Текст
                    Ю.И. Неймарк
МАТЕМАТИЧЕСШ
МО Д Е Л И
в естествознании и технике

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ НИЖЕГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. Н.И ЛОБАЧЕВСКОГО Ю.И. Неймарк МАТЕМАТИЧЕСКИЕ МОДЕЛИ В ЕСТЕСТВОЗНАНИИ И ТЕХНИКЕ Рекомендован Научно-методическим советом по прикладной математике и информатике У МО университетов РФ в качестве учебника для студентов, обучающихся по направлению 510200 - Прикладная математика и информатика и специальности 010200 - Прикладная математика и информатика Нижний Новгород Издательство Нижегородского университета 2004
УДК 519.8. ББКВ143 Н45 Н45 НеймаркЮ.И. Математические модели в естествознании и технике: Учебник. Н. Новгород: Издательство Нижегородского госуниверситета им. Н.И. Лобачевского, 2004. 401 с. В книге рассказывается о разнообразных конкретных математических эволюционных моделях и их исследовании в механике, физике, биологии, технике и управлении, моделях игр и поиска решения, волновых явлениях, фундаментальных законах макромира и микромира, пространстве и времени и др. Дается представление о математическом моделировании как науке и искусстве. Для студентов, аспирантов, преподавателей, инженеров и всех, интересующихся математическим моделированием. ISBN 5-85746-496-Х ББКВ143 © Неймарк Ю.И., 2004
Ill ОГЛАВЛЕНИЕ И КРАТКОЕ СОДЕРЖАНИЕ ГЛАВ ПРЕДИСЛОВИЕ .......XI Математика как язык. Математическая модель. Математическое моделирование как метод изучения окружающего мира ВВЕДЕНИЕ ......XIV 1. ДИНАМИЧЕСКАЯ СИСТЕМА .......1 Детерминизм Лапласа. Динамическая система - как основная математическая модель естествознания. Фазовый портрет Примеры динамических систем и их фазовых портретов: про- стейшие примеры, игра «жизнь», маятник на вращающемся ос- новании. Фазовый портрет как средство отображения наших знаний о динамике модели и как средство ее изучения 2. ВЫТЕКАНИЕ ЖИДКОСТИ ИЗ СОСУДА .......20 Закон Торичелли и простейшая модель вытекания Эффект сжатия струн. Недостаточность простейшей модели. Уточнен- ные модели, учитывающие разгон жидкости. Фазовый портрет и отображение на нем быстрой фазы разгона и медленного вы- текания Уточнение фазы разгона 3. РАВНОВЕСИЕ И АВТОКОЛЕБАНИЯ УРОВНЯ ЖИДКОСТИ В СОСУДЕ ПРИ ОДНОВРЕМЕННОМ ПРИТО- ...............31 КЕ И ОТТОКЕ Равномерный приток и отток через дырочку и через сифон 4. ПЕРЕХОДНЫЙ ПРОЦЕСС, СОСТОЯНИЕ РАВНОВЕСИЯ И АВТОКОЛЕБАНИЯ .......35 Подводится итог полученным знаниям о возможных типах движений: переходные процессы, устойчивые равновесия и ав- токолебания 5. ДИНАМИКА УРОВНЯ ЗЕРКАЛА ВОДОХРАНИЛИЩА С ГИДРОСТАНЦИЕЙ .......38 Критические значения. Бифуркационная диаграмма 6. ЭНЕРГЕТИЧЕСКАЯ МОДЕЛЬ СЕРДЦА .......43 Виды кризисных состояний. Критические значения. Сужение жизненных возможностей 7. ЗАСОЛЕНИЕ ВОДОЕМА С ЗАЛИВОМ И ЗАГАДКИ КАСПИЙСКОГО МОРЯ .......47 Загрязнение водоема сточными водами с растворимыми за- грязнениями. Загадка Каспийского моря. Засоление водоема с заливом. Равновесный водный режим и равновесная соленость. Возможность непредсказуемых смен равновесного уровня 8. ЭКСПОНЕНЦИАЛЬНЫЕ ПРОЦЕССЫ .......56 Математическая модель. Периоды полураспада и удвоения. Примеры экспоненциальных процессов: размножение и гибель, радиоактивность, цепные реакции, разряд конденсатора, разгон ракеты, торможение, поглощение излучения, охлаждение, распро- странение эпидемии и слухов, рост численности населения, произ- водства, знаний, приближение и удаление от равновесия и др. Уточнение модели: учет насыщения, взрывной характер роста. Яв- ление внезапного кризиса, «схлопывания» и исключительности 9. ДИНАМИКА СОСУЩЕСТВОВАНИЯ ПОПУЛЯЦИЙ .......66 Математические модели сосуществования: «хищник - жертва», конкуренция (противостояние), симбиоз. Фазовые и бифурка- ционные портреты
IV 10. ПРОТОЧНЫЙ БИОЛОГИЧЕСКИЙ РЕАКТОР .......75 Простейшая модель биологического реактора (хемостат): фазо- вый портрет, оптимизация 11. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИММУННОГО ОТВЕТА ОРГАНИЗМА НА ВТОРЖЕНИЕ ИНФЕКЦИИ ................78 Рассматривается упрощенная феноменологическая модель иммун- ного ответа организма на инфекцию в виде системы дифференци- альных уравнений четвертого порядка, которая обнаруживает ос- новные варианты течения заболевания: выздоровление и выздоров- ление через обострение, гибель и гибель от истощения ресурсов, хроническое заболевание с равновесным и периодическим течени- ем, бациллоносительство, их зависимости от параметров, степени зараженности и предпринимаемых действий 12. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ СООБЩЕСТВА «ПРОИЗВОДИТЕЛИ-ПРОДУКТ-УПРАВЛ ЕНЦЫ» .......85 Возможные виды фазовых портретов. Эволюция сообщества с ростом технологии производства в зависимости от остальных параметров 13. ЛИНЕЙНЫЙ ОСЦИЛЛЯТОР .......95 Математическая модель линейного осциллятора Возможные типы движений. Фазовый и бифуркационный портреты. Что описывает линейный осциллятор: типы равновесий, гармони- ческие, затухающие и нарастающие колебания 14. ЭЛЕКТРОМЕХАНИЧЕСКИЕ АНАЛОГИИ. УРАВНЕНИЯ ЛАГРАНЖА-МАКСВЕЛЛА .......107 Электромеханические аналогии. Уравнения Лагранжа- Максвелла механических, электрических и электромеханиче- ских систем. Инвариантность уравнений Лагранжа Принцип наименьшего действия как вариационная форма математиче- ских моделей Примеры и уравнения Лагранжа-Максвелла с обобщенными силами 15. ЧАСЫ ГАЛИЛЕЯ-ГЮЙГЕНСА .......118 Как и почему появились часы Галилея-Гюйгенса, что в них принци- пиально нового, что определяет точность часов9 Анализ причин по- грешностей и пути их уменьшения Простейшая математическая модель часов Галилея-Гюйгенса. Фазовый портрет. Отображение А.Пуанкаре и диаграмма точечного отображения Кенигса-Ламерея. Часы как автоколебательная система, как система с обратной связью 16. ГЕНЕРАТОР ЭЛЕКТРИЧЕСКИХ КОЛЕБАНИЙ .......129 Генератор электрических колебаний как электрический аналог часов Галилея-Гюйгенса Математическая модель Уравнение Ван-дер-Поля и его фазовый портрет. Приближенное исследо- вание уравнения Ван-дер-Поля и сведение к точечному ото- бражению. Мягкий режим возбуждений автоколебаний 17. МЯГКИЙ И ЖЕСТКИЙ РЕЖИМЫ ВОЗБУЖДЕНИЯ .......135 АВТОКОЛЕБАНИЙ Фазовые портреты и бифуркационные портреты мягкого и жесткого возбуждения автоколебаний на основе исследования точечного ото- бражения 18. СТОХАСТИЧЕСКИЙ ОСЦИЛЛЯТОР («ЧАСЫ НАОБОРОТ») ..........140 Осциллятор с непредсказуемым поведением. Математическая модель, фазовый портрет, точечное отображение Непредска- зуемость и случайность Два типа поведения динамических систем: устойчивость и неустойчивость, предсказуемость и не- предсказуемость. Осциллятор (динамическая система) как ге- нератор стохастических колебаний
19 НЕУСТОЙЧИВОСТЬ И АВТОКОЛЕБАНИЯ, ......148 ВЫЗЫВАЕМЫЕ ТРЕНИЕМ Математическая модель и ее фазовый портрет Классическая кулоновская модель сухого трения и необходимость ее уточне- ния. Возбуждение колебаний трением и возникновение автоко- лебаний, исчезновение трения 20 ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ ...... 157 ЛИНЕЙНОГО ОСЦИЛЛЯТОРА Математическая модель Амплитудно-фазовая частотная ха- рактеристика. Явления резонанса и фазового сдвига. Примеры килевой качки корабля и динамического гасителя колебаний. Спектральный подход и принцип суперпозиции Обобщенная ^-функция 21 ПАРАМЕТРИЧЕСКОЕ ВОЗБУЖДЕНИЕ ......167 И СТАБИЛИЗАЦИЯ Математическая модель. Явления параметрического возбужде- ния и резонанса. Особенности параметрического резонанса, от- личающие его от обычного резонанса 22 НОРМАЛЬНЫЕ КОЛЕБАНИЯ И БИЕНИЯ ......175 Математическая модель двух взаимодействующих осциллято- ров. Нормальные колебания и перекачка энергии, вызывающая явление биений 23 СТАБИЛИЗАЦИЯ ПЕРЕВЕРНУТОГО МАЯТНИКА . 180 Управление как могучее средство изменения поведения и свойств динамических объектов и систем. Жонглирование вер- тикально стоящей на опоре и двумя стоящими друг на друге палочками Математические модели. Стратегия управления, условия стабилизации, роль запаздывания 24 УПРАВЛЯЕМЫЙ МАЯТНИК И ДВУНОГАЯ ХОДЬБА ......190 Перевернутый управляемый маятник как математическая мо- дель автоколебательной двуногой ходьбы 25 ДИНАМИЧЕСКИЕ МОДЕЛИ ИГР, ОБУЧЕНИЯ ......198 И ЦЕЛЕСООБРАЗНОГО ПОВЕДЕНИЯ Автоматные модели игроков и динамические детерминирован- ные и стохастические модели игр 26 ПЕРСЕПТРОН И РАСПОЗНАВАНИЕ ОБРАЗОВ ......214 Рассказывается о принципе работы персептрона Розенблата, трактуемого как динамическая система. Описываются матема- тические модели объекта, образа, распознавания и обучения распознаванию. Формулируется и доказывается теорема о ко- нечности числа ошибок. Обнаруживается связь между алго- ритмом обучения персептрона и стохастической аппроксима- цией 27 ЗАКОНЫ КЕПЛЕРА И ПРОБЛЕМА ДВУХ ТЕЛ, .... 222 РЕШЕННАЯ НЬЮТОНОМ Рассказывается о проблеме двух тел и ее связи с некоторыми вопросами астрономии: черные дыры, расширение Вселенной, эволюция Солнечной системы 28 РАСПРЕДЕЛЕННЫЕ ДИНАМИЧЕСКИЕ МОДЕЛИ .......235 МЕХАНИКИ И ФИЗИКИ Определяется понятие распределенной динамической системы. Описываются распределенные модели классической математи- ческой физики, механики, электродинамики и квантовой меха- ники: уравнения Эйлера и Навье-Стокса, Максвелла и Шре- дингера
VI 29 ФУНДАМЕНТАЛЬНОЕ РЕШЕНИЕ УРАВНЕНИЯ ......245 ТЕПЛОПРОВОДНОСТИ Рассказывается о расплывании поля температур, диффун- дирующего вещества или плотности вероятности блуж- дающей случайной частицы, поначалу сосредоточенных в некоторой точке. Решается задача о прогреве полупро- странства 30 БЕГУЩИЕ ВОЛНЫ ......254 И ДИСПЕРСИОННОЕ УРАВНЕНИЕ Рассказывается о бегущих гармонических волнах. Решается задача о температуре поверхностного слоя земли под влиянием суточных и годовых колебаний над ним. Решается задача о скорости намер- зания льда на поверхности воды 31 ТЕОРИЯ ЭЛЕКТРОМАГНЕТИЗМА ......262 ФАРАДЕЯ - МАКСВЕЛЛА И ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ МАКСВЕЛЛА - ГЕРЦА Показывается наличие у уравнений Максвелла решения в виде бегущей со скоростью света гармонической волны 32 ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ ВОЛН ......266 Находятся отраженная и преломленная волны при набегании на раздел сред бегущей гармонической волны 33 СТОЯЧИЕ ВОЛНЫ И КОЛЕБАНИЯ ......269 ОГРАНИЧЕННОЙ СТРУНЫ Излагается метод Фурье изучения колебаний струны. Решается задача о колебаниях струны, вызванных сосредоточенным уда- ром. Выясняется спектр и его связь с «окраской» звука 34 МИКРОЧАСТИЦА ......274 Рассказывается об особенностях микромира. О необходи- мости пересмотра привычных представлений классической физики. Излагается формализм квантовой механики и при- водятся примеры его применения. Описываются понятия квантового состояния, оператора его изменения и его связь с измеряемыми и наблюдаемыми физическими величинами. Рассматривается поведение квантовой частицы в потенци- альной яме, в радиально-симметричном электрическом по- ле заряда 35 ПРОСТРАНСТВО И ВРЕМЯ ......295 Рассказывается о преобразованиях Галилея и Лоренца. Об ин- вариантности уравнений Ньютона и неинвариантности урав- нений Максвелла по отношению к преобразованиям Галилея. Выводятся преобразования Лоренца из свойства сохранения волнового уравнения, вытекающего из уравнений Максвелла, и представлений однородности и изотропности пространства и однородности времени. Рассматривается связь между собы- тиями, наблюдаемыми в разных системах координат: сокра- щение расстояний и замедление часов, сложение скоростей. Вводится четырехмерное пространство - время. Обсуждаются понятие одновременности и принцип причинности. Указыва- ются необходимые уточнения уравнений Ньютона в случае очень больших скоростей движения, приближающихся к ско- рости света
VII 36 37 38 39 40 41 42 43 44 РАЗГОН РЕЛЯТИВИСТСКИХ ЧАСТИЦ ......308 В ЦИКЛОТРОНЕ Рассматривается модель движения релятивистской частицы в циклотроне Обнаруживается наличие квазистационарного ус- тойчивого резонансного разгона МАТЕМАТИКА КАК ЯЗЫК, КАК ОПЕРАЦИОННАЯ ..............312 СИСТЕМА И МОДЕЛИ Математика как особый язык, включающий операционную систе- му и математические модели. Изоморфизм операционных систем и моделей. Роль изоморфизма в математическом моделировании ГЕОМЕТРИЧЕСКОЕ, ФИЗИЧЕСКОЕ, ......319 АНАЛОГОВОЕ, МАТЕМАТИЧЕСКОЕ И ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ О геометрическом, физическом, математическом моделировании и лежащих в их основе изоморфизмах, о критериях моделируемости и правилах моделирования ОБЩАЯ СХЕМА ......328 МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ О двух разных взаимосвязанных частях математического модели- рования (составление модели и ее исследование) и основных эта- пах моделирования и некоторых полезных соображениях МОДЕЛИ ВИБРОПОГРУЖЕНИЯ ......331 О вибропогружении и его математическом моделировании ОСНОВНАЯ МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ......336 СОВРЕМЕННОЙ НАУКИ И ТЕОРИЯ КОЛЕБАНИЙ Динамическая система как основная модель точной науки, о ее роли и ее изучении. Об автоколебаниях, регулярных и хаотических движениях и гомоклинических структурах. О теории колебаний как всеобъемлющей науке об эволюционных процессах. О роли А.А.Андронова в становлении нелинейной теории колебаний МАТЕМАТИЧЕСКАЯ МОДЕЛЬ, ......355 КАК ПЛОДОТВОРНАЯ ИДЕЯ НАУЧНОГО ИССЛЕДОВАНИЯ. D-РАЗБИЕНИЕ На примере устойчивости линейных систем (проблемы Раута- Гурвица, робастной устойчивости и др.) показывается возможная роль математической модели как плодотворной идеи научного использования ИДЕАЛИЗАЦИЯ, МАТЕМАТИЧЕСКАЯ ......363 КОРРЕКТНОСТЬ И РЕАЛЬНОСТЬ На примерах моделирования центробежного регулятора скорости вращения и известной проблемы парадокса Пэнлеве в механике иллюстрируется роль идеализации в математической корректно- сти, в достижении требуемой адекватности результатов моделиро- вания реальному объекту ДИНАМИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ МЕТОДА ......376 НАИМЕНЬШИХ КВАДРАТОВ И ГЛОБАЛЬНОЙ ПОИСКОВОЙ ОПТИМИЗАЦИИ С АДАПТИВНОЙ МОДЕЛЬЮ На примерах широко известного метода наименьших квадратов и глобальной поисковой оптимизации функций многих переменных иллюстрируется полезность широкого использования модели ди- намической системы
VIII 45 ИГРОВАЯ МОДЕЛЬ ЧЕЛОВЕЧЕСКОГО ОБЩЕСТВА .......382 Аргументируется игровая модель человеческого общества Обна- руживаются основные принципы его функционирования, органи- зации и управления. Изучается идеальная игра людей в обществе и выясняется существо и пути преодоления проблемы власти
Посвящаю моей матери Елене Николаевне и отцу Исааку Густавовичу, моей жене Валентине Васильевне, без которых я не жил бы на этом свете, а также Александру Александровичу Андронову, открывшему мне путь в науку. Выражаю благодарность всем моим ученикам, которым я помог войти в науку и которые сейчас мне служат опорой и поддержкой
XI В науке и ее приложениях, как и в жизни, самое главное - понимание. Оно всегда просто, но добывается трудно. ПРЕДИСЛОВИЕ Настоящая книга возникла в результате чтения автором лекций о ма- тематическом моделировании студентам, бакалаврам и магистрам, спе- циализирующимся по прикладной математике и информатике, и аспи- рантам точных наук Нижегородского государственного университета. Появление этого нового лекционного курса было вызвано тем, что суще- ствующая в России университетская система подготовки специалистов -по прикладной математике основывалась на сочетании фундаментально- го математического и прикладного компьютерного образования, что ори- ентировало студентов на решение точно поставленных математических задач, формируя определенную отчужденность от важнейших этапов и сторон фактического решения прикладных задач, таких, как осмысление и глубокое проникновение в существо конкретной задачи, и математиче- скую подготовку, включающую упрощения, принимаемые идеализации и составление математической модели, ее коррекцию и сопоставление ре- зультатов исследования с реальным объектом. Помимо этой главной це- ли была еще и другая, состоящая в том, чтобы выпускники в дальнейшем занимались не только математическими вопросами и на них ориентиро- вались, но и восполняли и широко использовали математику как универ- сальный язык современной точной науки, а математическое моделирова- ние - как могучее средство изучения природы, техники и человеческого общества. В 1994, 1996 и 1997 годах частично эти лекции по математическим моделям естествознания и техники были изданы Нижегородским универ- ситетом в виде трех небольших книжек. Затем была написана четвертая часть, сделаны добавления к ранее опубликованным частям, содержащим материал, читаемый магистрам и аспирантам. Получившийся труд был рекомендован Научно-методическим советом по прикладной математике и информатике университетов России в качестве учебника для обучаю- щихся по направлению 510200 - Прикладная математика и информатика
XII и специальности 0102200 - Прикладная математика и информатика. По- жалуй, следует отметить, что, кроме перечисленных выше стимулов к написанию этой книги, значительную роль сыграло то, что я в процессе чтения лекций осмыслил решающую роль простых математических мо- делей в общем понимании и познании окружающего мира и получал ог- ромное удовольствие, строя и изучая такие простые модели, как модель автоколебательной ходьбы человека, загадок Каспийского моря, кризи- сов и исключительности иммунного ответа организма на вторжение ин- фекции, игры в отгадывание, парадокса Пэнлеве и многие другие. Автор книги «Математические модели естествознания и техники» - ученик А.А. Андронова, выходец из его всемирно известной школы тео- рии нелинейных колебаний. Это определило выбор рассматриваемых моделей. В книге идет речь об эволюционных моделях, т.е. моделях про- цессов изменения во времени: о моделях динамики, управления, обуче- ния, вычислительных процессов, распознавания, оптимизации, относя- щихся к объектам самой разнообразной природы: механической, физиче- ской, химической, биологической, технической, экологической, социаль- ной и др. Объединяющей основой всего этого разнообразия является универсальная, всеобъемлющая математическая модель - динамическая система. Книга может быть интересной и полезной очень широкому кругу чи- тателей: студентам всевозможных естественных, технических и других высших учебных заведений; работающим специалистам, сталкивающим- ся с задачами и проблемами моделирования или тем, где моделирование может быть полезным, и просто для людей любопытных, желающих уз- нать, как математика изучает окружающий мир и позволяет понять и объяснить загадочные явления, предвидеть будущие изменения, постиг- нуть свойства и предсказать поведение не только реально существующих объектов и процессов, но и воображаемых или изобретаемых. Моделирование в значительной мере искусство, и в силу этого в нем не последнюю роль играет красота: красота модели, красота ее исследо- вания и, наконец, красота объяснения загадочных и непростых явлений и свойств изучаемого объекта. Возможно, что построение и исследование некоторых моделей, со- держащихся в книге, доставит вам эстетическое удовольствие. Математические модели можно подразделить на простые, лишь в об- щих чертах в самом нам интересном, описывающие реальный объект; математические модели фундаментальных законов природы - уравнения Ньютона механического движения, электродинамические уравнения Фа- радея-Максвелла, уравнение Шредингера микропроцессов, ... , и модели, от которых требуется значительная количественная адекватность, когда, например, моделируется полет ракеты и ее посадка на Луну. Каждый из перечисленных типов моделей имеет свою специфику. Моделирование последнего типа, как правило, требует высокой вычислительной квали- фикации, знания различных вычислительных методов и умения ими пользоваться, значительной вычислительной культуры и навыков, вклю-
XIII чающих навыки использования современной вычислительной техники. Для построения и исследования моделей первых двух типов многое из перечисленного не обязательно. Но далеко не всегда моделирование третьего типа может обойтись без умений и навыков, требуемых для по- строения и исследования моделей первых двух типов. Более того, фун- даментальные модели только и обеспечивают возможность математиче- ского моделирования, а простые модели, и только они, позволяют понять функционирование изучаемого объекта и сопровождающие его явления: понять глобально и качественно основные свойства, возможные явления, причинные связи и зависимости поведения от параметров. Настоящая книга о моделях первого и отчасти второго типов, что ин- тересно и важно само по себе и что является необходимым для модели- рования нестандартных задач и объектов третьего типа. Вместе с тем это не охватывает полностью математическое моделирование, к которому, безусловно, относится еще построение математических моделей на осно- ве наблюдаемых опытных и экспериментальных данных. Одним из ос- новных методов построения таких моделей является метод наименьших квадратов, возникший в трудах Гаусса и Лежандра около двух столетий тому назад. Его рассмотрение осуществлено отдельно в книге Ю.И. Неймарка и Л.Г. Теклиной «Новые технологии применения метода наименьших квадратов» (Изд-во ННГУ им. Н.И. Лобачевского, 2003).
XIV ВВЕДЕНИЕ В курсе «Математические модели естествознания и техники» вы по- знакомитесь с разнообразными математическими моделями механиче- ских, электрических, физических, астрономических, химических, биоло- гических, экологических, кибернетических и других систем и процессов. Кроме того, этот курс поможет вам сформировать ваше естественно- научное миропонимание, понимание науки и ваше отношение к специаль- ности «прикладная математика», к изучаемым вами общим и специаль- ным математическим предметам. Вы поступили в университет, чтобы получить высшее математическое образование и специальность прикладного математика, что позволит вам иметь интересную работу, приносящую удовлетворение и средства к суще- ствованию. Возможно, вы об этом и не думали, а пришли сюда в силу при- родной любознательности и любви к математике и успехов в ней. Вам хочется постичь и изучить окружающий мир, к чему зовет вас ваша генетическая наследственность. Почему же вместо этого вас учат аб- страктной, трудно понимаемой математике, оторванной от живого мира, - числам, векторам, матрицам, функциям, действиям над ними, диф- ференцированию, интегрированию и др.? Я думаю, что вы знаете общий ответ на этот вопрос: потому что мате- матика является основой естественно-научного познания. Но почему так велика роль в познании мира именно абстрактной математики, такой да- лекой от нашего конкретного, осязаемого, красочного мира, а, например, не астрологии, которая по расположению светил предсказывает будущее? Каков метод использования математики в познании мира и предсказа- ний будущего? Возможно, и на этот последний вопрос вы знаете ответ: мы познаем мир, создавая и изучая его математические модели. Вот и мы с вами будем строить математические модели и будем их изу- чать, тем самым постигая тайны мира, в котором мы живем. Что такое модель? Слово «модель» из итальянского языка и означает «копия, образец, прототип», изучив который, мы познаем оригинал. Зна- чит, математическая модель - это прототип какой-то части мира - объек- та, системы, устройства, машины, процесса, прибора, изучая который, мы постигаем эту часть мира. Чем же является математика и какова ее роль в создании этой вспомо- гательной модели, и почему мы эту математическую модель можем изу- чить, и почему, изучив ее, мы изучаем мир, и что, собственно, из себя
XV представляет математика? Я думаю, что на эти вопросы вы ответов не знаете. К ответу на них подойдем издалека. Как-то давно, в позапрошлом веке, на одном из ученых заседаний бурно обсуждался вопрос о роли языков и мате- матики в обучении студентов. Дебаты длились долго. Одни отстаивали роль языков, другие - значение математики. Среди обсуждающих был великий ученый Виллард Гиббс. Тот самый, который утверждал, что це- лое проще своей части, что изучить скопище миллиардов молекул проще, чем одну молекулу, и не только утверждал, но и доказал своими замечательными научными открытиями. Он был всеми уважаем и не- обычайно молчалив. Но тут, к общему удивлению, он попросил слова и сказал: «Математика — тоже язык». Что же имел в виду Гиббс? Что общего между русским, английским, греческим, французским и другими языками и математикой? А вот что: язык людей описывает их действия, чувства, желания, воспоминания, пожелания, мнения, приказания, а математика — это язык описания при- роды, язык научного естествознания. Если вы хотите поговорить и по- нять француза, вам надо изучить французский язык, с англичанином - английский язык, с природой — математический язык. Только на мате- матическом языке природа открывает нам свои тайны, и если вы хотите их постичь, вы должны изучить математический язык, изучить матема- тику. С природой и техникой, тоже частью природы, только созданной человеком, нужно разговаривать на математическом языке. То, что книга природы написана на математическом языке, сказал еще Галл илей. Языки человека — это конкретные языки, в них каждое слово имеет конкретный смысл, напротив, математический язык - язык абстрактный. Но оба они - языки, и это различие не так уж существенно. Допустим, вы на заборе увидели надпись: «Гчокая югора икает справдо» Сначала вам показалось, что это бессмыслица, но вдумавшись, вы по- няли, что говорится о некой «югоре», которая «глокая» и которая «ика- ет» и делает это «справдо». А теперь сравните эту фразу со следующими математическими фразами: (д + b) = а + "lab + b , _ d . d . о<—%(/)<—y(0- dt dt Judv = uv - J vdu. Во второй математической фразе говорится, что некоторая величина x(t) возрастает с ростом t медленнее, чем величина у (t). Что такое х и у, при этом остается неизвестным, как и то, чему равны а и b в первой фра- зе (формуле). Языковые описания нашей жизни — рассказы, повести, романы - это ее языковые модели. Описание естественных явлении на математическом языке — это их математические модели, т.е., математика — это язык
XVI точных наук, а математические модели — это описание объектов и процес- сов природы или техники на математическом языке. Для того, чтобы написать хорошее сочинение, нужно хорошо знать то, о чем пишешь, так и для того, чтобы составить математическую модель, нужно хорошо понимать то, что хочешь описать, отличать главное от второстепенного, понимать существо и закономерности происходящих процессов, явлений и взаимоотношений, наконец, нужно уметь все это описать на математическом языке. Написать сочинение не просто, но прочитать его и понять обычно не очень трудно. Хотя простота может быть обманчивой. Составить модель тоже достаточно трудно, но и понять ее, оказывается, не всегда просто, а подчас и очень трудно. Для того чтобы понять математическую модель, понять то, что она описывает, необходимо ее изучить, и это изучение может быть очень сложным и трудным. Теперь, я думаю, вам понятно в общих чертах, о чем курс «Математи- ческие модели естествознания и техники». Но на один вопрос мы не получили ответа: почему, изучая математи- ческую модель реального объекта или процесса, мы получаем возмож- ность изучения и их самих? Ведь они такие разные и, казалось бы, не имеют ничего общего. Это очень непростой вопрос. Один из известных математиков назвал эту чудесную возможность «непостижимой». Но, по- жалуй, это не совсем так: кое-что понять можно. Все основано на изоморфизме. Об этом — много позднее, а пока заме- тим только, что то, что реальный объект и модель такие разные, не так уж страшно: как работает телевизор, можно понять по его радиосхеме, совершенно не похожей на телевизор. Можно разобраться в улицах горо- да по его карте. Теперь я перейду к рассказу об одной из основных моделей естество- знания и техники — динамической системе.
1 1 ДИНАМИЧЕСКАЯ СИСТЕМА Архимед, когда постиг закон рычага, опьяненный открывшейся ему тайной природы, сказал: «Дайте мне точку опоры, и я переверну мир». Много веков спустя, в XVIII веке, великий математик и астроном Ла- плас, восхищенный открывшейся ему научной картиной мироздания и причинных связей всех явлений, выразил свое прозрение словами: «Я предскажу во всех деталях все будущее, все, что будет на все века впе- ред, от мелочей до самого крупного, если Вы мне скажете или полностью опишите, в каком состоянии мир находится сейчас» Это был апофеоз детерминизма, полной причинной связи будущего с настоящим. Ясно, что никто не мог уличить Лапласа во лжи или ошибке: кто же может описать мироздание полностью? Хорошо бы это сделать хотя бы в какой-нибудь его части - и не всего, а только кое-чего. Ну и что тогда? Уже предсказывать нельзя? Нет, оказывается, иногда можно. Постараем- ся разобраться, когда можно и когда нельзя и от чего это зависит, и заод- но поймем, почему Лаплас так сказал. Сказано это было в связи с успехами астрономии, в которой наука до- билась полного понимания причин движения планет и научилась их рас- считывать на много лет вперед и одновременно с воцарением механисти- ческой картины мира, в которой все происходящее объяснялось механи- ческим движением мельчайших материальных частиц - молекул. При этом само собой разумелось, что молекулы (атомы), хотя и очень ма- ленькие, но обладают такими же свойствами, как и окружающие нас те- ла: могут взаимодействовать между собой, ударяться друг о друга, со- единяться, ... Таковы уж капризы истории, что величайшие прозрения пришли в науку «с небес» благодаря успехам астрономии. Движение планет - блуждающих звезд - давно привлекало внимание человечества. Сейчас нам до них нет дела, а тогда давно было совсем не так. Широко известна Птолемеевская система мира. Она достаточно хорошо описыва- ла и с точки зрения этого описания объясняла видимые причудливые движения планет (Меркурия, Венеры, Марса, Луны, Юпитера, Сатурна) и Солнца, еще проще это делала система Коперника, но только Ньютон их объяснил, исходя из открытых им законов механического движения и закона всемирного тяготения. В отношении механического движения ма- териальной точки он установил, что оно подчиняется дифференциально- му уравнению второго порядка и однозначно определяется начальным положением и скоростью. Отсюда следовало, что движение всех планет и Солнца может быть точно вычислено, если известны их массы, началь- ные положения и скорости. Само вычисление Ньютон сумел выполнить лишь для двух притягивающихся свободных тел, но это уже не принци-
2 I. Динамическая система пиально. Вскоре научились вычислять приближенно, но с громадной точностью движения всех планет, а сейчас это легко делают ЭВМ. Итак, для планет существует описание, по которому может быть предсказано будущее, т.е. то, как это описание меняется. Такое описание было назва- но состоянием механической системы. В какой-то мере понятие состоя- ния может быть обобщено и распространено не только на механические системы. Именно по этому пути пошло дальнейшее развитие точного ес- тествознания в изучении эволюционных процессов и предсказаний бу- дущего. Идея детерминизма, вдохновившая Лапласа, идея временной причин- ности и однозначной обусловленности событий нашего мира может рас- сматриваться как наличие связей между описаниями прошлого и настоя- щего. При этом бессмысленно говорить о связи всего прошлого со всем на- стоящим: возможность фактического изучения появляется тогда, когда выбирается что-то как из описания, так и из окружающего мира. Этот выбор предмета изучения Ньютон описал как сосредоточение внимания на отдельных привлекательных красивых камушках на необозримом бе- регу моря. Тот «камушек», который мы выберем, назовем системой, а то, что привлечет к нему наше внимание, — ее описанием. Это описание можно обозначить буквой х, оно зависит от времени и совершенно не обязательно, что для него будет справедлив принцип детерминизма, т.е. то, что прошлое описание х( ti) определяет будущее описание х ((2) (t2> ti). Это только тогда, когда нам крупно повезло как в выборе камушка, так и в выборе того, что нас в нем привлекает. Теперь я приведу вам некоторые примеры выбора «камушков» и их описаний. Но прежде я хочу сказать еще несколько слов о детерминизме Лапла- са. Если можно так выразиться, оградить его от естественных нападок, что он не видел и игнорировал повсеместно наблюдаемую случайность. Нет, он ее видел. Более того, он ввел в науку известную случайную вели- чину, распределенную по широко используемому нормальному закону - закону Лапласа. Но так же, как А.Эйнштейн, он не верил, что Бог играет в кости. Он не знал, как объяснить наблюдаемую случайность, но это не помешало ему принять детерминистическую картину мира. И сделал правильно. И случайные процессы допускают детерминистическое опи- сание, но об этом много позднее. Вернемся к прерванному разговору. Вот у меня в руках кусочек мела. Я могу заинтересоваться, как он пишет на доске и почему он это делает. Тогда меня будут интересовать его свойства и его описание с точки зре- ния его качества для письма на доске. Но я могу воспользоваться им для того, чтобы бросить или просто отпустить и посмотреть, как он будет па- дать. В этом последнем случае я могу быть удачлив и установить законы падения тяжелых тел на землю, обнаружив торжество детерминизма. Я могу обратить внимание на стакан горячего чая и задуматься о том, почему он имеет такой вкус и запах, и что это такое, а могу поинтересо- ваться, когда же он, наконец, остынет и его можно будет пить. В послед-
1. Динамическая система 3 нем случае меня интересует только температура чая, описываемая в гра- дусах Цельсия, и если я буду достаточно упорен, то найду закон ее уменьшения, подтверждающий общую идею детерминизма. Эти примеры можно продолжать до бесконечности: горящая свеча, привлекшая внимание Фарадея; движение Земли вокруг Солнца, изучен- ное Иоганном Кеплером и Исааком Ньютоном; электрический контур из емкости и самоиндукции, тайна колебаний заряда которого была разга- дана Томсоном; атом, первая модель (описание устройства) которого бы- ла дана Нильсом Бором; земная атмосфера, от которой зависит погода, которую мы никак не научимся предсказывать; живой организм, и по- сейчас полный тайн, и совсем таинственный мозг. После этих беглых примеров рассмотрим несколько примеров попро- ще и более подробно. Понаблюдаем спринтерский заезд двух велосипедистов на велодроме. Они приняли старт в одно и то же время, и выиграет тот, кто приедет первым к финишу. Сколько времени они будут ехать, не имеет значения, и это приводит к тому, что ни один из них не рвется вперед, а маневри- рует, желая обмануть противника и прийти первым. Просто рвануться без оглядки вперед нельзя, потому что «севший на хвост» соперник по- едет за ним, затрачивая значительно меньше сил, и вблизи финиша легко придет первым. Рис. 1.1. Вид сверху велодрома и спринтерского заезда велосипедистов 1и2 В качестве описания примем углы (pi и (р2, проходимые первым и вто- рым велосипедистами (рис. 1.1). Графики функций <pi(t) и ф2 (t) дают представление о том, как протекало соревнование (рис. 1.2). При этом мы рисуем две кривые. Можно изобразить ход соревнования одной кривой на плоскости (pi, (р2. (Старт отвечает углу (р =0, финиш -(р =2л). С течени- ем времени точка М с координатами <pi и <p2j опишет некоторую кривую (рис. 1.3). Ее вид также показывает, как протекало соревнование. Так, со- гласно рис. 1.3, первым уехал со старта первый велосипедист, затем вто- рой и был почти до самого конца позади первого, а перед самым фини- шем его обогнал и пришел первым. На рис. 1.4 изображен другой вариант соревнований, где много раз ве- лосипедисты менялись местами и победил первый. Нетрудно видеть, что принятое описание с помощью углов (pi и (р2 до того, как один из них равен 2л, не допускает однозначного прогноза ис- хода соревнований, хотя, возможно, опытный глаз специалиста мог бы высказать более или менее вероятные предположения.
4 /. Динамическая сие пи ма Рис. 1.3. Изображение на плоско- сти <pi, ср2 разных заездов велосипе- дистов Рис. 1.2. Временные графики (pi(t)u(p2(t) одного из заездов велосипедистов Рис. 1.4. Изображение на плоско- сти (pi, (р2 разных заездов велоси- педистов Рассмотрим еще пример с описанием течения болезни графиком тем- пературы больного (рис. 1.5). Этот график опытному врачу может сказать о многом в отношении течения болезни, но все же его начальной части недостаточно для достоверного прогноза всей кривой или только финала болезни. Следующий пример - это свободное вертикальное падение тела, нахо- дящегося на высоте ho от земли и имеющего скорость vo (вертикальную). Согласно закону свободного падения, имеем h = ho + vo t + g t2/2, где t - время падения, a h - положение, отсчитываемое по вертикали вниз. На рис. 1.6 изображены допустимые виды графиков зависимости h(t). Эти графики показывают, как происходит падение тела с заданным ho, если оно брошено вверх, просто отпущено или брошено вниз. Так что величина h неплохо описывает падение тела. Но возможен ли с помощью одного h прогноз дальнейшего падения тела? Очевидно, нет, нужно знать еще h(t) Учитывая это, примем в качестве описания два графика h (t) и h(t) (рис. 1.7). По значениям h (t) и h(t)= v в любой момент времени t можно предсказать их значения в любой следующий момент времени / > t по формулам: h(t) = h(t) + h(t)(t-t) + g(t-t)2/2, h(i) = h(t) + g(i-t), хорошо известным вам из школьной физики.
1 Динамическая система 5 Вместо двух графиков h(t) и Л (Г) можно ограничиться одной кривой, пробегаемой при изменении времени t на плоскости h, v точкой М с ко- ординатами Лир h Рис.1.5. График утренних и вечерних Рис.1.6. Графики падения тела с од- температур больного ной и той же высоты, но с разными начальными скоростями h = h(t), v = h(t). Уравнения этой кривой можно найти следующим образом. Из очевидных соотношений р=Л(г), v=g, (1.2) выражающих, что скорость — это производная от пройденного пути и что ускорение свободного падения равно g, следует, что dh _ v Jv g или h = v2 /2g+ С, где С - произвольная постоянная, Рис.1.7. Временные графики измене- ния высоты h и скорости v брошен- ного вертикально вверх тела Рис.1.8. Фазовый портрет падения тела
6 J. Динамическая система В силу этого траектории, описываемые точкой М( h,v) на плоскости h v при различных С, имеют вид, показанный на рис. 1.8. При возрастании времени точка М пробегает эти кривые в направлениях, показанных стрелками (это следует из того, что при v >0 величина h возрастает, а при у < 0 - убывает). Принятое нами описание падения тела двумя вели- чинами Л и у обладает замечательным свойством самодостаточности и позволяет осуществлять однозначный прогноз Действительно, задание любых h и у однозначно определяет единственную параболу, на которой лежит точка М (h,v). Тем самым определено однозначно дальнейшее из- менение величин h иv Плоскость переменных h, v имеет особое название - фазовая плос- кость, соответственно переменные h и у - фазовые переменные, а нари- сованные на этой фазовой плоскости траектории движения фазовых то- чек М (h, v) - фазовые траектории. Движение фазовой точки по траекториям замечательно тем, что зна- ние ее положения в любой момент времени t позволяет найти, куда она переместится в любой последующий момент времени t > t, а именно, со- гласно (1.1) или (1.2): v(t) = v(t) + g(t-t), h(t) = h(t) + v(t)(i-t) + ^g(t-t)2. Это свойство самодостаточности переменных h, v, состоящее в том, что для того, чтобы их найти через любой промежуток времени At, дос- таточно их же знать в начальный момент, придает им особое значение, благодаря которому такое описание получило название состояния, а опи- сывающие его переменные - фазовых переменных. Это же свойство со- стояния легло в основу определения математической модели, получив- шей наименование динамической системы, модели, описывающей де- терминированные эволюционные процессы, одной из основных, если не основной, модели современного научного естествознания и техники. Еще раз взглянем на описание соревнования велосипедистов на плос- кости (plt q>2 и свободного падения тела на плоскости h, у. В первом слу- чае описания различных заездов представляют собой всевозможные кри- вые в квадрате 0 < (pi >2л, 0 < (р2 > 2 л. Естественно только предполо- жить, что во всех этих случаях (pi и (р2 - неубывающие функции време- ни. Через каждую точку этого квадрата может проходить сколько угодно кривых. Именно поэтому задание значений уд и (р2 в некоторый момент времени не определяет дальнейшего хода проходящей через нее кривой. Напротив, на плоскости h, у кривые, изображающие различные случаи падения, не пересекаются между собой. Именно в силу того, что они не могут пересекаться и через каждую точку проходит единственная кривая, возможен однозначный прогноз дальнейшего изменения величин А и у. Таким образом, при описании переменными (р t. (р 2 невозможен одно- значный прогноз, и это находит свое отражение в том, что через каждую точку {(р ], (р 2) могут проходить несколько кривых и, напротив, при опи-
1 Динамическая система 7 сании свободного падения переменными Лиг имеет место детерминизм, потому что через каждую точку (h, v) проходит единственная кривая. Рассмотренное математическое описание свободного падения тела в поле силы тяжести является примером математической модели, называемой динамической системой, в то время как математическое описание сорев- нования велосипедистов с помощью углов (р j и (р 2 не является матема- тической моделью, называемой динамической системой. Дадим теперь общее абстрактное определение математической моде- ли, называемой динамической системой, в геометрической трактовке ве- ликого математика А. Пуанкаре. Динамическая система определяется пространством X и заданным на нем однозначным оператором Т (Л t), зависящим от параметра Д t > 0, так что каждой точке хе X оператор Т ставит в соответствие единственную точку х, т.е х =Т( Ы)х. При этом предполагается, что оператор Т (Л t) при любых допустимых Д ti > 0 и Д t2 0 удовлетворяет, соотношению Т(Д t2)T(At1) = T(At1 + A t2). Смысловое содержание пространства X и оператора Т (Л t) следующее: X - это пространство всевозможных состояний рассматриваемой систе- мы. (Обычно х - это многомерный вектор с компонентами хь х2,..., х,;).Описание х называется состоянием или фазовой точкой, а пространст- во состояний X - фазовым пространством. Оператор Т (Л t) по состоянию х в начальный момент позволяет найти состояние х спустя время Д t. При этом ясно, что переход из состояния х в х, совершаемый сначала за время Д tj > 0, а затем еще за время Д t2 > 0, должен быть таким же, как переход за время Д Г/ + Д t2 В этом смысл написанного выше требова- ния на оператор Т (Д t). Описание х замечательно тем, что по нему можно найти такое же опи- сание спустя любое время Д t > 0. Именно поэтому оно названо состоя- нием, а точка х - фазовой. Рассмотренный выше пример свободного падения тела под действием силы тяжести полностью соответствует приведенному определению. В нем состояние х — это двумерный вектор с компонентами h и v. Про- странство состояний или фазовое пространство представляет собой дву- мерную плоскость переменных Лиг. Значения высоты h и скорости v за время Д t изменяются, и, согласно предыдущему, их новые значения рав- ны h и V, где h = h + vAt+ ^g( At)2, v=v + gAr, (1.3) Эти последние формулы определяют оператор Т (Д t). Можно непо- средственно проверить, что для этого оператора Т (Д t) выполняется тре- бование, налагаемое на него определением динамической системы.
8 1 Динамическая система Из соотношений, определяющих изменение переменных h и v за время A t, следует, что Переходя в них к пределу при A t О, находим, что функции h (t) и v (t) удовлетворяют дифференциальным уравнениям dh dv = v. -= g. dt--------dt Этот вывод имеет место и в общем случае, если предположить, что существует предел T(bt) lim —------ ь, л/->о At и тогда состояние х, как функция времени Z, удовлетворяет дифференци- альному уравнению Действительно, запишем соотношение x = T(At )х в виде x(t + At ) = Т( At )х( t), далее в виде x(t + At)-x(t) _Т(At)х(t)-x(t) At At или, учитывая, что x(t) = T(O)x(t), и переходя к пределу при At 0, в виде dx(t) T(At)-T(0) —;— = hm--------------х( t) = Lx(t), dt At что и требовалось. Таким образом, изменение состояния динамической системы удовле- творяет некоторой системе дифференциальных уравнений первого по- рядка, которые для компонент вектора х могут быть записаны в виде •_ , ~ h(Xl>X2 •'•>Хп А dt П ' ‘ Л/' При этом, конечно, предполагается, что рассматриваемые дифферен- циальные уравнения однозначно разрешимы и тогда их решение х{ (t), (i~\,n) в любой момент времени t > to определяется начальными ус- ловиями, т.е. значениями х, (to) (i=\,n).
1. Динамическая система 9 Напротив, интегрирование этих уравнений позволяет найти оператор преобразования состояния динамической_системы Т (At). Тем самым за- дание дифференциальных уравнений, которым удовлетворяет состояние как функция времени t, определяет оператор динамической системы. Об- ратное имеет место лишь в случае дифференцируемости оператора ди- намической системы, что часто может не выполняться. Поэтому данное выше определение динамической системы несколько более общее, чем то, которое можно получить, считая, что изменение состояния динамиче- ской системы подчиняется некоторым дифференциальным уравнениям. Заметим еще, что оператор Т (At) может быть определен не при всех A t > О а только для некоторого множества значений A t > 0. Центральным наглядным геометрическим образом динамической сис- темы является ее фазовый портрет, изображающий все возможные ее движения, т.е. всевозможные случаи эволюции во времени ее состояния (описания). Знание фазового портрета дает полное представление о динамике (возможных изменениях) динамической системы, это портрет ее динами- ки. С фазовым портретом мы уже сталкивались при изображении падений тела на двумерной плоскости h, у. Каждое отдельное падение на этой плоскости изображалось параболой Вся совокупность возможных падений описывается параболами при всевозможных значениях С. Это привело к рис. 1.8. Отдельные кривые этого фазового портрета называются фазовыми траекториями, вся сово- купность возможных фазовых траекторий образует фазовый портрет. Опираясь на этот наглядный пример, нетрудно дать общие определе- ния фазовой траектории и фазового портрета, обнаружить важнейшее свойство фазовых траекторий, состоящее в том, что они не могут раз- дваиваться, т.е. ни из одной фазовой точки не может выходить более од- ной фазовой траектории и одна обязательно выходит. Действительно, пусть х - произвольная точка фазового пространства X. За время A t эта точка перейдет в точку х. При изменении A t от 0 до оо точка х опишет некоторую «кривую», выходящую из точки х. Это и есть фазовая траектория, выходящая из фазовой точки х. Эта фазовая траектория единственная в силу однозначности оператора Т (A t). Сово- купность всех фазовых траекторий образует фазовый портрет. Проиллюстрируем понятие фазового портрета на примерах описания катания на санках или лыжах, рассмотрев два вида профиля: ямку с все- возвышающимися краями и ямку на горизонтальной поверхности, изо- браженных на рис. 1.9, а и б. Будем считать, что сани симметричные и могут скользить без трения как вперёд, так и назад. Описание нужно выбрать так, чтобы оно было состоянием. Исходя из опыта примера с падением свободного тела, естественно выбрать в каче-
10 I. Динамическая система стве описания положение s и скорость v саней. Переменную 5 выберем вдоль горизонтали, начало отсчета - от наиболее глубокого места ямки За скорость v примем скорость движения саней вдоль профиля местно- сти. Не будем писать никаких формул и уравнений. Попробуем сообра- зить без них, какой вид имеет фазовый портрет, т.е. фазовые траектории на плоскости s, v. В случае ямки с всевозвышающимися склонами всякое движение саней будет представлять собою либо неподвижное положение внизу ямки, либо периодическое катание со склона на склон. Соответст- вующий фазовый портрет изображен на рис. 1.10а. Он состоит из оваль- ных, замкнутых, вложенных друг в друга фазовых траекторий, внутри которых находится фазовая траектория, изображаемая одной точкой s=0, v=0, отвечающая равновесному положению саней на дне ямки. В точках А, В Си D фазовой траектории Z сани последовательно находятся, соот- ветственно, в крайнем левом верхнем положении, на дне ямки, в крайнем правом верхнем положении, опять на дне, ямки и, наконец, снова в край- нем верхнем левом положении. Такое движение неограниченно периоди- чески повторяется. a) b) Рис. 1.9. Схема езды лыжника по снегу при разных а и б профилях местности Второй случай фазового портрета более разнообразен, поскольку вдоль горизонтальных участков сани движутся с постоянной скоростью и каждая из точек горизонтальных участков при v = 0 является состоянием равновесия. Это приводит к фазовому портрету рис. 1.11а. Давайте сообразим, как изменятся фазовые портреты рис. 1.10а и рис. 1.11а, если учесть реально всегда существующее трение. Теперь ко- лебания внутри ямки всегда затухают и переходят в равновесие на дне ямки. Движение по горизонтальной части также затухает. Если это учесть, то фазовые портреты рис. 1.10а и рис. 1.11а примут виды, изобра- женные на рис. 1,1 Об и рис. 1.116. Теперь, я думаю, вы готовы к тому, чтобы найти уже достаточно сложный фазовый портрет плоского маятника. Мы опять не будем при- бегать к уравнениям и формулам, а попробуем непосредственно сообра- зить, какой он имеет вид. В свое время, позднее, мы напишем формулы и уточним его количественно, а сейчас ограничимся качественным видом. Пожалуй, самое трудное - это понять, что из себя представляет фазовое пространство маятника. Если угол отклонения маятника от вертикали - Ср, то состоянием будет этот угол Ср и угловая скорость вращения маят- ника со = ф. Фазовое пространство - это пространство, точками которого
/. Динамическая система 11 являются всевозможные точки М((р, со). Угол ^меняется в пределах от -л до л, причем значениям ф — —71 к (р —71 отвечает одно и то же положе- ние маятника. Поэтому фазовым пространством будет бесконечная поло- са -л<(р < л, -оо < со <оо, причем точки (р = - л,со и ср = л, со изобра- жают одно и то же состояние маятника, поэтому им должна отвечать в фазовом пространстве только одна фазовая точка, а не две. Рис. 1.10а. Фазовый портрет движения лыжника по идеально гладкому снегу Рис. 1.106. Фазовый портрет движения лыжника с трением при профиле местности рис 1.9а Можно просто условиться, что точки (-л,со) и(л,со)- это одна и та же точка. А можно реально осуществить их слияние, склеив в цилиндр по- лосу по линиям ср=-лмср = л, но, конечно, так, чтобы склеились друг с другом точки с одинаковыми со. В результате приходим к тому, что фазо- вое пространство маятника - это двумерный цилиндр. Он изображен на рис 1.12. Разрезав его вдоль линии ср = ±л, придем к полосе рис. 1.13 с отождествленными сторонами. Рисовать фазовые траектории на цилинд- ре затруднительно, и поэтому будем это делать на полосе, имея все время в виду, что это разрезанный и развернутый на плоскость цилиндр. Рис. 1.11. То же, что и на рис. 1.10, но при профиле местности рис. 1.96 У маятника есть два равновесия: одно нижнее устойчивое, отвечаю- щее точке ср = О, со = О, и другое верхнее неустойчивое, отвечающее (р=±л, со = О. Каждая из этих точек — целая фазовая траектория, ее на- чало и конец и вся она в одной точке.
12 1. Динамическая система Рис.1.12. Фазовый цилиндр А а> Рис. 1.13. Развертка фазового цилиндра на плоскости Если неподвижно висящий маятник, изображаемый равновесием (р = О, а> = О, немного толкнуть, то он начнет качаться с маленькой амплиту- дой возле этого состояния равновесия. Такое движение изобразится не- большим овалом, охватывающим точку нижнего равновесия. С усилени- ем толчка маятник будет качаться все с большим и большим размахом (амплитудой), и наконец, его качания перейдут во вращательное движе- ние либо по, либо против часовой стрелки. Сказанное изображено на рис. 1.14а. Рис.1.14а. Фазовый портрет маятника в отсутствии трения маятника при наличии трения На этом фазовом портрете ко - нижнее устойчивое равновесие, ка - верхнее неустойчивое, kj, к2 - периодические колебательные движения около нижнего равновесия; Bj, В2 - все более и более быстрые враща- тельные движения против часовой стрелки; BJt В2 - убыстряющиеся вращения по часовой стрелке. Угол <р отклонения маятника отсчитывает- ся от нижнего его положения против часовой стрелки. Р1 и Pt - движе- ния, приближающиеся к точке к*, при t оо и t -<х>. Эти последние фа-
/ Динамическая система 13 зовые траектории Р1 и Р1 разделяют колебательные и вращательные движения. Вы можете считать себя на этом первоначальном этапе освоившими представления о фазовом портрете, если сумеете сами, не заглядывая в рис. 1.146, нарисовать, как изменится портрет рис. 1.14а с появлением затухания, например, из-за сопротивления воздуха, и объяснить, какие движения изображаются его отдельными фазовыми траекториями. Все математические модели, которые далее будут возникать и изу- чаться, являются конкретизациями и частными случаями описанной вы- ше общей математической модели динамической системы. Но сколь же они будут не похожи друг на друга, сколь разнообразны как по характеру протекающих в них процессов, так и по их физической природе! Всякий процесс, явление или система любой природы, описываемая дифферен- циальными уравнениями, - это динамическая система. В силу этого ве- ликие законы природы: законы механического движения твердых тел, жидкостей и упругих сред, изменения электромагнитного поля и законы электродинамики и квантовой физики - описываются математическими моделями, представляющими собою динамические системы. Но даль- нейшее изложение начнется не с них. Мы будем рассматривать и изучать очень простые модели, и лишь затем они будут несколько усложняться, оставаясь все же конкретными и очень простыми. Несмотря на их про- стоту, а скорее именно благодаря их простоте, они наиболее подходят для обучения и в наибольшей мере способствуют приобретению столь важных общих и интуитивных представлений, подкрепленных конкрет- ными, допускающими исчерпывающее осмысление примерами. Иногда это будут очень простые математические модели простых физических систем и иногда - простые модели очень сложных систем. Но даже в очень сложных случаях модели будут оставаться простыми, обнаруживая свое значение и познавательную мощь. Как отмечалось, всякая система или процесс, описываемые дифферен- циальными уравнениями, всегда представляют собой динамическую сис- тему. Это следует из теоремы существования и единственности решения дифференциальных уравнений при заданных начальных условиях. Ее со- стояние является совокупностью начальных условий, однозначно опре- деляющих решение, а оператор определяется ее решением на промежут- ке времени A t. Вместе с тем, мне не хотелось бы, чтобы вы подумали, что данное вам общее определение динамической системы - просто другая трактовка дифференциальных уравнений. Чтобы этого не произошло, я приведу пример, где очевидно, что от дифференциальных уравнений далеко и они ни при чем. Этот пример - игра «жизнь» по Конуэлю. В этой игре, разыгрываемой на шахматной доске, состояние определя- ется расположением на ней фишек. Пространство состояний - это мно- жество всевозможных расположений фишек. Состояние можно задать матрицей 8x8, элементы которой - единицы и нули, в зависимости от то- го, есть или нет фишки на соответствующей клетке. Фазовое пространст-
14 /. Динамическая система во состоит из всевозможных таких матриц. С каждым тактом Л t = 1 рас- положение фишек меняется в соответствии с оператором, определяемым тремя правилами выживания, гибели и рождения: 1) фишка остается, если рядом с ней две или три других фишки; 2) фишка убирается, если рядом с ней более трех или менее двух фишек; 3) на пустой клетке появляется новая фишка, если рядом с ней име- лось три фишки. В зависимости от начального расположения фишек возможны весьма многообразные их изменения. Так, например, три фишки, расположен- ные следующим образом нет, превращаются, как показано, сначала в две и затем исчезают. Расположение четырех фишек в виде квадрата не влечет никаких изменений. Три фишки в ряд осциллируют (как показано) с периодом два такта. Пять фишек, образующие фигуру «планер», вида повторяются каждые четыре такта, смещаясь вправо и вниз на одну клет- ку. Существуют расположения фишек, которые, осциллируя каждый пе- риод, рождают «планер». Есть расположения фишек, пожирающие планеры, и т. д. Это разнооб- разие возможностей, отдаленно и упрощенно имитирующее реальную жизнь, порождаемую комбинированием химических молекул, как уже говорилось, представляется динамической системой, состояние которой х - это матрица из нулей и единиц. В ней столько же строк и столбцов, сколько на доске, на которой разыгрывается эта игра. Элемент д,7 этой матрицы равен 1 или 0, в зависимости от того, есть или нет фишки на пе- ресечении i строки и j столбца доски. Множество всевозможных таких матриц с единичными и нулевыми элементами составляет ее пространст-
/. Динамическая система 15 во состояний. Оператор Т (Д t) этой динамической системы определен только для дискретных значений Л t, равных 0, 1, 2 .... При этом, если п целое, то Т(п) = Г(1), а Т(0) - оператор изменения расположения фишек, никак его не меняю- щий. В заключение знакомства с математической моделью динамической системы и ее фазовым портретом найдем фазовый портрет физического маятника на вращающемся основании (рис. 1.15). При неподвижном ос- новании фазовый портрет маятника мы нашли, не выписывая его уравне- ний движения: мы достаточно хорошо знаем маятник и нам не понадоби- лись дифференциальные уравнения его движения. С маятником на вра- щающемся основании так поступить нельзя: его динамика для нас загад- ка и разгадать ее можно, исследуя его математическую модель, что мы и сделаем. Для этого нам потребуются некоторые сведения из механики. Примите их на веру. В качестве состояния маятника на вращающемся основании вокруг вертикальной оси с угловой скоростью Д как и маятника на неподвиж- ном основании, примем его угол отклонения от вертикали ср и его угло- вую скорость со =ф. Нам нужно составить его дифференциальные урав- нения движения. В этом может помочь теоретическая механика. Рис. 1.15. Физический маятник на вращающемся основании Ее рецепт состоит в следующем: надо найти кинетическую Т и потенци- альную Г энергии маятника и составить функцию Лагранжа L, выразив *£=0. ее через переменные состояния ср и со, после чего уравнения движения записываются в таком красивом виде: dtydco) дер После сейчас непонятных вам вычислений находится функция L в ви- де L = — (со + Q2 sin2 #>)+ — Q 2V 7 2 cos ср + М gl cos ср где А и С - моменты инерции маятника, 1пМ- его длина и масса.
16 /. Динамическая система После дифференцирования приходим к искомому дифференциально- му уравнению второго порядка: С - А Аф +—-—Q sin2(р + Мglsin(р = 0. (1.4) Примите на веру то, как составлено это уравнение. Нужно лишь его понимать, т. е. видеть, что при £2=0 оно переходит в уравнения движе- ния обычного физического маятника на неподвижном основании. Еще следует представлять физический смысл моментов инерции Л и С. Маят- ник имеет вид тела вращения относительно своей линии подвеса (линии, соединяющей точку подвеса с центром масс). Его центр масс находится на расстоянии I от оси подвеса, сам маятник имеет массу М С - момент инерции относительно линии подвеса, А - момент его инерции относи- тельно осей, перпендикулярных линии подвеса и проходящих через точ- ку подвеса. Для тела, вытянутого вдоль оси подвеса, С< А. Наоборот, для маятника в виде диска достаточно большого радиуса по сравнению с его длиной С > А. Решить уравнение (1.4) в элементарных функциях нельзя. Но можно его один раз проинтегрировать. Для этого умножим его на ф и продела- ем следующие вычисления: С-А Афф А--—Q2ф sin 2(р -+Мgl(p sin<p = d (А . 2 С-А 2 А = — —ф----------£2 cos2(р —м glcos(p I—с/, dt V 2 4 J откуда А С — А —ф2-----—Q2 cos2(p-Мglcos(p = h, где h - постоянная интегрирования. Из полученного интеграла находим, что [а~ I С-А А—ф=±А/г + —-—Q2 cos2(p+Mglcoscp . (1.5) Это и есть уравнение фазовых траекторий на цилиндрическом фазо- вом пространстве переменных состояния (риф. Эти фазовые траектории надо построить, каждому h - своя фазовая траектория. Но вам сделать это не очень просто. Поэтому, сначала, исходя из этого уравнения (1.5), построим уже известный нам фазовый портрет маятника на неподвиж- ном основании (/? = О). В этом более простом случае ф =±. h + Mglcos(p . (1.6) Рассматривая подкоренное выражение как функцию#?, построим гра- фик постоянной h и график функции - Mgl cos (р (рис. 1.16). Первый гра- фик - прямая, параллельная оси (р на расстоянии h от нее, второй график - один период косинусоиды с амплитудой Mgl. Стрелками на этом рис. 1.16 показаны значения подкоренной функции при разных #?. Если
1 Динамическая система 17 длину этой стрелки с учетом ее направления обозначить через р, то урав- нение фазовой траектории (1.16) запишется в очень простом виде: Для приведенного на рис. 1.16 значения h возможные значения (р за- ключены между (pi и -<pi (вне их р < 0 и ф мнимое). Меняя <р от <pi до - (pi, легко находим из рис. 1.16 вид соответствующей фазовой траек- тории. Это будет овал, нарисованный ниже используемых нами графиков на плоскости ф, ф (точнее, полосе -я < у < я, -со <ф < со). Меняя h от - Mg! до со, найдем все фазовые траектории. Этот фазовый портрет нам уже известен и еще раз изображен на рис. 1.16. Колебаниям маятни- ка отвечают - Mgl < h < Mgl, нижнему, устойчивому равновесию - h = - Mgl, верхнему, неустойчивому, - h = Mgl, вращениям - h > Mgl. Рис. 1.16. Рис. 1.17. Построение фазового портрета маятника на вращающемся основании при £2=0 (рис. 1.16) и при достаточно большом £2 (рис. 1.17) Теперь аналогичным образом построим значительно более сложный фазовый портрет по уравнению (1.5) при £2 *0. При (С—А) £2 2> 4 Mgl рисунок 1.16 изменится и примет вид рис. 1.17. На нем построен график зависимости — Мg I cos (р — ——— Cl2 cos 2<р 4 и проведена прямая, отвечающая значению h. Как и ранее, стрелками по- казаны значения р ((р) и по-прежнему фазовая траектория описывается уравнением (1.7). Меняя h, при некотором усердии находим фазовый портрет, который изображен на рис. 1.17. Этот фазовый портрет наделяет
18 /. Динамическая система маятник совершенно удивительными свойствами: он может устойчиво висеть как вниз, так и вверх. Это поразительная способность появилась в силу сделанного предположения, что (С-A) Q2>4Mgl, т. е. при С > А и при достаточно большой скорости вращения /2 основа- ния маятника. Интересно, что, как можно обнаружить аналогичным об- разом, при С < А увеличение скорости вращения /2 сохраняет неустойчи- вость верхнего положения и делает неустойчивым и нижнее положение равновесия. При С < А и £2 2 > Mgl (А - С)'1 соответствующий фазовый портрет изображен на рис. 1.18. Рис. 1.18. Фазовый портрет маятника на вращающемся основании при достаточно большом £2 Почему нижнее положение равновесия становится неустойчивым с ростом угловой скорости £2, понять можно: устойчивость нарушается центробежной силой. Почему же это не имеет место при С > А и почему при этом и верхнее равновесие становится устойчивым? А дело в том, что маятник не математический, его масса не сосредоточена в одной точ- ке и суммарная центробежная сила при отклонении маятника от нижнего и верхнего равновесий не обязательно направлена от оси вращения, она при С > А может быть направлена к оси вращения. Чтобы это обнару- жить, следует всмотреться в уравнение (1.4), которое можно трактовать как уравнение движения маятника во вращающейся вместе с маятником системе координат под действием силы тяжести и центробежных сил. При этом на маятник действует суммарный момент сил, равный: С-А -----— Q2 sin 2(р - Mglsin ф, который при ф, близком к нулю, возвращает к равновесию при любом /2, и возвращает его к равновесию ф = я-при достаточно большом /2. Точная математическая модель поправляет нашу примитивную интуицию, по- рождая новую, более совершенную. Рассмотрим еще один пример, где интуиция нас подводит. Пусть вам задают вопрос о том, как лучшей вооруженностью компенсировать меньшую численность. Естественный ответ: если армия в два раза менее численна, то она должна быть в два раза лучше вооружена, подразумевая при этом, что она должна быть в два раза более эффективной, т.е. что каждый солдат должен в два раза быстрее выводить из строя солдат про- тивника, чем это делают солдаты более многочисленной армии.
/ Динамическая система 19 А теперь посмотрим, что дает соответствующая математическая мо- дель. Пусть x(t) и y(t) - численности армий в момент времени t. При t = О, когда началось сражение, они были х(0) и у(0). Пусть а и b - скорости, с которыми солдаты противостоящих армий выведут из строя солдат про- тивника. Тогда х = -by, или axdx by dy у = -ах О, ах2-bу2 = ах2(0)-Ьу2(0) const. Согласно полученному интегралу, дающему уравнения фазовых тра- представленный на рис. 1 19. ектории, фазовый портрет имеет вид, Рис. 1.19. Фазовый портрет динамики численностей «сражающихся армий» Все фазовые траектории кончаются либо на оси ОХ, либо на OY, либо в точке О. Если фазовая траектория кончается на оси ОХ, то побеждает армия численности х, если - на оси OY, то армия численности у. В первом случае, для начальной точки хо, уо должно выполняться не- равенство: у<’<^Ьхо- Во втором случае - обратное неравенство. Таким образом, для победы армии численности хо над армией численности уо должно иметь место неравенство: аУо b х2’ т.е. при численности уо> в два раза большей хо, необходимо, чтобы эффективность армии х была в четыре раза большей. Это следует из математической модели, а в чем ошибка интуиции, попробуйте сообра- зить сами.
20 2 ВЫТЕКАНИЕ ЖИДКОСТИ ИЗ СОСУДА •д Рассмотрим очень простое явление вытекания воды из цилиндрически суда с маленькой дырочкой в его дне (рис.2.1). Пусть площадь сечения со S, площадь дырочки ст, а высота уровня воды в сосуде Я. Как будет мен!1а высота уровня жидкости Я, если она вытекает и в начальный момент вьт ния воды ее уровень Н = Но. Ясно, что для того, чтобы ответить на это, прос, достаточно знать скорость у, с которой вода вытекает через дыр Действительно, за время dt через дырочку вытекает объем воды, равный с и поэтому скорость опускания уровня воды в сосуде равна Н = Рис.2.1. Цилиндр с отверстием в дне, через которое выливается вода Если известно у, то полученное соотношение является дифференциалыс уравнением, из которого можно найти Н как функцию времени /, т.е. Н\ Первым догадался, чему равно у, очень давно, три века назад, Торичелли 5 сказал: «Вода будет вытекать с той же скоростью, с какой она бы упала с соты Н ». Ведь сверху вода исчезает, а снизу вытекает и при этом она как1 падает с высоты Н. Тело, падающее с высоты Н, приобретает скорость 1 v = ^H. ! Это и есть знаменитая в свое время формула Торичелли. Нельзя не приз^ остроумия рассуждений Торичелли. Но ведь сверху опускается одна вода] через дырочку вытекает другая. Не все здесь понятно, но формула верная 4 показал эксперимент. Если поверить этой формуле, то приходим к диффер циальному уравнению из которого следует, что
2 Вытекание жидкости из сосуда 21 и поэтому S где С - пока неизвестная постоянная. 0< Из начальных условий и [-^находим, что к 1 'и окончательно । Но Н = (2.2) Теперь можно нарисовать график убывания Н (рис. 2.2) и найти время пол- ного вытекания воды t выт S 2Н± g (2.3) измене- Рис. 2.2. Временной график ния уровня воды при ее вытекании из цилиндра Из графика видно, что сначала вода выте- k кает быстрее, затем скорость ее вытекания уменьшается до нуля и это проис- I ходит за конечное время tebim, пропорциональное корню квадратному из на- - чальной высоты воды Но. Насколько эти выводы совпадают с экспериментом? Формула Торичелли практикой подтверждается: действительно, вода во всех случаях выливается с той же скоростью, как если бы она свободно падала с верхнего уровня воды. А .вот время вытекания 1выт, получаемое по формуле (2.3), оказывается примерно в два раза меньшим. Соответственно, в два раза меньше расчетной и скорость опускания уровня воды Н в сосуде. Откуда взялось такое громадное расхож- дение, если скорость вытекания воды v из дырочки определена правильно? Это I возможно только за счет неправильности формулы Н = V, S означающей, что сколько воды вытекло, на столько ее и убыло. Отчего же она может быть неправильной? Сформулируем ее точный смысл -отношение скоростей v/Нравно отношению сечения цилиндра к сечению вытекающей струи. Мы приняли, не задумываясь, что сечение струи совпадает
22 2. Вытекание жидкости из сосуда с размером дырки и вот это совсем не так. Сечение струи на самом деле мю ше сечения дыры и вызвано это тем, что притекающая к дыре с разных стсТ' жидкость вызывает ее сжатие, благодаря чему сечение струи оказыва! меньше сечения отверстия. Сжатия струи можно избежать, снабдив отверс постепенно сужающейся воронкой. Сложный гидродинамический расчет, и твержденный экспериментом, дает, что сужение струи, вытекающей через верстие в горизонтальном дне, равно примерно 2. Построенная нами математическая модель вытекания жидкости явля динамической системой. Ее фазовым пространством является полупря Н >0. Ее единственная фазовая траектория представляет эту полупрж пробегаемую от Н = со до Н = 0 (рис. 2.3). Рис. 2.3. Построение одномерного фазового портрета вытекания воды Сосуд, из которого вытекает вода, в древние времена использовался для»д счета времени. Это так называемые водяные часы, клепсидры. Если выбрав а и Но так, чтобы 1выт равнялось суткам, то, налив сосуд водой, можно опре, лять время в течение последующих суток по уровню воды Н. Для того, что указать уровни, которым отвечают разные часы суток, нужно разделить от зок оси t графика рис. 2.2 на 24 равных части и, согласно графику этого рис ка, найти соответствующие Н. Нетрудно видеть, что получающаяся при эт шкала времени, выражаемая уровнями воды, будет неравномерной: снач часу будет отвечать сильное опускание воды, а дальше все меньшее и ме шее. Попробуем сообразить, как нужно изменить водяные часы, чтобы шкала была более удобной, равномерной. Еще раз взглянем на формулу (2 шкала будет равномерной, если равным dH вне зависимости от Н будут oic чать равные dt, т.е. нужно сделать так, чтобы { — ^2gH = const. На первый взгляд, это невозможно, но если подумать, то можно сообрази что для этого достаточно цилиндрический сосуд, для которого S постояв^ не зависит от Н, заменить на сосуд, у которого ! S = ajH. Что за форма у такого сосуда? Пусть он имеет вид тела вращения, тогда» горизонтальное сечение на высоте Н- круг радиуса г и площади 5 = яг2.1 лее следует, что или яг2 =
2. Вытекание жидкости из сосуда нто соответствует форме сосуда, изображенной на рис. 2.4, форме, похожей на отелок. Рис. 2.4. Форма сосуда, из которого во- I да вытекает с постоянной скоростью \ , / убывания ее уровня \ • / В Итак, задача решена, закон вытекания найден и может быть использован (ля построения водяных часов с удобной равномерной шкалой, правда, сейчас ио уже никому не нужно. В основе решения задачи о вытекании лежит закон Торичелли, вывод кото- рого несколько туманен. Попробуем его прояснить. Для этого прибегнем к то- ну, чего Торичелли не знал, к закону сохранения энергии. При вытекании во- ць потенциальная энергия тонкого слоя воды массы dm в связи с ее опускани- ем переходит в кинетическую энергию вытекающей воды, так что .или v = ^2gH , что и есть формула Торичелли. Так что все обосновано. Но давайте испытаем на прочность полученный выше результат (2.2) тем, что посмотрим, что он дает при су = S, когда вода не вытекает, а просто падает из бездонного цилиндра. Раз она свободно падает, то очевидно, что никак не согласуется с тем, что дает принятый нами закон Торичелли. На рис. 2.5 для сравнения приведены вместе оба графика изменения H(t). Первый из них отвечает закону Торичелли при ст = S, второй - свободному падению воды. Они не совпадают, хотя вода выливается из сосуда в обоих случаях за одно и то же время 1выт. В чем же дело? Где ошибка? Неверен закон Торичелли? В законе падения твердого тела усомниться трудно. Посмотрим, в чем разница между графика- ми 1 и 2 рис. 2.5. Согласно графику 1, вода сначала вытекает быстро, а затем скорость ее вытекания замедляется, а согласно кривой 2, наоборот, сначала медленно, а затем все быстрее и быстрее. При дырке в весь сосуд, пожалуй, вернее второе. Где же ошибка? Что, неверен закон сохранения энергии? Едва Он неверно применен? Это скорее похоже на правду. Но где?
24 2 Вытекание жидкости из сосуда Рис. 2.5. Временные графики 1 и 2 «вытекания» воды из цилиндра без дна, следующие из уравнения (2.1) и, соответст- венно, закона свободного падения Ведь все так просто и ясно. Вернемся к основной посылке: энергия сох0 ется (трением жидкости можно пренебречь) и поэтому потенциальная верхнего слоя переходит в кинетическую энергию вытекающей жидкое# ведь это так, причем приближенно, только при <т« S. Действительно,^' верхний слой жидкости опускается и имеет некоторую кинетическую энер поэтому правильнее написать , rr , Н2 , V2 dm g Н + dm-^- = dm — и соответственно, учитывая, что ov = -SH, 2gH 1- Эта новая формула при с?« S переходит в формулу Торичелли. Так требуемое уточнение найдено. Но не будем спешить: примем опять ст = 5.1 хуже: теперь Н = оо. Опять ошибка. Вернемся снова к исходному расе! нию, сразу имея в виду <j= S. При падении жидкости ее потенциальная а гия, равная действительно dm g Н, переходит в кинетическую, но не то жидкости, «вылезающей» из сосуда, но и находящейся в нем, точнее, в бавку ее кинетической энергии, поскольку движение носит ускоренный ха* тер. Так что ошибка в том, что нужно еще учитывать прибавку в кинетине^ энергии жидкости, находящейся в сосуде, которая действительно мала cr «S. Но при ст, сравнимом с S, это совсем не так. Еще раз вернемся к ходному рассмотрению и сделаем необходимые уточнения. Итак, пусть V- потенциальная энергия жидкости в сосуде, Т -ее кинет ская энергия, a 1) - кинетическая энергия вытекшей из сосуда жидкосп время dt, тогда, согласно закону сохранения энергии, —(T + V)dt + T, =0. dt Выражение для Г/ нам уже известно. Это v2 • V2 Т, =dmy = -pSHdty, где р- объемная плотность жидкости. Потенциальная энергия может быть сосчитана
2 Вытекание жидкости из сосуда 25 I V = \gHdm = jpSHgdH = . О А кинетическая энергия равна Т = [—dm, J 2 где интеграл берется по всему объему жидкости в сосуде, aw- скорость тече- ния элемента массы dm этого объема жидкости. В разных точках сосуда ско- рость и своя, найти ее - это значит найти, как жидкость вытекает из сосуда, а гэто очень сложно. Как же быть? Как быть, ясно в двух крайних случаях: ,сг« S, и тогда можно пренебречь величиной порядка и2, и а = S, когда и = Н. Последнее приближение применимо и в случае, когда Н»г, где г - радиус цилиндрического сосуда с водой. Примем его, и тогда PJ2 т=^н—. После этого закон сохранения энергии, согласно предыдущему, примет вид: dt{ 2 2 J lo-J 2 или ^-^pgSHH = 0 .откуда (2.5) Как и можно было ожидать, теперь полученное дифференциальное уравне- ние уже второго порядка и успешно проходит проверку при ст = S, поскольку из нее следует, что, как требуется, H = -g. Остается понять, как из него при сг« S следует ранее полученное уравне- ние, основанное на законе Торичелли или его уточнении. Обнаружить это не очень просто. Для облегчения рассуждения введем обозначение и = -Н и за- исследуемое уравнение в виде: S 2 -1 ^\^f(u) (2.6) u=-\gH- и посмотрим, как меняется и. При f(u)<0 скорость и убывает и при f(u)>0, на- против, возрастает, т. е. существует такое значение и = 2gH Г-1 -1
26 2. Вытекание жидкости из сосуда что при и < и* и возрастает, а при и > и* и убывает. В результате эт оказывается близким км*. Для наглядности изобразим полуось значений и нарисуем график f ( и ) как функции и В соответствии с этим график меняется, как показано на рис.2.6. При этом, в силу того, что S/су» 1 ближение и к и* происходит быстро. Заметим, что при приближении и\ точка и* несколько смещается, но это смещение точки и* происходит зн тельно медленнее, чем приближение и к и*, поскольку В силу этого, приближенно и тем точнее, чем меньше cr/S, имеет место что полностью совпадает с тем, что писалось ранее (формулы 2.1 и 2.4). Какие же выводы следуют из того, что уравнение h=~J^h 1Э заменилось уравнением 2 Н н2 2 L V ь Прежде всего то, что теперь в начальный момент t = О, Н = 0. Затем ? 0 исходит быстрое приближение Н к величине Н, определяемой первым у г нением, и далее процесс изменения Н происходит в соответствии со втор Сказанное изображено на рис. 2.7, где сплошной линией изображен граг изменения Н согласно первому уравнению, а пунктиром - второму. % графика, отвечающая промежутку времени от t = 0 до tpa3, соответствует [е гону вытекающей струи жидкости, а остальная часть от tpa3 до tebim - ее. тельному вытеканию с постепенным замедлением. I Для того, чтобы правильно представить этот график изменения скорее следует определить время разгона tpa3, а время вытекания уже определено j 5 12Н„ u,=-J- -• о-V S После разгона величина скорости вытекания жидкости достигает велич! figH , причем скорость разгона v, во всяком случае в начале, как следуя (2.6), равна . S v = —g. ст Поэтому приближенно по порядку величины время разгона равно _ сг /2/70
2. Вытекание жидкости из сосуда 27 Рис. 2.6. Фазовый портрет дифференциального уравнения (2.6) при H=const Рис. 2.7. Временные графики падения уров- ня воды после открытия дырочки: сплошная линия - без учета фазы разгона, пунктирная - с учетом ее Отсюда следует, что примерно t /t риз выт S) В частности, если отношение радиуса цилиндра сосуда к радиусу отверстия в дне равно 100, то время разгона меньше времени вытекания примерно в 108 раза, т. е., если время вытекания - около часа, то время разгона - десятитысяч- ные доли секунды. Даже при относительно большей дыре, когда отношение радиусов —10, отношение времен - порядка 104. Таким образом, при а/S « 1 разгон происходит практически мгновенно, а далее вытекание согласуется с законом Торичелли. На этом краткий рассказ о том, как вытекает вода из сосуда через дырочку в его дне, можно было бы и закончить. Но я хочу еще вам показать, как можно использовать понятие фазового портрета для исследования движений уточ- ненной модели (2.5). Запишем ее дифференциальные уравнения в переменных Н и v уровня жидкости и скорости вытекающей струи. Совокупность этих переменных об- разует состояние и их изменения, согласно предыдущему, удовлетворяют дифференциальным уравнениям: • сг . S Н------v, 1 S су v Jg--------- су Н V2 ~2 (2.9) В пределе при o7S —>0 дифференциальные уравнения принимают вид: Н=0, со о v2 <2gH, — 00 при при v = 2gH, при v2>2gH, 2 асно которому фазовый портрет состоит из вертикальных фазовых траек- [й, по которым фазовые точки бесконечно быстро перемещаются на кри- состояний равновесия v = 2 g Н (рис. 2.8).
28 2. Вытекание жидкости из сосуда Рис. 2.8. Фазовый портрет пре- дельного дифференциального урав- нения (2.10). Линия с черными точ- Рис. 2.9. Фазовый портрет ди? ференциального уравнения (2:0‘ при сг/S « 1 »л ками - состояния равновесия При а/S « 1, т. е. очень маленьком, мгновенные движения перейдутИ стрые, замедляющиеся по мере приближения к линии v 2 = 2gH, и одноврь. но каждая из фазовых точек, включая и бывшие состояния равновесия, (L смещаться влево с очень малой скоростью. В результате этого фазовый ге рет изменится и примет вид, показанный на рис. 2.9. На нем всякое движ£ фазовой точки после быстрого изменения переходит в медленное движ вблизи и вдоль фазовой кривой v 2=2gH, где выполняется закон Торичелли.^ В частности, если начальной является фазовая точка Н - Hq, v = 0, то чала она очень быстро приблизится к кривой v 2 = 2gH и затем будет двиг. ся вдоль нее налево, оставаясь вблизи нее. Соответствующий этому движе фазовой точки график изменения скорости v (точнее Н = —v) уже были ставлен на рис. 2.7. Там же мы очень грубо оценили время приближения вой точки из начального положения Н = Hq, v = 0 к малой окрестности кш v 2=2gH Сейчас мы можем уточнить эту оценку. Действительно, пусть наск тересует время приближения рассматриваемой начальной фазовой точки ь окрестности кривой v 2=2gH, определяемой неравенствами - 2gHs <v2 - 2gH < 2gHs, где e>0 мало. Из второго дифференциального уравнения (2.9) следует, что] Г v2(l-p2 ) "I * pdv- g---------—— dt, введено обозначение p = сг/ S. Пренебрегая малым изменением вели! Н, которая в начальной момент равна Но, и величиной запишем его в вад pdv FSi I 2sH„ J Интегрируя левую часть от значения v=0 до значения v = -yj2gH(l-г)1 вечающего достижению границы ^-окрестности кривой v2 = 2gH, a npai
2. Вытекание жидкости из сосуда 29 часть от 0 до г, находим, что искомое время движения т фазовой точки при- ближенно равно I Т = — -----5—=----J-----In----7=- g „ J у 2S\ g i-ji-e 2gH0 Это по порядку величины близко к ранее грубо оцененному значению т, равному ст 5 ^2H0/g . Таким образом, при небольшой дырочке (e/S « 1), вытекание жидкости из сосуда четко разбивается на две фазы: быстрая фаза разгона до скорости, близкой к 2gH0 , и длительного вытекания за конечное время с убывающей до нуля скоростью V. Вместе с тем из полученных оценок следует, что время разгона с уменьшением сечения дырочки ст неограниченно уменьшается. Это вызывает сомнения, так как соответствует неограниченному росту ускорения. *Этот парадокс, по-видимому, - следствие допущенных приближений в подсче- те кинетической энергии жидкости в сосуде, когда принято, что скорость жид- 1 кости во всех ее точках равна Н. Ясно, что вблизи дырочки это значительно не так, и тем более не так, чем больше 5 /ст. Вместе с тем, при достаточно ма- лой дырочке в силу капиллярного поверхностного натяжения жидкость может не начать течь, если радиус отверстия меньше 2р /pg Но, где р - коэффициент поверхностного натяжения. Для воды и Но » 50 см, это отверстие много менее 1 мм В силу этого же эффекта может прекратиться вытекание с уменьшением уровня Н. Вообще, при маленькой дырочке возможно не только прекращение вытекания, но и возникновение прерывистого вытекания. Однако, оставим эти явления в стороне и попытаемся уточнить вычисление кинетической энергии жидкости в сосуде на основе гидродинамической модели вытекания идеальной жидкости. Это уточнение вычисления наиболее существенно вблизи дырочки, где скорость много больше Н Пусть Н достаточно мало так, что поле скоростей жидкости внутри сосуда вблизи дырочки меняется медленно и его можно считать квазистационарным. Для возможности сравнения полученного выражения для кинетической энергии Т запишем его в виде (рис.2.10): „ fj ери2 da 1 2 v 1 „ (S\2гт2 f „„ Н2 "\KS T=\de\—-------dx-—pv2eK = —pKe — H2 = pSH-------------. J 2 de 2 2 \e J 2 )eH Выделенный скобками множитель - это прежнее выражение кинетической энергии. Отличие нового и прежнего во множителе К S (е Н) 1, где К - среднее значение интеграла по трубкам тока, „ 1 г , }de. К — — I de I —dx. сг J ' de (У О г» с л d(T Величина убывает с х от 1 до —, где dS - значение de на поверхно- de dS ста жидкости. Поэтому К - величина, меньшая Н, причем тем более меньшая,
30 2. Вытекание жидкости из cocvda чем быстрее убывает вдоль трубки тока с ростом х ——. Итак, множитель da личия первоначальной и уточненной величин кинетической энергии мен S ГЛ — и его величина растет с уменьшением ст. Отсюда видно, что совершен ст нами ошибка в первоначальном подсчете кинетической энергии может б значительна, но уменьшается с ростом Н и убыстрением убывания с da том х. Рис. 2.10. Трубка тока, по которой осуществляется подсчет кинетиче- ской энергии Т Найдем теперь, как изменится дифференциальное уравнение (2.5). Имеем dt\ 2 2 ) \а) 2 Откуда Н = как и раньше, приходим к оценке времени разгона вида ‘г> « к. 2Я0 g согласно которой нет стремления к нулю вместе с уменьшением о. За тим, что - это время свободного падения с высоты Но, а К мень 1. Время падения с высоты 50 см - это примерно 0,3 с, т.е. разгон остае быстрым.
31 РАВНОВЕСИЕ И АВТОКОЛЕБАНИЯ УРОВНЯ ЖИДКОСТИ В СОСУДЕ ПРИ ОДНОВРЕМЕННОМ ПРИТОКЕ И ОТТОКЕ Пусть теперь одновременно с оттоком воды из цилиндрического сосу- да с площадью сечения S через его дырочку в дне с эффективным сече- нием а вода снаружи притекает с интенсивностью Q. В этом случае уравнение баланса жидкости в сосуде запишется в виде: SH = -crv + Q, (3.1) где v - скорость вытекания воды через отверстие с сечением струи сг, а Н, как и ранее, - высота уровня жидкости в сосуде, при этом жидкость счи- тается несжимаемой. Если еще пренебречь ее вязкостью, то при a/S «1 и v = ^2gH , дифференциальное уравнение (3.1) можно записать в виде: (3.2) о Л Оно легко интегрируется, но прибегнем к рассмотрению его фазового портрета, нарисовав график скорости Н как функции Н (рис. 3.1). Слева от точки Н* H*=Q2/2c>2g, (3.3) в которой Н=0, фазовые точки по фазовой полупрямой Н >0 движутся вправо, Н возрастает; справа от точки Н*, наоборот, Н убывает. Это оз- начает, что точка Н = Н* - устойчивое состояние равновесия. К нему приходят с течением времени все точки фазовой полупрямой Н > 0. Из формулы (3.3) следует, что высота равновесного уровня прямо пропор- циональна квадрату интенсивности Q притока воды и обратно пропор- циональна квадрату сечения вытекающей струи. Вот, собственно, и вся нехитрая динамика этой системы: она всегда приходит к устойчивому динамическому равновесию Н - Н* притока и оттока жидкости. Допустим теперь, что отток жидкости происходит не через отверстие в дне сосуда, а через так называемый сифон, трубку сечения ст, изогнутую, как показано на рис. 3.2. Трубка не доходит до дна на расстояние, равное Hi, вверху она пово- рачивает на высоте Н2 от дна и кончается ниже дна на расстоянии Нз (рис. 3.2). Сифон - это замечательное устройство, позволяющее выливать воду из неполной бочки через ее край, т.е. при Н < Н2. Но это возможно лишь тогда, когда сифон наполнен водой, если же он пуст, то при уровне воды Н< Н2 через него вода не течет. Можно поэтому думать, что наша система - бочка с сифоном и притоком - будет иметь своим состоянием
3. Равновесие и автоколебания уровня жидкости в сосуде при одновременном притоке и оттоке 32 Рис. 3.1. Фазовый портрет из- менения уровня воды Н в цилинд- ре при притоке воды Q извне и оттоке ее через дырочку в дне Рис. 3.2. Цилиндр с притоком воды Q и оттоком через сифон описание, достаточное для прогноза: высоту уровня воды И и значение переменной £ равное 7, если сифон заполнен водой, и равное 0, если он пуст. Итак, в качестве описания, претендующего на состояние, примем Н и По-видимому, следует различать случаи: H<Hh Ht<H<H2 ъН>Н2. HpnH<Hi f=OuSH=Q. При Н> Н2 сифон наполняется (если не был наполнен), поэтому f = 1 и В промежуточном случае Hi < Н < Н2 возможны значения £ = 0 и £=7.При£=0, ST7=g. При £ = 7 SH = Q-c/2g(HTH^). В случае Hi < Н < Н2 f = 1, если непосредственно перед этим % -1 или Н> Н2 и f = 0, если перед этим f = 0 или Н < Нр Описанную зависимость £ от значения и изменения Н можно предста- вить диаграммой рис. 3.3, на которой указаны условия смены значения £ с 0 на 7 и обратно: меняется с 0 на 7, если Н, возрастая, обращается в Н2, и % испытывает переход от 7 к 0, если 77, убывая, проходит значение Нр Сделанное описание является математической моделью сифона. При этом £ не является функцией 77, хотя бы и двузначной. Это функционал
3 Равновесие и автоколебания уровня жидкости в сосуде при одновременном притоке и оттоке 33 от предшествующего изменения Н(т) с т < t, описываемый диаграммой рис. 3.3. Уравнения изменения Н, согласно предыдущему, записываются в виде : Н = Q/S Q/S ' Q/S-v/sJi^hThJ Q/S-а/Spg(H+ Н3) при Н <НХ, при I/, <Н < Н2и £ = О, приНх<Н<Н2и £ = 1, при Н>Н2. (3.4) Фазовое пространство рассматриваемой системы состоит из двух час- тей: отрезка $<Н<Н2 и полупрямой Н] <Н< оо, с переходами с одного на другой, показанными на диаграмме рис. 3.3. Я* • » » -> а) Hj Н2 % н\ £=7 ——Г------- U Т - » -— б: --------► Hj н2 Н1 н2 н т ----------------------- в) Hi н2 Рис. 3.3 Рис. 3.4 Диаграмма смен состояния £ сифона при изменении уровня воды Н и одновременно фазовое пространство уравнения (3.4) Для того, чтобы на этом фазовом пространстве построить фазовый портрет, нужно показать стрелкой направление движения каждой из его точек в соответствии с дифференциальными уравнениями (3.4 ). Знак Н непосредственно указывается уравнениями (3.4). При Н<Н2 и £=0 Н > 0. На части фазового пространства, отвечающей £ = 7, знак Н зави- сит от местоположения точки 77=77*, в которой Q-apg(H + H3)=0. Возможны три разных случая: а) Н* < Hi б) Hi < Н* < Н2 и в) Н* > Н2. Они представлены на рис.3.4. Первый случай (а) отвечает возникновению периодических колебаний уровня воды от Hi к Н2 и обратно. Второй и третий - устойчивым рав- новесным уровням /7* между Hi и Н2 и выше Н2_ Пусть все параметры изучаемой системы фиксированы, а /7? может меняться. То, какой из случаев будет иметь место, зависит от значения корня /7* уравнения
3. Равновесие и автоколебания уровня жидкости в сосуде при одновременном притоке и оттоке 34 равного Q2 Н*=- -Н3. 2ga Согласно рис. 3.4, при Н* > Hi имеет место устойчивое равновеси! уровня жидкости в сосуде, при Н* < Hi - устойчивые периодические его колебания, называемые автоколебаниями. Скачкообразное изменение динамики уровня жидкости происходи:, при значении Нз, определенном из условия Q2 -^--Н3 = Н, 2ga2 или при * Q2 H3 = H3=^-y-Hlt 2gcy т.е. при Нз < Нз* имеет место устойчивое равновесие, а при Нз>Н? будут наблюдаться автоколебания.
35 ПЕРЕХОДНЫЙ ПРОЦЕСС, СОСТОЯНИЕ РАВНОВЕСИЯ И АВТОКОЛЕБАНИЯ В только что рассмотренных математических моделях мы познакоми- лись с тремя типами движений динамических систем: переходный про- цесс, состояние равновесия и автоколебания. Переходный процесс имел место при выливании воды из сосуда: сис- тема из одного состояния, отвечающего начальному уровню воды, пере- ходит к другому, при котором сосуд пуст. Переходные процессы имели место и при установлении в сосуде равновесного уровня или периодиче- ских колебаний уровня. Последнее имело место в случае слива воды с помощью сифона. Равновесие носило динамический характер в результате устойчивого выравнивания притока и оттока воды. Устойчивость возникла в силу то- го, что увеличение уровня вызывало превышение оттока над притоком, а его уменьшение, наоборот, превышение притока над оттоком. Наиболее неожидан и интересен случай, когда возникают устойчивые колебания. Ведь они возникают без какой-либо видимой побуждающей их причины, сами по себе, почему и названы автоколебаниями (самоко- лебаниями). Еще совсем недавно возникновение таких колебаний связы- вали с каким-нибудь периодическим воздействием и с трудом приняли, что периодические колебания могут возникнуть сами по себе без него. В науке и инженерном деле признание возможности автоколебаний носило характер революционной ломки сознания, которая последова- тельно совершалась в электричестве, механике, химии, биологии и эко- номике. Казалось, что возможность автоколебаний противоречит приро- де вещей: всякие механические колебания, например колебания маятни- ка, затухают, затухают и колебания электрического контура. А в химиче- ской реакции откуда возьмутся колебания: всякая реакция стремится к своему окончанию; некоторому динамическому равновесию. Но все ока- залось значительно сложнее. Автоколебания возможны в самых разнооб- разных физических, химических и биологических системах. Автоколеба- ния могли быть вредными, а могли быть полезными, и вскоре, после упорных и бурных обсуждений, их стали видеть всюду. Сегодня это уже банальность. Но еще в тридцатых-пятидесятых годах прошлого века это было совсем не так. В технике многие автоколебательные явления, такие, как шимми передних колес автомобиля, состоящие в возникновении их колебаний; флаттер крыла самолета, при котором возбуждаются колеба- ния крыла самолета, ведущие к его поломке или потере управляемости самолета; колебания режущего инструмента металлообрабатывающих станков и многие другие, длительное время пытались объяснить, исходя из предположения о наличии вынуждающей силы и резонанса. Шимми
36 4 Переходный процесс, состояние равновесия и автоколебания предполагалось возникающим от неровностей дороги или дисбаланса ко лес, особенно опасным, если имел место резонанс - близость периоди- ности этих воздействий с собственной частотой колебаний колес. Флат тер крыла считалось, что вызывается вихрями в воздушной атмосфере опять же опасно, если имел место резонанс. Режущий инструмент вибри- ровал под влиянием срывов снимаемой стружки. Эти неправильные представления приводили к бессилию теории борьбе с подчас очень вредными и опасными явлениями. I Несколько ранее, чем в механике, признание автоколебаний произош- ло в радиотехнике, поскольку именно они (автоколебания) лежали в ос- нове зарождающейся передачи радиосигналов, в основе радиотехники i затем телевидения. Особенно упорным сопротивление идее автоколебаний было в химю и биологии, где консервативность проявлялась сильнее и длительнее Даже когда Белоусов нашел реакцию, которая носила явный автоколеба- тельный характер, видимый по периодическому изменению цвета рас- твора, химики не сдавались и утверждали, что это невозможно, потому что невозможно никогда. Обычно принято думать, что великие открытия и перевороты в науке требуют сложных новых методов, на самом деле они требуют скорее простых, но принципиально новых. Таким принципиально новым подходом, позволяющим понять естест- венность возникновения автоколебаний и заставляющим нас их принять в противовес ошибочной интуиции, является фазовый портрет динамиче- ской системы. Именно он легко убедил в том, что сифон может вызвать автоколебания. Но, пожалуй, общие соображения о том, каков образ ав- токолебаний на фазовом портрете и как он может у него возникнуть, еще действеннее, чем отдельные примеры. Этот простой геометрический об- раз - замкнутая фазовая траектория - открыл А.Пуанкаре, а его научное математическое открытие с практикой и теорией колебаний связал А.А.Андронов. Его знаменитая работа так и называлась: «Предельные циклы А.Пуанкаре и автоколебания». Как же сегодня можно объяснить явление возникновения автоколеба- ний в динамических системах, естественность и обычность этого явле- ния? Пусть динамическая система описывается дифференциальными урав- нениями х = Х(х) (х-вектор). Его фазовые траектории являются огибающими векторов поля этой системы, т.е. скоростей X, которые в каждой точке х фазового простран- ства определяют вектор х, т.е. векторное поле. Если поле скоростей, т.е. вектор-функция Х(х) такова, что фазовая траектория замыкается, то воз- никают автоколебания. Для этого нужно лишь подобрать подходящим образом вектор-функцию Х(х), а это сделать совсем нетрудно Нужно лишь, чтобы пучок фазовых траектории зашел себе в хвост и сжался, как
4, Переходный процесс, состояние равновесия и автоколебания____ 37 это показано на рис. 4.1. Сжатие фазовых траекторий обеспечивает не только существование замкнутой фазовой траектории, но и ее устойчи- вость. Так бывает очень часто: именно в силу такой ситуации поет скри- пичная струна, гудит орган, переливается флейта, поет соловей, мы гово- рим и поем, работает наше сердце, мы ходим и бегаем, идут часы на на- шей руке, передаются радиосигналы, стрекочат кузнечики, противно скрипят тормоза, и еще неприятней скрипит ноготь, которым проводят по стеклу. Рис.4.2. Иллюстрация к возникнове- нию автоколебаний на фазовой плоскости Рис.4.1. Иллюстрация к возникнове- нию автоколебаний В двумерном случае, т.е. при двумерном фазовом пространстве нари- совать общее поведение фазовых траекторий, ведущих к наличию авто- колебания - устойчивой замкнутой фазовой траектории, к которой при- ближаются соседние траектории, еще нагляднее. Пусть одна фазовая тра- ектория у] скручивается, и расположенная внутри другая фазовая траек- тория у2 раскручивается, как показано на рис.4.2. Наглядно ясно, что между ними есть замкнутая фазовая траектория у, на которую они нама- тываются (она изображена пунктиром). В дальнейшем будет приведен конкретный, т.е. описывающий реальный объект, пример подобного по- ведения фазовых траекторий. А сейчас ограничимся примером диффе- ренциального уравнения. Пусть (р, г - полярные координаты, удовлетво- ряющие дифференциальным уравнениям ф = 1, г = г-г2. Из этого уравнения видно, что фазовая траектория, начинающаяся при (р = 0 и г = 7/2? раскручивается, а начинающаяся в точке (р= О иг = 2 - скручивается, и их разделяет окружность г = 7, соответствующая устой- чивому периодическому вращению - автоколебанию, что означает, что касательная в каждой ее точке совпадает с вектором х, вектором скоро- сти и перемещения этой точки в фазовом пространстве.
38 ДИНАМИКА УРОВНЯ ЗЕРКАЛА ВОДОХРАНИЛИЩА С ГИДРОСТАНЦИЕЙ В предыдущих главах мы строили и изучали математические модели бочки с водой при ее оттоке через отверстие в дне или сифон и, возмож- но, еще притоке. Бочка — объект, заслуживающий внимания: самая из- вестная для современников работа И.Кеплера, помимо его астрологиче- ских работ, о том, как определить объем наполненной бочки, не опораж- нивая ее. Но это было давно, и с тех пор бочка потеряла свою «актуаль- ность». В соответствии с этим и мы перейдем от бочки к математическим моделям более значимых объектов: водохранилища с гидростанцией и бесценного жидкостного насоса, помещающегося у нас в груди, именуе- мого сердцем. Эти объекты очень сложные, но их модели останутся про- стыми до примитивности, и все же кое о чем важном, неочевидном и ин- тересном они нам поведают. Рис. 5.1. Схематическое изо- бражение водоема с плотиной и гидростанцией На рис.5.1 схематически изображено водохранилище с уровнем воды Н, подпирающей его плотиной и гидравлической турбиной с электроге- нератором. Вода из водоема по трубопроводу поступает в турбину и вращает ее. Соединенный с ней генератор вырабатывает электрический ток требуемой мощности W. В водоем притекает вода, интенсивность общего притока которой равна Q. Величина Q меняется со временем, но мы примем ее постоянной. Вода в водоеме расходуется на вращение тур- бины, но, кроме того, следует учесть испарение и фильтрацию воды, ко- торые растут с повышением уровня воды в водоеме. Нас будет интересо- вать изменение уровня воды Н в водоеме. Расход воды, необходимый для выработки электроэнергии, зависит от интенсивности использования во- ды гидротурбиной и ее напора, определяемого уровнем Н воды в водо- еме. Учитывая все сказанное, можно записать
5. Динамика уровня зеркала водохранилища с гидростанцией 39 S- = Q-I-F-----—---, dt kpg(H + h) (5.1) где S (Н) - площадь поверхности зеркала воды в водоеме, I и F - интен- сивность испарения и фильтрации, а последний член выражает интен- сивность расхода воды, необходимого для выработки электроэнергии мощности W при коэффициенте полезного действия гидростанции к. Выражение последнего члена расхода воды в формуле (5.1) находится следующим образом. Пусть искомый объемный расход равен Р. Тогда, если перепад уровня воды перед гидротурбиной H+h, то при перетекании воды из водохранилища в гидротурбину освобождается за время dt энер- гия, равная pgP(H + h)dt. Часть kpgP(H+h) этой энергии превратится в электроэнергию (к - ко- эффициент полезного действия гидротурбины вместе с электрогенерато- ром), которой требуется мощность W. Поэтому kpgP(H + h) = W, откуда находим искомую интенсивность объемного расхода воды гидро- турбиной р=—. kpg( H + h) Перейдем к исследованию полученного дифференциального уравне- ния (5.1). Для этого нам необходимо нарисовать график правой части этого уравнения как функции Н. Правая часть состоит из постоянного слагаемого Q, величин InF, возрастающих с ростом уровня Н, и послед- него члена, который, напротив, увеличивается с убыванием Н. При Н<0 последний член исчезает, так как при этом прекращается подача воды в гидротурбину. В соответствии с этим более полно уравнение (5.1) запи- шется в виде: № = < Q-I-F- Q-I-F W kpg(H + А) при Н > О (5.2) при Н < О, а график правой части уравнения (5.1) качественно имеет вид, представ- ленный на рис. 5.2. Рис. 5.2. Фазовый портрет системы «водоем-гидростанция с плотиной» при описании изме- нения уровня воды в водоеме дифференциальным уравнением (5.2)
40 5. Динамика уровня зеркала водохранилища с гидростанцией На нем величина правой части есть разность между Q и остальными членами, которая изображается стрелками. Согласно этому графику, на фазовой полупрямой Н >-Hj имеется три состояния равновесии. О2 (Н = Н2*) - устойчивое равновесие, при котором обеспечена полно- ценная работа гидростанции с выдачей требуемой мощности W, равно- весие О с Н = 0 также устойчивое, но оно не обеспечивает получение полной мощности W, а только ее части, равной <w, н=о поскольку при Н = 0, как видно из графика рис.5.2, и, наконец, неустойчивое состояние равновесия О] (Н = Hi*). Оно инте- ресно тем, что при Н> Н]* уровень водоема возрастает до величины Н = Н2*, и при этом обеспечивается требуемая отдача электроэнергии. Напротив, при 0 < Н < Hi * уровень Н уменьшается до нуля и полноцен- ная работа гидростанции не обеспечивается. Заметим, что она не обеспе- чивается не за счет того, что принципиально не хватает требуемой воды, а за счет того, что режим работы системы выбран неправильно. Ведь при том же притоке Q в равновесии О2 мощность W гидростанцией обеспечи- вается. Из сказанного следует, что нельзя допускать падения уровня воды в водоеме ниже Н = Hi*, Hi* - это критический уровень, ниже которого необходимо принимать неординарные меры: уменьшать временно по- требление электроэнергии и мощность гидростанции и лишь после того, как уровень Я превзойдет Hi*, снова вернуться к нормальной эксплуата- ции. Теперь посмотрим, какие сюрпризы нас могут ожидать при временных уменьшениях интенсивности притока Q или временной необходимости увеличения мощности W. При уменьшении Q состояния равновесия О2 и О] сближаются, при Q = QKp - сливаются и при Q < QKp — исчезают, после чего уровень Н приближается к Н = 0. При Q < Q равновесный уровень меньше нуля. Аналогичный результат возможен и при временном увели- чении W. В обоих случаях для того, чтобы вернуться к прежнему нор- мальному режиму работы гидростанции, необходимо временно умень- шить мощность гидростанции и дождаться того, когда уровень Н пре- взойдет его критическое значение Hi*. Для придания наглядности сказанному нарисуем диаграмму зависимо- сти равновесных режимов от величин Q. При одном значении Q, изобра- женном на рис.5.2, эти равновесные состояния - Oi (Hi*), О2( Н2*) и О(Н=0). Нанесем их при разных Q на диаграмму, как показано на рис.5.3. Кружочками отмечены устойчивые равновесия и крестиком - не- устойчивые. Будем теперь менять Q и посмотрим по диаграмме рис. 5.3, как меня- ется равновесие. При уменьшении Q состояния равновесии Oi и О2 будут
5. Динамика уровня зеркала водохранилища с гидростанцией 41 сближаться (Н2* убывает, а Я/* возрастает). Для состояния равновесия О величина Н по-прежнему равна нулю. При некотором критическом значении Q = QKp, равновесия О/ и О2 сольются и при дальнейшем уменьшении Q исчезнут. После того, как они исчезнут, в связи с умень- шением Q, останется одно устойчивое равновесие О. В этом равновесии Н = 0, гидростанция не может вырабатывать полную мощность W, так как при этом расход воды Р, находимый из соотношения 2-/-F-P = 0, меньше, чем расход W / kgр f, требуемый для получения мощности W. При обратном возрастании Q гидростанция будет находиться в неполно- ценном режиме Н = 0 работы вплоть до Q = Q , где — W Q=I(0) + F(0) + ----. kgph После возрастания Q сверх Q режим О перестанет быть равновесным и гидростанция перейдет к режиму О2, в котором будет отдавать требуе- мую мощность W в выгодном режиме работы. На рис. 5.4, повторяющем рис. 5.3, показано, как будет меняться ре- жим работы гидростанции при медленном, описанном выше, сначала убывании, а потом возрастании притока воды Q. Характерной особенно- стью этого изменения является то, что при одном и том же притоке Q при QkP < Q < Q возможно два существенно разных режима работы гидро- станции в соответствии с двумя устойчивыми равновесиями О2 и О. С точки зрения работы гидростанции хорошим является первый и плохим - второй. То, какой из режимов на самом деле будет иметь место, зависит от предыстории изменения Q. Нетрудно заметить, что характер этой за- висимости похож на тот, что имел место для сифона. Рис. 5.3. Бифуркационная диа- грамма равновесных уровней в во- доеме с гидростанцие. Рис. 5.4. Графическая иллюстрация явления гистерезиса зависимости уров- ня воды Н в водоеме от ее притока Q С помощью диаграммы рис. 5.3 и рис. 5.4 легко прослеживается зави- симость возможных равновесных режимов от притока Q и как они сме- няют друг друга при медленном изменении Q. Ее называют бифуркаци-
42 5 Динамика уровня зеркала водохранилища с гидростанцией онной диаграммой состояний равновесия по параметру Q - диаграммой изменения равновесий с изменением параметра Q. Как следует из сказанного, стратегия управления гидростанцией, при которой она все время вне зависимости от уровня Н и притока Q должна выдавать мощность W, не только не всегда реализуема, но и плоха, так как может приводить к ситуации, когда гидростанция не выдает требуе- мую мощность W, хотя это было бы вполне возможным при другой стра- тегии управления ею. Выше предполагалось, что уровень устойчивого равновесия не выше допустимого Нтах. Это может быть не так, и тогда необходимо использо- вать неустойчивое равновесие, трансформировав его в устойчивое сред- ствами управления, о чем будет идти речь далее. Если пренебречь поте- рями воды на испарение и фильтрацию по сравнению с расходом ее на выработку электроэнергии, то ясно, что наилучшим режимом работа гидростанции является ее работа на максимально возможном Нтах (опре- деляемом высотой плотины), потому что в этом случае расход воды на единицу получаемой мощности минимален. Этот режим работы не толь- ко самый экономный с точки зрения расхода воды, но и дающий макси- мально возможную мощность при заданном притоке Q. Это, если можно так выразиться, идеальный режим работы гидростанции. Но он реализу- ется при заданной Нтах при вполне определенном притоке Q, равном W 1(Нтах ) + F(H ) +--------------. kgp(h + Hmx) При уменьшении Q этот оптимальный режим нарушается и при со- хранении мощности W переходит в менее выгодный режим с меньшей, чем Нтах, высотой Н. Нетрудно видеть, что при этом происходят потери возможной суммарной энергии. Чтобы этого не происходило, можно снизить мощность W так, чтобы уровень воды оставался Нтах- Как види- те, перед нами возникает задача об оптимальном управлении гидростан- цией. Теоретическим изучением таких задач занимается специальная сравнительно недавно возникшая и еще развивающаяся наука - теория оптимального управления, являющаяся самостоятельной частью более общей науки, называемой теорией операций.
43 6 ЭНЕРГЕТИЧЕСКАЯ МОДЕЛЬ СЕРДЦА Мы построим и исследуем очень простую энергетическую модель сердца. Будем изучать орган очень сложный с помощью модели очень простой. Оказывается, это возможно. Оказывается, и очень простая мо- дель может быть полезной и сказать что-то очень важное и интересное. Функционально сердце - четырехкамерный насос, снабжающий кро- вью весь организм. Одна его половина прокачивает кровь по, так назы- ваемому, малому кругу, через легкие, обогащающие ее кислородом. Си- няя венозная кровь превращается в красную, ее эритроциты, поглотив кислород, меняют цвет. Вторая половина сердца снабжает артериальной кровью, наполненной кислородом и многими другими веществами, все органы и ткани человека. Это, так называемый большой круг кровообра- щения. Сердце не может остановиться, оно должно непрерывно работать днем и ночью, всю нашу жизнь. Но сердце - не просто насос. Это управляемый насос, подчиняющийся командам вегетативной и центральной нервной систем. При своей работе оно должно согласовываться с физическими и психическими нагрузками своего обладателя, поддерживать баланс между большим и малым кру- гами, менять свой ритм и интенсивность работы в соответствии с коман- дами нервной системы. Его нервная регуляция многоступенчата и доста- точно сложна. Сердце совершает механическую работу за счет запасен- ной им химической энергии, которая все время неустанно пополняется поступающей в него кровью за счет его же работы. Оно как бы питает само себя, работает, потому что себя питает. Сердце - это сложный управляемый насос, он должен прогонять кровь по малому и большому кругам, принимая предсердиями и прокачивая желудочками. Для этого нужна система клапанов: митральный, аорталь- ный и другие, нужны сложнейшие сети артериальных и венозных сосу- дов вплоть до тончайших капиллярных сосудов, доставляющих кровь клеткам тканей. Процесс превращения химической энергии АТФ в меха- ническую работу очень сложен, очень сложна и система управления ра- ботой сердца, она должна в достаточной мере снабжать организм кро- вью, не излишествуя и увеличивая это снабжение по мере необходимости при физических, умственных и стрессовых нагрузках. Она должна обес- печить согласованность прокачки крови по большому и малому кругам, не вызывая переполнения кровью легких, органов и тканей организма. В этом ей помогают эластичные сокращения и расслабления сосудов. Сис- тема управления должна обеспечить и синхронное сокращение отдель- ных мышечных волокон сердца, и возможность его автономной работы. Все это достаточно сложно. Современной медицине очень нужны мате-
44 6. Энергетическая модель сердца матические модели сердца, они нужны, чтобы понять, как можно ему помочь, особенно в так называемых критических состояниях: при реани- мации, операциях на сердце и тех или иных его заболеваниях. В настоящее время существуют модели, отражающие лишь отдельные стороны его очень сложного функционирования. Я вам расскажу об очень простой модели, где отражено только то, что им управляет нервная система и некоторые поступающие в него химические вещества, и то, что оно живет только потому, что, работая, себя питает. В соответствии с этим будем описывать его только двумя переменными: командой управ- ления и, которую сердце беспрекословно выполняет, и его текущим энер- гетическим запасом Q, который расходуется для выполнения работы и пополняется протекающей через него кровью. Энергетический запас сердца Q расходуется и тогда, когда сердце не работает. Он расходуется1 для поддержания жизнедеятельности его тканей. В соответствии с этим можно записать дифференциальное уравнение ^ = -a-f(u,Q) + g(u.Q). (6.1) at где а - интенсивность расходования Q на поддержание жизненного со- стояния неработающего сердца,/(п, Q) - интенсивность расхода энерге- тического запаса на совершение работы по перекачке крови и g(u, Q) - интенсивность пополнения запаса Q за счет поступающей в сердце кро- ви. Величины и и Q могут меняться в О <Q <Qmax (рис.6.1). каких-то пределах 0 <и <и„Л Рис. 6.1. Геометрическая интерпретация энергетиче- ской модели сердца, описы- ваемой дифференциальным уравнением (6.1), на плоско- сти переменных запаса энер- гии сердца Q и управления и Для того, чтобы написанная модель приобрела конкретность, нужно знание функций f(u, Q) и g(u, Q), хотя бы качественное. Ясно, что как при и = 0, так и Q = 0 эти функции обращаются в нуль, т.е. f(0, Q) =f(u, 0) = g (О, Q)=g(u, 0) = 0. Далее f(u,Q) - неубывающая функция обоих аргументов. Так как Q не может быть больше Qmax, то при Q = Qmax ^<0 dt и поэтому а f(u> Qmax) + Qmax) —
6 Энергетическая модель сердца 45 Естественно предположить, что при и = итах, т е. максимальном тре- бовании к работе сердца, оно быстро истощается и при этом dQ/dt < О Таким образом, на сторонах Q = О, и = 0 п и = итах прямоугольника рис.6.1 правая часть дифференциального уравнения (6.1) отрицательна. На четвертой стороне Q = Qmax она не положительна. Вместе с тем мы длительно живем и поэтому внутри квадрата рис.6.1 должна быть об- ласть, где правая часть уравнения (6.1) положительна. Это приводит к картинке рис.6.1, где стрелками указаны направления перемещения точ- ки М (и, Q) при фиксированном и. Конечно, сколько-нибудь точный вид границы области, где внутренний запас Q энергии сердца растет, остался неизвестным, но для наших целей он и не нужен. Мы будем основывать дальнейшие выводы только на общих представлениях о виде области (7, в которой Q возрастает вплоть до ее границы. Вне области G точка М (и, Q) при своем движении при фиксированной команде управления и либо приходит на отрезок, где Q = О, либо приходит на часть Г границы области G. Наблюдая возможные движения точки М (и, Q) при изменениях и, можно заметить, что до тех пор, пока точка М (и, Q) не оказалась левее прямой Q = QKp, она может побывать в любом месте и быть приведена к любому месту с Q > QKp. Напротив, при Q < QKP ее судьба предопределе- на, и независимо от изменения и точка М (и, Q) приходит на границу Q = 0, это приводит к гибели сердца. К неотвратимой, если не будут предприняты соответствующие реанимационные меры. Отсюда ясно, что пребывание вне области G в той ее части, где точка М (и, Q) приходит к отрезку, на котором Q = О, допустимо только до тех пор, пока точка М (и, Q) лежит правее прямой Q = QKp. Причем меры, с помощью кото- рых можно предотвратить это, могущее стать роковым, движение точки М (и, Q), различны для случаев, когда точка М (и, Q) лежит выше области G и когда - ниже нее. В первом случае необходимо вовремя прекратить дальнейшее требование высокой нагрузки на работу сердца, т.е. нужно уменьшить и. Во втором случае, напротив, необходимо стимулировать работу сердца и увеличить команду и. Нетрудно видеть, что первый слу- чай отвечает длительным нагрузкам, которые следует прекратить, а вто- рой - недостаточной работе сердца, недостаточной ее стимуляции и тре- бует увеличения команды, и в том числе с помощью возбуждающих ме- дикаментозных средств. Таким образом, с точки зрения этой модели, возможны два карди- нально разных кризисных состояния сердечной деятельности; одно - на- зываемое длительной нагрузкой, другое - длительным чрезмерным ос- лаблением его деятельности. Заметим, что длительная интенсивная рабо- та сердца может быть вызвана не только реальной физической нагрузкой, но и стрессовым состоянием и перевозбуждением нервной системы. Теперь посмотрим, как меняется область G при сужении сосудов, пи- тающих сердце, при уменьшении его коэффициента полезного действия, вызываемого, в частности, детренировкой, интоксикацией или общим истощением организма.
46 6. Энергетическая модель сердца В первом случае уменьшается величина функции питания g (и, Q), во втором - увеличивается значение функции f (и, Q). Оба случая имеют один и тот же эффект - уменьшение размеров об- ласти G, что влечет сужение жизненных возможностей организма. В ча- стности, при этом увеличивается QKp, уменьшаются нагрузочные воз- можности и одновременно возможности сердцу «отдохнуть». Как это ни парадоксально, но сердце вынуждено работать интенсивнее и в сужен- ных пределах изменения нагрузки. Оно лишено отдыха и имеет очень малый запас мощности и суженный резерв. Некоторого улучшения этой ситуации можно добиться путем искусственного лекарственного расши- рения коронарных сосудов и, возможно, еще умеренной тренировкой, призванной увеличивать коэффициент полезного действия сердечной мышцы и сердца в целом. Таковы выводы, которые можно сделать из принятой примитивной энергетической модели сердца. В модели учтено лишь то, что интенсив- ность работы сердца подчиняется управлению и, и что оно поддерживает свою жизнь, все время работая. Можно заметить, что эти же особенности есть и у каждого живого существа, предоставленного самому себе в ок- ружении безжалостной природы: оно должно все время убегать от вра- гов, искать и добывать себе пищу, и интенсивность этого поиска и убега- ния диктуется им самим и обстоятельствами. Разница между бедным жи- вотным и нашим сердцем только в жесткости внешних требований, кото- рые человек сумел в большей или меньшей мере смягчить. Пожалуй, в некоторой мере эта модель относится и к сообществу животных и чело- века.
47 ЗАСОЛЕНИЕ ВОДОЕМА С ЗАЛИВОМ И ЗАГАДКИ КАСПИЙСКОГО МОРЯ Следующая математическая модель, которую мы рассмотрим, это за- соление или растворимое загрязнение водоема стекающими в него вода- ми Помимо экологического аспекта эта модель имеет отношение к за- гадке существенно разных соленостей Черного и Каспийского морей, имеющих общее происхождение. Если говорить о засолении замкнутого ограниченного водоема, то ясно, что по мере стекания в него вод, несу- щих растворимые вещества, он будет все более и более засоляться до тех пор, пока не наступит насыщение и выпадение осадка. Пусть Q - интенсивность втекающего потока, a v - концентрация за- грязняющих веществ. Далее, пусть и - объем водоема и I - интенсив- ность испарения с его поверхности. Интенсивность испарения зависит от многих факторов: влажности воздуха, его температуры, ветра. Но ее среднее значение определяется, в основном, размером испаряющей по- верхности, которая определяется объемом и. Аналогично, интенсивность втекающего потока Q меняется и зависит от очень многих причин, но среднее значение Q достаточно постоянно. Запишем уравнение баланса притекающей и испаряющейся воды ^=e-w dt и уравнение накопления в водоеме общего количества загрязнений dM „ — =vQ. dt Так как I (и ) — возрастающая функция ь>, то из первого уравнения следует установление устойчивого равновесного уровня и*, определяе- мого из уравнения Q-!(») = О, что поясняется графиком рис. 7.1. Рис. 7.1. Фазовый портрет дина- мики уровня воды в водоеме с испа- рением, зависящим от количества воды в нем Из второго уравнения следует, что масса загрязнения неуклонно рас- тет. Сначала это влечет увеличение концентрации загрязнения, равной
48 7, Засоление водоема с заливом и загадки Каспийского моря Л/7 и, а затем, с наступлением насыщения, ее рост прекращается и начи [ нается образование донных отложений. Как видно, в рамках этой модели причина различия в солености Чер- ного и Каспийского морей установлена быть не может. Необходимо учесть еще какие-то обстоятельства. Но что именно? Черное море не со- всем замкнутое, оно соединено узким проливом со Средиземным морем, Но через Босфор вода, в основном, вытекает, так обстоит дело сейчас, а ранее оно было замкнутым. Каспийское море все время изолировано от океана и, несмотря на это, его соленость много меньше, чем у Черного моря. В чем же может быть существенное различие? Это различие не броса] ется в глаза. Оно - в наличии у Каспийского моря залива Кара-Богаз-Гол. На первый взгляд кажется, что это не может играть роли, ведь все равно] Каспий остается замкнутым водоемом, но это не так. Не так, потому что между водами Кара-Богаз-Гола и Каспия нет перемешивания, вода из Каспия все время течет в залив. Пролив, их соединяющий, узкий и длин! ный, а снижение уровня воды в нем около 4,5 метров. Учтем все это и составим более полную математическую модель. Пусть и и ь>/ - объемы воды в водоеме и заливе; Q и v - имеют преж- ний смысл; / и // - интенсивности испарения в водоеме и заливе; q - ин- тенсивность перетекания воды из водоема в залив (рис. 7.2). В этих обо ) значениях непосредственно имеем: dv П Т - = Q-I-q, * (71) «Ц г Кроме того, dM — = vQ-pq, Z (7-2 ам. Л где Л/ и Л// - общие массы растворимого загрязнения в водоеме и заливе, I а // - концентрация загрязнения в водоеме. Считая, что загрязнение в во- доеме не достигает насыщенности, имеем р. = М/ и. Напротив, насыще- ние в заливе имеет место уже давно и в нем образовались гигантские донные отложения солей натрия, магния и других. Vi,pi Рис. 7.2. Схематическое изо- бражение Каспийского моря с заливом Кара-Богаз-Гол
7, Засоление водоема с заливом и загадки Каспийского моря 49 Полученная система дифференциальных уравнений (7.1) и (7.2) опи- сывает водный баланс и баланс растворимого загрязнения. Первые два уравнения водного баланса не зависимы от оставшихся двух, так что их можно рассматривать сами по себе. Однако это рассмотрение затруднено тем, что I и Ii зависят от и и ь>/ соответственно, a q - функция и и ь>/ , причем выписать конкретный вид этих зависимостей весьма затрудни- тельно. Вместе с тем представляется очевидным наличие у них устойчи- вого равновесного режима u* t>/* Для того, чтобы в этом убедиться, надлежит установить наличие решения у системы нелинейных уравнений I(v)+q(v,vi) = Q, т , . , х п <7-3) // (vO-qfv.Uj) = О и обнаружить устойчивость отвечающего ему равновесия (ь>* ь>/ *). Этим займемся позднее, а сейчас, предполагая наличие такого устойчивого равновесия, перейдем к анализу дифференциальных уравнений (7.2) ма- тематической модели водоема с заливом. Последнее уравнение уже хо- рошо известно и не несет ничего нового. Масса примесей в заливе растет со временем, это влечет рост концентрации примесей, который прекра- щается с достижением насыщения и образованием осадка. Первое дифференциальное уравнение, напротив, говорит о коренном изменении ситуации и подмене неограниченного роста количества за- грязняющего вещества равновесной концентрацией //*, находимой из ус- ловия обращения правой части рассматриваемого дифференциального уравнения в нуль pq(v, vj)- vQ = 0. Учитывая, что и —> ь>*, ь>/ -> ь>/ * находим равновесную концентрацию vQ Р* =--------. q( и* иj *) Следует отметить, что процесс установления водного равновесия зна- чительно более быстрый, чем установление равновесной концентрации, и поэтому общий процесс установления можно разбить на два этапа: отно- сительно быстрое установление равновесных объемов и*, и/* и сравни- тельно медленное установление равновесной концентрации /А После установления равновесных объемов и*, vj * процесс установления равно- весной концентрации подчиняется, согласно (7.2), дифференциальному уравнению и *— = vQ-q( и*,и} *)р, dt решение которого легко находится и при нулевом начальном условии запишется в виде: yQ q(u*tu{*) 1-ехр — q( и*,и j*) и* =р* 1-ехр — q(v*v{*)t и * (7.4) Заметим, что, как следует из формулы (7.4), концентрация р составля- ет 1 - е 1 часть равновесной р* спустя время v* ! q*, равное времени, в
50 7. Засоление водоема с заливом и загадки Каспийского моря течение которого в равновесном режиме объем t>* перетекает из Каспий- ского моря в залив Кара-Богаз-Гол. При удвоении этого времени pi уже равно (7 - е2) pi*, так что в качестве оценки времени установления рав- новесной концентрации pi* можно принять время т = и* / q*. Вернемся к равновесной концентрации pi*. Она равна pi*=-------- q( v*,v*) и, казалось бы, требует знания v, Qnq. Однако, пользуясь уравнениями (7.3), определяющими и* и V/*, легко находим, что А я(^*) q* +1* я* (7.5) где звездочки обозначают, что соответствующие величины взяты при равновесных значениях и = и* и vi = vj *. Отношение I* / Ij*, входящее в (7.5), грубо приближенно равно отно- шению площадей водных поверхностей водоема и залива, т. е. S / S/. Эта величина для Каспийского моря и Кара-Богаз-Гола примерно 37, и по- этому равновесная концентрация в заливе примерно только в 40 раз бо- лее средней концентрации солей в потоках пресной воды, поступающей в Каспийское море, благодаря втекающим рекам и дождям. Таким образом, залив Кара-Богаз-Гол играет для Каспийского моря роль отстойника, отсасывающего растворимые загрязнения. Эту же роль в заселяемых стоками воды водоемах могут сыграть искусственные зали- вы. При этом необходимо обеспечить наличие неисчезающего перепада уровня воды от водоема к заливу, так как обратный поток из залива в во- доем все испортит. Поэтому меньшую, чем у Черного моря, соленость Каспийского моря можно объяснить наличием залива Кара-Богаз-Гол. Но на самом деле наше предположение о равновесности объемов и* и t>/* не совсем со- блюдается. Уровень Каспийского моря меняется причудливым образом, то колеблется возле одной величины, то возле другой и различие этих уровней значительно больше колебаний воды возле каждого из них. Эти изменения не удается объяснить ни изменениями погоды, ни тек- тоническими изменениями ложа Каспийского моря. Так что это еще одна загадка Каспийского моря. Относительно небольшие колебания уровня Каспийского моря не на- рушают данного выше объяснения малой его солености и формулу (7.5), но они значительны для эксплуатации Каспийского моря и интересны сами по себе. Для того, чтобы перейти к разгадке этого удивительного явления, рассмотрим, казалось бы, очевидное предположение о наличии устойчивых равновесных объемов t>* и и/* вод моря и залива, единст- венно ли равновесие и нет ли автоколебаний. Вернемся к уравнениям (7.1) водного баланса в Каспийском морей заливе. Фазовым пространством этой системы дифференциальных урав- нений является первый октант плоскости и, l>j, для которого и > 0 и
7. Засоление водоема с заливом и загадки Каспийского моря 51 vi>0. Прежде всего установим, что все фазовые траектории приходят в конечную его часть вида: и + ui = С > 0. Это следует из того, что при достаточно больших и и Vi (большом С) 4<У+ V, )=Q - I(v) - It(v ,)<0. at На рис. 7.3, изображающем поперечное сечение Каспия, залива и со- единяющего их протока, виден наиболее высокий уровень соединяющего их протока Рис. 7.3. Профиль дна водо- ема, залива и соединяющего их узкого пролива Из этого рисунка 7.3 видно, что фазовое пространство, первый октант D > 0, V] > 0, плоскости и, vj, разбивается на части, когда q = 0, q > О, и q < 0 Ясно, что q = 0, когда в Каспии и заливе уровень ниже указан- ного на рис. 7.3. И пусть это имеет место при и < и и uj < up q = 0. Это имеет место еще и тогда, когда уровень Каспия и залива равны, но и > и и V]> Up Множество точек фазовой плоскости, отвечающее q = 0, со- стоит из прямоугольника и <и и uj и некоторой кривой у, изобра- женных на рис. 7.4. Рис. 7.4. Графическая иллюстра- ция к поиску области, в которую приходят все траектории фазо- вого пространства о> О, U]> О На этом же рис. 7.4 изображена прямая и + Uj = С, пересекаемая фа- зовыми траекториями снаружи внутрь, что показано стрелками. Эта пря- мая вместе с осями и = 0 и Uj = 0 ограничивает область, в которую вхо- дят все фазовые траектории, т.е. спустя достаточное время любая фазовая точка (о, Uj) находится в ней. После этих предварительных соображений перейдем к выяснению ус- тановившихся движений системы 7.1. Ясно, что они зависят от величины притока Q, функций I ( и), I ( и; )н функции q ( и, ui). При Q<I(и) все фазовые траектории входят в четырехугольник, в котором q = 0, и далее приближаются к состоянию равновесия о = < и и ui = 0, где и* - корень уравнения Q-I(v)=O, единственный, если Г ( и) > 0. Так как при составлении второго уравне- ния (7.1) мы учли приток q воды только из Каспия, то залив высыхает.
52 7, Засоление водоема с заливом и загадки Каспийского моря Отметим, что именно это произошло после временного перекрытия пло- тиной протока из Каспия в залив. При Q > I ( о) все фазовые траектории входят в треугольник, ограни- чиваемый прямыми о = Оь О/ = 0 и о + О1 = С, и поэтому в нем ест состояния равновесия. В одной части этого треугольника q > 0, в друга q <0. Их разделяет кривая у, на которой q = 0. Выше и на ней q <0« й,<0 Так, что все фазовые траектории , начинающиеся в криволиней ном треугольнике, ограничиваемом прямыми о= о, о+ О/ = С и криво? у, выходят из него и, следовательно, в нем не может быть равновесия Теперь покажем, что это равновесие единственно и устойчиво. Дали мы покажем, что замкнутых фазовых траекторий нет, и поэтому эта единственное равновесие глобально устойчиво. Конечно, это основыва- ется на определенных свойствах функций I ( и), I ( Of) и q ( о, О/). Мы примем, помимо Q>I ( о), что (76) do do, до до. Преобразуем (7.3) к виду: I(o)+Il(ol) = Q, I(v) + q(v,»i) = Q- Дифференцируя первое уравнение (7.7) по о, имеем <// ! d£, dv, do do, do у, do, ~ и поэтому, в силу (7.6), -< 0. do Аналогично из второго уравнения (7.7) следует di dq dq do, — + -----L = o, do do do, do do, n _ и тогда —- > 0, причем, может обращаться в бесконечность. do Первое соотношение (7.7) определяет о/ как убывающую функцию и Второе соотношение (7.7) - как возрастающую функцию, могущую иметь вертикальные отрезки или вообще быть вертикальной прямой. Пе- ресечение этих кривых единственно и определяет единственное равнове- сие L>*, Of*. Таким образом, при естественных предположениях равновесие суще- ствует и пусть имеет место при о = о* и о/ = Of *. Покажем, что оно устойчиво. Для этого пусть £ и q - малые отклоне- ния от равновесия, так что о = о* + , Of = о/ *+ q. Отклонения £и q удовлетворяют дифференциальным уравнениям
7. Засоление водоема с заливом и загадки Каспийского моря 53 =Q _ i(v * +^) _ q(u * , У; * +Г!), at d(u,*+q) . л е 4 . _ . . . ---1—----= ^>*+£u,*+q)-I,(u, *+?]) at или после линеаризации • ( dq dl\ е dq Л=-----i----%-----i-ц, V ди du) ди, dq e f dq di, 7=—^+ —---------- q , du \du, du,) где производные вычисляются при и = и*, U] = U] * Устойчивость или неустойчивость определяется корнями характери- стического уравнения, которое в рассматриваемом случае второй степени вида Л2 + А Л +В = 0. Устойчивость имеет место, если корни этого уравнения лежат слева от мнимой оси. Для этого необходимо и достаточно, чтобы А > О, В >0. Вычисляя коэффициенты А и В непосредственно, в силу отмеченных выше неравенств, находим, что л = Ё1+^_^+^_>0. ди du ди, du, 81 dq 8q 81 8181 D =---------1-------1-------> U. du du, du du, du du, Таким образом, состояние равновесия имеется, и оно устойчивое и единственное. Интуитивно ясно, что это исследование было излишним, а с другой стороны, из него еще нельзя заключить, что кроме устойчивого равнове- сия, нет других установившихся движений, которыми могут быть только устойчивые периодические движения. Но их все же нет, как это следует из широко известного критерия Бендиксона, согласно которому справед- ливость неравенства дР dQ п — + -^>0 ди ди, или обратного, где Р и Q - правые части дифференциальных уравнений (7 1), достаточно для отсутствия предельных циклов в области, где это неравенство выполняется. В рассматриваемом случае, в силу сделанных предположений, ди ди, du ди ди, du, и поэтому состояние равновесия (ь>* U]*) является глобально устойчи- вым и к нему сходятся все движения, т.е. при любых начальных условиях
54 7. Засоление водоема с заливом и загадки Каспийского моря v(t) и* V/ (t)—> Uj* при t —> оо. Итак, при естественных предположениях не только интуитивно ка- жется, но и доказано, что равновесие одно и оно глобально устойчиво Откуда же наблюдаются переходы равновесного уровня Каспия от одно- го уровня к другому? Это действительно загадка Ведь сделанные пред- положения так естественны. Но податься некуда, и надлежит думать, ка- кое же предположение все же неверно. Напомним, что сделанные предположения - это Q > I (и) и неравен- ства (7.6). Конечно, загадка была бы полностью устранена, если бы ус- редненный по нескольким годам водный приток значительно меняла или менялось ложе Каспийского моря и почему-то все время одинаково Но этого не наблюдалось. Что же может быть еще не так? Посмотрим и принятые неравенства (7.6), пожалуй, самое слабое место — > 0 Дейст du вительно, можно придумать, когда это может быть не так. Пусть дне Каспия имеет вид, показанный на рис. 7.5. Рис. 7.5. Гипотетический профиль дна Каспийского моря и различные возмож- ные в нем уровни: 1, 2, 3 и 4 Горб в центре рисунка - это возможные мели. Теперь посмотрим, как ме- няется интенсивность испарения при жаркой погоде при переходе от га него уровня, обозначенного на рис. 7.5 цифрой 1, к верхнему уровню 4 При переходе от 1 к 2 происходит сильное возрастание испарения При переходе от 2 к 3, несмотря на общее увеличение площади моря, ио парение может уменьшаться, так как вода над мелью стала более глубо- кой и значительно холоднее, а следовательно, и менее испаряющей Под дальнейшем переходе от 3 к 4 снова происходит увеличение испарения. Таким образом, наличие мелей может привести к тому, что график I (и примет вид, показанный на рис. 7.6. И теперь равновесий может быть три, как это видно из того же рисун- ка Пренебрегая ради простоты величиной q « Q, рассмотрим, что про- исходит с этими равновесиями при временных изменениях Q, иногда выходящих за рамки 1тахН 1тп, указанных на рис. 7.6. Теперь фазовое пространство - это полупрямая и > 0, а фазовый порт рет определяется уравнением at Точки пересечения графика 1(и) и прямой Q на рис. (7.6) определяю равновесия, а стрелки - величину и знак разности Q - 1(и) , т.е. ^.1
7. Засоление водоема с заливом и загадки Каспийского моря 55 случае рис 7 6 состояний равновесия три: О], О2 и Оз . Причем, Oj и Оз - устойчивые, а О2 - неустойчивое. Рис. 7.6. Фазовый портрет изменения объема вод Каспий- ского моря при значении при- тока Q, когда пересечение про- исходит в трех точках, кото- рым отвечают два устойчивых равновесия Oj и О$ и одно не- устойчивое - О2 Теперь мы можем нарисовать график, как зависят О], О2 и Оз от Q. Координаты состояний равновесия О], О2 и Оз обозначим соответст- венно ui* и2* и из*, и придем к зависимостям щ*, и2* и из* от Q, изображенным на рис. 7.7. Кружочкам на этом графике, называемом бифуркационной диаграм- мой, соответствуют устойчивые равновесия, а крестикам - неустойчи- вые. При Imin < I < 1тах и имеется два устойчивых равновесия ui* и из*. При убывании Q сверх Imin оба они переходят в щ *, причем, равновесие wj* скачком. При последующем возрастании Q ui* меняется так же скачком на из* при возрастании Q сверх 1тах. Рис. 7.7. Бифуркационная диаграмма равновесных уров- ней объемов воды в Каспий- ском море (кружочкки — ус- тойчивые равновесия, крести- ки — неустойчивые) При последующем убывании Q равновесие из* сохраняется, переска- кивая на ui* при уменьшении £> сверх Imin. Сказанное может объяснить имеющие место на Каспийском море из- менения его уровня. Эти изменения происходят скачками с низкого уровня на высокий, когда Q при своем текущем изменении превосхо- дит 1тах- и наоборот, высокий уровень моря снижается скачком на низкий при снижении Q ниже Imin.. Здесь идет речь о скачкообразном изменении устойчивых равновесий с изменением притока Q. Уровень же Каспий- ского моря меняется вовсе не скачком, а достаточно медленно в соответ- ствии со скоростью перехода к новому состоянию равновесия, причем разные уровни из* и щ* имеют место при одинаковом притоке Q, а их смена происходит сравнительно редко, через несколько десятилетий, ко- гда Q > 1тах и, соответственно, Q < Imin.
56 8 ЭКСПОНЕНЦИАЛЬНЫЕ ПРОЦЕССЫ От рассказа об отдельных математических моделях перейдем к описа-< нию достаточно широкого класса динамических процессов, так называе» мых экспоненциальных процессов и некоторых других (логистическим взрывной). Экспоненциальные процессы могут быть двух видов: экспоненциал ного возрастания и экспоненциального убывания. Они оба описываю ( очень простым дифференциальным уравнением dx —=Лх, dt При Л> 0- это экспоненциально возрастающий процесс, при 2 < 0-1 экспоненциально убывающий. Экспоненциальное возрастание или убы- вание может быть как по времени t, так и по какой-либо другой отлич ной от времени физической переменной. Решение дифференциального уравнения (8.1), обращающееся в хо при! t = 0, имеет вид: (8.1) х = хо е* (8.2) и обладает следующим замечательным характеристическим свойством спустя промежуток времени т= А/7 In 2 от любого начального момен- та t ------~=2, x(t) если 2 > 0 и процесс возрастающий, и (8.3) (8.4) x(t) 2’ если 2 < 0 и процесс убывающий. Это говорит о том, что арифметиче- ской прогрессии возрастающих значений t + п т (п = 0, 1, 2, ...) соответ- ствует геометрическая прогрессия со знаменателем 2 или 1/2. На рис.8.1 представлены эти свойства возрастающего и убывающего экспоненци- альных процессов. Основное, что поражает в экспоненциальных процессах, это их фанта- стически быстрое, не вполне осмысливаемое нами, все убыстряющееся возрастание или, наоборот, замедляющееся убывание. Хорошим приме- ром может служить притча о царе и изобретателе шахмат, которого он пожелал вознаградить и сказал: «Проси у меня, что хочешь, хоть полцар- ства, хоть царскую дочь». Но изобретатель шахмат оказался очень скромным человеком. Он сказал: «Не надо мне ничего, дай мне самую малость. На первую клетку шахматной доски положи пшеничное зер-
8. Экспоненциальные процессы 57 нышко, на второю - два, на третью - четыре и т.д.». Царь сказал: «Что за пустяк ты просишь, но пусть будет по-твоему». Когда дошли, до середи- ны доски, то закрома царя уже были пусты. А чтобы заполнить все 64 клетки шахматной доски, требуется зерна много больше, чем на всем земном шаре. Рис.8.1. Графическая иллюстрация экспоненциального возрастания и убы- вания, и времени удвоения и уменьшения вдвое Столь же фантастически ускоряясь, происходит беспрепятственное размножение клеток, микробов и вирусов. Клетки и микробы делятся кавдые час-два, и поэтому через 3-6 суток их число того же порядка, что и число пшеничных зерен на всех клетках шахматной доски. У вирусов время удвоения много меньше часа, так что за время, меньшее суток, возможна катастрофа, если им не мешать размножаться. Так же, все ус- коряясь, истощая ресурс, протекают цепные ядерные и химические реак- ции, лавинообразующие и лавинообразные процессы. В них время уд- воения может измеряться тысячными долями секунды, так что процесс может носить взрывной характер, достигая фантастических размеров за ничтожные доли секунды. Аналогичны примеры распространения эпидемий и слухов. Они тоже носят в своей начальной стадии экспоненциальный характер. Ярким примером плохой нашей ориентировки в скорости роста экспоненциаль- ного процесса является необдуманный ответ на вопрос: «Сколько руко- пожатий жителя маленького городка нашей страны связывает с прези- дентом США?» Обычно отвечают, что достаточно много, в то время как на самом деле - заведомо меньше десяти. Быстро оценить это можно, ес- ли учесть, что каждый человек, как правило, здоровается за свою жизнь не менее, чем со 100 людьми. Поэтому в цепочке из 5 человек, если не учитывать повторных рукопожатий, насчитывается 10 человек, больше чем их на земном шаре. Это, в частности, указывает на стремительность распространения эпидемий с коротким продромальным периодом и еще большую стремительность распространения слухов. Во всех приведенных примерах скорость нарастания некоторой вели- чины тем больше, чем больше сама эта величина. До тех пор, пока не ис- тощается материал, из которого создается эта величина, и не нарушаются условия ее роста, такой процесс носит нарастающий экспоненциальный характер и подчиняется дифференциальному уравнению
58 8. Экспоненциальные процессы dN —=aN, dt где N- число размножившихся клеток или вирусов, число заболевши людей во время эпидемии, число размножающихся нейтронов или моле кул при цепной ядерной или химической реакциях, число людей, до ко| торых дошел слух о сенсационном событии или новости, число жителе страны или всей нашей планеты и т.д. В какой-то мере такая же законе! мерность относится к приобретению знаний, изучению языков, посколи ку уже приобретенные знания облегчают и ускоряют их дальнейшее п» стижение. Это относится как к накоплению знаний отдельным челови ком, так и всем человечеством. Это относится к развитию науки, про™ водства, нарастанию экологического загрязнения и разрушения. Быстрота нарастания экспоненциального процесса приводит к явлени ям внезапного возникновения кризиса и исчезновения, «схлопывания ресурсов. Представьте себе, что вы летом устроились в палатках на беря гу чудесного озера, в котором предполагали купаться и плавать. Пуст это озеро имеет площадь 16384 м2. Большое, хорошее озеро метров 200 длиной и метров 100 шириной. В день вашего приезда в укромном угол- ке озера были зеленые водоросли, занимающие площадь в 1 м2. Вы их в не приметили. Пусть время их удвоения при размножении равно одни| суткам. В течение 13 дней они вам особенно не мешали, хотя в послед ние 3-4 дня вы уже их заметили. Но вот наступил 14 день, и все озер! заросло зелеными водорослями и купаться и поплавать уже негде. Ката- строфа произошла за одну ночь, еще вчера ничто не предвещало беды» половина озера была без водорослей. Это 8192 м2, более чем достаточно Чистая вода озера «схлопнулась» за сутки, а 13 дней до этого все был очень хорошо и не предвещало никаких неприятностей. Экспоненциальный рост знаний, науки, промышленности, богатств' приводит еще к одной связанной с ними особенности. В качестве приме- ра возьмем индивидуальное накопление знаний, знания языков в частно сти. Для каждого человека в период его активной жизни и при наличщ благоприятствующих обстоятельств накопление знаний носит экспонен- циально нарастающий характер, поскольку приобретение новых знаний облегчается имеющимися, т.е. грубо приближенно —=ЛЗ, dt В силу этого, приобретение знаний носит пороговый характер, т.е. кад только они достигают некоторого порога 3*, их дальнейшее накопление приобретает необычайно быстрый характер и человек за свою короткую жизнь может достичь гигантских высот. Но для этого он должен в своих знаниях превзойти некоторый трудно достижимый порог. Это удается немногим. Но кто этого достиг, далее устремляется к вершинам. Эти приводит к тому, что среди всех людей резко выделяется по объему и ка- честву познаний лишь весьма ограниченное число, ничтожные доли про-
8. Экспоненциальные процессы 59 цента, и между ними и остальными имеет место колоссальный разрыв. В этом можно видеть объяснение явления исключительности. Следующий пример - пример внезапного кризиса - возможно, уже из вашего опыта. Вы заразились неделю тому назад. Шесть дней длился ни- чем не обнаруживающий себя, так называемый, продромальный период заболевания. На седьмой день - озноб, высокая температура, плохое или даже тяжелое состояние. Конечно, микробы или вирусы размножаются в вашем организме не беспрепятственно. Им противостоит мощная им- мунная система, но, возможно, еще не мобилизованная и недостаточная, чтобы подавить инфекцию. Для этого организму нужно время. В силу этого, экспоненциальная катастрофа в значительной мере смазана, но все же она проявляется, и чем расслабленней и неподготовленней иммунная система, чем позже ее реакция, тем четче и быстрее растет численность возбудителей болезни, и интоксикация достигает критических значений и после первых слабых признаков заболевания наступает состояние, уг- рожающее жизни. Об экспоненциальном росте населения земли впервые сказал Мальтус в конце XVIII века. У него был предшественник уже в XVII веке - из- вестный математик Фиббоначчи. Он поставил и разрешил вопрос: «Сколько пар кроликов в год от одной пары рождается». Экспоненциальное размножение предполагает отсутствие всяких ог- раничений. На самом деле они всегда есть (например, ограничение ре- сурса), и простейший их учет состоит во введении отрицательного квад- ратичного члена, так что соответствующее дифференциальное уравнение Иг -=Лх-ех2 (8.5) dt имеет решение вида, так называемой, логистической кривой, изображен- ной на рис. 8.2. При этом первоначальное возрастание, близкое к экспо- ненциальному, замедляется и ограничено предельно достижимой вели- чиной Ха, = Л/е (см рис. 8.2). Рис.8.2. График логистиче- ской зависимости (кривой) Многие процессы, экспоненциальные на начальном участке, затем ис- пытывают замедление и близки к логистической кривой. Таковы рост на- родонаселения, рост численности животных, развитие промышленности, науки, образования и многое другое. Возможны и процессы более быстро нарастающие, чем экспоненци- альные. Таково, например, размножение насекомых, где численность по- томства определяется частотой встреч, которая на ограниченном участке пропорциональна квадрату числа его населенности, т.е.
60 8. Экспоненциальные пр цессы dN ---=-aN . dt Решение этого уравнения No - at при начальном условии 2V| =N„ t=0 неограниченно возрастает при приближении t к конечному значении 1 /а No, что соответствует взрывному росту численности, хорошо извест- ному, например, у саранчи. Экспоненциальный характер нарастания, во всяком случае на начат ном участке, характерен для неравновесных уходов от неустойчивых со- стояний равновесия. Так, пусть система описывается дифференциальные уравнением X = f(x) (8.8) их = х* - ее неустойчивое состояние равновесия. На рис. 8.3 показан; горка, вершинная точка которой отвечает неустойчивому равновесию Скатываясь с нее, точка все быстрее и быстрее набирает скорость. Введем новую переменную £ положив и подставим ее в уравнение (8.8), найдем, что / = f( X * +£) = f(x*) + /' <х*Х +...(f(x*) = 0), где многоточия означают члены второго и выше порядков малости отно- сительно £ На начальном участке ухода от неустойчивого равновесия когда £ еще мало, можно приближенно принять, что где Л =/’ (х*) > 0, т.е. возрастание £ во всяком случае на начальном уча- стке, действительно происходит по экспоненте До сих пор описывались экспоненциально возрастающие процессы Перейдем к экспоненциально убывающим. Их тоже очень много, и они весьма разнообразны. Это остывание чашки горячего чая, разряд элек- трически заряженного конденсатора и, в частности, электронной трубки телевизора после его выключения, убывание интенсивности излучения при прохождении его через частично прозрачную среду, убывание массы разгоняющейся ракеты, торможение падения после раскрытия парашюта, гибель популяции, попавшей в неблагоприятные условия, например, рез- кого недостатка пищи, приход к равновесному состоянию и многое, мно- гое другое. Экспоненциальное убывание - это все время замедляющееся убыва- ние, настолько быстрое, что весь процесс замедления всегда ограничен Именно ввиду этой конечности времени быстроногий Ахилл не мог дог- нать черепаху, потому что он пробегал сначала метр, потом полметра.
8. Экспоненциальные процессы 61 затем четверть метра,... и всего не более двух метров. Ахилл не догоняет черепаху, но вместе с тем приближается к ней он очень быстро, в том смысле, что расстояние до нее сокращается сначала в два раза, потом еще в два раза и всего в четыре, потом еще в два раза, и всего в восемь и т.д. Из сказанного следует, что экспоненциальное убывание можно тракто- вать как все убыстряющееся приближение к финальному значению. Рис.8.4. Электрический замкну- тый контур из сопротивления и емкости Рис.8.3. Иллюстрация неустойчивого равновесия в виде материальной точ- ки на вершине выпуклой кривой Перейдем к конкретным примерам. На рис. 8.4 представлена схема конденсатора емкости С, разряжающегося на сопротивление R. В соот- ветствии с законами Кирхгофа, дифференциальное уравнение разряда конденсатора пишется в виде: Rq--— С или dq 1 — =------q dt RC и, следовательно, описывается экспоненциальным убывающим процес- сом с временем уменьшения вдвое, равным г = R С In 2. Это время т пропорционально емкости С и сопротивлению R. При начальном заряде q= qo ______ -t/RC q(t) -qoe . Следующий пример - торможение парашюта. Пусть по достижении скорости падения и0 парашют раскрылся и тормозит падение пропор- ционально его скорости. Согласно закону Ньютона, mv = -mg - hv. Решение этого уравнения следующее: -л wp , mg . — t v = + (v0---—)е т . h ° h Из него следует, что начальная скорость vo (уо > О') экспоненциально замедляется до постоянной скорости спуска, равной mg /h. График этого процесса изображен на рис. 8.5.
62 8. Экспоненциальные процессы Рис.8.5. Временной график па- дения тела при вязком сопро- тивлении До сих пор рассматриваемые нами экспоненциальные процессы носи- ли временной характер, т.е. они менялись экспоненциально с изменением времени. Рассмотрим теперь также экспоненциальные процессы, но не от временной переменной. Сейчас уже мало кто читает Жюля Верна, а когда-то им зачитывались. Он в своих фантастических романах предвидел очень многое, но иногда ошибался. Одной из таких явных ошибок был описанный им полет на Луну из пушки. Полет он предсказал, но из пушки - это ошибка. Жюлю Верну казалось, что чем больше пушка, тем быстрее она выбрасывает ядро. Но это не совсем так; есть предельная скорость выброса и ее пре- взойти нельзя. Пусть используется порох (как у Жюля Верна) или другое взрывчатое вещество, и пусть при взрыве его массы т выделяется энер- гия Ехим на единицу массы. Эта энергия может сообщить массе т (без учета массы ядра) скорость v. В лучшем случае thv2 — = , 2 т.е. скорость выбрасываемого ядра не может быть больше ^тах y^i-'хим ‘ Вот тот абсолютный теоретический предел скорости, который можно достигнуть стрельбой из пушки. Он много меньше требуемой первой космической скорости 8 км/сек. Циолковский был первым, кто понял, что необходим другой путь ис- пользования того же химического вещества, при котором теоретически может быть достигнута любая, сколь угодно большая скорость. Это путь использования ракетного двигателя. Ракетный двигатель развивает тягу за счет выбрасываемой им струи газа. Пусть ракета массы т имеет ско- рость v и из нее выбрасывается в обратном к скорости направлении масса со скоростью с (рис. 8.6). Эта выбрасываемая масса - dm приобретает скорость с за счет химической энергии сгорающего в ракете топлива, так что (8-9) dmc2 — (л t хил1 , где d Ехим - затрата химической энергии, запасенной в ракете, переходя- щая в кинетическую энергию движения газа. То, что ракета при выбра- сывании из себя назад массы - dm получает ускорение движения вперед
8. Экспоненциальные процессы 63 можно обнаружить и вычислить величину этого прироста скорости, ис- ходя из закона сохранения энергии, т.е. приравнивания энергии до и по- сле выброса массы. Рис.8.6. Схема, поясняющая вывод уравнения разгона ракеты при выбрасывании из нее через сопло газа До выброса массы ракета обладала энергией, равной Она складывалась из химической энергии содержащегося в ней топлива и ее кинетической энергии движения. После выброса массы об- щая энергия складывается из уменьшенной химической энергии, изме- ненной кинетической энергии ракеты и кинетической энергии выбро- шенной массы газа - dm и в соответствии с этим равна (т + dm)(y + dv)2 dm(y-c)2 Е + Д Е 4~---------------------------• хим хим у у Приравнивая общие энергии до и после выбрасывания массы, найдем, что (m + dm)(v + dv)2 dm(v-c)2 mv2 Е„„, + uEr„„ Ч-------------------------— Е Ч--------. хим хим хим Откуда, учитывая (8.8) и, естественно, отбрасывая члены, содержащие dm dv, (dv)2 более высокого порядка малости, придем к простому соот- ношению т v dv ч- с v dm = 0. Или dm 1 ----= —т. dv--с Таким образом, масса т ракеты убывает как экспоненциальная функ- ция скорости v m=moe'v/c. (8.10) Так как нас интересует возрастание скорости с убыванием массы, в связи с ее отбрасыванием назад, то естественно последнее соотношение записать в виде формулы Циолковского 7 т0 V = с In— т Из выражения скорости v через отношение начальной массы то к массе т следует, что, выбрасывая все большую и большую часть массы, ракета может достичь все больших и больших скоростей, причем каждо-
64 8 Экспоненциальные процессы му уменьшению массы в два раза отвечает увеличение скорости ракеть на величину с In 2. Эта закономерность в принципе позволяет достиг любых сколь угодно больших скоростей, но для этого, так как конечна; масса ракеты не может быть очень маленькой, необходимо, соответст- венно, значительное увеличение начальной массы то. Так что для полет, на Луну нужна не большая пушка, как думал Жюль Верн, а большая ра- кета. Не большая, а громадная. Из соотношения (8.9) следует, что на- чальная масса т0 - экспоненциально возрастающая функция скорости v v/c tno = me , и удвоение начальной массы при заданной конечной происходит с каж дым возрастанием скорости на величину с In 2. Поэтому, чтобы снизит! начальный вес ракеты, необходимо предельно уменьшить ее конечный вес. Существенного снижения конечного веса ракеты достигают путем ее многоступенчатой конструкции, когда уже в полете ненужные части ра- кеты отбрасываются и остается минимально необходимая ступень раке- ты. Другой пример. Динамика численности популяции N, т.е. величина производной N определяется соотношением скоростей рождаемости Р и гибели Г, так что N = P-P Р и Г являются функциями численности N и внешних условий. При не- изменности внешних условий и естественной простейшей зависимости от N Р = a N, Г = bN, в зависимости от знака величины Л = а - Ь, при- ходим к процессам экспоненциального размножения или гибели. Процессу гибели популяции аналогичен радиоактивный распад, вле- кущий экспоненциальное убывание нераспавшегося вещества. Скорость радиоактивного распада характеризуют временем полураспада. Чем меньше это время, тем быстрее исчезает опасное для человека радиоак- тивнее излучение. Как процесс только гибели можно представить поглощение излучения не вполне прозрачной средой. При этом очень удобно представить себе излучение как поток большого числа N фотонов, а среду - обладающей некоторыми независимыми вероятностями поглощения каждого из фо- тонов потока на единицу пробегаемого им пути. В этой интерпретация при очень большом N dN - = -2N, dt что приводит к экспоненциально убывающему процессу с пробегом, уменьшающим интенсивность излучения вдвое, равным Я 1 In 2. Экспоненциальным характером убывания интенсивности излучения объясняется факт кромешной тьмы в глубинах океана, при достаточной освещенности в его верхних слоях. Действительно, пусть освещенность падает вдвое на каждые 20 метров. Это падение освещенности в ясный светлый день совершенно незаметно. Но уже на глубине километра будет
8. Экспоненциальные процессы 65 тьма, поскольку интенсивность излучения будет в 250 « 1012 раза мень- шей. Эта же модель потока частиц может привести к экспоненциально рас- тущему лавинообразному процессу, если при столкновении быстро дви- жущейся частицы с молекулой газа может образоваться более одной так же быстро движущихся частиц. Такие лавинные процессы наблюдаются при вхождении в атмосферу из космоса частиц, со скоростями, близкими к скорости света и огромными энергиями. Охлаждение не очень сильно нагретого тела - стакана чая или кофе - это также экспоненциально убывающий процесс. Действительно, если температуру окружающей среды принять за отсчетную, то изменение температуры Т нагретого тела подчиняется дифференциальному уравне- нию ^=-лт dt в силу того, что отдача тепла нагретым телом окружающей среде при- ближенно пропорциональна разности температур тела и среды. Наконец, отметим, что все процессы прихода к равновесному состоя- нию, а именно так можно трактовать разряд заряженного конденсатора, торможение движущегося тела, гибель популяции, охлаждение нагретого тела, как правило, имеют экспоненциально убывающий характер. Это обосновывается тем, что линеаризованное в окрестности равновесия уравнение движения в общем случае совпадает с дифференциальным уравнением экспоненциально убывающего процесса. Так, для одномерного процесса ^ = f(x), dt имеющего состояние равновесия х* для величины отклонения £ от х* имеем: dt где в силу устойчивости f (х*) < 0. Для многомерного случая все несколько сложнее и процесс убывания описывается выражением вида: У С, е‘' +£ А е "*' cos(a)t t+<pk), где As и jUk- положительные, т.е. суперпозицией экспоненциально убы- вающих и экспоненциально убывающих осциллирующих составляющих. Ясно, что финальный приход к равновесию будет описываться членом с наименьшим показателем As или /л, и в этом смысле тоже может ха- рактеризоваться как экспоненциально убывающий или осциллирующий экспоненциально убывающий процесс.
66 9 ДИНАМИКА СОСУЩЕСТВОВАНИЯ ПОПУЛЯЦИЙ Выше рассказывалось о беспрепятственном размножении популяции, Оно происходило по экспоненте. Однако в реальных условиях популяция находится в весьма разнообразных взаимоотношениях с другими попу- ляциями и внутри себя. Эти взаимоотношения могут быть типа хищник и жертва (антагонизм), взаимопомощи (симбиоз), взаимной конкурен- ции. В простейшем случае взаимодействующих популяции две, так что именно это взаимодействие является решающим и наиболее важным, а остальные носят второстепенный характер. Первая экологическая модель взаимодействующих популяций - эта модель хищник - жертва, написанная Лотка и Вольтерра. Она учитывает что популяция жертвы может существовать сама по себе, а популяция хищника, только питаясь жертвой. Поэтому в отсутствии хищника жерт- ва размножается экспоненциально согласно уравнению х = ах, а хищник в отсутствии жертвы вымирает, так что у = -су- Хищник съедает тем больше жертвы, чем ее больше и чем более мно- гочисленен он сам, поэтому при наличии хищника х = ах-Ьху. (9.1) Съеденное количество жертвы способствует размножению хищника и поэтому у = —су + dxy. (9.2) Дифференциальные уравнения (9.1) и (9.2) и есть знаменитые и широко известные дифференциальные уравнения Вольтерра-Лотка, уравнения, с которых началось развитие теории взаимодействующих популяций. Состоянием этой динамической системы, описываемой уравнениями (9.1) и (9.2), являются численности х и у жертвы и хищника, фазовым пространством - октант х >0, у >0. При у = 0 х возрастает по экспонен- те, при х = 0 у убывает по экспоненте. Точка х = у = 0 является со- стоянием неустойчивого равновесия типа седла. Это следует из того, что вблизи точки равновесия х = у = 0 членами, содержащими произведение малых величин х и у, можно пренебречь и приближенно х = ах, у = -су . Кроме равновесия х = у = 0, возможно еще равновесие х = х* у =у* где х* и у* - отличное от нуля решение уравнений ax-bxy = 0, -cy + dxy = 0, т.е.
9 Динамика сосуществования популяций 61 x*-c/d, у* = а / Ь. Тип равновесия (х*, у*) можно найти, как обычно, составляя его ха- рактеристическое уравнение a-by*-Л dy* — Ъх* -с + dx* -Л = 0 или А2 + ас ~ 0. Корни характеристического уравнения чисто мнимые ±i-^l ас и отве- чают в линейном приближении состоянию равновесия типа центр, кото- рое при учете отбрасываемых при линеаризации членов может оказаться как устойчивым, так и неустойчивым фокусом. В данном случае более полный анализ обнаруживает, что нелинейные члены сохраняют вид со- стояния равновесия, т. е. оно остается типа центра. Более детальный ана- лиз основывается на возможности интегрирования дифференциальных уравнений Вольтерра-Лотка. Уравнение Вольтерра-Лотка можно запи- сать в виде: dx _ dy ах - bxy - су + dxy Откуда, разделяя переменные х и у, (-c + dx)dx _(a-by)dy X у и после интегрирования - я In у - clnx + dx + by = h, где h - произвольная константа. Последнее уравнение - это уравнение фазовых траекторий. Каждой траектории соответствует свое значение константы интегрирования h. Качественно построить фазовые траекто- рии на плоскости х, у можно, заметив, что каждая из фазовых траекторий получается проектированием на плоскость х, у линии пересечения по- верхности z = dx + by— clnx —alny = f(х,у) (9.3) плоскостью z = h (рис. 9.1). Вид этой поверхности, показанный на рис. 9.1, можно найти из соображений, что на осях х и у f (х, у) = оо и f (х, у) ->°о при возрастании хотя бы одной из переменных х или у Точ- ке минимума этой поверхности z=f{x, у) отвечает состояние равновесия (х* у*). Все остальные фазовые траектории представляют собою овалы, заключенные друг в друге и охватывающие равновесие (х*, у*), так что фазовый портрет оказывается вида, изображенного на рис. 9.2. Несмотря на свою простоту, модель Вольтерра-Лотка качественно пра- вильно отражает колебательный характер численностей х и у в сосущест- вовании хищника и жертвы. Он был обнаружен, например, при много- летних наблюдениях численности зайцев и рысей в Канаде и многих дру- гих случаях.
68 9. Динамика сосущ ствования популяции Рис.9.1. Геометрическое построе- ние фазового портрета модели Волътерра-Лотка Рис.9.2. Фазовый портрет модели Волътерра-Лотка =-с + dx, Согласно фазовому портрету, колебания численности популяции но- сят периодический характер, но могут происходить с разными размаха- ми: от нулевых до бесконечных, но, как заметил Вольтерра, временные средние значения численности х и у остаются неизменными, равными координатам х* и у* состояния равновесия. Это непосредственно следует из усреднения по периоду соотношений х _ у , - = а-Ьу> — =-с+ dx, X у поскольку средние значения их левых частей равны нулю. Согласно этой модели, ни изменения параметров а, Ь, с и d, ни возму- щения, приводящие к изменению начальных условий, до тех пор, пока; не обращается в нуль, не могут нарушить печальную судьбу жертвы был пищей для хищника. Пожалуй, самое благоприятное для нее - находить, ся вблизи равновесного состояния, поскольку при больших размахах по пуляция жертвы, впрочем, как и хищника, проходит периоды очень ма лой численности. Если распространить, что допустимо лишь с большими оговорками эту модель на сосуществование человека (жертва) с микробом или виру сом (хищник), то можно сделать любопытные выводы о том, как следует и как не следует принимать лекарства, уничтожающие хищника. Прежде всего, если это возможно, то хищника нужно добивать полностью: остав ляя даже очень малое его количество, мы никакой цели не достигнем спустя некоторое время он достигнет, возможно, еще большей численно сти. Если же полное истребление хищника невозможно, то уменьшат] его число целесообразно в некоторой мере и только в верхнем над равно весием положении фазовой точки, т.е. вблизи максимальности его чис ленности. Частичное уничтожение при малой численности приведет только к большему последующему обострению заболевания. Таковы выводы, которые можно сделать из очень простой модели со существования хищника и жертвы Вольтерра-Лотка. В дальнейшем эт; модель уточнялась и усложнялась. С чисто математической стороны мо
9. Динамика сосуществования популяции 69 дель Вольтерра-Лотка неудовлетворительна в силу возможности значи- тельных качественных изменений фазового портрета под влиянием сколь угодно малых изменений правых частей ее дифференциальных уравне- ний. Это означает, что неучет даже незначительных факторов может су- щественно его изменить, и поэтому нет никаких оснований считать мо- дель правильной, так как игнорирование второстепенных факторов неиз- бежно. Такое нежелательное поведение модели Вольтерра-Лотка объясняется тем, что его равновесие типа центр, которому отвечают чисто мнимые корни характеристического уравнения, может при самых незначительных добавках 8 (х, у) и £ (х, у) к правым частям уравнений (9.1), (9.2) сменить- ся на устойчивый или неустойчивый фокус, а вокруг него могут появить- ся замкнутые устойчивые периодические движения, что существенно из- меняет фазовый портрет и вытекающее из него поведение сосуществую- щих жертвы и хищника. Модель, лишенная этого недостатка, учитывающая насыщение хищ- ника и конкуренцию жертвы за источники питания и жизни, имеет вид: х = ах—--------Вх2, 1^-Ах (9.4) Она переходит в модель Вольтерра-Лотка при А = 0 и В = 0. Пара- метр А учитывает насыщение хищника, что даже при очень большом чис- ле х жертв он не может съесть жертвы больше, чем некоторое количество ЬА', в то время как при А = 0 он мог съесть неограниченно много при х -> со. Параметр В > 0 учитывает ограниченность ресурсов для размно- жения жертвы. Исследование дифференциальных уравнений (9.4) уже не так просто, как модели Вольтерра-Лотка. Его целесообразно начать с уменьшения числа параметров. Сейчас их шесть. Оказывается, что можно привести к двум. Замена переменных х=с/d и, y=a/bv приводит диффе- ренциальные уравнения (9.4) к виду: uv 2 и=и-------£и , 1 + аи (9-5) и 1 + аи > Как показывает исследование, качественный вид их фазового портрета зависит только от положительных параметров а и 8, параметр у на него не влияет (а = А с / d, £. = с В / a d). Отыскание двумерного (переменные и > 0, v >0) фазового портрета этих уравнений и бифуркационного портрета распадается на ряд этапов. Сначала находятся и исследуются состояния равновесия. Это исследова- ние подсказывает возможность автоколебаний. Далее находятся области
70 9 Динамика сосуществования популяций параметров, отвечающие различным качественным структурам фазового портрета. В результате приходим к бифуркационному портрету рис.9 Он содержит три области 1, 2 и 3. Каждой из них отвечает свой вид фазо- вого портрета, показанный на рис.9.4 с указанием номера области би Рис.9.4. Фазовые портреты уточненной модели «хищник-жертва» для значений параметров из областей 1-3 параметрического портрета При параметрах из области 1 хищник гибнет, остается одна жертва в кс личестве u* = 1 / е, отвечающем устойчивому равновесию фазовог портрета 1 рис. 9.4. В области 2 изолированное существование жертвы становится неу тойчивым и появляется равновесное взаимодействие хищника и жертвы. С переходом в область 3 нарушается равновесное сосуществовали жертвы и хищника и оно приобретает автоколебательные характер. После этого краткого описания перейдем к изложению исследования Состояния равновесия находятся из уравнений: и uv 2 п и--------ей =0, 1 + аи Решений три: l)w=v = 0, 2) и = 7/f, v = 0, 3) и = 1/(1-а), v = 1 - а-е/(1-а)2. Первые два равновесия имеют место при любых положительных аи последнее - только в области 2 и 3, где 1 - а - £> 0. На границе обласк 1 и 2 третье и второе равновесия сливаются. = 0.
9 Динамика сосуществования п пуляции 71 Для исследования устойчивости найденных равновесий составим ха- рактеристическое уравнение: . - v auv „ и 1 + аи Х(Х) = -/V аи ,___\2 (1 + аи ) I в которое последовательно подставляются вместо миг значения коорди- нат равновесий, исследуемых на тип и устойчивость. Для состояний рав- новесия 1, 2 и 3 последовательно находим корни этого характеристиче- ского уравнения: 1) 2/ = 1, Л2=-у; 2) 2/ = -7, Л] = - у (а + £ - 1); 3) Л/, 2 = - tr±i в), где а обращается в нуль на граничной кривой £ = а (1-а) / (1+а) облас- тей 2 и 3 (в области 2 - значение ст отрицательно, а в области 3 - положи- тельно) В соответствии с теорией бифуркаций при переходе из области 2 в 3 должно либо рождаться устойчивое периодическое движение от третьего состояния равновесия, либо неустойчивое периодическое дви- жение должно исчезать, влипая в него. Выяснить, какой из случаев имеет место, можно, подсчитывая знак, так называемой Ляпуновской величи- ны. Эта процедура приводит к тому, что имеет место рождение устойчи- вого периодического движения - автоколебания - и в соответствии с этим имеет место фазовый портрет 3 рис. 9.4. Справедливости ради укажем, что при строгом подходе нужно еще выяснить, не могут ли возникнуть сложные предельные циклы. Легче всего в этом убедиться с помощью компьютера, с дисплея которого и были срисованы все приведенные картинки фазовых портретов. Мы рассмотрели математические модели взаимодействующих попу- ляций типа хищник-жертва. Аналогичные модели могут быть построены для двух конкурирующих популяций и помогающих друг другу. Диффе- ренциальные уравнения двух конкурирующих популяций при учете еще и внутренней конкуренции в каждой из них можно записать в виде: 2 . 2 X] —Cl]Xj a JjX/ aj2X]X2, Х2 —а2Х2 ^22Х2 &21Х2Х1 т а, а2 или, после замены переменных t = —, х, = —их, х2 =----и2, в эквива- а\] а22 лентном виде: = Wj(l-их -£хи2), (9.7) w2 =уи2(1-и2 -f2W]). Как и в предыдущей модели, приведенной к такому виду, зависимость от / несущественная, не отражающаяся на качественном виде фазового портрета. По существенным параметрам £/ и £2 бифуркационная диа- грамма содержит четыре области 1, 2, 3 и 4 (рис. 9.5), каждой из которых отвечает свой вид фазового портрета, показанный на рис. 9.6 под тем же номером, что и соответствующая область бифуркационного портрета.
72 9. Динамика сосуществования популяций Общий смысл их состоит в том, что в конкурентной борьбе выживает та популяция, которая в параметрах £i и £2 оказывает на другую большее конкурентное давление. Эта ситуация имеет место в областях 1 и 2, где одни из параметров £*/ и £2 больше единицы, а другой меньше. В облас- ти 3 имеет место равновесное сосуществование В области 4 выживает одна из популяций в зависимости от начальных условий. Рис.9.6. Фазовые портреты, соответствующие параметрическому порт- рету (рис 9 5) модели конкурирующих видов Для осмысливания этих выводов нелишне знание связи исходных па- раметров модели alt а2, ап, aI2, a2i, ai2 с редуцированными £1 и £2: а2а12 а1а21 =------> £2 =----- а1 а22 а2 а11 Следующие две модели соответствуют взаимопомощи популяций, из вестной в биологии как явление симбиоза. Первая модель относится i случаю, когда взаимопомощь - необходимое условие существования каждая из популяций сама по себе гибнет В ней учитываются еще внут
9 Динамика сосуществования популяций 73 ренние конкуренции в каждой из популяций. В исходных параметрах эта модель имеет вид: Ьхх 2 хх = -аххх 4----------Cjjq , 1 + Ах х2 ЬххХ2 2 Х2 — ^2Х2 + . А С2Х2 1 + Л2Х1 (9-8) Как и ранее, все параметры неотрицательные. Здесь возможно только два вида фазового портрета: один, когда при любых начальных условиях численности обоих популяций xj и хг стремятся к нулю и популяции вы- мирают, и второй, отвечающий рис. 9.7. В заштрихованной части фазово- го пространства все фазовые траектории стремятся к началу координат, что означает гибель обоих популяций. При больших значениях числен- ности xi и Х2 популяций, отвечающих незаштрихованной области, ус- танавливается равновесное взаимовыгодное сосуществование. Это рав- новесное состояние отмечено на фазовом портрете буквой О. Рис.9.7. Фазовый портрет модели (9.8) симбиоза двух видов Значительное разнообразие динамики симбиоза двух популяций на- блюдается в модели, где отдельное существование каждой из популяций возможно, но требует, чтобы ее численность превзошла некоторый по- рог: малочисленная популяция вымирает. Такая особенность биологиче- ского поведения изолированной популяции может быть отображена мо- делью вида: х - -ах(х - Lx)(x - L2) (0<£j<£2), (9.9) как это видно из рис. 9.8, на котором изображен график правой части этого уравнения и соответствующий ему фазовый портрет. В соответствии с этим математическая модель симбиоза двух популя- ций записывается в виде: хх = аххх(х, -Lx)(L2 -xx) + bxxxx2, (9.Ю) х2 =д2х2(х2 — КХ)(К2 — х2) + b2xxx2. Один из возможных здесь фазовых портретов, который, как и другие, можно наблюдать на дисплее персональной ЭВМ, изображен на рис. 9.9.
74 9. Динамика сосуществования популяций В соответствии с поведением фазовых траекторий на рис.9.9 в описывае мом симбиозе может произойти вымирание обоих популяций, любая к популяций может выжить, а другая погибнуть, и, наконец, они могут со- существовать при больших численностях, чем каждая отдельно. Рис.9.8. Фазовый одномерный портрет существования од- ного вида модели (9.9) Другой возможный случай изображен на рис. 9.10. В нем, как и в пре- дыдущей модели симбиоза (9.8), возможно только совместное существо- вание обоих популяций или их обоюдная гибель. Рис.9.9. Рис.9.10. Фазовые портреты симбиоза двух видов для модели (9.10) Мы рассмотрели несколько разных математических моделей cocyi ствования двух популяций. Соображения, положенные в их основу, е< ственны и просты, но выводы неожиданны и поучительны. Можно ли было ожидать, что сосуществование хищника и жертвы дет к автоколебаниям? Можно ли было думать, что конкуренция же способствует ее избавлению от хищника, что при сосуществовании к курирующих популяций та же внутренняя конкуренция, которая еще лее затрудняет жизнь, способствует выживанию? Менее неожидан, также интересен вывод о том, что при симбиозе популяции выжив; только при достаточно больших численностях.
75 10 ПРОТОЧНЫЙ БИОЛОГИЧЕСКИЙ РЕАКТОР Проточный биологический реактор - хемостат - представляет собою емкость с питательной средой, в которой размножаются микробы. Его особенность состоит в том, что среда, в которой происходит непрерыв- ное размножение, все время пополняется свежим интенсивным питаю- щим раствором и одновременно с той же скоростью отбирается жидкость с микроорганизмами и субстратом. Среда хемостата интенсивно разме- шивается, так что во всем его объеме концентрации интенсивного суб- страта и микробов одинаковы. Пополнение и отбор происходят с одина- ковыми объемными скоростями. В хемостате поддерживается постоян- ная температура. Наша задача состоит в том, чтобы, построив математическую модель динамики хемостата, изучить ее и оптимизировать его работу по управ- ляемым параметрам. Размножение микробов в питательной среде хемо- стата подобно размножению хищника с учетом его насыщения. В соот- ветствии с этим скорость размножения примем пропорциональной массе микробов х с коэффициентом пропорциональности вида А = jimS т____ K + S’ (10.1) где S - концентрация субстрата в хемостате, а /лт и К - параметры. Пусть поступающий в хемостат питательный субстрат концентрации So и скорость объемного поступления его в хемостат равна D. Ясно, что убыль интенсивного вещества пропорциональна скорости размножения микробов. Поступление интенсивного раствора и отбор содержимого хе- мостата происходят с постоянной объемной скоростью D. Согласно сказанному, используя (10.1), найдем, что fiimS K + S D х----х, V VS = D(S0-S)~^^-x, K + S где V - объем жидкости в хемостате. Введем новые параметры: вместо D/V D и вместо I/ V Z, запишем эти уравнения в виде: • х =—-—х- Dx, K + S S = D(SQ-S)-1-^- (Ю.2) и приступим к их изучению. Фазовым пространством хемостата, точнее, его математической моде- ли (10.2), является первый октант х > О, S > 0 плоскости х, S. Помимо
76 10. Проточный биологический реактор тривиального равновесия х = О, S = So, имеется еще одно равновесие, определяемое из уравнений: -1^--D=O, D(S0-S)-^^- х=0. K + S ° K + S Непосредственно находим, что его координаты х* и S'* равны = ^^flm-D)Sc-KD]r'(^m-D)-'. (103) -D • т Этим значением S* и х* будет отвечать равновесие, если они не отри- цательные, т.е. при выполнении неравенства < <ц K + S Л (Ю.4) т.е., если точка (So, D) лежит в области, изображенной на рис. 10.1. Рис. 10.1. Область существования равновесия (х*, S*) хемостата по параметрам Sq и D Устойчивость равновесий определяется корнями характеристического уравнения: - D - 2 Л(Л) = Z + S)2 , _ М„К1 -lu, -D-----—------ 1 w Z 1Z’ С1 \2 = 0, (Ю.5) где использовано обозначение (10.1), а£их - значения координат рас- сматриваемого равновесия. Для равновесия х = 0, S = So корни действи- тельные разных знаков, и для равновесия х = х* S = S*, определяемого (10.3), коэффициенты квадратного уравнения относительно 2 (10.5) по- ложительны и, следовательно, оно устойчиво. Соответствующий фазо- вый портрет представлен на рис. 10.2. Он очень прост: любая фазовая точка (х, S) (х > 0) асимптотически приближается к равновесию с коор- динатами S* х*. Рис.10.2. Фазовый портрет хемостата при значениях параметров So и рт. из об- ласти существования равновесия, показан- ной на рис. 10 1
10. Проточный биологический реактор 77 Параметрами хемостата, согласно (10.2), являются рт, К, D, So, I, при- чем величины параметров D и So можно менять, они управляемые. Ме- нять их следует так, чтобы не нарушить устойчивую работу хемостата, т.е. соблюдая условия (10.4), и, естественно, желательно так, чтобы мак- симизировать Dx*. Из (10.3) следует, что .. . . , , DS„ KD2 Dx*=D[(ji -D)Sc-KD]l~'(/i —D)~' =-~---------------- • (Ю.6) I w т и ) При выбранном So максимум по D достигается при некотором D(Sq)< [1т, причем D (So) - возрастающая функция So . Т.е. So жела- тельно выбирать побольше и при выбранном So существует оптималь- ная скорость отбора D. На рис. 10.3 изображен поясняющий этот факт график зависимости скорости производства микроорганизмов Dx* от скорости отбора D. Точка пересечения этого графика с осью абсцисс имеет координату pmSo(K + So)'1 и поэтому после этой точки график теряет физический смысл, поскольку нарушается неравенство (10.4), обеспечивающее функционирование хемостата. Рис. 10.3. График производительности хемостата от скорости отбора D. Четко видно наличие максимума
78 11 МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИММУННОГО ОТВЕТА ОРГАНИЗМА НА ВТОРЖЕНИЕ ИНФЕКЦИИ Иммунные системы животного и человека очень сложны. Сложно и многообразно их устройство, сложны и многовариантны их реакции на инфекцию, сложны и многолики средства противодействия. Сегодня описание иммунной системы занимает пару томов, и при этом ещё мно- гое остаётся незатронутым и неизвестным. Вместе с тем иммунная сис- тема, сколь бы сложна она ни была, предназначена оказывать противо- действие и уничтожать вторгшуюся в организм чужеродную и вредную для него инфекцию, и в общих понятиях это противодействие инфекции и её вредное влияние на организм могут быть описаны, опуская детали того, как это фактически происходит. Есть инфекция, которая стремится размножиться и воздействует на организм, подавляя его жизнеспособность. Есть организм, который пы- тается её истребить, организуя, кроме изначального противодействия, ещё и дополнительное, как только её обнаружит. Быстрота и эффектив- ность ответа организма зависят от наследственных факторов и от приоб- ретённого “жизненного опыта”, а также от состояния организма в дан- ный момент и резервов, которыми он располагает. Таким образом, несмотря на всю сложность иммунного ответа орга- низма на инфекцию, на первый план выступают три фактора: инфекция, её размножение и влияние на организм, противодействие организма и возможности его реализации, зависящие от его состояния. Эти факторы можно количественно охарактеризовать тремя величинами: х, у и z - численностью инфекции, величиной противодействия организма и по- тенциалом организма. Инфекция, помимо своей численности х, характе- ризуется быстротой размножения в среде организма и подавляющим дей- ствием на организм. Противодействие характеризуется своим количест- вом у и его эффективностью, быстротой и мощностью пополнения w, за- висящими от организма и его потенциала z. Всё сказанное позволяет описать динамику иммунного ответа - изме- нение величин х, у, w и z - следующими четырьмя дифференциальными уравнениями:
11 Математическая модель иммунного ответа организма на вторжение инфекции 79 х_Лх ахУ 1+ах 7W + W = < 1 + ах О + w = К при у > О ИЛИ у = О И К > О при О (111) при X < х0 Bz(2zq - z)(x + р х2) при х > х0; Z = ' —5-----dy-e — F при z > О или z = О и F > О 1 + ух О при z = О и F < О. В этих уравнениях (11.1) хо - порог чувствительности организма к инфекции, г - временная задержка дополнительного иммунного ответа, величина которого зависит от объёма инфекции х и потенциала орга- низма z. При Р —0 зависимость от х линейная, при Р > 0 она форсиро- вана, а прир <0, напротив, уменьшена. Последнее уравнение системы (11.1) описывает изменение потенциала z, при этом 0 <z <zq. Первый член последнего уравнения (11.1) - это скорость пополнения потенциала z до его предельного значения zq, второй и третий - его расход на иммунный ответ организма у и на потребности самого организма. Обращение z в нуль трак- туется как полное истощение организма, ведущее к его гибели. У четырёх уравнений (11.1) 13 параметров. Параметр Л может иметь любой знак: Л < 0 означает, что инфекция, попав в среду организма, гиб- нет, при Я > 0 она всё же размножается, но ей мешает в этом противо- действие организма у, которого может и не быть. В дальнейшем А > 0. Все остальные параметры, кроме Р , положительны. Процесс нарастания и динамики противодействия у инфекции х описывается последними тремя уравнениями. Хотя сказанного достаточно для понимания предлагаемой модели (11.1), все же дадим более подробное описание каждого из ее уравнений. В первом уравнении член Ах соответствует размножению инфекции, вто- рой ее уничтожению фактором у противодействия организма. Этот по- следний член, естественно, равен нулю при х = 0, максимален при х = со и линейно зависит от у. Последний член отражает возможность конкуренции за условия размножения. Второе уравнение описывает из- менение противодействия инфекции у. Первый член во втором уравне- нии при у > 0 соответствует тому, что на каждую единицу уничтожен- ной инфекции х происходит определенное уменьшение у. Второй член w в этом же уравнении - это скорость пополнения организмом противодей- ствия у. Третье уравнение указывает, что иммунный ответ на инфекцию имеет место только при х > xq, происходит с временной задержкой и оп-
gQ II. Математическая модель иммунного ответа организма на вторжение инфекции ределяется величиной, зависящей от потенциала организма z, причем, пропорционально х или с некоторой форсировкой при р > 0 или, наобо- рот, уменьшением с ростом х при р <0. Последнее уравнение описывает из менение потенциала z организма. В этом уравнении 0 <z< zq. Первый член правой части увеличивает z при z < zq. Скорость этого роста потенциала убы- вает с увеличением вредного влияния инфекции х. Второй и третий члены - затраты на поддержание противодействия у и всего организма. Модель (11.1) для исследования достаточно сложна, но её можно зна- чительно упростить, ограничившись переменными х и у. Это тем более возможно, что роль остальных уравнений довольно очевидна и может быть мысленно учтена и понята. Упрощённая модель имеет вид: А х аху 1 4- ах £ х 2 Ьху 1 + а х — + В(х + /3х2) = К 1 + ах О при X <х, при х > х0 и у > О или у = 0 и К > О, при х>хоиу = 0иЛГ<0, (Н.2) Отличие этих уравнений (11.2) от (11.1) в том, что величина В теперь постоянна, в то время как в уравнениях (11.1) она меняется согласно двум последним уравнениям. Формально перейти от системы (11.1) к (11.2) можно, положив г = 0 и приняв z постоянным. Величина т> О определяет быстроту возрастания w от нуля до предельного значения В z(2z0-z)(x +Рх2), а В в уравнениях (11.2) равно Bz(2z0-z) при принимаемом постоянном z. Так что роль последних двух уравнений в (11.1) может быть учтена, как изменяемость В в уравнениях (11.2). Число параметров в упрощённых уравнениях (11.2) может быть уменьшено путём изменения масштабов по времени t и переменным х и у, после чего они принимают вид: 2 -----£Х Ьху прих<х0, 1 + х -—¥- + В(х + рх2) = К прих>хоиу>О 1 + х или у = 0 и К > О, О при х > х0 и К <0. (11-3)
Л Математическая модель иммунного ответа организма на вторжение инфекции § 1 Поймём, что следует из упрощённой модели (11.3), сначала приняв £=0. При этом остаётся три параметра: xq, b и В. Как оказывается, возможно два существенно разных случая: b > В и b < В. Второй случай, Ь<В, распадается ещё на два: b < 1 и b > 1. Так что имеют место четыре разных вида фазовых портретов, представленных на рис. 11.1 -11 .За, б. Фазовые портреты упрощенной модели (11.3) при /3 = £ = 0, соответственно при Ь>В,Ь<В и Ь<1, и Ь<В и Ь>1. А - область начальных условий, для которых име- ет место выздоровление. Вне области А инфекция сохраняется на уровне чувстви- тельности хо и имеет место бациллоносительство Как видно из рис. 11.1, 11.2, 11.3а, 11.36, в случае Ь> В организм из- бегает гибели только при начальных условиях в области А, т.е. при дос- таточно высоком начальном уровне у. При недостаточном начальном противодействии у организм гибнет (происходит неограниченное воз- растание х, влекущее, согласно последнему уравнению (11.1), к зануле- нию потенциала z). Это происходит даже при самой незначительной на- чальной инфицируемости. Напротив, при b < В организм никогда не гибнет. Однако исход встречи с инфекцией может кончиться либо пол-
11. Математическая модель иммунного ответа организма на вторжение инфекции ным её уничтожением (область А и приход к одному из равновесий, х =’ О, у > у*), либо сохранением инфекции на пороге чувствительности (вей положительный октант, кроме области А), благодаря приходу к устойчи- вому равновесию О. Полное выздоровление при начальных условиях области А сопровождается одним либо, возможно, несколькими обостре- ниями (рис. 11.2). То, насколько ярко выражены эти обострения, завися! от массированности инфекции х и начального значения величины им- мунного противодействия у. Носительство инфекции и равновесное со- жительство с ней происходит путём колебательного прихода к устойчи- вому равновесию О (рис. 11 3). По этим рис.11.1-11.3 можно проследить, каковы последствия умень- шения количества инфекции х, например, с помощью антибиотиков или других лекарств, в предположении, что это не оказывает существенного влияния на иммунный ответ, т.е. на величины b и В в уравнениях (11.3) и значение у. В случае Ь> В ку> у* достаточное уменьшение инфекции! ведет к более быстрому выздоровлению или даже спасению организма от гибели. При у <у выздоровление требует полного уничтожения инфек ции (х = 0). Это выздоровление носит неустойчивый характер: малейшее повторное внесение инфекции или остаточная инфекция влекут после временного улучшения повторное заболевание, оканчивающееся гибелью организма. В случае b < В роль такого лекарственного воздействия скромнее и не всегда положительна, так как может привести к сожительству с инфекци ей, хотя и облегчает течение заболевания. Вместе с тем необходимо учи- тывать, что значительное и длительное обострение, через которое может произойти, согласно рис. 11.2,11.3, выздоровление, может реально не со- стояться в силу не учитываемого нами уменьшения потенциала z, влеку щего уменьшение величины В в уравнениях (11.3). И ещё необходимо отметить, что на самом деле, согласно полной модели (11.1), вначале, в момент заражения, В = 0, и лишь затем достигает своего, рассматривав мого нами значения, причём рост В в течение времени порядка г проис- ходит только после того, как х превзойдёт xq. Приведённые рисунки фазовых портретов, как правило, указывают на желательность привнесённого извне увеличения у, стимуляции иммун ной системы. Это вообще убыстряет выздоровление и позволяет избе- жать перехода в хроническую инфицированность. Это будет видно и из дальнейшего, когда выявится роль Д Но, пожалуй, самый существенный вывод, кроме крайней желательности обеспечения b < В, это то, что це- лесообразно поддерживать изначальное значение у больше, чем у* (см рис.111-11.3). Действительно, если в начальный момент, до заражения, иммунная система находится в равновесии, х = 0, у > 0, то при у <у* в силу неус- тойчивости равновесия, даже незначительное увеличение х приводит к заболеванию, в то время как при у > у* происходит уничтожение инфек-
11. Математическая модель иммунного ответа организма на вторжение инфекции 83 ции и наступление нового близкого равновесного состояния. Уменьше- ние у может произойти в силу отсутствия асимптотической устойчиво- сти состояний равновесий х = О, у > у*. Напротив, при сожительстве с инфекцией состояние равновесия организма О асимптотически устойчи- во, и в этом смысле оно оберегает организм от вторичного заражения. Конечно, это только при стабильности параметров Ъ и В, при их измене- нии эта инфекция, наоборот, может быть причиной повторного заболе- вания. Теперь посмотрим, что нового вносят параметры и я, не учиты- ваемые ранее (е = р = 0). Ограничимся иллюстрацией ряда фазовых портретов, срисованных с дисплея ЭВМ. Фазовые портреты, рис.11.4, 11.5 и 11.6, демонстрируют роль форсированного иммун- ного ответа р > 0 на весьма неблагоприятном случае b > В. При этом всё кончается хроническим заболеванием, бациллоносительством, или выздоровлением. Конечно, длительное хроническое заболевание может навлечь существенное уменьшение потенциала z и следующее за ним уменьшение величины В, что может привести к фатальным последствиям. Рис. 11.4. Вид фазового портрета упрощенной модели (11.3) при xq-1, b=l,l, В=1,0, £=0 и Р=0,2. Состояние равновесия О/ устойчиво и соответ- ствует хроническому заболеванию. В области А - выздоровление Рис.11.5. Вид фазового портрета упрощенной модели (11.3) при хо=1, Ь=0,8, В=0,5, £=0 и Р=0,2. Состоя- ние равновесия Oi неустойчиво и при любых начальных условиях - выздоровление На рис. 11.7 представлен другой вариант форсировки иммунного отве- та (р > ф, при котором возможно течение болезни с периодически по- вторяющимися рецидивами (автоколебание Г.) Что может произойти при ослаблении иммунного ответа (Р < 0), де- монстрируют рис. 11.8 и 11.9: несмотря на то, что В > Ь, возможен ле- тальный исход. К ослаблению иммунного ответа может привести не
11. Математическая модель иммунного ответа организма на вторжение инфекции только р < 0, но и уменьшение потенциала z согласно последнему, на учитываемому упрощённой системой (11.3), уравнению системы (11.1). х0 Рис.11.6. Вид фазового портрета уп- рощенной модели (11.3) при Хо=1, Ь=1, В=0,9, £=0,01 и р=0,05. В облас- ти А — выздоровление, вне А - бацил- лоносительство Рис. 11.7. Вид фазового портрета упрощенной модели (11.3) при Хо=1, Ь=0,9, В=0,9, £=0,01 и р=0,05. В об- ласти А — выздоровление, вне А - периодическое течение болезни (автоколебание I) Рис.11.8. Вид фазового портрета уп- рощенной модели (11.3) при х0=1, Ь=0,5, В=2, £=0 и р=-0,1. В области А - выздоровление, вне А - гибель Рис. 11.9. Вид фазового портрета упрощенной модели (11.3) при х0=1, Ь=0,8, В=1, £=0 и Р=-0,2. В области А — выздоровление, вне А — гибель
85 МАТЕМАТИЧЕСКАЯ МОДЕЛЬ СООБЩЕСТВА «ПРОИЗВОДИТЕЛИ-ПРОДУКТ-УПРАВЛЕНЦЫ» Человеческое общество необычайно сложно, каждый человек - целый мир с многообразным непредсказуемым поведением, а людей - тысячи и миллионы, и они находятся в сложнейших взаимоотношениях друг с другом. Кроме того, есть государство, системы управления и распреде- ления, финансы, промышленность, бытовые учреждения, транспорт, связь, учебные заведения, медицинские учреждения, и т.д. Кажется, что это все невозможно описать математически, да это так и есть. Но можно попытаться описать только некоторые стороны этого неописуемого сложного человеческого сообщества, опираясь на какие-то присущие ему особенности. Например, для того, чтобы жить, необходимо добывать пищу, чтобы ее эффективнее добывать, нужна организованность, да и не хлебом единым жив человек: ему нужно жилище, семья, орудия произ- водства, зрелища и удовольствия. При реализации своих естественных потребностей он вступает в конфликт с другими членами сообщества, имеющими свои потребности, и вместе с тем члены сообщества объеди- няются, чтобы эффективнее добывать то, что они хотят потреблять. Вы- делим во всем этом три основных компонента: производители, продукт, управленцы. Производители - это те, которые непосредственно произво- дят продукт, управленцы не производят продукт, но способствуют его производству; продукт - это все то, что нужно для жизни человека, что он потребляет и чем он пользуется. Придадим производителям, управленцам и продукту количественную определенность в виде величин х, у и z, означающих численности произ- водителей, управленцев и наличное количество используемого сообще- ством продукта. Производители и управленцы находятся в конкурентных взаимоотношениях как между собой, так и друг с другом, и вместе с тем, производители совместно производят продукт, а управленцы могут спо- собствовать этому производству, они оказывают влияние на жизнь и производство продуктов; сообществом, но непосредственными их кор- мильцами, как и себя самих, являются производители. Итак, есть конку- рентные взаимоотношения, есть естественное размножение и есть совме- стное производство продукта, эффективность которого определяется уровнем технологии сообщества. Парис. 12.1 указаны связи и взаимодействия между производителями х, управленцами у и продуктом z. Каждая стрелка этой схемы отвечает воздействию переменной, от которой она идет, на изменение той, к кото- рой она ведет. Так, стрелка от переменной х к переменной z означает, что скорость изменения количества продукта z зависит от переменной х - числа производителей. Таких стрелок две: одна отвечает тому, что х
35 12. Математическая модель сообщества «производители-продукт-управленцы» производит продукт z, а такая же другая - что он его потребляет. Стрелка от z к х означает, что скорость изменения х зависит от наличного продук- та z. Все стрелки, идущие от х, у и z к z, указывают, что скорость измене- ния накопленного продукта z зависит от х, у и z. Эта схема не раскрывает конкретного характера зависимостей и вза- имных связей, она лишь указывает на их наличие и то, что мы хотим в нашей модели их учесть. Ясно, что сколько-нибудь точный учет их очень труден, да и при агрегированное™ переменных х, у и z невозможен. Ог- раничимся грубо приближенным, качественным их учетом, описывае- мым следующей системой трех дифференциальных уравнений: x = (a-bx-ly + cz')x, (12. 1+е,у Z - < F - g " Ц/~-------hx-ky при z > О 1 + £2у l + dz О при z = 0 и F <0 или z - 0 и F > О, которая является предлагаемой математической моделью соо( «производители - продукт - управленцы». В этой модели очень не учтено. Посмотрим, к какой динамике модели это приводит. ( еще раз, более детально, общие соображения, лежащие в ее основе. При- нимается, что скорость изменения х в целом пропорциональна х с коэф- фициентом пропорциональности a-bx-ly + сz, убывающим с ростом х и у и возрастающим с ростом z Это призвано отразить внутреннюк конкуренцию среди производителей х, давление на них управленцев у г способствование производителям накопленного продукта z. Без учел этих влияний х, у и z на изменение х первое уравнение системы (12. Г приняло бы вид х = ах, отвечающий беспрепятственному размножению производителей. Соображения, положенные в основу второго уравнения системь (12.1), такие же, но принято, что давление производителей на управлен цев отсутствует или им можно пренебречь. Возможно, это не всегда так t не представляет труда это учесть. Если производители еще как-то, воз можно, могут существовать сами по себе при z = 0, то в отношены управленцев это исключено и поэтому знак перед коэффициентом d от
12. Математическая модель сообщества «производители-продукт-управленцы» gj рицательный, в соответствии с чем «изолированные» управленцы подчи- няются дифференциальному управлению y = -dy, отвечающему их гибели. Третье уравнение отражает процесс накопления продукта в результате его производства и потребления. Потребляют продукт производители и управленцы. Он амортизируется и разрушается сам по себе и произво- дится совместными усилиями производителей и управленцев. Характер участия производителей и управленцев в производстве продукта разный: производители непосредственно его производят, а управленцы способст- вуют (или тормозят) его производству. В соответствии с этим, правая часть дифференциального уравнения для z содержит три слагаемых: пер- вое отражает скорость производства продукта с учетом увеличивающей- ся трудности его производства, с ростом его объема и учетом его «старе- ния» (амортизации), второе и третье - его потребление производителями и, соответственно, управленцами. Потребления продукта производите- лями и управленцами принимаются пропорциональными с разными ко- эффициентами их численности х и у. С производством продукта сложнее. Принято, что скорость его производства пропорциональна численности производителей х с коэффициентом пропорциональности, в который входят сомножителями уровень технологии сообщества g, величина (1 + Si у)(1 + £2у) 1, описывающая влияние на производство управленцев у, и множитель (1 + 8z) 1, убывающий с ростом z, призванный учесть амортизацию накопленного продукта и увеличение трудности его накоп- ления с возрастанием его объема. При £{/ £2 > 1 управленцы способст- вуют в пределах от 1 до £/ / £> производству, напротив, при Е]/ Е2 < 1 они его тормозят в тех же пределах. В принятой модели понятия продукта, производителей и управленцев агрегированные, не учитывающие их, возможно, очень сложной и много- образной дифференциации. Для первобытного общества продукт - это прежде всего продукты питания и, возможно, жилище; для более разви- того общества - еще и орудия охоты, скотоводства и земледелия, вклю- чая сам скот и землю; для современного общества - это вся совокупность материальных и интеллектуальных богатств общества. Трактовка пере- менных х и у усредненная, обобщенная, ассоциированная с производст- венной и общественной активностью, отражаемой в производственных и конкурентных взаимоотношениях. Такие обобщенные, усредненные и расплывчатые трактовки перемен- ных х, у и z, естественно, вызывают чувство неудовлетворенности. Мно- гое еще хочется учесть, уточнить, дифференцировать, но вместе с уточ- нениями модель неизбежно потеряет не только свою простоту, но и общ- ность. Поэтому не будем излишне требовательны. Ведь все же что-то, и, возможно, самое главное, она учитывает. Посмотрим, что из нее следует, и тогда составим свое мнение.
88 12. Математическая модель сообщества «производители-продукт- управленцы» Модель определяется большим числом параметров, эти параметры во- все не постоянные и не всегда меняются достаточно медленно, иногда даже очень быстро. Они сложно зависят от текущего и прошлого состоя-; ния сообщества. Это в реальности, а в модели они принимаются посто-1 янными. Анализируя модель, можно выяснить, что происходит при та или иных фиксированных значениях параметров и как поведение модели меняется с их изменением. То, как текущие значения х, у и z влияют на изменение параметроЕ модели, зависит от того, понимают ли ее современники закономерное™ динамики сообщества, в котором живут, и каковы их фактические пред-' ставления о ней, какова управленческая структура общества, каковы нра- вы и воспитание его членов, каковы верования, мораль и этика? Ясно, что на характер зависимости параметров могут существенно повлиять в сведения о сообществе, полученные в результате изучения ее математи- ческой модели. Все это учесть очень трудно, поэтому ограничимся изу- чением модели при различных постоянных значениях ее параметров, а остальное предоставим нашему интеллекту. Изучение модели, несмотря на ее простоту, непростая задача: она трехмерная и в ней много параметров. Качественное изучение ее дина- мики сводится к построению фазовых и бифуркационных портретов. Фа- зовый портрет трехмерен и может быть нарисован. С бифуркационным портретом дело сложней и можно лишь получить некоторые общие о нем представления. Даже после обычного сокращения числа параметров их остается не меньше девяти, так что удобнее сохранить тринадцать ис- ходных. Выяснение возможных видов фазовых портретов и их зависимости от параметров, в основном, осуществлено старомодным трудоемким анали- тическим исследованием. Некоторая поддержка получена наблюдением фазовых траекторий на дисплее персональной ЭВМ. Обнаружить удалось следующее. Одним из основных параметров, оп- ределяющих структуру сообщества, является его уровень технологии# В зависимости от его величины сообщества можно подразделить на три типа: с низким уровнем технологии, средним и высоким. Низкий уровень - это когда g < h, средний - при h<g<h(l +8 d/f)w. высокий - когда g>h(l + 8d/f) Фазовые портреты сообществ с низким и средним уровнями техноло- гии зависят еще от величин £; и определяющих влияние управленцев на эффективность производства. При Ej<K (£2), где К (е2) зависит, ко- нечно, и от остальных параметров, имеют место фазовые портреты рис 12.2 и 12.3. Первый из них отвечает сообществу с низким уровнем про- изводства, когда в нем остаются одни производители без накопленного продукта и управленцев: что добыл, то и съел. Второй - сообществу со средним уровнем производства, в котором устанавливается общество производителей, имеющих накопленный продукт. Состояния, при кото-
12. Математическая модель сообщества «производители-продукт-управленцы» §9 рых имеются управленцы, меняются так, что они со временем исчезают, а для сообщества с низким уровнем исчезает и накопленный продукт. Рис.12.2. Фазовый портрет мо- дели «производители - продукт- управленцы» при g<h, когда в глобально устойчивом равновесии О/ нет продукта и управленцев Рис.12.3. Фазовый портрет модели «производители — продукт - управ- ленцы» при h < g < h (l+8d/f), ко- гда в глобально устойчивом равнове- сии О2 есть производители и про- дукт, но нет управленцев Если управленцы могут значительно повысить эффективность произ- водства, так что Ei> К (£2), то это приводит к измененным фазовым порт- ретам, показанным на рис. 12.4, 12.5. В этом случае, наряду с сохранени- ем прежних устойчивых сообществ «производители» или «производите- ли - продукт», возможно возникновение сообществ с накопленным про- дуктом и управленцами, т е. сообщества «производители - продукт - управленцы». Сообщества «производители - продукт - управленцы» могут быть стабильными и нестабильными. Все это приводит к четырем видам фазо- вых портретов, изображенных на рис. 12.4, 12.4а, 12.5, 12.5а. Стабиль- ность имеет место при Л > 0, а нестабильность — при Л < 0. Рис.12.4а Фазовые портреты модели «производители - продукт - управленцы»: на рис. 12 4 два устойчивых равновесия О; и О4, области притяжения Ф/ и Ф2 которых разделены сепаратрисной поверхностью S седлового равнове- сия Оз, на рис. 12.4а одно равновесие О/устойчиво, второе - О4, став не- устойчивым, породило устойчивое периодическое движение Г, области их (О/ и Г) притяжения Ф{ и Ф2 разделены сепаратрисной поверхностью S седлового равновесия Оз
12. Математическая модель сообщества «производители-продукт- управленцы» Нестабильное сообщество можно мыслить возникшим из соответст- вующего стабильного, благодаря потере устойчивости состоянием рав- новесия О, отвечающего сообществу «производители - продукт - управ- ленцы», в результате рождения от него устойчивого периодического дви- жения Г Периодическое движение F может располагаться целиком выше плоскости z = 0 полного истощения накопленного продукта, а может включать в себя участок, расположенный на плоскости z - 0. Рис.12.5а Фазовые портреты такие же, как на рис. 12.4, но устойчивое равновесие О/, в котором есть только производители, заменилось устойчивым равно- весием О2, где нет только управленцев Модель сообщества с высоким уровнем технологии g> h (1+dd/f) всегда имеет два состояния равновесия О2 и О4. Ранее устойчивое равно- весие (?2, отвечающее сообществу «производители - продукт», становит- ся неустойчивым. Появляется новое состояние равновесия О4. В зависи- мости от знака величины Л оно устойчиво или неустойчиво: первое име- ет место при Л > 0 и второе - при Л < 0. При его локальной устойчивости оно глобально устойчиво и соответствует сообществу «производители - продукт - управленцы». При смене знака величиной Л и потере устойчи- вости состоянием равновесия из него рождается устойчивое периодиче- ское движение Г. Его устойчивость также глобальная, и оно соответству- ет сообществу «производители - продукт - управленцы». Как и ранее, это периодическое решение, отвечающее нестабильному автоколеба- тельному сообществу «производители - продукт - управленцы», распо- лагается выше плоскости z = 0, но может содержать части, лежащие на плоскости z = 0. Соответствующие сделанному описанию фазовые портреты изобра- жены на рис. 12.6 и 12.6а. Кроме этих качественных различий, можно отметить, что устойчивое или неустойчивое равновесное сообщество, точнее, отвечающее ему рав- новесие х* * О, у* *0, z* *0, может по-разному вести себя при неогра- ниченном росте параметра g: х* у* z* неограниченно растут, либо ос- таются ограниченными. Первое имеет место при с e-lf> 0, второе - при обратном неравенстве.
12. Математическая модель сообщества «производители-продукт-управленцы» 91 Описанные выше состояния равновесия и периодические движения лежат целиком в параллелепипеде, определяемом неравенствами: 0<x<A, 0<y<B, 0<z<C, где конечные А, В и С определяются неравенствами: тах(1, е1/Е2)~(1 + 8C)h< 0, -d-eB+fC<0, а-ЬА+сС<0, поскольку через его стороны х = А, у = В и z = С фазовые траектории входят внутрь него. Рис.12.6 Рис.12.6а Фазовые портреты при высоком уровне технологии и стабильности и суще- ственной нестабильности общества, где есть производители и управленцы. Определенный интерес представляют количественные значения коор- динат х* у* и z* для устойчивых сообществ, отвечающие устойчивым равновесиям. Они легко находятся для обществ производителей и произ- водителей и продукта = -, y* = z* = 0 b (12.2) (12.3) и, соответственно, x=a + c(g-lO t = = b dbh dh В случае сообщества «производители - продукт - управленцы» оты- скание х*, у*, z* сложнее и определяется следующим образом: находим максимальный положительный корень у* уравнения, 1 + Е.у а.+а2у . .. , . „ g----------------------ha. -(ha, +k)y = 0, 1 + s2y l + 8bt + db2y (12.4) где a cd се I . d . е 1 b bf 2 bf b 1 f 2 f и затем x* z* определяются формулами: х* = «1+а2У*, z* = bx+b2y*. (12-5) При условии
12. Математическая модель сообщества «производители-продукт- управленцы» (12.6J (12.7 уравнение (12 4) имеет либо два положительных корня, либо ни одного Слияние корней происходит при £i=K (е2), И ОНИ отсутствуют При £{< К (£2). При условии Sd (12.8 уравнение (12 4) имеет один и только один положительный корень. Устойчивость равновесия (х*, у* z*) со всеми координатами, отлич- ными от нуля и где у* - максимальный корень уравнения (12.4), имеет место при выполнении неравенства: Д = (еу * +bx*)(bBx *-Af у * +еВу *+Ьех* у*) - -(bkf х* у* +lkf х* у*2 -секх*2 у*2 где * 2 Л = g & _ 8(hx* +ky*) 1 + dz* При убывании А в момент А = 0 из состояния равновесия (х* у* z*j рождается устойчивый предельный цикл Г. Подведем итоги сказанному. Они представлены на диаграмм! рис. 12.7. На ней уже указаны номера рисунков соответствующих фазе вых портретов. Прокомментируем диаграмму. При g < h в зависимое^ от остальных параметров возможны три вида фазового портрета, пред ставленные на рис. 12.2 и рис. 12.4 и 12.4а. В первом случае имеет мест» глобально устойчивое равновесие Oi (х* > 0, у* = z* = 0), отвечают» сообществу производителей. Во втором - все фазовое пространство раз бивается на две части: часть Ф/ — это область притяжения устойчивой равновесия О/ (х*> 0, у* = z* = 0) и часть Ф2, являющуюся областьн притяжения либо устойчивого равновесия О4 (х*>0, у*> 0, z* > 0) (ри 12.4), либо устойчивого периодического движения - автоколебания-] (рис. 12.4а). Возникновение второй области Ф2 и ее притягивающего ус тановившегося движения при малом g объясняется его фактическим уве личением за счет воздействия управленцев, возникновение которых ста ло возможным, благодаря их значительному положительному возденет вию на производительность общества. С исчезновением этой положи тельной роли управленцы, а с ними и накопленный продукт, исчезают. При среднем уровне технологии производства, когда h<g<h(l+6d/j) также в зависимости от £/, возможны три разных вида фазовых портрс тов, изображенных на рис. 12.3, 12.4, 12.4а, 12.5 и 12.5а. В случае, из браженном на рис. 12.3, имеет место сообщество «производители и пре дукт». Управленцы в нем изживаются. Это если £i <К. Напротив, пр
12. Математическая модель сообщества «производители-продукт-управленцы» 93 Ei > К возникает сообщество, в котором помимо производителей и нако- пленного продукта есть еще и управленцы. В зависимости от знака вели- чины 4 сообщество стабильное или нестабильное, а его установившийся режим - состояние равновесия или автоколебание. В третьем случае - высокого уровня технологии - появление управленцев не зависит от то- го, положительно или отрицательно их воздействие на общество: они возникают, потому что производительность общества позволяет им это сделать. Возникающие варианты фазового портрета зависят от знака ве- личины Л и соответствуют стабильному равновесному сообществу и не- стабильному автоколебательному. Все фазовое пространство в обоих случаях является областью притяжения равновесия или автоколебания, т.е. они глобально устойчивы. Отметим, что наряду с сообществами, в которых устанавливающееся состояние определяется только значениями параметров, возможны слу- чаи, когда устанавливающееся движение зависит еще и от начальных ус- ловий. Разделение стабильных обществ на общества неограниченного и огра- ниченного развития не носит качественного характера и относится к ха- рактеру изменения координат глобально устойчивого равновесия х* у*, г* при g —> 00. Отметим, что такова же роль знака величины се-If на характер изменения средних значений периодических функций x*(t), y*(t), z*(t), описывающих автоколебания, как это следует из соотношений для средних значений этих функций, которые можно получить из диффе- ренциальных уравнений модели: a-Z>x*(/)-Zy*(/) + cz*(/) = 0, -d-ey*(t) + f z* (г) = 0, поскольку из них следует, что х* = — + — + —(се-If )у*. b bf bfK В заключение еще раз обратим внимание на рис. 12.7. На нем указаны условия, отвечающие различным видам фазовых портретов, и показано, как они переходят друг в друга с изменением параметров. Параметр g, и отчасти f/, определяют общую структуру сообщества. При этом можно отметить, что если при высоком уровне технологии управленцы возни- кают вне зависимости от их полезности или вредности для сообщества, то при более низком уровне технологии их возникновение имеет место только при их достаточно высокой полезности. От знака параметра Л за- висит стабильность сообщества, т. е. является ли его предельное устано- вившееся движение устойчивым равновесием или автоколебанием. На- конец, важен еще параметр се-If: он определяет количественный ха- рактер развития сообщества с ростом уровня технологии. Можно смотреть на диаграмму и фазовые картинки как на игру математического ума и воображения, а можно и задуматься о том, какое
12. Математическая модель сообщества «производители-продукт-управленцы» отношение судьбе. они имеют к многовековой истории человечества и ei <к g <h Рис. 12.2 h <g<h(l+8d/j) Рис. 12.3 I g <h Рис. 12.4, A>0; Рис. 12.4a, A <0 h <g <h (1 +8d/f) Puc.12.5, A>0; Puc. 12.5a, A <0 g>h(l+8d/f) A>0 Puc. 12.6 I ce-lf >0 ограниченного развития A<0 Рис. 12.6a ce-lf >0 неограниченного развития Рис.12.7
95 13 ЛИНЕЙНЫЙ ОСЦИЛЛЯТОР Линейный осциллятор - очень простая математическая модель, заме- чательная как по разнообразию и широте конкретных интерпретаций, так и многообразию описываемых ею явлений. В механике осциллятор всю- ду, где есть взаимодействующие масса и упругость, в электродинамике там, где есть емкости и самоиндукции. В схематическом виде они пред- ставлены на рис. 13.1 и 13.2. Линейный осциллятор описывает периодические гармонические коле- бания, затухающие и нарастающие колебания разных частот, различные равновесия: устойчивые и неустойчивые, типа узла, фокуса и седла. Ма- тематической моделью линейного осциллятора является линейное диф- ференциальное уравнение второго порядка вида х + 28х+&2х = 0. (13.1) В нем всего лишь два параметра £и 6)2, его фазовое пространство дву- мерно. Простейшими физическими объектами, приводящими к уравнению (131), являются масса на пружинке и электрический контур из самоин- дукции и емкости, изображенные на рис. 13.1 и 13.2. Масса т может перемещаться только вдоль оси х, а сила упругости пружины при ее растяжении на х от нерастянутого состояния х = 0 равна -кх. «Минус» потому, что она противоположна смещению массы т. Согласно уравнению Ньютона, тх = -кх или . .к х + —х = 0, т что при 8= 0 и к/т = со2 совпадает с (13.1). В замкнутом контуре, включающем емкость С и самоиндукцию L (рис. 13.2 ), q - заряд конденсатора и, следовательно, I = q - сила тока в контуре. На обкладках конденсатора возникает напряжение q / С, а в са- моиндукции L - ЭДС, равная - Ldl/dt. Опять же "минус", потому что ЭДС самоиндукции противоположна нарастанию тока. В силу того, что конденсатор замкнут на самоиндукцию, напряжения q/С и -Ldl/dt равны друг другу, т.е. dt С
96 13. Линейный осциллятор или, учитывая, что I = q, q + —!— = 0 . LC Это совпадает с (13.1) при 5= 0 и со2 = 1 / LC. к Рис. 13.1. Грузик, удерживае- мый пружиной Рис. 13.2. Эпектрический контур с емкостью и самоиндукцией Рис.13.3. Электрический контур конденсатором, самоиндукцией t сопротивлением В любом реальном электрическом контуре имеется омическое сопро тивление (если только мы не имеем дело с исключительным случаем сверхпроводимости). Схема соответствующего контура, включающем сопротивление, представлена на рис. 13.3. В этом случае ЭДС конденса- тора q/С противостоит ЭДС последовательно соединенных самоиндук- ции с ЭДС - Ldl / dt и сопротивления с ЭДС - RI В силу этого имеем: -L— -RI -- dt С или .. R . 1 q + — q +--q = 0 , L LC что совпадает с (13.1) при 25= R/L и со2 = 1 /LC. Аналогично, и в слу- чае массы на пружинке может присутствовать препятствующее движе- нию сопротивление, пропорциональное скорости х с коэффициентом 1, и тогда тх = —kx - hx , или h . к — х + — т т
13. Линейный осциллятор 97 что опять приводит к уравнению линейного осциллятора (13.1) с 18=hlт и со2 = к/ т. Дифференциальное уравнение (13.1) имеет частные решения вида х = е л‘, где 2 - любой из корней т.н. характеристического уравнения Л2 + 2 3 А + со2 — О, получаемого прямой подстановкой этого предполагаемого решения в уравнении (13.1). Вообще, таких корней два, и общее решение, получае- мое согласно принципу суперпозиции линейных динамических систем, имеет вид: х = С1ел‘( +С2е^, (13.2) Напомним, что принцип суперпозиции применительно к осциллятору (131) означает, что если х} (t) и X2(t) - произвольные решения диффе- ренциального уравнения (1,1), то и их любая линейная комбинация С/х j(t) + С2 х 2(t) - также решение. Общее решение уравнения (13.1) при Л у = Л 2, т.е. при 82 = со1 также может быть найдено, опираясь на принцип суперпозиции. Действитель- но, пусть Л у близко к Л 2, и имеется два независимых решения е^'и Однако, при 22 Л} они сливаются и остается только одно. Но можно рассмотреть решение которое при Л2 -> 2 у не исчезает и не совпадает с е^‘: оно равно t еЛг‘. ем самым при 2 у = Л 2 = Л общее решение может быть записано в виде: (13.3) Это простое рассуждение говорит о том, что мы можем считать д *Л2и, если имеет место обратное, то в конечном результате следует перейти к пределу при Л 2 —> 2у. Корни 11 и X г характеристического уравнения могут быть действи- тельными или комплексными. В любом случае при подходящих С i и С 2 общее решение (13.3) может удовлетворить любым начальным условиям вида: *|,=о=*о , х|,.о=х, (13.4) Действительно, расписывая эти условия, придем к двум линейным уравнениям относительно Су и С2: С } + С 2 = Хо , Л у С у + Л 2 С 2 = X/, откуда легко находим, что q _ Л2Х0 — -Xj _ 21 х0 — а^ 1 ” Л2 -2t 2 Лх- Л2 и поэтому соответствующее решение принимает вид: х=(Л2 - Л, J"1 [(Л2х0 -xt)ex,t ~(Л{х0 -xje^]. (13.5) При комплексных корнях, когда 212=-<5±iQ, Q = a/6>2-£2, (13.6) из (13.5) находим, что
98 13. Линейный осциллятор X = -~iО {[(-£ - ZQ)х0 -х,] е &(cos£lt + isin£lt) — - [f-Z> + iCl )x0 - X] ]e ^(cosQt - i sin Q/ Д = = e~& |x0 cos Clt + Q"l(8x0 + X])sin Q.I}. К этому же результату (13.7) и общему виду действительного решения при комплексных корнях характеристического уравнения можно прийти I и другим путем. Опять же в силу принципа суперпозиции, наряду с ел'‘ и| , будут решениями и —(ел'‘ + еЛ2‘) = ccxSlt, 2 1 —(e'1|,-e-'!') = e'ssinnz, 2i которые уже действительные. Суперпозиция этих действительных реше-1 ний и дает его общий вид. Что же собою представляют найденные нами общие решения С,ел'‘ + С2е*г‘ (13) в случае действительных Л / и Л 2 и общие решения е"Л (С] cosQz + С2 sinQ/) (139 при комплексных А/ и А2? Нас интересуют графики x(t) как функции времени t, так и фазовым портреты, отвечающие случаям (13.8) и (13.9). И то, и другое зависите параметров 8 и со2. Прежде всего, от этих параметров зависит, какой им случаев (13.8) или (13.9) имеет место. Для наглядности введем в рассмотрение плоскость параметров со2 и л (рис. 13.4). Подчеркнем, что оба параметра ди со2 могут быть любой знака. Граничному случаю, разделяющему (13.8) и (13.9), отвечает равенства 82 = со2, которому на плоскости рис. 13.4. соответствует нанесенная на нем парабола. Внутри этой параболы 82 < со2 и имеет место (13.9), вне ее, 82 > со2 и имеет место (13.8). Рассмотрим сначала осцилляторы, отвечающие точкам внутри пара-1 болы. Точкам на оси £=0, помеченным на рис. 13.4 цифрой 1, внутри параболы отвечают гармонические осцилляторы х + бУ2х = 0, (13.10л движения которых - хорошо известные гармонические колебания х = С] coscot + С2 sin cot = A cos(cot + <p), (13.II) где A - амплитуда колебаний, со - частота колебаний, а ср - фаза. С по- стоянными С/ иС2 амплитуда Л и фаза ср связаны соотношениями: A sin ср = С I, A cos ср = С 2, из которых следует, что
13 Линейный осциллятор 99 A = yjcf+Cl, tg<p = ^~. с2 График гармонических колебаний представлен на рис. 13.5. На нем же показаны амплитуда А, фаза (р и период Т = 2л/со. Рис.13.4. Разбиение плоскости параметров а, 8 линейного осциллятора на области с различными корнями А] и Л? характеристи- ческого уравнения: 1) оба корня чисто мни- мые 2) комплексные с отрицательными действительными частями, 3) комплексные с положительными действительными час- тями 4) действительные отрицательные, 5) действительные положительные и 6) действительные разных знаков Рис. 13.5. Временной график гармонического колебания Из (13.11) находим параметрические уравнения фазовых траекторий в виде; х = A cos (со t + (р)} х = -соА sm(cot + <р). При изменении t точка (х, х) пробегает по часовой стрелке эллипс X2 X2 _ Различным А отвечают разные эллипсы, что в итоге приводит к фазо- вому портрету рис. 13.6. Заметим, что найти фазовые траектории можно было и непосредственно, интегрируя дифференциальное уравнение 13.10) гармонического осциллятора. Именно, умножая (13.10) на х и интегрируя, находим, что где постоянная интегрирования h, имеющая смысл приведенной энергии осциллятора, связана с амплитудой колебаний осциллятора соотношени- ем h=-lD2A2. 2
.100 13. Линейный осциллятор Сместимся теперь в область плоскости параметров со2, 8 выше оси абсцисс, оставаясь внутри параболы. В этом случае придем к тому, что cos(cot + ср). (13.12] Рис. 13.6. Фазовый портрет гармонического осциллятора (область I рис. 13 4) Рис. 13.7. Экспоненциально за- тухающее гармоническое колеба- ние(область 3 рис. 13.4) Рис. 13.8. Экспоненциально нарастающие гармонические колебания Это соответствует затухающим гармоническим колебаниям, изоб- раженным на рис. 13 7. Их период колебаний 2л7Г1 несколько больше, чем период колебаний соответствующего гармонического осциллятора, равного 2л7 бУ = ^со -82^ При 8<0, т.е. при смещении вниз от оси абсцисс по плоскости параметров со2,8 рис 13 4, также имеет место (13.12) Однако теперь соответствующие колебания нарастающие, как показано на рис. 13.8 Фазовые портреты в рассмотренных случаях со- стоят из скручивающихся (8>0) или раскручивающихся (8<0) спира- лей, представленных на рис. 13.9 а и б. Итак, мы нашли графики движения и фазовые портреты в областях 1,(<5=0, а>2>0), 2. (<5> 0, и 3 (£<0, 82 < а>2) рис 13.4 Найдем еще графики изменения х и фазовые портреты для осциллято- ров из областей 4 (8> 0, 8 > со > 0), 5 (£<0, 82 > со2 > 0) и 6 (со2 < 0) того же рисунка 13 .4. Если предшествующие случаи отвечали комплексным корням характеристического уравнения, то теперь эти кор-
13. Линейный осциллятор 101 ни действительные и общее решение определяется формулой (13.8). Это решение является суперпозицией двух решений х = е^‘ и х = е*2*. Гра- фики этих решений - это возрастающие или убывающие экспоненты в зависимости от знаков Л/ и А 2, что позволяет представить себе, каковы графики их суперпозиций с любыми коэффициентами С у и С j. Рис.13.9. Фазовые портреты а) в области 2 рис. 13.4 и б) того же рисунка Для построения фазовых портретов построим сначала фазовые траек- тории для частных решений х = и х = е*1'. Пусть Л - это либо Л /, ли- бо Л 2, тогда параметрическое уравнение фазовой траектории записывает- ся в обоих случаях в виде x = e* , х = Лел (—со < к оо), (13.13) и фазовые траектории представляют собой лучи х = Ах (х > 0 или х < 0), пробегаемые фазовой точкой, согласно (13.13), от начала координат до бесконечности при А>0 или, наоборот, из бесконечности до нуля при Л< 0. Нетрудно понять векторное равенство (х,х) = С1(1,Я1)ел’’+С2(1,Л2)е^', (13.14) непосредственно следующее из (13.13). Соответствующая ему геометри- ческая интерпретация представлена на рис. 13.10. Она позволяет, меняя знаки и величины С / и С 2, построить фазовый портрет. Рис. 13.10. Вспомогательное построение для получения фа- зового портрета узлового со- стояния равновесия
102 /3. Линейный осциллятор В области 4 рис. 13.4 Я / и Л2 отрицательны и соответствующий фае вый портрет представлен на рис. 13.11. В области 5 Л / и положив, ны, и фазовый портрет имеет вид, показанный на рис. 13.12. В области Я/ и Я2 - разных знаков, а фазовый портрет вида, показанного) рис. 13.13. Тем самым мы нашли все возможные виды фазовых портр тов линейного осциллятора. На всех них есть выделенная фазовая ipaei тория, сводящаяся к одной точке - состоянию равновесия х = 0 х-~ Остальные фазовые траектории как бы расположены вокруг нее и поэт) му можно говорить о различных типах состояний равновесия. Они cooi ветствуют областям 1, 2, 3, 4, 5 и 6 рис. 13.4 и называются центром, ус тойчивым и неустойчивым фокусом, устойчивым и неустойчивым узле и седлом. В этом перечислении выделена граница 1 между областями 2) 3. Остальные границы оставлены без внимания. Это вызвано ее особо ролью. Эта граница между экспоненциальной устойчивостью и неустон чивостью, затухающими и нарастающими колебаниями, и этот особь граничный случай является общим для консервативных и, в частности гамильтоновых систем. Рис.13.13 Фазовые портреты узла (устойчивого и неустойчивого) и седла. Они отвечают соответственно областям 4, 5 и б рис. 13.4 Фазовые портреты гармонических осцилляторов, принадлежащих этому граничному случаю, обладают очень важной для статистической механики особенностью. Она проявляется, когда вместо одного осцилля- тора рассматривается ансамбль идентичных осцилляторов, каждый из которых представляется своей движущейся фазовой точкой. При этом фазовый портрет можно интерпретировать как поток частиц, отобра- жающих осцилляторы, или как течение фазовой жидкости. Фазовые час-
13. Линейный осциллятор 103 ,-<5f тицы с течением времени перемещаются и как-то деформируются. Если задана область фазового пространства Go, то, спустя время t, она перей- дет в область Gt согласно преобразованию: § Clt < (cos Qz + — sin Qt )x0 + sin—x0 ►, ^2 g * - (£1 + ~^)sin ^txQ + (~ ~ sin Qi + cos Qi )xo х = е * следующему из формулы (13.7), определяющей решение x(t) через на- чальные условия хо и х у. Якобиан этого преобразования дх дх Г = ^0 *0 дх дх дх0 дх0 -2& находится после несложных вычислении и оказывается равным е Этот результат означает, что при своем течении фазовая жидкость сжи- мается при <5>0, расширяется при 3<0 и при <5=0 ведет себя как не- сжимаемая. Точнее, любой элемент фазового объема defy преобразуется за время t в элемент dcrt и d(5t =e~2Stdcr0, так что e~2St является коэффициентом сжатия (<5> 0) или коэффициентом растяжения (<5< 0) текущей фазовой жидкости. При <5=0 этот коэффи- циент растяжения равен единице, что соответствует течению несжимае- мой жидкости. Перечисленные выше виды фазового портрета линейного осциллятора - центр, фокус, узел и седло - имеют место не только у равновесий ли- нейного осциллятора, но и у равновесий О(х*, у*) любых двумерных ди- намических систем, описываемых двумя дифференциальными уравне- ниями второго порядка х = Х(х,у), у = Y(x,y). (13.15) Мы с этим уже сталкивались, рассматривая фазовые портреты взаимо- действующих популяций. При этом эти фазовые портреты имели место не на всей фазовой плоскости, а только в некоторой окрестности состоя- ния равновесия. Как и для осциллятора, вид фазового портрета в окрест- ности состояния равновесия х*, у* определяется корнями Л/ и 22 харак- теристического уравнения, которое для уравнения (13.15), как известно, принимает вид: Г ах у _ ''агу (axY
104 13. Линейный осциллятор где звездочки означают, что производные вычисляются в точке равнове- сия х* у*. В окрестности состояния равновесия линеаризованные уравнения (13.15) имеют вид; где £ и г] - отклонения от равновесия х* у*, т.е. £ = х - х *нт]=у-у* Исключение из этих дифференциальных уравнений £ или ту приводит к уравнению линейного осциллятора для %; ''arYrarT ^ду) уйк, £ = 0 или точно такому же уравнению для тр Ниже будут приведены конкретные примеры линейных осцилляторе в из всех областей 1-6 бифуркационного портрета рис. 13.4. При этом мо- дель линейного осциллятора (13.1), как правило, является тем или иным приближением реальной системы, очень часто приемлемой только для малых или не очень больших уклонениях от равновесия. Так, в линейном приближении нижнее состояние равновесия маятника описывается ли- нейным гармоническим осциллятором с состоянием равновесия типа центр; движение вблизи верхнего равновесия - осциллятором с неустой- чивым седловым равновесием. Действительно, круговой маятник fi + ysin<p = Q (13.16) имеет два равновесия: нижнее $?* = 0 и верхнее (р* = п. Полагая (р = (р* + х, имеем x + —sin(cp +х7 = 0 , или .. s . • я x + j-sin^ +j-xcos^ +... = 0, (13.17) где многоточие означает величины третьего и большего порядка малости относительно предполагаемого малым х. Из (13.17) при = 0 следует х + й>2х = 0, о1 I а при ср* = л следует Х-й)2Х = 0,
13. Линейный осциллятор 105 Маятник, отвечающий математической модели (13.16), мы представ- ляем в виде тела, подвешенного в поле силы тяжести. Но его можно представить и в виде диполя в электрическом поле. Если / - момент инерции диполя длины 21 относительно центра масс, и е и - е - заряды на его концах и Е - напряженность однородного постоянного электриче- ского поля, то для угла (р отклонения диполя от направления электриче- ского поля имеет место уравнение 1ф = -2lesintp, т.е. опять же классическое уравнение маятника, а в линейном приближе- нии при малых отклонениях от равновесных значений <р=0 и (р = л - линейный осциллятор. В хорошем приближении линейным осциллятором описываются ма- лые колебания лодки или другого плавающего на воде тела. Для лодки или корабля различают бортовые и килевые колебания. Каждое из них имеет свою частоту. Можно приближенно линейным осциллятором опи- сывать колебания струны, здания, имея в виду его вертикальные колеба- ния на фундаменте и боковые колебания. 100-этажный небоскреб колеб- лется так, что боковые смещения его верхней части порядка метра. Осциллятором можно описать упругие колебания газа в сосуде в виде резонатора Гельмгольца, колебания молекул в кристалле, электромаг- нитных волн в проводящей полости и многое, многое другое: колебания автомобиля, поезда, пузырька воздуха в воде, разнообразных электриче- ских контуров в радиосхемах; колебание воды в сообщающихся сосудах; колебания жидкости в нашем вестибулярном аппарате; крутильные коле- бания маховика на упругом валу. Во всех приведенных примерах осцилляторов имеет место рассеяние энергии, и колебания затухают, при этом 8 > 0 или 8=0, если этим зату- ханием можно пренебречь. Ниже будут приведены примеры с 8 < 0, с так называемым отрицательным трением, когда, напротив, происходит под- качка энергии от некоторого источника. Кроме того, будут рассмотрены некоторые нелинейные осцилляторы, для которых линейное описание недостаточно, а поведение существенно другое. В заключение, как на итог всего сказанного, посмотрите на сводный рисунок 13 1-+. На нем изображено, как ведут себя осциллограммы изме- нения координаты x(t) и какой вид имеют фазовые портреты в зависимо- сти от параметров со 2 и 5, из разных областей бифуркационной диаграм- мы.
106 13. Линейный осциллятор Рис.13.14. Итоговый параметрический портрет линейного осцилля- тора. В каждой из его областей изображены временные графики и фазовые портреты
107 ЭЛЕКТРОМЕХАНИЧЕСКИЕ АНАЛОГИИ. УРАВНЕНИЯ ЛАГРАНЖА-МАКСВЕЛЛА Вернемся к простейшим примерам механического и электрического линейных осцилляторов. Первая физическая модель описывается диффе- ренциальным уравнением тпх + hx + kx = 0, (14.1) а вторая - дифференциальным уравнением Z^ + ^ + (l/C)^ = 0. (14.2) Эти модели (14.1) и (14.2) переходят друг в друга при заменах пере- менной д на g (х на q, х на q) и параметров m на L, h на R, к на 1 / С. Поэтому, если m= L, h = R, к = 1 / С и если в некоторый начальный мо- мент времени х = q и x = q ,то равенства х = q и х = q будут иметь место после этого все время, х - это координата положения массы, a q - элек- трический заряд конденсатора, и они при перечисленных условиях будут меняться одинаково. Аналогично все время будут совпадать величина скорости х перемещения массы и электрический ток q в контуре. По- этому можно говорить об аналогии массы на пружине с вязким трением и электрического контура из самоиндукции, емкости и сопротивления. Аналогии в том смысле, что процессы изменения совершенно разных физических величин х и q одинаковы, если только т = L, h = R и к = 1 /С. А аналогичными являются: механические смещения и электри- ческий заряд, скорость и ток, масса и самоиндукция, коэффициент вязко- го трения и омическое сопротивление, коэффициент жесткости пружины и величина, обратная емкости конденсатора. Продолжим эту аналогию. Кинетическая энергия массы равна тх2 /2. Аналогом ее будет величина Lq / 2 Это, как известно, энергия магнит- ного поля катушки самоиндукции. Потенциальная энергия пружины - это кх212, ее аналог - q2 / 2С и это, как мы видели ранее, энергия электри- ческого поля конденсатора. Произведение к х - это сила натяжения пру- жины, ей отвечает величина электрического напряжения q / С конденса- тора. Мы установили аналогичность величин смещения, скорости, силы, кинетической и потенциальной энергий соответственно заряду, току, на- пряжению, энергии магнитного поля самоиндукции и электрического по- ля конденсатора. Одновременно масса т, вязкое сопротивление h и жест- кость к аналогичны самоиндукции L, омическому сопротивлению R и ве- личине обратной емкости 1 / С.
108 14. Электромеханические аналогии Уравнения Лагранжа - Максвелла Эта аналогия относится не только к массе на пружине и электриче- скому контуру. Она значительно шире. Чтобы в этом убедиться, предста- вим механическую систему и электрическую, состоящими из элементов: масс, упругостей, вязкого сопротивлений и, соответственно, самоиндук- ций, емкостей и омического сопротивлений. Каждый из этих простейших элементов имеет свою математическую модель. Укажем их. Масса т свя- зывает ускорение х с силой F соотношением тх = F. Аналогично, само- индукция L связывает скорость изменения тока q с напряжением Е, так что Lq = Е. Таковы же аналогии между упругостью и емкостью, механи- ческим вязким и электрическим сопротивлениями. Выпишем их все: тх = F L q = Е, h x = F о R q = E, (14.3) kx = F q/C = E При этом в каждой из аналогий (14.3) сила F и напряжение Е имеют свой смысл и величину. Слева - математические модели массы, вязкого сопротивления (демпфера), упругой пружины. Справа - самоиндукции, омического сопротивления, емкости. После этого ясно, что если имеются две системы: механическая и электрическая, составленные из перечисленных элементов и так, что ме- жду аналогичными элементами возникают одинаковые связи, то и систе- мы в целом будут аналогичными. На этом основано электромеханическое аналоговое моделирование, позволяющее механическую систему изучить с помощью электрической и наоборот. Не будем пока развивать дальше эту тему и ограничимся сказанным Продумайте только, что чему соответствует в этой замечательной анало- гии. Еще раз выпишем ее х-уэ q, т v2/2 L I2/2, т <-> L, v=k<->I=q, кх2 / 2 <т-> q 2 / 2 С, k-^l/C; (14.4) F<-+E h<^R. Перейдем теперь к трудному вопросу составления математических моделей механических, электрических и электромеханических систем. Для механических систем Лагранж придумал общий простой и удоб- ный универсальный способ составления их динамических математиче- ских моделей в виде знаменитых дифференциальных уравнений Лагран- жа. Вообще, это большая и красивая теория. Вы о ней узнаете из соот- ветствующих курсов. А сейчас, не вдаваясь в детали, я постараюсь вам описать алгоритм составления этих дифференциальных уравнений для произвольной механической системы, положение всех материальных то- чек которой определяется конечным числом скалярных величин q t,q2, > Qn,, получивших наименование обобщенных координат. Пусть сначала все силы, действующие в системе, потенциальные, т.е. для них есть потенциальная энергия V(q i,q2, ..., qn, t), зависящая от обобщенных координат, и возможно, времени t. Это означает, что работа этих сил на любом виртуальном перемещении 8 q /, 8 q2, ..., 8 qn равна уменьшению потенциальной энергии, т.е.
14. Электромеханические аналогии. Уравнения Лагранжа - Максвелла 109 dV 5A--5V = -——dq. л. a dqa Далее ясно, что ее кинетическую энергию Т в любой момент времени можно выразить через обобщенные координаты q i,q2, qnn обобщен- ные скорости qx,q2,—,qn- Ведь кинетическая энергия - это сумма кине- тических энергий всех материальных точек системы, положение которых однозначно зависит от q i,q2, qnnt. Согласно Лагранжу, нужно составить функцию L = T-V (14.5) ис ее помощью искомые уравнения движения записываются в виде; d dL dL _ z . _ . ------------= 0, (a = 1,2,..., и). dtdqa dqa (М.6) Этот очень красивый общий способ составления уравнений движения в силу изложенной аналогии можно перенести на электрические систе- мы. В свое время это сделал Максвелл. Это можно сделать не только для электрических систем, но и электромеханических. Нужно лишь, в силу изложенной выше аналогии, под кинетической энергией Т понимать сумму механической кинетической энергии и энергии магнитных полей индуктивностей, а под потенциальной энергией V- сумму механической потенциальной энергии и энергий электрических полей емкостей. Под обобщенными координатами q i,q2, qn при этом понимаются любые скалярные величины, которые определяют не только механическое по- ложение, но и все заряды, производные которых определяют все элек- трические токи. Подчеркнем, что при этом в системе нет ни механиче- ских, ни электрических сопротивлений. Поясним на очень простом примере, как возникает запись дифферен- циальных уравнений математической модели движения в виде уравнения Лагранжа (14.6). Возьмем уравнение Ньютона движения линейного механического ос- циллятора mx + kx = 0 (14.7) и выполним с ним следующие преобразования: d д тх2 . д кх2 тх =---------, кх --------, dt дх 2 дх 2 и следовательно, ... d д (тх2 кх2\ д (тх2 тх + кх =----------------------- dt дх\ 2 2 J дх 2 (14.8) что по форме совпадает с уравнением Лагранжа (14.6) и при этом х- обобщенная координата, т х 2 / 2 - кинетическая энергия и к х ' / 2 - по- тенциальная энергия.
по 14. Электромеханические аналогии. Уравнения Лагранжа - Максвелла Аналогично к Лагранжеву виду приводится и уравнение электрик ского осциллятора: Т.. q d д Lq2 q2 У д Lq2 q2 С dtdq[ 2 2CJ dq 2 2C где обобщенной координатой является заряд q конденсатора, L q2/2- магнитная энергия катушки самоиндукции, a q ' / 2С - электрически энергия конденсатора. Эти выкладки представляются искусственными и ничего не доказц вающими. Это так и есть. Для того, чтобы придать им смысл, нужно про- никнуть в тайну Лагранжевой записи уравнений движения. А тайна их» том, что они соответствуют некоторой вариационной задаче минимум функционала. Необходимое условие минимума функционала, как извей- но, состоит в обращении в нуль первой его вариации. Условия обраше ния в нуль первой вариации оказываются уравнениями Лагранжа. Такова тайна удивительной формы и универсальности уравнений Лагранжа. Но давайте не будем спешить, а сначала познакомимся еще с удивительным свойством инвариантности Лагранжевой записи уравнений движения, независимости их вида от выбранных обобщенных координат, в частно сти, уравнений (14.8) или (14.9). Оказывается, при любой замене пере менных вида х =f(y) ( q =f(p)) вид их сохраняется, чего нет для исход- ных уравнений Ньютона или Кирхгофа. Действительно, замена переменных в дифференциальном уравнении Ньютона (14.7) приводит его к виду: + kF( у) = Ъ, (1410) отличному по форме от исходной записи (14.7). А теперь сделаем такую же замену переменных в Лагранжевой записи (14.8). Нам надо убедиться, что из d д г'тпх2 кх2> д (тх2 кх2> dt дх 2 2 2 2 у (14П) (1412) и обратно, т.е. что замена переменных в уравнении Лагранжа сводится к замене переменных в функции Лагранжа (функция Лагранжа должна быть функцией принимаемых нами обобщенных координат и скоростей). Для этого достаточно показать, что (14.12) совпадает с (14.10), поскольку (14.10) совпадает с (14.7), а (14.7) с (14.11). Действительно,
14. Электромеханические аналогии. Уравнения Лагранжа - Максвелла 111 -^4=k/w^+<=0 dtdy 2 2 Оу 2 2) оу и поскольку df /ду * 0, то приходим к уравнению (14.10). Итак, Лагранжева форма записи обладает удивительным свойством инвариантности формы записи по отношению к замене переменных. Эта форма записи не зависит от выбранных переменных, она инвариантна по отношению к ней. Интересно, откуда эта инвариантность? Разгадать это не просто. Но в науке очень часто важно найти зацепку, дальше уже сле- дует «ковырять», пока не поймешь. А что нужно «ковырять», пожалуй, ясно существует, по-видимому, какой-то надкоординатный подход отде- ления истинных движений системы среди всех мыслимо возможных. Ведь именно это, в конечном счете, делают дифференциальные уравне- ния движения. Не зависимая от координат вариационная формулировка законов ме- ханического движения исторически назревала давно и имела своим исто- ком теологические представления о целесообразности божественного промысла. Об этом много написано. Наверное, и сейчас к этому трудно прийти чисто логически. Так что не будем лукавить и прямо скажем, в чем дело. Возьмем интеграл по времени от функции Лагранжа от момента вре- мени t о до 11 fnn to и назовем эту величину действием. Обозначим ее через Ж Распишем де- тальнее, от чего зависит действие IV. w = ...qn(t):qx(t).. to Оно определяется функциями qa(t) (а = 1, 2, зависящими от времени t на промежутке от to до 11, т.е. является функционалом. Рас- смотрим, как меняется этот функционал при малых изменениях функции qcft). Мало изменим эти функции qa(t), заменив qa(t) на qa(t) + 8 qa(t) и найдем изменение действия W с точностью до величин первого порядка малости относительно малых изменений 8qa(t)n 8 q а. Имеем: dL d + л 8qa dt =
112 14. Электромеханические аналогии. Уравнения Лагранжа - Максвелла dL р 'гу < 8L d_dC дЧ« + dtdqaj 8qadt. Последнее действие в этих вычислениях состоит в интегрировании по частям. В результате мы с удивлением обнаруживаем, что под интегра- лом стоят выражения dL ddL (14.13) обращение которых в нуль как раз и есть уравнения Лагранжа. Что же нужно потребовать, чтобы они обратились в нуль? Какое предположение в отношении действия W приведет к такому выводу? Догадаться не очень трудно. Потребуем, чтобы <5W = 0 при условии, что изменений функций qa (t) на концах не происходит» поэтому 5 qa = 0 при t = tont = tp Действительно, из этих предположе- ний следует, что ddL - dtdqa) для произвольных 3qa (а = 1, ..., и), обращающихся в нуль при t = tgn t = 11. Это влечет, как нетрудно понять, обращение в нуль всех выраже- ний (14.13). Это имеет место только благодаря произвольности торые в силу этого можно, в частности, выбрать равными ко- d nL' dtdqaJ e2(t) 2 где £ (t) обращается в нуль только на концах замкнутого интервала [to, t J. Для таких вариаций функций qa (t) из (14.14) следует, что ’(yf51 - Y ,, « 1а» dtdqaJ e2(t)dt = 0, (14.15) и, если бы при каком - либо значении t внутри промежутка [to, t1] одно из выражений (14.13) было отлично от нуля, то и интеграл (14.13) был бы положительным, отличным от нуля. Итак, уравнения Лагранжа эквивалентны требованию <5W = 0 (14.16) при любых вариациях функций qa(t), при которых не меняются их значе- ния при t = to и t = t]. Это и есть желанная вариационная формулировка принципа отбора истинного движения от всех мыслимо возможных. Истинное движение за время от to до 11, от начальной точки qa = qa° до конечной qa = qa! вы- деляется из всех мыслимых тем, что для него вариация действия равна нулю.
14. Электромеханические аналогии. Уравнения Лагранжа - Максвелла 113 Можно показать, что при этом на истинном движении достигается не только равенство нулю первой вариации, но действие на нем достигает минимума. Но нам достаточно и того, что мы узнали: мы пришли к фор- му ировке закона движения, не зависящей от выбираемых переменных, от того, как конкретно мы его описываем. Из этой независимости и сле- дует инвариантность Лагранжевой записи уравнений движения. Вместе с тем мы обнаружили, что в качестве математической модели могут выступать не только дифференциальные уравнения движения, но и, пожалуй, более общие вариационные принципы. Более общие, потому что они не зависят от координатного описания. Они как бы над ним. По- вторим еще раз, в чем же состоит эта вариационная математическая мо- дель. В основе ее уже не лежит пространство состояний, ее основа - про- странство положений, конфигураций, пространство переменных q ,..., qn. Для механической системы - это положение всех ее матери- альных точек. Для электрических, тех, о которых речь шла выше, это электрические заряды, производные по времени, от которых электриче- ские токи. Движение в вариационном принципе определяется не начальным со- стоянием, а исходным и конечным положениями. Во всяком случае, они предполагаются как бы заданными или фиксированными. А сам рассмат- риваемый нами вариационный принцип состоит в том, что действитель- ное движение от заданной начальной точки к конечной выделяется тем, что для него вариация действия равна нулю. Можно смотреть на это, как на математический прием новой формы записи дифференциальных уравнений движения, можно видеть в этом новый принцип. Он так и называется принципом наименьшего действия, открытие которого принадлежит Гамильтону. Это принцип некоей целе- сообразности по идее другой, чем принцип детерминизма. Вообще гово- ря, из принципа целесообразности не следует принцип детерминизма, но конкретно, применительно к законам природы, пока это всегда так. Это и делает обе точки зрения совместимыми, дополняющими друг друга. Теперь я хочу привести вам несколько примеров применения уравне- ний Лагранжа - Максвелла. Они убедят вас в их эффективности, в том числе и в случаях, когда вы не знаете даже, как подступиться к составле- нию математической модели. В качестве первого примера возьмем обычный круговой маятник. Для него кинетическая энергия равна J<p2/2, а потенциальная - mglcos(p, где (р- угол отклонения маятника от вертикали, J пт- момент инерции и масса маятника, I - расстояние от точки подвеса до центра масс. По- этому функция Лагранжа равна Г 7 L = —— + mgl cos (р. После чего легко находим, что
114 14 Электромеханические аналогии Уравнения Лагранжа - Максвелла ------ =J(p + mgl sin(p — 0. dt дф д(р Теперь пусть маятник не круговой, а параболический, т.е. масса т № жет двигаться по расположенной в вертикальной плоскости парабол z = а х2 (рис. 14.1 ). В этом случае 2 2 2 V г V = mgz = mgax2 и d dL dL a . 2 2V- л ----------= rail + 4л x ix + zrngax = 0. dt dx dx Рис. 14.1. Параболический математический маятник х mg Рис.14.2. Иллюстрация к движе- нию материальной точки по про- извольной гладкой плоской кривой в поле силы тяжести Наконец, пусть материальная точка массы га движется в вертикальной плоскости Oxz (рис. 14.2) по произвольной кривой, уравнение которой запишем в параметрическом виде: х = х (s), z = z (s ), где параметр 5 - длина дуги кривой, отсчитываемая от некоторой точй О Непосредственно находим, что г Z 1 L =-----1- mgz(s), и поэтому d dL dt ds — -ms + mgz'( s) = 0. ds Возьмем электрический контур, состоящий из самоиндукции L и ем- кости С. При этом г=Л1_ 9 2 2С и поэтому d dL dL r„ q n ---------= Lq + — = 0, dt dq dq C
14. Электромеханические аналогии. Уравнения Лагранжа - Максвелла 115 что нам хорошо известно. Усложним задачу, предположив, что внутри катушки самоиндукции может качаться подвешенный на пружине железный стержень массы т, так что ее самоиндукция L зависит от отклонения х стержня от его рав- новесного положения х = 0 (рис. 14 Рис.14.3. Взаимодействующие между собой механический и электрический осцилляторы Эта система довольно сложна. Она состоит из двух осцилляторов (замкнутого контура из самоиндукции и емкости, и массы т, подвешен- ной на пружине), которые взаимодействуют друг с другом. Движение стержня меняет магнитное поле катушки самоиндукции, вызывая в ней ЭДС индукции, а меняющееся магнитное поле катушки самоиндукции воздействует на железный сердечник. Для того, чтобы написать уравне- ния движений этих осцилляторов, нужно найти индуцируемую в катушке самоиндукции движением стержня ЭДС и меняющуюся силу воздейст- вия магнитного поля катушки самоиндукции на находящийся в ней же- лезный стержень. Это для математика не так уж просто. А написать функцию Лагранжа-Максвелла очень легко. Помимо координаты х, введем еще заряд конденсатора q, тогда L _L(x)q2 ^тх2 q2 кх2 “ 2 ~2~ 2С 2 и приходим к двум уравнениям для координат х и q как функций времени d dL dL .. 1 , 2 > n ----------= тх---L(x)q + кх = О, dt dx dx 2 d dL dL q = + L + 7? = °* dt dq dq C Из этих уравнений, как и следовало ожидать, вытекает закон сохране- ния энергии в виде: L(x)q2 тх2 q кх2 ---- —I-----1-----1---= п - постоянная . 2 2 2С 2 Получается это соотношение умножением первого уравнения на х, второго на q, затем их сложения и интегрирования. Перепишем найденные выше уравнения Лагранжа-Максвелла в виде:
116 14. Электромеханические аналогии. Уравнения Лагранжа - Максвелла тх + kx = —L'q , 2 Lq + ~ - -L'xq. При L' = 0 они распадаются на два независимых осциллятора - меха- нический и электрический. Их взаимодействие тем сильнее, чем болым L'. При L' О электрический осциллятор действует на массу механиче-1 ского с силой 1 / 2L' q2, а механический осциллятор наводит в электричн ском контуреЭДС индукции, равную-L'xq. Вы, вероятно, уже заметили, что во всех приведенных примерах ш-1 сутствуют механические и электрические сопротивления. Это потому* что уравнения Лагранжа предполагают потенциальность действующ! сил. При независимости потенциальной функции от времени из этой следует, как и в рассмотренном примере, закон сохранения энергии. При непотенциальных силах и, в частности, наличии вязких трений ы омических сопротивлений, энергия не сохраняется и уравнения Лагранж не применимы. Но их можно обобщить. Это несложно. Нужно только ис- ходить не из потенциальной энергии действующих сил и энергии элек-1 трического поля, а из выражения элементарной работы 8 А. При наличия потенциальной энергии V элементарная работа 8 А равна ЗА = -8У^-^—8Ча. (14.17) В общем же случае (точнее, более общем) 8A = YjQa8qa, <14.14 т.е. производные -дУ/ dqa заменяются на величины Qa, называемые обобщенными силами. К этой формальной замене, как оказывается, сво- дится обобщение уравнений Лагранжа. Запишем уравнения Лагранжа в виде: d дТ _дТ дУ dt 8qа dqa cqa ' Их обобщение будет d дТ дТ dt dqa 8qa Заметим еще, что, разделяя потенциальные и непотенциальные силы, можно уравнение Лагранжа записать в виде: dtcqa dqa 8qa + ИЛИ d dL dL dt cqa dqQ (14.20) где, по-прежнему, L = T- V, но V относится только к потенциальным си- лам, а непотенциальные силы представлены обобщенными силами Qa.
14. Электромеханические аналогии. Уравнения Лагранжа - Максвелла 117 Проиллюстрируем сначала уравнения (14.19) и (14.20) очень простым примером массы на пружине при наличии вязкого трения. В этом случае кинетическая энергия Т равна тх 2 /2. Сил, совершающих работу при виртуальном изменении х, две - сила упругости - к х и сила трения - йх. Их работа на перемещении 8 х равна 8 А = -кх 8x-hx 8х, поэтому, соответствующая координате х обобщенная сила (в данном случае просто сила) равна Q = - kx-hx. Уравнение Лагранжа (14.19) принимает вид; т х = -kx — hx. Составляя уравнения движения в форме (14.20), потенциальную силу жесткости относим к функции Лагранжа L, равной _ тх2 кх2 / X/ — 2 2 а обобщенная сила вязкого трения Q будет - h х. В силу этого уравнение (14.20) принимает вид: d д (тх2 dt дх 2 кх2> д 'тх2 2 J 2 кх2> = -hx или тх + кх =-hx. Для электрического контура из самоиндукции, емкости и омического сопротивления все аналогично, так как работа диссипативных сил оми- ческого сопротивления при переносе заряда 8q равна - R q 8 q.
118 15 ЧАСЫ ГАЛИЛЕЯ-ГЮЙГЕНСА Исчисление времени - древнейшая проблема человечества. Миллионы лет, столетия, годы, месяцы, сутки, часы, минуты, секунды и кратчайшие ее доли - нонасекунды - это те разнообразные масштабы, в которых для разных целей научился измерять время человек. Первоначальное измере- ние времени основывалось на обращении земли вокруг солнца и ее соб- ственном вращении. Знаки зодиака указывали времена года, а солнце днем и звезды ночью - время суток. Вызванная мореплаванием потребность определения местоположения корабля потребовала точного измерения времени суток. Широта опреде- лялась только по астрономическим наблюдениям. Для определения дол- готы требовалось еще и точное знание времени. Определение местопо- ложения по долготе с точностью в один километр соответствует ошибке в отсчете времени примерно в три секунды. А плавать приходилось, не имея возможности откорректировать показания корабельных часов, ме- сяц и более. В XVII веке английское адмиралтейство объявило конкурс на созда- ние точных часов. Такие часы были сконструированы и изготовлены Х.Гюйгенсом. Это были первые маятниковые часы - часы, в которых для отсчета времени использовались колебания маятника. Галилей изучил колебания маятника, установил неизменность периода их колебаний (при малых отклонениях маятника изменения частоты его колебаний Галилей заметить не мог). Гюйгенс создал часы на этой основе. Поэтому эти но- вые часы можно назвать часами Галилея - Гюйгенса. До Галилея и Гюй- генса были часы, использующие колебания балансира, однако этот ба- лансир не имел собственной частоты колебаний, его частота колебании зависела и определялась прилагаемыми к нему усилиями часового меха низма. Использование в часах устройства с собственной частотой колебании оказалось необычайно плодотворным и привело к серии разнообразный конструкций все более и более точных часов, использующих этот прин цип: часы с балансиром на пружинке с цилиндрическим, анкерным и хронометровым ходами, кварцевые часы, использующие собственны! упругие колебания кварцевой пластинки, часы, использующие электри ческий колебательный контур с собственной частотой, и, наконец, - фе номенально точные молекулярные и атомные часы, позволяющие обна ружить и измерить неравномерность вращения Земли. Для того, чтобы колеблющийся маятник сделать часами, нужно счи тать его колебания и показывать их число, например, стрелкой на цифер блате в соответствующем масштабе. Кроме того, нужно поддерживат
15. Часы Галилея - Гюйгенса 119 его колебания, которые сами по себе затухают. Необходимо затухающие колебания маятника превратить в незатухающие автоколебания. Рис.15.1. Схематическое изображение ходового механизма часов Обе эти задачи успешно решает т.н. часовой ход, простейший вариант которого схематически изображен на рис. 15.1. После каждого колебания маятника туда и обратно храповик под влиянием заведенной пружины или опускающегося груза поворачивается на один зубец и одновременно сообщает маятнику подталкивающий импульс. Тем самым скорость вра- щения храпового колеса определяется частотой колебаний маятника, а его зубцы в момент его поворота подталкивают маятник, поддерживая его колебания. Точность хода часов с таким устройством определяется стабильно- стью колебаний маятника. Период колебаний маятника зависит от мно- гих причин, и каждая из них может повлечь его изменение. Основными факторами, определяющими период колебаний маятника, является его длина, масса, момент инерции, сопротивление среды и трение в точке подвеса, величина ускорения силы тяжести, удары храпового колеса, а также амплитуда его колебаний. Рассмотрим сначала зависимость периода колебаний маятника от его амплитуды. Запишем уравнения колебаний маятника в виде Jcp + mgl sin (р = 0, (15.1) где J - его момент инерции, т и I - масса и длина (расстояние от оси подвеса до центра масс). Введя обозначение со 2 = mg/ /J, умножая урав- нение (15.1) на ф и интегрируя, найдем, что ф2 2 ь 2-^- - со cos (p = h , где h - константа интегрирования. Полагая угловую амплитуду маятника равной а , имеем, что при ср- а, ср = 0 . Выражаем, согласно (15.2), константу интегрирования через а и (15.2) записываем в виде: Ф 2 2 ----со cos (р = -со cos а 2 (15.2) или ф = co-y]2(cos(p-cosa). Из уравнения (15.3) следует, что , —=d. a>p(cos <р - cos а ) (15.3) (15.4)
120 75 Часы Галилея - Гюйгенса Пусть период колебания маятника при амплитуде а равен Т. Тогда при изменении угла отклонения маятника от нуля до а пройдет четверть периода и, согласно (15.4), найдем, что r_j 4 - со 2 (cos (р - cos а) Этот интеграл не вычисляется в элементарных функциях. Он может быть найден численно. При малых а, что нас устраивает, можно найти его разложение в ряд по параметру а. Если ограничиться точностью до а , то это представление находится следующим образом: а а ----1--- 2 24 [2(сО5 (р - cos cz)] 2 24 -1'2 2 и поэтому 2 2 (р +а 12 24 2 2 2 , ^2 или после подстановки ср = a sin# a2(l + sin2 6) 24 (15-5) Рис Л 5.2. График зависимости пе- риода колебаний Т маятника от его амплитуды О точности этой формулы можно судить по графику рис. 15.2 , где сплошной кривой изображена численно определенная величина, стоящая в скобках правой части формулы (15.5), т.е. оТ / 2л, и пунктиром гра- фик первых двух членов этой скобки, т.е. 1+а2/16. Из них видно, что при а< л/4 эти графики на рисунке неразличимы. Из самой формулы (15.5) видно, что при малых амплитудах а изме- нений периода колебаний маятника невелико. Так, при а <0,1 измене- ние периода не более, чем 0,7 % . А изменение периода Т при измене- нии амплитуды а на Д а таково, что
15 Часы Галилея - Гюйгенса 121 dT аДа ~Т~~ 8 При а= 0,1 и требуемой точности dT/ 7’= 10 5 Да не должно пре- восходить 4x1 О'4, т.е. требуется большая стабильность амплитуды. В связи с этим в свое время задумывались, нельзя ли сделать маятник, у которого период колебаний не зависел бы от амплитуды. Такой маятник был придуман. Его идея состояла в том, чтобы маятник качался не по ок- ружности, а по какой-нибудь другой кривой, чего можно достичь, как это показано на рис. 15.3 , где 77- гибкая пластинка, а 77- ограничивающие ее движение направляющие. При этом линия L , направленная вдоль подвеса маятника, все время касается направляющей 77. Рис.15.3. Ограничивающее пре- пятствие Н, позволяющее изме- нить траекторию колебаний ма- ятника Рис. 15.4. Иллюстрация к поиску кри- вой, по которой должен качаться ма- ятник, чтобы его период колебаний не зависел от амплитуды Пусть искомая кривая, по которой должен качаться маятник (матери- альная точка массы т ), имеет уравнение x = x(s), у = y(s), (15.6) где 5 - длина дуги, отсчитываемая от нижней точки кривой (рис. 15.4). Составим уравнения движения массы т. Находим функцию Лагранжа Откуда ms + mgy'(s) = 0. (15.7) Решение этого уравнения будет периодическим с периодом, не зави- сящим от начальных условий, а, следовательно, и амплитуды, если оно совпадает с уравнением линейного гармонического осциллятора, т.е. ко- гда gy'(s) = co2s при произвольном со. Решая это уравнение, находим, что со2 2 у------S , 2g (15.8) (15.9)
122 15. Часы Галилея - Гюйгенса где произвольная постоянная отсутствует, так как, согласно рис. 15.3, при s = О у = 0 . Осталось найти функцию x(s). Это легко сделать, исходя из соотноше- ния или dx2 +dy2 = ds2 Из (15.9) и (15.10) находим, что dx ds (15.10) (15.11) или Используя замену 5 = a1 sin ф, вычисляем интеграл (15.12) и, учитывая (15.9), приходим к параметрическим уравнениям искомой кривой: х = —^-г-ф + —^r-sin2^, ^ = -^sin2^. (15.13) 2а> 4й? cd Это хорошо известная циклоида, ее вид показан на рис. 15.5. Она отли- чается от окружности тем, что поднимается вверх от точки х = у = 0 все быстрее и быстрее, чем окружность, тем самым ускоряется скатывание по ней маятника при увеличении его отклонения. Это отличие, естест- венно, при малых ф невелико, как невелико и отличие уравнения коле- баний кругового маятника от уравнения линейного гармонического ос- циллятора, т.е. как отличие sin ф от ф. Рис. 15.5. Сопоставление траек- торий движения кругового и цик- лоидального маятника (пунктир- ная кривая) Мы рассмотрели зависимость периода колебаний маятника от его ам- плитуды колебаний, оценили влияние изменения амплитуды на точность хода часов и обнаружили, что от этой зависимости и возможной причины уменьшения точности хода часов можно избавиться, если круговой маят- ник заменить циклоидным. Однако изменение амплитуды далеко не единственная причина, от которой зависит точность хода часов. У маят- ника может меняться длина, при значительных перемещениях часов мо- жет меняться ускорение силы тяжести. Мы никак не учли наличие тре-
15. Часы Галилея - Гюйгенса 123 ния, вязкого и сухого. Нестабильность периода может внести и механизм подталкивания маятника, поддерживающий его колебания. Таким образом, нестабильность и потеря точности хода часов могут возникнуть от многих причин, и, если мы хотим создать точные часы, то нам надлежит изучить все эти факторы нестабильности, оценить их ве- личину и найти пути устранения. Все эти факторы нестабильности в силу их малости можно изучить раздельно, независимо друг от друга, учитывая не все вместе, а каждое отдельно. Это значительное упрощение можно обосновать следующим образом. Период колебаний Т является функцией многих параметров ча- сового механизма и /, .... ит, так что Т = Т(и1,и1,...,ит). Пусть «/* « г wM - номинальные значения параметров, а их воз- можные изменения - 8 и i, 8 и 2, .... 8 и т . Тогда с точностью до этих ма- лых изменений дТ ди. 8их + дТ ди, 8и, +.. + r 8Т . Sw... где производные от функции Т вычисляются при номинальных значе- дТ ниях параметров, т.е. производная - вычисляется в предположении отсутствия зависимости от остальных параметров U]\ и 2*,...,ит*> кроме Ws*. В силу этого с принимаемой точностью зависимость от длины, вязкого трения и ускорения силы тяжести можно вычислить исходя из упрощен- ной модели колебаний маятника, не учитывающей зависимость его пе- риода от амплитуды, т.е. из уравнения линейного осциллятора а>2 ф + 28ф + а>2(р = 0 , (15.14) период колебаний которого равен 2 л Т = ja)2-8 Ради простоты примем, что основная масса маятника сосредоточена в одном месте. Тогда J=ml2 и (15.15) принимает вид: 1 IS1 'l -----+ ... , 2 g J ? = 2л- (15 16) = 2л J--82 NI из которого находим оценку dT 1 dl 1 dg 18 dS У ~2 / 2 g + g Эти оценки указывают на сильную зависимость точности хода от из- менений длины и силы тяжести, а также от вязкого трения, если оно не очень мало.
124 15 Часы Галилея - Гюйгенса Длина маятника меняется в основном под влиянием изменения темпе- ратуры. Поэтому этот факт потери точности хода часов можно устрани^ поддерживая окружающую температуру постоянной. Но есть и друга способ поддержания постоянства I, несмотря на изменение температу- ры. Он состоит в особой конструкции маятника, показанной на рис. 15.6 При увеличении температуры длины /1 и 12 увеличиваются на 811 в 8 /2 , а длина маятника увеличивается при этом на 8 Ц-812 . Стержни длин 11 и / 2 изготовлены из разных материалов с коэффициентами те плового расширения ai и а2 , подобранными так, чтобы величина уд- линения, равная 81= 81х-812=(ах1х -а212)8Т, где 8 Т - изменение температуры, равнялось нулю, то есть так, чтобы а 111 - а212 = О- С зависимостью от ускорения силы тяжести, если часы значительно меняют свое местонахождение, например, находясь на корабле, вроде бы ничего сделать нельзя. Можно лишь скомпенсировать ее соответствую- щими вычислительными поправками или заменить маятник часов балан- сиром на пружинке, что спустя некоторое время и было сделано: часы Гюйгенса сменил корабельный хронометр. Оценим еще влияние сухого трения. Для этого, согласно сказанному можно ограничиться рассмотрением модели ф + о2(р = -fsigrup , (15.1?) где /- параметр, отражающий наличие сухого кулоновского трения. Как мы сейчас увидим, сухое трение приводит к затуханиям колебаний, но их период не меняется. Действительно, на каждом полупериоде колебаний ф не меняет знака и поэтому, например, при ф > 0 (15.17) записывается в виде ф + со2(р = -/ или, после замены ср на (р -f /со1, в виде ф + со2(р = 0, где зависимость от трения f исчезла, т.е. ее нет. Перейдем к рассмотрению механизма поддержания колебаний маят- ника и его влияния на стабильность хода часов. Часовые ходы весьма различны по конструкции (цилиндрический ход, анкерный, хронометровый и др.), и их точное описание довольно сложно. Примем идеализированную схему часового хода, считая, что он осуще- ствляет подталкивание при угле ср — а (ср > 0), сообщая маятнику им- пульс р, а вне этого подталкивающего импульса движение маятника под- чиняется уравнению ф + 25$? + о2(р = 0. (15.18) Толчок происходит при ср — а и ф > 0, ив результате его скорость ф мгновенно возрастает на величину р . Так, что
15 Часы Галилея - Гюйгенса 125 0+=0_+р, (15.19) где (р - доударная угловая скорость, а ф + — послеударная. Угол ср при этом измениться не успевает. Нарисуем фазовую траекторию, отве- чающую одному колебанию от точки (р= а снова к <р = а . Пусть на- чальная точка Мо , а М\ - точка повторного значения (р= а при усло- вии, что движение происходит в соответствии с дифференциальным уравнением (15.18). В момент прихода в точку М\ происходит передача импульса р и точка Mi перемещается вверх вдоль оси ф на расстоя- ние/? (рис. 15.7) в точку Мг Рис. 15.7. Фазовая траектория часов и способ ее изучения путем сведения к точечному отображе- нию точки Мо в точку М2 Рис. 15.6. Схема устройства под- веса маятника, делающего его дли- ну не зависящей от температуры После этого весь описанный цикл повторяется (за исключением слу- чая, когда выходящая из точки М2 фазовая траектория больше не пере- секает линии ср- а). Найдем аналитические зависимости описанного движения от фазовой точки Мо к М\ и затем М2 Пусть точки М0,М i и М2 имеют коорди- наты ^>о = <2И = ф 1, (р2 = а и ф2 • Точки Мо и М\ связа- ны, согласно (13.7), зависимостями: <Р\ = е* Фа +д(Ра ) (pa cosQr + —---------sin Cl т , ° Q J (15.20) ip^e~T (• I £ ' (pa cos£lt+^--^-sinClr -Q^?o smCM + (^0+ 8(p^)cos£M , Q ) со2 - 82 . Для то- (15.21) где т - время движения от точки Мо до М а чек Mi и М2, согласно (15.19), <Р1 = 02 = Ф1 +Р- При этом следует еще иметь в виду, что ^0 = <Р\ =<Р1 = а- (15.22) Из (15.20), (3.21) и (15.22), вводя обозначения фо = и и , на- ходим, что
126 15. Часы Галилея - Гюйгенса а = е St „ и + 8а . ] acosLlT +------sinLlT , (15.23 и = р + е 5т и + 8а -С12а и cos Qт ч-----------sin lit . Q J Первое соотношение (15.23) определяет время т в зависимости от «, а второе позволяет найти й. Анализ этих уравнений достаточно сложен, но при а = 0 он сущест-| венно упрощается, так как в этом случае формулы (15.23) принимаю!) вид: sinQr = 0 (и э*0), и = е 5rwcosQr + р, из которого следует, что т=2яг/бУ (взят второй по величине положи- тельный корень первого уравнения, так как для первого корня соответст- вующее ф 1 < 0 , это же следует из рис. 15.7 ) и что й = е-2^/пм + р. (15.24) Прежде чем проанализировать этот необычайно простой результат покажем, что именно он в первую очередь достоин внимания. Дело 1 том, что именно при а = 0 исчезает зависимость периода колебаний от скорости и. Он постоянен и равен 2л/со. Напротив, при а*0 така зависимость есть и следует из уравнений (15.23). Действительно, диффе ренцируя по и первое уравнение (15.23), находим, что dr ( и + 8а . _ — acosLlT +--------sinLlT + du v Q ) „ . „ dt 1 . z c ъ dr -aLlsinLlT— + —sin lIt+ (u +8a) coslIt— . du Q du О = -e~Sx -8т Откуда dr du [а-и- 8a)cos&T + sinClr u + 8a _ ------+ sin LIT J и, следовательно, dr/du не обращается в нуль, поскольку т отлично от 2л I Этот же факт можно обнаружить и непосредственно из вида фазов траектории рис. 15.7 . Причем, из него видно, что т> 2л/а>, так как нем а> 0 . Напротив, при а< 0 видно, что т< 2л/со . Сказанное с новится очевидным, если заметить, что любой луч ф = сир, любая фа вая траектория повторно пересекает через одно и то же время 2л/со. Вернемся к найденному ранее соотношению (15.24), определяюще связь между последовательными угловыми скоростями, с которыми i еле подталкивания маятник проходит через вертикальное равновесь положение. Этому соотношению, связи между и и й, можно прид< очень простую, полезную во многих случаях геометрическую интерп] тацию. Возьмем прямоугольную систему координат, откладывая на
15. Часы Галилея - Гюйгенса 127 осях и и й, и построим в ней график зависимости (15.24) (рис. 15.8). До- полним его биссектрисой и найдем по и й и затем перенесем его снова на ось w, как показано на том же рис. 15.8. Повторяя это построение, най- дем последовательно и , й и т.д. Из него видно, что последовательные точки и, й, w , ... стремятся к точке и , отвечающей пересечению кри- вой (15.24) с биссектрисой. Само же значение и переходит в себя, по- скольку й * = и , и следовательно, согласно (15.24), w* = е и* + р и «*=. -1-0- (15.25) 1 — е Рис. 15.8. Диаграмма Ламерея для часов Галилея-Гюйгенса: и*- устойчивая непод- вижная точка, соответствующая авто- колебаниям часов; и, й, и, ... — последо- вательные приближения к точке и* Таким образом, при подталкивающих ударах, сообщающих маятнику постоянный импульс при прохождении им состояния равновесия, его ко- лебания асимптотически приближаются к периодическим с периодом 2л со и амплитудой по скорости, равной и . Тем самым затухающие ко- лебания маятника превращаются в автоколебания. Достигается это с по- мощью механизма - часового хода, осуществляющего обратную связь, полнее - управления движением маятника с помощью обратной связи. Общая идея управления и обратной связи имеют в науке и технике ог- ромное значение. Мы еще не раз с ней столкнемся, а сейчас ограничимся объяснением, в чем же состоит управление и почему оно реализуется с помощью обратной связи. Управление потому, что мы действуем на маятник импульсами, имеющими сторонний источник энергии. Эти импульсы сообщаются ма- ятнику тогда, когда он проходит через свое состояние равновесия, т е. влияние на маятник осуществляется в зависимости от движения самого маятника. Маятник как бы действует сам на себя, осуществляя обратную связь и используя при этом стороннюю энергию пружинного завода ча- сов или опускающегося груза. В результате этого не толчки определяют движение маятника, а сам маятник поддерживает свои колебания, управ- ляя толчками, и часы Гюйгенса оказываются автоколебательной авто- номной (не зависящей явно от времени) динамической системой. Вообще управление используется человеком и существует в природе для реализации каких-то целей. Во многих случаях оно реализуется как корректировка того, что происходит с объектом управления, т.е. с помо-
128 75. Часы Галилея - Гюйгенса щью обратной связи и некоторого необходимого ей источника энергии Но возможны и случаи, когда управление осуществляет намеченный за- ранее план или подчиняется каким-то командам извне. В чем же секрет точности часов Гюйгенса? Ведь и до него были часы, использующие часовой ход, колеблющий балансир. Но Гюйгенс придал балансиру собственную частоту колебаний и этим колоссально увеличил точность хода часов. При этом частоту колебаний маятника уже опреде- ляли не толчки «туда-обратно» часового хода, а собственная частота его колебаний. Маятник - конкретный частный вид осциллятора с собственной часто- той - стал определяющим фактором отсчета времени, и стабильность его собственных колебаний определяла точность часов. А стабильность ко- лебаний осциллятора может быть очень высокой, и тем большей, чем не- значительней подталкивающие его импульсы, т.е. чем меньше его зату- хание, и поэтому еще более точные часы - это часы, в которых вместо маятника используется упруго колеблющаяся кварцевая пластинка или, наконец, молекулы и атомы. Молекулярные и атомные часы уже на- столько точны, что позволяют регистрировать неравномерность враще- ния Земли. В заключение несколько слов о соотношении (15.24) с диаграммой рис. 15.8 . Способ, с помощью которого мы пришли к соотношению (15 24), но- сит общий характер. Его придумал А.Пуанкаре, и он широко использует- ся в теории колебаний и теории динамических систем. В общей форму- лировке он состоит в сведении описания и исследования движений ди- намической системы к составлению и исследованию точечного отобра- жения. С этой общей точки зрения соотношение (15.24) - это точечное отображение прямой в себя, преобразующее любую ее точку с координа- той и в другую точку с координатой и . Именно это точечное отобра- жение строится изложенным выше способом на рис. 15.8. Диаграмма рис. 15.8 впервые использовалась Ламереем, а точечное отображение прямой в прямую исследовалось Кенигсом. В связи с этим диаграмма рис. 15.8 получила наименование диаграммы Кенигса-Ламерея. Это на- звание ей дал А.А.Андронов, который усовершенствовал и широко ис- пользовал ее для решения ряда актуальных задач теории колебаний и ав- томатического регулирования. Вот, пожалуй, для первого знакомства с методом Пуанкаре и точеч- ными отображениями и все. Дальнейшее вы сможете узнать из соответ- ствующих курсов теории управления и теории динамических систем.
129 16 ГЕНЕРАТОР ЭЛЕКТРИЧЕСКИХ КОЛЕБАНИЙ Электрическим аналогом маятника является колебательный контур, составленный из емкости и самоиндукции. Так же, как в часах Галилея - Гюйгенса, колебания маятника поддерживаются подталкиваниями часо- вого механизма, можно поддерживать колебания электрического контура с помощью специальных устройств - электронной лампы или полупро- водникового триода. Эти устройства должны осуществлять подкачку энергии для того, чтобы компенсировать ее рассеяние на неизбежном омическом сопротивлении. Подталкивающее воздействие на маятник ча- сов должно согласовываться с его фазой и в этом смысле имеет управ- ляемый характер. Аналогично этому управляемый характер имеет и под- держка колебаний электрического контура - генератора электрических колебаний, осуществляемая электронной лампой или полупроводнико- вым триодом через взаимоиндукцию М. Электрическая схема одного из вариантов такой управляемой подкачки энергии изображена на рис. 16.1. Входящая в нее электронная лампа имеет катод, анод и управляющую сетку. Напряжением на сетке можно, практически не затрачивая энергии, менять сопротивление лампы от катода к аноду. Поэтому, если между катодом и сеткой приложить некоторое напряжение, то текущий от като- да к аноду ток 1а будет определяться напряжением на сетке Е . Эта зави- симость имеет вид, представленный на графике рис. 16.2 Со школы вы, наверное, помните, почему график зависимости Ia(Eg) имеет именно та- кой вид: раскаленный катод излучает электроны, и напряжение на сетке Eg) помещенной между катодом и анодом, помогает или препятствует их попаданию на анод, т.е. увеличивает или уменьшает анодный ток. Напишем математическую модель для электрической схемы рис. 16.1. Пусть 1а - анодный ток, Е - напряжение на сетке (относительно като- да), a q - заряд конденсатора. Пусть еще С, R и L соответственно, ем- кость конденсатора, величина сопротивления (резистора) и самоиндук- ция катушки, а М- ее коэффициент взаимоиндукции с катушкой в анод- ном контуре. Для колебательного контура, состоящего из самоиндукции L, емкости С, и сопротивления R, имеем:
130 16 Генератор электрических колебаний (16.1 i = q, е 4 s с L — + RI + — = M^~. dt С dt Для того, чтобы продвинуться дальше, необходимо конкретизировать вид зависимости Ia(Eg). Примем, что la=a + PEg-rEe\ (16.2 Рис. 16.2. Вид зависимости анодно- го тока от напряжения на сетке трехэлектроднои лампы При этом мы пренебрегаем самоиндукцией в анодном контуре и при- нимаем, что анодный ток определяется формулой (16.2), аппроксими- рующей зависимость рис. 16.2: Л?2 с3 L'q + Rq + — = M\ " С I с Или R М/3\. -------\Я L CL ЗЛ . 2 Q n ---ГЯЯ +-^- = o. £C3 CL (16.3) Это уравнение (16.3) приводится к виду широко известного уравнения Ван-дер-Поля u-2S(\-au )й + со и = 0, (164 где мр R (мр RX' Зг г 1 CL L (CL L) LC3 LC При этом предполагается, что <5> 0, а > 0 и со > 0 При а = 0 или очень малых и уравнение Ван-дер-Поля превращается в линейный ос- циллятор с отрицательным трением 8> 0. При и2 > 1/а коэффициент при и становится положительным и мы вправе предположить, что при этом колебания затухают. Таким образом, состояние равновесия осцил- лятора Ван-дер-Поля неустойчиво и малые колебания нарастают, а очень большие колебания затухают и, следовательно, между ними долж- но быть устойчивое периодическое движение Г (рис. 16.3). В этом правдоподобном утверждении можно непосредственно убе- диться, наблюдая на дисплее ЭВМ фазовый портрет уравнения (16.3). Аналитическое обоснование этого факта сравнительно просто при доста- точно малом 8, при этом мы не только аналитически обоснуем автоколе- бательность рассматриваемой нами системы при 8> 0 (т.е. при доста-
16. Генератор электрических колебаний 131 точно большом М), но и найдем приближенное значение амплитуды ав- токолебаний. Рис.16.3. Фазовый портрет уравнения Ван-дер-Поля Г- автоколебание - устойчивое периодическое движение Запишем уравнение Ван-дер-Поля (16.3) в виде: й-г со2 и ——eu й + 28и, (16.5) где величина £ = Л>0. ЛС1 как и 8, принимается малой. Это позволяет записать решение уравнения (16.5) в виде: и = A cos(cot + <р), (16.6) где в силу малости £ и 8 А и ср - медленно меняющиеся функции вре- мени. Возможность такого представления не вызывает особых сомнений, но вместе с тем требование его конкретного вида может вызвать затруд- нения Оно, прежде всего, связано с тем, что такое представление неод- нозначно. Но именно пользуясь этой неоднозначностью, можно к усло- вию 16.6) добавить еще одно, например, й = -со Asin(cot + ср), (16.7) после чего А и ср выражаются через ин й. Далее, можно непосредственно убедиться, что производные А и ср в силу уравнения (16.5) малы ввиду малости 8 и £. Рассмотрим, как меняется со временем энергия осциллятора, отве- чающего уравнению (16.5) при е = 8 = О Энергия такого осциллятора равна Е = -^(й2 + со2и2), а ее производная по времени при изменении величины w, согласно (16.5), имеет вид: (16.8) dE j 2'2' — = йй + соий = (28 — £и )й dt или, учитывая (16.6) и (16.7), — -128 -Е A2 cos (cot + <р)1А со sin2(cot л-ср) . Л/ L J (16.9) dt
132 16. Генератор электрических колебаний Интегрируя по периоду 2л/со полученное соотношение (16.9) при тех же предположениях А = ф = 0, найдем, что изменение энергии за это время ЕЕ = 2лёсоА2-^-А*. 2 С другой стороны, согласно (16.7) и (16.6), Е = со2 А 2. Поэтому т2 Л4 ДЕ = —ДЛ = 2лбсоА ' - лесо — 2 2 или Д4* —J4. (16.10) СО О) Обозначая последовательные значения амплитуды А, отстоящие друг от друга на промежутке времени 2п/со, через Ап и Ап + /, приходим, со- гласно (16.10), к связывающему их соотношению . 2 (1 4тГ<^ . 2 ЛГ .4 /14 11) = 1+— < Л > 06.ii) \ СО J СО которое уже известным нам образом может быть рассмотрено с помо- щью диаграммы Кенигса - Ламерея. Рис. 16.4. Диаграмма Ламерея в случае мягкого возбуждения автоколеба- ний с ростом параметра S: а) при S< 0, б) при S> 0 При 6=0 происхо- дит рождение из теряющего устойчивость равновесия устойчивой непод- вижной точки А*, соответствующей автоколебанию Из вида этих диаграмм при S< 0 п 6> 0 и постоянном £> О, пред- ставленных на рис. 16.4, следует, что при 6< О (16.4а) амплитуда А дви- жения уменьшается до нуля, т.е. состояние равновесия глобально устой- чиво. Напротив, в интересующем нас случае, когда 8> О (16.46), из вида соответствующей диаграммы следует неустойчивость равновесия и на- личие глобально устойчивого автоколебания (периодического движе- ния). Амплитуда этого периодического движения А * находится из усло- вия Ап + / = Ап и равна (16.12)
16 Генератор электрических колебаний 133 Период соответствующего автоколебания при сделанных предполо- жениях малости б и е приближенно равен Зл/о. Рис.16.5. Бифуркационная диаграмма мяг- кого возбуждения колебаний. С ростом па- раметра 6/е при переходе его через нуль равновесие теряет устойчивость и стано- вится неустойчивым. Одновременно с этим рождается автоколебание, амплитуда ко- торого растет с последующим возраста- нием величины 6/е Построим еще для наглядности бифуркационную диаграмму равнове- сия и возникающего из него при смене знака б автоколебания. Она пред- ставлена на рис. 16.5. По ее оси абсцисс отложена величина б Точки оси абсцисс отвечают состояниям равновесия, устойчивым при б < 0 и неус- тойчивым при б> 0. Потеря устойчивости происходит при б = 0 и вместе с этим при возрастании б возникает автоколебание, амплитуда которого растет от нуля, т.е. оно как бы рождается из сменяющего устойчивость равновесия. Все сделанные выводы мы получили из приближенного вида точечно- го отображения (16.11), как бы считая его точным. Не может ли это при- вести к ошибке? Вообще это возможно, но только при достаточно боль- ших (р или А. При малых ф и А точечные отображения рис. 16.4 меня- ются мало и общие выводы остаются прежними. Они остаются прежни- ми при достаточной малости ф и А, т.е. параметров б и е. А вот измене- ние вида анодно - сеточной характеристики 1а = Ia(Eg) может повлечь значительные изменения. Мы их рассмотрим, так как это позволяет об- наружить разные пути возникновения автоколебаний при потере устой- чивости состоянием равновесия и обнаружить и дать математические описания явлениям мягкого и жесткого возбуждения автоколебаний и т.н, явления гистерезиса. Мягкое возбуждение колебаний - плавное от нуля возникновение ав- токолебаний из теряющего устойчивость состояния равновесия в силу изменения параметров системы - это то, которое описано выше. Мягкое - потому, что оно возникает плавно от нуля. Подчеркнем, возникает в результате изменения параметров системы. При обратном изменении параметров вся картина возникновения ав- токолебаний повторяется в обратном порядке. Адекватной математиче- ской моделью мягкого возбуждения являются последовательности фазо- вых портретов или точечных отображений, отвечающих бифуркацион- ной диаграмме рис. 16.5. Эта последовательность точечных отображений и фазовых портретов воспроизведена на серии из трех рисунков 16.6. Первый рисунок отвеча- ет устойчивости равновесия. Второй - непосредственно после возник-
134 16. Ггнератор электрических колебаний новения неустойчивости. Третий - при дальнейшем изменении пар метра, приводящего к росту амплитуды (размаха) автоколебаний. Рис. 16.6. Последовательные виды диаграмм Ламерея и соответст- вующих фазовых портретов при мягком возбуждении автоколебаний с ростом 8/я Такое мягкое возбуждение колебаний в результате изменения пара- метров наблюдается в реальных системах, но наряду с этим можно на- блюдать и совсем другой вариант возникновения автоколебаний, он на- зван жестким. При жестком режиме возбуждения колебаний все не так: автоколебания возникают скачком, приобретая сразу конечное и, воз- можно, большое значение. При обратном изменении картина не повторя- ется в обратном порядке: она другая.
135 МЯГКИЙ И ЖЕСТКИЙ РЕЖИМЫ ВОЗБУЖДЕНИЯ АВТОКОЛЕБАНИЙ На сыгравшем историческую роль в начале нашего века примере лам- пового генератора электрических колебаний и описывающего его дина- мику дифференциального уравнения Ван-дер-Поля мы познакомились с явлением мягкого возбуждения автоколебаний. Это явление носит общий характер и сопряжено с бифуркацией рождения в фазовом пространстве из теряющего устойчивость состояния равновесия устойчивого периоди- ческого движения - автоколебания. Впервые эта бифуркация динамиче- ской системы была рассмотрена А.А.Андроновым и носит его имя. На соответствующем рисунке были приведены последовательные стадии - кадры киноленты - мягкого возбуждения автоколебаний в двумерном фазовом пространстве. Эти кадры являются геометризованной математи- ческой моделью этого явления, а уравнение Ван-дер-Поля можно счи- тать простейшей конкретной его аналитической моделью. Но возбуждение автоколебаний при изменении параметров может но- сить не только мягкий, но и так называемый, жесткий характер. Его можно наблюдать на том же ламповом генераторе с другого вида анод- ной характеристикой Ia = Ia(Eg), например, при 4= /3Eg+rEe3+^Ees, (17.1) в котором отсутствие четных степеней несущественно, так как они никак себя не проявляют при нашем приближенном методе исследования. Нам надлежит повторить предшествующие выкладки для этого более общего случая, когда в характеристику (17.1) добавлен еще один член, и мы придем к точечному отображению вида: ^,=(l+—к2+М„4+МЛ (17-2) k ф J первые два члена которого совпадают с тем, что было раньше, а третий член новый. Коэффициенты Е/ и 82 пропорциональны у и ц и, как и 8, по предположению, малы. Кроме того, описание анодной характеристики полиномом (17.1) приемлемо только в некоторой конечной области из- менения Eg, что влечет ограниченность амплитуды Ап в (17.2). Нам надлежит рассмотреть точечное отображение (17.2) с учетом описанных ограничений. Если различать все возможные случаи по зна- кам параметров 8, Et и е2 , то это приводит к восьми различным вариан- там, для каждого из которых на рис. 17.1 изображены соответствующие графики точечного отображения — диаграммы Кенигса-Ламерея. Они разбиты на четыре пары а, б, в и г , каждая из которых отвечает 8 < О и 8> 0 при одинаковых 8} и е2 .
136 17, Мягкий и жесткий режимы возбуждения автоколебании Рис.17.1. Возможные виды диаграммы Ламерея при полиномиальной харак теристике лампы (17.1) в соответствии с видом точечного отображения (17.2) Случай г) соответствует уже известному нам мягкому возбуждению колебаний при непрерывном переходе от 8< 0 к 8> 0,а случай в - интересующему нас новому жесткому возбуждению. Случаи а) и скорее умозрительного характера, так как не отвечают реальному виду характеристики электронной лампы. Сосредоточим внимание на случае в), изобразив его подробнее в ваде пяти последовательных графиков точечного отображения (17.2) для возрастающих значений величины Из этих графиков видно, что сначала имеет'место устойчивое состоя- ние равновесия О, затем появляется полуустойчивое периодическое дви-
17. Мягкий и жесткий режимы возбуждения автоколебаний 137 жение М12 (точнее, полуустойчивое периодическое движение, отвечаю- щее неподвижной точке М12), затем распадающееся на устойчивое М2 и неустойчивое Mt периодические движения. При дальнейшем возраста- нии § амплитуда неустойчивого периодического движения Mt уменьша- ется, а устойчивого М2 - увеличивается, в результате чего М] сливается с состоянием равновесия О , которое из устойчивого становится неус- тойчивым. Рис. 17.2. Последовательность диаграмм Ламерея жесткого возбуждения колебаний: сначала равновесие О глобально устойчиво, затем рождается по- хуустойчивая неподвижная точка М]2, которая распадается на две Mt и М2, затем точка Mj сливается с равновесием О и делает его неустойчивым, в ре- зультате чего глобально устойчивой оказывается неподвижная точка М2 Фазовые портреты, отвечающие этим превращениям, представлены на рис. 17.3 . Найдем, основываясь на этих рисунках, бифуркационную диа- грамму. Она изображена на рис. 17.4. Как видно, она отличается от би- фуркационной диаграммы, имеющей место в случае мягкого возбужде- ния (рис. 16.5 ). Что же следует из этого различия? Прежде всего, если раньше при переходе б через нуль, возрастая, состояние равновесия те- ряло устойчивость, отрождая от себя устойчивое периодическое движе- ние, то теперь при потере устойчивости с ним сливается неустойчивое периодическое движение и система, находясь ранее в устойчивом равно- весии, покидает его и переходит сразу к периодическому движению ко- нечной амплитуды М2 . Это и есть жесткий режим возбуждения колеба- ний, когда сразу скачком возникают автоколебания конечной амплитуды. Конечно, они устанавливаются не сразу, для этого нужно некоторое вре- мя и размах колебаний растет непрерывно, а скачок с изменением пара- метра имеет место для установившегося движения Таким образом, первое отличие жесткого режима возникновения авто- колебаний как физического явления состоит не в плавном, а скачкооб- разном изменении характера движения с изменением параметра. В мате- матическом описании это различие отражается в том, что из состояния равновесия не рождается устойчивое периодическое движение, а с ним
17. Мягкий и жесткий режимы возбуждения автоколебании 138 сливается неустойчивое периодическое движение и точки, близкие к ставшему неустойчивым состоянию равновесия, устремляются к уже и ранее существующему устойчивому периодическому движению. Рис.17.3. Изменения фазового портрета, отвечающие изменениям диа- граммы Ламерея рис. 17.2 Второе существенное отличие относится к необратимому характеру жесткого перехода от равновесия к установившемуся движению: при пе- реходе возрастания через значение ё = 0 жестко возникают автоколеба- ния, но при обратном уменьшении ё через нуль автоколебания не исче- зают, они сохраняются, непрерывно меняя амплитуду. Для того, чтобы от возникающих жестко автоколебаний перейти к устойчивому состоянию равновесия, нужно уменьшить параметр до некоторого отрицательногс значения ё= ё* (рис. 17.4), после чего автоколебания скачком исчезаю] и происходит переход к устойчивому равновесию. Исчезновение устой- чивого автоколебания сопровождается его слиянием с неустойчивым пе- риодическим движением и их совместным исчезновением (при ё = $ устойчивое периодическое движение М2 сливается с неустойчивым М и при ё < ё* исчезают). Таким образом, возникновение и исчезновени автоколебаний при жестком их возбуждении имеет место при разни значениях параметра ё, как это показано на рис. 17.4. Это явление по добно гистерезису ферромагнитных тел.
17. Мягкий и жесткий режимы возбуждения автоколебаний 139 Рис. 17.4. Бифуркационная диа- грамма жесткого возбуждения ко- лебаний. Кружочки и крестики - со- ответственно, устойчивые и неус- тойчивые равновесия и периодиче- ские колебания Закончим повествование о мягком и жестком возбуждениях автоколе- баний мыслимым экспериментом. Пусть перед вами ручка, вращая кото- рую вы можете увеличивать и уменьшать параметр динамической систе- мы, наблюдая одновременно на дисплее ЭВМ изменение состояния сис- темы(одну из его компонент). Тогда при мягком режиме при медленном вращении ручки сначала не будет колебаний, затем они возникнут и их амплитуда будет медленно нарастать, тем медленнее, чем медленнее вы вращаете ручку (рис. 17.5). При обратном движении все виденное вами повторится в обратном порядке. При жестком возбуждении вначале также не будет колебаний, но за- тем они возникнут сразу, причем, быстрота этого перехода не уменьша- ется с замедлением вращения ручки (рис. 17.6). При обратном изменении картина не будет меняться в обратном порядке. Исчезновение автоколе- баний, и притом, тоже скачком, произойдет при более длительном вра- щении ручки в обратную сторону. Рис. 17.5. Осциллограммы мягкого и жесткого возбуждения колеба- ний при плавном изменении пара- метра
140 СТОХАСТИЧЕСКИЙ ОСЦИЛЛЯТОР («ЧАСЫ НАОБОРОТ») В предыдущих лекциях мы рассмотрели часы Галилея-Гюйгенса. Ос- новой этих часов является маятник или любой другой осциллятор, коле- бания которого под держиваются за счет какого-нибудь источника энер- гии и период которых достаточно стабилен. Стабильность периода коле- баний - это точность часов. Мы изучили возможные причины неста- бильности и пути ее уменьшения. Очень важным моментом стабильности была малость затухания, это одновременно и малая зависимость от нега периода, и достаточность очень малых толчков, и малая, вызываема^ толчками, нестабильность. Однако осциллятор может быть как высокоточный измеритель време- ни с весьма стабильным периодом, так и обладать беспорядочными зна- чительно меняющимися временами колебаний, настолько разными, что говорить о периоде колебаний становится бессмысленным. Более тощ эти колебания приобретают свойства случайности, становятся непредска- зуемыми и допускают вероятностное описание. Эта удивительная воз- можность стала научной сенсацией недавних лет. Она изменила обще- принятые представления о случайности. Оказалось, что случайность мо- жет порождаться динамической системой, описываемой дифференциаль- ными уравнениями. И это несмотря на то, что остается верной теорема о единственности решения, о единственности его определения начальными условиями (начальным состоянием). Как это может быть? Представляет- ся очевидным, что это совершенно невозможно, и все-таки это может быть и реализуется вокруг нас не менее часто, чем детерминированные процессы, описываемые дифференциальными уравнениями. Оказывает- ся, что реальные решения дифференциальных уравнений могут быть де- терминированными и предсказуемыми, а могут быть и случайными не- предсказуемыми. Целью дальнейшего рассказа является объяснение того, как это может быть, на очень простом примере стохастического осциллятора или «ча- сов наоборот». Часы - это затухающий осциллятор, время от времени подталкивае- мый. «Часы наоборот» - это самораскачивающийся осциллятор, колеба- ния которого время от времени одерживаются. Математическая модель часов имела вид: х + 28х + а)2х = 0 для х 0 или х = 0 и х < 0, (18.1) х+ =х_ + р для х = 0 и х > 0. Математическая модель «часов наоборот» (р < а )
18. Стохастический осциллятор («часы наоборот») 141 х + 28х + со2х = 0 для х^О или х = 0 и х<а, (18 2) х+ = х_ - р для х = 0 и х > а . Уравнения (18.2) получаются из (18 1) заменой -5на 8ир на -р Кроме Нам надлежит исследовать модель (18.2). Прежде всего представим себе вид ее фазовой траектории (рис. 18 1). Затем сведем исследование динамики модели (18.2) к точечному отображению, к диаграмме Кениг- са-Ламерея. Для этого рассмотрим последовательные уходы фазовой точки с полуоси х = 0, х > 0. Рис.18.2. Различные возможные виды фазовых траекторий часов «наобо- рот»: при ui точкиМ] меньшем а и, напротив, при щ > а. За цикл колеба- ния точкаМ с координатой и переходит в точку с координатой и, причем при Ui> а этот переход совершается со скачком от Ui до и Пусть после первого пересечения х = и, а после второго х = w . Най- дем связь между и и й Пусть траектория выходит из точки М(0, и) Она приходит вновь на луч х = О, и > Ов некоторой точке Mi(0, ui), где u.=ue2tcS,Q
142 18. Стохастический осциллятор («часы наоборот») и не одерживается, если м/ < а ( рис. 18.2а ), и тогда й = и/, либо одержи- вается, если ui >а, и тогда й = и^-р (рис. 18.26 ). Итак, имеем: f qu для u<a/q w=] , (IM \qu - р для u>a/q где для сокращения записи введено обозначение q = ехр(2л8/С2) > 1. Нарисуем для полученного точечного отображения (18.3) диаграмму Кенигса-Ламерея. Для этого построим график зависимости (рис. 18.3) и проведем биссектрису. Изучение одной из них, несмотря на ее простоту достаточно сложно. Но она стоит того, чтобы потрудиться. Даже потру- дившись, мы далеко не все сможем обосновать, кое-что придется при- Рис. 18.3. Возможные виды диаграммы Ламерея для часов «наоборот» Получаемые таким образом диаграммы точечного отображения могут иметь три различных вида. Они показаны на рис. 18.3 а, б и в. Первый случай: точки А и В обе лежат выше биссектрисы. При этом а-р> а / q или р / а < 1 - 1 / q. Второй случай: точка В лежит ниже бис- сектрисы, а точка С выше точки А. При этом а-р < а / q и а < р / (q—1) или р /а> 1-1 /q пр /а> q-1. Третий случай: точка В лежит ниже бис- сектрисы и точка С ниже точки А. При этом а- р < a/qna>p/(q-[ или р / а > 1-1 /qnp/a<q - 1. Как видно, то, какой из случаев имеет место, зависит от величин q и р / а. При этом q> 1, 0 <р / а <1. Каждому из перечисленных случаев на плоскости величин q ир/а от- вечает своя область. Эти области, соответственно, за номерами 1, 2 и показаны на рис. 18.4. Рис. 18.4. Параметрический портрет, соответствующий изображенным на рисунке 18.3 различным видам диа- граммы Ламерея В случаях 1 и 3 почти все последовательные преобразования уходят в бесконечность. Это соответствует неограниченному раскачиванию ос- циллятора. В случае 2 в зависимости от начального значения величины и возможно два разных поведения. При и < р / (q - 1) последовательные
18. Стохастический осциллятор («часы наоборот») 143 преобразования и все время ограничены. Напротив, при и > р / (q - 1) они неограниченно возрастают. Наибольший интерес для нас представляет случай 2, когда значения преобразований все время ограничены. Для любого начального ио е(0, р/ (q-1)) последовательные преобразования ult и2,... с некоторо- го номера попадают на отрезок \а-р, а] и на нем остаются. Любая такая фазовая траектория и0, ui, и2,... неустойчива и близкие к ней траектории разбегаются. Они в силу наличия у отображения (18.3) разрыва могут сблизиться, но потом снова разбегаются и т.д. Проследим, как это происходит, сопоставляя две траектории ио, ui,... и vi vi,... с близкими начальными точками ио и vo . Если между точками ио и v не лежит точка разрыва а / q отображения (18.3), то, согласно (18.3), -Vj =q(u0 -v0) (18.4) и следовательно, расстояние между ними увеличивается в q > 1 раз. Ес- ли же между точками ио и vo лежит точка разрыва а/q отображения (18.3), то -~vi = ?(wo -*о) ±Р- (18-5) Такая же альтернатива имеет место и на всех последующих преобра- зованиях. Поэтому в любом случае после некоторого числа преобразова- ний, сколь бы близки не были начальные точки, они расходятся на ко- нечное расстояние, не меньшее, чем р / 2q. Причем, это заведомо проис- ходит за число шагов, не более, чем п, для которого (18-6) 2? Поэтому, сколь бы точно, но все же с некоторой погрешностью, мы не вычисляли последовательные преобразования отображения (18.3), их ошибки после некоторого их числа превзойдут величину р / 2q. Исклю- чение составляет лишь случай абсолютно точного вычисления, который вообще не реализуем. А так как эти малые ошибки, как и малые возму- щения, при физической реализации непредсказуемы и не поддаются уче- ту, то фактически мы сталкиваемся с непредсказуемостью фазовой тра- ектории движения «часов наоборот». Движения «часов наоборот» не- предсказуемы, и эта непредсказуемость явно проявляется очень быстро. Действительно, неравенства (18.6) при q = 1,76, р = 4 и очень маленькой ошибке в начальных значениях порядка 10' выполняются для п >32. Для ошибки порядка размеров атома оно выполняется при п > 48. Движение «часов наоборот» непредсказуемо еще и потому, что мы не можем задать или знать их начальные условия абсолютно точно. Любая же погрешность в начальном значении через некоторое время ведет к большим различиям, ведет к непредсказуемости. Идея о том, что случайность может порождаться исчезающе малыми не известными нам неопределенностями с последующим их экспоненци- альным усилением из-за неустойчивости, высказывалась еще А. Пуанка- ре и позднее в более развернутом виде Н.С.Крыловым и М.Борном. При- менительно к долгосрочному прогнозу погоды эффект необычайно чув-
144 18. Стохастический осциллятор («часы наоборот») ствительной зависимости от малых возмущений отмечался Э.Лоренцом как «эффект бабочки», которая своим полетом может изменить состоя- ние атмосферы и будущую погоду так же, как она повлияла на события, развертывающиеся в одном из рассказов Брэдбери. Осмысливание сказанного, естественно, приводит к пониманию того, что неустойчивость порождает непредсказуемость, но это не значит, что случайность. Для случайности необходимо наличие еще вероятностного описания Откуда ему взяться? Мне представляется, что сегодня еще трудно дать исчерпывающий однозначный ответ. Этот вопрос требует дальнейшей глубокой проработки. Но кое-что сказать можно. Оказывается, что динамическая система, описываемая отображением (18.3), обладает удивительными свойствами, которые позволяют ее не- предсказуемости приписать вероятность, определяемую только ее дина- микой, а не тем, какие случайные возмущения вызывают непредсказуе- мость. Нужно лишь наличие этих ничтожно малых случайностей. Доста- точно тех, которые порождаются тепловым движением молекул или даже квантовой вероятностной природой микромира. Поясним сказанное на «часах наоборот» с параметрами из области 2 рис. 18.4, взяв в ней точку, где р = а и q = 2. Диаграмма точечного ото- бражения (18.3), которое обозначим через Т, принимает вид, показанный на рис. 18.5, а само оно записывается так: 2и при и < а / 2, 2и - а при и > а / 2. Отображение, обратное (18.7), двузначное. Пусть Tf1 и Tf1 его одно- значные ветви. Согласно (18.7), 7\~' : и = и Ь < (18.7) и 1 и + а —; Тг : и = -------- 2 2 2 предполагая ее случайной с некоторой (18.8) Зададим начальную точку ио, плотностью вероятности ро (и). Малая неопределенность в задании uq оз- начает, что функция ро (и) плотности вероятности похожа на 3- функцию и имеет вид, изображенный на рис. 18.6. Чем уже и выше пик этой функ- ции, тем точнее задается начальное значение uq. Произведем преобразование 7, при этом каждое щ перейдет в новое значение м/. Если ио случайные, то и и; тоже случайные. По плотности вероятности ро(и) случайной точки щ можно найти плотность вероятно- сти преобразованной точки щ. Пусть это pi (и) Продолжая преобразова- ния Т далее, можно найти р2(и), рз(и) и так далее. Для того, чтобы дейст- вительно их вычислить, найдем связь между ps(u) и ps+i(u). Точки us+I е (и ,u+du), если use (ГС1 (и), Tf1 (u+du)) или use(T2l(u) Тр1 (u+du)). Поэтому Р(их+, е(и,и + du)) = -1-1 11 (18.9) = Р(их е (7] (и), 7] (и + du))) + P(us е (Т2 (и), Т2 (и + du))), где Р означает вероятность события, стоящего за Р в скобках. Так что со- отношение (18.9) означает, что вероятность того, что точка us+i, являю-
18 Стохастический осциллятор («часы наоборот») 145 щаяся отображением точки uS) принадлежит интервалу (и, u+du), равна сумме вероятностей того, что us принадлежит, соответственно, интервалу (Ti '(и , Tj1 (u+du)) или интервалу (Тг1 (и), Т2 1 (u+du)). а a/q 2a/q П(и) и Рис.18.5. Частный случаи диаграммы Рис.18.6. Вид плотности вероятно- Ламерея для «часов наоборот», когда сти задания начального значения и р = а uq = 2 Учитывая (18.8), перепишем (18.9) в виде: D(u.+I e(u,u + du))— Р us G 2 2 ’ 2 или и du 2 pM(u)du=p, - — + Р \ Z J Z и + а и + а + du и + a du 2 2 или, сокращая на du , и + а .2 (18.10) 2 с известной и U Это искомое соотношение (18.10) позволяет, начиная плотности вероятностей ро(и), найти последовательно pi(u), ргби) и так далее. Естественен вопрос: есть ли предельная вероятность и какова она? Установить сходимость и найти предел можно следующим образом. Пусть начальная плотность вероятностей ро(и) имеет производную. Тогда, согласно (18.10), ее имеют и все последующие вероятности ps(u). Продифференцируем (18.10) и найдем, что 2Г “ Из (18.11) с очевидностью следует, что limX f«> = 0, , z . 1 4 и) А.1 (и) = -\р - + Л 4 2) (18.11) 2 )) и поэтому предельная функция рсо(и) постоянна. Учитывая условие нор- мировки, непосредственно находим, что z * 1 pju) = ~- а
146 18. Стохастический осциллятор («часы наоборот») Таким образом, спустя некоторое время, величины послеударных ско- ростей us в моменты прохождения маятником «часов наоборот» равнове сия, являются равномерно распределенными случайными величинами с интервалом значений от нуля до а. Эти величины не независимы. Напро- тив, близкие по номеру величины тесно связаны друг с другом, но по ме- ре удаления друг от друга эта связь слабеет и очень отдаленные значения практически не зависимы. Мы обосновали наличие вероятности лишь на конкретном примерена еще только в частном случае р = а и q = 2. Обоснование может быть и более широким. В том, что изложено, рассуждение о связи плотностей вероятностей ps(u) и ps+i(u), носит общий характер. Трудности в обосно- вании существования предела ps(u) при s—юо. Именно поэтому мы огра- ничимся частным случаем р = а и q - 2, хотя существующие исследова- ния позволяют сделать значительно более общие утверждения. Они по- зволяют утверждать, что наличие предела не есть что-то исключитель- ное, что это одна из общих возможностей. Таким образом, ситуация, обнаруженная в рассмотренном очень про- стом примере «часов наоборот», носит общий характер Она имеет место в широком круге явлений турбулентности жидкостей и газов. Именно ею вызваны трудности долгосрочного прогноза погоды. Стохастичность на- блюдается во многих электрических и механических системах, в движе- ниях молекул газа. Можно сказать, что устойчивости и неустойчивости отвечают два принципиально разных основных типа поведения динами- ческих систем. В первом случае имеет место предсказуемость и детерми- низм, а во втором - непредсказуемость и стохастичность. Простейшим типичным примером первого типа динамических систем являются часы Галилея-Гюйгенса, типичным примером второго типа- «часы наоборот» или простейший стохастический осциллятор. Часы служат для измерения времени, в регулярности и стабильности их хода их достоинство, стохастический осциллятор порождает из мик- рослучайности макрослучайность. Часы Галилея-Гюйгенса генерируют равномерный ряд моментов времени, «часы наоборот» генерируют слу- чайную последовательность. В динамических системах первого типа фазовые траектории сближа- ются, стремясь к состояниям равновесия или периодическим движениям, в системах второго типа они все время разбегаются, образуя сложный запутанный клубок. Ранее, при обсуждении автоколебаний была выявлена естественность их возникновения в динамических системах и указан геометрический об- раз автоколебаний — замкнутая фазовая кривая, к которой приближают- ся все соседние траектории. С непредсказуемыми хаотическими движе- ниями это сделать много сложнее. Они значительно более многолики. Общее их свойство — в нерегулярности и непредсказуемости, которые могут вызываться самыми ничтожными возмущениями. Можно выделить притягивающие множества неустойчивых фазовых траекторий. Это, ко- гда каждая отдельно взятая фазовая траектория неустойчива и соседние
18. Стохастический осциллятор («часы наоборот») 147 от нее убегают, а все в целом они притягивающие, что схематически представлено на рис. 18.7. Рис. 18.7. Схематичное представ- чение притягивающего множества неустойчивого непредсказуемого движения Этого достаточно для непредсказуемости. Для стохастичности, по крайней мере, следует еще потребовать наличия предельных плотностей вероятностей, о которых шла речь выше, а в общем, еще все впереди и ждет своих исследователей и исследований, которые могут видоизменить и обогатить нашу феноменологическую аксиоматически построенную теорию вероятностей. На этом можно было бы закончить, но мне хочется познакомить вас еще с замечательной системой дифференциальных уравнений Лоренца: х - -ох + оу, у = -гх— у — xz, z = -bz + ху, дающих приближенное описание тепловой конвекции между нагретой нижней и более холодной верхней горизонтальными пластинками. При b = 0 это уравнение описывает конвективную циркуляцию жидкости в замкнутой круговой трубке, которую снизу нагревают. В отсутствии на- грева снизу эта система имеет устойчивое равновесие. По мере нагрева оно становится неустойчивым и рождаются две устойчивых циркуляции жидкости по и против часовой стрелки. Затем по мере роста нагрева и эти циркуляции становятся неустойчивыми и наступает хаос: равновесие нарушается - возникает циркуляция, она нарушается и возникает другая циркуляция, она, в свою очередь, прекращается и возникает снова преж- няя и т.д. без какой-либо регулярности, без намека на периодичность, с единственно закономерной сменой циркуляции в одну сторону циркуля- цией в другую, сменой непредсказуемой, совершаемой через разные слу- чайные промежутки времени. Но что замечательно: оказывается, иссле- дование этих смен циркуляций может быть описано точечным отображе- нием, похожим на то, которое имело место в рассмотренном нами при- мере «часов наоборот». Вот на этом уже поставим точку.
148 НЕУСТОЙЧИВОСТЬ И АВТОКОЛЕБАНИЯ, ВЫЗЫВАЕМЫЕ ТРЕНИЕМ Последующий рассказ о механизме и простейших математических моделях возникновения неустойчивости и автоколебаний благодаря тре- нию. В том, что трение вызывает неустойчивость и автоколебания, есть что- то парадоксальное: мы привыкли к тому, что трение тормозит и прекра- щает движение. Но оказывается, это не всегда так, и парадокс разрешает- ся тем, что трение выступает в роли распределителя энергии некоторого другого, не связанного с трением, источника энергии. Само же по себе оно действительно может только тормозить движение. Схематическая упрощенная модель, с которой мы начнем исследова- ние систем с парадоксальной ролью сухого трения, состоит из массы, ко- торую через пружину тянут с постоянной скоростью по горизонтальной плоскости. Массивное тело при этом движется под влиянием силы растя- гиваемой пружины (рис. 19.1). В этой модели можно считать, что движет- ся с постоянной скоростью плоскость, а конец пружины, прикрепленной к телу, неподвижен (рис. 19.2). Рис.19.2 Различные виды конкретной реализации математической модели, описываемой дифференциальным уравнением 19.3 Остановимся на этом последнем варианте модели (рис. 19.2). В не- сколько другом конкретном физическом виде она предстает в так назы- ваемом маятнике Фроуда, изображенном на рис. 19.3, и представляющем собою обычный маятник, насаженный с помощью муфты на вращаю-
19. Неустойчивость и автоколебания, вызываемые трением 149 щуюся с постоянной скоростью ось. Ось вращается в муфте с некоторым не очень большим трением, чтобы маятник мог качаться на ней, но не вращался вместе с нею. Реальными прототипами описанной схематиче- ской модели могут служить тормозные колодки автомобиля, трамвая, железнодорожного вагона, а также других разнообразных механических тормозных устройств. С некоторой натяжкой сюда же можно отнести скрипичную струну, по которой с трением скользит смычок. Вернемся к принятой схематической модели. Обозначим через х ве- личину смещения массы т от ее положения, при котором пружина не растянута, а через F - силу трения массы о движущуюся плоскость опо- ры, тогда уравнение Ньютона запишется в виде: mx = -kx + F. (19.1) Природа силы сухого трения очень сложна. Первая математическая модель силы сухого трения была предложена еще в XVIII веке Кулоном. Она так и называется - кулоновским трением. О ней вам рассказывали в школе, как о законах сухого трения, согласно которым сила трения не зависит от взаимной скорости трущихся поверхностей, направлена про- тив скорости и по величине пропорциональна нормальному давлению, так что F = Fosign (v-x), (19.2) где sign - знак величины <f. Это при х ф у . При х = v, т.е. когда мас- са движется вместе с плоскостью, как бы скреплена с ней, сила трения - сила трения покоя - может быть любой в пределах от - Fo до Fo. По- следнее означает, что любая сила по величине, меньшая Fo, не может сдвинуть покоящуюся относительно движущейся плоскости массу. Дви- жение начинается, когда действующая сила по величине превзойдет Fo. Эти последние утверждения о силе трения покоя можно включить в формулу (19.2), приняв, что sign 0 означает любую величину между -1 и +1 После чего соотношение (19.2) является математической моделью кулоновского трения и уравнение движения запишется в виде: тх + kx = Fosign(y - х). (19.3) Дифференциальное уравнение (19.3) - это математическая модель рассматриваемой нами системы. Выяснение ее динамики сводится к рас- смотрению фазового портрета динамической системы (19.3). Фазовым пространством динамической системы, определяемой диф- ференциальным уравнением (19.3), является плоскость фазовых пере- менных х и х = у. В полуплоскостях у < v и у > у движения фазовых точек подчиняются, согласно (19.3), уравнениям mx + kx = +F0, (19.4) каждое из которых является гармоническим осциллятором с состоянием равновесия, соответственно, в точке х = -Fo /к, х = у = 0 или в точке x=Fq! к, х = у = 0. Это позволяет непосредственно нарисовать, как по- казано на рис. 19.4, фазовые траектории отдельно в каждой из полуплос- костей у > V И у < V.
150 19. Неустойчивость и автоколебания, вызываемые трением Рис.19.4. Фазовый портрет систем типа маятника Фроуда при кулоновской идеализации трения Движение фазовой точки на этом рисунке определено всюду, кроме точек линии х = у =v. Эта линия разбивается на три части: луч (-со, ОД по отношению к которому фазовые траектории приходят снизу и уходят сверху; отрезок [Oj, О2], на который фазовые траектории приходят сни- зу и сверху, и луч (О2, оо), где они приходят сверху и удаляются снизу. На лучах £-00, Of) и (О2, од) естественно предположить, в силу не- прерывности изменения скорости у = х и координаты х (фазовая точка не может совершать скачков), что при своем движении фазовая точка пе- ресекает их, соответственно, снизу вверх и сверху вниз; а на отрезке [Oi, О2], придя к нему снизу или сверху, остается на нем, двигаясь вдоль него согласно тому, что на нем у = х = v, и, достигнув в результате этого движения точки О2, ее покинет, переходя в нижнюю полуплоскость. ; Сделанное описание полностью определяет движение фазовых точек на всей фазовой плоскости. Однако, возможно, оно кажется не совсем обоснованным или, во всяком случае, его желательно детальнее осмыс- лить. Движение массы т может быть с проскальзыванием по опорной плоскости и без него, т.е. вместе с ней. В полуплоскостях у < v и у > v движения всюду с проскальзыванием. На лучах (-оо, О /) и (О?, а») имеют место мгновенные остановки относительно плоскости, вызванные сменой направления проскальзывания, совершаемого со скоростью v - х На отрезке [Qi, О2] проскальзывания нет, масса движется вместе с плоскостью со скоростью V. На этом отрезке х =y = v. На отрезке [О] О2] сила трения - это сила трения покоя. На нем в течение конечного времени y = v и у = 0 и поэтому в силу уравнения (19.3) kx = Fqsign (0). (19 5) Так как на отрезке [О/, О2] -Fo I к<х< Fq ! сила натяжения пру- жины к х не превосходит величины трения покоя Fq и проскальзывания
19. Неустойчивость и автоколебания, вызываемые трением 151 не возникает. Напротив, на лучах (-«?, О/) и (Q?, сд) остановка имеет мгновенный характер, так как на них сила натяжения пружины кх пре- восходит предельную величину силы трения покоя Fq. Перейдем к общему описанию полученного фазового портрета рис. 19 2 и возможных движений массы т. Имеется равновесие О(х = Fo / к, у = 0). Оно устойчивое типа центра. Возле него возможно бесконечное множество гармонических колебаний до некоторой предельной амплитуды, отвечающей кривой Г. Эти гармо- нические колебания не затухают, несмотря на наличие трения. Трение как бы исчезает. Все остальные движения после нескольких колебаний с уменьшающимся размахом приводят к временному движению массы т вместе с движущейся плоскостью (к движению фазовой точки по отрезку [О/, Ch]), после чего возникают гармонические колебания, отвечающие замкнутой фазовой кривой Г. Мы провели теоретическое исследование движений массы на пружи- не, лежащей на движущейся плоскости, исходя из кулоновской модели сухого трения, и обнаружили не только устойчивое равновесие, что до- вольно естественно, но и, к удивлению, множество различных периоди- ческих колебаний. Однако эксперимент не подтверждает эти теоретиче- ские результаты: на небольших конечных временах теоретические и экс- периментальные данные близки друг другу, однако со временем расхож- дения нарастают. Это значительное нарастание различий имеет место только в области фазового пространства, ограниченного кривой Г, и со- стоит в том, что равновесие может быть неустойчивым и вместо беско- нечного числа периодических движений либо нет ни одного, либо чаще всего одно. Это имеет место одновременно с соблюдением законов Ку- лона с большой точностью. Податься некуда и, по-видимому, и ничтож- ные отличия от закона Кулона могут привести к таким существенным различиям. Это действительно так, и вы уже с этим сталкивались при рассмотрении модели «хищник-жертва» Вольтерра-Лотка. Там причина была в некорректности математической модели, и вызвана она была на- личием состояния равновесия типа центр. В рассматриваемом сейчас случае центр тоже есть. Так что, возможно, именно в нем все дело и нужно уточнить математическую модель сухого трения так, чтобы мате- матическая модель рассматриваемой нами системы стала корректной. Желательно это сделать так, чтобы учесть реальные отличия характери- стики трения от идеальной кулоновской и одновременно не слишком ус- ложнить задачу исследования получающейся уточненной математиче- ской модели. Закону Кулона отвечает график зависимости силы трения F от взаимной скорости и трущихся поверхностей, представленный на рис.19.5. Эксперимент дает несколько другие графики. Они в основном трех следующих типов: сила трения возрастает со скоростью, убывает со ско- ростью, сначала убывает, а затем возрастает. Возможны и другие вариан- ты, но оставим их без внимания. На рис. 19.6. изображены перечисленные
152 19. Неустойчивость и автоколебания, вызываемые трением три типа. Для первых двух типов естественна кусочно-линейная аппрок- симация, при которой сила трения равна F = Fo sign и + hu, (196) Рис. 19.5. Кулоновская идеализация сухого трения тле и - взаимная скорость трущихся поверхностей, в нашем случае и = v - х. В третьем случае аппроксимируем силу трения полиномом третьего порядка F- Fq sign и+Р и+ у и3. (19.7) Эти аппроксимации, естественно, могут быть хорошими только при ограниченных значениях и Рис. 19.6. Возможные отклонения от кулоновской характеристики трения В случае (19.6) математическая модель рассматриваемой нами систе- мы примет вид: тх + hx + kx = Fosign(v-x) + hu, (19.8) а в случае (19.7), вид: mx + hx + kx = Fosign(v-x) + ри + уи', (19.9 где h, р и у малы. В общем же случае уравнение уточненной математической модели можно записать в виде: тх + кх = F(u), u = v-x, (1910 где F(u) - кусочно-гладкая функция, имеющая разрыв непрерывности при и = 0. Ясно, что математическая модель (19.10) содержит модели (19.8) и (19.9) как частные случаи. Исследование мы начнем с самой общей модели, но оно коснется только ее состояния равновесия х = F(y) /к, х = 0, когда сила трения
19. Неустойчивость и автоколебания, вызываемые трением 153 уравновешивается силой натяжения пружины. Интересовать нас будет устойчивость этого равновесия. Для исследования устойчивости нам следует рассмотреть движения, близкие к равновесию х = F(y) / к. Введем новую переменную (19.11) и запишем уравнение (19.10) в виде: dF' Пренебрегая в дальнейшем членами не ниже, чем второго порядка ма- лости относительно малой величины £, обозначенными в нем многото- чием, рассмотрим линеаризованное уравнение .. dFt ^ +—\^ + ^ = 0. (19.12) Это хорошо известный нам осциллятор. Его равновесие устойчиво при —I >0 (19.13) и неустойчиво при противоположном неравенстве. Таким образом, если скорости v отвечает восходящий участок харак- теристики трения, то равновесие устойчиво, если нисходящий, то оно не- устойчиво. Это общее утверждение, полученное из общей модели, верно, конечно, и для моделей (19.6) и (19.7). Характеристика трения модели (19.6) качественно изображена на рис. 19.6. Для нее dF, — = h. (19.14) diFu=v Для модели (19.7) аг + (19.15) Поэтому состояние равновесия х = F(y) /к, х = 0 этих моделей ус- тойчиво, соответственно, при положительных h и Д+3/v2 и неустой- чиво при отрицательных. Сказать еще что-нибудь о модели (19.10), не уточняя вида характери- стики трения, едва ли возможно, так что обратимся к более конкретизи- рованным моделям (19.8) и (19.9). Уравнение (19.8) перепишем в виде: тх + hx + кх = FQsign(v-x) + hu. В полуплоскостях х >v и х <v своей фазовой плоскости х, х =у оно принимает вид: тх + hx + kx = +F0+hu, (19.16) т.е. в каждой из них является линейным осциллятором со смещенным в h _ F() . точку х = — v + —, х = 0 состоянием равновесия (по отношению к при- к к вычной записи, когда равновесие находится в точке х = х = 0 ). Величи-
154 19. Неустойчивость и автоколебания, вызываемые трением на h, по предположению, мала, поэтому их фазовые портреты - устойчи- вый фокус при h > 0 и неустойчивый при h < 0. При этом «скручива- ние» и «раскручивание» фазовых траекторий происходит в силу малости h медленно, так что существенное изменение фазовых траекторий урав- нений (19.16) по отношению к фазовым траекториям ранее рассмотрен- ных уравнений (19.4) произойдет только с замкнутыми фазовыми тра- екториями, охватывающими точку (Fq! к, 0) (рис. 19.4). Эти изменения при h> 0 и h < 0 разные и представлены на рис. 19.7а и б. Ранее рас- смотренный случай относится к h = 0 В первом случае при h> 0 вся- кое движение оканчивается устойчивым состоянием равновесия О с ко- ординатами Fol к и 0. Во втором, когда h < 0, это равновесие неустой- чиво и всякое движение оканчивается устойчивым периодическим дви- жением - автоколебанием, изображаемым на рис. 19.76 замкнутой кривой Г (на рисунке она выделена жирной линией). Эти качественные изменения имеют место при сколь угодно малом i Это подтверждает и обосновывает сделанное ранее утверждение о не- корректности математической модели (19.3), совпадающей с рассматри- ваемой моделью при h = 0. При h *0 математическая модель (19.8 корректна. Это следует из общей теории грубости - структурной устой- чивости - динамических систем второго порядка. Поэтому можно наде- яться, что полученный результат носит общий характер, т.е. имеет место для любых монотонных не очень крутых характеристик трения, возрас- тающих и убывающих. Конечно, не лишнее, прежде, чем делать такое предположение, посмотреть на дисплей компьютера. Кроме того, следует иметь в виду, что сделанные аппроксимации силы трения предполагают не очень большие величины х и v. Перейдем к модели (19.9). Ее характеристика трения состоит из па- дающего и последующего восходящего участков (рис.19.6в). Возьмем за образец проделанное ранее исследование динамики лампового генерато- ра, описываемого уравнением Ван-дер-Поля. Пусть v>0 и х мало. Запишем уравнение (19.9) в виде: тх + кх- F() + pv + yv3 +(-/3 - 3yv2 )х + 3yvx2 -ух3 = = а() + a-jX-t а х + а3х . Это дифференциальное уравнение после замены переменных £ = х - ао / к приводится к виду: ^-25(1-а^-Ь^^+а)^ = 0, (19.17) где 25-ai / т, а = аз ! та/, Ь = аз/та/ и а> -к/m. При а=0 оно очень похоже на уравнение Ван-дер-Поля. Член же а £, как будет вид- но из дальнейшего, несущественен. Уравнение (19.17) с а = 0 и урав- нение Ван-дер-Поля являются простейшими математическими моделя- ми автоколебательных систем. Приступим к исследованию уравнения (19.17). Как и ранее, примем, что A cos(coi+tp) (19.18)
19. Неустойчивость и автоколебания, вызываемые трением 155 Рис.19.7. Фазовые портреты систем типа маятника Фроуда: а) при характе- ристике трения вида рис. 19.6 а, б) при характеристике трения виде рис. 19.6 б и найдем производную по времени от энергии Е = (^ + со2^2)/2 соот- ветствующего линейного осциллятора: = = + 6)2 = = (19.19) = 25[\ +aa)Asin(o)t + ср)-Ьсн A sin2(cot + (р)]агA sin (cot + cpX Напомним, что эти последние вычисления выполняются в пренебре- жении членами с А и ф, т.е. при А = ф = 0. Интегрируя (19.19) по периоду 2 л / со, находим что . со2 А2 ( 7 2 1 4 А------= \ бсо А —босо А — 2 2 ) а)
156 19. Неустойчивость и автоколебания, вызываемые трением ИЛИ АЛ2 =------------2л8Ьо) А*. (19.20) а> Из (19.20) следует рекуррентное соотношение для последовательных амплитуд Ап и An+i А 2 п+1 Ап2 -2я8Ъа)Ап4, (19.21) О) которое можно рассматривать как точечное отображение полупрямой в себя. Его неподвижной точке А = 0 соответствует состояние равновесия, устойчивое при 3< 0, и неустойчивое при 8> 0. При Ь> 0 имеется еще одна неподвижная точка .* bat2 А =-------, 2 (19.22) которая устойчива при 8> 0, т.е. при неустойчивости равновесия. Для характеристики трения вида рис.19.6в и приближенно аппрокси- мируемой полиномом (19.7), если скорость v лежит на ее падающем участке 8> 0 и Ъ> 0, и следовательно, состояние равновесия неустой- чиво и возникают автоколебания с амплитудой, приближенно опреде- ляемой формулой (19.22) (рис.19.8). Рис.19.8. Фазовый портрет системы типа маятника Фроуда при наличии падающего участка характеристики трения рис. 19.6 в С некоторой долей оптимизма можно надеяться, что так же будет для любой характеристики вида, изображенного на рис.19.6в (но при 8 ма- лом).
157 ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ ЛИНЕЙНОГО ОСЦИЛЛЯТОРА Мы познакомились с простейшими физическими реализациями ли- нейного осциллятора: масса на пружине при наличии вязкого трения и с электрическим контуром из самоиндукции, емкости и сопротивления. Теперь нам предстоит рассмотреть, каков результат воздействия на эти объекты гармонической силы и, соответственно, напряжения (рис.20.1 ). Математическая модель в обоих случаях одна и та же и имеет вид: х + 28х + й)2х = acosvf. (20.1) Рис.20.1. Условное изображение конкретных реализаций механического и электрического осцилляторов с действующими на них внешними гармони- ческими воздействиями, силой F cos vt и напряжением Е cos vt Мы значительно облегчим себе выкладки в этом и подобных случаях, если прибегнем к так называемой комплексной форме записи, заменив уравнение ( 20.1 ) уравнением х + 28х + й)2х = ае‘*. (20.2) Понимать его можно как то, что его действительная часть - это и есть рассматриваемое уравнение (20.1 ) и, в соответствии с этим, a exp (ivt) - это комплексная запись действительного воздействия a cos vt, а в (20.1) хесть действительная часть х, входящего в (20.2). Решение неоднородного уравнения (20.2 ) состоит из общего решения однородного, которое хорошо нам известно, и какого - нибудь решения неоднородного уравнения, которое мы постараемся найти. Будем его ис- кать в виде х = A exp (ivt), т.е. как колебания той же частоты, что и внешнее воздействие a exp (i vt). Прямая подстановка дает, что (-v : + 28 vi + со )А = а, откуда
158 20. Вынужденные колебания линейного осциллятора Если предположить, что общее решение однородного уравнения при! t оо исчезает - это имеет место при 8> 0 и а} > 0 , то остающееся при неограниченном возрастании времени колебание осциллятора ( 20.2 ) совпадает с найденным нами частным решением неоднородного уравнения а (20.4) V = ------------- р со2 - v2 + 28vi Выясним, что оно собою представляет. Начнем с общего рассмотре- ния Пусть х = £(гу)е'\ (205) где К (iv)- комплексная функция частоты v. Реальный смысл имеет действительная часть (20.5 ) . Найдем ее, сохранив за ней обозначение х = Re(K(i v)e‘'‘) = Re |) K(i v) | ] = | K(i v) | cos(vt + <p), cp = arg К ( i v ) . Таким образом, найденное нами частное решение (20.4 ), которое ус- танавливается с возрастанием t при ассимптотической устойчивости ос- циллятора, называемое поэтому вынужденным колебанием, является гармоническим колебанием с частотой внешнего воздействия ц ампли- тудой | K(i v) | и фазой ср = arg К (i v). Обратите внимание, что характеристики вынужденного гармониче ского колебания - амплитуда и фаза - находятся по одному и тому ж комплексному числу К (iv), которое определяет эти величины кш функции частоты внешнего воздействия v. Благодаря этому зависимости К(iv) получила наименование амплитудно-фазовой частотной харак теристики, т.е. характеристики, объединяющей частотные зависимосп амплитуды и фазы одновременно. Частотной амплитудно-фазовой характеристике можно придать гео метрически наглядный характер. Для этого на комплексной плоскости И нарисуем годограф (кривую), пробегаемую комплексной точко! W = К(iv) при изменении v от 0 до оо (рис.20.2 ). Длина радиус вектора точки Wэтой кривой, отвечающего частоте v, дает амплитуду,; угол с действительной осью - фазу соответствующего вынужденной колебания. Кривая-годограф, отвечающая формуле (20.3), легко строится п трем своим характерным точкам, для которых v= 0, v= со и v=o ( рис.20.3 ). При малом 8> 0 годограф сильно вытягивается вдоль oi рицательного направления мнимой оси, принимая при v= со значени -ia / 28 со. Начинается он в точке v = а / со и кончается в точке v = со. По амплитудно-фазовой частотной характеристике рис.20.3 легко пс строить амплитудную зависимость - резонансную кривую - и фазовуг зависимость от частоты внешнего воздействия v. Эти зависимости пр разных 8> 0 качественно представлены на рис.20.4. Из них следует пн роко известное явление амплитудного резонанса - большое возрастай»
20. Вынужденные колебания линейного осциллятора 159 Рис.20.2. Амплитудно - фазовая час- тотная характеристика W = К (i v) Рис.20.3. Амплитудно - фазовая частотная характеристика линейного осциллятора амплитуды вблизи v = со при ё << 1 - и менее известное, но не менее замечательное явление противофазы вынужденных колебаний по отно- шению к внешнему воздействию при v> со. При £= 0 фаза колебаний зависит от частоты v разрывно при v< со она равна нулю, а при v> со она равна - тс. При небольшом ё> 0 эта зависимость уже непрерывная но с быстрым изменением фазы ср вблизи v= со (рис 20.5) Резонанс тем ярче выражен, чем меньше затухание ё. При малом ё максимальная амплитуда достигается примерно при v= со, а точнее, при v = y[co2 -2ё , ибо именно при этом значении частоты внешнего воз- действия достигается максимум модуля величины А, определяемой фор- мулой ( 20.3 ) ( рис 20.4 ) . Рис.20.4 Рис.20.5 Следующие из амплитудно - фазовой частотной характеристики линейного осциллятора амплитудно - частотные характеристики (резонансные кривые) и фазовая частотная характеристика для трех убывающих значений коэф- фициента ёдемпфирования (вязкого трения, омического сопротивления) Оба эти явления ярко иллюстрируются бортовой и килевой качками корабля на бегущих волнах. В обоих случаях приближенной моделью
160 20. Вынужденные колебания линейного осциллятора качки корабля является осциллятор, на который действует внешняя гар- моническая сила, на что в свое время обратил внимание А.Н.Крылов. Особый интерес представляет килевая качка корабля, когда при доста- точно большой амплитуде воздействия волн на корабль их частота зави- сит от скорости и курса корабля. При неудачных курсе и скорости набе- гающие волны могут иметь частоту, несколько большую собственной частоты килевой качки, и тогда явление резонанса будет еще сопровож- даться тем, что корабль не взбегает носом на приближающуюся волну, а опускается вниз и зарывается в нее носом. Найдем условия возникновения такой нежелательной и опасной ката. Пусть <9 - угол между направлениями движения волны со скоростью и и корабля, движущегося со скоростью v навстречу волне. При этом ско- рость набегания волн на корабль равна и + v cos «9 (рис.20.6), а частота их набегания v= 2 я А" (и + v cos&), где А - длина бегущих волн, Частота собственных свободных колебаний корабля пусть со. Тогда осо- бенно опасна ситуация, когда при близости частот v и со v > со, так как именно в этом случае имеет место близость к резонансу, а колебания но- са корабля в противофазе с набегающей волной. Следующий пример о вынужденных колебаниях системы несколько более сложный, чем осциллятор. Основной его частью является машина на упругом основании под действием возникающей при ее работе гармо- нической силы. Ее математическая модель совпадает с ( 20.1 ). Периоди- ческое воздействие может иметь своей причиной, например, наличие эксцентричных вращающихся деталей или деталей, поступательно дви- жущихся туда и обратно с некоторой частотой у. Под влиянием этой силы машина начинает вибрировать, что может быть весьма нежелатель- ным. Как подавить или хотя бы уменьшить эти вибрации? Одним из эффек- тивных средств их подавления является динамический демпфер, который представляет собой массу с пружиной, подсоединяемой к основной большой массе вибрирующей машины (рис.20.7 ). Пусть величины перемещений машины и массы демпфера от их рав- новесных положений, соответственно, х и у, М и т. - массы машины и демпфера, а К и к - жесткости основания (крепления) машины и пружины демпфера. Математическую модель машины на упругом осно- вании с динамическим демпфером ( рис.20.7 ) можно записать в виде: Мх = -Кх - к(х - у) + Fe‘“, ту = к(х-у). В этой модели ради простоты трения не учитываются. Для реального расчета динамического демпфера этот учет, конечно, необходим, но для наших целей демонстрационного характера он несущественен и только усложняет рассмотрение.
20. Вынужденные колебания линейного осциллятора 161 Уравнение ( 20.6 ) можно написать, исходя непосредственно из зако- в Ньютона, или на основе функции Лагранжа, которая в данном случае равна ^_Мх2 ^ту2 Кх2 к(х-у)2 “22 2 2 и кроме того, есть силы Рис.20.6. Курс корабля, движущегося Рис.20.7. Схема механического резо- со скоростью и под углом О к набе- раненого демпфера вынужденных ко- гающим со скоростью и волнам лебаний массы М гармонической силой Найдем вынужденные колебания модели (20.6 ). В соответствии с предыдущим примем, что х = Ае\ y = Bent (20.7) и подставим их в (20.6 ). Имеем - Mv2 А = - КА - к( А - В) + F, -mv2В = к(А-В), (20.8) откуда F(k-mv2) (К + к - Mv2)(k - mv2) - к2 ’ {K + k-Mv2}(k-mv2)-k2 ' Из этих формул следует, что вынужденные колебания машины на ос- новании имеют амплитуду А, обращающуюся в ноль, при k-mv2=0. (20.10) Масса демпфера при этом колеблется с амплитудой B = -F/k. Так что пружины демпфера действуют на массу машины с силой кВе'“ = -Fe"*, в точности компенсирующей воздействие F е lvt. Так как, огласно (20.10), к = т\?', а масса тп мала, то амплитуда колебаний
162 20. Вынужденные колебания линейного осциллятора демпфера может быть большой и именно такой, чтобы нейтрализован воздействие на машину гармонической силы Это замечательный и удивительный результат: демпфер колеблется,а вибраций машины нет. Однако, как же заколебался демпфер? По- видимому, ответ может быть только один: машина вначале колебалась л возбудила колебания демпфера, колебания демпфера подавили колеба- ния машины и они исчезли и остались одни колебания демпфера. Это до- вольно правдоподобно, но не совсем так, поскольку о вынужденных ко- лебаниях, как об установившихся, можно говорить только при затухании собственных, т.е. при наличии трения. Так что это может быть так только при наличии исчезающе малых трений. Они, конечно, всегда есть и всев конечном счете верно. Только при наличии очень малых трений вибра- ции машины не отсутствуют, а очень малы. Мы рассмотрели действие гармонической силы на линейный осцилля- тор, нашли вызываемые им колебания и обнаружили явления синхро- низма, резонанса и сдвига фаз. Синхронизм выражается в том, что гармоническое воздействие часто- ты v вызывает гармонические вынужденные колебания осциллятора той же частоты. Явления резонанса проявляются тем сильнее, чем меньше параметр трения ё> 0, так что в резонансе амплитуда вынужденных ко- лебаний неограниченно растет при ё -> 0. Явление сдвига фазы - это ее зависимость от частоты воздействия к Она такова, что при маленьких частотах сдвиг фаз близок к нулю, при больших к -я, т.е к противофазе. При ё -> 0 эта зависимость приоб- ретает скачкообразный характер: при v < со сдвиг фаз равен 0, и при v> со он равен - я. Мы ввели еще понятие частотной амплитудно - фазовой характери- стики K(iv), так что в комплексной записи связь между гармониче- ским воздействием а е lvt. и вынужденными колебаниями Ае1 1 записы- вается в очень простом виде: A=K(iv)a, (20.11) напоминающем закон рычага. Конечно, из этой записи следуют явления синхронизма, резонанса и сдвига фаз. Таковы успехи хорошей теории: сложное становится простым. К этому краткому итогу наших исследований мне хочется сделать од- но важное добавление. Формула (20.11 ) относится к гармоническому воздействию, нельзя ли ее обобщить на произвольное периодическое воздействие. Оказывается, это возможно. Возможно в силу применимо- сти принципа суперпозиции и представимости любого периодического воздействия в виде суммы гармонических. С представимостью вас по- знакомили в курсе математического анализа, где она называется рядом Фурье. Согласно теории рядов Фурье, периодическую функцию f (t) с пе- риодом Т = 2л/ v при выполнении для нас неограничительных условий можно записать в виде:
20. Вынужденные колебания линейного осциллятора 163 / (Г) = 22 аь cos svt + 8*п 5 vt, (20.12) где Т т ао=~ ’ а> = ~ №<0 cos svtdt, 0 577 о т bs= — j/(f)sin5vftfr, (5 = 1,2,...) , 71 0 или в виде /(0 = Ке^(а1-/6.,.)е“и. (20.13) л=0 Последняя формула (20 13 ) означает, что периодическое воздейст- вие является суммой гармонических воздействий (в комплексном пред- ставлении ) f(t) = Re^cs e^f сх = as-ibs. ( 20.14) s=0 Такое представление функции f (t) называется спектральным. Часто- ты входящих в него гармонических составляющих - его спектром. С нулевой частотой входит постоянное воздействие величины Со = ао.. Гармоническая составляющая с частотой v называется основной, ос- тальные воздействия, называемые гармониками, имеют частоты 2ц Зц .... Амплитуды этих гармонических составляющих, основной и гармоник, соответственно, с |, с2 |,.... Теперь, чтобы найти вынужденные колебания осциллятора, отвечаю- щие произвольному периодическому воздействию f (t) , достаточно вос- пользоваться принципом суперпозиции. Отдельному гармоническому воздействию, входящему в ( 20.14 ), отвечает вынужденное колебание сД(Аи)е/АИ, (20.15) поэтому сумме воздействий (20.14 ), т.е. воздействию f (t) , отвечает сумма вынужденных гармонических колебаний (20 15) C'Kfisvy™. (20.16) Л=0 Соответствующие (20.16 ) гармонические колебания имеют частоты sv, амплитуды | cs К (i s у)| и фазы arg [с5 К (is v)]. Явление синхрониз- ма сохраняется в том смысле, что ответ осциллятора имеет тот же пери- од что и воздействие, явление сдвига фаз при периодическом воздейст- вии (20.14) теряет смысл, а явление резонанса сохраняется, однако, те- перь резонанс возможен не только при v = 4со2 -28 , но и при sv = \a>2 -282 с любым целым $, т.е. не только на основной частоте, но и ее гармониках. Но, в связи с тем, что cs 0 при s со, явление резо- нанса может проявляться только на не очень далеких гармониках. Это при 8> 0, при 8=0 резонанс возможен на любой гармонике.
164 20. Вынужденные колебания линейного осциллятора Сказанное о периодическом внешнем воздействии на осциллятор мо- жет быть обобщено на произвольное воздействие f (t) . Это дальнейшее обобщение также основывается на принципе суперпозиции, но исходит из более общих способов представления воздействия f (t) в виде супер- позиции более простых. При этом под более простыми понимаются та- кие, для которых отклик осциллятора может быть легко найден. В опи- санном выше таким простым воздействием было гармоническое воздей- ствие е 1 vt. Отклик на него также гармонический и равен К (iv) е1 где К (iv) - амплитудно - фазовая частотная характеристика осциллятора Далее мы воспользовались тем, что периодическое воздействие f(t) периода Т может быть представлено в виде ряда Фурье, т.е. в виде су- перпозиции гармонических колебаний частот 2/гп/Т с п = 1, 2, 3,.. и некоторого постоянного воздействия. Но, кроме ряда Фурье, существует еще интеграл Фурье, который любую функцию f (t) , достаточно быстро убывающую при t +оо, представляет в виде интеграла f(t)= jg(v)eludv, (20.17) -СО т.е. тоже в виде суперпозиции гармонических воздействий g(v)e'“dv частоты v, амплитуды |g(v ) dv и фазы arg [ g(v) dv ] При этом, как из- вестно, функция g(v), называемая преобразованием Фурье функции f (t) , находится по формуле g(v)=^ f/(z)e i"dt' (2018) На каждую гармоническую составляющую g(y)e,v1 dv интегральной суммы (20.17) откликом осциллятора является X(z v)g(z а отклик на все воздействие f (t) будет x(t}= pC(zv)g(v)e'"dv . (20.19) — CO Наряду co спектральным представлением внешнего воздействия f (t возможно и импульсное представление, т.е. представление f (t). как по- следовательности мгновенных воздействий - импульсов. В момент t за время dt величина этого импульса равна/(t) dt, где длительность dt ис- чезающе мала. Задать такой импульс с помощью обычных функций не- возможно и это достигается с помощью обобщенной функции, получив- шей название дельта функции. Мгновенный единичный импульс в мо- мент времени т записывается в виде d(t - т) . Составить представле- ние об этом описании, об этой математической модели мгновенного еди- ничного импульса можно, мысля его как предел пикообразной функции (р (t - т, е) , изображенной на рис.20.8 при е 0. При этом предпола- гается, что, несмотря на то, что область ширины е возле точки т, в ко- торой функция (р (t- т,е) отлична от нуля, неограниченно сужается интеграл
20. Вынужденные колебания линейного осциллятора 165 j (pit - т, s)dt = j (pit - т, s)dt (20.20) —оо r—e!2 все время равен единице. Ясно, что такое требование ведет к неограни- ченному росту функции (p(t - т,е) при £ -> 0 и отсутствию предель- ной функции в обычном понимании. Обойдем эту трудность, назвав пре- дельную функцию обобщенной и записав в виде 8 (t - т) . С помощью этой обобщенной функции любое воздействие f (t) можно записать в виде f(t)=\pT)6(t-r)dT. (20.21) Рис.20.8. График импульсного воздействия Действительно, согласно теореме о среднем, J /(т)£(Г-т)с?т = 1ш1 = -оо г-с/2 т+е/2 = Пт/(т ) f (p(t - т, £}d т = f{t}. £~>00 J т-е!2 Напомним, что т - это некоторое значение, лежащее в суживающем- ся интервале (t- е/2, t + е/2) . Формула (20.21 ) - это представление внешнего воздействия в виде суперпозиции импульсных воздействий, описываемых обобщенной функцией 8(t- т). Обозначим отклик осциллятора на единичный им- пульс через ip(t~ т). С его помощью, согласно принципу суперпози- ции, отклик осциллятора х (t) на произвольное воздействие f (t) можно записать в виде X(t) = f - r)dr. ( 20.22) -оо Осталось найти отклик ip(t-r) осциллятора на единичный импульс 8(t- т) , т.е. на воздействие f (t) = 8(t- т) . Но, прежде чем присту- пить к поиску этого отклика ip(t - т) , уточним условия его действия, как и то, что мы понимаем под откликом осциллятора на воздействие Дело в том, что движение осциллятора определяется его начальным стоянием и последующим внешним на него воздействием. Поэтому,
166 20. Вынужденные колебания линейного осциллятора естественно, под откликом на внешнее воздействие понимать только ту его часть, которая отвечает этому воздействию, а не начальному возму- щению осциллятора, его начальным, отличным от нуля условиям Итак, под V//(t — т) мы понимаем результат воздействия импульса 8 (t-^ при нулевых начальных условиях, т.е. мы хотим решить задачу: найти решение дифференциального уравнения х + 28х + со х - 8(t - г) (20.23) при условиях х(т-^) = 0, х(т-£) = 0, (£>0). (20.24) Позволим себе найти его не формально. Затем можно проверить пря- мой подстановкой верность полученного результата. Мгновенный импульс вызывает скачок скорости х, а координата х в виду бесконечной малости времени импульса и конечности скорости i, не меняется. Поэтому, интегрируя ( 20.23 ) в пределах от т- si 2 до г+ е/ 2 и устремляя е к нулю, имеем Ах = х(т + 0) - х(т - 0) = 1, откуда, так как х(т - 0) = 0, то х(т + 0) = 1. К этому добавим, что х(т+0) =х(т-0) =х(т) =0. Таким образом, откликом на воздействие 8 (t - т) является решение уравнения: х + 28х + со2х = 0, х(т) = 0, х(т) = 1 при t < т, равное нулю, а при t >т, определяемое начальными уело ия- ми х(т) = 1 . х(т) = О Это решение, согласно (1.7), при со2 - $ > 0 записывается в виде: 0 при t <т, е~5 ‘ И 8*П ~ П^и x(t) = i//(t - г) = (2025) В заключение я хотел бы отметить, что полученная нами формула от- клика ( 20.22 ) (с учетом ( 20.25 ) ) является прямым следствием ис- пользования новой непривычной для вас обобщенной функции 8(t , обладающей свойством х 0 при t*0 % <5(0 = 1 , Г<5(0^ = 1. (20.26) со при t = 0 Несмотря на необычность функции 8 (t) , она всего лишь естествен- ная математическая модель мгновенного импульсного воздействия. Од- новременно, она же математическая модель плотности единичной точеч- ной массы на прямой или точечного единичного заряда. Впервые эту функцию в науку ввел Хэвисайд в связи с созданным им операционным исчислением, позднее - физик Дирак в связи с разрабатываемой им кван- товой физикой. Физики ее называют функцией Дирака, математики - обобщенной 8-функцией или просто 8-функцией.
167 21 ПАРАМЕТРИЧЕСКОЕ ВОЗБУЖДЕНИЕ И СТАБИЛИЗАЦИЯ В предыдущих лекциях мы рассмотрели действие внешней гармони- ческой силы на линейный осциллятор, в результате которого его диффе- ренциальное уравнение принимает вид: х + 2дх + со2х = acosvt. (21-1) Но воздействие, зависящее от времени, может вызывать и другие из- менения уравнения линейного осциллятора. Например, оно может со- 2 стоять в том, что параметр частоты со меняется гармонически со вре- менем и тогда уравнение осциллятора принимает вид: х + 2дх + (со +fcosvr)x = 0. (21.2) Непосредственной физической моделью для уравнения ( 21.2 ) являет- ся масса на пружине с переменной гармонически меняющейся жестко- стью при наличии вязкого сопротивления. С приемлемым приближением уравнением (21.2) описываются малые колебания маятника с верти- кально гармонически колеблющейся точкой подвеса. Если точка подвеса колеблется горизонтально, то с аналогичным приближением приходим к уравнению (21.1 ). Рис.21.1. Маятник с перемещае- мой точкой подвеса. Величины пе- ремещений в горизонтальном и вертикальном направлениях и uv Рассмотрим вместе оба этих случая, предполагая, что точка подвеса маятника смещается по горизонтали и вертикали согласно законам u(t) и v (t) . Для составления уравнений движения мы прибегнем к уравне- нию Лагранжа. Выразим координаты х и у массы т маятника через
168 21. Параметрическое возбуждение и стабилизация смещения и( t) м v (t) и угол ср отклонения его от вертикали (рис. 21.1 ): х = и + I sin (р, у = v + I cos (р и запишем функцию Лагранжа W 2 2 L = — {(ii + 1фсо$<р) +(v-Z$>sin$?) } + mg(lcos(p + v). После несложных вычислений находим искомое уравнение Лагранжа в виде: .. g . 1 .. 1.. ф + ysm^? = --ucosip + -vsmip или, учитывая еще вязкое трение и заменяя sin<p на (р, a cos(p на 1, в виде: 7 1 1 (р + 2дф + а) (р = --й + -v(p (21.3) Уравнение (21.3) переходит в (21.1) и (21.2), соответственно, при гармонических горизонтальных ( и = а I у'2cos у t, v = 0) и вер- тикальных (и = 0, v = si у'2 cos yt) колебаниях точки подвеса маятника. Таким образом, если гармонически горизонтально перемещать точку подвеса маятника, то это равнозначно действию на маятник гармониче- ской силы. Если же точку подвеса гармонически перемещать вертикаль- но, то это равнозначно гармоническому изменению частоты маятника. Это позволяет нам наглядно наблюдать, что происходит с маятником в первом и втором случаях, описываемых дифференциальными уравне- ниями (21.1 ) и (21.2). Воспользуемся этим, чтобы еще раз продемон- стрировать явления синхронизма, сдвига фаз и резонанса, о которых была речь в предыдущей лекции, а в заключение этой лекции продемон- стрируем вывод и исследование дифференциального уравнения (21.2). Для демонстрации я воспользуюсь одной из сумочек присутствующих здесь студенток. Я держу ее за ремешок на весу. Затем начинаю переме- щать руку периодически вправо и влево. Сумка начинает качаться в такт с рукой, демонстрируя явление синхронизма. Резонанс наступает тогда, когда сумка сильно качается, а перемещения руки практически незамет- ны; сумка колеблется влево, а рука перемещается вправо, когда частота движения руки больше собственной частоты колебаний сумки, при меньшей частоте движения руки рука и сумка движутся одновременно вправо и влево. Вернемся к уравнению ( 21.2 ). Путем замены переменных х = е 'St в нем можно убрать член вязкого трения и привести его к виду: у + (Q2 + s cos yf)y — О, где /22 = о2 - 82. В свою очередь замена масштаба времени т = у t по- зволяет оставить в нем только два параметра, приведя его к виду широко известного уравнения Матье у + (v-2Q2 + sy~2 cos т)у = 0,
21. Параметрическое возбуждение и стабилизация 169 которое запишем, возвращаясь к исходным обозначениям, в виде: х + (а> +£cos/)x = 0. (21.4) Исследование уравнения Матье ( 21.4) не очень просто и может слу- жить примером, когда хорошая идея порождает метод исследования, само исследование ведет к вычислениям, а вычисления приводят к чет- ким и неожиданным результатам. Идея идет от великого математика А.Пуанкаре и состоит в сведении изучения решений уравнения Матье к точечному отображению. Метод и вычисления состоят в построении, изучении и численном исследовании этого точечного отображения. Пусть хи х = у - начальные значения при t = 0 , а хи у - зна- чения этих же переменных спустя время 2 л. Значения х и у одно- значно находятся по х и у, так что (х , у) = Т(х,у), (21.5) где Т - некоторый не известный нам однозначный оператор, переводя- щий х и у в х и у. Соотношения ( 21.5 ) можно трактовать и как то- чечное отображение точки ( х, у) в точку (х , у ) . С такой трактовкой мы уже сталкивались при рассмотрении динамики часов Галилея- Гюйгенса и «часов наоборот» ( стохастического осциллятора). Это бы- ли диаграммы Кенигса - Ламерея, которые геометрически представляли одномерные точечные отображения. Теперь перед нами - двумерное точечное отображение. К сожалению, столь же удобное геометрическое представление для него неизвестно. Но и без него использование точеч- ного отображения оказывается очень полезным. Полезность эта состоит в том, что продолжение решения уравнения Матье ( 21.2 ) с начальными условиями х, у на времени 2л, 4тг, 6 л,... сводится к однократному, двукратному, трехкратному, ...преобразованиям (21.5), т.е. при лю- бом целом положительном п и любом решении х (t), у (t) = x(t) уравнения Матье ( 21.2 ) имеет место (х( 2пл), у( 2пл)) = Тп (xf 0), у(0)). (21.6) Этот очевидный факт сводит исследование поведения решений урав- нения Матье ( 21.2) при неограниченном возрастании времени t к рас- смотрению итераций (последовательных преобразований) точки Итак, идея состоит в том, чтобы вместо решений уравнения Матье (21.2) и его трехмерного фазового портрета изучать отображение Т плоскости переменных х, у в себя. Найдем отображение Т. Для этого надлежит проинтегрировать дифференциальное уравнение Матье (21.4). Пусть мы это сделали для начальных условий х = 1 и у = 0, и х = О и у = 1. Обозначим эти решения <£>у (t) и (t) . Тогда при про- извольных начальных условиях х, у решение х (t) в силу линейности уравнения Матье запишется в виде: x(t) =x(pi(t) +y(p2(t)
170 2/. Параметрическое возбуждение и стабилизация И y(t) — x(t) =x<p,(t) + уф2(1). Поэтому х = х(2л) = <р} (2л)х + (р2 (^2л)у, у = х(2л) = фх (2zr)x + ф2 (2л) у, (21.7) т.е. мы нашли отображение Т и оно оказалось линейным. Для его оты- скания нам потребовалось знание только двух частных решений (р / (t |и 2 (/). Даже не самих решений, а только их значений и значений их производных при t = 2л. Линейное отображение мы исследовать умеем, и как оно устроено, нам хорошо известно. Применим эти знания. Самым важным являются собственные значения матрицы линейного отображения Т, т.е. корни квадратного уравнения (21.8) <р} (2л) -Я <р2 (2л) (р}(2л) <р)(2л)-Л - Я ~((р} (2л) + ф2 (2л))Л + (2л)ср2 (2л) - фх (2л)(р2 (2л) = 0. Это уравнение не общего вида: его свободный член равен единице. Дей- ствительно, пусть (pi (t) ф2 (t) - (pt(t) (p2(t) =W(t). При t - 0 W (t) = I. Далее обнаруживаем, что W (t) = 0 и поэто- му И7 ( 2л) = 1, т.е. свободный член тоже равен единице. Итак, харак- теристическое уравнение ( 21.8 ) имеет вид: +1=0, (21.9) где 2А = (pi ( 2л) + ф2( 2л). Корни Я/ и Я2 этого уравнения (21.9) Х!.2 = А+7Л2-/ при А > 1 - действительные различные, один по модулю больше еди- ницы, другой - меньше ( следует иметь в виду, что произведение кор- ней равно единице ); при IА | < 1 — корни комплексные сопряженные, по модулю равные единице. Переход от первого случая ко второму про- исходит при А = 1 : при А - 1 - через двойной корень, равный еди- нице, и при А = - 1 - через двойной корень, равный минус единице. Как известно, при различности корней Я/ и Л2 , т.е. а\ *1, ли- нейное отображение Т после однородной линейной замены переменных ( возможно, комплексной ) представимо в диагональном виде: ц = Я]М, г = Я2г. (21.10) При А | > 1 корни Я / и Я 2 - действительные, замена переменных также действительная и, согласно (21.10), отображение Т в одном направлении сжимающее, а в другом - растягивающее. При А < -1 растягивание и сжатие сопровождаются еще симметричным отображени-
21. Параметрическое возбуждение и стабилизация 171 ем относительно преобразуемой в себя точки х = у = 0 , совпадающей с точкой и = v = 0 Ясно, что при этом почти все точки х, у при последо- вательных преобразованиях удаляются в бесконечность Исключение со- ставляют точки линии и = 0 или v = 0 , вдоль которой имеет место сжатие ( соответствующее Л по модулю меньше единицы ). Из этого следует, что при А | > 1 состояние равновесия х = у = 0г уравнения Матье неустойчиво и почти все его решения со временем не- ограниченно возрастают. Имеет место т н параметрическое возбуждение колебаний осциллятора, при котором амплитуда колебаний неограни- ченно растет. При А | < 1 ситуация совсем другая В этом случае Л ] и 2 2, как и переменные и и v, - комплексные сопряженные Перейти к действи- тельным переменным можно с помощью замены В новых переменных £ и гр преобразование (21.10) и исходное (21.7) (если учесть, что |Л/| = lA^I = 7, и поэтому при некотором (р А / = cos#? - z sin#?, а Аз= cos#?+ z sin#? ) принимает вид; £ = £ cos#? - г] sin#?, 7 = £ sin#? + rj cos#?, т.е. в этих переменных оно является вращением вокруг точки х = у = 0 на угол #? Это означает, что при неограниченном возрастании времени любое решение х (t), у (t) = х (t) уравнения Матье остается ограни- ченным, а его равновесие х = у = 0 является устойчивым Итак, при А > 1 имеет место неустойчивость с экспоненциальным возрастанием, а при А\< 1 - устойчивость, не сопровождающаяся приближением к равновесию Граничный случай А = 1 позволим себе оставить без внимания Значение величины А определяется параметрами а» и 8 уравнения Матье Эту зависимость не удается найти аналитически, но для любых О)2 и 8 можно вычислить соответствующее значение А. Это вычисле- ние легко выполняется ЭВМ. Представим себе, что мы ею воспользова- лись и нашли области на плоскости параметров со и 8, где А > 1 и где А | < 1. При этом мы придем к картинке, показанной на рис.21.2 На этой картинке есть детали, которые не могут быть выяснены вычислительно - это поведение граничных кривых вблизи оси е Доходят ли они до нее или оканчиваются очень близко к ней и как именно ведут себя около нее? Но именно этот вопрос может быть исследован аналитически, поскольку при этом можно ограничиться малыми 8. Это аналитическое исследова- ние было проделано. Приведенный рисунок (212) соответствует его ре- зультату "носы" областей неустойчивости упираются своими заостре- ниями в ось со в точках, для которых со2 = п2/4 ( n = 1, 2, ... ) . Что же из этого следует в отношении движений осциллятора, описы- ваемого уравнением Матье? Отсюда следует не только удивительное яв-
172 21. Параметрическое возбуждение и стабилизация ление параметрического возбуждения под влиянием гармонически ме- няющегося параметра, но и возможность этого возбуждения при сколь угодно малых амплитудах изменения параметра, если только частота ис- ходного приведенного невозмущаемого осциллятора со достаточно близка к одному из значений п / 2 ( это, конечно, при со2 > 0). Параметрическое возбуждение удивительно потому, что оно может происходить и тогда, когда при каждом фиксированном значении ме- няющегося параметра осциллятор устойчив. Это еще более удивительно потому, что может происходить при сколь угодно малых изменениях па- раметра. Однако, только при вполне определенных условиях на частоту Рис.21.2. Области по параметрам и s параметрического резонанса (за- штрихованы) и устойчивости парамет- рически возбуждаемого осциллятора, описываемого уравнением Матье (21.4) осциллятора, точнее, на соотношение частоты со исходного осциллято- ра ( 2.9) и частоты v изменения параметра е. Это последнее явление такого же типа, как явление резонанса при вынужденных колебаниях осциллятора, и потому получило наименование параметрического резо- нанса; но если обычный резонанс ( при £= 0 ) происходит при равен- стве частот осциллятора и внешнего воздействия, то параметрический резонанс имеет место при счетной серии соотношений частот, когда co=^v (п = 1,2,...). (2111) Наиболее ярко проявляется параметрический резонанс, отвечающий п = 1, когда отношение частот осциллятора и параметрического воздей- ствия со и v равно 1/2. Именно благодаря этому резонансу мы раскачи- ваемся на качелях, приседая и вставая в два раза чаще, чем качания ка- челей. Приседания и вставания приводят к изменению параметра длины маятника, что также с некоторым приближением описывается уравнени- ем Матье. «Понять» этот основной параметрический резонанс можно с энергетической точки зрения, так как периодическое изменение жестко- сти или изменение длины маятника требует затраты работы, которая пе- реходит в колебательную энергию качания маятника. Для подкачки энер- гии нужно вставать, когда Вас сильнее давит вниз, и приседать, когда это давление меньше* внизу вставать, в верхних положениях приседать Ясно, что при этом мы совершаем работу и значит, раскачиваем качели.
21. Параметрическое возбуждение и стабилизация 173 Параметрическое возбуждение в основном резонансе можно тракто- вать как преобразование колебаний частоты v в колебания с частотой у/2. При обычном резонансе деления частоты не происходит: вынуж- денные колебания происходят с той же частотой, что и внешнее воздей- ствие. Это преобразование частоты широко используется в технике, в гак называемых параметрических преобразованиях частоты. В ряде слу- чаев параметрический резонанс, как и обычный, приводит к крайне не- желательным и даже опасным колебаниям, например, при возбуждении колебаний спаренных колес электровоза, в силу того, что жесткость их соединения зависит от угла поворота колес. Трактуя результаты исследования уравнения Матье, предполагалось, что отсутствует диссипация и <5=0. При обычном резонансе с появлени- ем диссипации амплитуда колебаний становится конечной вне зависимо- сти от величины воздействия. Для параметрического резонанса - это не так. Амплитуда колебаний и при наличии диссипации может расти неог- раниченно. Нужно только, чтобы амплитуда изменения s превосходила некоторый предел. То есть граница неустойчивости располагается не- сколько выше указанной на рис.21.2 линии. Параметрическое возбужде- ние имеет место выше этой линии. Естественно, что эта линия с ростом (5 смещается все выше и выше. Внимательно посмотрим на рис.21.2. На нем области устойчивости и неустойчивости изображены как при со2 > 0, так и при со2 < 0. Штри- ховка относится к областям неустойчивости. Штриховка при со2 > 0 оз- начает параметрическое возбуждение. При со2 < 0 осциллятор неустой- чив и при е= 0, и поэтому при со2 < 0 область неустойчивости примы- кает к оси абсцисс. При со > 0 «носы» областей неустойчивости указы- вают на явление параметрического резонанса, а наличие областей устой- чивости при со2 < 0, напротив, на явление параметрической стабилиза- ции статически неустойчивого осциллятора - перевернутого маятника. На этом рассказ об осцилляторе с параметрическим гармоническим воздействием можно было бы закончить. Однако, отчего же при обычном резонансе даже малая диссипация делает амплитуду вынужденных коле- баний конечной, а при параметрическом резонансе она продолжает неог- раниченно расти? Рассмотрим процесс нарастания амплитуды при обычном резонан- в отсутствии диссипации. Ему соответствует решение дифференци- ного уравнения х + со2х = acoscot (21.12) in нулевых начальных условиях х = х = 0 при t = 0. Это решение лег- । находится и имеет вид: х = A tsin cot, (21.13) е после прямой подстановки выясняется, что А = а / 2со. Таким образом, рост амплитуды при обычном резонансе пропорцио- лен времени. Убывание же амплитуды, вызываемое <5" > 0, экспонен-
174 2! Параметрическое возбуждение и стабилизация циальное. Так что рост амплитуды обязательно приостановится. При па- раметрическом резонансе все иначе. Нарастание амплитуды при неус- тойчивости (А > 1) имеет экспоненциальный характер, и показатель этой экспоненты может быть больше по величине показателя - ё экспо- ненциального затухания. Так что обычный резонанс с помощью дисси- пации можно подавить лишь частично, уменьшив амплитуду. Для пара- метрического резонанса это подавление полное, поскольку превращает неустойчивое равновесие в устойчивое. Однако, если это подавление не- достаточное, то амплитуда продолжает экспоненциально расти. В заключение я, как обещал, продемонстрирую вам параметрическое возбуждение, но только для главного резонанса, когда r= 2бУ, с помо- щью той же знакомой вам сумочки на ремешке. Как видите, я ее подни- маю и, опуская в два раза чаще, чем она может качаться, и она начинает раскачиваться. Затем это раскачивание нарастает, но, конечно, не до бесконечности, так как с ростом ее колебаний становится неприемлемой наша модель.
175 22 НОРМАЛЬНЫЕ КОЛЕБАНИЯ И БИЕНИЯ Ранее мы познакомились с замечательной математической моделью - линейным осциллятором. Его обобщением являются системы взаимодей- ствующих, связанных осцилляторов и линейные динамические системы. Последующий рассказ ознакомит вас с некоторыми новыми явлениями и фактами, относящимися к этим обобщениям линейного осциллятора. Из- ложение не будет носить общего характера, оно ограничится простым примером, осмыслив который, вы все же получите некоторое представ- ление о том, что нового может быть в многомерных линейных динамиче- ских системах. Пример - это две массы, перемещения которых вдоль прямой сдержи- ваются тремя пружинами (рис.22.1 ). Массы одинаковые и равные т, крайние пружины равных жесткостей к. Между массами - пружина же- сткости /л. Если X] и Х2 - смещения масс от их равновесных положений, то дифференциальные уравнения Ньютона непосредственно записыва- ются в виде: тхх = — кхх — //(%! — х2), тх = -кх2 + р(хх — х2) или тх + (к + р)хх = тх, + (к + р)х2 = рхх. (22.1) Рис.22 Л. Два гармо- нических осциллятора, взаимодействующих друг с другом посред- ством упругой связи жесткости р Если в правых частях этих уравнений положить р = 0, то мы придем к ум, никак не связанным между собой линейным осцилляторам. Несу- хтвенным, но упрощающим последующие выкладки обстоятельством ляется то, что осцилляторы, получаемые фиксированием одного из них или Х2 равно нулю), имеют одинаковые частоты со = ^(к + р)/т . Это гественно, и в соответствии с (22.1) наталкивает на мысль рассматри- гь систему (рис.22.1 ) как два взаимодействующих осциллятора: пер- й действует на второй с силой рх1,ъ второй - на первый с силой рх2. ков же будет результат этого взаимодействия? Для того, чтобы отве-
176 22. Нормальные колебания и биения тить на этот вопрос, необходимо найти решение системы ( 22.1). Это де- лается так же, как и для одного линейного осциллятора, путем поиска решений вида X] = а]ел , х2 = а2 е , (22.2) когда обе переменные х/ и х2 меняются пропорционально еЛ1. Такое реше- ние, точнее, отвечающие ему действительные решения, называются нор- мальными колебаниями, т.е. колебаниями, когда все части системы колеб- лются с одной и той же частотой, но, возможно, с разными амплитудами После подстановки ( 22.2 ) в ( 22.1 ) приходим к двум уравнениям: (тЛ2 + k + р.) ai - pia2 = 0, piai + (mA2 + k + pi) a2 = 0. (22.3) Это два уравнения относительно трех неизвестных ар а2п Л. Ясно, что найти их однозначно не удается. Это и сразу было понятно, потому что наряду с решением ( 22.2 ) решением является и любое другое, получае- мое умножением ( 22.2 ) на один и тот же множитель. Исключая пере- менные а] и а2, или, пользуясь общей теоремой линейной алгебры о на- личии у линейной однородной системы ненулевого решения, приходим к характеристическому уравнению для возможных значений Л: mA2 + k + pi -pi - pi mA2 +k + pi Это уравнение легко решается ( так и был подобран пример ) и оказы- вается, что xW = = 0. (22.4) 1,2 = ±iai Д},4 = ±ia>2. (22.5) Теперь, подставляя последовательно в ( 22.3 ) полученные значения 2 ( 22.5 ), находим постоянные ai и а2 с точностью до множителя. При этом следует подставлять найденные значения Л только в одно из урав- нений ( 22.3 ) , так как они линейно зависимы. При Л = Лц 2 имеем piaj-pia2 = ti или а2 - ар При Л = Лз,4 -pici]- pia2 = 0 или а2 — aj. Таким образом, мы нашли частные решения вида х2 = а е,{0'1 X/ = a е,й>1‘ и вида X/ = a е,с°2‘ ico-it х2 = - а е 2 . Им отвечают следующие действительные решения: cos х2 = a coxt sin COS х, = a coxt, sin (22.6)
22. Нормальные колебания и биения 177 cos х, = a ci) ,t, sin cos х = -a a>2t. sin (22 7) Эти решения, при которых обе массы колеблются с одинаковой часто- той, называются нормальными колебаниями. Их частоты разные, ар и, соответственно, бУ?, причем, аь> ар. Для первого нормального колебания амплитуды колебаний обеих масс одинаковы и они колеблются в фазе Во втором - амплитуды тоже одинаковы, но колебания происходили в противофазе. Это означает, что при первом нормальном колебании обе массы колеблются вместе вправо и влево. При втором, напротив, на- встречу друг другу с большей частотой. Любое другое движение рас- сматриваемой системы двух масс или связанных осцилляторов - это су- перпозиция нормальных колебаний (22 6) и (22 7 ). Складывая колеба- ния (22.6) и ( 22 7 ), можно получить много различных графиков, но, пожалуй, самый интересный возникает при бУ/, близком к бУ?, так как при этом наблюдается неожиданное явление последовательной перекачки энергии от одного осциллятора к другому, когда графики изменений х/ и п имеют вид, показанный на рис.22.2. Частоты бУ/ и бУ? близки друг к другу, согласно 22.5, когда // мало, что и будем предполагать. При этом, пользуясь комплексной записью коле- баний, имеем.- X/ = Ci + С2 , х2 = С/ е'ш'‘ -С2 или, несколько преобразовывая эту запись в предположении, что I с, I > I С2 |, х, =0,^(1 + ^^’'), С] о) С1
178 22. Нормальные колебания и биения Каждое из этих колебаний в силу записи ( 22.8 ) и а)] ~ <у2 можно трак-1 товать, как колебание с частотой &>/ и медленно меняющимися амплиту-1 дами, равными величинам С 1 + 2 е’&г-йчу С, находящимся в пределах от /-|с2/С,| до/+|с/с,|. Частота изменения амплитуды мала и равна а>2 - ($1- Мы предположи- ли, что | С/ | > С2 I, при | С/ | < С2 |, аналогично, пришли бык колебаниям частоты <z>2 с медленно меняющейся амплитудой в пределах от 1 -1С2/С11 до 7 + С2/С11. Это подтверждает график рис.22.2 При этом полнота перекачки энергии от одного осциллятора к другому зави- сит от отношения |С2/С,|. При | с, I = | с21 перекачка полная, при С2 = 0 или С/ = 0 она отсутствует, но это имеет место только при нор- мальном колебании с частотой coj или <у2, т.е. в тех случаях, когда массы колеблются вместе, либо навстречу друг другу. Этот простой пример следует рассматривать как введение в разнооб- разный подчиненный принципу суперпозиции мир колебаний связанных осцилляторов и линейных систем, в частности, образующих цепочки, кристаллические решетки или отдельные молекулы, с их затейливыми спектрами нормальных колебаний и многообразием их форм и суперпо- зиций. Качественно новым, пожалуй, будут нормальные колебания в ви- де стоячих и бегущих волн, ярко проявляющихся при большом числе ос- цилляторов. Эти волновые явления перебрасывают мостик от скромного линейного осциллятора к колебаниям распределенных сред, соответст- вующих неограниченно большому их числу. Перейдем к описанию наглядной демонстрации обнаруженного нами явления биений или перекачки энергии от одного осциллятора к другому и обратно. И это, несмотря на малость связей осцилляторов между собой, когда жесткость // мала, но при близости частот каждого из осцилляторов при //=0. Т.е. перекачка энергии от одного осциллятора к другому и об- ратно происходит при близости их частот в условиях резонанса. Это де- лает понятным, почему малая связь влечет значительные последствия, - полную перекачку энергии с одного осциллятора на другой. Эту перекачку можно наглядно наблюдать с помощью двух одинако- вых маятников с общей осью, соединенными между собой слабой пру- жинкой или резинкой ( рис.22.3 ). Если качнуть один из маятников, то он начнет раскачивать другой до тех пор, пока сам не остановится, после чего уже его начнет раскачивать раскачавшийся маятник и т.д. Эта вза- имная раскачка обусловлена малым силовым, но резонансным их взаи- модействием. Аналогичное явление резонансной перекачки энергии можно наблю- дать, когда одна из связей между осцилляторами силовая, а другая - па- раметрическая. Представьте себе грузик, висящий на длинной пружинке
22. Нормальные колебания и биения 179 Рис.22.3. Упруго связанные ос- цилляторы в виде маятников Рис.22.4. Маятник с упругим подвесом, как два связанных ос- циллятора: от х/ к Х2 связь пара- метрическая, от х2 к X/ - силовая Он может качаться вверх и вниз, а может еще колебаться, как маятник (рис.22.4). Частоты этих колебаний разные, и пусть все подобрано так, то частота колебаний в два раза больше частоты качаний. Тогда при ко- лебаниях грузика периодически меняется длина маятника и происходит параметрическое возбуждение его качаний за счет, естественно, его ко- лебаний. Далее, качания маятника вызывают колебания грузика, так как сила инерции имеет частоту, удвоенную по отношению к качаниям маят- ника. Все это приводит к очень интересной и красивой последовательно- сти переходов от колебаний к качаниям и обратно - от качаний к колеба- ниям. В заключение мне хотелось бы подчеркнуть, что формальная матема- тическая сторона нашей сегодняшней лекционной беседы в основном вам хорошо известна из курса дифференциальных уравнений: вас там научили, как решаются системы линейных дифференциальных уравне- ний с постоянными коэффициентами. В этом плане ничего нового вы не услышали. Но мы придали некоторую образность тому, что делали, введя понятие нормального колебания, его частот и форм, и представляя любое движение как суперпозицию нормальных колебаний. Чтобы ощутить по- лезность этих общих наглядных представлений, попробуйте выяснить, каковы возможные колебания трех равных масс, насаженных без трения на круговое кольцо при условии, что сила притяжения каждой пары масс друг к другу, за счет сближающих их пружин, пропорциональна углу между ними. По общим правилам эту задачу можно решать долго и нуд- но а пользуясь образным представлением нормального колебания, ре- шение потребует не более строчки.
180 23 СТАБИЛИЗАЦИЯ ПЕРЕВЕРНУТОГО МАЯТНИКА Я хочу рассказать вам об универсальном методе, который позволяет кардинально менять свойства разнообразных объектов, на простом при- мере превращения неустойчивой, всегда падающей, вертикально стоящей палочки в устойчивую, саму по себе стоящую. Этот универсальный ме- тод, широко используемый живой природой и человеком, называется управлением. Вертикально поставленная палочка стоять не может. Она обязательно упадет. Заставить ее не падать могут в цирке. Это делают жонглеры едва заметными перемещениями ее точки опоры. Они меняют положение ее точки опоры так, что палочка или другой предмет стоит вертикально и не падает. Как они это делают? Попробуем это понять, по- строив математическую модель стабилизации вертикального маятника. Рис.23.1. Перевернутый маятник с углом ср отклонения от верхнего неус- тойчивого положения Итак, перед нами плоский маятник с перемещаемой точкой опоры ( рис.23.1). Угол отклонения маятника от вертикали пусть (р, а горизон- тальное смещение точки опоры в плоскости качания маятника - и Дли- на маятника I, масса т. Найдем функцию Лагранжа и составим с ее по- мощью уравнения движения. Непосредственно находим координаты х, у масссы т маятника х = и -1 sincp, у = I cosy). Далее находим кинетическую и потенциальную энергии ТП Г. . . . ч2 ,2 • 2 • 2 1 "2 . 2 л» • »2*2\ Т = — [(«-Itpcoscp) +1 ф sm (р\= — (и -21ифсо$(р + 1 ф ), К = mgy = mgl cos ^9 и функцию Лагранжа /72 L = T-V =—(ti -Uii<pcos<p + lz<p)-mglc.os<p. (23.1)
23 Стабилизация перевернутого маятника 181 Составляем уравнение Лагранжа d dL dL =() dt dip d(p В рассматриваемом случае dL .. ,2 . dL .. . . . . — = -mlucos(p + ml ф, — = mliMpsintp + mglsintp, dф dtp и поэтому уравнение (23.2 ) принимает вид: - mill cos (р + т1йф sin (р + т12ф - mhup sin (р - mgl sin <р = О или (23.2) .. g . й ф~ —sm$? = — cos (9. Ограничимся малыми углами (р и упростим это уравнение, записав его в виде: ф-^<р = -й. (23.3) При и = 0, т.е. при неподвижной точке опоры маятника, уравнение (23.3) переходит в хорошо нам известное уравнение маятника, линеари- зованное вблизи верхнего неустойчивого положения равновесия. Это не- устойчивое равновесие типа седла. А мы хотим, чтобы оно стало устой- чивым равновесием типа узла или фокуса. Как этого достигнуть? Вос- пользуемся возможностью выбора смещения и точки опоры, возможно- стью управлять ее положением. Как это нужно делать, мы не знаем, но хотим, чтобы уравнение ( 23.3 ) превратилось в уравнение ф + 28ф + а>2(р = 0 (23.4) осциллятора с устойчивым положением равновесия (р = 0, т.е. чтобы ма- ятник, стоя кверху, вел себя так же, как если бы он висел вниз и колеба- ния его затухали ( 8 > 0 ). Сравнивая ( 23.3 ) и (23.4 ), находим, что для этого нужно, чтобы u = -(g + la)2)(p-2l&p. (23.5) Реализовать такое и можно, наблюдая за маятником и измеряя его от- клонение ср и скорость отклонения ф и сообщая точке опоры ускорение й согласно формуле (23.5 ). Способ управления, задаваемый формулой ( 23.5 ), называют страте- гией управления. Как уже говорилось, для ее реализации нужно измерять <рн (р, и, естественно, прикладывать к точке опоры силу, которая бы со- общала точке опоры требуемое ускорение й. Таким образом, для реали- зации управления нужна измерительная и исполнительная системы. В цирке обе эти функции с успехом выполняет жонглер. Описанный процесс управления можно изобразить схемой, показан- ной на рис.23.2. Схема включает объект управления - перевернутый ма- ятник, на который можно воздействовать, перемещая его опору; систему измерения угла (р и угловой скорости ф; систему управления, реализую-
182 23. Стабилизация перевернутого маятника щую стратегию управления и силовое воздействие, передвигающее опо- ру перевернутого маятника и сообщающее ей требуемое стратегией управления ускорение. Рис.23.2. Принципиальная схема стабилизации стоя- щего вертикально вверх ма- ятника, отображающая основной принцип управле- ния - обратную связь Что же собою представляет стратегия управления ( 23.5 )? Она линей- на по <р и ф, так что й = - а (р-Ъ ф, причем, требуется для устойчи- вости, чтобы а > g, ab > 0. При b = 0 перевернутый маятник также ус- тойчив, но его колебания возле равновесия не затухают, так как они опи- сываются осциллятором ( 23.4 ) с б = 0. Первый член стратегии управления сир - это управление по отклоне- нию маятника (р. Согласно этому члену, основание маятника нужно пе- ремещать ускоренно в ту же сторону, что и наклон маятника, т.е. при ср > 0 й < 0, а при (р < 0 й > 0. Следующий член корректирует величину ускорения й, учитывая уг- ловую скорость вращения маятника. Если маятник движется в ту же сто- рону, что и его отклонение, то это приводит к увеличению необходимого ускорения й по сравнению с членом а ср, напротив, если он движется в сторону, обратную по отношению к отклонению, то это ускорение уменьшается по величине, становясь меньше сир. Перейдем теперь от жонглирования палочкой к управлению лодкой ( судном или кораблем ). Целью управления является поддержание опре- деленного курса ее движения, а средством воздействия - руль. Если ру- лем не управлять, то лодка может двигаться в любую сторону или, вооб- ще, все время будет менять курс. Построим математическую модель движущейся со скоростью v лодки и модель ее управления, т.е. модель движения управляемой лодки. Пусть лодка движется с постоянной скоростью v, так что сила сопро- тивления ее движению компенсируется силой тяги весел или гребного винта. Если набегающий на лодку поток направлен точно вдоль ее кор- пуса, то никакой момент сил не возникает. Момент сил ( пусть относи- тельно ее центра масс ) возникает только тогда, когда набегающий поток отклоняется от продольной оси лодки, от направления ее киля. В грубом приближении угол расхождения скорости движения центра масс лодки и направления ее продольной оси определяется скоростью ее вращения ф
23. Стабилизация перевернутого маятника 183 и вызывает момент, равный-Л (р, где, в зависимости от конструкции лодки коэффициент h может быть положительным или отрицательным. При этом изменение угла (р поворота лодки относительно ее центра масс, без учета воздействия руля, описывается уравнением вида: J(p — ~h(p^ (23.6) где J - момент инерции лодки. Как видим, лодка, как объект управления, представляет собою осциллятор с нулевой жесткостью. Интегрируя уравнение ( 23.6 ), находим, что Jtp + h(p = const. (23.7) Наличие первого интеграла ( 23.7 ) позволяет непосредственно указать фазовые портреты лодки, движущейся без руля, изображенные на рис.23.За, б. Рис.23.За относится к h > 0, а рис.23.3б - к h < О В обоих случаях лодка имеет множество равновесий, отвечающих фазовым точ- кам оси ф = 0, при которых лодка движется с постоянной скоростью под некоторым постоянным углом <р. При h> 0 эти равновесия устойчи- вые и любое движение лодки переходит в движение в каком - то посто- янном направлении. Напротив, при h< 0 состояния равновесия неустой- чивы и лодка стремится быстрее и быстрее вращаться ( рис.23.36 ). Так как наше линеаризованное упрощенное уравнение (23.6 ) справедливо только для не очень больших ф, то сказанное нужно понимать, как то, что лодка не может придерживаться определенного курса и обязательно будет вращаться. Рис.23.3. Фазовые портреты неуправляемого объекта управления (кораб- ля или лодки): а) устойчивого и б) неустойчивого При h > 0 состояния равновесия устойчивые, но эта устойчивость не асимптотическая и малейшее возмущение движения лодки вообще при- водит к неустранимому изменению направления движения лодки. Примем, что (р=0 отвечает требуемому курсу движения лодки, Из предыдущего следует, что ни при h> 0, ни тем более h < 0, лодка не может устойчиво придерживаться заданного курса ср = 0. Для того, чтобы лодка его придерживалась, надо ею управлять, на- пример, с помощью руля. Пусть - угол отклонения руля (рис.23.4 ).
184 23. Стабилизация перевернутого маятника При \рф 0 давление текущей воды на руль создает вращающий момент и уравнение ( 23.6 ) заменится уравнением J(p + h<p = -kip. (235) Рис.23.4. Лодка (корабль), уклонив- шаяся на угол (р, с рулем, повернутым на угол ip (23.9) Такое уравнение приемлемо, конечно, только при не очень больших у/. Уравнение (23.8 ) предполагает ф и ^/малыми, а (р может быть любым. Для придания лодке нового свойства асимптотической устойчивости движения по требуемому курсу (р = 0 используем ту же стратегию, что и для жонглирования палочкой, а именно, примем, что ip = аср + Ьф t Подставляя ( 23.9 ) в ( 23.8 ), находим, что Зф + (к + Ь)ф + ксир = 0. (23.10) Состояние равновесия (р - 0 этого дифференциального уравнения - линейного осциллятора - будет устойчивым, если все коэффициенты его характеристического уравнения JX2 + (h + b)X + ka = O (23.11) положительные, т.е. при выполнении условий h + Ь> 0, ка> 0, кото- рые нетрудно выполнить, выбирая соответствующие а и Ъ, а>0, b>-h. (23.12) Итак, лодка, управляемая стратегией (23.9) при условии (2312), асимптотически устойчива на курсе. Смысл стратегии при условии ( 23.12 ) прост. Он такой же, как и в случае жонглирования палочкой, но, если ранее требовалось достаточно большое значение параметра а, то теперь при h< 0 это требование налагается на параметр Ь. Из этого сле- дует, что лодкой с h > 0 управлять сравнительно просто. Напротив, при h < 0 это становится достаточно сложным, ибо требуется достаточно большое и правильное реагирование на скорость вращения лодки. Для этой правильной реакции есть даже свое название, нужно вовремя энергично «одерживать» уходящую с курса лодку. Если лодка сама по себе устойчивая (h> 0), то управление ею выглядит так: лодка влево - руль вправо, лодка вправо - руль влево. При h < 0 стратегия управления значительно сложнее, главным в ней является идея «сдерживания», «сдерживания» даже при $9=0, если ф*0. Вернемся к жонглированию палочкой. Но прежде, чем продолжить рассмотрение, отметим, что цирковое жонглирование имеет много обще- го со стабилизацией вертикального взлета и разгона ракеты. Как и палоч-
23. Стабилизация перевернутого маятника 185 ка, ракета неустойчиво торчит вверх и подпирается снизу реактивными двигателями. Конечно, для нее нужны более точные и полные модели, но в принципе, все так же, как и для палочки. А более точные модели - хотя бы потому, что, возможно, нужно учесть упругость корпуса ракеты, влияние ее колебаний на показания измерительных приборов и процесс стабилизации, запаздывания реализации наблюдения и управления и, возможно, многое другое. Все же снова о стабилизации перевернутого маятника. Стратегия (23.5) поддерживает вертикальность перевернутого маятника, но при этом его точка опоры может значительно смещаться, не имея тенденции к возврату. Спрашивается, а можно ли стабилизировать верхнее положе- ние маятника, сделав одновременно асимптотически устойчивым и ис- ходное положение точки опоры. Попробуем применить к этой более требовательной задаче стратегию такого же вида, как и ранее, т.е. линейную по фазовым переменным объ- екта. Итак, мы хотим стабилизировать маятник не только по (р, но и по координате точки опоры и. Теперь фазовыми переменными маятника с перемещающейся точкой опоры будут переменные ср, <р и и, й, для ко- торых примем уравнения й = а<р + Ьф + си + dii, 7 где стратегия управления, как и ранее, линейная функция всех фазовых переменных. Задача существенно осложнилась. Характеристическое уравнение, от корней которого зависит устойчивость, не второго, а четвертого порядка. Найдем его. Из (23.13) непосредственно находим характеристическое уравнение в виде определителя A2-g/Z -22/Z =() а + ЬЛ c + dA — A2 или, раскрывая определитель, Л* +(-d + y)A3 +(-с-^- + у)Л1 +г^Л + сЛ = С. (23.14) Корни этого уравнения за счет выбора параметров а, Ъ, с и d можно сделать любыми. Это следует из того, что свободный член любой за счет выбора с, коэффициент при А - за счет выбора d, коэффициент при А 2 - за счет выбора а и, наконец, коэффициент при Л3 - за счет выбора Ь. Таким образом, подходящая стратегия вида и = а(р + Ь(р + си + dii, при которой все корни уравнения ( 23.14 ) лежат слева от мнимой оси, обеспечивает требуемую стабилизацию перевернутого маятника. Под- черкнем, что при с = d = О, т.е. при стратегии управления и = -а<р - Ьф
186 23. Стабилизация перевернутого маятника характеристическое уравнение имеет два нулевых корня и равновесия ср = О, и = 0 неустойчиво, что приводит к уклонению и от нуля. Рассмотрим еще вопрос о так называемой левитации, т.е. бесконтая ном устойчивом "подвешивании" тела в некотором месте. Согласном генде, так висит в какой - то пещере гроб Магомета. Сразу же приходи мысль сделать это с помощью магнитов, т.е. вывесить железный предай или содержащий железо магнитами. Однако, есть общая теорема, кото! рая это запрещает, но ферромагнитный шарик можно устойчиво поде! сить с помощью управления, используя такую же стратегию управлении как и ранее. Это очень соблазнительно, так как бесконтактная подвес! позволяет создавать многие новые высокоточные измерительные прибн ры и другие устройства, избавленные от неточностей и диссипаций, вы- зываемых трением, не говоря уж об отсутствии подчас нежелательных контактов с другими телами. В детстве, возможно, вы безрезультатно пытались "вывесить" перни ко (или какой — либо небольшой железный предмет) магнитом: при этом перышко неизменно либо падало, либо прилипало к магнит)! Управлять можно положением магнита, но значительно проще заменим магнит электромагнитом и управлять его током I. При этом, как и ранее] нужна измерительная система положения и скорости вывешиваемого те- ла, а стратегия управления может состоять в изменении тока как линем ной функции этих измерений. При подходящем подборе параметров теля "свободно" и асимптотически устойчиво висит. Висящее тело можно по- трогать пальцем и почувствовать, что оно упирается, не желая менян! своего места. Можно его завертеть и оно будет долго вращаться, так ш трение о воздух незначительно. Можно трение уменьшить, откачав воз- дух, и тогда оно будет вращаться еще дольше. Мы рассмотрели жонглирование (стабилизацию ) одного переверну! того маятника, но нельзя ли таким же путем жонглировать с несколькими поставленными друг на друга маятниками, управляя положением точки опоры только самого нижнего. Кажется, что это нельзя сделать: верхние маятники упадут. Но посмотрим, что дает математическая модель. Огра- ничимся двумя маятниками с равными длинами и массами, которые без! потери общности примем единичными. Рис.23.5. Двойной маятник с уклонениями от вертикали на углы д)] и <р? соответственно В обозначениях рис.23.5, полагая, без ограничения общности, т = 1= 1, непосредственно находим, что функция Лагранжа L с учетом
23. Стабилизация перевернутого маятника 187 последующей линеаризации, т.е. сохранения в дифференциальных урав- нениях Лагранжа только членов, линейных относительно </?/, (р2, ф2. равна L = ^-(2ii2 -4йф]-2йф2 + 2ф2 +ф2 +2ф1ф2) + g(p2 + ^-<р2. Откуда непосредственно находим, что имеют место уравнения: 2^, + ф2 - 2w - 2g(px = 0, + ф2 -u-gcp2 =0 или -^-Ш+28₽2=0, (2315) Фх + ф2 -U~g(p2 =0. Как и ранее, примем стратегию управления в виде линейной функции всех фазовых переменных, т.е. й = а{<р} + Ьх(рх + а2(р2 4- Ь2(р (23.16) Составим характеристическое уравнение системы (23.15) с учетом (23.16) -2g -A2+2g =() A2-g-a2-b2A или Я4 -b$ -(«! + 4g)A2 + 2g(6, + b2)A + 2g(g - flj + a2) = 0. (23.17) Из вида характеристического уравнения ( 23.17 ) следует, что коэффи- циенты при ЛД Л,2, Л и Л° могут быть любыми при соответствующем вы- боре параметров стратегии управления b /, а /, b ; и а 2- Таким образом, стабилизация двух поставленных друг на друга пало- чек возможна и для этого достаточно надлежащим образом перемещать нижнюю точку опоры в соответствии со стратегией управления (23.16 ). Вместе с тем следует иметь в виду, что эта и предшествующие модели составлены в предположении идеальности как измерительной,так и ис- полнительной систем управления, т.е. что измерительная система доста- точно точно и своевременно находит значения фазовых переменных, а исполнительная система быстро и точно реализует требуемое управление (ускорение точки опоры, угла поворота руля ). При этом из рассмотрен- ных нами математических моделей не ясно, в какой мере можно укло- ниться от этих идеальных требований, как и то, каким образом их можно осуществить. Едва ли в общем курсе целесообразно сколько-нибудь подробно рас- сматривать эти сами по себе важные вопросы - это удел специальных курсов. Поэтому ограничимся сказанным и примером учета неизбежных задержек (запаздываний в измерении (р и ф и реализации управляющего ускорения w) при стабилизации вертикального положения маятника. В отсутствии этих задержек уравнение движения системы управления име- ло вид (уравнения ( 23.3 ) и ( 23.5 ) )
188 23. Стабилизация перевернутого маятника ф-^ф = -а-Ьф. Учитывая временную задержку т измерений ф и ф и реализации управления, заменим их уравнением ф(1)-уф(1) = -аф(?-т)-Ьф&-т). (23.18) Его характеристическое уравнение, составляемое обычным образом, полагая ф = е Л *, имеет вид: Л2-у + ае гА + ЬЛе~т2 = 0. (23.19) Для того, чтобы система управления, описываемая линейными диффе- ренциальными уравнениями с запаздываниями ( 23.18 ), имела устойчи- вое состояние равновесия ф = 0, как и в случае обыкновенного диффе- ренциального уравнения, нужно, чтобы корни его характеристического уравнения ( 23.19 ) лежали слева от мнимой оси, т.е. удовлетворяли ус- ловию Re Л < 0. Расположение корней характеристического уравнения ( 23.19) зависит от параметров стратегии управления а и Ь. При отсутст- вии запаздывания, когда г= 0, устойчивость имеет место при a>g/l, b> 0. (23.20) Рис.23.6. Область стабилизируе- мости перевернутого маятника и ее зависимость от запаздывания г реа- лизации линейной стратегии управ- ления. Граничные кривые 0, 1, 2 и: соответствуют возрастанию за- паздывания. При т=0 область ус- тойчивости a>g/l, b>0; при т, отве- чающим граничной кривой 3, об- ласть устойчивости исчезает Как обнаруживает соответствующее исследование, с методикой кото- рого вас познакомят в курсе теории управления, при т малых, меныпих у]21 / g , область устойчивости по параметрам управления а и b сущест- вует и имеет вид, показанный на рис.23.6. При т 0 эта область устой- чивости стремится к области Do, определяемой неравенствами ( 23.20). При увеличении т область устойчивости по параметрам а и b рис.23.6 уменьшается (Z)/) и при т= т* = -^21/g исчезает. При т> г* ее нет. Из сказанного следует, что для того, чтобы жонглирование было ус- пешным, нужно не только правильно выбрать параметры а и b стратегии управления, но и реализовать измерения и управление достаточно быст- ро. Эта быстрота должна быть тем большей, чем меньше длина палочки. Пытаясь жонглировать очень короткими палочками, вы неизбежно по-
23. Стабилизация перевернутого маятника 189 терпите поражение и по этой наименьшей, доступной вам длине успеш- ного жонглирования, можете судить о быстроте выполнения вами тре- буемого управления и, конечно, одновременно и об умении подобрать требуемую стратегию управления. Для палочки ( шариковой ручки ) длиной 16 сантиметров мне это ни- как не удавалось. Осуществление жонглирования представлялось безна- дежным Она падала раньше, чем я успевал что-либо сделать для предот- вращения ее падения. Критическое значение запаздывания для такой па- лочки равно примерно т ~ 0,17 с. Для т = 0,3 соответствующая длина равна I = 45 см. Такой палочкой жонглировать уже удается. Я имею в ви- ду себя. А как у вас? При желании вы можете сопоставить т , получаю- щиеся для вас из экспериментов жонглирования, с прямым измерением времени вашей реакции, которое вы можете провести с кем-нибудь из своих знакомых, располагая обыкновенной линейкой. Причем, интерес- но, что по такой же формуле т= д/2/ / g , где / - минимальная длина па- дающей между вашими большим и указательным пальцами линейки, ко- торую после отпускания на ваших глазах, вам еще удастся зажать и не дать упасть. У меня вышло примерно 20 см, что отвечает т ~0,2 с. Мы познакомились на простых примерах с величайшей придумкой природы и человека - управлением, без которого жизнь была бы невоз- можна. Человек управляет своим поведением, с помощью управления через энзимы он осуществляет биохимические процессы в своем орга- низме; зажигая электрический свет в темной комнате? он, нажатием вы- ключателя, управляет электрическим током; поворачивая руль, управля- ет велосипедом, а, нажимая на педали, заставляет его ехать; руками и но- гами управляет автомобилем, произнося команды, через других людей управляет производственными процессами; посредством нервной систе- мы управляет сокращением и расслаблением мышц и, тем самым, дви- жением своего тела, биением сердца, дыханием, сокращениями и пери- стальтикой кишечника, поступлением в желудок и двенадцатиперстную кишку необходимых для пищеварения веществ. Посмотрите, как красиво бежит или скачет лошадь, грациозно перемещается и движется кошка - это тоже благодаря управлению. А мимика нашего лица, отражающая внутренние психологические процессы, обогащающая наше общение, да сама наша речь возможна только благодаря управлению голосовыми язками, горлом и артикуляцией рта. Человек создал и разработал новую науку — теорию управления, и она щсказала ему, как построить автопилот, авторулевой, как управлять [ерным реактором, полетом самолета, работой станков и механизмов, к создать системы связи и передачи информации и как управлять раке- й и своей собственной жизнью на земле, что наиболее трудно и еще леко от совершенства. Да и сама наша жизнь возможна лишь благодаря фментам, управляющими биохимическими реакциями в нашем орга- (зме, и нервной системе, управляющей сердцем и нашими органами, и действиями.
190 24 УПРАВЛЯЕМЫЙ МАЯТНИК И ДВУНОГАЯ ХОДЬБА В предыдущих лекциях я вам рассказывал об управлении на примера жонглирования, - стабилизации одной и двух вертикально стоящих па- лочек, - и управления курсом лодки. С этим вы встречаетесь, но сравни- тельно редко. Сейчас я вам расскажу тоже о конкретном феномене управления, но с которым вы в содружестве все время, пользуетесь ил каждый день. Хотя жонглированием вы занимаетесь тоже каждый день, поддерживая свое вертикальное положение, но модели этого жонглиро- вания другие, чем мы рассмотрели. Простейший вид жонглирования своим телом - вы стоите, опираясь иг обе ноги. Стоите вы вполне уверенно, но все же немного, еле замета покачиваясь. Прислушавшись к себе, можно заметить, как меняются уси лия в опорных ногах. Это подсказывает следующую модель управления! виде вертикального маятника, в неподвижной точке опоры которого име ется управляющий момент М. В каждой из двух перпендикулярных плос костей имеют место линеаризованные уравнения вида: (р-~(р = —^—М . I ml2 Согласно предыдущему ясно, что стратегия, обеспечивающая ваи вертикальное положение, может быть очень простого вида: М = а ср + b ф. Но стоять вертикально вы можете, не только опираясь на подошв обеих ног, но и встав на носки, т.е. опираясь на маленькую площадку, i позволяющую вам создать момент М. Вы это делаете, двигая руками корпусом, а если стоите на одной ноге, то и другой свободной ногой, этом случае оказывается, что для стабилизации вертикального полож! ния достаточно одного управления корпусом. В качестве упрощение модели такого жонглирования примем двойной маятник с закрепление точкой опоры и управляемым моментом М в их сочленении. Для напис ния математической модели в этом случае можно воспользоваться пол ченными ранее формулами для управляемого двойного маятника, пол жив в них и = 0 и добавив к правым частям моменты М и -М соотве ственно. В упрощенном линеаризованном виде, согласно формулам, и посредственно предшествующим (24.5), имеем: 2<p,+<p2-2g^ = М, Стратегию управления в соответствии с предыдущим возьмем сящей от всех фазовых переменных, т.е. от (р{ ,фх (р2 ,ф , так, что
24 Управляемый маятник и двуногая ходьба 191 М = ах(рх + Ъхфх + а2(р2 + Ь2ф2. Это приводит к характеристическому уравнению 2Я2 - 2g - ах - ЬХЛ Z2 - а2 - 62Л Л2 +ах + ЪХЛ Л2 - g + а2 + Ь2Л или А4 + (ЗЬ2 -2ЬХ)Л3+ (За2 -2ах -3g^ 2+(bx -2Ь2^Л +g(2g-ax -а2) = 0. Коэффициенты полученного характеристического уравнения за счет вы- бора ai, b], ci2, Ъ2 могут быть любыми и поэтому при надлежащем их вы- боре асимптотическая устойчивость равновесия <pi = ф2~ О обеспечива- ется Итак, жонглирование двумя стоящими друг на друге перевернутыми маятниками при закрепленной опоре возможно с помощью линейной стратегии управления моментом М в шарнирном соединении маятников. Природа тоже нашла такие стратегии и они вырабатываются у нас после рождения в процессе обучения и, возможно, что-то заложено генетиче- ски. Таким образом, стоять мы умеем. Но мы умеем еще и ходить. Природа ходьбы кажется очень сложной: в ней участвуют многие десятки мышц нашего тела. Вместе с тем феномен ходьбы в своем простейшем виде - это не более, чем автоколебания, при которых все периодически повто- ряется. Добиться генерации колебаний, как это было видно на примере часов Галилея-Гюйгенса и генератора электрических колебаний, рас- смотренных ранее, можно с помощью обратной связи, управления, осу- ществляемого обратной связью. Выше указывались и многочисленные другие примеры применения управления и обратной связи для достиже- ния требуемых свойств различных объектов. Пожалуй, управление и об- ратная связь по достоинству должны быть произведены в некий принцип обратной связи. Именно так сделал Н.Винер и провозгласил новую, ос- нованную на нем, науку кибернетику. Но вернемся к двуногой ходьбе. Рассказ об этом феномене начнем из- далека. Мы рассмотрели и поняли, как жонглер заставляет не падать вер- тикально стоящую палочку: он ею управляет. Управляет, перемещая ее точку опоры в зависимости от ее движения. Ясно, что это не единствен- ный способ управления перевернутым маятником. Маятником можно управлять и иначе. Например, подсоединить к концу маятника еще одно звено и поддерживать его направление постоянным. Не задумывайтесь над тем, зачем это нужно, лучше сначала разберемся, что из этого после- дует. Итак, перед нами двойной маятник (рис.24.1). Его звенья имеют дли- ны li и Ь', массы, которые ради простоты сосредоточим на концах пало- чек, mi и т?, углы звеньев с вертикалью (pi и (р2. В сочленении звеньев маятника находится управляющее устройство, которое с помощью мо- мента М между подсоединенным звеном и маятником поддерживает угол (р2 постоянным, равным а. Момент М нам неизвестен, но известно, что
192 24. Управляемый маятник и двуногая ходьба система уравнений справляется со своей задачей, так что угол (р посто- янно равен а. Составим математическую модель этого причудливо управляемого перевернутого маятника. Рис.24.1. Двойной маятник Маятник с подсоединенным звеном - это двойной маятник. С ним вы уже встречались, когда рассматривали жонглирование двумя, стоящими одна на другой, вертикальными палочками. Сейчас нас интересует дру- гое: как будет двигаться маятник под воздействием описанного управле- ния. Пусть х/, у 1 и Xi, у2 ~ координаты точечных масс т{ и mi. Непосред- ственно из рис.24.1 находим, что X/ = -1/ sin (pi, у/ = 1/ cos ф], Х1 = - Il sin (pl —11 sin (pi, У2 = I] COS (pi + /2 COS (p2. Далее находим кинетическую энергию Т и потенциальную функцию - V сил тяжести: т = \(т\ + m2)l2(p2 +т21]12ф]ф2со5((р] ~<р2) + ^т2122<р22, V = (т{ +m2)gl} cos^?! + m2gl2 cos$> . Обобщенные силы Q/ и Q2, отвечающие моменту М управляющего устройства, равны Qi = М, Q2 =-М. Теперь мы знаем функцию Лагранжа и дополнительные обобщения силы и можем написать уравнения Лагранжа: (т} + т2)12ф} + т21}12ф2 cos(^ -(р2)- т21112ф2(ф1 ~Ф2)51п(<Р1 ~<Р2)+ + т21112Ф1Ф2 sin( (Pi~(P2)-(mi^m2 )lig sin <Pi=M, m2l2(p2 + т21х12фх CQs{(px -(p2)- т21112(ф1 -ф2)ф{ sin((p, -(p2)~ - m2ltlrf)pp2 sin((pt ~(p2)~ m2l2gsin (p2 = -M или, учитывая, что (p2 = а (ф2 = ф2 = 0) (ml+m2)ll2ipl-(ml+m2)l,gsin<pl=M, т21112Фг cos((pj - a) - m2ljl2ф 2 sin((pt -a) - m2l2gsina = -M. Эта система уравнений определяет изменение угла (pi маятника с вер- тикалью и управляющий момент М. Исключая из этих уравнений неиз- вестный момент М, приходим к уравнению для угла (ph Опустив у угла
24. Управляемый маятник и двуногая ходьба 193 р/ индекс, запишем получившееся дифференциальное уравнение второго порядка в виде: [(т, + m2)l2 cos((p -а)]ф - (24.3) -т21]2ф2 sin(^9 - а) - (тх + m2)glx sin<p- m2gl2 sin а = 0. Для любого решения уравнения (24.3) каждое из уравнений (24.2) можно использовать для нахождения момента М. Приступим к изучению решений - фазового портрета - уравнения (24.3). Прежде всего приведем его к виду: [1+Kcos((p - а )]ф - кф2 sin( (р-а)-со2 sincp- ксо2 sin а = 0, (24.4) содержащему только два параметра лги со к ^=1.. тх + т2 Zj Z] При к= 0 уравнение (24.4) превращается в уравнение маятника, ко- торый при (р-0 стоит вертикально вверх. Оказывается, что уравнение (24.4) можно проинтегрировать. Для этого умножим его на [1+ kcos( (р- а)](р. [ 1 + к cos((p-а)]2фф -к[ 1 + кcos((р-а)]ф3 sin((р-а)- -со2 [1 + к cos( (р - а)]ф sincp - ксо2 [ 1 + к cos( (р-а )]ф sina = 0 и преобразуем к виду: {[ 1 + kcos(ср-а)] (р }- [1 + кcos((p-а)Jco (sin(р + к sina )(р = 0. 2 dt Интегрируя, находим, что [l + Kcos((p-a)]2 ф2 +F((p) = h, (24.5) где h - постоянная интегрирования и F(<p ) = -2(о2 J /7 к cos( ср-а )](sin (р + к sin a )dcp = АГ = 2со2[cos(p--cpsinaA—cos(2(p — a) — K2 sinasin((p —a)] . 2 4 Разрешая (24.5) относительно ф, имеем Ф = ------(------(24.6) 1 + к cos( (р- а) Как вы уже знаете, построение фазового портрета, согласно (24.6), сводится к нахождению графика функции F((p). Однако, при к> 1 воз- можно неограниченное возрастание угловой скорости при приближении угла <р к значению, при котором 1+ kcos( ср- а) = 0. (24.7) Этот неожиданный феномен проистекает оттого, что для реализации требуемого управления управляющий момент М неограниченно растет, так как из уравнений (24.2), исключая ф, находим, что М=--—— -------[ф2 sin((р-а) + со2 sina-co2 sin(pcos((p-а)] , (24.8) l+Kcos(<p-a)
194 24 Управляемый маятник и двуногая ходьба где (pi заменено на ср. Реализация неограниченного момента невозможна, и поэтому невоз- можно соблюдение условия ф2 = аи мы вынуждены, если хотим изу- чить этот случай, внести коррективы в рассматриваемую математиче- скую модель. Эта корректировка может, например, состоять в том, что при достижении I М | некоей предельной величины М = Л/sign М до тех пор, пока М, определяемое из (24.8), не окажется по модулю меньше М. При этом углы (pi и (р2 определяются из уравнений (24.1). Однако, ограничимся случаем, когда описанное явление не имеет места. Отметим только, что это явление подобно удару и приводит к очень быстрым из- менениям скоростей ф, и ф2. Как уже отмечалось, для построения фазового портрета достаточно располагать графиком функции F(<p), определяемой формулой (24.5). Вид графика функции F(cp) зависит от двух параметров к и а. Доста- точно очевиден его вид при малых к и а. На рис.24.2 приведен его вид при а> 0. Согласно этому графику функции F(cp), построены фазовые траектории, определяемые уравнением (24.6) при разных А, совокупность которых дает фазовый портрет на цилиндрическом фазовом пространст- ве, изображенном на рис.24.3. Рис.24.2. График функции F((p) в формуле (24.6) Рис.24.3. Фазовый портрет на развертке цилиндра управляемого двухзвенно- го маятника, получаемый с помощью графика функции F((p)
24. Управляемый маятник и двуногая ходьба 195 На этом фазовом портрете два состояния равновесия О и Ор Равнове- сие^ (р= (р), где (р находится из условия sin ср -- к sin а, неустой- чиво и отвечает положению маятника, показанному на рис.24.4, т.е. пе- ревернутому маятнику. Равновесие Ор отвечающее тому же условию, соответствует маятнику, висящему вниз. Это равновесие устойчиво. Воз- ле этого устойчивого равновесия возможны колебания. Они соответст- вуют замкнутым фазовым траекториям, изображенным на рис.24.3 об- ласти, содержащей равновесие О/. Все остальные фазовые траектории, кроме граничных траекторий, се- паратрис седла О, отвечают движениям с неограниченно возрастающей скоростью вращения маятника ((р со). Это неожиданный эффект управления вторым звеном маятника: стремление поддерживать второе звено под одним и тем же углом а к вертикали приводит к ускоренному вращению основного звена маятника. Рис.24.4. Положение двухзвенного маятника, отвечающее неустойчивому равновесию (точ- ка О на фазовом портрете рисунка 24.3) Мы привыкли, что маятник можно завращать, подталкивая его в одну и ту же сторону, сильно крутнув рукой непосредственно или с помощью ременной или зубчатой передачи. В этих случаях воздействие на маятник носит внешний характер. Но, оказывается, это можно сделать и иначе, с помощью подсоединения к нему управляемого маятника. Это приводит к тому, что основной маятник все быстрее и быстрее крутится. Конечно, такое неограниченное раскручивание предполагает отсутствие диссипа- ции (вязкого и сухого трений). При учете диссипации, например, не- большим вязким трением, возникает устойчивое вращение Г с некоторой скоростью, как это видно из рис.24.5. В области, охватываемой кривой, составленной из сепаратрис седла О, все фазовые траектории неограни- ченно приближаются к устойчивому равновесию Ор Равновесие О, по- прежнему, неустойчивое седло. С дальнейшим увеличением коэффици- ента трения все движения сходятся к устойчивому равновесию О]. Нас будет интересовать случай, когда имеется устойчивое вращение Д что соответствует фазовому портрету рис.24.5. Таким образом, в реальных условиях наличия потерь энергии описан- ное управление приводит к вращению маятника. Мы уже отмечали не- обычность этого способа порождения и поддержки вращения. В допол- нение к этому отметим, что этот эффект неожиданным образом исполь- зуется человеком в организации его двуногой ходьбы. Едва ли вы заду- мывались, как вы ходите. Но уже самое поверхностное наблюдение об- наруживает, что при ходьбе вовсе не обязательно подталкивать себя впе-
196 24. Управляемый маятник и двуногая ходьба ред ногами. Скорее при ходьбе ощущается, что какая-то «сила» тянет вас вперед и вы только выставляете поочередно ноги вперед, чтобы не упасть. Эта влекущая вас вперед сила ощущается не только при спуске, но и при ходьбе на ровной дороге и даже чуть-чуть в гору. Эту влекущую вперед «силу» можно увеличить, наклонив еще немного корпус вперед. Рис.24.5. Фазовый портрет перевернутого управляемого двойного маят- ника с учетом диссипации Понять, откуда берется эта тяга вперед, можно, обратившись к фазо- вому портрету рис.24.5, трактуя нашу ногу, на которую мы опираемся, как звено перевернутого маятника, а подсоединенный к ней наш кор- пус, - как подсоединенное звено, которое мы поддерживаем под неко- торым постоянным углом к вертикали: при стоянии корпус вертикален, при ходьбе несколько наклонен вперед. Наша опорная нога не может со- вершать полных вращений около своей точки опоры, она лишь поворачива- ется на некоторый угол от -р до р. После чего нога Н] сменяется и другая нога Н2 поворачивается от - р до Ди так все время, пока вы не меняете длину шага (рис.24.6). При этом мы несколько упрощаем характер движе- ния опорной ноги; она не опирается одной точкой, опора осуществляется всей ступней. В целом это движение со сменой ног уподобляется каче- нию колеса со спицами без обода. Рис.24.6 Схема двуногой ходьбы как циклически повторяемые движения управляемого двойного маятника (ав- токолебательная ходьба) В соответствии со сказанным проведем на фазовом портрете рис.24.5 две вертикальные линии (р = - рн <р = р (рис.24.7).
24. Управ яемый маятник и двуногая ходьба 197 Рис.24.7. Фрагмент фазового портрета двойного маятника с учетом диссипации Фазовые траектории, покидая точки отрезка (р~- Д могут пересекать при своем продолжении отрезок (р = Д Пусть на начальном отрезке у = w, а на конечном (р = й. Отображение и в й рис.24.6 имеет диа- грамму, показанную на рис.24.8. Устойчивая неподвижная точка этой диаграммы точечного отображения отвечает равномерной ходьбе, у ко- торой каждый новый шаг начинается со скоростью w, равной координате /этой неподвижной точки. При этом, если вы использовали рис.24.3, то диссипация полностью отсутствует, а, если рис.24.5, то она есть в тече- ние всего движения от (р = -Д до ср~ Д При реальной ходьбе диссипация есть при перекатывании на опорной ноге и особенно при смене ног, так как при смене опорной ноги происхо- дит «толчок» ее об опору, сопровождаемый потерей энергии. Тонкости механизма потери энергии не влияют на качественно правильный вид диаграммы рис.24.8, неподвижная точка которой соответствует равно- мерной периодической ходьбе. Рис.24.8. Диаграмма Ламерея, обосновывающая автоколебатель- ную ходьбу Резюмируя сказанное, отметим, что, как следует из предыдущего, не только человек, но и природа придумали свое колесо и не только колесо, а и своеобразные способы его вращения; у человека он основан на управлении положением корпуса и своевременной сменой ног, как бы предотвращая падение. Можно еще отметить, что для динозавров, у ко- торых к> 7, этот способ требует дополнительных опор, что, по- видимому, и делал динозавр, опираясь на громадный хвост. Но это сквозь магический кристалл: детального анализа случая к> 1 мы не про-
198 25 ДИНАМИЧЕСКИЕ МОДЕЛИ ИГР, ОБУЧЕНИЯ И ЦЕЛЕСООБРАЗНОГО ПОВЕДЕНИЯ В последующих лекциях я расскажу вам о простейших динамических моделях целесообразного поведения, игр и обучения. Разработка этих вопросов только началась и в своем начале пересекалась с популярной дискуссией о том, «может ли машина мыслить?» Дискуссия была бурной и, пожалуй, формально безрезультатной: каждая из сторон осталась при своем мнении. Одни утверждали, что машина может мыслить, так как умеет решать сложные математические задачи, подчас не доступные че- ловеку, умеет доказывать геометрические теоремы, находить выход из лабиринта, играть в шахматы, управлять ядерным реактором или раке- той, «читать» чертеж и по нему управлять изготовлением соответствую! щей детали,.... Другие возражали и говорили, что машина не мыслит, а лишь выполняет действия, начертанные ей человеком. Ясно, что каждая из сторон по-своему была права, что дискуссия не имеет смысла, пока не договорились о том, что значит «мыслить», пока каждая из сторон понимает это по-своему. Где же этот водораздел между бездумным выполнением команд и предписаний и разумным поиском решения и его осуществлением? Чем «мыслить» отличается от выполнения некоторой программы действий? Ведь всякий разумный подход тоже происходит по некоторому неведо- мому нам алгоритму. Возможно, этот алгоритм не детерминированный i включает в себя элементы случайности. Может, в этой случайности и по- следующей фильтрации и есть суть мышления? А может быть в ассоциа- циях и умениях увидеть аналогии и использовать имеющиеся знания или, наконец, в умении извлечь выводы из неудачных и удачных попыток? Но даже если все это так, то и это происходит в соответствии с некоторыми правилами. Едва ли сегодня можно дать исчерпывающий ответ на эти вопросы: точно определить, что означает «мыслить». Да и как это можно сделать, когда мы фактически ничего не знаем о том, как работает наш мозг, ко- торому мы приписываем возможность мышления? Но мы знаем, как работают создаваемые нами ЭВМ, и применительно к ним можем попытаться установить, где наступает различие между «бездумным» выполнением команд, предписанных человеком, а где на- чинается «мышление» машины. В признании способности ЭВМ мыслить нас не должно смущать, что ею машину наделил человек, ведь и человека ею тоже наделила природа, миллиарднолетний эволюционный процесс,
25. Динамические модели игр, обгчения и целесообразного поведения 199 как мы сейчас думаем, сводящийся к жесткому отбору случайных изме- нений. Даже в этой специализированной суженной постановке вопроса едва ли сейчас целесообразно стремиться к однозначным четким ответам, лучше лишь обсудить их с вами, дав некоторую затравку для размышле- ний. Эта затравка состоит в рассказе о простейших моделях, в которых обнаруживаются элементы того, что, пожалуй, уже воспринимается как мышление. Начнем с описания автоматных моделей целесообразного поведения и обучения. При этом субъект, принимающий решение, будет «мыслить» как некий автомат с внутренним состоянием, от которого зависит прини- маемое решение, а само состояние определяется успешностью предшест- вующих решений. Идея и исследование таких моделей ведет начало от М.Л.Цетлина. Пусть у автомата возможных действий только два, тогда все состояния делятся на два класса: в одном принимается одно решение, в другом - другое. Обозначим эти решения «+1» и « - 1». Примером такой ситуации может быть вопрос о том, в правой или левой руке находится монета, ко- торая служит призом при угадывании. Можно представить и ситуацию с выбором одной из двух кормушек А или В, как изображено на рис.25.1. С помощью кормушек изучалась способность крыс к обучению. Крысу время от времени выпускали через дверцу в помещение, из которого она могла пойти к одной из кормушек: направо А или налево В. Пища поме- щалась время от времени то в одну, то в другую кормушку и крыса в за- висимости от того, куда она пошла, могла утолить свой голод или ос- таться голодной до следующего раза. Рис.25.1. Схема расположения двух кормушек для проведения эксперимента по обучаемости крыс или других животных или птиц Первая ситуация соответствует игре в отгадывание, вторая напомина- г жизненную ситуацию о том, куда отправиться за пищей. Начнем с простейших автоматных описаний различных типов игро- ов: простака, упрямца, хитреца и мистика. Будем считать, что игрок ожет находиться в двух состояниях и, в одном он принимает решение 1 и в другом +1 ( рис.25.2 ). Решения -1 и +1 означают, соответствен- з, что он выбирает левую или правую руку. Отгадывающий - отгады- 1я, загадывающий - кладя монету. То, какое состояние он имеет и как к меняет в зависимости от результатов предшествующих игр, зависит от )го, кто он: простак, хитрец, упрямец или мистик. Простак считает, что :ли он выиграл, то не должен менять своего мнения - состояния о том, какой руке монета. Напротив, если он проиграл, то состояние нужно
200 25. Динамические модели игр, обучения и целесообразного поведения сменить. Пусть величины £=+1 и £=-1 означают, выиграл или, соот- ветственно, проиграл игрок предшествующее отгадывание. Тогда при £= +1 он не меняет своего состояния и при - 1, напротив, его меняет, как это показано на рис.25.3. Рис.25.3. Граф смены состояний ав- томата-игрока «простак» в зависи- мости от выигрыша (£=1) или проиг- рыша (£=-1) в предыдущей партии Рис.25.2. Два разных состояния автомата-игрока Хитрец же считает, что если он выиграл, то его партнер сменит поло- жение монеты и поэтому он должен, выиграв, сменить свое состояние. При проигрыше он, напротив, не меняет состояние, так как думает, что его партнер сам его сменит. Стратегия игры хитреца изображена на рис.25.4. ^=1 £=±1 Рис.25.4. Рис.25.5. То же, что и на рис. 25.3, но для хитреца (рис. 25.4) и, соответственно, упрямца (рис. 25.5) Упрямец не меняет своего решения и находится все время в состоянии х _ ] или х+] вне зависимости от результатов игры. Граф смен его состоя- ний не зависит от результата £ предшествующей игры ( рис.25.5 ). Мистик доверяет свое решение случаю, бросая некий, не обязательно симметричный, кубик и принимая в соответствии с этим независимо со- стояния х_ 1 или х+1 с вероятностями р и q = 1 -р. При этом он не обра- щает внимания на свои выигрыши и проигрыши, полностью полагаясь на свой талисман - кубик. Такое поведение также можно описать (моде- лировать) автоматом с двумя состояниями, но теперь его состояния ме- няются не в строгой зависимости от проигрыша или выигрыша, а слу- чайно в соответствии со стрелками и указанными на них вероятностями графа смен состояний рис.25.6.
25. Динамические модели игр, обучения и целесообразного поведения 201 Мы описали стратегию отгадывающего простака, хитреца, упрямца и мистика. Аналогичные стратегии могут быть у загадывающего простака, хитреца, упрямца и мистика. Такие же стратегии могут быть и у крысы, ищущей пищу. Однако в случае крысы едва ли целесообразны стратегии хитреца, мистика или упрямца. Хотя все зависит от того, каковы правила размещения пищи в кормушках. Рис.25.6. Граф вероятностей перехода мистика (p+q=l) £ = ±1 В описании возможных стратегий игры в отгадывание мы ограничи- ись двумя состояниями и предполагали, кроме мистика, детерминиро- ванную их смену после каждой партии в зависимости от ее результата. Число состояний можно увеличить, и их смене придать стохастический характер. Так можно ввести простака с памятью, который не сразу меня- ет свое мнение, а после первой неудачи только начинает сомневаться в нем и лишь при повторном проигрыше его меняет. То, как происходит смена состояний у такого памятливого простака, изображено на рис.25.7. Рис.25.7. Граф смен состояний для «простака» с памятью (так называе- мая линейная тактика игры) На нем четыре состояния: крайние правое и левое соответствуют уве- ренности, какое надо принять решение, средние, напротив, тому, когда решение принимается, но с некоторым сомнением. Ясно, что состояний может быть не четыре, а любое число. Каждому из решений могут соот- ветствовать не обязательно равные числа состояний, как в предшест- вующем примере, где их по два. Можно придумать и другие автоматные модели, например, с графом смены состояний рис.25.8. Рис.25.8. Автомат-игрок с памятью, но другим графом смен состоянии, чем на рис. 25.7
202 25. Динамические модели игр, обучения и целесообразного поведения На рис.25.9 изображен граф смены состояний для принимающего ре- шения автомата с двумя состояниями, но в случае, когда их смена про- исходит случайно с вероятностями 1 -р при выигрыше, когда £=+1и соответственно, с вероятностями 1 - q при проигрыше, когда £=- 1.1Н рок со стохастической стратегией, изображенной на графе рис.25.9 при р = 1, q = 0 - простак; при р = 0, q = 1 - хитрец; и при р = J,q = l - упрямец. Рис.25.9. Граф вероятностей перехода для автомата-игрока «стохастик» Мы описали простейшие стратегии для игры в отгадывание у другого игрока или у «природы». Природу также можно рассматривать как игро- ка, безразличного к проигрышу или выигрышу. В качестве простейших моделей стратегии стохастической природы можно принять последовательность независимых решений с вероятно- стями р и q (p+q = 1), как у мистика, или марковскую последователь- ность, определяемую некоторой матрицей смен состояний. Например, имеется два состояния х_ / и х+/, в них принимаются решения -1 и, соот- ветственно, +1. Смена состояний х_ / и х+/ происходит случайно, с неко- торыми неизменными вероятностями, например, 8( рис.25.10). Случай- ные независимые смены состояний х_ / на х+/ и наоборот могут происхо- дить и с разными вероятностями 8 /И 82- Рис.25.10. Граф вероятностей пере- хода «стохастика» при безразличии к выигрышу или проигрышу После того, как мы познакомились с простейшими автоматными мо- делями игроков, рассмотрим игру в отгадывание между двумя игроками: простаком и хитрецом. Посмотрим, кто кого обыграет. Состояние одно- го игрока - простака обозначим х_/их+/, состояние второго - хитре- ца - у] и у+]. У них вместе будет четыре состояния (х_/,у_/), (х+/,>»_/), (х_/,_у+/), и (х+/,_у+/). В состояниях х_/ и у-i отгадываю- щий выбирает левую руку, а загадывающий в нее берет монету, а в со- стояниях х+/ и у+} отгадывающий называет правую руку, а загадываю- щий в ней держит монету. В состояниях (х_ /,у_ /) и ( х+i,y+i) выигры- вает отгадывающий, а в состояниях ( х_ /, у+/) и (х+/, у_ /) выигрывает
25. Динамические модели игр, обучения и целесообразного поведения 203 загадывающий. Теперь можно нарисовать граф смены состояний дина- мической системы загадывающий - отгадывающий, показанный на рис 25.11. Результат несколько неожиданный. Если выиграл первую пар- тию отгадывающий -простак, то он будет выигрывать и все остальные партии. Если же выиграл первую партию загадывающий - хитрец, то он будет выигрывать и дальше. Рис.25.11. Фазовый портрет игры «простака» с «хитрецом» Аналогичный граф для двух простаков изображен на рис.25.12. Их иг- ра протекает периодически с периодом в четыре игры: в двух партиях выигрывает загадывающий простак, а в двух других - отгадывающий. Так что общий результат ничейный. Рис.25.12. Фазовый портрет игры двух «простаков» Рассмотрим игру двух игроков со стохастическими стратегиями. Это рассмотрение включает как частные случаи все варианты игр хитреца и простака, а также мистика или природы (рис.25.9). У одного пусть соот- ветствующие вероятности р, q, а у другого г, s. Игроки могут нахо- диться в четырех комбинациях своих состояний ( х- /,у - /), (х+/, у_ /), (х-ьУ+i) и (x+i,y+j). В первом и последнем состояниях выигрывает отгадывающий, в двух средних - загадывающий. Смены состояний обо- их игроков могут происходить в любом случае. При выигрыше с вероят- ностями 1-ри 7 - г, а при проигрыше с вероятностями 1 - q и 7-5, со- отвественно. Пусть играется последовательно несколько партий и pn(x-Jty-i), pn(x+I,y-i), pn(x_hy+i) и pn(x+b y+i) - вероятности соответствующих комбинаций xt и yj в и-ой партии. В начальный момент может иметь место определенное сочетание состояний х„ у} так, что только одна из вероятностей р(xlt yj) равна единице, а остальные - ну- лю.
204 25. Динамические модели игр, обучения и целесообразного поведения Ясно, что теперь комбинации ( х„ у ) не являются состояниями, так как знание х, и у, не позволяет предсказать, какие будут х, и на сле- дующем такте. Но можно предсказать, каковы их вероятности. Это наво- дит на мысль, что за состояние следует принять вектор р9 компонентами которого являются вероятности р( xh yj). Допустим, что на п - й игре вектор состояний известен и равен рп. Найдем вектор р п+1, т.е. найдем его компоненты рп+1(хч>у_1), pn+I(x+I,y-i), pn+1(x^hy+j)npn+1(x+1,y+I) через pn(x_hy-i), pn(x+by-I)ipn(x_I,y+I) и рп(х+1,у+1). Оказывается, что рп+Х (25.1) где Р - матрица вероятностей перехода, равная PS (i-p)s p(} - s) (\-S)(l-p) qr (\-q)(\-r) q(i -r) , (25.2) q(l-r) (\-q)(l — r) 4r d-q)r (l-p)(l-s) (\-s)p sfl - p) ps а р п и рп+1 - вектора строки. Если перенумеровать комбинации "состояний" (х_/, (х_/, у+/), ( х+/, у-]), ( х+/, у+1) номерами 1, 2, 3, 4, а элементы матрицы Р обозна- чить pij, где i - номер строки, а/ - номер столбца, то р ij - это вероят- ность перехода из комбинации «состояний» с номером i в комбинацию «состояний» с номером j. Так элемент р12 - это вероятность перехода (х-/,у-1) в (х_/, _у+/ ), равная произведению вероятностей смены состоя- ния выигравшего отгадывающего, т.е. 1 -р, на вероятность сохранения состояния проигравшего загадывающего, т.е. s. Аналогично находятся все остальные элементы матрицы Р. Справедливость формулы (25.1 ) следует из соотношения Pi ~ Pl Ph+p2 Р2^Рз РзГ Р-1 Р-Н, означающего, что i - я комбинация состояний может возникнуть из пер- вой с вероятностью рн, из второй - p2i, из третьей - р$, и из четвертой - с вероятностью р^ а вероятности первой, второй, третьей и четвертой комбинаций, соответственно, р", р2, рз и р/. Итак, знание вектора вероятностей р п позволяет найти его следующее значение рп 1 после еще одной сыгранной партии. Это позволяет нам игру двух стохастических автоматов рассматривать как динамическук систему с состоянием, описываемым вектором р Фазовым пространством этой динамической системы являются все возможные вектора р(рх,рг,ръ,р^), у которых всер, не отрицательнь и их сумма равна единице, так как в одном из несовместных «состояний) 1,2,3 или 4 рассматриваемая система обязательно находится. Это фазо вое пространство имеет размерность три и представляет собою трехмер
25. Динамические модели игр, обучения и целесообразного поведения 205 ный симплекс. Вершины этого симплекса Zj, изображенного на рис.25.13, отвечают единичным векторам (1,0,0,0), (0, 1,0,0), (О 0,1,0) и ( 0, 0, 0, 1 ). На четырех гранях, соответственно, р/ = О, Р1 = 0,р3 = 0ир4 = 0. Динамическая система с фазовым пространством в виде симплекса 27? (а в общем случае с симплексом любой размерности ) и оператором, оп- ределяемым матрицей Р, согласно формуле (25.1 ), называется дискрет- ной марковской системой. Рис.25.13. Фазовое прост- ранство в виде трехмерного симплекса в случае, когда хо- тя бы один автомат-игрок меняет свои состояния слу- чайно с какими-то вероят- ностями, могущими зави- сеть от результата предше- ствующей игры Фазовый портрет такой системы в общем случае очень прост: все его фазовые траектории стремятся к единственному равновесию р , определяемому из условия pn+l = рп =р* или, согласно (25.1 ), р* = р*Р. (25.3) Уравнение ( 25.3 ) в общем случае имеет единственное ненулевое ре- шение р . Марковская система определяется матрицей Р, т.е. ее элемен- тами pt > 0. В силу этого под общим случаем понимается тот, когда ни одно из ру не обращается в нуль. В нашем конкретном случае, когда мат- рица Р вида ( 25.2 ), общий случай имеет место при р, q, г и 5, отличных от нуля и единицы. При выполнении этого общего условия уравнение (25.3 ) имеет единственное решение р*(р*,р2 * р3* р4*)• Это условие существования единственного глобально устойчивого равновесия, к которому асимптотически приближаются все точки фазо- вого пространства, является достаточным. Необходимое и достаточное условие состоит в том, что некоторая степень матрицы Р, т.е. Р к, удов- летворяет этому достаточному условию положительности всех своих элементов. В ситуациях (х_/, уз ) и (x+i,y+i), т.е. 1 и 4 выигрывает угадываю- щий, в остальных ( 2 и 3 ) он столько же ( пятак) проигрывает, так что математическое ожидание его выигрыша f при длительной игре близко к его значению в равновесном состоянии Л// = 5(р*+р4*) - 5(р2*+рз*)- (25.4)
206 25. Динамические модели игр. обучения и целесообразного поведения Полученное выражение ( 25.2 ) матрицы переходных вероятностей ис- пользуем, чтобы рассмотреть игры простака, хитреца и мистика со сто- хастиком с вероятностями 0<r<ln0<s<J. Для простакар = 1 и q = 6, поэтому, согласно (25.1 ), матрица Р запи- сывается в виде: 5 0 1-5 0 г 0 1—г 0 0 1 —г 0 г 0 1-5 0 5 (255) что приводит к уравнениям, определяющим равновесие: P* = SP\ *+гр2*, p2* = (i- г)р3 * +(1 -s)pA *, 1 Рз* = П - S)Pi * V1 - Г)Р2 * > р4* = Фз *+sp4 *, к которым следует присоединить условие нормировки р|* + р2*+р3*+р4* = 1. (25.7) Решение этих уравнении (25.6 ) и (25.7 ) легко находится, если сна- чала найти искомые р/*,р2*,рз* и р^* с точностью до общего множите- ля из (25.6), р2*=рз*=—Р\*, р4*=Р1*; Г а затем этот множитель из ( 25.7 ). В результате найдем, что Г 1 — 9 = -----V’ Р2* = /?3* = ™-----V ’ 2( 1 + г - s) 2(\ + r-s) (25.8) (25.9) и, следовательно, математическое ожидание (25.4) выигрыша отгады- вающего простака равно Л// = 5-~' + Г+- . (25.10) 1 + Г -5 Теперь легко исследовать, как зависит выигрыш в глобально устойчи- вом равновесии от вероятностей г и 5. Полагая Mf=5p, согласно ( 25.10), легко придем к тому, что на линии л-Д‘-^ = 1 (~l</i<l) (25.11) \+р внутри квадрата 0 < г < 1, 0 <s < 1 математическое ожидание (25.10) равно 5р (рис.25.14). Таким образом, простак в зависимости от вероятностей г и 5 может как выигрывать, так и проигрывать, а также иметь любой промежуточный результат. Близок простак к максимально возможному выигрышу при р ~ + 1 и, напротив, к максимальному проигрышу при р При р»-\ стохастик близок к хитрецу сг = 0и$ = /, но хитрец у простака не все-
25. Динамические модели игр, обучения и целесообразного поведения 207 гда выигрывает, а сколь угодно близкий стохастик выигрывает. Этот ска- чок вызван тем, что при г = 0 и s = 1 нарушаются условия существования глобально устойчивого равновесия. Аналогично, почти максимально проигрывающий стохастик близок к хитрецу с г = 1 и s = 1, который у простака не выигрывает. Это несоот- ветствие (скачок ) опять же объясняется нарушением условия глобаль- ной устойчивости равновесия р при г = s = 1. Рис.25.14. Геометрическое представ- ление зависимости выигрыша р от ве- роятностей г и s смен состояний в иг- ре «простака» со «стохастиком» Для игры хитреца со стохастиком находим, что ( р = 0, q = 1 в фор- муле (25.2 )) матрица Р вида 0 0 1-s 0 г 0 \-г Р = 1 -г 0 г 0 , 25.12) 1-S 0 s 0 и поэтому равновесие находится из уравнений: (25.13) Р* = ГРз * * > Pi* = О - s)p, * +л - r)p2 * и условия нормировки ( 25.7 ). Из ( 25.13 ) и ( 25.7 ) находим, что 1 — у г А* = Pi* = , Рг* = Р,* = 777“--------7 • (25.14) 2(1 + s - г) 2(1 + s — г) Далее оказывается, что математическое ожидание выигрыша хитреца в глобально устойчивом равновесном режиме равно 1 — г — ч < = (25.15) 1 + s — г Найденное Мf равно -Mf формулы (25.10 ), если в ней поменять местами 5 и г, поэтому имеет место тот же, что и раньше, график рис.25.13, с заменой //на -ри оси г наs и s на г.
208 25. Динамические модели игр. обучения и целесообразного поведения Теперь рассмотрим игру мистика, для которого р = q = а, со стохас- тиком. В этом случае матрица переходных вероятностей имеет, согласно (25.2 ), вид: as (\-а)г а(1-г) (l-a)s ar (l-a)(l-r) а(Л -s)0 a(l-s) (l-a)(l-r) ar (\—a)s (l-a)(l-S) a(\ -r) (l—a)r as (25.16) В соответствии с (25.16) уравнения устойчивого равновесия запи- шутся в виде: (as-\)pl *+fl -a)rp2 *+а(1 -r)p3 *+(1 - ajfl - s)p4* = 0, (I - a)spt *+(ar — l)p2 * +fl - a)(l - r)p3 * +a( 1 - s)p4 * = 0, 1 a(\-s)px * +(1 -a)(l - r)p2 * +(ar -l)p3 * +(1 - a)sp4* = 0, (\-a)(l- s)px * +a(\-r)p2 * +({ - a )rp3 * +(as -\)p4* = 0. Эти уравнения ( 25.17 ) линейно зависимые и поэтому допускают не- нулевое решение pt*, р2*, рз*> Р4*. которое затем следует нормировать на единицу. Манипулируя с этой системой уравнений ( 25.17 ) (склады- вая первое и третье уравнения, и третье и четвертое ), приведем ее к виду (отбрасывая четвертое ): р/* - Р2* + Рз* - р4* = 0, ( 1 -S )р,* + (1 -г)р2* + (г- 1 )р3* + (s- 1 )р4* = 0, а( 1 -s)pi* + ( 1 - а)(1 -г}р2* +(as-1 )рз* + ( 1 - a}sp4* = О и непосредственно находим, что требуемое нормированное на единицу решение будет следующим: Pi* = р4* = A~'(2-s-r)(r + a-2ar), р2* = р3* = Д '(2-a-s)(a + s-2as) 9 Д = 2(а -s-г)[2а + s+ r-2a(r + s)] 9 а математическое ожидание выигрыша в равновесном состоянии будет М/ = 5(р, *+р4 *-р2 = - 5(г-д)(1~2а) (25.|8) 2а + г + 5 - 2a(r + s) Из этого выражения ( 25.18 ) следует, что при а = 0,5 мистик не про- игрывает и не выигрывает у любого автомата ( при любых г и 5 ). Напро- тив, при а Ф 0,5 он может как проигрывать, так и выигрывать. При а < 0,5 он выигрывает при r>s и проигрывает при г < s. При этом его максимальный выигрыш у простака, когда г = 1, s = 0; максималь- ный проигрыш хитрецу, когда г = 0, s = 1. При а > 0,5 все наоборот: он выигрывает при г < s максимально у хит- реца, а проигрывает при г > s максимально у простака. (Эти выводы о максимальном выигрыше и проигрыше предполагают а отличным от
25. Динамические модели игр, обучения и целесообразного поведения 209 нуля и единицы, что опять связано с нарушением условий глобальной устойчивости равновесия). Итак, мы рассмотрели игры простака и хитреца между собой, а также игры простака, хитреца и мистика со стохастиком. Мы нашли вероятно- сти различных ситуаций в игре в установившемся равновесном состоя- нии и выигрыши и проигрыши игроков в нем. Для полноты представле- ния об этих играх напомним соответствующие им графы смены ситуаций для игр детерминированных игроков простака с хитрецом и простака с простаком, изображенных на рис.25.11 и 25.12. В этом случае графы смен ситуаций одновременно являются и фазовыми портретами, потому что ситуация является одновременно и состоянием. При наличии в игре стохастичности ситуация не является состоянием и граф смены ситуаций не является фазовым портретом. Фазовый портрет - это всевозможные фазовые траектории точки р (pi, рз, Рз> Р4 ) трехмерного симплекса ps > 0, Р! + р2+ Рз + Р4= Р Этот фазовый портрет в общем случае положительности всех вероят- ностей перехода ptJ прост и состоит из фазовых траекторий, стягиваю- щихся к единственному устойчивому равновесию р *(р/*,р2*, Рз*,Р4*} Граф смены ситуаций может быть непосредственно нарисован по матрице переходных вероятностей Р ( 25.2 ). Матрицы смен состояний игроков при играх простака и хитреца со стохастиком и стохастического мистика со сто- хастиком являются частными случаями этой матрицы Р. Поэтому можно ог- раничиться одним рис.25.16 графа переходов матрицы Р вида (25.2 ). Мы рассмотрели очень простые примеры игр в отгадывание. А где же в них обучение? Оно состоит в том, что игроки «простак», «хитрец», «стохастик» действовали не по заранее фиксированному плану, а на ос- нове результатов предшествующих игр, поскольку они выбирали прини- маемое в следующей партии решение в зависимости от результатов игры. Упрямец не обучался, он действовал по заранее определенному плану, он мог бы быть и другим, реализующим некоторую произвольную заранее заданную последовательность действий (ходов). Мистик также не обу- чался, хотя и не имел заранее заданного плана, но его действия не зави- сели от хода игры, они определялись не зависимым от него случаем. Стратегии упрямца и мистика не предполагают обучение. Напротив,
210 25. Динамические модели игр, обучения и целесообразного поведения стратегии простака, хитреца и стохастика таковы, что имеет место обу- чение. Рис.25.16. Граф вероят- ностей перехода в игру двух «стохастиков» Простейшие стратегии игры в отгадывание, которые мы рассмотрели, применимы и к принятию крысой решения о том, к какой из кормушек пойти, чтобы поесть, куда отправиться за пищеи. Этот случай соответст- вует игре отгадывающего с природой, поскольку принимается, что то, где окажется еда, определяется причинами, не зависящими от действии крысы. Есть еще одно отличие в стратегии природы от стратегии загады- вающего игрока: не обязательно одна кормушка с едой, другая без нее, возможны и случаи, когда обе кормушки с едой или обе без нее. В интерпретации игры в отгадывание, как и крысы, ищущей еду и улучшающей свой поиск в результате учета результатов своих предшест- вующих действий, элемент обучения очевиден. Этот элемент обучения заложен в играющего, он очень прост до примитивности и поэтому, воз- можно, еще не ощущается его принципиальное отличие и совершенно новые возможности по сравнению с жестко заданными, не использую- щими предшествующего опыта, алгоритмами поведения. Хотелось бы подчеркнуть, что новое в обучении не только в иных алгоритмах дейст- вий, айв новой информации, используемой алгоритмом: информации о результатах предшествующих действий. В рассмотренных выше примерах эта информация использовалась для принятия решения перехода автомата в то или иное состояние. Мыслимо и более общее и глубокое использование этой информации для измене- ния самого автомата, в частности, вероятностей р и q стохастического автомата. Описанная стратегия поведения крысы с обучением представляется нам целесообразной. Вместе с тем не так уж очевидно, почему это так: неясно, с чем ее сравнивать и по отношению к чему она лучше. Это очень не простой вопрос. Его обсуждение увело бы нас очень далеко от нашей темы. Поэтому ограничимся сравнением со случайным поведени-
25, Динамические модели игр, обучения и целесообразного поведения 211 ем, и то, что лучше его, будем считать целесообразным. Случайное пове- дение с независимыми выборами имеет равные вероятности выигрыша и проигрыша. Целесообразная стратегия - это та, для которой выигрыш более 0,5. Такое понимание, по-видимому, согласуется с нашей интуици- ей. Более полный анализ этого вопроса вас, возможно, ждет в специаль- ных курсах. В заключение хотелось бы остановиться на двух общих вопросах, не имеющих прямого отношения к теме нашего разговора — это объяснение того, почему стохастик с р = q = 0,5 ни у кого не выигрывает и никому не проигрывает и почему марковская система с матрицей Р, у которой все элементы ру положительны, имеет единственное устойчивое равнове- сие р * То, что он не проигрывает и не выигрывает ни у простака, ни хитреца ни стохастика, мы получили из конкретного рассмотрения мате- матических моделей их игр. Но естественен вопрос: не может ли все же существовать такая стратегия игры против стохастика, равновероятно и независимо выбирающего -1 и +1, при которой его можно обыграть, как об этом мечтают фанатики игорных домов? Простое рассуждение пока- зывает, что это невозможно. Невозможно в силу независимостей реали- заций у стохастика -1 и +1 ни от его предшествующих ходов, ни от дей- ствий партнера. В силу этой независимости условные вероятности его выигрыша и проигрыша всегда одни и те же, равные 0,5. В свое время мне и Д.М.Черток захотелось придумать более сложные, чем описано выше, обучающиеся стратегии и с их помощью обыграть человека. Человек не равновероятный стохастик: человек невольно учи- тывает результаты предыдущих игр и если этот его учет разгадать - про- игрыш человека неизбежен. Для того, чтобы реализовать стратегию иг- ры с человеком, основанную на разгадывании его стратегии, нужна ма- тематическая модель человека - игрока. Достаточно эффективным оказа- лось предположение, что стратегия человека - игрока носит случайный характер, но вероятности выбора -1 и +1 зависят от конечного не очень большого числа предшествующих партий и то, что человек в результате этого выбирает -1 и +1 не равновероятно и не независимо. Вместе с тем машина, таким способом обыгрывающая человека, ста- вит себя в рискованное положение и тем самым может проиграть челове- ку, если он придумает еще более совершенную, чем у машины, страте- гию, основанную на разгадке ее стратегии. Этот процесс взаимного со- вершенствования стратегий может длиться долго, как войны человечест- ва. Это не совсем прямая аналогия, потому что в войнах совершенству- ются не только стратегии ее ведения, но и средства, которыми она ведет- ся, что, впрочем, тоже можно считать стратегией. Насущная жизненно необходимая проблема человечества - обрыв этой цепочки эволюцион- ного совершенствования, заложенного в инстинктах человека как пред- ставителя мира живых существ. Это, по-видимому, возможно только че- рез осознание им гибельности этого «естественного» пути, гибельности в новых невиданных еще условиях его существования, в осознании необ- ходимости коренного изменения стратегий коллективного поведения пе-
212 25. Динамические модели игр, обучения и целесообразного поведения ред лицом экологической катастрофы. В связи со сказанным особый ин- терес представляет построение моделей сосуществования не только на основе дарвинской борьбы за существование, но и моделей сосущество- вания современного человечества в новых условиях его существования. Скорее всего, это переход к новым эволюционным стратегиям, основан- ным не на открытой борьбе за существование, а стратегиях компромис- сов и соглашений, которые должны быть взаимовыгодными, как в крат- ковременных, так и долгосрочных планах, в понимании, что кроме при- митивных инстинктивных стратегий, возможны другие, много более це- лесообразные и выгодные стратегии. Наличие таких стратегий ниже иллюстрируется примером Ю.Б.Гер- мейера, хорошо объясняющим возможность более выгодных стратегий, чем прямая максимизация собственного выигрыша. Речь идет об игре й лиц, в которой выигрыш 5-го игрока равен Л=1-х,+яЕ*( (5 = 1,2,..., л). (25.19) Каждый игрок волен распоряжаться своей выбираемой им переменной 0<xs<J. Ясно, что непосредственная максимизация 5-ым игроком своего выиг- рыша fs приводит к выбору xs = 0. Если так поступят все игроки, то выиг- рыш каждого из них равен 1. Вместе с тем, если они договорятся о том, что не будут стремиться к непосредственной выгоде, а все выберут xs = 1, то выигрыши каждого из них будут не единица, а, возможно, много большие р (п - 1). Такая договоренность не носит устойчивого характера: каждому из игроков выгодно ее нарушить и получить еще больший вы- игрыш р(п- 1) + 1. Вместе с тем, если так поступят т игроков, то их выигрыш будет р(п-т- 1) + 1 , а остальных р(п- т - 1). Ясно, что ес- ли /л (п - т - 1) окажется меньше единицы, то для них общая договорен- ность станет невыгодной и «союз» распадется к общей невыгоде всех. Договоренности можно придать устойчивый характер, если прибегнуть к общей кассе, т.е. договориться, что выигрыши всех поступают в общую кассу и затем, например, поровну раздаются всем. В этом случае общий выигрыш равен F = ^fs =n-X, -:.-Хп +/J(n-l)(^i +... + Х„) = = п + (//(«-1)- 1)(х, +х2 + ... + хп). Пусть р (п - 1) — 1 > 1, тогда не только всем вместе, но и каждому из игроков выгодно выбирать xs = 1. Второй общий вопрос, по-видимому, был вам обоснован в лекциях по теории вероятностей. Удивительность и важность этого общего факта делает желательным эвристически наглядное его понимание, которое и приводится ниже. Я только хочу напомнить вам, что условия ptl > 0 дос- таточные, а не необходимые. Необходимые и достаточные условия тоже известны. Я не буду вам о них рассказывать, хотя они очень красивые и непосредственно проверяются по виду графа возможных смен ситуаций. Итак, пусть все ptJ > 0.
25. Динамические модели игр, обучения и целесообразного поведения 213 При этом линейном преобразовании с матрицей Р симплекс Е„ пере- ходит опять - таки в симплекс Е „, который лежит строго внутри сим- плекса Е„. Строго внутри потому, что все вершины симплекса Е„ (1,0,О ), ( 0, 1,... ), ..., ( 0, 0, ..., 1 ) переводятся в силу ру> 0 строго внутрь Е„. Это означает, что симплекс Е„ преобразуется внутрь геомет- рически подобного симплекса Е „, который в q < 1 раз меньше симплекса 1Й. При следующем преобразовании аналогично симплекс Е п преобразу- ется в q раз меньший подобный ему симплекс Е„ и так далее. Последо- вательность подобных неограниченно уменьшающихся с числом преоб- разований симплексов стягивается к некоторой внутренней точке р .
214 26 ПЕРСЕПТРОН И РАСПОЗНАВАНИЕ ОБРАЗОВ Перейдем теперь к модели, которая появилась сравнительно недавно, в середине прошлого века, и получила широкую известность уже в шес- тидесятые годы. Модели безусловно интеллектуальной деятельности че- ловека, которая реализуема на ЭВМ и тем самым доказывает, что маши- на может мыслить. Модели, которая потрясла современников и послужи- ла началом нового раздела кибернетики - распознавания образов. Снача- ла появилась не математическая модель, а удивительное устройство, ко- торое придумал Ф.Розенблат в 1957г. и которому дал звучное название «персептрон». Придумано оно было, исходя из тогдашних представлений о конструкции мозга, сетчатки глаза и обработки ее сигналов в слоях нервных клеток. По профессии Розенблат был физиолог. Его устройство могло воспринимать, различать и узнавать зрительные образы. Отличать треугольники от овалов, опознавать буквы и другие изображения. Самое удивительное было в том, что эти способности не были заложены в нем, а возникали в результате обучения. Обучение позволяло различать новые геометрические фигуры и зрительные образы. Это умение ранее казалось прерогативой человеческого интеллекта и недоступным машине. Удив- ление подкреплялось еще и тем, что было совершенно непонятно, как персептрон это делает: доска с фотоэлементами, имитирующая сетчатку глаза, случайные их связи с Л—слоем, /Гелой, сумматор, формальный нейрон, многочисленные обратные связи, все это как-то связано между собой и как-то функционирует согласно непостижимым принципам ней- родинамики. Возможно, если бы не реальное устройство, а просто его описание и те же рассуждения о его работе, никто бы на них не обратил внимание. Но было устройство, и оно работало, распознавало образы, обучалось этому распознаванию. Розенблат написал толстую книгу «Принципы нейродинамики», она была переведена на русский язык. Скорее всего мало кто ее читал, едва ли она была понятна кому-нибудь, кроме автора. Но человеческая мысль работала. Принципы были поняты. Они оказались в потрясающе простой, далекой от нейрофизиологии, математической модели пространства при- знаков и образа, как области в нем, модели, основанной на абстрактном фантастическом понятии многомерного пространства, придуманном не- обузданным воображением математиков. Таинственность, запутанность, непостижимость исчезли. Все стало очень просто, даже тривиально, и эта мощь простоты привела к бурному развитию нового раздела кибернетики «Распознаванию образов» и его разнообразным, многочисленным при- менениям и использованиям. Сейчас робот может играть на фортепиано с нот, поставленных перед ним, станок - изготовлять детали по их чер-
26 Персептрон и распознавание образов 215 тежам, компьютер - печатать статью или книгу с рукописи или голоса, ставить диагноз заболевания, обнаруживать неисправности машин, нахо- дить месторождения полезных ископаемых и многое многое другое. Вернемся к персептрону. Я не буду вас затруднять детальным описа- нием его устройства, хотя, может быть, это было бы полезно. Я попыта- юсь вам рассказать о его функционировании с точки зрения сегодняшне- го его понимания. С помощью табло 100x100 фотоэлементов персептрон воспринимал зрительный образ, как 104 сигналов х/, Х2, .... хюооо, образующих вектор признаков или описание х. На каждый входной сигнал х персептрон от- вечал: да или нет, +1 или —1. То, как он отвечает на данный входной сиг- нал х в каждом конкретном случае, зависит от его внутреннего состоя- ния, характеризуемого величинами параметров уь /2, • Ym , состав- ляющих вектор Y- Эти параметры у могут меняться под воздействием учителя, который в каждом случае поначалу указывает персептрону, ко- гда он отвечает верно и когда неверно. Предполагается, что учитель все показываемые персептрону объекты делит на два класса Л и В и хочет этому разделению научить персептрон, так чтобы на объект образа (класса) А он отвечал +1, а на объект образа В - f-1 ). Этого учитель хочет достигнуть, обучая персептрон на примерах показа разных образов и вызывая соответствующие изменения его внутреннего состояния у. Учитель надеялся, что после обучения персептрон будет верно ( так же, как учитель) отвечать на новые показы, которых, возможно, не было при обучении. Согласно этому описанию, внутреннее устройство персептрона, каким бы оно не было, может быть представлено моделью У=Пх.Г), (26.1) в которой f (х, у) - функция двух векторов х и у, могущая принимать только два значения +1 и -1. В простейшем варианте персептрона Ро- зенблата эта функция имеет вид: f(х,у) = sign£ys(ps(ххп) = signy(p(х) . ( 26.2 ) S=I Это только модель ответа персептрона на сигнал х , нужно еще опи- сать, как происходит процесс обучения персептрона. В общем виде обучение можно понимать, как использование инфор- мации учителя для определения вектора у состояния персептрона, т.е. у = g (х1, z1; х2, z2; ..., х?, £) , ( 26.3 ) дех' zl - описание /-го показываемого объекта и указание учителя, к какому образу он принадлежит: к образу А , если z = -1 и В , если z = 1. Последовательность х1, z1хр, zp - это обучающая информация учите- ля. Персептрон ее использует, определяя по ней свое состояние у. При новом показе ответ персептрона (26.1 ) на показ объекта с описанием х определяется х и состоянием у. Ответ z учителя определяется какой-то нам неизвестной функцией fy4um (х) = z.
216 26. Персептрон и распознавание образов Так что процесс обучения можно видеть в том, чтобы приблизить функцию персептрона (26.1 ) к неизвестной функции учителя /учит(*] по обучающей информации I (х1, zl; хр, zp). После этого пояснения перейдем к описанию алгоритма обучения (26.3 ) для простейшего вари- анта персептрона. Пусть X - множество всевозможных объектов х. Их конечное или бес- конечное число. Каждый объект х е X учитель относит к одному из клас- сов А или В. Эту способность учителя можно представить некоторой функцией fy4um (х) , принимающей для любого х только одно из двух значений: +1 и -1. Задача обучения персептрона в идеале состоит в том, чтобы ученик-персептрон делал то же, что и учитель, т.е. чтобы при лю- бом хеХ у=/(х,у) = Signy<p(x) =fy4um(K). (26.4) Ясно, что для принципиальной возможности обучения необходимо существование такого числа у= у*, для которого имеет место (26.4) при всех х е X. Далее возникает вопрос, каким должно быть (26.3), что- бы найти такое у* при условии, что оно существует? Напомним, что в рассматриваемом нами случае функция f (х, у) определяется формулой (26.2). Розенблат придумал следующий алгоритм подбора требуемого /♦ в процессе последовательных показов объектов х1, х2,... персептрону и ука- заний учителя fy^um (х]) , .... /учит (х2 ), > обнаруживающих, верно или неверно ответил персептрон. Возьмем произвольное у. Если персептрон ответил верно, то это под- тверждает учитель, и персептрон, удовлетворенный, ничего не меняет, т.е. оставляет у без изменения. Если же ответ персептрона не совпал с ответом учителя, т.е. если он неверен, то происходит изменение у, при- ближающее персептрон к верному ответу. А именно, пусть учитель отве- тил +1, а персептрон -1, тогда /(х, у) = Sign уср(х) = -1 и для того, чтобы приблизить персептрон к верному ответу +1, можно к вектору у добавить вектор £ <р(х) ( £> 0), т.е. заменить у на / со- гласно формуле У = у+£ ф(х). При этом У ф(х) = уср(х) +£(р2 (х) , (£>0) и, следовательно, /(х, у ) >/(х, у) и тем самым персептрон прибли- зился к верному ответу. Пусть теперь, наоборот, учитель ответил -1, а персептрон +1. Тогда величину у (р (х) следует уменьшить, т.е. у заменить на у согласно формуле у = у- £ (р (х), поскольку при этом/(х, у) = у ср(х) уменьшается на - £ ср 2 (х)
26 Персептрон и распознавание образов 217 Пусть ответ учителя fy4um (х) и ответ персептрона не совпадают, то- гда, согласно сказанному, / меняется в соответствии с формулой у = у+£fy4um(x) ф(х). (26.5) Это изменение происходит только при ошибке персептрона. В случае же когда персептрон отвечает правильно, вместо ( 26.5 ) имеет место у = у. ( 26.6 ) Не представляет труда (26.5 ) и ( 26.6 ) записать в виде одной форму- лы / (26.7) или у = у-0.5 s(f-fy4um) (р(х), где f - ответ персептрона, определяемый формулой ( 26.2 ) , з./учит - от- вет учителя на показ одного и того же объекта х е X. Прежде чем перейти к изучению алгоритма обучения (26.7 ) , кратко и схематично опишем, как сказанное было реализовано в персептроне Ро- зенблата. Как уже говорилось, Розенблат, конструируя персептрон, исходил из представлений о структуре зрительного рецептора и последующей обра- ботки восприятия зрительного образа сетчаткой глаза и мозгом. Эту об- работку он мыслил послойной; слой рецепторов, слой формирования функций (ps(xi, ..., хп), слой умножения функций <ps на коэффициенты Ys и, наконец, нейрон, реализующий пороговую функцию Sign. В соот- ветствии с этим его схема имела вид, показанный на рис.26.1. Рис.26.1. Схема трех- слойного персептрона с формальным нейроном (пороговым элементом) на выходе. Обратные связи изменения фазо- вых переменных ур..., ут в третьем слое не пока- заны Механизм обучения был реализован путем сопоставления ответа ней- рона с ответом учителя, по результатом которого происходила корректи- ровка с помощью обратных связей каждого из -множителей ys согласно формуле ( 26.7 ). Таково схемное описание работы персептрона. Помимо этого функционального и схемного описаний возможно гео- метризированное описание. Поступление образа х в персептрон можно интерпретировать как возникновение точки х в многомерном простран- стве признаков R п. В этом пространстве функцию ( 26.2 ), реализуемую
218 26. Персептрон и распознавание образов персептроном, можно представить геометрически как то, с какой сторо- ны от поверхности у (р ( х ) =0 (26.8) находится точка х. С одной стороны этой поверхности у (р (х ) > 0, и это соответствует ответу -И, с другой ее стороны у р(х) <0 , что отвечает ответу -1. Множество точек X делится на точки класса А и точки класса В, которые должны лежать по разные стороны поверхности (26.8). В соответствии со сказанным множество точек х, отвечающих образу А , можно трактовать как модель образа А. Аналогично, множество точек образа В - как модель образа В. Обучение при этом трактуется как по- строение поверхности (26.8) , разделяющей множества точек образов к и В, согласно формуле А , если у<р(х) > 0 х е < . В , если у<р(х) < 0 Итак, интеллектуальная задача распознавания образов получила гео- метрическую интерпретацию в построении поверхности, разделяющей множества точек - моделей - образов А и В. Такая геометрическая интерпретация распознавания зрительных обра- зов возымела огромные последствия. Образы начали мыслить не только как зрительные, а любые, описываемые какими-то числовыми признака- ми х/, Х2,..., х п. А это сделало возможным узнавание почерков, различ- ных звуковых сигналов, нефтяных месторождений, чтение текстов, узна- вание голоса человека и произносимых им слов, медицинской и техниче- ской диагностики, и многого, многого другого. Наконец, немаловажно и интересно, что персептрон - это динамиче- ская система, что процесс его обучения, как и само узнавание, - динами- ческий процесс. Состояние персептрона - это вектор у размерности тп. Оператор этой динамической системы дается формулой (26.7 ), которая определяет из- менение его состояния у. Ответ персептрона на внешнее воздействие х определяется формулой ( 26.2 ). Обученность персептрона - это дости- жение им равновесного состояния, в котором состояние у уже не меняет- ся при любом показе х. Перейдем к обоснованию возможности его обучения согласно алго- ритму ( 26.7 ). При этом мы будем трактовать персептрон как динамиче- скую систему. Вектор состояния у будем интерпретировать как точку в многомерном фазовом пространстве Гт. Формула (26.7 ) определяет за- кон изменения состояния и может трактоваться как оператор динамиче- ской системы. Состояния у*, при которых персептрон обучен и всегда отвечает одинаково с учителем, согласно ( 26.7 ), не меняются и поэтом) являются его равновесными состояниями. Нетрудно видеть, что множество состояний равновесия, если они су- ществуют, образуют выпуклый конус. Действительно, равновесие у* оп- ределяется требованием
26. Персептрон и распознавание образов 219 Sign у*<р(х) =/уЧит(к) (26.9) для всех х еX. Но если (26.9 ) выполнено для некоторого у *, то оно вы- полнено и для 2у* при любом Л> 0. Аналогично, если yi* и у2* - рав- новесия, toh2i/i* + 22/2* тоже равновесие при 2 i и 2 2 положитель- ных (в частности, при 22=1-2/и0<2/<1 ). Теперь докажем, что если персептрон имеет конус равновесий, содер- жащий внутреннюю точку у*, то он может совершить не более некоторо- го конечного числа ошибок, после чего уже их не совершает. Эта оше- ломляющая теорема Новикова доказывается сравнительно просто. Смысл ее состоит в том, что любая дискретная фазовая траектория персептрона при любой заданной последовательности показов не может содержать более некоторого конечного числа точек. Из этого еще не следует, что она обязательно окончится равновесием, просто после некоторого конеч- ного числа ошибок персептрон на любой заданной последовательности обязательно перестает ошибаться. Но если мы будем несколько раз пока- зывать последовательно все точки множества X, то фазовая траектория обязательно закончится состоянием равновесия и персептрон научится правильно различать все точки множества X. Доказательство этой замечательной теоремы Новикова, как уже гово- рилось, несложно. Пусть для х е X 0 < г < xj|| - < 00 и пусть у* - внутренняя точка множества равновесий, которая соответствует обученности персептрона, тогда |/ * <Р(х>| — р\у *|| ||«?(х>||, р > О (26.10) вне зависимости от длины вектора у*, которую можно выбрать произ- вольно. Действительно, если у* - внутренняя точка конуса равновесий, то при некотором р>0 для любого вектора я, для которого ||я|| < р, для всех х е X имеет место неравенство |(у * +ог||у *||)^(х)| > 0 или, принимая а = vy(х)/^<р(х 7||, неравенство |/*^xJ + v||/*|||^x4|>0 при любом v| < р, из чего следует ( 26.10 ). Пусть еще у0 - произволь- ное начальное состояние персептрона и у1, у2, у5,... - последователь- ность состояний, возникающая в результате его обучения показами неко- торых произвольных точек х1, х2, х3,... множестваX. Рассмотрим, как ме- няется расстояние V ( ys) = ( ys- у* ) 2 точки ys от точки у* с ростом s. Непосредственно находим, что У(/х+}) - V(yx) = (ух + 8fy4um(p(x) - у*)2 - (ух - у*)2 = = 2е х) - *<р(х) + е1/гуш„<рг(х). Так как
220 26. Персептрон и распознавание образов fучит ф (% fучит У *ф (% ) > 0, то, учитывая ( 26.10 ), И(ул+|) - Е(/л) < -2е\у * р(х)| + £2ф2(х)<- 2sp\\y *| |^(х>|| + £2<р2(х), Пользуясь произвольностью выбора длины вектора /*, выберем ее так, чтобы - 2бр||/ *||(г?(х)|| + £2(р2 (х) < —q < 0 . Тогда с каждым переходом от /s к ys+1 расстояние до у* будет уменьшаться не менее, чем на q > 0 и поэтому таких переходов не может быть больше, чем N = V ( у0) / q. Утверждение доказано. Найдем явное выражение оценки N верхней границы числа ошибок £R персептрона. При II/ *11 = — и у0 = 0, р = max 2£р — ||^(х)||-^2^2(х) = ^max[2Rg=-^, р Р J Р r^R р что весьма естественно, так как вынужденное уменьшение р означает все большую и большую трудность разделения подмножеств А и В мно- жества А". Таким образом, персептрон совершает не более конечного числа оши- бок, если он в принципе способен к различению образов А и В. Это так даже при бесконечности множества X. Если множество X конечно, то повторно показывая его, он обязательно в конце концов научится пра- вильному распознаванию заведомо за число повторных показов, меньшее N. Напротив, при бесконечности множества X никакое сколь угодно дли- тельное обучение не может гарантировать его обученности. С точки зре- ния ускорения обучаемости желательно, чтобы он при обучении совер- шал возможно большее число ошибок и исчерпал допустимое их число. Если это число исчерпано, то персептрон правильно классифицирует все остальные точки, несмотря на то, что учитель ему их не показывал. В этой экстраполяционной прогностической возможности состоит вели- чайшая его ценность и практическое значение. Она, в частности, позво- ляет по показу нескольких больных той или иной болезнью затем ставить диагноз этого заболевания для новых больных. По нескольким показам буквы А затем узнавать ее при других написаниях и т.д. Выше фактически одновременно с описанием модели персептрона была описана и общая модель обучения распознаванию двух классов объектов (то, что только двух классов, не является существенным огра- ничением, так как путем дихотомии можно осуществить разделение на любое число классов). Эта модель состоит из решающего правила f (х, у) и алгоритма обучения, алгоритма изменения состояния /, кото- рый записывается в виде ( 26.3 ). Сегодняшние знания не позволяют ука- зать на все возможные, приводящие к цели, алгоритмы для любого за- данного решающего правила f(x, у). Нельзя указать и лучшее из ре- шающих правил. Но уже существует довольно много разных видов алго-
26 Персептрон и распознавание образов 221 ритмов обучения. Мы укажем на один общий способ их построения. Он основан на методе минимизации стохастического функционала и полу- чил название метода стохастической аппроксимации. Пусть имеется некоторый функционал G (х, у) , зависящий от слу- чайного вектора х е X и вектора параметров Л. Случайный вектор имеет некоторую функцию распределения р (х). Метод стохастической ап- проксимации указывает процедуру последовательных приближений к значению 2*, которое минимизирует математическое ожидание функ- ционала MG(x,A) = ^G(x,A.)p(x)dx (26.11) X по параметру 2. Последовательные приближения строятся согласно фор- муле Л'*1 =Лр -s^/iG(xp",ЛР), (26.12) где точки х, х,... возникают случайно в соответствии с плотностью ве- роятностей р (х). Не будем формулировать условий сходимости последовательных при- ближений 21, Л2,... к минимуму функционала (26.11 ). Это при желании вы узнаете из соответствующих спецкурсов или книг. Ограничимся тем, что покажем, как этим общим способом можно прийти к описанному выше алгоритму обучения и многим другим, как показал Я.З.Цыпкин. Ясно, что цель обучения можно сформулировать как стремление к возможно меньшему числу ошибок, т.е. как отыскание такого 2*, при котором решающее правило f (х, Л) допускает минимум ошибок. Вве- дем вместо числа ошибок функцию штрафа совершенной ошибки G (х, Л) и потребуем, чтобы математическое ожидание этой функции штрафа было минимальным. Отыскание требуемого 2 можно осущест- вить согласно ( 26.12 ). Примем f (х, Л) = Sign 2 (р(х), G (Х,Л) = (f f X, 2>-fyuum (х)) л<р (х) и, согласно ( 26.12 ), найдем Л₽+' = Лр- £р(f(x, A)-fy4un, (х))Л<р(х) = = ЛР-ЕР (f(x, A) (х))<р(х), что, как нетрудно видеть, совпадает с ( 26.7 ) при ер = 0,5 е. Функция штрафа G (х, Л) была выбрана так, что при верном ответе (f~fy4um ) она обращается в нуль, а при неверном (f *fy4Um) оказывает- ся равной /2 (р (х) / Выбирая другие функции штрафа, можно найти другие алгоритмы обучения.
222 27 ЗАКОНЫ КЕПЛЕРА И ПРОБЛЕМА ДВУХ ТЕЛ, РЕШЕННАЯ НЬЮТОНОМ Сегодня я начну рассказ о динамической системе, описание и матема- тическое моделирование которой прошло через всю историю человече- ства. От египтян, вавилонян, арабов и древних греков к европейцам и всему современному человечеству протянулась извилистая нить этих ис- следований к нам через двадцать пять веков, отражая изменения взглядов людей на окружающий мир и свое место в нем, на возможности исполь- зования их в своей жизни. Началась с примитивных описаний непосред- ственно созерцаемого, прошла через постижения величественного за- мысла богов и созданной ими гармонии мира, через описание этой гар- монии совершенными идеальными математическими образами (кругами, сферами, правильными многогранниками, золотым сечением и др.) к со- временному лаконическому сугубо математизированному абстрактному моделированию и исследованию, к пониманию единства мира земного и небесного и их законов, выражаемых языком математики. Эта система- звездное небо с Солнцем, Луной и планетами, и Землей под ними. День сменяет ночь и снова наступает день, так из поколения в поколе- ние, испокон веков. Зиму сменяет весна, весну - лето, лето - снова зима и так все время. Жизнь человека непосредственно связана с этой вечной сменой времен года, дня и ночи. Луна то появляется, то исчезает, меня- ются ее фазы, причудливо движутся по небесному своду бродяги - планеты. Иногда вдруг затмевается Луна или Солнце. Загадки этих ме- таморфоз не могли не волновать человека, ему казалось, что его жизнь целиком в их власти, во власти величественного божественного неба и его светил. Мы все со школьной скамьи знаем о геоцентрической систе- ме мира древних греков и средневековья, об описательной кинематиче- ской модели Птолемея, о сменившей ее гелиоцентрической системе Ко- перника, о законах Кеплера и всемирном законе тяготения. Но как из этих законов Ньютона следуют три закона Кеплера, осталось тайной. Вот эту тайну мы развеем. Именно о ее раскрытии будет дальнейший рассказ. Законы Кеплера несравнимо проще описывают движение небесных светил и позволяют предсказывать их положения на небе, чем это делала предшествующая очень сложная кинематическая модель Птолемея и бо- лее простая Коперника, но такая же в основном принципе представления движения планет в виде суперпозиции равномерных круговых вращений. Если системы Птолемея содержали 77 кругов, то система Коперника уменьшила их число до 34. Вместе с тем системы Птолемея и Коперника достигли очень большой точности предсказания порядка угловых минут, но вычисления были очень сложными. Кеплер все необычайно упростил, но описание по-прежнему оставалось кинематическим. Три закона Кеп-
27. Законы Кеплера и проблема двух тел. решенная Ньютоном 223 лера не были связаны между собой, не имели единого объяснения. Еди- ное объяснение им дал Ньютон. Единое не только для них, но и для всех механических явлений на небе и на земле. Все стало следствием одних и тех же законов, законов механического движения. Напомним законы Кеплера. Первый закон говорит о том, что орбита каждой планеты - это эллипс, водном из фокусов которого расположено Солнце. Второй закон описывает, как, с какой скоростью движется каждая планета по своему эллипсу. Скорость ее движения переменная, но посто- янна так называемая секторная скорость - скорость, с которой описывает площадь радиус - вектор, соединяющий Солнце и планету. Третий закон, как думал Кеплер, - это общая гармония небесных сфер, выражаемая постоянством отношения квадрата периода обращения пла- неты к кубу большой полуоси ее эллипса. В целом три закона Кеплера дают полное кинематическое описание закономерностей движения планет солнечной системы. Но нет ли более общих оснований этим закономерностям, не есть ли они следствие ка- ких-то более общих законов природы? Чтобы это выяснить, Ньютон пре- одолел громадные трудности и титаническими усилиями человеческого гения заложил основы ряда новых направлений науки; механики, теории тяготения, дифференциального и интегрального исчисления. Более того, само вычисление, как говорил Ньютон, законов Кеплера было для того времени невообразимо сложной задачей, но Ньютон «вычислил». Мы сейчас в осовремененном виде повторим эти вычисления и пред- пошлем им выдержку из сочинений Ньютона, которая говорит о близо- сти нам его методологии и о месте нашего рассказа в его общей про- грамме постижения мира. «Вся трудность физики... состоит в том, чтобы по явлениям движения распознать силы природы, а затем по этим силам объяснить остальные явления». В аннотации загадочного тяготения, действующего через пустоту, он писал; «... гипотез же я не изобретаю. Довольно того, что тяготение на самом деле существует и действует согласно изложенным нами законам и вполне достаточно для объяснения всех движений небесных тел и мо- ря». Может быть, следует напомнить, что в изложенном подходе великий Ньютон следовал великому Галилею. Как и до сих пор, нам надлежит построить математическую модель и ее исследовать. Объектом моделирования являются две точечные массы, тМ которые притягиваются друг к другу с силой, по величине равной у ——, Р е т и М- массы притягивающихся тел, р- расстояние между ними и у - экспериментально найденный коэффициент, константа тяготения. Сила притяжения направлена по линии, соединяющей два тела. Пусть г и R - радиус-векторы этих масс в некоторой инерциальной :истеме координат (рис.27.1), тогда, согласно второму закону Ньютона и
224 27. Законы Кеплера и проблема двух тел, решенная Ньютоном закону всемирного тяготения, имеем: , Мт г - R MR —=i (27.1) тг Мт г -R Рис.27.1. Графическая иллю- страция к задаче двух тел - притягивающихся друг к другу масс т и М В этих дифференциальных уравнениях - единичный вектор, направленный от тела М к телу т. Если их написать в скаляр- ной форме, как это, естественно, делал Ньютон, то они составят систему шести уравнений второго порядка, т.е. систему двенадцатого порядка. Перейдем к вычислениям с этой системой. Они необычайно облегча- ются векторной записью (27.1). Первое - сложим друг с другом эти урав- нения и найдем, что MR + тг = О или d MR +mr _ — dt M + m = const. (27.2) Это означает, что центр масс двух тел движется равномерно и прямо- линейно с постоянной скоростью vc. Запишем уравнения (27.1) в виде: г м и вычтем одно из другого, найдем, что р =+ т)-~, (27.3) И где р = r -R - радиус-вектор массы т (планеты) по отношению к массе М (Солнцу), т.е. это дифференциальные уравнения их относи- тельного движения. Как движется их центр масс, мы уже знаем. Умножим векторно обе части уравнения (27.3) на ~р и придем к то- му, что рх р = О или
27. Законы Кеплера и проблема двух тел, решенная Ньютоном 225 —\р*р)=о, at — g = const. (27.4) Выясним смысл полученного соотношения (27.4). Из него следует, что обе массы М и т все время находятся в плоскости, проходящей через центр масс, перпендикулярно вектору g . Действительно, радиус - векто- ры рт и рм масс т и М (планеты и Солнца) по отношению к их центру масс равны, соответственно, _ _ MR + тг т _ р=г------------------р М + т М + т , _ — MR + тг М _ Рм =R----ГГ,--= У71~Р ’ М + т М+т где вектор р,согласно (27.4), все время перпендикулярен вектору g . Далее распишем (27.4) в скалярной форме, выбрав начало координат в начале вектора р, т.е. в центре Солнца, и направим ось Oz вдоль век- тора g длины g. Имеем к z i (27.5) Z х, у, z- проекции вектора р на где i, j, к - орты осей Ох, Оу и Oz, эти орты, причем, вектора р и ~р ортогональны орту к согласно его выбору и поэтому z = z = 0. В силу этого из (27.5) следует только одно соотношение = (27.6) Перейдем к полярным координатам х = р cos (р, у = р sin (р и приве- дем (27.6) к виду P> = -g. (27.7) Нетрудно заметить, что полученное соотношение (27.7) выражает вто- рой закон Кеплера. Действительно, приращение площади d е, описы- ваемой вектором ~р, равно = - p2d<p и поэтому de --^p2<pdt = -^dt или de g = = const, dt-----2 что и требовалось (рис.27.2).
226 27. Законы Кеплера и проблема двух тел, решенная Ньютонам Перейдем теперь к поиску орбиты планеты относительно Солнца. Рис.27.2. Иллюстрация ко второ- му закону Кеплера: сг - площадь, описанная вектором р, массой т, движущейся вокруг Солнца В нашем распоряжении уже имеется одно уравнение (27.7), которое запишем в виде; Второе уравнение для dp / dt можно получить из векторного уравне- ния (27.3), умножив его скалярно на вектор скорости р рр = ~Км + т)^~ Р 1 d ( р2> р3 dt{ 2 } ИЛИ d (р2'\ \ 1 d р2 ( ч — = -у(М + т)-Т—^- = -у(М + т} dt\^ 2 J р dt 2 = -у (М + = у (М + /и)— — р c//<pj Откуда, интегрируя, находим, что р2 у(М + т) -------------- -h- const. (27.9) 2 р Выразим в (27.9) р2 через полярные координаты р и (р : р2 = (х2 + j>2) = (р cosep - pepsin(р^ +(psin(p + pepcosep)2 = p2 + p2(p. После подстановки в (27.9) имеем 2y{M + ni) р~ + р <р ——-------' = 2h Р или, выражая ф через р согласно (27.8), р р Разрешая последнее уравнение относительно р, находим, что L + (2710) dt у р р Найденное уравнение (27.10) вместе с ранее полученным уравнением (27.8) представляют собою дифференциальные уравнения относительно- го движения планеты в плоскости OXY. Если из этих уравнений исклю-
27. Законы Кеплера и проблема двух тел, решенная Ньютоном 227 чить время t, разделив почленно уравнения (27.10) на уравнение (27.8), то придем к одному уравнению орбиты планеты , Мм+"О g d<P g \ P P Проинтегрировать это дифференциальное уравнение первого порядка и найти уравнение орбиты можно следующим образом. Сделаем замену переменных, введя новую переменную и = 1/р, в результате чего придем к уравнению — = — ^2h-2y(M + т)и -g2u2 = — y[f dtp g g и повысим его порядок, продифференцировав по (р, d2u _ 7 7 7 # _ _J_ 7_ # _7 _ d<p2 g 2 Jf du dtp 2g du g = = + m)-2g2u) 2g du 2g или 22l+u=2l (27.li) d tp g Мы пришли к хорошо нам известному неоднородному дифференци- альному уравнению гармонического осциллятора, общее решение кото- рого нам хорошо известно и пишется в виде: и - + с, cos tp + c2 sin (p - {7 + ecos((p - tp0 )}, g g где e и фо - константы интегрирования. Постоянная <p0 имеет смысл начала отсчета переменной ср на орбите и может быть выбрана равной 0 или тг, так чтобы постоянная е была неотрицательной. После этого уравнение планетной орбиты примет вид: g2 1 р = -----------, е>0. (27.12) р l + ecostp Эта орбита при е = 0 - окружность, при 0 < е < 1 - эллипс, при е = 1 - парабола и при е > 1 - гипербола (рис.27.3). В точке р = 0 рас- положен фокус. Ближайшей к фокусу точкой орбиты является точка (р=0, р= g2/М(1 + е). Параметр е имеет смысл эксцентриситета1. Между величинами а и b большой и малой полуосей эллипса и рас- стоянием с - 4а — Ь от центра эллипса до его фокусов Fi и F'2 и Это следует непосредственно из определений перечисленных кони- ческих сечений. Так, для эллипса, согласно рис.27.4 и его определению, (2 а - р) 2 = р + 4 с2 + 2р с costp. Откуда р = (a'-c2)/[a(I+c/a cos <р)]. Что при обозначениях е = с/а, g/ р = а2 -с2 / а совпадает с (27.12).}
228 27. Законы Кеплера и проблема двух тел, решенная Ньютоном параметрами формулы (27.12) имеют место соотношения: с g . g ['п i-}\ в — , а ~ с — т. г, а + с г- г. (27.13) а //(1 + е) р(1-е) 0<е<1 е=1 Рис.27.3. Эллиптическая, пара- болическая и гиперболическая орбиты движения массы т от- носительно инерциальной сис- темы с началом координат в центре масс Перейдем к извлечению из найденных соотношений третьего закона Кеплера. Прежде всего, интегрируя формулу секторной скорости плане- ты dcr g dt 2 ’ находим, что (^dt = _ST 2 Используя то, что площадь эллипса равна яаЬ, находим, что ла b = -g Т/2. или Т _ 2лаЬ (27.14) g Рис.27.4. Эллипс с фокусами FtuF2
27. Законы Кепдера и проблема двух тел, решенная Ньютоном 229 Это соотношение (27.14) вместе с соотношениями (27.13) и с=7а -Ь2 составляет 5 уравнений между шестью величинами а, Ь, с, е, g, Т, что позволяет, в частности, получить соотношение между а и Т. Это соотношение может быть получено следующим образом: Г = -^^. = -—^аг-с2 = -^-yll-e2 . (27.15) g g g Далее из соотношений (27.14) следует, что а- /72(1~е2) ИЛИ Подставляя найденное выражение в (27.15), находим, что ? _ 2яа2 g _ 2 ла31 2 g № 4^ или Г2 _ а3 /л (27.16) что и является соотношением, выражающим третий закон Кеплера. Ве- личина /л - у(М + т) = / М 1 + — М ) несколько различна для разных планет, но эти различия не могли быть замечены во времена Кеплера, так как для солнечной системы т/М очень малая величина. Применим теперь полученные результаты в отношении движения двух тел, притягивающихся друг к другу по закону всемирного тяготения к движению тела, запущенного с горы на земле в горизонтальном на- правлении со скоростью v, в отсутствии сопротивления воздуха. Прежде всего заметим, что шарообразная Земля при сферической однородности притягивает брошенное тело так же, как материальная точка, имеющая массу Земли и находящаяся в ее центре. Этот нетривиальный факт был установлен Ньютоном. Он же поставил и решил сформулированный вы- ше вопрос о траектории движения запущенного с земной поверхности тела и обнаружил, что при достаточной скорости это тело станет спутни- ца м Земли подобно Луне. Согласно предыдущему, движение будет происходить по кривой, оп- ределяемой уравнением (27.12) р = —---------- (27.17) и \ + ecos(D
27. Законы Кеплера и проблема двух тел, решенная Ньютоном 230 и в одном из ее фокусов будет находиться центр Земли. При (p=t р = R з, где R з - радиус Земли или, точнее, расстояние от центра Земли до места, с которого запускается тело, так что р 1 + е Осталось еще учесть, что тело запускается со скоростью v. Из соот- ношения (27.8) следует, что (27.18) ф =— R2. где и (р-—> R, так что (27.18) можно записать в виде: п _И32 1 л, --------— Откуда 1 (27.19) u2R3 + е =----- Д или, пренебрегая массой запущенного тела, е = ^-1. ГМ, Соотношение (27.19) позволяет по скорости v найти эксцентриситет е орбиты брошенного тела, что вместе с (27.18), определяющим g2/^ определяет параметры уравнения орбиты (27.17). Формула (27.19) позволяет найти первую и вторую космические ско- рости Uj и из- Первая - это минимальная скорость, при которой бро- шенное тело не падает на Землю и становится ее спутником. Вторая- это минимальная скорость, при которой брошенное тело перестает быть спутником и покидает Землю. Первое имеет место при е = 0 и круговой орбите, второе - при е = 1, когда орбита становится параболической. Из (27.19) находим, что уМ ~R~ Ц = =39,8x6,106 «8км/с Я,2 (27.20) »2 = 2Л/, ,, ----- «11 км/с. R, Эти скорости очень велики; с такой скоростью можно облететь земной шар менее, чем за два часа. Но человек их достиг и сделал это только в XX веке с помощью ракеты, о которой у нас была речь ранее. Этих ско- ростей могут достигать и молекулы газа. Для Земли это удается очень редким молекулам, а на Луне, где вторая космическая скорость много меньше, их настолько много, что на ней нет атмосферы. Вторая космиче-
21. Законы Кеплера и проблема двух тел. решенная Ньютоном 231 ская скорость на Солнце много больше, чем на Земле, но температура на нем настолько велика, что Солнце все время испускает поток заряжен- ных частиц. Помимо этих очевидных замечаний по поводу полученных нами фор- мул (27.20) укажем на еще два их следствия. Первое относится к тому, когда "звезда" становится черной дырой, которую ничто и даже свет не могут покинуть. Черная дыра уже не светится и ее удается обнаружить лишь по влиянию ее тяготения на ближайшие к ней настоящие видимые звезды. Ответ на поставленный вопрос очень прост: «звезда» будет чер- ной дырой, если ее вторая космическая скорость больше скорости света: быстрее света с ничто перемещаться не может. Таким образом, условие черной дыры имеет вид: (27.21) где М - ее масса, a R - радиус. Чтобы почувствовать, что представляет собою это условие, укажем, что Солнце было бы черной дырой, если бы его размер был менее трех километров, т.е. при гигантской плотности нескольких миллионов тонн в кубическом сантиметре. Эта фантастиче- ская плотность все же возможна, и черные дыры существуют. Вблизи черной дыры геометрия пространства неевклидова и часы идут медлен- нее в соответствии с теорией тяготения Эйнштейна, эффекты которой, еле уловимые в поле тяготения Солнца и планет, становятся значитель- ными в гигантских гравитационных полях черных дыр. Второй вопрос о том, сбегаются под влиянием тяготения небесные те- ла вселенной или, наоборот, разбегаются? Он уже не так прост, я бы да- же сказал, настолько сложен, что ответ не столь уж очевиден и ясен. Начнем издалека. Еще Ньютону было известно, что сила f притяже- ния единичной массы на расстоянии г от центра массивного однородно- го шара радиуса R и массы М определяется формулой for r>R г2 f = \ t , (27.22) уМ r f < p —-----г for r<R lr2 R3 т.е. при r>R шар можно заменить точечной массой М в его центре, а при г < R наружная часть шара по отношению к притягиваемой единич- ной массе никакого притяжения не оказывает (все ее притяжения, на- правленные в разные стороны, уравновешиваются). Сделанные выше выводы из формулы (27.22) обобщаются на неодно- родный шар, у которого плотность р зависит только от радиуса удале- ния от центра. Теперь перенесем эти соображения на вселенную. Плот- ность ее в пределах досягаемости и точности измерений постоянна. Ко- нечно, под плотностью понимается усредненная плотность по достаточ- но большому шару, но и не очень большому: много, много меньшему размеров обозримой нами вселенной. Можно думать, что где-то еще
232 27. Законы Кеплера и проблема двух тел, решенная Ньютоном дальше она уменьшается и даже исчезает и что наша Солнечная система J находится где - то вблизи центра вселенной, центра по отношению к этому очень далекому убыванию. Об этом говорит отсутствие притяже- ния вселенной нашей Солнечной системы с точностью до локальных флуктуаций плотности. Далее, чтобы ответить на вопрос, сжимается или разбегается вселен- ная, нужно иметь некоторое представление о скоростях составляющих ее масс. Эти сведения дает закон Хаббла, согласно которому на хаотические скорости звезд накладывается систематическая радиальная составляю-] щая. Звезды радиально разбегаются со скоростью V= HR км/с, (27.23) где //-постоянная Хаббла, примерно равная 75 км / с Ми к, а 7? - рас- стояние до звезды, измеряемое в Мик. (Мик — это единица расстояния, равная примерно пути, пробегаемому светом за три года). Теперь выделим большой шар радиуса R с центром, где мы находим- I ся, и спросим, могут ли ее звезды или другие тела его покинуть? Они I смогут это сделать, если скорости на поверхности шара превосходят вто- I рую космическую скорость выделенного нами шара, т.е. если F = HR>J^^, (27.24)1 и не смогут это сделать при противоположном неравенстве. Выражая массу М выделенного шара радиуса R через среднюю плотность р, найдем, что M = --npR3. Подставляя значение М в (27.24), находим, что критическая, разде- ляющая случаи разбегания и сжатия, плотность ркР, не зависит от R и равна г/см3- (27.25) Таким образом, если плотность массы во вселенной больше ркр, все- ленная будет сжиматься, если меньше - расширяться. Сегодняшние под- счеты р для вселенной требуют учета межзвездного темного вещества и дают с его учетом цифру, близкую к р кР, так что вопрос остается откры- тым. Мы с достаточной скрупулезностью проделали все вычисления, с ко- торыми впервые справился Ньютон. Вы понимаете, что в те времена это громадный титанический труд, полный неожиданных препятствий. Ведь до Ньютона не было ни дифференциального, ни интегрального исчисле- ния, не было и дифференциальных уравнений. В дальнейшем пытались обобщить результаты Ньютона на большое число притягивающихся тел, на так называемую проблему п тел. Но ни- кому это не удалось. Спустя значительное время стало ясно, что это нельзя сделать: проблема п тел при п > 2 неинтегрируема. Возникли
27. Законы Кеплера и проблема devx тел. решенная Ньютоном 233 сложные теории приближенного решения, методы так называемой тео- рии возмущений. Эта теория достигла высокой степени совершенства и сыграла в науке громадную роль не только в небесной механике. Путем вычислений, основанных на теории возмущений, удалось не только предсказать на много лет вперед положение планет, но и открыть новую планету Нептун. Но проинтегрировать не удалось даже в упрощенной проблеме трех тел, когда одно из тел имеет исчезающе малую массу и его притяжением на два других тела можно пренебречь. Теория возмущений основана на построении последовательных при- ближений, например, в виде степенного ряда по некоторому малому па- раметру. В первом приближении учитывается основное взаимодействие каждой планеты с Солнцем. В нем все планеты движутся по неизменным кеплеровым орбитам. Плоскости этих орбит близки к плоскости эклип- тики. Положение каждой из орбит относительно плоскости эклиптики определяется какими-то параметрами. В первом приближении они по- стоянны. Затем строится второе приближение, учитывающее влияние всех или части остальных планет, считая, что они движутся по неизмен- ным эллиптическим орбитам. Затем эта процедура повторяется с учетом уточненных орбит планет и т.д.. В результате возникает решение для из- менений параметров орбит и движений по ним планет в виде ряда по ма- лому параметру - отношения масс планет к массе Солнца. Построение этих рядов достаточно сложно и, с одной стороны, достигло высокой степени разработанности, а, с другой, обнаружило ряд трудностей, среди которых самой стойкой и непреодоленной оказалась проблема малых знаменателей. Качественная теория дифференциальных уравнений А.Пуанкаре - от- вет на эти трудности. Начало ей положили знаменитые труды А.Пуан- каре «Новые методы небесной механики» и «О кривых, определяемых дифференциальными уравнениями». Но и эта новая замечательная тео- рия оказалась бессильной не только перед проблемой п тел, но даже пе- ред ограниченной (упрощенной) проблемой трех тел. (Сегодня расчет движения планет и искусственных спутников благодаря успехам методов вычислений и вычислительной техники выполняют ЭВМ. Они это дела- ют быстро и очень точно.) Но не все им подвластно. И сегодня нет отве- та, какой будет Солнечная система через миллиарды лет. Устойчива ли она или может существенно измениться? Прямые вычисления здесь по- мочь не могут: как бы ни были малы ошибки счета за миллиарды лет, они накапливаются и становятся очень большими и непредсказуемыми. Это вызвано тем, что дифференциальные уравнения движения в зада- че п тел консервативные гамильтоновы, не допускающие экспоненци- ально устойчивых движений. Любое их решение либо экспоненциально неустойчиво и тогда неизбежно экспоненциальное же нарастание ошиб- ки при его приближенном вычислении, либо нейтральное, для которого ошибки счета также, хотя и значительно медленнее, но все же нарастают. Более того, скорее всего, что при сколь угодно малых независимых слу- чайных ошибках спустя достаточное время Солнечная система может
234 27. Законы Кеплера и проблема двух тел, решенная Ньютоном прийти к любому состоянию, достижимому при ненарушении основных законов сохранения энергии, количества и момента количества движе- ния. Вместе с тем у Солнечной системы наблюдаются удивительные струк- турные особенности и закономерности. Особое удивление вызвали уди- вительные синхронизмы между периодами обращения планет, орбиталь- ными и собственными, тонкая структура колец Сатурна и другие. Все это ни теория, ни счет долго не объясняли. Они и не могли объяснить, пока господствовала только консервативная гамильтонова модель Солнечной системы. Эти закономерности своим появлением обязаны неконсервативным силам, не только силам ньютоновского притяжения, но, пусть и очень малым, диссипативным силам. Солнечная система существует миллиар- ды лет и именно эти, казалось бы, ничтожные силы, породили удиви- тельную структуру и закономерности движения Солнечной системы. Изучение этих структурных особенностей долго эволюционирующей Солнечной системы невозможно и без более полного учета гравитацион- ных взаимодействий между ее телами. Если однородные шарообразные тела взаимодействуют друг с другом, как материальные точки, помещен- ные в их центрах, что знал еще Ньютон, то для тел не шарообразных и неоднородных это не так. Нужно учитывать не только нешарообразность тел Солнечной системы, но и их деформируемость, приводящую к при- ливному трению и силам, вызываемыми внутренними деформациями. Этот учет кардинально качественно меняет фазовый портрет и движение Солнечной системы, т.к. консервативная гамильтонова система диффе- ренциальных уравнений движения превращается в диссипативную, до- пускающую экспоненциально устойчивые движения. Их уже можно на- ходить вычислительно, а экспоненциально устойчивые установившиеся движения можно найти теоретически с помощью современной теории систем с быстровращающимися фазами. Наличие малой диссипации упростило фазовый портрет Солнечной системы, в нем уже нет прежнего, возможно, бесконечного числа перио- дических движений, он упростился и стал доступен теоретическому и вычислительному изучению и это сделал учет, казалось бы, совершенно ничтожных добавок, не обнаруживаемых в первых приближениях.
235 28 РАСПРЕДЕЛЕННЫЕ ДИНАМИЧЕСКИЕ МОДЕ- ЛИ МЕХАНИКИ И ФИЗИКИ До сих пор рассматриваемые нами математические модели - динами- ческие системы - были в основном такими, что их состояние задавалось конечным числом скаляров, а его изменение подчинялось обыкновенным дифференциальным уравнениям dx ^ = Х(х), (28.1) at где х - конечномерный вектор состояния, аХ(х) - вектор-функция х. Сейчас мы перейдем к другому типу динамических систем, у которых состояние определяется функциями от каких-то переменных, а измене- ние состояния во времени, т.е. изменение описывающих его функций, подчиняется уравнению в частных производных вида ди ( ди ди У — — F и,----------,... , (28.2) Э/ дх, дхп ? где и (ххп; t) - функция или вектор-функция, описывающая состояние в момент времени Z, а правая часть уравнения (28.2) зависит не только от функции w, но и ее частных производных по переменным х/,..., хп до ка- кого-то порядка. При этом данное ранее общее определение динамической системы полностью сохраняется. Изменился лишь способ описания ее состояния и в связи с этим и вид ее оператора. Как и ранее, изменение состояния во ди времени, т.е. производная —определяется через состояние, т.е. функ- dt цию и (х/,..., xn;t) и определяемые ею частные производные по х/,..., х„. Как и ранее, это позволяет приближенно найти состояние в следующий момент времени t+A t через состояние в предшествующий момент вре- мени t и(х,,...,хп; t + At)^u(xl,...,xn;t)+ F(x,,...,xn)At и надеяться делать это сколь угодно точно с уменьшением A t. В предпо- ложении существования гладкого решения ошибка на одном шаге поряд- Т ка (A t) 2, а на конечном промежутке времени Т порядка (А/)2 — = ТА/ и At стремится к нулю вместе с A t. Описание состояния функциями во многих случаях вызвано простран- ственной распределенностью описываемой реальной системы. Так, теп- ловое состояние среды описывается температурой Т (х, у, z, t), зависящей от пространственных переменных х, у, z и меняющейся со временем t. Давление в жидкости (газе,) определяется его величиной р (х, у, z, t) в
236 28. Распределенные динамические модели механики и физики каждой ее точке (х, у, z). Аналогичны описания р (х, у, z, t) плотности вещества или распределения в пространстве электрического заряда. Это все примеры скалярных полей и описаний их одной функцией от пространственных переменных и времени. Поля могут быть векторными. Таково поле скоростей v(x,y,z,t) те-' чения жидкости или газа. Поле смещений г (х, у, z, t) точек упругого деформируемого тела. Электрические и магнитные поля, описываемые векторами электрического и магнитного полей. Рассматриваемые нами ранее системы, состояние которых описыва- лось конечным числом скалярных переменных, называются дискретны- ми. Системы, о которых сейчас речь и у которых состояние описывается функциями, называются распределенными. Распределенную систему можно трактовать как дискретную с беско- нечным числом переменных. Действительно, функцию, например, трех переменных f (х, у, z) можно разложить в ряд по некоторым функциям (pi (х,у, z), q>2 (х, v, z),..., так что f(x, у, z) = ^Cj <р. (х, у, z) j=! и тем самым функция f (х, у, z) определяется бесконечным числом ска- лярных переменных с/, Q,.... При такой замене при независимости функций ^>/, ^,... уравнение (28.2) повлечет за собой эквивалентную ему бесконечную систему обык- новенных дифференциальных уравнений de. -d-=F(chc2,...) (/=1,2,3,...). dt Сказанное достаточно очевидно, но требует обоснований и они не так уж и просты, скорее даже очень сложны, если пытаться уменьшать огра- ничения на функции/и F. Но это уже не предмет этих лекций. Мир распределенных систем, пожалуй, еще более многообразен и ши- рок, чем дискретных. Более того, на дискретные системы можно смот- реть как на частный конечномерный случай распределенных. Это не де- лается только потому, что существующие методы исследования уравне- ний в частных производных существенно отличаются от методов теории обыкновенных дифференциальных уравнений. Фактически это разные научные дисциплины, разные разделы математики, которыми занимают- ся разные люди. Вместе с тем те и другие дифференциальные уравнения при использо- вании общих понятий функционального анализа записываются одинако- во в виде (28.1/ где теперь х - элемент некоторого функционального пространства, а X (х) не вектор-функция от х, а оператор X от х. Дальнейший рассказ — не более чем знакомство, предисловие или введение в науку о распределенных динамических системах. Более осно- вательные встречи у вас могут состояться в курсах математической фи- зики, гидродинамики, теории упругости, электродинамики, статистиче-
28. Распределенные динамические модели механики и физики 237 ской физики, теории вероятностей и случайных процессов и других. По- скольку это предисловие, то многое будет носить описательный, а не до- казательный характер. Это в первую очередь относится к основным мо- делям классической математической физики и великим уравнениям в ча- стных производных механики и физики: уравнениям Эйлера, Навье- Стокса и уравнениям Максвелла. Вам придется поверить на слово, не требуя их обоснования и вывода, и это не должно вам мешать их «по- нять» и пользоваться при рассмотрении конкретных примеров. Исключе- нием из этого будет уравнение теплопроводности или диффузии. Просто для того, чтобы дать вам возможность увидеть, как возникают и откуда берутся уравнения в частных производных. Речь идет об уравнении ди 2( д2м д и д2и --— а ----— Ч---— Ч--— dt ^дх ду2 dz } (28.3) которые одновременно описывают явления теплопроводности, диффу- зии, и случайного блуждания. В первом случае и (х, у, z, t) - температу- ра в точке (х, у, z) в момент времени Z, во втором - плотность диффун- дирующего вещества и в третьем - плотность вероятности того, что слу- чайная блуждающая точка в момент времени t находится в точке (х, у, z). Начнем с распространения тепла в однородной одномерной среде. По- ле температуры и этом случае описывается функцией Т (х, t). Ее измене- ние происходит благодаря естественному перетеканию тепла с более го- рячих мест в более холодные. Это перетекание во многих случаях можно принять пропорциональным градиенту температуры, так что dQ = ~k—dt , (28.4) дх где dQ - количество тепла, перетекшего в направлении оси Ох эа время (//через сечение х (рис.28.1). Знак минус указывает на то, что перетека- ние тепла происходит в направлении, обратном возрастанию температу- ры. Однородность среды выражается в постоянстве коэффициента теп- лопроводности к. Рис.28.1. Распространение тепла в однородной одномер- ной среде х Выделим произвольный участок [х/, х2]. Принимая, что теплоемкость среды постоянна и равна с, находим, что в момент времени t в нем со- держится количество тепла, равное *2 J с Т (х, t) dx. X/ Прирост этого количества тепла, если нет излучения, за время dt опре- деляется его притоком через сечения х = х/ и х = х2 (х2 > х Д т.е.
238 28. Распределенные динамические модели механики и физики а 7 , х. . , дТ\ . . эт\ — сТ\x,t)dx dt--k—I dt + k—- dt J v 7 ax1*-*' ax1 V/ / dt, или, сокращая на dt и дифференцируя по /, (28.5) Нам осталось перейти к пределу при неограниченном сближении се- чений х/ и Х2 к произвольному х. Воспользуемся теоремой о среднем для интеграла в соотношении (28.57 и запишем это соотношение в виде: , С5Т\ ,(дт 8Т \ > с(х?-х,)— . =k —I-------1 L где некоторая промежуточная точка между х/ и Х2. Разделим получен- ное равенство на Х2-Х/ и перейдем к пределу при стремлении этой раз- ности к нулю в связи с сближением точек х/ и Х2 к точке х. В результате придем к искомому уравнению теплопроводности дТ , д2Т с— = к dt dx2 которое обычно записывают в виде : dT 2 а2г — - а —г dt dx2 (28.6) Таким же уравнением описывается и процесс диффузии одного веще- ства с концентрацией р (х, t) в другом. Это следует из того, что при диффузии происходит перемещение вещества из мест с большей концен- трацией в места с меньшей, причем для количества переместившегося вещества dm за время dt имеет место тот же закон, что и для перемеще- ния тепла, т.е. d m = -D—dt, (28.7) dx где D - коэффициент диффузии. Поэтому такие же рассуждения и вы- кладки приводят к уравнению (28.6/ в котором a2=D. К такому же уравнению приводит и задача о случайных блужданиях частицы по прямой Ох. Назовем эту задачу задачей об абсолютно пья- ном, который не знает, куда ему идти, и делает шаг вперед или назад равновероятно. Пусть шагает он через время г, а длина его шага а. Пусть еще р (s а, п т) - вероятность того, что в момент t = п т после п шагов он оказался в точке x=s a (s- целое/ Нетрудно установить связь между вероятностями р (sa, пт) и р (s а, (п + 1) т). Действительно, в точке s а он может оказаться, только шагнув перед этим вперед из точки (s - 1) а или, шагнув назад из точки (s + V а. То и другое он делает равновероятно с вероятностью 1/2. По- этому
28. Распределенные динамические модели механики и физики 239 ,(п + /)г) = p((s - 1)а,пт)+^р((з + 1)а,пг). (28.8) Это соотношение (28.87 позволяет, зная функцию р (s а,п т) при л=0, найти последовательно ее при любом п. Так, если при п=0 абсолютно пьяный - блуждающая частица - находится в точке х=0, то функция р (s а, 0) известна и равна О при 5^0, 1 При 5 = 0 и по ней может быть найдена любая из вероятностей р (sa, п т) при лю- бых S ИП. Допустим теперь, что шаги пьяного все убыстряются, а их длина уменьшается. Пусть т на стремятся к нулю, так, что 2 lim— = D. (28.9) 2т Запишем (28.8) в виде: p(sa,(n + /)г)-p(sa,nv) _ a2 p((s + 1)а,пт)-2p(sa,nT) + p(sa,nr) т 2т а2 и переходя в нем к пределу при т 0, а т и, учитывая условие (28.9), придем к уравнению в частных производных относительно функ- ции р (х, t) = (28.10) dt dx2 совпадающему по виду с уравнением теплопроводности (28.6) (a=D). Не следует думать, что в уравнении (28.10), как это было бы естест- венно, стоит предел дискретной функции р (sa, п т). Этот предел, как не- трудно видеть, равен нулю, так как все вероятности р (sa, п т) при а -> 0 стремятся к нулю. Конечно, 0 уравнению (28.10) удовлетворяет, но это нас не устраивает. Нам нужно ненулевое решение уравнения (28.10), удовлетворяющее условию нормировки +оо J p(x,t)dx = 1, которое интерпретируется для дискретных функций р (sa, п т) в виде 4-00 Р(?а> П Г) = 1 $=-00 Его можно записать в виде pjsajvr) а = { . а приводящем к мысли, что р (х, t) следует считать пределом дискретной функции р (sa, п т) /а. Приведенные выводы нетрудно повторить в более общих предполо- жениях двумерности или трехмерности пространства. При этом мы во всех трех случаях придем к уравнению вида
240 28. Распределенные динамические модели механики и физики или, соответственно, вида дТ /д2Т dt дх2 г/, (28.11) дТ 2( d2T d2T — = а —г +—т dt dx2 dy д!т\ (28.12) Дифференциальное уравнение в частных производных (28.12) (него частные случаи (28.6) и (28.11)) является одним из основных уравнений классической математической физики. Вторым основным ее уравнением является волновое уравнение d2u 2 —7~а dt2 d2u d2u d2u dx2 dy2 dz2 Это уравнение описывает колебания упругих сред. Для звуковых ко- лебаний газа функция и (х, у, z, t) имеет смысл давления в точке (х, у, z) в момент времени t. В одномерном случае, когда d2u 2 д2и —т = а —г» dt2 dx2 (28.13) функция и (х, t) может быть отклонением натянутой струны от ее равно- весного положения. Это же уравнение описывает продольные упругие колебания однородного стержня. В этом случае и (х, t) - упругое про- дольное смещение материала стержня в сечении х в момент t, В двумер- ном варианте уравнение (28.11) может описывать поперечные колебания мембраны. Уравнения теплопроводности и волновое уравнение классической ма- тематической физики - линейные. Это значит, что к ним применим прин- цип суперпозиции, тот же самый, что и для линейного осциллятора или любой другой линейной системы, т.е., найдя какие-нибудь их решения, можно с их помощью строить новые решения или, может быть, даже лю- бое нужное нам решение. Такими частными решениями является так на- зываемое фундаментальное решение уравнения теплопроводности и гар- монические бегущие волны. С тем и другим ниже мы познакомимся. Существенным отличием динамических систем, описываемых диффе- ренциальными уравнениями в частных производных от тех, которые описываются обыкновенными дифференциальными уравнениями, состо- ит в том, что равновесные состояния дискретных динамических систем находятся сравнительно просто из обращения в нуль их правых частей, т.е. из некоторых нелинейных уравнений, в то время как для распреде- ленных динамических систем уравнения, определяющие равновесие, оказываются также дифференциальными. Так, полагая в (28.127 или (28.137 Т(х, у, z, t) =Т*(х, у, z) и и (х, у, z, t) =и*(х, у, z) равновесными состояниями, не меняющимися со временем, приходим к тому, что они удовлетворяют уравнениям в частных производных
28 Распределенные динамические модели механики и физики 241 д2Т* д2Т* _ ~д?~~ дх1 (28.14) 2 и, соответственно. д2и * д2и * л* = о. (28.15) (28.16) дх2 ду2 dz2 Решение этих уравнений настолько сложно, что они также входят в список уравнений классической математической физики. Продолжим знакомство с другими математическими моделями рас- пределенных динамических систем. Движение вязкой жидкости подчиняется нелинейным дифференци- альным уравнениям в частных производных Навье - Стокса ди / х 1 —+ (yV)o =------------------- dt р Частным его случаем при v = 0 является уравнение Эйлера движения идеальной (невязкой) жидкости. В этом уравнении и (х, у, z, t) - вектор скорости жидкости в точке х, у, z в момент t, р (х, у, z, t) -давление, р - плотность, v - параметр, т.н. кинематическая вязкость, Ги Л - широко распространенные символы операторов градиента и Лапласа. Именно „ . д .д . д V = i — + 1 — + k—, дх ду dz где i, j, k - орты прямоугольной системы координат, а оператор Лапласа имеет вид: д2 д2 д2 Л — —— ч---- ч--—. дх2 ду2 dz2 В случае несжимаемой жидкости к уравнению Навье - Стокса или Эй- лера требуется добавить условие несжимаемости, состоящее в том, что скорости жидких частиц должны быть такими, чтобы их объем не менял- ся. Это условие также записывается с помощью уравнения в частных производных, а именно: (28.17) (28.18) дих ди ди>2 div и - —- ч----ч- —- = О, дх ду dz а для сжимаемой жидкости в виде условия div pv = 0, выражающего сохранение не объема, а массы. Вас бегло познакомлю еще е великими уравнениями Максвелла. Это достаточно сложная система уравнений в частных производных. В нее входит много разных функций. Вектор-функции Е (х, у, z, t), D (х, у, z, t), Н(х, у, z, t), В (х, у, z, t), описывающие электрическое и магнитное поля (поля вектора электрической напряженности и индукций, магнитной на- пряженности и индукции), скалярная функция распределенного электри- ческого заряда р (х, у, z, t); и векторная функция поля электрических то-
242 28. Распределенные динамические модели механики и физики ков j (х, у, z, t). Уравнения Максвелла связывают эти функции между со- бой. В векторной форме и в сокращающих их запись общепринятых обо- значениях, они могут быть записаны в виде следующих основных урав- нений *: . __ дВ _ = -4тс j + с rotH , = -с rotE (28.19) д t-----------------------------------------------д t к которым следует добавить еще два уравнения div В = 0, div D = -4л р, (28.20) и в простейшем, частном случае, еще три алгебраических соотношения D = sE, В = рН, j = crE. (28.21) Это очень сложная система уравнений. Это и понятно, ведь из нее сле- дуют все явления электростатики, магнитостатики, электродинамики и электромагнитного излучения и волн. Они при независимости £ и от полей Е и Н линейные и поэтому допускают применение принципа су- перпозиции. В этом смысле более простые на вид уравнения гидродина- мики куда хуже, они нелинейные и принцип суперпозиции для них не имеет места. Вы увидели несколько замечательных, даже великих, распределенных математических моделей механики и физики. Возможно, они вам чужды и непонятны. Не смущайтесь этим, ведь это не более как математические описания, математические модели. Только это от вас сейчас требуется. Вы должны принять их в этом качестве, не смущаясь ни их сложностью, ни вашим сегодняшним незнанием, как их решать и применять. Во всех приведенных моделях описание состояния функциями воз- никло потому, что речь шла о тех или иных физических пространствен- ных полях: поле температур, плотности, скорости, смещений, давления, электрической и магнитной напряженностей и индукции, плотности ве- роятностей. Но возможны и совсем другие причины возникновения в описании состояния функций. Этот другой случай вам встретится позд- нее при рассмотрении математических моделей микромира. Состояние динамических систем микромира описывается функцией от координат всех входящих в систему частиц и их спинов, а уравнение, которому эта функция удовлетворяет, - это знаменитое уравнение Шредингера для функции состояния у/ ih^- = Hv, (28.22) dt rot А- дифференциальная операция над вектором А (Ах, Av, AJ, определяе- мая определителем вида: rot А - i д дх Ах j д ду Ау к д dz Az 8Ау' dAz' дх j (дА дх дАхУ Определение div А содержится в уравнении (28.17).
28. Распределенные динамические модели механики и физики 243 которое пишется очень кратко, но в котором отражается весь окружаю- щий мир. Уравнение это на самом деле очень сложное и решается очень трудно: функция у/- комплексная и может зависеть от очень большого числа переменных, а под знаком оператора Гамильтона Н спрятан слож- ный дифференциальный оператор, содержащий частные производные второго порядка. Этому не следует удивляться, ведь именно он в конеч- ном счете определяет все происходящее в окружающем нас неживом и живом мире. Ко всему сказанному о распределенных моделях динамических систем (классических уравнениях математической физики, уравнениях Эйлера и Навье - Стокса, Максвелла и Шредингера^ необходимо добавить, что са- ми по себе они еще не дают полного описания изменения входящих в них функций. К этим уравнениям необходимо присоединить еще некото- рые дополнительные условия. Они весьма разнообразны и определяются конкретным рассматриваемым объектом. Для уравнений математической физики при неограниченности пространства переменных х, у, z - это не- которые условия ограниченности на бесконечности, при ограниченности области переменных х, у, z - это некоторые условия на ее границе, назы- ваемые краевыми. То же имеет место и для уравнений гидродинамики, электродинамики и уравнений Шредингера. Только совместно с этими дополнительными условиями входящие в эти уравнения функции от про- странственных переменных определяют состояние, т.е. будучи заданы при t = to, они могут быть найдены при любом t> to. С некоторыми кон- кретными краевыми условиями вы встретитесь в дальнейшем. А сейчас ограничимся простым примером натянутой струны, концы которой не- подвижно закреплены. В этом случае уравнение малых колебаний струны - это волновое уравнение где и (x,t) - отклонение струны от равновесного натянутого положения в момент времени t. Это уравнение имеет место на всей струне, т.е. при О <х <1, где х = О и х = 1 - координаты закрепленных концов струны. На этих концах отклонение и отсутствует и поэтому имеют место краевые условия и|„0 =0,и|х_, =0. (28.24) Уравнения в частных производных (28.23} совместно с краевыми ус- ловиями (28.24) допускают при заданном начальном положении и скоро- стях и (*>01,-0 = <»(*)> тЧ-о = И*) (28.25) Ct единственное решение и (х, t). Состояние в этом случае определяется в начальный момент функциями (р(х) и (х), удовлетворяющими краевым условиям ср (0) =(р (I) =0, у/ (0) = у/ (1) =0. При любом t состояние описы-
244 28 Распределенные динамические модели механики и физики вается удовлетворяющими краевым условиям функциями х и (х, t) и du(x,t) _ -------. Вас не должно удивлять, что наряду с функцией и (х, t) в опи- dt du(x,t) сание состояния входит еще и функция ---------. Это объясняется тем, dt что волновое уравнение (28.137 в виде (28.27 записывается как ^(и,и) = (у,а2Аи), (28.26) и состоянием для него является вектор, составленный из двух функций и (x,t) и и (х, t), как функций х при фиксированном времени t.
245 29 ФУНДАМЕНТАЛЬНОЕ РЕШЕНИЕ УРАВНЕНИЯ ТЕПЛОПРОВОДНОСТИ Распространение тепла в неограниченной однородной одномерной теплопроводящей среде описывается дифференциальным уравнением в частных производных вида I ^L = a2^I.т = Т(х, t) (29.1) dtdx2 Такое же по виду уравнение описывает диффузию или случайное блуждание частицы. Пусть в начальный момент времени t = 0 имеется некоторое произ- вольное поле температур То ( х ) , так что (29.2) Уравнение теплопроводности (29.1 ) по начальному распределению температур То (х ) определяет дальнейшее поле температур Т ( х, t) при любом t > 0. Уравнение ( 29.1 ) и начальное условие (29.2 ) описывает не только изменение начального поля температур, но и диффузию вещества и из- менение со временем плотности вероятности случайно блуждающей час- тицы. При этом Tq ( х ) - начальная плотность вещества или, соответст- венно, начальная плотность вероятности. Не будем решать эту общую для всех перечисленных явлений задачу (29.1 ), (29.2 ) сразу для произвольного начального поля То (х ). Попытаемся найти ее решение для точечного начального поля, когда только в одной точке хо среда разогрета или только в ней находится диффундирующее вещество или в ней находится случайная частица. Сразу же возникает вопрос, как, какой моделью описать точечное со- средоточение тепла, вещества или плотности вероятности? С физической точки зрения идеализации точечным сгущением массы или тепла обыч- ны. Но как их описать математически? Ведь в этих случаях температура, плотность диффундирующего вещества или, соответственно, плотность вероятности становятся бесконечными, а всюду вне этой точки равными нулю. Не будем смущаться и запишем, что для описывающей функции То (х) имеет место при X = х0. при X Ф х0 (29.3) и еще запишем, что в точке х = хо сосредоточено с ( с - теплоемкость вещества) единиц тепла, единичная масса или вероятность, равная еди- нице,
246 29. Фундаментальное решение уравнения теплопроводности Jto(x> = 1. (29.4) Безусловно, Tq (х ) , определяемая ( 29.3 ), не функция в обычном смысле, а интеграл ( 29.4 ) - не интеграл. Будем ее рассматривать как некий новый символ -8- функцию или обобщенную функцию. Эту не- обычную 8- функцию ввел в математику О.Хевисайд, в связи с создан- ным им операционным исчислением, и позднее физик - П.Дирак - в квантовой механике. Обобщенная функция 8 ( х ) определяется условиями: <*(*)= оо « О при х = О, при х * О (29.5) |<5(х)<& = 1. Из ( 29.5 ) формально следует, что для любой непрерывной функции J/(x)5(x - x„)dx = /(х„). (29.6) Действительно, то х0+е $f(x)8(x-x0)dx= ^f(x)8(x-x0)dx х0-е при любом сколь угодно малом 8 > 0. По известной теореме о среднем этот последний интеграл равен /fe) \s(x-x0)dx = х0~е где £ лежит в промежутке от хо-8 до хо+е. Так как я может быть сколь угодно малым и функция /( х ) - непрерывна, то £ = хо. Пусть xq = 0 и начальному распределению температур 7о(х) = 6(х) отвечает меняющееся поле температур ср ( х, t). Функция (р ( х, t) пока- зывает, как растекается с единиц тепла, сосредоточенных в точке х=О, по всей прямой. Для задач диффузии и случайного блуждания функция (р (х, t) описывает диффузию вещества, поначалу сосредоточенного в точке х = 0, а для случайного блуждания частицы - плотность вероятно- сти нахождения и в точке х спустя время t, если в начальный момент она находилась в точке х = 0. Найти путем логического рассуждения функцию (р (х, t) не очень просто, догадаться можно, но трудно. Мы не будем делать ни того, ни другого: а просто ее напишем ----у=ехр - 2ay/ftt v 4a2t (29.7) и проверим, что эта функция ср (х, t) удовлетворяет при любых х и t > 0 уравнению теплопроводности (29.1 ) и начальным условиям
29. Фундаментальное решение уравнения теплопроводности 247 29.2), когда То ( х) = J( х ). Не нужно только последнее понимать бук- вально: если в ( 29.7 ) подставить t = 0, то нам дважды придется делить на 0. Поэтому будем не подставлять t = 0, а переходить к пределу при /->0. Т.е. покажем, что О при х*0 оо при х = 0 Нт <p(x,t) t-tO и что СО Нт [<p(x,t)dx = 1. t^>0 J —GO Первое очевидно, второе мы установим, показав, что при всех t > О 00 J^(x,/)o5c = 1. Действительно, 1 2а4тй ехр------г I 4a2t 4а t) 2а J t (29.8) Полученный несобственный определенный интеграл хорошо известен и равен у[я. Убедиться в этом можно следующим образом. Обозначим этот интеграл через I. Тогда 00 so 00 СО I2 = ^exp(-^2]d^exp{-p2)dp = f jexp(-^2-q2)dgdq, —CO —00 — OO— 00 или, переходя к полярным координатам г и (р, оо я оо I2 = jdr ех^ - г2 \d(p-7i jexp (- г2 )dr2 = л . 0-я О То, что функция (р ( х, t) удовлетворяет уравнению теплопроводности (29.1) при всех Z>0, можно убедиться непосредственно подстановкой. Итак, функция (р (х, t) , та, которую мы искали. Напомним еще раз, что <p(x,t), определяемая формулой (29.7), соответствует тому, что в на- чальный момент t = 0 в точке х = 0 помещено с единиц тепла. В случае, если речь идет о диффузии, то в начальный момент t = 0 в точке х = О помещена единичная масса диффундирующего вещества. Наконец, при случайном блуждании в момент t = 0 блуждающая частица находится в точке х = 0. При t« 0 функция (р ( х, t) имеет вид высокого ( высоты 1 / 2а ) и тонкого пика. С ростом времени t этот пик расплывается, как показано на рис.29.1. Площадь, ограниченная этой расплывающейся колоколообразной кривой, все время при всех /, согласно ( 29.8 ), равна единице, что отвечает сохранению тепла, вещества или, соответственно, нормировке плотности вероятности.
248 29. Фундаментальное решение уравнения теплопроводности Рис.29.1. Изменение со временем функции отклика (p(x,t) Зная функцию ф ( х, t) , описывающую расплывание тепла, сосредо- точенного в одной точке, можно найти по ней аналогичные функции в двумерном и трехмерном случае. В трехмерном случае такой функцией будет ф(х, у, z, t,) = ф(х, 1,)ф(у, t^p[z, /,) = 8а^еХЛ x2+y2+z2> 4a2t , . (29.9) Проверить это очень просто. Непосредственно находим, что Г°о при x = y = z = 0, lim<z>(x,>’,z,/l) = < /->0 [О при х2 + у1 + z1 Ф 0. (29.10) Запишем ОО ОО СО со ^(x,y,z,t)dxdydz = |^(x,f)tZx fa(y,t)dx fa(z,t)dx = 1. —CO —CO —CO —CO Далее уравнение дф(х,у,гл) _ д2ф(х,у,г,() д2ф(х,у,гл) d^(x,y,z,t) dt дх2 dy2 dz2 записывается в виде: dt dt dt dx dy dz поле будет or t на t - г, т.е. из которого следует его выполнимость. Функция ф ( х, t) описывает температурное поле, которое возникаем растеканием с единиц тепла, помещенных в точке х = 0 в момент вре- мени t = 0. Если то же количество тепла помещается в точку xq в мо- мент времени г, то последующее тепловое функцией ф ( х, t) с заменой х на х - хо и ф(х-х0, t- г). Оказывается, что с помощью этой функции ловое поле Т ( х, t) для любого начального распределения температуры То ( х ). В силу этого частное решение ф ( х, t) названо фундаментальным. Для того, чтобы это установить, прибегнем к принципу суперпозиции. Однако, прежде рассмотрим описываемое ею случайное блуждание. Ф ( x, t) можно найти теп-
29. Фундаментальное решение уравнения теплопроводности 249 Плотность вероятности случайно блуждающей частицы - абсолютно пьяного - со временем меняется, как показано на рис.29.1. Спрашивает- ся, как далеко уйдет абсолютно пьяный от начальной точки х = 0 за время /? Средняя удаленность (математическое ожидание х) равна нулю, по- тому что возможные уходы влево и вправо уравновешивают друг друга, поэтому следует прибегнуть к математическому ожиданию | х | или Мх2 . Та и другая величины легко вычисляются и равны М\х | = а (29.11) е. в обоих случаях «удаление» пропорционально ylt, в то время как при равномерном движении удаление пропорционально t. Поэтому даже очень медленно движущаяся частица уходит дальше, чем блуждающая бесконечно быстро случайная. Вместе с тем с очень маленькой вероятно- стью спустя любое время, в том числе и очень малое, она может оказать- ся сколь угодно далеко от начального положения. Растекание тепла и диффузия вещества происходят так же, как и рас- текание плотности вероятностей случайно блуждающей частицы. Инте- ресно отметить, что это растекание несколько необычно. За конечное и даже малое время температура повышается сколь угодно далеко. Это по- вышение ничтожно, но оно есть, т.е. тепло распространяется бесконечно быстро. То же самое относится и к диффузии. Эта несуразица, несущест- венная ввиду ничтожной малости удаленных значений фундаментально- го решения (р (х, t), является все же некоторым принципиальным дефек- том наших моделей. Сущность дефекта понятна из соотношения (28.9), согласно которому ти а стремятся к нулю, а величина а212т = а /т • а /2 к конечному числу D и поэтому скорость перемещения случайной час- тицы а 1т неограниченно растет. Вернемся к ролям фундаментального решения ср (х, t) и принципа суперпозиции в решении общей задачи о тепловом поле Т ( х, t) при на- чальном его значении То ( х ). Из принципа суперпозиции следует, что если раздельны для началь- ных полей 7о/(х)и То2 ( х) температурные поля 7}(х, Г) nT2(x,t), то при начальном поле температур с/ То/ (х ) + с2 Т02(х) последующее температурное поле будет с/ Т/ ( х, t) + с2 Т2 ( х, /). Начальное поле температур То ( х ) можно записать в виде: (29.12) и мыслить его как сумму полей £(x-£)7o(<f)d£ при всевозможных £ каждому из слагаемых которой отвечает спустя время t температурное ле <p(x-^T0(^d^. В соответствии с этим, согласно принципу суперпозиции,
250 29. Фундаментальное решение уравнения теплопроводности ОО T(x,t)= . (29.13) Это и есть решение задачи ( 29.1 ), ( 29.2 ). При желании, с пользой для себя, вы можете проверить это путем подстановки (29.13) в (29.1 ) и (29.2). Напишем еще раз полученное решение (29.13 ), выписав конкретный вид фундаментального решения T(x,t) = —j= 2ayj7tt (2914) В двумерном и трехмерном случае искомые решения пишутся анало- гично. Так, в трехмерном случае СО T(x,y,z,t)= ^Ta(l;,r],£)<p(x-,t}dl;dr)d£ = 1 "fr lx z-1 f (Х~^У+(у~^)2+(z~^)2)jcj j/- 8a3(J^tf-L I 4a ‘ ) где, как и ранее, То ( х, у, z ) - трехмерное начальное при t = 0 поле тем- ператур. Этим возможности фундаментального решения не ограничиваются С его помощью можно решить и более общую задачу, когда наряду с на- чальным полем температур имеется распределенное тепловыделение или поглощение тепла. Первое можно представить как горение или экзотер- мическую химическую реакцию в теплопроводящей среде, а второе - как таяние мелких льдинок или эндотермическую химическую реакцию ней. Мы получим решение этой новой задачи, даже не выписывая урав- нений в частных производных, которое ей соответствует. Пусть выделяющееся тепло за время dr в каждый момент времени т создает некоторое дополнительное распределение тепла с Ему, как нам уже известно, отвечает решение (29.13 ) или (29.14), в котором То ( £) следует заменить на с/(£, r)Jr,a г на t- т, т.е. СО //(<• z<p(x t)d£ —ОО Ко времени t все эти тепловые поля просуммируются, т.е. t оо T(x,t) = f jfU.r^x-^.t-T^dT. (29.15) О —оо Это, конечно, при начальном поле температур То (х) = 0. Если То (х ) * 0, то следует к решению ( 29.15 ) добавить еще (29.13), так что в итоге со t СО T(x,t)= /7'0Шх-е,^+ J ^fa,T)<p(x-^t-T)d^dT. (2916) —оо 0 —со
29. Фундаментальное решение уравнения теплопроводности 251 Это есть решение уравнения ( 29.1 ), правая часть которого дополнена слагаемым /(х, t), соответствующим непрерывному тепловыделению, при условии ( 29.2 ). Вот так изящно с помощью фундаментального ре- шения находятся решения задач о теплопроводности в неограниченной теплопроводящей среде. Изящество, прежде всего, в том, что решения сложные, а находятся легко, без выкладок, только на основе принципа суперпозиции. Но надо было догадаться, что нужно найти решение р(х, t), отвечающее точечному распределению тепла. Теперь рассмотрим задачу о прогреве полупространства, в решении которой нам опять поможет фундаментальное решение (р (х, t). Эта за- дача формулируется так. С одной стороны пространства температура все время равна 7/, а с другой - находится теплопроводящая среда, имеющая в начальный момент температуру То. Спрашивается, как будет меняться температура этого последнего полупространства? Выберем начало координат О на границе сред и направим ось Ох в глубь теплопроводящей среды (рис. 29.2). Тогда ее температурное поле будет зависеть только от х и, следовательно, описывается функцией Т(х, t). Эта функция Т{ х, t) удовлетворяет уравнению теплопровод- ности дТ , д2Т — - а —т, dt дх2 начальным условиям т(х, t) | /=0= То и, кроме того, граничному условию л=0~ > (29.17) (29.18) (29.19) так как по условиям задачи в полупространстве х <0 поддерживается температура Т]. Новым по сравнению с предыдущим является наличие границы области, в которой рассматривается тепловое поле, и в связи с этим появление нового дополнительного условия - граничного условия (29.19). Ti О Рис.29.2. Иллюстрация к задаче о прогреве бесконечно толстой стенки T(x,t) Заметим, что температуру То можно считать равной нулю. При этом 7/ заменится на Ti -То. А можно этого и не делать, а просто искать теп- ловое поле в виде Г(х,Г) =Т0+ T(x,t), где Т (x,t) удовлетворяет условиям (29.17 ),( 29.18 ) и ( 29.19 ), в ко- торых То и Т] заменяются, соответственно, нулем иТ] -То.
252 29. фундаментальное решение уравнения теплопроводности Решая эту задачу, можно, наверное, исходить только из чисто матема- тических соображений. Но мне хочется показать вам на этом примере, как могут помочь и подсказать решение физические соображения. Пусть ради определенности Ti > То и, следовательно, происходит про- грев полупространства х > 0. Этот прогрев происходит за счет того, что через граничную точку х = 0 ( через единицу площади границы раздела х = 0 ) перетекает тепло с интенсивностью q(t). Эта функция q(t) нам неизвестна, но через нее с помощью фундаментального решения можно записать Т ( х, t) в виде T(x,t) =TQ + j^(r)^(x,Z - т)с!т. (29.20) о Функция Т ( х, t), определяемая формулой ( 29.20 ), удовлетворяет (29.17 ) и (29.18 ) при любой функции q ( г). Так что остается удовле- творить еще только требованию (29.19 ), т.е. Тх = То + j?(r)p(O,Z - о или Т, =T0 + J—ад '2а^л\1~т) Вводя новую переменную и = dt, запишем ( 29.21 ) в виде г, - то = -2= du. (29.22) 2аул q vl - и Для выполнения этого последнего условия во всяком случае следует избавиться от зависимости подынтегральной функции от t. Для этого следует выбрать q(tu)=T=, (29.23) yjtu после чего ( 29.22 ) принимает вид: гг. гг 1 г du 4л А _ Аз = —г= |—\ =—с • 2аул £ -у/и(1-и) 2.а Откуда находим, что 2а(Т -7L) с = —^-1--°/, (29.24) 4 л и искомое решение, согласно ( 29.22 ), (29.23 ) и ( 29.24), принимает вид: r(x,f)=ro+^^j—^expf- ^ Л (29.25) Исследование этого решения обнаруживает, что оно является функци- ей tlx2' Это означает, в частности, что для того, чтобы на глубине 2х
29. Фундаментальное решение уравнения теплопроводности 253 установилась та же температура, какая уже есть на глубине х, необходи- мо не в два, а в четыре раза большее время. Устанавливается сделанное выше общее утверждение преобразовани- ем после замены переменной тиа ту = т!х2, выражения (29.25 ) к виду : т-т. <Гп _ ..гехр 1 " о -7J) к™ '/// Вид графика этого решения, как функции tlx2, показан на рис.29.3. Такой его вид следует из монотонности возрастания F как функции ар- гумента tlx2, и из того, что при tlx2 = ti Т(х, t) = То, а при tlx2 = со T(x,t) = Т[. Рис.29.3. График изменения темпе- ратуры в прогреваемой толстой стене в идеализации полупростран- q ством Т~Т0\-
254 БЕГУЩИЕ ВОЛНЫ И ДИСПЕРСИОННОЕ УРАВНЕНИЕ Уравнение линейного осциллятора х + 23к + со2х = О имеет частные решения вида еЛт, где значения Л находятся из характери- стического уравнения %(Л) = Л2 + 28Л+со2 = 0. Аналогично, для уравнения теплопроводности ди 2 --= а ---г dt дх1 (30.1) и волнового уравнения д2и _ 2 д2м имеются решения вида е'(<у/ где возможные значения cd и к находятся из дисперсионного уравнения /(<уД) = 0. (30.3) Подставляя в (30.1) предполагаемое решение и(х, () = е,(й}‘-кх\ (30.4) приходим к дисперсионному уравнению ico + a2k2 = 0. (30.5) Для уравнения (30.2) аналогичная подстановка дает ia>-a2k2 = 0 (30.6) Выражая к через со, согласно (30.5) и соответственно (30.6), находим, что уравнение (30.1) имеет всевозможные решения вида w(x,r) = expz cot± J СО 1 — z' a V2 а уравнение (30.2) вида / \ , co w(x,r)=expz py/±—x . k a ) (30.8) Выясним, что представляют собою эти решения (30.7) и (30.8), т.е. решения вида и(х, t) = exp i (cot + кх), (30.9) где cd действительно, а к может быть комплексным. Пусть поначалу со и к действительные. Тогда exp i ( cot + кх) = cos(co t + кх) + i sin(cot + кх) и, следовательно, действительными решениями являются функции cos(cot + кх), sin(cot + кх). (30.10)
30. Бегущие волны и дисперсионное уравнение 255 При t = 0 этим решениям отвечают переменные гармонически ме- няющиеся поля с длиной волны 2 = 2л/ \к\ (рис.30.1). С ростом времени t это поле как целое перемещается вдоль оси х со скоростью v = - со /к. Так что (30.10) является, а (30.9) можно трактовать, как бегущую со ско- ростью v = - со/к гармоническую волну длины 2 = 2я7 |Л|. При этом в каждой точке х, как это видно из (30.10), поле при изменении времени t меняется тоже по гармоническому закону с частотой со и единичной ам- плитудой. В силу этого величины со и к названы частотой и волновым числом бегущей гармонической волны (30.10) ( (30.9)). Рис.30.1. Гармонически меняющееся одномерное скалярное поле Пусть теперь волновое число к комплексное, т.е. к = к i + i к 2. Тогда exp i (cot + кх) = е k2Xcos (cot + к; х) + i е к1Х sin (соt + к/ х) и, следовательно, действительными решениями являются e'kiXcos (cot + кi х), екгХ sin (cot + к/ х). Если бы к 2 = 0, то это была бы гармоническая бегущая волна. Нали- чие множителя е~к2Х при к2> 0 приводит к ее экспоненциальному убы- ванию в направлении положительных х или, напротив, экспоненциаль- ному возрастанию при к2< 0. Сама волна перемещается направо, если ki< 0, и налево, если кi > 0. Скорость этого перемещения ц как и в пре- дыдущем случае, равна -colkj. Так что при к/ < 0 и к2> 0 - это убы- вающая бегущая направо волна (рис.30.2). При к1<01л.к2<0 - это воз- растающая бегущая направо волна (рис.30.3). Аналогично, при kj> 0 имеем бегущую налево волну, убывающую при к 2 < 0 и возрастающую при к 2 > 0. Во всех случаях в каждой точке х поле меняется по гармони- ческому закону с частотой со и амплитудой е~кгХ. Волновое уравнение (30.2), согласно (30.8), допускает всевозможные бегущие гармонические волны с всевозможными частотами и волновыми числами, соответственно, со и ± со/ а. Скорость распространения у всех этих волн одна и та же - а и, соответственно, + а. Длины волн разные 1ла! со, как и разные соответствующие им частоты. В силу принципа суперпозиции наряду с всевозможными бегущими гармоническими волнами (30.8) имеют место и всевозможные бегущие волны вида £c,cos a>s t±- + <р: и вида
256 30. Бегущие волны и дисперсионное уравнение С X \c(co)cos со 1±—\ + <р(со) dco . 1 к a J о Рис.30.2 Рис.30.3 Бегущие затухающая и, соответственно, нарастающая гармонические волны Это наталкивает на мысль, что волновое уравнение допускает произ- вольные бегущие со скоростью ±а волны / X / . 1 Л к а ) любой формы. Так это на самом деле и есть Это легко проверить не о- средственно убеждаясь, что при любой функции f (30.11) удовлетворяет волновому уравнению (30.2) Если все бегущие волны волнового уравнения распространяются в об( стороны с одной и той же скоростью а и не затухают и не возрастают, л волновые решения (30.7) уравнения теплопроводности имеют разные скорости распространения и экспоненциально уменьшаются. Согласие (30.7), действительными волновыми решениями являются переменные поля вида / \ у/ со u\x,f) = ехр—t=xcos cot + ay] 2 ay] 2 и поля вида ( Л 'JCO u\x.t) = exp-------р=х cos cot- . ау/ 2 (30 (30 у/СО ау[2 при разных неотрицательных со Поле, описываемое формулой (30 12), - затухающая волна, бегущая налево, а поле (30.13) - бегущая направо затухающая волна. При это» как быстрота затухания, так и скорость движения волн зависят от ее час тоты со Скорость ее перемещения равна ау/2со и тем больше, чем боль . 2у[2ла _ ше ее частота со или меньше ее длина волны Л = —=—. Вид этих бегу у] со щих волн показан на рис 30 4 На этом же рисунке указаны скорость е распространения, длина волны и быстрота ее затухания. Применим теперь полученные нами сведения к следующим двум по хожим задачам для волнового уравнения и уравнения теплопроводност» В качестве физической модели первой задачи возьмем полубесконечну»
30. Бегущие волны и дисперсионное уравнение 257 веревку, конец которой двигают вверх и вниз по закону A cos £2 t. В каче- стве физической модели второй - полупространство, на границе которого температура меняется по тому же закону. Рис.30.4. Бегущие гармонические тепловые волны: со - временная частота волны, Л - ее пространственная длина, и - скорость распространения Я думаю, вы, наверное, не раз в детстве забавлялись пусканием волн по веревке, быстро колебля ее конец в руке. Так же природа со сменой дня и ночи или зимы и лета меняет температуру над земной поверхно- стью Мы придем к сформулированным выше задачам, если примем, что движение руки и температура меняются по гармоническому закону. Ко- нечно, это грубое приближение. Но оно достаточно для понимания про- исходящих при этом явлений. Построим математические модели в первом и втором случаях. При- мем, что веревку начали колебать уже очень давно, как и очень давно меняют температуру над земной поверхностью. В первом случае движение натянутой полубесконечной веревки опи- сывается волновым уравнением при - оо< t< + ooHx>0. При х = 0 и всех t имеет место и(х, t) /х = о~ A cos £21. (30.15) Во втором примере тепловое поле подчиняется уравнению теплопро- водности
258 30. Бегущие волны и дисперсионное уравнение ет 2 д2т — — а — dt дх1 (30.16) тоже при - со<1< + соих>0, и при х = 0 и всех t Т(х, t) !х = о = A cos Q t. (30.17) Как видите, постановки обеих задач очень похожи. В первом случае вы хорошо знаете и много раз видели, что будет. Это позволяет нам, со- четая виденное с тем, что мы узнали о гармонических волнах, сразу со- образить, какое будет решение. Это будет гармоническая волна частоты со, бегущая от руки вдоль веревки, т.е. и(х, t) = A cos Q.(t-----) а (30.18) Она удовлетворяет уравнению (30.14) и краевому условию (30.15). По аналогии, решение второй задачи запишем в виде тепловой волны, бегущей от поверхности Земли вглубь и имеющей частоту Х2, т.е., со- гласно (30.13), ( T(x,t) = А exp (30.19) Ясно, что функция Т(х, t), определяемая (30.19), удовлетворяет урав- нению теплопроводности (30.16) и краевому условию (30.17). Решение (30.18), я думаю, вам хорошо известно из наблюдения. Хотя, если бы веревка была бы достаточно длинная, то вы бы заметили, что бе- гущая волна затухает. Это уже дефект нашей идеализации: наличие тре- ния в веревке при ее деформациях и трение ее о воздух мы не учли. При желании это можно сделать, считая, например, что сила трения пропор- циональна скорости движения веревки и противоположно направлена. Это привело бы к уравнению вида д2и 2 д2и г ди dt2 dx2 dt (30.20) Далее можно найти волновые решения вида (30.4) и, используя его, уточнить полученное нами решение (30.18). Действительно, подставляя (30.4) в (30.20), найдем, что со2 — а2 к2 -i hco = О или со Г Th к =--Л М ~1— • а \ со При h/ со « 1 приближенно к = ±— 1-1— . а \ 2со J Нас интересует волна, бегущая от руки, поэтому в полученном значе- нии волнового числа к берем знак минус. Соответствующее уточненное решение будет
30. Бегущие волны и дисперсионное уравнение 259 д(хЭ) = Лехр-----cos О/-----х. (30.21) \ 2а) \ а ) Оно действительно затухает с ростом х и при h = 0 переходит, как и положено, в (30.18). Бегущая вдоль веревки волна может привести к неожиданному эффек- ту если веревка утончается. Это утончение вызывает рост скорости рас- пространения волны а, так как а2 = Т/р, где Т - натяжение веревки, а р- ее линейная плотность. При этом растет не только скорость, но и ам- плитуда колебаний, волна нарастает. В результате может возникнуть сильный хлопок, вызванный тем, что скорость движения к концу веревки превзойдет звуковую. Чтобы осмыслить это явление, учтем, что волна сохраняет энергию, а колеблющаяся масса уменьшается. Наблюдать это явление можно на пастбище, когда пастухи хлопают утончающимися к концу длинными кнутами. Полученное нами решение (30.19) приближенно качественно описы- вает прогрев земной поверхности при суточных и годовых колебаниях температуры. При этом предполагалось, что наружная температура ме- няется согласно (30.17), колеблясь возле среднего значения, равного ну- лю Если считать среднее значение температуры отличным от нуля и равным То, то и к решению (30.19) добавится То и оно примет вид: Q T(x,t) = То + Л ехр к ---у=Х cos Q.t- а<2 «л/2 (30.22) Проанализируем это решение. Оно состоит из постоянной составляю- щей То и экспоненциально убывающей бегущей волны. Экспоненциаль- ное убывание для суточных колебаний много больше, чем для годовых. Амплитуда колебаний температуры убывает в е раз на глубине a 2 / Jo и поэтому, если для годовых колебаний она порядка метра, то для суточ- ных она в 4&год1 40. сут - 20 раз меньше, т.е. порядка сантиметров Отсюда следует, что на глубине нескольких метров температура практи- чески постоянна и равна средней температуре. Это объясняет наличие вечной мерзлоты на глубине, если наружная средняя температура ниже нулевой. Длина тепловой волны 2 равна атт\2 / - Q и значительно больше для годовых колебаний, чем суточных, примерно в двадцать раз. Минималь- ное и максимальное значение температуры на поверхности смещаются вглубь одно за другим со скоростью распространения волны и, равной а^[2О.. Поэтому на глубине х максимум и минимум температур насту- пают позднее на время x/a\f2Q, чем на поверхности. Это объясняет, что если в холодную зиму глубоко зарытые в землю водопроводные трубы замерзают, то происходит это не в самые сильные морозы, а значительно позднее, возможно, весной при значительном потеплении Суточные вол- ны температуры распространяются вглубь быстрее, чем годовые (при- мерно в 20 раз), а затухают они значительно быстрее, по экспоненте с
260 30. Бе уи ие волны и дисперсионное уравнение показателем тоже примерно в 20 раз большим и, конечно, отрицатель- ным. Мы рассмотрели задачи о теплопроводности, которые можно тракто- вать, как прогрев земной поверхности или толстой стенки здания, а так- же то, как меняется температура в глубине земной поверхности при су- точных и годовых изменениях ее на поверхности. Рассмотрим еще, как происходит намерзание льда над водой в озере или реке. Вода начинает замерзать, когда она охлаждается до нуля и про- должает охлаждаться со своей поверхности. На рис.30.5 схематически представлена толща льда и под ним еще не замерзшая вода при нулевой температуре. На поверхности льда температура отрицательная Тi, тол- щина льда £. Нас интересует, как растет со временем %. Пусть температу- ра льда Т(х, t). Для нее имеет место уравнение теплопроводности дТ 2 д2Т — - а dt (30.23) дх2 и краевые условия T(x,t)lx-o = Tl, T(x,t)/X-! = O, (30 24) означающие, что на верхней и нижней поверхности льда его температу- ра, соответственно, Т i и 0. лед Рис.30.5. Иллюстрация к намерзанию льда на поверхности воды Поток тепла через нижнюю поверхность льда от более нагретой воды к более холодному льду равен (30.25) В соответствии с этим оттоком тепла происходит образование нового дх льда, причем _ ос^_ ar х_£ н dt л—9 (30.26) где с - тепло, выделяющееся при замерзании единицы массы льда, а р - его плотность. Такова наша исходная математическая модель. Она доста- точно сложна. Сложность эта обусловлена тем, что в краевое условие (30.25) входит неизвестная переменная меняющаяся в соответствии с уравнением (30.26), которое само зависит от неизвестного £ Учтем особенности задачи и упростим ее математическую модель Образование льда происходит очень медленно. Так что можно считать, что в толще льда температура квазистационарна, т.е. такая, которая уста- навливается при постоянном %.
30. Бегущие волны и дисперсионное уравнение 261 При постоянном £ установившееся, не зависящее от времени, темпе- ратурное поле Т(х, t) = и*(х) удовлетворяет уравнению ^ = 0, (30.27) ах следующему из (30.23), и краевым условиям и\^0 = Т1} и\^ = 0, (30.28) следующим из (30.24). Из (30.27), (30.28) непосредственно находим, что Т эк _ * I и*-------- и поэтому уравнение (30.25) принимает вид Ji рс— =-к—. Л £ (30.29) Откуда, зная, что при t = 0 <^= 0, 2кТ1 (30.30) что означает увеличение толщи льда по закону , т.е. замедляясь со временем. Так, что если один сантиметр льда возникает за сутки, то 6 сантиметров, когда по льду можно ходить не за шесть, а за 36 суток. За- висимость от наружной температуры тоже замедленная, пропорциональ- ная . Поэтому при в два раза более низкой температуре скорость образования льда увеличивается только в 41 раз. Конечно, реально все немного не так, поскольку температура Т у не постоянна, а меняется со временем. Если эти изменения температуры не очень быстрые и в толще льда успевает все время устанавливаться теп- ловое поле, отвечающее температуре Тi(t), то можно по-прежнему вос- пользоваться уравнением (30.29), но считая в нем Ту функцией времени. Из этого уравнения (30.29) находим, что или pc £d£ = -k Тi(t)dt Откуда (30 31) Из приближенной формулы (30.31) следует, что в пределах ее по- грешностей толщина намерзшего льда за некоторое время t определяется той же формулой (30.30), где уже Ту средняя температура над поверхно- стью льда за время t. Так что толщина льда, намерзшего за зиму, пропор- циональна корню квадратному от средней зимней температуры и корню квадратному из ее длительности.
262 31 ТЕОРИЯ ЭЛЕКТРОМАГНЕТИЗМА ФАРАДЕЯ - МАКСВЕЛЛА И ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ МАКСВЕЛЛА - ГЕРЦА Ранее вы познакомились с великими уравнениями Максвелла. Они достаточно сложны и в них не просто разобраться. Современникам они были непонятны и лишь немногие их приняли всерьез. Их освоение, да- же в современной более ясной и простой векторной форме написания и продвинутом общим уровне мышления, требует больших усилий мысли, освоения новых понятий и представлений. В первоначальном же виде у Максвелла они были записаны в кватернионной форме и содержали за- темняющие суть дела лишние уравнения. Электрические и магнитные поля существовали до Максвелла раздельно. Они мгновенно порожда- лись, соответственно, зарядами и токами, которые считались первопри- чинами электромагнитных явлений. Уравнения Максвелла описывали нечто совершенно другое и новое. Они описывали электромагнитные по- ля, которые, меняясь и взаимодействуя друг с другом, могут существо- вать и распространяются сами по себе в пространстве с конечной скоро- стью. Из уравнений Максвелла можно было извлечь волновое уравнение, говорящее о существовании гармонической бегущей электромагнитной волны. Ее скорость оказалась близкой к скорости света, что позволяло Максвеллу высказать гипотезу об электромагнитной природе световых волн. Теория Максвелла, английского физика, противоречила существую- щей европейской, с нашей точки зрения, квазистационарной электроди- намике, хорошо математически разработанной и, казалось, полностью согласующейся с экспериментом. Приверженец европейской теории, Герц решил опровергнуть заумную теорию Максвелла, поставив основа- тельные и хорошо продуманные эксперименты. По существу речь шла об отстаивании европейской теории электромагнетизма, успешно развивае- мой такими гигантами, как Ампер, Лаплас, Гаусс, Нейман, Вебер, Гельм- гольц, против «вздорной» теории Фарадея-Максвелла. Первые шли от зарядов и токов, от описания электромагнитных явлений на их основе. И, как мы сейчас знаем, их ждал тупик. Заряды и токи не позволяют во всех случаях построить состояние электродинамической системы и поэтому понять, изучить и предсказать ее поведение. Для конструирования со- стояния нужны принципиально новые полевые представления, нужно электромагнитное поле, для которого заряды и токи лишь его особенно- сти. В теории Фарадея-Максвелла электромагнитные явления могут про- текать без зарядов и токов. Состоянием динамической системы электро- динамики Фарадея-Максвелла являются электромагнитные поля. И если в механике сплошных сред поля смещений и скоростей возникали есте- ственно и не были сопряжены с новым взлетом мысли, то в электроди-
31 Теория электромагнетизма Фарадея - Максвелла и электромагнитные волны Максвелла - Герца___________ 263 намике это не так. В ней конструируются поля совершенно непонятной природы, чуждой человеческому восприятию. Этот скачок человеческой мысли сделал М.Фарадей. Именно он при- думал электрические и магнитные поля и с их помощью описывал непо- нятные электромагнитные явления. Максвелл уверовал в гений самоучки Фарадея и, как он сам пишет, лишь придал его представлениям матема- тическое описание. И именно этот безумный скачок мысли был необхо- дим для создания адекватной математической модели. Результат экспериментов Герца был неожиданным, он противоречил теории, разделяемой и любезной Герцу, и полностью соответствовал тео- рии Максвелла. Несмотря на это, Герц опубликовал результаты своих экспериментов и в связи с ними развил теорию Максвелла, открыв излу- чатель электромагнитных волн, получивший название вибратора Герца. Тем самым вместе с Максвеллом он стал у истоков возникновения радио, величайшего технического достижения начала XX века. Эксперимент Герца подтвердил теоретические открытия Максвелла, и уже ничего не препятствовало триумфальному шествию уравнений Максвелла. Сейчас очень не просто воспроизвести поиски Максвелла. Даже если это сделать, они будут едва ли понятны. Поэтому в плане общего расска- за о распределенных динамических систем и бегущих гармонических волнах покажем, как из уравнений Максвелла следует их наличие, следу- ет возможность электромагнитных волн. Итак, наша задача выяснить, допускают ли уравнения Максвелла решение в виде бегущих волн, когда вектора Е и Н являются только функциями двух переменных, времени t и, допустим, переменной х, электромагнитной волны, существующей са- мостоятельно, при отсутствии зарядов и токов, в пустом пространстве, т.е. при £= ц=\ и сг= 0. В этих условиях уравнения Максвелла (28.19), (28.20) и (28.21) упрощаются и принимают вид: О j-ч О у у — = crotH, = -crotE, (31.1) dt dt divE = 0, divH = 0, где E = E(x, t) и H = H(x, t). Заметим, что, не упрощая задачу поиском сразу плоской волны, можно обнаружить, что из уравнений (31.1) следу- волновые уравнения для полей ЕиН Действительно, продифферен- )уем первое уравнение (31.1) по ?, а к второму применим операцию дгЕ 8Н дН —— = crot----, rot----= -с rot rot Е. dt2 dt dt Откуда, пользуясь известной формулой векторного анализа it rot = Vdiv-Д, d2 Е - - - = -с rot rot Е - -с2 (ydivE - LE) в силу третьего уравнения (31.1) приходим к волновому уравнению для жтопного поля
31 Теория электромагнетизма Фарадея - Максвелла и электромагнитные волны Максвелла - Герца 264 дгЕ dt2 = с2&Е. Аналогично находится волновое уравнение для вектора магнитного поля. Далее уже можно находить согласованные уравнениями (31.1) ре- шения этих волновых уравнений. Не ставя себе такой общей задачи, за- будем об этом эффектном использовании векторного анализа и скромно продолжим поиск решения уравнений (31.1) в виде плоской волны, рас- пространяющейся вдоль оси х. Итак, в уравнениях (31.1) векторы Е и Н - функции только х и L Из последних двух уравнений (31.1) непосредственно следует, что —— = 0, дх дНх дх = 0 и, следовательно, компоненты Ех и Нх векторов Е и Н не зависят от х Поэтому они нас не интересуют и мы примем Ех= Нх = 0. После этого распишем первые два уравнения (31.1) в компонентах: дЕ дН дЕ, дН —- = -с-2-, —2- = с—у~, dt дх dt дх дН дЕ дН дЕ —- = с—---------- = -с— dt дх dt дх Эти уравнения разделяются на две независимых пары. Выпишем от- дельно одну из них: вА.-Ли< „„ dt дх dt дх Дифференцируя первое уравнение по t, а второе по х и сравнивая их, приходим к волновому уравнению д2Е . д2Е -----= С ---7 dt дх (ЗВ) которое, как нам известно, имеет решение в виде бегущей гармонической волны г Л . Е„ = Asin cot---- Далее из любого из уравнений (31.2) находим, что ТТ , . ( <ОХ\ (31.4) 31.5) Нг = Asin cot---- с Полученное частное решение (31.3), (31.4) удовлетворяет исходным уравнениям (31.1) и представляет собою электромагнитную волну, со- стоящую из двух перпендикулярных друг другу гармонических волн электрического и магнитного полей, распространяющихся вдоль оси х со скоростью с (рис.31.1). Таким образом, уравнения Максвелла при £= ]U= 1 п су = 0 имеют решение (31.4), (31.5). Остальные компоненты Ex, Е2 и Нх, Hz равны нулю. Это решение - плоская электромагнитная гармоническая волна с произвольной частотой со, волновым числом 2я
31 Теория электромагнетизма Фарадея - Максвелла и электромагнитные волны Максвелла - Герца 265 с/<уи скоростью распространения с. Так что таких разных волн много. Среди них — световые волны, радио-волны, ультрафиолетовые и инфра- красные волны, рентгеновские волны. Все эти разные волны имеют одну и ту же электромагнитную природу и различаются только частотой и длиной волны при одинаковой скорости распространения. Рис.31.1. Гармоническая электромагнитная волна
266 32 ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ ВОЛН Мы познакомились с распределенными динамическими системами. С основными уравнениями классической математической физики. Уравне- нием теплопроводности и одновременно диффузии, и случайных блуж- даний. Волновым уравнением, описывающим колебания натянутой стру- ны или мембраны, продольные и поперечные колебания упругой среды, изменения давления в газе, звуковые колебания, электромагнитные вол- ны. Новым по сравнению с дискретными системами являются волны. Те- пловые затухающие волны, скорость распространения которых зависит от частоты и длины волны. Незатухающие волны упругой среды и элек- тромагнитные волны, распространяющиеся с неизменной скоростью. С волнами связаны такие впечатляющие явления, как интерференция, диф- фракция, причудливая эволюция волнового пакета, с которой, в частно- сти, связаны искажения речи и музыки при передаче их на большие рас- стояния, отражение и преломление волн и другие. Эти явления вам хо- рошо знакомы со школьной скамьи и курса общей физики. Но там их из- ложение носило описательный характер и не опиралось на математиче- ские модели. Сейчас мы их можем не только описывать, но и изучать, извлекая новые неизвестные нам количественные и качественные сведе- ния. В качестве еще одного простого примера рассмотрим явления отра- жения и преломления волн от раздела упругих сред с разными характе- ристиками. Пусть конкретно речь идет о бегущей вдоль натянутой стру- ны волне вида (32.1) наталкивающейся на скачкообразное изменение плотности струны. На- правим ось Ох вдоль струны и пусть разные плотности струна имеет при х < 0 и х > 0 , т.е. точка х = 0 - точка раздела сред. Нам нужно найти пе- ременное поле и(х, t) смещений струны, вызываемое бегущей слева на границу раздела волной (32.1). Математическая модель должна включать волновые уравнения для частей х < 0 и х > 0 струны и условия согласо- вания их решений при х = 0 и то, что слева направо по части струны х < 0 бежит волна вида (32.1). В соответствии с этим пусть и(х, t) = и i(x, t) при х < 0 и и(х, t) = и 2(х, t) при х > 0. Для и i(x, t) и и 2(х, t) имеют место уравнения: d2u,(x,t\ д2и, / ч
32. Отражение и преломление волн 267 и I Лф/) (х>0) dt2 дх2 ' ’ где между и i(x, t) и и 2(х, t) при х = 0 имеют место сопряжения 1 I w,(^0L=o=“2U0Lo, (32 4) dn}(x,t) du2(x,t) дх X=Q дх Еще нужно отразить тот факт, что слева на границу раздела приходит бегущая волна вида (32.1), в которой волновое число к = co/а р Несмотря на простоту задачи, без физической подсказки поиск ее ре- шения не представляется простым. Физическая подсказка состоит в том, что нам известно, что при этом возникают отраженная и преломленная волны. Какие они - вопрос, но естественно предположить, что такие же, как и падающая волна, бегущие гармонические волны. В соответствии с этим примем, что ц(х,г) = Ае1{м-“М + Ale'^‘vM, y-jZ.DJ u2(x,t)=A2e'^-^\ где А, А ] и А 2 - амплитуды падающей, отраженной и преломленной волн, сц и а2 определены уравнениями (32.2) и (32.3); А р А 2 и сор со2 - неиз- вестные, подлежащие определению. Из условий сопряжения имеем: Aeiat + А^0* = А2е^‘, -г— Ае'м + i—Ale'“'‘ = -i^-А2е"*, а} а{ а2 где оба соотношения выполняются при любом t. Из этих соотношений следует, что со / = со 2 ~ а. Это можно было со- образить и сразу, ведь условия (32.4) должны соблюдаться при всех t. Принимая со / = со 2 = со, приходим к условиям; А + А^ = А2, со . со со Л ----А +— А} =----А . аг а2 Первое соотношение очевидно, так как в точке х = О струна не разрывается. Второе условие не столь очевидно. Оно следует из одинаковости натяжения N струны слева и справа от точки х = 0. Слева перпендикулярно оси Ох на точку стыковки струн действует сила -Nsinot!, где а / - угол струны слева от точки х = 0 с осью Ох. Аналогично справа действует сила + Nsina2 (рис.32 1). Точка струны, отвечающая х = 0 , имеет нулевую массу, поэтому силы —Nsinai и -Nsina2 уравновешивают друг друга, т.е. at = а2 и, следовательно, касатель- ные к струнам слева и справа в точке х = О совпадают. А это и означает выпол- нение второго из соотношений (32 4).
268 32. Отражение и преломление волн Откуда (32.6) А Л, =1 а'1агА, ' ' '|/й2 -----А. Требуемые решения и ](х, t) и и з(х, t) найдены. Рассмотрим зависимо- сти амплитуд А / и А 2 отраженной и преломленной волн от а / и а 2. Для этого на рис.32.2 представлен график зависимости А//А и Аг/А от aj/a2- Напомним, что а 2 и а22 в волновых уравнения (32.2) и (32.3) - это отношения общей для них силы натяжения к плотностям струны при х < 0 и х > 0. Из графика рис.32.2 следует, что для однородной струны, когда ai/a2 = 1 , как и должно быть, отраженной волны нет, а прелом- ленная - продолжение падающей. При исчезающе малой или очеш большой плотности струны в части х > 0 отношение а / /а 2 равно 0 и соответственно, оо. В первом случае имеет место отражение волны с тот же амплитудой и фазой, во втором - с той же амплитудой, но противопо ложной фазой. Амплитуда преломленной волны, соответственно, удваи вается, либо равна нулю. Эти крайние случаи можно рассматривать Kai отражение от свободного и закрепленного конца х = 0 струны с х < 0.1 первом случае падающая волна отражается, изменив только направлеши движения, а во втором, еще и перевертывается (рис.32.3). Рис.32.2. График амплитуд А/ и А2 соответственно отраженной и пре- ломленной гармонических волн Рис.32.1. Иллюстрация к преломле- нию и отражению бегущей гармо- нической волны на границе раздела х=0 разных однородных сред Рис.32.3 . Явление перевертывания при отражении бегущей гармониче ской волны от «закрепления». Пре- ломленной волны нет х-0
269 33 СТОЯЧИЕ ВОЛНЫ И КОЛЕБАНИЯ ОГРАНИЧЕННОЙ СТРУНЫ В этой лекции вы познакомитесь с новым типом колебаний распреде- ленных динамических систем - сплошной среды или электромагнитного поля - стоячими волнами. Они возникают в ограниченных упругих телах или объемах. Стоячая волна может возникнуть и как суперпозиция (ин- терференция) бегущих гармонических волн А е1 1 кх) и А е '(01 кх), бе- гущих навстречу друг другу, так как А е +Ае Kal + kx) = 2Ае to/ cos кх (33 Д) У волны (33.1) колебания в каждой точке х совершаются с одной и той же частотой со и фазой, но с разной амплитудой, зависящей от х по зако- ну 2А cos кх. В соответствии с (33.1) общий вид стоячей одномерной волны можно записать в виде u(x, t)=X(x)T(t), (33.2) где Х(х) - функция только х, a T(t) - только времени t. Во многих случаях колебания распределенной системы представимы в виде суперпозиции стоячих волн. В качестве примера мы рассмотрим произвольные колебания ограниченной струны с закрепленными конца- ми и их частный случай, когда эти колебания вызваны сосредоточенным ударом по ней в каком-то месте. Общая математическая модель следующая. Задано волновое уравне- ние 2 С1 _2 — %— (33.3) dt дх и начальные и граничные условия на функцию u (х, t) Начальные - I । и (х, t) I, = о = 4>(х), —/=о=И*), (33-2 * 4) dt граничные - и (х, t) \х = о = 0, и (х, t) \х = о = 0. (33.5) Метод получения требуемого решения был впервые предложен Фурье и назван его именем. Он состоит в том, что сначала ищутся решения вида стоячих волн (33.2) уравнения (33.3) при граничном условии (33.5). Та- ких решений оказывается счетное число. После этого решение задачи
270 33. Стоячие волны и колебания ограниченной струны (33.3), (33 4), (33.5) ищется в виде суперпозиции полученных решений вида (33.2). При этом оказывается, что суперпозиция всегда может быть подобрана требуемым образом, т.е. так, чтобы удовлетворялись началь- ные условия (33.4), краевые условия, как и само уравнение (33.2), удов- летворяются автоматически в силу того, что каждое слагаемое суперпо- зиции им удовлетворяет. Подставляем (33.2) в (33.3) и находим, что Так как левая часть этого равенства не зависит от х, а правая от I, то они равны постоянной, пусть -Я. Это приводит к уравнениям Т"+ЛТ = 0, X" + а2ЛХ=0. (33.6) Нас интересуют только те решения этих уравнений (33.6), для которых функция и (х, t), определяемая согласно (33.2), удовлетворяет краевым условиям (33.5). Это возможно только при положительном Я. При />0 общие решения (33.6) имеют вид: T = sinJXt + Bcos4Xt, X = Csina^Ax + Dcosa-y/Лх, и, следовательно, u(x,t) = TX = (Asin-xfX t + Bcos^/X t)(Csinajx х + Dcosa-\[X х). (33.7) Это решение должно удовлетворять краевым условиям (33.6). Из них следует, что D = 0, С sin а 1 = 0. (33.8) Принять С = 0 нельзя, так как в результате придем к тривиальному нулевому решению, поэтому из (33.8) следует, что 71 = — п (и = 1,2,3,...). al Итак, приходим к решениям вида 7ТУ1 ЛХ1 71X1 и (х, t) = (Hsin — t + Bcos—Osin—x. (33.9) al al I Это стоячие волны с дискретными длинами волн 21 / п и соответст- вующими частотами лп /а. 1.Х этой стоячей волны все точки колеблются синхронно с временной частотой (оп = лп/al и амплитудой, гармониче- ски меняющейся с изменением х пропорционально sin (лпх/l). Вид не- скольких стоячих волн для п = 1, 2, 3 показан на рис.33.1. Рис.33.1. Гармонические стоячие волны: 1 — основ- ного тона, 2 и 3 - первой и второй гармоник Далее будем искать решение исходной задачи (33.3), (33.4), (33.5) в виде бесконечной суммы всех стоячих волн (33.7)
33. Стоячие волны и колебания ограниченной cmpvnbi 271 u(x,t) = y (Ansin—t + Bncos—t)sin—x, (33.10) al al I гдеAn и Bn пока произвольны. Начальные условия (33.4) приводят к ус- ловиям: \ Вп sin^-x = ф(х), п I 7 (33.11) Z7T П , 71И . . —~Ап Sin-—X = W(x), al I которые можно рассматривать как разложения в ряды Фурье функций ^(х) и, соответственно, у/(х). Так как при п*т f . тт . тип sin—х sin—xdx = 0 , J Z / о * / а при n = m тот же интеграл равен —, то, умножая каждое из равенств 2п (33.11) на sin—х и интегрируя по х от 0 до I, находим, что 2я г х . . тип . Вт =—J (p(x)sin — хах, Ат = — Г цг( х) sin^-xdx. т i 1 (33.12) Так красиво и просто решается общая задача (33.3), (33.4), (33.5). Ре- шение получено в виде суперпозиции дискретной последовательности стоячих волн. Каждая стоячая волна характеризуется частотой о)„ = п 7г/а I и длиной волны 2 I /п. Ее вид определяется формулой (33.10). Частоты соп образуют спектр частот возможных колебаний огра- ниченной струны. Наименьшая частота со / отвечает основному тону, час- тота (02 ~ первой гармонике, - второй и т.д. (рис.33.1). Спектр коле- баний струны определяется его спектром частот и соответствующими им амплитудами. Если речь идет о рояльной струне, то состав гармоник ее колебаний определяет основной тон звука и его окраску, зависящую от гармоник. При одинаковом основном тоне окраска звука может быть совершенно разной. Так один и тот же нотный звук у рояля, скрипки и гитары звучит совершенно по-разному. Это при одинаковых основных тонах. Так что окраска и красота звука определяется всем его спектром. Основной тон определяется длиной, натяжением и плотностью струны. Спектр же - от того, как возбудили ее колебания. Где ее ударил молоточек рояля, как и где проводится смычок скрипки и какой он сам, наканифолен ли и как натянут и из чего сделан? Конечно, дело не только в том, каков спектр колебаний самой струны, но и в том, как эти колебания превращаются в звук, но этот сложный вопрос мы оставим в стороне и рассмотрим толь-
272 33, Стоячие волны и колебания ограниченной струны ко, как зависит спектр колебаний струны от места ее удара х = £ Разница звучаний рояля Бекштейна и Стенвея проистекает, прежде всего, от раз- личия мест удара молоточка по струне. При составлении математической модели колебаний первоначально неподвижной струны, получившей сосредоточенный на очень малой длине удар, передавший ей импульс р, будем исходить из общей модели (33.3), (33.4), (33.5). В этой общей модели надлежит только конкретизи- ровать вид функций (р (х) и у/ (х). Удар будем считать мгновенным и точечным. В соответствии с этим за время удара струна не успеет переместиться и поэтому ср (х) = 0, Так как струне при ударе передается импульс р, то / ^py/(x)dx = p, (33.13) о где р - постоянная плотность струны, а у/(х) - скорость струны после удара в точке х. Удар мы предполагаем сосредоточенным в исчезающе малой окрестности точки х = %. Поэтому вне этой исчезающе малой ок- рестности скорость у/ (х) непосредственно после удара равна нулю и по- этому условие (33.13) можно записать в виде y/(x)dx - — (£>0) (33.14) Р и у/(х) = 0 при х [х- £, х + t/, где £ исчезающе мало. При неограни- ченном уменьшении длины отрезка, по колорому ударяет молоточек, на этом маленьком отрезке функция у/(х) неограниченно растет, но все вре- мя соблюдается условие (33.13). Таким образом, функция <р(х) = Ц, а функция у/(х) всюду равна нулю, кроме исчезающе маленькой окрестно- сти точки х = £, и для нее имеет место условие (33.13). Используем эти сведения для вычисления постоянных А т и Вт по формулам (33.12). Со- гласно первой из них, В т = 0, а согласно второй, л ... пт . 'lap ... Л =— \ y/(x)sin-----хахк------sin---д , (33.15) т J / тр I где формулы тем точнее, чем меньше £ > 0. Это рассуждение, позволяющее у общего решения (33.10) найти кон- кретные значения коэффициентов Ап и Вп (п-1, 2,...), можно фор- мализовать и упростить с помощью уже знакомой вам обобщенной 8 -функции. Мгновенный удар молоточка сообщает струне, точнее ее точке х = %, импульс р. Математическая модель сосредоточенного в точке импульсар - это р 8 (х - т.е. у/(х) = — S(x-$). (33.16) Р Подставляя (33.16) в формулы (33.12) для А т формально приходим к (33.15), где знак приближения заменяется равенством.
33. Стоячие волны и колебания ограниченной струны 273 В обоих случаях приходим к тому, что колебания струны, получившей мгновенный сосредоточенный в точке х = f удар импульса р, имеют вид: . . . тт И . тт . тт u(x,t)= >——sin—q sin—xsin — t. (33.17) пр I I al Согласно (33.17), максимальные амплитуды основной частоты — и al соответственно, равны In гармоник — , — lap . 7i „ ар . 17Г ~ lap . Зтг ——sin—c. —sin—c , ——sin—c, p Гр I 3p / что наглядно представлено на рис.33.2 для основного тона п = 1 и пер- вых трех гармоник п = 2, п = 3 и п Рис.33.2. Графическая иллюстрация к зависимости амплитуды от порядка гармоники при импульсном ударе струны в точке х=Е, Из рис.33.2, в частности, видно, что основной тон наилучше представ- лен при ударе по центру струны, но при этом отсутствует вторая и чет- вертая гармоники. Для того чтобы хорошо представить несколько первых гармоник, можно ударить недалеко от концов струны. Так и делается в рояле. Причем, чем это расстояние меньше, тем более гармоник пред- ставлено. У Стенвея это расстояние меньше, чем у Бекштейна, и поэтому его звук «звонче», но зато звук Бекштейна «бархатнее» и «мягче». Звук скрипичной струны и фортепианной одного и того же основного тона сильно различаются, и это отличие объясняется также различностью представительности гармоник. Наше ухо устроено так, что звук воспринимается фактически через его спектр. Музыкальные звуки до, ре, ми, ... имеют спектр, состоящий из основного тона и гармоник. Музыкальные аккорды имеют спектр, со- ставленный из спектров, входящих в него звуков. Шум имеет очень мно- го спектральных частот, такой спектр называют сплошным в противопо- ожность с дискретным спектром, когда частот не очень много. Почему определенные последовательности звуков вызывают у нас та- кие сильные эмоции - пожалуй, одна из величайших загадок природы. Хотя некоторые необходимые для этого требования известны и состав- ляют предмет теории музыки.
274 34 МИКРОЧАСТИЦА До сих пор мы рассматривали различные математические модели ок- ружающего нас мира, подчас непонятного и загадочного, но все же того, в котором мы живем. Но помимо этого мира существуют миры, скрытые от нас, которые недоступны нам, и в этом смысле существуют лишь в нашем воображении. Таков микромир - мир молекул, атомов и элемен- тарных частиц. Мир, о котором человек догадался давно, но который стал доступен изучению только в последнее столетие, вместе с созданием но- вой неклассической физики — квантовой механики. Математические модели объектов микромира - квантовой механики - еще в большей мере, чем модели классической физики, носят математи- ческий характер, не только оторванный от нашего непосредственного опыта, повседневных представлений и интуиции, но и непринимаемый ими. Несогласования имели место и раньше при рождении законов меха- ники и электродинамики. В механике повседневные наблюдения, каза- лось бы, бесспорно свидетельствуют о том, что силы вызывают движе- ние, в то время как они только его изменяют. Более сложные электриче- ские явления казались порождаемыми зарядами и токами и совершенно неприемлемой была идея о существовании электромагнитных волн, ибо при этом нет ни зарядов, ни токов. Для квантовой механики такие непри- ятия проявлялись значительно сильнее. Микромир никогда и ни в чем непосредственно не воспринимался нашими органами чувств и оказался невообразимо отличным от привычного макромира. Вместе с тем, в ко- нечном счете, именно микромир лежит в основе всех проявлений макро- мира. Поэтому микромир все же можно обнаружить с помощью созда- ваемых человеком приборов и специальных условий опыта: наблюдая спектры излучения и поглощения атомов, радиоактивность, дифракцию электронов, фотоэффект и другое. Приобретаемые таким образом новые данные и их теоретическое ос- мысление противоречили не только многовековому опыту, но и сложив- шимся к тому времени теоретическим представлениям об окружающем физическом мире, получившем впоследствии наименование классиче- ской физики. Конечно, это относится не только к микромиру, но и другим разделам новой физики нашего века - физике больших скоростей, близ- ких к скорости света, огромных расстояний в миллионы световых лет, гигантских масс и огромных плотностей, сверхвысоких температур, не- виданных магнитных полей и др. Укажем на некоторые явные отличия проявлений микромира, говоря- щих о необходимости кардинального пересмотра представлений класси- ческой физики и создания кардинально новых математических моделей.
34. Микрочастица 275 Человечество давно, со времен древних греков, догадывалось, что ма- териальный мир состоит из мельчайших частиц - атомов - и все проис- ходящее с ним порождается их движениями и взаимодействиями. При этом само собой разумелось, что хотя они и чрезвычайно маленькие, но наделены такими же свойствами, как и обычные тела: они могут переме- щаться, ударяться друг о друга, зацепляться и т.д.. Создаваемая поначалу кинетическая теория газов, представления о жидких и твердых телах и многообразные химические превращения не противоречили этим наив- ным представлениям. Но на пороге XX века начали обнаруживаться не- соответствия. Постепенно эти несоответствия проявили свою полную не- совместимость с классической физикой. Например, выяснилось, что в некоторых случаях бессмысленно гово- рить о траекториях движения микрочастиц, что представления о наличии таких траекторий входит в явное противоречие с опытом, что в микроми- ре может в классическом понимании нарушаться закон сохранения энер- гии, а колеблющийся в атоме электрический заряд - электрон - почему- то не излучает, как это положено согласно классической электродинами- ке, а если и излучает, то только волновые пакеты определенных частот и энергий. Вы, конечно, слышали об этих и других особенностях микроми- ра: о дифракции электронов, о радиоактивном распаде, спектрах излуче- ния и поглощения атомов, квантовых генераторах - лазерах, фотоэффек- те, ядерных реакциях и реакторах, атомной бомбе, непомерно большой энергии излучения Солнца, необъяснимых закономерностях таблицы Менделеева и, возможно, многом другом. Для доказательства несостоятельности научных представлений и тео- рий не требуется много противоречий, нужно много соответствий, но противоречия достаточно одного. На одном мы и остановимся, на ди- фракции электронов. Электрон по первоначальным представлениям - это мельчайшая заря- женная частица с очень маленьким зарядом и массой. Его полет можно отклонить магнитным полем в полном соответствии с силой Лоренца, действующей на движущийся в магнитном поле электрический заряд. Его можно обнаружить после удара о фотопластинку, на ней он оставит после проявления черную точку. В электрическом поле он движется в полном соответствии с законами Ньютона. Но вот поставим на пути по- тока электронов постоянной интенсивности преграду с двумя отверстия- ми, а после преграды экран, который фиксирует попадание в него элек- тронов. Естественно считать, что на экране оставят следы только те элек- троны, которые пролетают через отверстия. Остальные будут задержаны препятствием и на него не попадут. При этом одни электроны летят через одну дырочку, а другие - через другую. Пролетев через дырочки в пре- граде, они долетят до экрана и оставят на нем свои следы. Из сказанного с очевидностью следует, что если мы будем в течение некоторого време- ни Т пропускать электроны через одну дырочку, закрыв другую, а затем опять в течение того же времени так же пропускать через другую, то это должно дать на экране ту же картину попаданий в него электронов, как
276 34 Микрочастица если их пропускать через обе дырочки в течение того же времени Т. Раз- личие можно видеть только в том, что пролетевшие через две дырочки электроны взаимодействуют друг с другом. Но это кулоновское взаимо- действие очень мало. Кроме того, оно, как и всякое другое, исключается, если время между полетами электронов более времени их движения от препятствия до экрана, т.е. если поток электронов достаточно малой ин- тенсивности. При описанном раздельном пропускании электронов то че- рез одну дырочку, то через другую или сразу через две, но в течение в два раза меньшего времени на экране должны быть одинаковые картины по- паданий в него электронов. Если электроны летят по определенным тра- екториям как обычные маленькие частицы, то это, безусловно, так. Что же дает эксперимент? Он дает нечто совершенно неожиданное, изобра- женное на рис. 34.1. . . Рис.34.1. Дифракция электронов •" при последовательном прохождении : : через две дырочки и одновременном ' черные точки соответствуют • «ударам» о фотоэмульсионный слой отдельных электронов Эти картинки разные, совершенно не похожие друг на друга Вторая картинка похожа на то, что через два отверстия пролетали не частицы - электроны, а проходил свет - электромагнитные волны - с характерной для него картинкой дифракции. Так что же такое летящий электрон - это летящая частица или волна, для которой имеет место явление дифрак- ции? Скорее всего, ни то, ни другое - они микрочастицы, объекты новой незнакомой нам природы. Верно лишь то, что в одних случаях они про- являют себя подобно частицам, в других как волны, а в третьих ни как волны и ни как частицы, а как микрочастицы. История синтеза математических моделей микромира - сложный, про- тиворечивый и запутанный процесс, очень далекий от логического выво- да. В нем много фантастических гипотез, непостижимых догадок и оза- рений с последующей фильтрацией, уточнением и взаимными увязками. Изложение квантовой механики даже для физиков обходит сколько- нибудь полное описание этого процесса. Тем более естественно это сде- лать для математиков, начав сразу с описания итоговой математической модели, ее формализма, который затем иллюстрируется на примерах. Освоение необычных математических моделей микромира требует выработки новых представлений, понятий и новой интуиции, на основе постижения математической модели путем проникновения в ее логику и гармонию, исходя из чисто математических соображений. Такой путь по-
34 Микрочастица 277 стижения истины тоже доступен человеческому интеллекту и именно в згой возможности его мощь и сила, вызвавшая гигантский скачок естест- венных наук в последние столетия. Основанием необходимости этих необычных математических моделей служит невозможность трактовки наблюдаемых явлений микромира с позиций классической физики, а основанием их справедливости являют- ся качественные и количественные совпадения получаемых с их помо- щью выводов и результатов с данными разнообразных наблюдений и зкспериментов (дифракция электронов на кристаллических решетках, спектры атомов и молекул, фотоэффект, спектры равновесного излуче- ния, химические свойства веществ и таблица Менделеева, явления физи- ки твердого тела и полупроводников, квантовые генераторы и многое, многое другое). К этому следует добавить, что все же необычные кванто- вые модели переходят в классические при изменении параметров от их значений в микромире к значениям нашего макромира. И в этом можно видеть стыковку законов нашего макромира и микромира. Лучше всего воспринять модель микромира, о которой будет речь ни- же, как игру, так же, как в свое время вы слушали игру Коена «жизнь». Только теперь меняются не фишки на шахматной доске, а некая функция и находимые с ее помощью физические величины. Такой подход по- зволит вам легко принять ее правила и, потрудившись, научиться играть. Когда вы научитесь «играть», математическая модель микромира вам станет привычной, а со временем и понятной. Если основной математический аппарат классической физики - это дифференциальные уравнения, то для квантовой механики - это еще и совсем другой, существенно отличный от дифференциальных уравнений, математический аппарат теории линейных операторов. Он был создан математиками до того, как был востребован физиками, исходя из внут- ренних потребностей и мотивов развития самой математики. Теория ли- нейных операторов вам знакома из курса функционального анализа, но, несомненно, действия с линейными операторами вам менее привычны, чем с дифференциальными уравнениями. Математические модели классической физики и квантовой механики существенно разные, но принцип детерминизма в его достаточно широ- ком понимании уцелел. Как и в классической физике, в основе описания объектов микромира лежит состояние, но теперь в виде некоторой ком- плексной функции у/ от координат микрочастиц и, возможно, их спинов. При этом состояние микросистемы - это сама комплексная функция у/ перечисленных переменных, а не значения входящих в нее переменных. Изменение во времени функции у/ подчиняется дифференциальному уравнению Шредингера ih^- = Hy/, (34.1) где Н - оператор рассматриваемой системы, h - т.н. постоянная Планка, равная очень маленькой величине 1,05 х 10 2 эрг.с.
278 34. Микрочастица Функция (//, как уже отмечалось - это функция вектора х - координат микрочастиц, спинов и времени Z. Оператор Н - это т н. оператор Га- мильтона. Он действует по переменным вектора х . Назван он так пото- му, что получается по определенным правилам из функции Гамильтона микросистемы, рассматриваемой как классическая механическая систе- ма То, что именно функция является описанием состояния, имело место и в классической механике при описании сплошных сред, и в электроди- намике при описании электрического и магнитного полей. Не ново и то, что эта функция удовлетворяет некоторому уравнению в частных произ- водных. Не так уж ново и то, что функция у/ комплексная, такое имеет место при приложении теории функций комплексного переменного к за- дачам гидродинамики и электродинамики. Существенное отличие состо- ит не в этом. Оно состоит в том, как по функции состояния у/ находятся возможные значения наблюдений физических величин, характеризую- щих рассматриваемую микросистему; как функция у/ связана с наблю- даемыми физическими величинами: координатами, импульсами, момен- тами, энергиями, спинами, частотами, длинами волн и др. Математический формализм квантовой механики. В квантовой механике постулируется, что каждой физической величине отвечает Эр- митов - комплексный самосопряженный - линейный оператор, собствен- ные значения которого - единственные возможные значения этой физи- ческой величины. Напомним, что эрмитовость оператора L означает, что для любых функций у/j и у/2 имеет место (звездочка означает комплексное сопря- жение) fy/j *Ly/2dx= ^у/,(Ly/} )*dx . (34.2) Собственные значения Л любого Эрмитова оператора L действитель- ные. Числа Л и соответствующие собственные функции ср находятся из условия L ср = Л (р (ср^О) (34.3) Множество всех собственных функций Эрмитова оператора полное, а собственные функции (pi и (р2-> отвечающие разным собственным значе- ниям Л / Ф 2 2, ортогональны j*#?, * (p2dx = 0. (34.4) Итак, как уже указывалось, каждой физической величине I сопоставля- ется по правилам, которые будут указаны ниже, Эрмитов оператор L. Возможные значения физической величины I - это только его собствен- ные значения. В результате измерений эти значения могут наблюдаться. Причем в идентичных условиях результаты измерений могут быть раз- ными, и фактический физический смысл имеет лишь их среднее значение (математическое ожидание). Это среднее значение I, согласно кванто-
34. Микрочастица 279 во-механическому формализму, находится по состоянию у/ квантовой системы по формуле (/) = [w*Ly/dx, (34.5) где функция состояния ^предполагается нормированной, т.е. Jу/ *у/ dx = 1. Сказанным исчерпывается формальное описание математической мо- дели квантовой системы. Эта математическая модель включает понятие состояния - функция у/, уравнение Шредингера изменения состояния во времени, и формализм отыскания возможных значении любой физиче- ской величины и ее среднестатистического значения по функции состоя- ния и операторам этих физических величин, согласно (34.5). Фактическое построение математической модели квантовой системы требует написания функций у/и Ни уравнения Шредингера,а также зна- ния операторов, отвечающих интересующим нас физическим величинам. Ее исследование в рамках изложенного состоит в решении уравнения Шредингера, возможно, при некоторых дополнительных сведениях о функции yr, отыскания собственных значений и собственных функций операторов интересующих нас физических величин и вычислений с по- мощью найденной функции у/их средних значений по формуле (34.5). Укажем операторы, отвечающие координатам х,у и z, импульсам рх,р у и р г, кинетической Т и потенциальной V энергий, а также оператору Га- мильтона Н, для частицы массы т в потенциальном поле V (х, у, z) без учета ее спина. Операторы, отвечающие координатам х,у и z, - это умножение на х,у и, соответственно, z. Так что оператор, отвечающий координате х, от функции у/-это х ух, для у И Z - это у y/nz у/. Оператор от у/,отвечающий функции V(x,y,z), - это V(x,y,z) у/. Импульсамрх,р ирz отвечают дифференциальные операторы -th— ,-ih—,-ih—. (34.6) дх ду dz Вектору импульса р (рх, р у, Pz) отвечает вектор - оператор ( — (34.7) ^дх ду dz> где V - значок оператора градиента. Кинетической энергии Т частицы массы т соответствует оператор h2 С ё2 д2 82 'I h2 Т72 h2 д — —— ч у ч — — V —-------------Л 2т дх ду dz ) 2т . 2т (34.8) где А - значок оператора Лапласа. Потенциальная энергия V (x,y,z) является функцией координат, и по- этому соответствующий ей оператор - это умножение на V (x,y,z). Осталось указать оператор Гамильтона частицы массы т. Согласно т.н. принципу соответствия классической функции Гамильтона,
280 34 Микрочастица V~(p« + Р* +P.2)+V(x.y.z) 2т и квантового оператора Гамильтона, он записывается в виде Н = ——А + V(x,y,z). 2т (34.9) Теперь мы можем записать уравнение Шредингера для микрочастицы массы т (без спина). Функция состояния будет = (// (х, t) = y/(x,y,z, t), (34.10) а уравнение Шредингера, согласно предыдущему (34.1), имеет вид .. di// h‘ (д2ц/ d2ip d2ip I п — =---—— ч----— ч--— dt 2т {дх ду dz2 у ч- ?(х,у. г)у/ • (34.11) Прежде чем перейти к конкретным примерам, укажем на два важных следствия, вытекающих из описанной математической модели квантовой системы. Одно следствие касается того, что можно указать, не только ка- кие значения может принимать та или иная физическая величина и не только ее среднее значение, но и вероятности, с которыми эти значения могут приниматься. Для того, чтобы это обнаружить, разложим в формуле среднего значе- ния (34.5) функцию у/ по собственным нормированным функциям опера- тора L. Ради простоты пусть спектр собственных значений оператора L дискретен, и тогда разложение нормированной функции ip по собствен- ным функциям tpi, (р2, — с собственными значениями / /, /2,... , которые есть возможные значения величины /, имеет вид: £i<Pi+ С2Ф2+ (34.12) где с, =jv'(3)<p’(x)dx. Подставляя (34.12) в (34.5), непосредственно находим, что W=Zkl4- (34-13) где в силу нормированное™ функции ip Xk.l2 =1- Как известно, математическое ожидание величины /, которая может принимать значения Z/, /2, — с вероятностямир i,p2,равно М1 = ^1,р,. (34.14) Сравнивая (34.14) с (34.13), находим, что вероятность ps принятия значения ls равна А=|СЛ (34.15) В частности, отсюда следует, что если функция ц/ совпадает с одной из собственных функций оператора Л, пусть с <pSi то ps — 1 и поэтому в этом случае физическая величина может принимать только одно значение / ,а вероятности других значений Z, (j *s) равны нулю.
34. Микрочастица 281 Таким образом, в общем случае функции у/ величина Z может прини- мать любое из значений 11,12,— с вероятностями, соответственно, pi,p2,.. • Это не исключает возможности в частных случаях (частных ви- дах функции у/) принятия величиной I лишь некоторых значений или да- же только одного. Только в последнем случае результат измерения физи- ческой величины Z предсказуем. Таков первый важный вывод из сформулированной математической модели квантовой системы. Проиллюстрируем его простым примером, когда речь идет о значени- ях координат х,у и z микрочастицы. Этим величинам отвечают операто- ры умножения на х,у и z. Поэтому, согласно формуле (34.5), (х) = ^у/* xy/dxdydz = jx у/ dxdydz = Jx( у/^dydz^dx и аналогично - для (у) и z. Отсюда непосредственно следует, что ff| является плотностью вероятностей значений координаты х, а |^|2 - плотность вероятностей значений х,у и z. Тем самым найден статистический смысл функции квантового состоя- ния у/: квадрат ее модуля у/ 2 - это плотность вероятностей принятия координатами значений х, у и z. Однако, согласно предыдущему, функция у/ дает статистическое опи- сание не только значений координат х,у и z, но и любых других физиче- ских величин, операторы которых нам известны. Второй вывод, который можно сделать из определения математиче- ской модели, относится к так называемому принципу неопределенности Гайзенберга о возможных результатах одновременного измерения физи- ческих величин ( I и к с операторами L и К) и состоит в утверждении, что однозначный результат измерения двух физических величин возможен только при коммутативности операторов LnK, т.е. когда LK-KL=0 В противном случае, либо обе величины Z и к не имеют однозначных значений, либо если одна однозначна, то другая неопределенна. Полнее, для дисперсий величин Z и к имеет место неравенство / \ 2 DIDk > - к * ( | у, &. (34.16) 4 J I i J Поясним это важное неравенство (34.16). В нем I и к— произвольные физические измеряемые величины, a L и К соответствующие им операто- ры. Оно является следствием очевидного неравенства - 2 справедливого при любом действительном А.
282 34. Микрочастица Выше были формулой (34.5) определены средние значения физиче- ских величин I и к. Аналогично можно определить их дисперсии, как средние значения величин (/-(/})2 и (к - . Так Dl = j(// * (т - (l))2 у dx , где функция i//(x,t), являющаяся состоянием микрочастицы, как ив формуле (34.5), предполагается нормированной на единицу. Например, операторы координаты х и импульса рх не коммутируют, так как ( . г д А д д д -in— \x + xin— = —in — inx— + xih— = —in ч дх J дх дх дх и поэтому, согласно формуле (34.16), h2 DxDpx>—, (34.17) 4 т.е. произведение дисперсий результатов измерений координаты х и со- ответствующего импульса не может быть меньше h 2/4. Это существенно отлично от того, что имеет место в классической ме- ханике, где, наоборот, для определения состояния требуется задание вме- сте с координатой х и импульса рх. В квантовой же механике они одно- временно не могут быть заданы принципиально. Это возможно лишь в случае коммутативности соответствующих операторов. Так, например, коммутируют между собой операторы координат х,у и z, а также импуль- сов рх,ру и р z и поэтому одновременное однозначное измерение только всех координат или только всех импульсов возможно, но если одновре- менно определены три координаты или три импульса, то не определены все импульсы и соответственно все координаты. Таким образом, одновременная определенность всех физических ве- личин, к которой мы привыкли в классической механике, в квантовой ме- ханике не имеет места. Кроме этого кардинального различия с классикой, напомним, что имеет место и еще другое существенное различие, о кото- ром уже говорилось. Это дискретность физических величин, их кванто- ванность, поскольку возможные значения физической величины опреде- ляются спектром собственных значений ее оператора, а этот спектр мо- жет быть дискретным. Перейдем к рассмотрению движений свободной квантовой частицы в некоторых простых одномерных полях. Рассмотрим мы и гармонический осциллятор, и квантовый вариант задачи Ньютона - атом водорода и во- дородоподобный ионизированный атом гелия или лития. Во всех этих случаях уравнение Шредингера, согласно (34.10), имеет вид ди/ h2 (д2и/ д2и/ ih— =--------?- +—v dt 2т дх2 ду д2у/У + + V(x, у, z)y/. (34.18) Будем искать его решения вида
34. Микрочастица 283 ц/(х, у, z,t)= Л Q) у/ (х, у, z). (34.19) После подстановки (34.19) в (34.18) и разделения переменных t и x,y,z получаем ih дА A dt h1 _ -—-Ey/ + Vy/ 2m (34.20) w = E, где E — постоянная. Перед нами два уравнения: одно относительно A(t), второе - у/ (х,у, z). Решение первого легко находится и имеет вид A(t) = e ~h‘. (34.21) Решение второго /г2 ----Ьлу+Vy/= Еу/, (34.22) 2т требует конкретизации функции V. Если нам удалось найти решение уравнения (34.22), удовлетворяющее естественным условиям, налагае- мым на функцию у/ (непрерывность, ограниченность и еще какие- нибудь условия, следующие из постановки задачи), то решением (точнее одним из решений) исходного уравнения (34.20) будет y/(x,y,z,t) = e h y/(x,y,z). (34.23) Это решение у/ при любом t удовлетворяет уравнению (34.22) (если в него вместо подставить (//) и поэтому является собственной функцией оператора энергии h2 А Т7 ----Л + V. 2т (34.24) Поэтому в найденном состоянии у/ энергия системы имеет определен- ное значение Е, так как £, согласно (34.20), является собственным значе- нием оператора энергии, отвечающим собственной функции у/. Состояния квантовой системы, отвечающие определенным значениям энергии £, называются стационарными. Так стояние с энергией Е. Заметим, что что цг - стационарное со- (34.25) и поэтому плотности вероятности значений координат в стационарном состоянии не зависят от времени (поэтому оно и названо стационарным). Для квантовой системы имеет место принцип суперпозиции. Это сле- дует из линейности относительно функции состояния уравнения Шре- дингера. Поэтому суперпозиция стационарных •состояний является тоже некоторым состоянием, удовлетворяющим уравнению Шредингера. Вер- но и обратное: всякое допустимое решение уравнения Шредингера мо- жет быть представлено суперпозицией стационарных состояний. Тем са- мым изучение возможных состояний квантовой системы сводится в этом смысле к отысканию всех ее стационарных состояний.
284 34. Микрочастица Спектр собственных значений оператора энергии может быть дис- кретным, непрерывным или смешанным. Каждому невырожденному зна- чению спектра отвечает единственная нормированная собственная функ- ция. При вырожденности собственного значения их может быть несколь- ко и даже бесконечно много. Однако в любом случае все собственные функции можно ортогонализировать и нормировать. Условие ортогональности двух различных собственных функций и ^2, отвечающих дискретному или непрерывному спектру, состоит в том, что Jy/y y/*2dx = 0. (34.26) Условие нормировки по форме записывается по-разному для собст- венного значения, отвечающего дискретному или непрерывному спектру. Для случая дискретного спектра условие нормированности функции y/s, отвечающей собственному значению Es, уже писалось и имеет вид f = 1 (34.27) Для непрерывного спектра, собственные функции которого зависят от параметраЕ,т.е. у/ = ^условие нормировки можно записать в виде jVe v'e'd* ~ $ (Е ~ Ef). (34.28) Эта запись означает, что при Е *Е' j^El/'E.dx = O, (34.29) что соответствует ортогональности. При Е = Е' интеграл (34.29) обраща- ется в бесконечность, но так, что все же существует интеграл от него по Е, равный единице, т.е. J Ye Vp d* = 1> (34.30) где интегрирование по Е происходит по непрерывной части спектра. Для того, чтобы сблизить записи (34.26), (34.27), (34.28), (34.29), (34.30) и (34.31), запишем их в виде *dx = 8i}, \y/Ey/Eldx = 8(E-E'\ (34.31) где символы 8цИ 8 (Е - Е) обращаются в нуль соответственно при i /у и Е ^Е\ а при i = j и Е = Е' первый равен 1, а для второго равен единице интеграл \з(Е-E')dE = \. Напомним, что символ 8 у (функция от целочисленных значений / и у) был введен Кронекером и называется символом Кронекера, а символ 8(Е- Е) был введен в теоретическую физику Дираком и называется функцией Дирака. Впервые эта функция использовалась Хевисайдом в созданном им новом, непонятом современниками, операционном исчис- лении. После этого затянувшегося, но необходимого предисловия перейдем, наконец, к рассмотрению указанных выше квантовых систем.
34 Микрочастица 285 Микрочастица (например, электрон) описывается операторами коор- динат, импульса, моментов импульса, энергии и спина, кроме того, она имеет массу и заряд. Если микрочастица имеет заряд, то на нее действует электрическое, а при движении - и магнитное поля. Такое богатство опи- сания и возможных влияний приводит к гигантскому разнообразию яв- лений в поведении микрочастиц. Последующее имеет целью познако- миться лишь с некоторыми из них, наиболее простыми, не приводящими к математическим трудностям и все же достаточно представительными для того, чтобы почувствовать отличия микромира от привычного мак- ромира. В последующем изложении примеры относятся только к микро- частице, для которой отсутствует или несущественен спин и отсутствует магнитное поле. Свободная микрочастица. Для свободной микрочастицы V = 0, и по- этому уравнение (34.22) принимает вид* Л2 - — Лу7 = Еу7. (34.32) 2т Непосредственно проверяя, можно убедиться, что оно имеет решение вида V = ехрЦрхх + pvy + p2z), (34.33) h гдеPx,py,Pz- произвольные постоянные, удовлетворяющие условию: 2 ’2 (34.34) (34.35) 2т Поэтому, согласно (34.23), соответствующее решение уравнения Шре- дингера для свободной частицы запишется в виде: У> = ехр^(р,х+ р, .у + p2z — Et). Это знаменитая функция. Она получила наименование волны де Брой- ля и с нее началась волновая трактовка микрочастицы. Чтобы это понять, заметим, что, с одной стороны, функция у описывает комплексную плоскую волну с частотой со = Е / h и волновым числом к = р\/ h = у/2тЕ /h, распространяющуюся вдоль вектора р, а с другой - она представляет собой микрочастицу с энергией Е и импульсом р. Последнее следует из того, что эта функция у является собственной функцией операторов импульсов .,д ч, 5 ч, д -th —, -ih —, -in— дх ду dz и, одновременно, оператора кинетической энергии - h 2 А /2т с собствен- ными числами рх,р Vipz и Е, соответственно. Согласно смыслу функции состояния «//, плотность вероятности ее местонахождения пропорцио- нальна | у/ 2, который, как видно из (34.35), при всех x,y,z и t равен еди- нице. Т.е. волна де Бройля как функция состояния описывает частицу с
286 34 Микрочастица определенным импульсом и энергией, но располагающуюся равномерно во всем пространстве, в полном соответствии с принципом неопределенности. Микрочастица в потенциальной яме. Пусть в прямоугольной по- тенциальной яме с неограниченными стенками находится микрочастица. В этом случае в уравнении Шредингера = + (34 36) V = функция V зависит только от одной координаты х: О при хе (0,а), со при хе (0,а) и ее график имеет вид, изображенный на рис.34.2. (34.37) V=oo V=0 V=OO Рис.34.2. Иллюстрация к пове- дению электрона в бесконечно t ) a x глубокой потенциальной яме Решение уравнения Шредингера (34.36) можно искать в виде i//= y/i(x)y/2(y,z). (34 38) После подстановки(34.38) в (34.36) получаемое уравнение можно за- писать в виде: h2 aV) 1^—^ +----- k dt 2m dx2 1 7 aV2 , dVzY dt 2m\dy2 dz2 j; (34.39) с разделяющимися переменными, что позволяет последующее рассмот- рение свести к поиску решения одномерного уравнения Шредингера: dy/. h2 д2у/. dt 2m dx2 + *Vi- (34.40) Этот прием будет использоваться и в последующих задачах. При х е (0, а) из уравнения (34.40) следует, что у/1 = 0, поскольку при этом V(x) = оо. При х е (0, а) оно принимает вид одномерного уравнения свободной частицы ( у/ / заменено на у/) _ а2 dt 2т dx2 решение которого легко находится и записывается в виде суперпозиции функций вида IР. Е expi —-х------1 < h h 2 Px 2m
34 Микрочастица 287 которая должна удовлетворять краевым условиям равенства нулю при х=0 и х = а. Этим краевым условиям удовлетворяют только функции вида: iEt . р Е ; Рх I h для которых Рх Е ] ( iEt\.px ... . 1Ч expi---х--1 =2icexp\-sin—х, (34.41) { h h ) *Ah)h h т.е. fl (k=±l, ±2, ...), 7th . Рх = —к, а (34.42) 2та2 Мы уже знаем, что функции (34.41) являются собственными функция- h д2 ми оператора кинетической энергии-----— с собственными значе- 2т дх ниями Ек, определяемыми формулой (34.42). Функция (34.41) состоит из суперпозиции двух функций, которые являются собственными для опе- ., д . ратора импульса -т— с собственными значениями, равными дх Рк = ±7th к/а. Таким образом, функции состояния у/формулы (34.41) отвечает кван- товая частица с энергией Е к и импульсами р к и - р принимаемыми рав- новероятно. Выясним еще, какова плотность вероятности координаты х квантовой частицы, находящейся в потенциальной яме с неограниченными краями для функций у/вида (34.41). Для этого необходимо функцию формулы (34.41) нормировать и най- ти квадрат ее модуля. Обозначим эту функцию Непосредственные вычисления дают, что е \ -'т' - Рк у/к=е h sin-j-x , (34.43) \VkVk*dx = -E J yj2a И поэтому ДЛЯ нормированной функции 1//к I <2 1-2 ^71 Vk\ =—sin —x' 2a a Соответствующие графики плотности вероятности изображены на рис.34.3, (для к = 7,2 и 3). Возможные функции состояния у являются всевозможными суперпо- зициями с комплексными коэффициентами найденных функций у к, т.е. ? . ктг t sin—X, а 1 ( ,7t2hk2 y/(x,t) = ~-^ckexp -i--- 2а ( 2та 2а 1
288 34 Микрочастица для которой условие нормировки состоит в равенстве единице суммы квадратов модулей коэффициентов с к- При этом квантовая частица имеет энергию Е к и импульс р к или - р к с вероятностями 1/2 | с к I 2- Что же отличает движение квантовой частицы в потенциальной яме от движения классической? Классическая частица будет двигаться в ямке от стенки к стенке, идеально отскакивая от них. Может иметь любую энер- гию Е. Половину времени попеременно и периодически она будет иметь импульс -j2mE , и другую - ~j2mE . Никакая суперпозиция движений иметь места, конечно, не может. По существу мало общего, только соот- ношение рх = 2 т Е между энергией и импульсом А=7 О к=2 к=3 Рис.34.3. Иллюстрация к поведе- нию электрона в бесконечно глу- бокой потенциальной яме, где изображены первые три гармо- ники функции y(xt) а Мы решили задачу об одномерном движении квантовой частицы в бесконечной прямоугольной потенциальной яме, определяемой функци- ей (34.37), которую обозначим Va(x). Располагая этим решением 1 ( -Ek "I .__exp -J2a V n J . лк sin — x a можно указать решение и для частицы, находящейся в трехмерной пря- моугольной яме (прямоугольном ящике), для которого потенциальная функция имеет вид: y=Va(x) + Vb(y)+Vc(z) А именно, искомые функции у/(х, у, z) будут . , с~'" h . лк. лк? лк Ч\кгк, (*>y>z) = -7=-^= sin-xsin—±-ysin — z, ' yJSabc a b с где к^к2,кз~ целые числа,большие нуля, и
34. Микрочастица 289 x2h2 (k2 ky = -------Т + -Л- + -¥ • 2m a b c J Диффузия микрочастицы через потенциальный барьер. Допустим, что микрочастицы движутся в направлении оси Ох. Пусть энергия каж- дой из них Е и, следовательно, они описываются найденной выше волной до Бройля. Поставим на пути этих микрочастиц потенциальный барьер (рис.34.4) с уровнем энергии Vo. Рис.34.4. Иллюстрация к явлению прохо- ждения микрочастицы сквозь потенциаль- ный барьер ширины а, в частности, и то- гда, когда энергия микрочастицы меньше энергетической высоты барьера Го Vo В классическом случае, если Е > V о, частицы пройдут через потенци- альный барьер и продолжат свое движение с прежней скоростью вдоль оси Ох. Если же Е < V о, то частицы полностью отразятся, и ни одна из них через барьер не пройдет. Оказывается, что для макрочастиц все будет не так. Только часть из них при Е> Vо «просочится» через барьер, а часть отразится обратно. Частичное отражение будет иметь место и при Е < V о. Остальные пре- долеют барьер, хотя их энергия Е меньше энергетической высоты барь- ера V о- Если мыслить в терминах волнового дуализма, то такое поведе- ние довольно естественно: падающая на потенциальный барьер волна де Бройля частично отразится, а частично, преломившись, пройдет через не- го. Посмотрим, что дает в этом случае математический формализм моде- ли микрочастицы. Будем искать стационарное решение уравнения Шре- дингера с энергией Е. Учитывая, что потенциальная энергия У(х) рис.34.4 описывается формулой О при х < О, Ио при 0 < х < а, О при х>а, И(х) = найдем, что уравнение (34.22), вытекающее из уравнения Шредингера для разных х, имеет различный вид, так что h2 г- --—= прих<0, 2т ох --—-^- = (E-VQ)y7 при 0<х<д, (34.44) 2т ох А2 д2у/ ------^ = £1// прих><7. 2т дх
290 34. Микрочастица Решение у/ этих уравнений должно быть ограничено и непрерывке вместе с первой производной. Вводя для краткости обозначения 2тЕ _ . 2т(Е-У0) h2 ’ h2 1 ’ из уравнений (34.44) непосредственно находим, что у/ равно Aelkx + Be~,kx при х < 0, Сеk'x + De lk'x при 0 < х < а, (34 45 Ee,kx + Fe,kx при х > а . Условия гладкости функции у/ (х) при х = 0 и х = а приводят к четы- рем условиям: Я + £ = С + £>, ikA - ikB = ik.C — ik.D, 1 1 (34.46) Ce,k'a + De~k'a = Eeika + Fe~ika, ikxCeik'a — ik{De~ik'a = ikEe,ka -ikFe~ika для шести неизвестных комплексных постоянных А, В, С, D, Е и F. Так как уравнений только четыре, то их решение неоднозначно. Это и понят- но, так как функция у/ может быть определена с точностью до постоян- ного множителя и, кроме того, по физическому смыслу задачи из беско- нечности справа налево не могут двигаться микрочастицы, что еще не было учтено. В силу этого можно принять, что А = 1 и F = 0, после чего уравнения (34.46) решаются однозначно и [k -к}2 )[exp(ikia)-exp(-ikia)] (к-к' )2 exp(jkia)-(k + kl )2 ехр(-1к{а) -4кк} А —___________________!_______________ (&-&,) ехр^я)-(к + к})' ехр(-ik{a) ' г _к + к\ + (кх - к}В к} - к з-(к + к})в ~ 2кх ’ ~ 2к} ’ Из этих формул следует, что для отраженной и преломленной волн де Бройля |^|2 _ ______________________4^2 -^2)sin2 кр 4\к2 +к2) sin2 к}а+\6к2к2 cos2 кр 4(£2 + к2) sin kla + \6k2ki cos к{а и, следовательно, наряду с отраженными от барьера частицами сущест- вуют проходящие через барьер частицы, вне зависимости от того, больше или меньше энергия частицы энергетической высоты Vo барьера. Это совершенно новое явление «просачивания» или диффузии через энерге- тический барьер микрочастицы, не имеющее классического аналога и противоречащее классике.
34. Микрочастица 291 Атом водорода. Атом водорода - это электрон в центральном куло- новском поле электрически положительного заряда ядра. Классическим аналогом атома водорода является известная нам проблема двух тел, ре- шенная Ньютоном. В классическом случае движение тела характеризует- ся тремя законами Кеплера об эллиптичности орбиты, постоянстве сек- торной скорости и соотношении периодов обращения и больших полу- осей орбит. Для микрочастицы все не так: нет орбиты, энергия и импульс квантованы и одновременно заведомо не имеют определенных значений. Как оказывается, возможные значения энергии те? 1 (и = 1,2,3,...) (34.47) п 2h2 п2 V зависят от целого числа п. С математической точки зрения, отыскание квантовых значений энер- гии Еп - необычайно эффектное решение сложной и трудной задачи о собственных значениях и функциях линейного дифференциального опе- ратора. Столь же эффектно подтверждение получаемых результатов наблюде- ниями частот спектральных линий атома водорода. Напомним, что часто- та о испускаемого атомом фотона (волны де Бройля) при переходе элек- трона с энергетического уровня Еп на Ет определяется соотношением ha) = En-Em (п<т), что приводит к наблюдаемым сериям спектральных линий Лаймана (01т = Ei-Em/h (т = 2, 3, 4,...), Бальмера 0У2т = (Е 2-Е J / h (т = 3, 4, 5,...), Фитца - Пашена созт = (Ез-EnJ/h (т = 4,5,6,...) и другими. Целью дальнейшего является изложение постановки задачи и описа- ние результатов ее решения для атомов водорода или водородоподобного иона с зарядом ядра z и одним электроном. В рассматриваемом случае потенциальная энергия равна те4 1 qj2 2 1>2,3»...), 2п п а уравнение Шредингера целесообразно записать в сферических коорди- натах: О < г < оо, 0 < £ < л, 0 < (р< 2л:
292 34. Микрочастица .jdy/ h / =-----Лу/ + И(г dt 2m h2_ 2т d 1 dr r — I dr r2 sin& dS 1 d2 sin&— + _ sin2 «9 dtp d&) >i]/ +V(r)i//. 1 d 2 Поиск стационарных решений этого уравнения Шредингера приводит к задаче о собственных функциях и значениях Е. Отыскание непрерывных конечных при всех г, & и (р (включая г = со) решений этого уравнения довольно сложная, красиво решаемая задача. Ее решение - результат труда многих выдающихся ученых - и сейчас излагается в учебниках по квантовой механике и математической физике. Основные результаты этого исследования состоят в следующем. При Е> 0 спектр непрерывен и соответствующие собственные функции не обращаются в ноль на бесконечности. Это соответствует возможности неограниченного ухода микрочастицы от ядра атома. Напротив, при Е <0 спектр дискретен и соответствующие собственные функции в бес- конечности зануляются, что означает, что электрон остается на конечном расстоянии от ядра. Дискретные собственные значения равны z2me4 _2 , ч Еп =------х—п ( п = 1,2,3,...). " 2h2 Каждому из этих собственных значений отвечает конечное число соб- ственных функций вида (/ = 0,1,2....,я-1;/и = 0,±1,. Как уже отмечалось, это полностью соответствует наблюдаемым спек- трам атома водорода. Квантовый линейный осциллятор. В предыдущих лекциях мы уде- лили значительное внимание классическому линейному гармоническому осциллятору, описываемому уравнением тх + кх = О и функцией Гамильтона Н = 2 2 2 рх та х 2т 2 рх = тх,со2 к Л Соответствующий квантовый осциллятор описывается уравнением Шредингера: .. dy/ h d у/ mat2 2 z z xx ^-77 = -—+ (y/ = y/(x,tY), dt 2m dx 2 отыскание стационарных решений которого с энергией Е приводит к уравнению h d ш та2 2— ------т- + х и/ = Ем/. 2т dx1 2---* v
34. Микрочастица 293 Найти его собственные значения и функции не просто. Это непростое решение дает, что Е„ = hco п + — I 2J (п = 0,1,2,...) и соответствующие нормированные собственные функции равны Первые три функции у/0, и у/2 изображены на рис.34.5. Согласно сказанному, значения энергии эквидистантно квантованы, и минимально возможная энергия больше нуля и равна hco/2. Никак не похожи и графики | у/п | 2 (рис.34.5) на график вероятности обнаружения в случайный момент времени классического осциллятора вместе с коор- динатой х. Этот последний график изображен на рис.34.6. Рис.34.6. Для сравнения с рисунком 34.5 приведена плотность вероятности величины х классического линейного ос- циллятора Вертикальные асимптоты соответствуют экстремальным воз- можным значениям х (х = ± а, где а - амплитуда колебаний) Рис.34.5. Виды первых трех функции у/ для стационарных ре- шений уравнения Шредингера для квантового линейного осциллятора Квантовое уравнение Ньютона. Движение микрочастицы описыва- ется изменением ее функции состояния и ни в коей мере не напоминает движение по траектории. Ведь если известно место частицы, то неопре- деленна ее скорость, т.е. нет траектории. Но вместе с тем быстро летящая микрочастица оставляет в пузырьковой камере след от своего движения. Что же из себя представляет этот след? Дело в том, что в этом случае величины дисперсий координаты и ско- рости (импульса) настолько малы, что след «случайного блуждания» от образования одной капельки к другой все же представляется нам траек- торией, поскольку он достаточно тонок. Ширина этой «траектории» ги-
294 34. Микрочастица гантских размеров по сравнению с атомом, но в нашем масштабе макро- мира она тонкая. Согласимся с тем, что все время неопределенности положения и ско- рости очень малы, но почему же движение в целом соответствует нашим классическим представлениям? На этот вопрос в свое время ответил П.Эренфест, обнаружив, что для среднего значения < х > координаты х имеет место аналог уравнения Ньютона, который можно назвать кванто- вым уравнением Ньютона: t/2 /ак\ ак((х)) dx2 \дх / дх Вывод его не очень сложен, содержится в учебниках по квантовой ме- ханике и опирается только на ранее изложенные вам положения модели микрочастицы. Для макротел < х > неотличимо от х, поскольку диспер- сия х очень мала.
295 35 ПРОСТРАНСТВО И ВРЕМЯ В предыдущих лекциях рассматривалось много разных математиче- ских моделей. Почти во всех них фигурировали пространственные пере- менные и время. Что это такое, не объяснялось, их смысл казался само- очевидным. И.Кант считал представления о пространстве и времени врожденными. Но оказалось, что они все же требуют пояснений и заслу- живают особого внимания, и пришло время задуматься над тем, что за пространственные переменные и время стоят в великих математических моделях механики и физики, а, следовательно, и во всех математических моделях, которые на них основаны. Обратите внимание: вопрос не о том, что такое пространство и время вообще, вопрос конкретен: что за пере- менные стоят в математических моделях естествознания и техники? И будет поставлен еще конкретнее: как связаны между собой эти перемен- ные в разных инерциальных системах, движущихся относительно друг друга с постоянными скоростями? Ньютон считал, что существует выделенная абсолютная система от- счета. В ней координаты измеряются принятым масштабом, а время - абсолютными часами, что существует абсолютное пространство и абсо- лютное время. Окружающее нас пространство еще Евклид подверг математическому изучению, результатом которого была Евклидова геометрия и наше Евк- лидово пространство. Однако уже Гаусс усомнился, что наше простран- ство Евклидово и хотел измерить углы большого треугольника, образо- ванного вершинами гор. Если бы сумма углов этого треугольника отли- чалась от тт, то это свидетельствовало бы о неевклидовости нашего про- странства. Появившиеся затем геометрии Лобачевского и Римана подве- ли теоретическую базу под эти сомнения Гаусса, но измерения в масшта- бах Земли не дали достоверных уклонений от евклидовости. Сомнения о характере геометрии нашего пространства зародились сравнительно давно, но что казалось бесспорным, так это то, что про- странство - это пространство, а время - это время, они как бы существу- ют раздельно сами по себе и никак не связаны друг с другом. И вот именно это оказалось неверным. Выяснилось это в начале двадцатого ве- ка. Об этом и будет речь дальше. Выяснилось, что нужно говорить не о трехмерном пространстве и одномерном времени, а о едином четырех- мерном пространственно - временном мире. Координатные системы, в которых справедливы законы Ньютона, на- зывают инерциальными. Инерциальные системы - это системы, движу- щиеся относительно друг друга с постоянной скоростью. Если направить оси Ох и О'х' вдоль этой скорости относительного движения систем
296 35. Пространство и время Oxyz и O'x'y'z', то координаты и время одной и той же точки в этих раз- ных системах отсчета будут связаны соотношениями: x' = x-ut, у' = у, z'= z, t' = t, (35.1) получившими название преобразований Галилея. Факт справедливости уравнений Ньютона во всех инерциальных системах и, в частности, в системах Oxyz и Ox'y'z' означает, что уравнения Ньютона инвариантны (сохраняют свой вид) при переходе от переменных х, у, z, t к х\ у\ z\ согласно (35.1). Действительно, уравнения тх = Fx, ту = Fv, mz = F,, (35.2) после замены переменных, согласно (35.1), переходят в такие же уравне- ния для х', у', z' и Л Обоснованность одинаковости сил Fx, Fy и Fz в обеих координатных системах можно видеть в том, что это так для взаимодей- ствий, зависящих от расстояний или величин деформаций упругих тел. Итак, уравнения Ньютона и все вытекающее из них, т.е. все уравнения механических систем, инвариантны по отношению к преобразованиям Галилея. Эта инвариантность есть следствие справедливости законов Ньютона во всех инерциальных системах координат, связанных между собою преобразованиями Галилея. Теперь от механики перейдем к электродинамике. Весь наш опыт и специально поставленные эксперименты свидетельствуют, что уравнения Максвелла имеют место в инерциальных системах, т.е. они тоже должны быть инвариантны относительно преобразований Галилея. Не будем тро- гать всю систему уравнений Максвелла. Ограничимся одним из ее след- ствий - волновым уравнением для плоской электромагнитной волны, распространяющейся вдоль оси Ох и электрическим полем, направлен- ным по оси Оу. Такое уравнение, согласно (7.3), имеет вид: £Ч= 2 d'Ey dt2 дх2 Это волновое уравнение, записанное в системе Oxyz после преобра- зований Галилея (35.1) должно перейти опять-таки в волновое уравнение. Во что должно перейти Еу, мы не знаем и не будем задумываться. Ясно, (35.3) что оператор 2 д2 dt2 дх2 должен перейти в оператор д2 2 д2 dt'2 С дх'2 ’ (35.4) (35.5) Первый из них зануляется на функции Еу(х, t), второй - на неизвестной нам функции Е'у'(х', t). Непосредственно находим: д _ д дх' д dt' _ д д2 д2 дх дх' дх dt' дх дх ’ дх2 дх'2 ’
35. Пространство и время. 297 д д дх д dt' д д — =-----------1------— —и-----1----• dt дх' dt dt' dt dx' dt' &___ g2 d2 df & dS a2 df dt2 dx'2 dt dx'dt' dt dtdx' dt dt'1 dt г d2 д2 32 = u —^-2t>—-—- +—-, dx'2 dx'dt' dt'2 и поэтому оператор (35.4) переходит после замены переменных (35.1) - преобразования Галилея - в оператор д2 о d2 (2 2\д2 dt'2 dx'dt' V (35.6) отличный от волнового оператора (35.5). С одной стороны, это неожиданно и означает, что-либо неверны ут- верждения о справедливости уравнений Ньютона и Максвелла в инерци- альных системах, либо неверно преобразование Галилея, и тогда неверны уравнения Ньютона, либо, наконец, неверны уравнения Максвелла. Ка- кую из этих трех возможностей выбрать? С другой стороны, то, что оператор (35.4) не перешел при преобразо- вании Галилея в такой же оператор (35.5), довольно очевидно: ведь сис- тема O'x'y'z' движется со скоростью и относительно системы Oxyz, и поэтому при таком переходе скорость с распространения электромаг- нитных волн должна измениться, должна измениться и форма волны. Убедимся в этом, найдя гармонические волны е'(б) 1 ~ W, зануляющие оператор (35.6) ' д2 п д2 s—z--2l>------- dt'2 dx'dt1 +(и2-с2) d2 dx'2 J( wt'-kx ) = [-W2 - - (v2 - c2 )k2 = 0. Откуда (co + vk)2 = c2!^ или 0) / k = - L> ± c. Это означает, что в системе Ox'y'z' при и < с в одну сторону волна распространяется со скоростью с - и, а в другую - со скоростью - с - и. Для выяснения, разная ли скорость распространения света в разных инерциальных системах и зависит ли она от движения источника света, проводились специальные очень точные и основательные опыты. Это знаменитый опыт Майкельсона-Марли. И он дал, что скорость света во всех системах одинакова и равна с ~ 300000 км/р. Это говорит о том, что преобразования Галилея неверные и надлежит найти преобразование, ко- торое сохраняет вид волнового оператора. Такие преобразования впер- вые были написаны Лоренцом и названы его именем, но он не связывал их с общей проблемой пространства и времени. Преобразования Лоренца должны заменить преобразования Галилея и могут подсказать, как уточняются уравнения Ньютона. Эти уточнения
298 35. Пространство и время. очень маленькие - и в механических наблюдениях, и экспериментах с и «с себя не проявляли. Столь же незначительны отличия преобразований Лоренца от преоб- разований Галилея. Но при скоростях, близких к скорости света, дости- жимых в современных ускорителях и наблюдаемых у космических час- тиц, не учитывать их уже нельзя. Напишем знаменитые уравнения Лоренца: t U х у=у', z = z', /' = -7=^= (35.7) и 1 и V У С2 и перейдем к их выводу. Он не очень сложен. Сложнее понять и осмыс- лить, что из них следует. Некоторые простейшие следствия мы рассмот- рим, а сейчас только отметим, что одно и то же событие, происходящее в некоторой точке и какой-то момент времени, имеет в разных инерциаль- ных системах не только различные координаты, но и времена. Два собы- тия, одновременные в одной инерциальной системе, не одновременны в другой и различие в их временах зависит как от их относительной скоро- сти и, так и удаленности г мест, в которых они происходят. Действительно, пусть в одно и то же время t произошли события в точках х и х + г. Это в одной системе отсчета. Назовем ее К. Тогда в дру- гой К', движущейся относительно К со скоростью и, они произошли во времена различающиеся на величину Мы выведем уравнения Лоренца (35.7) из свойств однородности и изотропности пространства, однородности времени и инвариантности волнового оператора - постоянства скорости распространения электро- магнитных волн - во всех инерциальных системах. Как показал А.Пуанкаре, по отношению к преобразованиям Лоренца инвариантно не только следующее из уравнений Максвелла волновое уравнение, но и сами уравнения Максвелла. Будем исходить из общего вида связи координат и времени х, t и х\ t' одного и того же события в разных инерциальных системах координат К и К*, движущихся относительно друг друга с постоянной скоростью и: система К' относительно К (ее начало координат) со скоростью и, а сис- тема К относительно К' со скоростью — и. Движение их относительно
35. Пространство и время. 299 друг друга происходит вдоль совпадающих осей Ох и О'х' (рис.35.1). В момент времени t = t' = 0 начала координат О и О' обеих систем сов- падают. Будем исходить из общего вида связей координат и времени сис- тем К и К', удовлетворяющего условиям однородности и изотропности пространства и однородности времени: х' = ах + b t, у' = у, z' = z, t’=ax + pt, (35.8) точнее, попробуем удовлетворить всем выше сформулированным усло- виям, исходя из такого вида преобразований, подбирая параметры а, Ь, а и р. Преобразование Галилея соответствует а = 1, b = - и, а=0, Р=\. И как мы уже знаем, оно не подходит. Требованиям однородности и изо- тропности удовлетворяют, а волновой оператор не сохраняют. Итак, нам надлежит найти значения четырех параметров а, Ь, а и Д. Рис.35.1. Дее инерциальные системы К и К', движущиеся относительно друг друга с постоянной скоростью вдоль оси Ох, совпадающей с О’х’ Начнем с требования сохранения волнового оператора. Повторяя уже знакомые вам вычисления, получим: дх2 д2 h2 а2 п д2 ---------- + 2аа- дх---------------dxdt' -^-7 + 2bp-^r-i дх'2 дх dt dt'2 ’ dt'2 ’ и поэтому при замене переменных (35.8) волновой оператор (35.4) пере- ходит в оператор 2д^_ dt2 С dx2 d2_ dx'2 (2bp - 2аас2 д2 dx'dt' + (р2-с2а2^. + Преобразованное к новым переменным волновое уравнение, отве- чающее оператору (35.4), будет совпадать с волновым уравнением, соот- ветствующим оператору (35.5), если их операторы различаются множи- телем, т.е. при выполнении условий Ь2-с2а2 2(Ьр-аас2) р2-с2а2 которые влекут два условия: Ьр-аас2 = 0, с2а2-Ъ2 = с2(р2-с2с?). (35.9) Два условия на параметры а, Ь, а и Р следуют из того, что начало ко- ординат О' движется относительно О со скоростью и, а О относитель- но О' со скоростью - и. Точка О' имеет в системе К' координату х' = 0. Поэтому а х + b t = 0, где х - ее координата в системе К спустя время t, те. скорость движения точки О' в системе К равна и = - Ь/а Анало- гично, точка О в системе К' имеет координату х' = b t в момент времени
300 35. Пространство и время. t' = Pt. Поэтому ее скорость в системе К' равна b /р, что ведет к еще од- ному соотношению Ьр = - и. Таким образом к двум соотношениям (35.9) добавляются еще два -b/a = v, b/p = -v. (35.10) Как оказывается, эти четыре соотношения зависимые и не позволяют найти все четыре параметра. Но их все можно выразить через один, на- пример а, Ь = -аи, р= а, а = -^у-. (35.11) с В соответствии с этими соотношениями (35.11) искомое преобразова- ние (35.8) записывается в виде: x'=ax-avt, t' = -^- + at. (35.12) с Смотря на (35.12), есть соблазн положить и = О и найти, что а = 1. Это верно, но только в том смысле, что при и = 0 а = 1. А что будет при других и * 0? Используем изотропность пространства и используем то, что переход от системы К' к К должен иметь такой же вид (35.12), но с заменой и на - и. В соответствии с этим разрешим уравнения (35.12) относительно х, t и найдем (35.13) Преобразование (35.12) должно совпадать с (35.13), если в последнем v заменить на -l>, а х', t' заменить на х, t и обратно, х, t на х', t'. Оди- наковость влечет условия: которые сводятся к одному Отсюда vic1 Но мы уже знаем, что при v = О а = 1. Поэтому а = 1—- L С J преобразование (35.8) оказывается имеющим вид уже написанных ранее преобразований Лоренца (35.7). и
35 Пространство и время. 301 Перепишем его и обратное ему, используя сокращенное обозначение f(i?) = (1 - i?/ с2) ~1/2, в виде х' = y(i/)(x- vt), f=y(v2)(t--^x) (35.14) с и x = y(i/)(x'+ut'), t = y(v2)(t'+-^х'). (35.15) С Напомним, что и - скорость движения системы К' по отношению к К или, что то же, -и - скорость движения системы К по отношению к системе К'. Еще раз обратим внимание, что из преобразований Лоренца следует, что одно и то же событие - нечто происходящее в каком-то месте и в ка- кое-то время - имеет для места в разных инерциальных системах отсчета не только разные координаты, что нам привычно, но и разные времена. Действительно, пусть в системе отсчета К событие произошло в точке х в момент t. Тогда, согласно (35.7), в системе К' оно имело место в точке х' = y(i?)(x- vt) в момент f = y(i?)(t-vx) / с2). Это означает, что абсолютного времени, как и координат, нет. Каждая инерциальная система имеет свой отсчет места и свои часы. Теперь уже не столь неожиданно и понятно, что события, одновре- менные в одной системе, не одновременны в другой. Понятие одновре- менности не абсолютное, а относительное, так как в каждой системе от- счета свои часы. Как же эти часы соотносятся друг с другом, а очень странно: часы системы К' по отношению к часам системы К отстают, но и часы системы К, наблюдаемые в системе К*9 так же отстают. Этот вывод, естественный с точки зрения логики, учитывающей симметрию систем К и К', совершенно неприемлем с точки зрения нашей привыч- ной оценки хода разных часов. Будем наблюдать из системы К часы системы К\ находящиеся в точке х', в течение времени т по часам системы К, т.е. от момента tj до где - 0 = z Отвечающие этим временам tj и t2 показания часов системы К', которые находятся в точке х' пусть t) и Тогда, согласно второму из уравнений (35.15), и, следовательно, Т= 12 -11 = y(v2)(t'2 - t'l) = z(i?X, (35.16) т.е. часы системы К' в системе К идут медленнее в у '(</) раз. Анало- гично, часы в системе К по часам системы К' Также идут настолько же медленнее. Замедление хода движущихся часов по отношению к непод- вижным имеет прямые экспериментальные подтверждения. Такое под- тверждение дают измерения длительности жизни коротко живущих мик- рочастиц, летящих с большими скоростями. Быстро движущаяся частица в неподвижных часах живет дольше, и это удлинение времени жизни со-
302 35. Пространство и время. гласуется с тем, которое следует из преобразований Лоренца, т.е. больше в Х1^2) раза- Время жизни летящей частицы - это время в часах коорди- натной системы, движущейся вместе с частицей. Такое время называют собственным временем частицы. Из равноправия всех инерциальных систем собственное время жизни частицы не зависит от ее скорости дви- жения, оно во всех инерциальных системах одно и то же. Некоторое подтверждение имеется и для часов, путешествующих на искусственном спутнике, по отношению к земным часам, путешествую- щие часы отстают. Вместе с тем из этого подтвержденного экспериментом факта замед- ления движущихся часов вытекает широко обсуждаемый в свое время парадокс близнецов. Он состоит в том, что из двух родившихся близне- цов одного оставили на Земле, а другого отправили в путешествие туда и обратно со скоростью, близкой к скорости света. Тогда по возвращении на Землю, путешествующий близнец может быть юношей, а оставшийся на Земле - стариком. Физики считают, что так и будет. Но парадокс в том, что можно то же самое рассуждение провести с точки зрения путе- шествующего близнеца, по отношению к которому путешествовал близ- нец, оставшийся на Земле и поэтому он должен быть стариком, а близнец на Земле - юношей. Этот парадокс разрешается тем, что полной симмет- рии между близнецами нет: путешествующий близнец тормозил и, по- вернув обратно, разгонялся и что происходит при этом с его собствен- ными часами, наша теория ответа не дает. Близнец же на Земле ничего такого не делал. Рассмотрим теперь другое явление сокращения размеров движущегося отрезка. Пусть в системе К' вдоль оси О'х' расположен отрезок [x'i, x'i] длины /' = Х2-х'/. Длину Г он имеет в масштабе системы Л?'. Этот от- резок, назовем его L', движется со скоростью и относительно системы К. Примем следующую естественную процедуру измерения его длины в системе К. Засечем в системе К координаты х/ и Х2 концов отрезка Z' в какой- нибудь один и тот же для обоих концов момент времени t в системе К. За его длину в системе К примем величину I = Х2-хр Найдем соотношение между I и Г. Согласно первому соотношению (35.15) и второму (35.14), имеем.’ Xt = y(l)2)(x'l + Ut'i), Х2 = y(t>2)(x'2+ Vt'?), t'i = r(v2)(t-r2 = y(v2)(t-~^x2). c~ c~ Откуда I = x2 -X/ = y(u2)[x'2 -x'i + l> (t'2 - t'l)] = и поэтому
35 Пространство и время. 303 или / = /~7и2)Л (35.17) Это последнее соотношение означает, что при измерении в системе К отрезка длины Г системы К* происходит ее уменьшение в у Y и 2) раз. Предыдущие следствия из преобразований Лоренца поясняли нам особенности физического пространства и времени. Конечно, это одно- временно и то пространство и время, в котором мы живем, но чтобы их обнаружить, мы должны иметь дело со скоростями порядка скорости света или обладать способностью регистрировать ничтожные по величи- не эффекты. Следующим неожиданным, но тоже для скоростей, много меньших скорости света, едва заметным эффектом является неверность правила сложения переносной и относительной скоростей. В свое время мы вы- вели формулу разгона ракеты и установили, что с неограниченным уменьшением ее массы она неограниченно увеличивает свою скорость. Этот вывод следовал из того, что с каждым выбросом массы dm со ско- ростью с относительно ракеты она получала приращение в скорости, равное cdm/m. Это было приращение скорости ракеты в системе отсче- та, связанной с ракетой. Из преобразований Лоренца следует, что в сис- теме отсчета, связанной с Землей, с которой она запущена, ракета такого приращения скорости не получит, оно будет меньше, и за счет этого уменьшения скорость ракеты не может превзойти скорость света, но мо- жет приблизиться к ней. Итак, пусть система К' движется, как и ранее, относительно системы К со скоростью и, и в системе К' относительно нее движется точка со скоростью м'. Тогда скорость и этой же точки относительно системы К будет и + и'. Это по классическим представлениям о пространстве и времени. В механике скорость и называется переносной, а и'- относи- тельной, движение точки в системе К - абсолютным, а движение этой же точки в системе К' - относительным. В этой терминологии абсолют- ная скорость равна сумме переносной и относительной. Посмотрим, что будет при наших новых воззрениях на пространство и время. Пусть дви- жущаяся точка М в системах К и К' находится в точках х и х' в мо- менты времени t и t'. Теперь t не обязано совпадать с t'. Значения х, t их' Z' связаны между собой преобразованиями Лоренца (35.14) и (35.15). Первое из них дает переход от системы К к К', а второе наоборот - от К' к К. Система К' движется относительно К со скоростью и, и точка М в системе К' движется со скоростью и' = dx* / dt'. Скорость этой же точ- ки М в системе К равна и = dx/dt Нам надлежит найти связь между этими скоростями мим' зная, что х, t и х', Г связаны соотношениями (35.14) и (35.15). Непосредственно имеем:
304 35 Пространство и время. _dx _ + _ dx' + vdt' _ w' 4- L> dt f ( ,\( u VI j, , u'v ’ d<v[v ) f + —x' > dt + —dx 7 + —j- I c2 J] c2 c2 Таким образом, действительно скорости и и и' не складываются. Имеет место более сложная зависимость ь> + и W = ---7— . и V 1+7^ (35.18) которая при и« с и и'« с близка к простому сложению, но при и = с и и' = с и = с, а не 2с, и отличие весьма велико. Можно заметить, что при и < с и и' < с и поэтому любое число при- бавок к скорости ракеты скоростей, меньших скорости света, никогда не позволяет ей превзойти скорость света. Естественным следствием изменений представлений о пространстве и времени является их объединение, необходимость их совместного рас- смотрения. Ранее были отдельно трехмерное пространство и одномерное время, теперь четырехмерное пространство пространства и времени. Точками этого четырехмерного пространства являются события. В раз- ных системах отсчета одно и то же событие описывается по-разному. В системе К х, у, z, t, в системе К' х\ у', z\ V. Причем, могут отличаться друг от друга не только х их' у иуг, z и z\ но и t и г'. Преобразова- ния Лоренца представляют некоторый частный случай, когда оси систем К и К’ параллельны и движутся относительно друг друга вдоль оси Ох, совпадающей с О'х'. К этому частному случаю сводятся любые две сис- темы К и К', движущиеся друг относительно друга с постоянной ско- ростью, так как переход от К к К, как и от К' к К' - это некоторые пе- реходы от одной пространственной системе к другой. И переход от К к К' можно мыслить как последовательность переходов от К к К от К к К' и от Л?' к К' (рис.35.2). Рис.35.2. Последовательные переходы от одной инерци- альной системы к другой: системы К, К и К' К’не- подвижны относительно друг друга; К и К' движут- ся относительно друг друга с постоянной скоростью При преобразованиях координат, связанных с переходом от одной системы к другой, неподвижной относительно нее, сохраняются расстоя- ния dr2 = dx2 + dy2 + dz2 (35.19)
35. Пространство и время. 305 Оказывается, аналогично этому в четырехмерном пространстве- времени сохраняется величина ds2 = dx2 + dy2 + dz2-c2dt2. (35.20) Для того, чтобы в этом убедиться, достаточно показать, что это имеет место при преобразованиях Лоренца (35.15) от системы К к К', так как при преобразованиях от системы К к К и от К' к К' это очевидно име- ет место. Непосредственно, используя (35.15), находим dx2 + dy2 +dz2 -c2dt2 = = [j (/(и2)(/ + и f) 2 + dy'2 + dz'2 = y2(u)(dx'2 + Ivdx'dt' + u2dt'2)+ dy'2 + dz'2 - - c2y2 (l>) dt'2 + 2 dt'dx' + dx'2 \ c c = dx'2 + dy'2 + dz'2 — c2 dt'2. Итак, ds2 = ds'2, (35.21) Величину ds можно назвать расстоянием в четырехмерном простран- стве событий. Преобразования, связанные с переходом от одной системы К к другой К', его сохраняют и являются в этом смысле аналогами движений в трехмерном пространстве. Эту аналогию можно сделать яв- ной, если время t заменить на i т/с и, соответственно, она -/си При этом квадратичная форма d s2 примет вид: ds2 = dx2 + dy2 + dz2 + dr2, (35.22) а преобразование Лоренца окажется вида: , x + ur , г-их x =-==, Г = z . , Vl + L>2 Vl + P2 или, полагая (1 + t?) ~1/2 = cos0 и соответственно, и (1 + t?) “1/2 = sin0 в виде: x' = xcos0+ Tsin0, d =-x sin0+ tcos0, (35.23) представляющем собою переход от системы Охт к системе Ох'Г, повер- нутой относительно нее на угол 0 (рис.35.3). Рис.35.3. Геометрическая интерпретация преобразова- ния Лоренца Таким образом, переход от одной инерциальной системы к другой можно представить как обычное преобразование в Евклидовом про- странстве от одной ортогональной системы координат к другой.
306 35. Пространство и время. В связи с инвариантностью ds2, выражаемой (35.21), мне хотелось бы сказать несколько слов о причинности в новом пространственно- временном мире. Спросим себя, какие события Sifxp у/г zi, tj) и № z2, t2) в разных точках х/, ур zp t/ и xj, у2, z2, t2 и в разные времена 6 и 6 могут быть причинно связаны, и какие - нет? Согласно самому смыслу принципа причинности, событие S2 может быть следствием события 5/ только в случае t2> //. При обратном неравенстве это невозможно. При переходе от одной инерциальной системы к другой времена Zj и О мо- гут изменяться и может нарушаться неравенство ti > tj. Величина ds2 = (х2-Х1)2 + (У2-У/)2 + (z2-zi )2 -с2( ti-ti)2 при переходе от одной инерциальной системы к другой не меняется, по- этому, если ds2 < 0, то ti - ti не может обратиться в нуль, и первона- чальное неравенство t2> ti сохраняется. Поэтому наличие причиннои связи между такими событиями может иметь место во всех системах от- счета. Этот случай характеризуется тем, что время прохождения светом расстояния Г = [ (х2-X,)2 + (у2-у,)2 + (z2-Z,)2]122 меньше г2 — t/. Напротив, при ds2 > 0 это время больше, чем - I/ При этом с переходом к другой системе отсчета t2 -1/ может и сменить знак. Т.е. такие события не могут быть причинно связанными. Невоз- можность причинной связи между событиями, для которых ds2 > 0, сле- дует еще и из того, что действие, устанавливающее эту причинную связь, должно было бы распространяться быстрее скорости света. Тем самым мы приходим к выводу, что дальнодействие противоречит соблюдению принципа причинности во всех инерциальных системах. Уравнения Мак- свелла устранили мгновенность кулоновского взаимодействия электри- ческих зарядов, то же сделала современная теория гравитации и гравита- ционных волн с Ньютоновским взаимодействием масс. Ни то, ни другое не могут осуществлять себя быстрее скорости света. Таким образом, принцип причинности сохраняется и в отсутствии аб- солютного времени. Уравнения Максвелла инвариантны по отношению к преобразованиям Лоренца и не инвариантны по отношению к преобразованиям Галилея. Уравнения Ньютона, наоборот, инвариантны по отношению к преобразо- ваниям Галилея и не инвариантны по отношению к преобразованиям Ло- ренца. Различия преобразований Галилея и Лоренца порядка v2/с2 и очень малы для скоростей, наблюдаемых во времена Ньютона механиче- ских систем. Сегодня это уже не так. Наблюдаемые космические частицы имеют скорости, близкие к скорости света с, так же уже сравнимы со скоростью света скорости частиц современных мощных ускорителей. Наблюдения за их движением обнаруживают расхождения с уравнения- ми Ньютона. Уравнения Ньютона нужно подправить так, чтобы они ос- тавались справедливыми и при больших скоростях и. Выяснить, каковы эти поправки, можно, исходя из требования их инвариантности по отно-
35. Пространство и время. 307 шению к преобразованию Лоренца. Опуская все рассуждения, приведем окончательный итог. Он состоит в следующем. Уравнение = (35.24) dt где р - количество движения или импульс, сохраняется, но сам импульс, ранее равный т и , теперь равен Р = тп()п> (35.25) где то - т.н. масса покоя. Полная энергия Е частицы равна г т*с (35.26) а энергия покоя Ед и кинетическая энергия Т, соответственно, равны £0 = т(,с2, Т = Е-Е„, (35.27) причем, кинетическая энергия Т г г то°2 3 . Т = Е - Е. = —— + -ти0 — +..., 2 8 ° с2 и при v« с близка к ее классическому значению mv/2. Таким образом, изменения, произошедшие с уравнением Ньютона, сводятся к тому, что масса тп заменяется на массу m = -r2g=r = Wo(l + |4+-.-), (35.28) if 2 с V с2 зависящую от скорости и отличающуюся от прежней массы на величину порядка и/с2. Механика Ньютона, уточненная применительно к большим скоростям движущихся тел, получила наименование релятивистской ме- ханики. Быстро движущаяся частица со скоростью порядка скорости све- та названа релятивистской частицей.
308 36 РАЗГОН РЕЛЯТИВИСТСКИХ ЧАСТИЦ В ЦИКЛОТРОНЕ Циклотрон - устройство для получения пучков заряженных частиц с очень большими скоростями, приближающимися к предельной скорости света. Идея циклотрона очень проста. Заряженная частица в однородном постоянном магнитном поле, имеющая начальную скорость, перпенди- кулярную к нему, движется по окружности с частотой 6? в классическом приближении, не зависящей от ее скорости. Независимость ее частоты вращения от скорости позволяет осуществить ее резонансный разгон пе- ременным электрическим полем постоянной частоты со. Реально разгон заряженной частицы производится не на всем ее пути, а только при про- хождении ею узкой щели с разностью напряжений V sin о t (рис.36 1). Пересекая в момент t щель, частица заряда е получает дополнительную энергию eV sin о t. Совершив пол-оборота за время п/со, она снова пе- ресекает щель и снова получает добавок энергии, равный - eV sin (ft> t+л) = eV sin t. Этот разгон при eV sin cd t>0 мог бы про- должаться до тех пор, пока излучение частицы и потери энергии при ее движении не сравняются с величиной подкачиваемой энергии и не воз- никнет вращение с постоянной скоростью. Но этому мешает релятивист- ский эффект увеличения массы частицы с ростом скорости и следующее из него замедление угловой скорости. При этом условия резонанса нару- шаются, резко падает подкачка энергии и прекращается дальнейший раз- гон частицы. Рис.36.1. Принципиальная схема циклотрона Такова вкратце идея разгона частицы в циклотроне и проблема, воз- никающая при ее реализации, если мы хотим достичь скоростей, при- ближающихся к скорости света. Поиск пути преодоления этой трудности естественно сопроводить по- строением и исследованием математической модели циклотрона, сосре- доточив свое внимание только на механизме резонансного разгона заря- женной частицы с учетом релятивистских эффектов. Начнем с выяснения зависимости частоты вращения частицы от ее за- ряда е, массы т и величины магнитного поля Н. На движущуюся со
36 Разгон релятивистских частиц в циклотроне 309 скоростью v перпендикулярно магнитному полю заряженную частицу действует сила Лоренца, равная по величине evH / с. Эта сила, перпен- дикулярная магнитному полю и скорости движения частицы, не меняя величины ее скорости, создает центростремительное ускорение, соответ- ствующее движению частицы по окружности некоторого радиуса R с частотой v, так что „ 2 еиН Rv = uv =--- тс или еН тс (36.1) Конечно, к такому же результату можно прийти непосредственно из уравнения Ньютона с учетом зависимости массы от скорости и j 2 4-(т<7) = -[и,Я], m = m0(l-— )->'2, (36.2) dt с с предполагая, что начальная скорость и ортогональна постоянному од- нородному магнитному полю Н. В формулах (36.1) и (36.2) масса т зависит от скорости. Учитывая, что энергия Е частицы равна тс2, со- отношение (36.1) можно записать в виде явно обнаруживающем зависимость частоты v от скорости движения и. В классическом приближении, когда т постоянно, этой зависимости нет. Таким образом, если мы хотим сохранить равенство со = v при из- менении скорости частицы v, необходимо соответствующим образом менять частоту со или величину магнитного поля Н. Искусственное осуществление этих связей затруднительно. Но, оказывается, нелиней- ные эффекты резонансного разгона позволяют реализовать необходимую связь между со и Н автоматически. Эта возможность следует из мате- матической модели, построение которой мы продолжим. Пусть Е и Е - значения энергии одной и той же частицы после сле- дующих друг за другом проходах ею через щель, тогда Ё = Е - /(Е) + eV sin at, (36.4) где t - момент времени прохода частицей через щель, после которого ее энергия равна Е , f (Е) - потери энергии частицы при движении между проходами через щели, а со, считаемая постоянной, - частота изменения напряжения в щели: пренебрежимо малой ширины. Далее напишем соот- ношение между временем t и временем i следующего прохода через щель р t=t + 7t—. (36.5) еНс
310 36. Разгон релятивистских частиц в циклотроне Если бы от момента t до t энергия частицы оставалась постоянной, то в формуле (36.5) Е совпадало бы с Е . Но при движении от щели к щели она несколько уменьшает свою энергию, как уже было принято в формуле (36.4), на величину /(Е). Поэтому естественно приближенно принять, что Е=Ё-1/2/(Ё). Величины подкачки энергии при проходах щели в моменты времени t и t соответственно будут е Vsin cot и -е Vsin со t = е Vsin (со i + я). Для осуществления резонансного разгона надо, чтобы для некоторого целого п > 0 имело место cot = йМ+(2п-\)я. (36.6) В простейшем случае п = 1, мы им ограничимся. Соотношение (36.6) означает, что фазы гармонически колеблющегося напряжения <р= со t п ср = со t + я в щелях в моменты прохода через них частицы совпадают - различаются на целое число 2 я. Из этого требования (36.6) при п = J, согласно (36.5) и принятой вели- чине Е, следует, что E-^-f(E) = -eHc. (36.7) 2 со Условие (36.7) определяет энергию частицы Е , как корень уравнения (36.7). Далее из (36.4) при Е = Е приходим к соотношению f(E*) = eV sin cot, (36.8) выполнение которого возможно только при f(E*)<eV. (36.9) При выполнении условия (36.9) уравнение (36.8) имеет два решения: 0 < t j < я /2 и я 12 <t 2 = я-11 < я. Найденным значениям Е ,ti и Е , t2 отвечают стационарные движения заряженной частицы, при ко- торых последовательные значения энергии частицы Е и Е и, соответ- ственно, фаз ср и совпадают и равны Е* и epi или ср2 (фазысов- падают, если различаются на целое число 2я). В этих стационарных со- стояниях заряженная частица движется периодически с частотой v = со, т.е. имеет место резонанс. Согласно уравнению (36.7), определяющему энергию Е * частицы в стационарном движении, она растет с увеличением магнитного поля Д но только до тех пор, пока выполняется условие существования стацио- нарного режима (36.9), поскольку потери на движение частицы не могут в стационарном режиме превосходить максимально возможную ее под- качку со стороны электрического поля в щели. Для того, чтобы стационарный режим и эта зависимость Е* от Нмог- ли реализоваться, стационарный режим должен быть устойчивым. Это условие не только необходимое, но и достаточное при достаточно мед- ленном квазистационарном изменении Н. Итак, мы пришли к необходи- мости исследовать устойчивость найденных стационарных движений.
36. Разгон релятивистских частиц в циклотроне 311 Пусть dE и dt-малые возмущения стационарных значений Е* и ср\ а dE и dt —отвечающие им изменения значений Ent при следующем проходе частицей щели. Согласно (36.4) и (36.5), находим, что dE =dE- f'(E*)dE + eVco coscot*dt, (36.10) di = dt + —— \dE--f'(E*)dE . eHc V 2 J Полагая dE =zdE и dt=zdt, приходим к характеристическому уравнению l-/YE*)-z eVco coscot* ----z eHc или 2 + f'-(l-^f) nVco He coscot* (36.11) определяющему возможные значения z. Условия устойчивости состоят в том, чтобы оба корня уравнения (36.11) были по модулю меньше единицы. Для этого коэффициенты ха- рактеристического уравнения (36.11) т и v при первой и нулевой сте- пенях z должны удовлетворять неравенствам v < 1, l-r+v>0, 1 + t+v>0. Соответствующая подстановка приводит к неравенствам: 1-/'<Е*)<1, 1 + 2 - /' + (1 - cos<y/*+1 - f > 0, (36.12) 2 Нс 1-2 + /'-(!- — f')^^coscot* +1- > 0. 2 Нс Первое и второе неравенства выполняются в силу положительности /' и малости /'и лсоУ / Нс , последнее неравенство приводит к условию coscot*<0, (36.13) которое определяет, какой их двух возможных стационарных режимов устойчив. Этот устойчивый стационарный режим группирует частицы и позволяет, медленно увеличивая Н, наращивать их энергию. При при- ближении Екр к критическому предельному значению, определяемому уравнением /(Екр) = е Г, происходит нарушение устойчивости и срыв квазистационарного разгона. Идея изложенного выше способа разгона релятивистских заряженных частиц впервые была выдвинута В.И.Векслером в 1944г., а изложенное теоретическое исследование принадлежит А.А.Андронову и Г.С.Горе- лику (1945г.). Основной результат исследования они представили в виде резонансной кривой со скосом и явлением гистерезиса, характерными для нелинейного резонанса.
312 37 МАТЕМАТИКА КАК ЯЗЫК, КАК ОПЕРАЦИОННАЯ СИСТЕМА И МОДЕЛИ Ниже развивается тема, затронутая во введении. Речь пойдёт о том, что такое математика, как она устроена, и почему так огромна и решаю- ща её роль в точном естествознании и точной науке. Но всё это уже по- сле того, как вы познакомились со многими математическими моделями и увидели, как с их помощью познаётся окружающий мир, подчас на ос- нове очень простых моделей и простых методов их исследования. Так что такое математика, точнее, что такое математика функцио- нально, в чём её роль и значение? Ответ на этот вопрос уже был дан во введении: математика - это язык, по своему назначению и роли, т.е. функционально, во многом такой же, как обычные языки: русский, анг- лийский, немецкий, французский и другие. Ещё Галилей сказал: «Вели- кая книга природы написана математическими символами». Из этого следует, что только тот, кто знает и владеет этим символическим языком, может надеяться читать книгу природы и понимать окружающий его мир: природу, технику и общество. Позднее эта же мысль весьма лако- нично была выражена великим физиком В.Гиббсом в его реплике: «Ма- тематика тоже язык», и поэтому её роль столь же велика в изучении ок- ружающего мира, как и обычных языков, в обыденной жизни. С этим нельзя не согласиться, в общем это так, но всё же язык математики чем- то особенный, и вот об этой его особенности и пойдёт речь ниже. Обычный язык - это словарь и звуковые и графические способы коди- рования слов, грамматика, всевозможные фразы и их наборы в виде опи- саний, сообщений, приказаний, рассказов, инструкций, повестей, рома- нов, ... . Нечто похожее есть и в математическом языке. Аналоги слов и грамматики, определяющей правила их сочетания, можно видеть в чис- лах, векторах, матрицах, функциях и действиях с ними: сложении, вычи- тании, умножении, делении, дифференцировании, интегрировании, ..., а аналог словесных описаний - в математических моделях. Аналогия сло- весных описаний с математическими моделями достаточно прямая и очевидная, а вот действий и правил и сочетания слов - не столь ясная. Здесь проявляется специфика математического языка, поскольку его «грамматика» - это не только правила сочетания элементов - слов, но и правила преобразования одних слов в другие. Первую часть математики - элементы и действия с ними - естествен- но назвать операционной системой, вторую часть - математическими моделями.
3 7. Математика как язык, как операционная система и модели 313 Понять назначение и общие принципы построения операционной сис- темы можно, проследив историю её становления и развития. Подчерк- нём, итоговую логику этого становления, а не фактическую конкретную историю, которая подчас весьма путана и непоследовательна. Началась операционная система с целых положительных чисел. Как они возникли, теряется в далёком прошлом. Но римские и арабские це- лые числа уже хорошо известны. Практические потребности уже тех давних времён привели к изобретению действий с целыми числами: сло- жению, вычитанию, умножению и делению. Они возникли как замена длительных и трудно выполнимых пересчётов количеств материалов, то- варов, денег, поступающих из разных мест в разное время и в разные места. Эти операции с числами были не всегда выполнимы, и, чтобы это устранить, придумали отрицательные и дробные числа, которым при- своили определённый смысл. Так, если положительное число - это на- личность, то отрицательное - это долг. С иррациональными числами произошла длительная заминка: греки не присваивали числа длине гипо- тенузы равнобедренного прямоугольного треугольника с единичными катетами, она не измерялась числом, что своеобразно греками обосновы- валось отсутствием у катета и гипотенузы общей меры, т.е. отрезка, ко- торый бы укладывался в каждом из них целое число раз. Это, непреодо- лимое для греческой мысли препятствие, в дальнейшем длительно игно- рировалось, и лишь в прошлом веке было преодолено Г.Кантором, К.Вейерштассом и Р.Дедекиндом. По существу, это было пополнение ра- циональных чисел действительными в результате операции предельного перехода, как требование её замкнутости. Возникновение комплексных чисел имело ту же причину: устранение неразрешимости квадратных уравнений, в связи с необходимостью из- влекать квадратный корень из отрицательного числа. Гамильтон нашёл обобщение комплексных чисел и изобрёл кватер- нионы. Для кватернионов сохранялись все правила действия с действи- тельными и комплексными числами, кроме свойства коммутативности. Затем было доказано, что это единственное обобщение такого рода, хотя подобных кватернионам гиперкомлексных чисел в дальнейшем было придумано много. Кватернион - это гиперкомплексное число вида a + ai + Pj + yk, (37.1) где а, а, Р,у - обычные действительные числа, а /, j, к - единичные числа новой природы, некие символы или единичные элементы, для ко- торых имеет место следующая таблица умножения: 1 i j k 1 1 i j k i i -1 k -j i j -k -1 i k k j —i -1 (37.2)
314 37. Математика как язык, как операционная система и модели Операции сложения, вычитания и умножения на действительное чис- ло для кватернионов такие же, как для комплексных чисел, а умножение кватернионов определяется приведённой таблицей. Из неё видно, что кватернионы, для которых р = у = 0, или а = р = 0 или а = у = 0 - это обычные комплексные числа. Умножение кватернионов не коммутатив- но. Деление кватернионов возможно в силу того, что произведение ква- терниона (37.1) и кватерниона a-a-i-р j-у -к, - действительное число, так что операция деления числа (37.1) на число aI + ati + Pjj + yjk после умножения числителя и знаменателя на сопря- жённый кватернион a, -at - i- pt • j -у, - к сводится к делению его на действительное число, что сводится к делению на него чисел а,а,р и у. Кватернионы были использованы Дж.К.Максвеллом для записи при- думанных им уравнений электромагнитного поля. Привычную нам век- торную форму написания уравнений Максвелла получили лишь после того, как кватернионное исчисление породило понятие вектора и вектор- ного исчисления. Произошло это примерно так. Подобно тому, как ком- плексное число состоит из действительной и мнимой частей, у кватер- ниона a + a-i + р-j + у - к выделили действительную часть а и вектор- ную часть ai + P' j + у -к, и далее, у произведения двух векторов z j к (ai + Pj+ук) (ai i + Pij + yik) =-a ai-рPi-yyi + а р у действительную часть со знаком минус, назвали их скалярным произве- дением, а векторную - векторным произведением. Это и привело к воз- никновению векторного исчисления с действиями сложения, вычитания, скалярного и векторного произведений и, конечно, ещё умножения и де- ления на действительное число. Далее, понятие вектора породило линей- ную алгебру, линейные преобразования векторов, матрицы и матричное исчисление. Напомним, что кватернионы - не единственные придуманные гипер- комплексные числа, но они единственные в своём роде, т.е. такие, где по сравнению с действительными и комплексными числами нарушена толь- ко коммутативность произведения, ассоциативность и дистрибутивность сохранены. Потребность описания процессов изменения привела к изобретению функций и действий с ними, включая дифференцирование, интегрирова- ние и операторные преобразования, т.е. к возникновению математиче- ского и функционального анализов. Сначала функций только действи- тельного переменного, затем многих переменных и комплексного пере- менного. Операторы и преобразования стали восприниматься, в свою очередь, как элементы, с которыми также возможны разные действия.
37. Математика как язык, как операционная система и модели 315 На этом процесс расширения математической операционной системы не остановился, он продолжался и продолжается, но сказанного доста- точно, чтобы сформулировать основной стимул её развития и предъяв- ляемые к ней требования. Стимул развития - это стремление описать всё, что требуется и удаётся, а требования - это замкнутость действий и опе- раций, их принципиальная выполнимость. Замкнутость - это существен- ная особенность именно математического языка. Эти принципы построения операционной системы — возможно более широкое описание на основе натуральных чисел и действий с ними, и требование замкнутости вновь изобретённых операций - в некоторой ме- ре дают ответ на недоумённый вопрос А. Эйнштейна: «Как это может быть, что математика, являясь после всего продуктом мышления людей, не зависимым от опыта, так замечательно приспособлена к объектам дей- ствительности?» Сказанным содержание математической операционной системы не ог- раничивается: ещё есть множества, действия и соотношения между ними. Действия - это объединение, пересечение и дополнение. Соотношения - это принадлежность и непринадлежность, включение и невключение. Отношения больше и меньше имеются для действительных чисел и мо- дулей чисел, функций и операторов. Конечно, для всех них имеются от- ношения равенства и тождественности. Множества и действия с ними можно присоединить к описанной ранее операционной системе, а можно считать ещё одной математической опе- рационной системой. Некоторое разделение всё же желательно, так как позволяет обнаружить особенности каждой из них. А эти особенности и существенные различия есть даже среди изоморфных операционных сис- тем, не различимых с точки зрения предшествующего их описания. Две операционные системы АнВ изоморфны, если между их элемен- тами и действиями возможно установление взаимно однозначных соот- ветствий Т и соответственно D таких, что для любого элемента (элемен- тов) хеА и допустимого действия feA имеет место диаграмма коммута- тивности, где у = fa, = g£, Тх-%, Ту = ?], Df = g. ► У Т (37.3) ▼ ► *7 Изоморфные системы в силу этой диаграммы коммутативности как бы отличаются друг от друга только обозначениями. Но на самом деле это не так, не так потому, что в предыдущем изложении не учитывалось, как
316 37. Математика как язык, как операционная система и модели осуществляются действия. А это оказывается очень важно. Действия можно задать неким абстрактным соответствием в виде таблицы умно- жения, но это реально осуществимо только для конечных чисел элемен- тов, а их бесконечно много. Так что должна быть какая-то, желательно, возможно более простая, процедура реализации этого абстрактного соот- ветствия. Поясним сказанное на примере римской и арабской записях одних и тех же целых чисел. Так, числа 156 и 267 в римской записи - это CLVI и соответственно CCLXVII. Перемножить числа 156 и 267 может школь- ник младших классов, а перемножить числа в римской записи, CLVI и CCLXVII, очень трудно, и практически невозможно, заведомо, если чис- ла четырехзначные. Греки этому обучались в течении многих лет. Сказанное относится не только к операции умножения двух чисел, ещё более ярко это видно на операциях дифференцирования и интегри- рования. Даже для элементарных функций интегрирование не всегда вы- полнимо. Но эти операции можно сделать очень простыми и всегда легко выполнимыми в операционной системе, придуманной Хевисайдом. Про- дифференцировать или проинтегрировать функцию f (t) в ней очень про- сто, и результаты, соответственно, р F (p)-f (0) и F(p) /р, где F (р) - за- пись функции f (t) в системе Хевисайда, а р- комплексное число. Операционная система Хевисайда изоморфна нашей привычной, и этот изоморфизм устанавливается известным преобразованием Лапласа. Правда, в ней плохо с умножением: оно выполнимо очень сложно, а в нашей привычной системе - просто. Осталось ещё добавить, что операционных систем типа Хевисайда до- вольно много. Совсем другая изоморфная операционная система, в кото- рой почти все действия, правда приближённо, легко и быстро выполни- мы, - это операционная система современной ЭВМ с хорошим матема- тическим обеспечением, памятью и быстродействием. Зачем же нам нужны другие изоморфные операционные системы, от- личные от привычной общематематической? Ответ можно сформулиро- вать так. В ряде случаев решить некоторую задачу в обычной математи- ческой операционной системе не удаётся, но если перевести её в другую, ей изоморфную, то там решение найти можно. Решив её в изоморфной системе, можно вернуться в исходную систему и получить требуемое решение. Эта возможность - прямое следствие диаграммы коммутатив- ности. Действительно, допустим, действие f над элементом х не выпол- нимо в операционной системе А, но оно выполнимо в операционной сис- теме В. Согласно диаграмме коммутативности, действию f в изоморф- ной системе отвечает действие g, и, как непосредственно видно из этой диаграммы, y = fx^T-li1 = T-‘g^T-'gTx, (374) где все операции Т, g и F1 выполнимы, причём операция Т соответству- ет переходу от исходной системы А к используемой, В, а операция F1- возврату в исходную систему А.
37. Математика как язык, как операционная система и модели 317 На этом краткое описание математических операционных систем за- кончим и перейдём к аналогам в математическом языке фразам, описа- ниям, рассказам, .... Этот аналог уже был указан - это математические модели, т.е. изоморфные отображения описаний каких-то реальных или мыслимых объектов с помощью математической операционной системы. Чтобы прояснить сказанное, определим математическую модель абст- рактно и формально, как некоторое множество элементов и связей между ними. Имеется в виду элементов математической операционной системы и связей, устанавливаемых её действиями и отношениями. В соответст- вии с этим определением, уравнение х + px + q = Q - модель, соотно- шение у = а х + b — тоже модель, х — тоже модель. Модель и dx!dt = z + х, модель и х <у. Но понятие модели имеет и содержатель- ный смысл. Чтобы выяснить, в чём он состоит, заметим, что понятие изоморфизма имеет место и для моделей. Две модели изоморфны, если между их элементами, действиями и от- ношениями между ними можно установить взаимно-однозначное соот- ветствие, для которого справедлива диаграмма коммутативности. Речь может идти о моделях в одной и той же операционной системе или раз- ных. А теперь осталось сказать о математической модели и математическом моделировании самое главное, но, к сожалению, не формализуемое: при- рода, как окружающий нас мир, тоже операционная система, так как её удаётся с той или иной полнотой представить в виде разнообразных эле- ментов и связей между ними и текущим временем, называемых законами природы и принципами её устройства. С этой точки зрения объекты при- роды - это её природные модели, и они могут быть изоморфны матема- тическим моделям. Вернее, человечество создало математический язык так, чтобы это имело место. И как только удаётся построить изоморфную объекту природы математическую модель, изучая её, мы постигаем и природный объект. Неформальным в описанном является выделение в объектах природы элементов, подчас выдумываемых и изобретаемых, и установление связей между ними и текущим временем, т.е. неформально то, как мы постигаем устройство мира и операционную систему природы и как мы постигаем изоморфную ей математическую операционную сис- тему, модели которой могут быть изучены, исследованы и поняты. И по- этому наука в целом и математическое моделирование как часть её - это не только точная наука, но и неформализуемое искусство. В истории науки и отдельных исследованиях формализуемое и неформализуемое, точная наука и искусство тесно переплетаются между собой и трудно от- делимы друг от друга. Но это разделение, например, было очень явным и чётким, когда М.Фарадей постиг электромагнитные явления, выдумав магнитные и электрические поля, а Дж.К.Максвелл построил соответст- вующую математическую модель - знаменитые уравнения Максвелла. В механике были придуманы силы и материальные точки, обладающие массой и находящиеся в каких-то местах и имеющие скорость движения,
318 37. Математика как язык, как операционная система и модели а Ньютон построил математическую модель их движения - уравнения Ньютона, затем Лагранж - уравнения Лагранжа для систем материаль- ных точек с голономными идеальными связями между ними, но без не- обходимости знания вызываемых ими сил. По-видимому, в основе не только нашего осознанного мышления, но и неосознанного постижения мира нашими органами чувств и мозгом ле- жит построение изоморфных моделей. Как устроены эти модели, как они строятся и познаются - одна из важнейших и не раскрытых тайн приро- ды. С помощью этого интуитивного мышления человек уже осознанно придумывает ещё более мощные, сознательно обоснованные математи- ческие модели и необходимую для их построения и исследования опера- ционную систему.
319 38 ГЕОМЕТРИЧЕСКОЕ, ФИЗИЧЕСКОЕ, АНАЛОГОВОЕ, МАТЕМАТИЧЕСКОЕ И ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ Все перечисленные в заголовке виды моделирования основаны на изоморфизмах. Геометрическое и физическое моделирования — на гео- метрическом и, соответственно, физическом подобии, вызываемом изме- нением масштаба длины и, соответственно, масштабов базовых физиче- ских величин, например, длины, времени и массы. Аналоговое модели- рование возможно в силу одинаковости видов некоторых закономерно- стей для величин различной физической природы, например, механиче- ской и электрической, процессов теплопроводности, диффузии и образо- вания электрического поля. Об изоморфизме реальных объектов и мате- матических моделей уже говорилось. Имитационное моделирование проистекает оттого, что неизвестная, подлежащая отысканию величина оказывается совпадающей с математическим ожиданием специальным образом организованного случайного процесса. Геометрическое моделирование используется с глубокой древности: законы геометрического подобия были известны уже грекам. Физическое моделирование возникло более века тому назад из-за крупных катастроф с морскими судами и затем стимулировало его ещё и развитие авиации. Аналоговое моделирование, точнее, лежащая в его основе одинаковость законов природы для объектов разной физической природы, были ясны уже Рейли, в частности, в виде аналогии между томсоновским электри- ческим колебательным контуром и механическим гармоническим осцил- лятором. Именно эти аналогии и менее полные привели к возникновению теории колебаний как науки об общих закономерностях разнообразных эволюционных процессов в механике, физике, химии, биологии и науке об обществе. Математическое моделирование в наше время стало веду- щим и широко используемым в немалой степени не только благодаря теоретическим успехам, но и появлению универсальных быстродейст- вующих вычислительных машин. В некоторых типах задач успешно используется имитационное моде- лирование, называемое ещё методом Монте-Карло или статистическим моделированием. Всем этим видам моделирования посвящена значительная литература, Здесь о них идёт речь лишь для того, чтобы показать, что у них общая основа - изоморфизм. Изоморфизм разных реальных объектов и процес- сов между собой и воображаемыми мысленно или записями на бумаге или на том или ином носителе информации. После сказанных общих
38. Геометрическое, физическое, аналоговое, математическое и имитационное моделирование слов далее несколько подробнее о физическом и имитационном модели- рованиях, а затем, отдельно, о математическом моделировании как науке и искусстве. 1. Физическое моделирование. Физическое моделирование не пред- полагает фактическое наличие математической модели, достаточно опе- реться на более скромные сведения и понимания изучаемого объекта: на- до знать, какие физические величины полностью определяют поведение рассматриваемого объекта, все и ни одного лишнего. Однако основыва- ется оно на том, что имеется математическая модель и входящие в неё физические величины имеют размерность, а она (математическая мо- дель) такова, что изменения всех базовых масштабов физических вели- чин её не меняют - масштабы сокращаются. Это эквивалентно наблю- даемой нами естественной независимости законов природы от прини- маемых масштабов измерения физических величин, что в принципе мог- ло бы быть и не так: в неевклидовых геометриях не имеют места при- вычные законы геометрического подобия. Пусть определяющие физические величины - /j,...,fm, а физическая размерность величины f есть La‘ Sp‘ Mr', где L, S и M - масштабы дли- ны, времени и массы. Эти данные запишем в виде таблицы: L S M // at p. Ti fl «2 Pl Г2 • • • ... fm am —j & Изменения масштабов L, S и М соответственно в К.-К? и Ки раз L, 7 0 /ИГ преобразует каждую определяющую величину / в величину f,=K°L‘К? K*f, i = (38.1) Новые физические определяющие величины фактически от- вечают тому же самому объекту и определяются той же самой математи- ческой моделью. Отсюда следует, что объект, характеризуемый величи- нами fj, подобен объекту, характеризуемому величинами , тогда и только тогда, когда для некоторых Kl, Кs и Км выполняется соотношение (38.1). Эти же формулы (38.1) позволяют пересчитывать определяющие величины одного объекта в другой с такими же опреде- ляющими величинами и одинаковыми математическими моделями, кото- рые не обязательно знать. Кроме определяющих величин/), объект может описываться и другими величинами, но они должны определяться ими, и поэтому, опять-таки, пересчитываться в соответствии с (38.1).
38. Геометрическое, физическое, аналоговое, математическое и имитационное моделирование 321 Найдём теперь условия физического подобия, т.е. выясним, когда су- ществуют такие Kl, Кs и Км, при которых имеют место формулы (38.1). Эти формулы (38.1), логарифмируя, можно записать в виде: а{ lnKL + Д lnKs + yi 1пКм = In^r, i = \,т. J < Система линейных уравнений (38.2) относительно lnKL, 1пКм имеет решение, если ранг матрицы «1 А л (38.2) lnKs и (38-3) равен рангу расширенной матрицы «> А Л /"у ат Рт Ут J т Последнее будет иметь место, если из линейной зависимости строк матрицы (38.3) ха.+...+r, а„ =0, x,p,+ ...+xmpm=Q, (38.5) Vi+- + V«=0, где х2 + Х22 + ... + Хт *0, следует выполнение соотношений: (38.4) х In— + ... + х_ In— - 0 1 Z* Ш j* или f\ /'хя т (38.6) где величины этого равенства справа и слева в силу (38.5) имеют нуле- вую размерность. Выполнение этих соотношений для любого решения xi, хт системы (38.5) является, таким образом, необходимым и доста- точным критерием физического подобия. Ясно, что достаточно выполне- ния этих условий для независимых решений х/, ..., хт системы (38.5). Каждому независимому решению xj, хт отвечает своё условие подо- бия, и их столько, сколько независимых решений у системы (38.5). Тако- вы условия подобия. При их выполнении формулы пересчёта находятся как решения относительно Kl, Кs и Кмлинейных уравнений (38.2). Эти формулы пересчёта неоднозначны с точностью до условий подобия, оди- наковых у объекта и его модели.
322 $8- Геометрическое, физическое, аналоговое, математическое и имитационное моделирование Перейдём к примерам. Пример 1. Пусть предполагаемая к строительству стержневая стати- ческая определяемая конструкция сделана из стержней длин li, 1п, сочленённых в узловых точках, где она нагружена некоторыми силами, Fi, ..., Fm , п нас интересуют усилия Gj, Gn во всех стержнях с целью выяснения, достаточно ли они прочны. Решить задачу мы хотим с помо- щью построения уменьшенной модели и экспериментального определе- ния сил в стержнях. Прежде всего очевидно, что конструкция, предпола- гаемая к строительству, и модель должны быть геометрически подобны, так как в противном случае соотношение I i/lj, i =^j для них были бы различными. По той же причине должна соблюдаться пропорциональ- ность для прилагаемых к конструкции усилий. При выполнении этих ус- ловий достаточно обосновано, что определяющими являются характер- ный размер и приложенное усилие, например, Z/ и Fj. Для них таблица имеет вид: *1 Х2 L S М 11 1 0 0 Fi 1 -2 1 Для неё уравнения (38.5) имеют вид: X; + Х2 ~ 0, -2 Х2 = 0 , Х2 = О и не имеют ненулевого решения. Поэтому физическое подобие имеет ме- сто между любыми описанными конструкциями с пропорциональными внешними силами, а усилия Gj, .... Gn определяются через аналогичные Gx,...,Gn в модели по формуле Gs=4gs, S = i^. (38.7) Л Пример 2. Пусть теперь в такой же конструкции, не обязательно ста- тически определяемой, стержни упругие с коэффициентами упругости kj, ..., kn. Из таких же соображений следует необходимость геометриче- ского подобия с моделью и одинаковые соотношения между внешними усилиями и, соответственно, коэффициентами упругости. Определяю- щими теперь будут характерные размер Z, внешнее воздействие F и ко- эффициент упругой жёсткости к, например, Z/, Fp ki. Как и ранее, соста- вим таблицу L S М 1 1 0 0 F 1 -2 * 1 к 0 -2 1 и уравнения для отыскания критериев подобия:
38. Геометрическое, физическое, аналоговое. математическое и имитационное моделирование 323 х/+х2 = 0, -2х2-2хз=0, х2 + х3= 0. Теперь эти уравнения имеют ненулевое решение х/ = 7, х2 = -7, xj = 7, и ему соответствует критерий подобия IF 1 к. Для подобия эти величины у проектируемой конструкции и модели должны быть одинаковыми, а пересчёт усилий в стержнях по-прежнему определяется формулой (38.7). Пример 3. В качестве следующего примера возьмём маятник. Маят- ник как механическая система определяется длиной 7, массой т и уско- рением силы тяжести g. Этому соответствует таблица X/ Х2 Хз L S М L 1 0 0 m 0 0 1 S 1 -2 0 и уравнения: xi + хз = 0, —2 хз = О, х2 = О, не имеющие ненулевого решения, и поэтому все маятники между собой подобны. Этот вывод непосредственно следует и из его математической модели J(p + Img • sin (р = О, так как путём замены масштаба времени, t -> ^lmg/J т, это уравнение приводится к виду d2(p • л —- + sin (р = 0. dr2 Это означает, что все маятники между собой физически подобны. Далее, допустим, мы хотим, пользуясь этим физическим подобием, найти период колебаний Т. Непосредственно это сделать нельзя, так как период Т зависит не только от величин /, m и g, но ещё и от амплиту- ды а колебания маятника, и в приведённую выше таблицу её нужно вве- сти. После этого внесения появится ещё одна переменная, х^, и соответ- ствующие уравнения запишутся в виде: х/ + хз + х4 = 0, -2 хз = О, х2 = О, Теперь уже ненулевое решение есть: х/ = -7, х2 - 0, хз = О, Х4 = 1 и ему отвечает критерий физического подобия а / 7. При его выполнении соотношение между периодами колебаний Т и Т определяется отноше- нием одноразмерных с ними величин -Jlmg / J и Jimg/ J , т.е. Т = Т-(Img / J )х/2 (~lmg /J')~'/2 или T = (lmg/J)',2-f(a/l), так как Т-(lmg/ J)~'/2 не имеет размерности и зависит только от отно- шения а / 1-а / /. Как известно, при а/I « 7, f (а/1) = 2 л.
38. Геометрическое, физическое, аналоговое, математическое и имитационное моделирование Пример 4. В качестве последнего примера определим критерий подо- бия для стационарного течения вязкой жидкости в поле силы тяжести, когда её течение определяется характерным размером /, характерной скоростью и, плотностью р, вязкостью v и ускорением силы тяжести g. При этих предположениях соответствующие таблица и уравнения, опре- деляющие критерий физического подобия, имеют вид: L S М XI 1 1 0 0 Х2 V 1 -1 0 Хз р -3 0 1 Х4 V 2 -1 0 Хз Я - 1 -2 0 Xi + Х2-З Х3 +2 Х4 +Х5= О, -Х2~ Х4 —2 хз= 0, хз = 0, Уравнения для х/, .... х5 имеют два независимых решения: х/ = 1, Х2= 1, х4 = -1 и X/ = -1, Х2 = 2, Х5 = -1, которым отвечают знаменитые числа Рейнольдца и Фроуда Примером сравнительно недавнего сенсационного применения моде- лирования на основе размерностей физических величин и общих упро- щенных представлений о моделируемом явлении является определение засекреченной энергии первого ядерного взрыва на основе открытой де- монстрации его киносъемки. Взрыв принимался точечным, а возникающая ударная волна - сфери- ческой. В этих упрощенных представлениях радиус взрывной волны R является функцией времени, зависящей от энергии взрыва Е и началь- ной плотности окружающего воздуха р. Соответствующая таблица раз- мерностей энергии Е, плотности р, времени t и радиуса R взрывной вол- ны имеет вид: Е____о____t___R 2 -3 0 1 1 1 0 0 -2 . 0 1 0 Поиск безразмерной комбинации определяющих величин Е, р и Г приводит к системе уравнений 2 х- 3 у = 0, х + у = 0, -2 х + z = О, имеющей только нулевое решение х = у = z = 0, и поэтому все точечные взрывы со сферической ударной волной подобны между собой.
38. Геометрическое, физическое, аналоговое, математическое и имитационное моделирование 325 В соответствии с этим, согласно приведенной выше таблице, находим, что радиус R выражается через определяющие физические величины Е, р и t формулой вида R = CE,/3p-"3t2'3, где С - некоторая константа, которая может быть найдена по единично- му конкретному эксперименту или теоретическому расчету, обнаружив- ших, что С = 1. Теперь найденная формула позволяет найти энергию ядерного взрыва Е, если известен радиус ударной волны при каком- нибудь t. Но можно найти Е и более надежно, используя серию значе- ний времени t и соответствующих значений R. Логарифмируя найден- ную формулу зависимости R от Е, р и t, и учитывая, что С = 7, находим, что Согласно этому, график зависимости — InR от In t изображается пря- 1, Е __ мои, отсекающей на оси ординат отрезок длины — In—. На эту прямую 2 Р должны лечь данные кинофильма ядерного взрыва и, исходя из этого, она может быть найдена. 2. Имитационное моделирование. Краткий рассказ об имитацион- ном моделировании начнём с исторического примера отыскания числа я путем случайных бросаний иголки на разграфлённый на одинаковые по- лосы лист бумаги. Этой забавой в прошлом увлекались и известные учё- ные, кидая иголку тысячи раз: чем больше раз кинешь, тем точнее най- дешь ЧИСЛО 71. Под случайным бросанием понималось, что иголка, попадая на лист бумаги, после остановки располагается относительно параллельных ли- ний, нанесённых на бумагу так, что ближайшее расстояние х её центра и угол (р с ними - независимые случайные величины с постоянными плот- ностями вероятностей 7/а, где 2а - ширина полос, и, соответственно, 1/л. Иголка длины 2а будет пересекаться с одной из линий, если acos(p>x, (38.8) В соответствии с принятыми обозначениями, вероятность пересечения иголки с одной из линий равна IT— -dxdtp, (38.9) где D - область, определяемая неравенствами 0 <х <а, -—<Ф<— и 2 2 (38.8). Интеграл (38.9) легко находится и равен 2/п.
38. Геометрическое, физическое, аналоговое, математическое и имитационное моделирование Рис.38.1 Пересечение иглы с одной из линии Пусть теперь иголка случайно брошена N раз и пересеклась с одной из линий п раз. Согласно закону больших чисел, частота пересечения n/N стремится к найденной вероятности 2/тг, так что приближённо и тем точ- нее, чем больше число бросаний N, 2N 71 . П Известное неравенство Чебышева позволяет оценить вероятность то- го, что ошибка будет не больше некоторого малого е. Согласно этому не- равенству, Р --М — I N М D— N £2 где М n/N и D n/N соответственно математическое ожидание и диспер- сия частоты пересечений n/N. Частота п _ 1 ~N~ N (38 10) (3811) где //> j = 1, если в z-ом бросании иголка пересеклась с одной из линий, и £ i = 0 в противном случае. Случайные величины f, независимы, и для каждой из них вероятность быть единицей равна р = 2/л. Далее, согласно (38.10) и (38.11), непосредственно находим, что (38.12) ) Ns2 т.е. вероятность отклонения частоты п/ N от величины р больше, чем на _ р(1-р) .. не более, чем -------, и стремится к нулю при N оо. Ns Таким образом, л приближённо и со сколь угодно большой точностью можно найти путём случайных бросаний иголки. Но этих бросаний нуж- но довольно много. Так, чтобы найти три точных знака тг, т.е при s< 10~3, с вероятностью 0,99 нужно бросить иголку примерно 1СР раз. Конечно, сегодня таким способом вычислять число л по меньшей мере неразумно. Но есть примеры, где это не только возможно, но, пожалуй, и единственно приемлемо. Этот пример - вычисление многомерных опре- делённых интегралов от функций многих переменных, например, десяти, вида
38. Геометрическое, физическое, аналоговое, математическое и имитационное моделирование 327 (38.13) D по ограниченной области D, определяемой некоторыми неравенствами, позволяющими выяснить, лежит ли точка (xj, х^) в этой области или нет. Пусть ах <Xj <ЬХ9...,ап <хп <Ьп и А < /(х,,...,хл) < В. Первые п неравенств и неравенство А < z < В определяют (п\ /^-мерный паралле- лепипед П в (п+/J-мерном пространстве Rn+i переменныхX/, ...» х„ иг. Величина интеграла есть не что иное, как /J-мерный объём области О <z<f (xi, xj, (xi, xj е D (38.14) в пространстве Rn+i- Назовём её D. Область D лежит внутри паралле- лепипеда П. Обозначим объёмы областей D и П через V п V. V - это интересующее нас значение интеграла (38.13), а V равно (В-A) П(Ь—ад. Отношение V /V не что иное, как вероятность попадания случайной точки М (xi, ..., хп z) в область D, если она имеет постоянную плот- ность вероятности в параллелепипеде Д равную {(В-A) П(Ьг-а^)} 1. Это означает, что величину VIV можно найти путём независимых случайных «бросаний» точки М точно так же, как это имеет место с бросанием иголки для определения числа л. Конечно, «бросаний» нужно достаточно много. Но что замечательно, так это то, что необходимое число «броса- ний» не зависит от размерности п интеграла. Осуществить же случайное бросание можно с помощью датчиков случайных чисел, и при каждом «бросании» непосредственно определяется, в соответствии с заданием области D неравенствами (38.14), когда «брошенная» точка попала в об- ласть D.
328 ОБЩАЯ СХЕМА МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ Математическое моделирование включает решение двух задач: со- ставление математической модели и её исследование. Эти задачи очень разные, требующие различных знаний, навыков и интуиции, но, несмот- ря на это, они тесно взаимосвязаны, поскольку при составлении модели следует учитывать трудности и возможности её исследования, а при ис- следовании может обнаружиться необходимость корректировки постро- енной модели. Кроме того, при исследовании и делаемых из него выво- дов необходимо понимать, что учтено и что не учтено в модели, т.е. на какие вопросы она может дать ответы, а на какие фактически не может. Математические модели, которые ранее рассматривались в этой книге, можно назвать простыми. Простыми по написанию, простыми для иссле- дования, хотя и не всегда простыми с точки зрения получаемых резуль- татов. Результаты исследования моделируемого объекта могли быть не- ожиданными и требующими объяснения. Модели просты за счёт того, что они учитывают только некоторые стороны объекта, не стремясь к всесторонней и полной адекватности с реальным объектом, и поэтому, естественно, могут объяснить только то, что в ней учтено и заложено, и зачастую только качественно, а количественно подчас весьма прибли- жённо. Несмотря на это, а может быть, благодаря этому, роль простых моделей в науке очень велика, поскольку они просты и ведут к понима- нию существа происходящих процессов. Пониманию очень важному и для учёного, и инженера, и конструктора, и изобретателя. Но это необхо- димое понимание не всегда достаточно, и во многих случаях необходимы более точные количественные данные. Это требует дополнительного уточнения и усложнения модели, что влечёт значительно более трудные, как правило, численные исследования. Эта вычислительная сторона ма- тематического моделирования, несмотря на её важность, в этой книге фактически не затронута. Скорее, в ней идёт речь о том, как этих вычис- лений избежать, если это возможно и допустимо. Построенные модели и их исследование могут требовать не только достаточных знаний, но и определённого искусства. Это искусство в не- котором смысле лежит вне науки, поскольку является результатом инди- видуального опыта и обучения показами на примерах. Искусству тоже можно учиться. Ведь учат сочинять стихи, музыку, рисовать, играть на
39. Общая схема математического моделирования 329 скрипке, танцевать. Следует признать, что современное традиционное изложение математики, теоретической и отчасти прикладной, не способ- ствует выработке этого искусства, и в результате лишь отдельные, ода- рённые от природы люди, могут вовремя преодолеть барьер математиче- ского формализма. Более успешно он преодолевается в научных школах, благодаря примерам, общению, беседам, обсуждениям и показам. Как, возможно, вы уже догадались и вспомнили, что именно эту цель облег- чения взятия барьера, разделяющего теоретическую математику и при- кладное математическое моделирование, ставит перед собой эта книга. Итак, пусть перед вами стоит задача построения и исследования моде- ли, т.е. задача математического моделирования. С чего следует начать? Прежде всего не жалейте времени на то, чтобы осмыслить, уточнить и конкретизировать поставленную перед вами задачу, посмотреть на неё с разных точек зрения. Нужно возможно точнее и полнее ответить на во- прос, что вы хотите узнать, на какие вопросы ответить, и какой объект следует для этого рассматривать, что в нём обязательно надо учесть, а чем можно или, может быть, можно пренебречь? Этот важнейший этап математического моделирования можно назвать: исходная постановка задачи и определение объекта исследования. Не думайте, что в дальней- шем вам не придётся к нему вернуться. Очень может быть, что придётся, и чуть ли ни тогда, когда вы будете считать задачу решённой. После этого вы можете приступить ко второму этапу, состоящему в словесном или мыслимом описании объекта и повелевающих и управ- ляющих им законов природы. После этого снова подумайте, нельзя ли чем-то пренебречь или, наоборот, что-то ещё нужно всё-таки учесть. В итоге вы завершите мыслимое или словесное описание объекта исследо- вания и выяснение законов природы, которые определяют его поведение и свойства. Далее, мыслимо-словесное описание следует изоморфно отобразить в математическую модель, стараясь это сделать возможно проще и удобнее для последующего исследования. При этом не следует упускать возможностей упрощений или декомпозиций, ведущих к рас- членению задачи исследования на последовательные этапы. В результате вы приходите к первоначальной математической модели. Теперь следует подумать о том, как её изучить и исследовать. Воз- можно, что это обдумывание приведёт вас к некоторым изменениям мо- дели, способствующим простоте, удобству и экономичности её исследо- вания. Далее, нужно провести исследование и сделать выводы о свойст- вах объекта, его поведении и возможных в нём явлениях, и сопоставить с тем, что вы знаете об объекте. Если что-то не совпадает, вызывает со- мнение или не вполне устраивает, - вернитесь к одному из предшест- вующих этапов или, может быть, даже к исходной постановке задачи. Если вас всё устраивает, можно переходить к формулировке выводов и рекомендаций. Конечно, то, что было сказано, - это общая схема, и вовсе не обязательно буквально ей следовать. В заключение этого краткого и общего описания сложного и многооб- разного математического моделирования, который иллюстрировался
330 39. Общая схема математического моделирования много раз ранее и будет ещё иллюстрироваться ниже, перечислим основ- ные его этапы, а затем приведём некоторые, также общие, полезные при моделировании соображения: 1. Постановка задачи и определение объекта исследования. 2. Идеализация и упрощение объекта. 3. Мыслимо-словесное описание объекта и определяющих его поведение и свойства законов природы. 4. Дальнейшие упрощения и, наоборот, учёт чего-то нового. 5. Составление первоначальной математической модели. 6. Внесение корректив в математическую модель. 7. Выбор и реализация методов исследования математической модели. 8. Сопоставление результатов исследования модели с тем, что из- вестно об объекте. 9. Выводы и рекомендации. Отметим, что от каждого из этапов возможны возвраты к любому пре- дыдущему. А теперь некоторые полезные общие соображения: 1. Чем проще модель, тем меньше возможность ошибочных вы- водов. 2. Модель должна быть простой, но не проще, чем это возможно. 3. Пренебрегать можно чем угодно, нужно только знать, как это повлияет на решение. 4. Модель должна быть грубой, малые возможные и допустимые поправки не должны кардинально и существенно менять её поведение. 5. Модель и расчёт не следует делать точнее исходных данных. Выводы не должны существенно меняться в пределах ошибок исходных данных и ошибок счёта. Если этого не удаётся достичь за счёт модифи- каций модели, необходимы более точные исходные данные. 6. При анализе результатов исследования модели важны не толь- ко конкретные численные результаты, но и понимание, почему и как всё происходит и как всё это зависит от параметров. Во всяком случае, к это- му следует стремиться, хотя в некоторых случаях это удаётся далеко не сразу.
331 40 МОДЕЛИ ВИБРОПОГРУЖЕНИЯ Как происходит вибропогружение 18-метрового тонкого металличе- ского шпунта в мёрзлый грунт, я видел сам, а создатель этого чуда, ин- женер Д.Д.Баркан, чиркнув карандашом поперёк шпунта, показал мне, как это происходит: шпунт вибрировал и погружался (рис.40.1). Причину погружения шпунта Баркан видел в наблюдаемом им экспериментально явлении разжижения грунта под влиянием вибраций. Проблема, которая его «заела», состояла в том, что вибраторы очень быстро выходили из строя, и их, поломанных и негодных, лежала невдалеке громадная куча. Это было на строительстве плотины Горьковской ГЭС зимой 1961 года. Прислали меня от ГИФТИ, чтобы помочь в беде, что напрямую я сде- лать, естественно, не мог, но по возвращении домой вскоре сообразил, в чём причина чудесного погружения шпунта в мёрзлый грунт, как в воду. Она была в усреднении сил сопротивления погружению шпунта под влиянием высокочастотных - 50 герц - его вибраций. На этой основе бы- ли построены модели, о которых рассказывается ниже, и найдены зави- симости скорости погружения от её параметров Эти результаты были использованы в создании последующих, ещё более эффективных конст- рукциях систем вибропогружения, где, в частности, вибраторы уже так быстро не ломались Рис.40.1. Осциллограмма вибропогружения шпунта, полученная движением каран- даша слева направо поперек него Я позволю себе кратко воспроизвести, как осмысливалось это не- обычное явление и как сформировалась приемлемая математическая мо- дель, результаты исследования которой можно было положить в основу инженерного конструирования. Сначала я прочитал работы Д.Д.Баркана о разжижении грунта под влиянием вибраций и использовании этого явления для вибропогружения шпунта, свай и другого. Изложенное подкреплялось экспериментами по погружению тяжёлого шарика в вибрирующий грунт, но оно не очень согласовывалось с теоретическими соображениями и данными экспери- ментов по реальным вибропогружениям шпунтов и свай. Кроме того, мне
332 40. Модели вибропогружения казалось очевидным, что это разжижение не может происходить в про- мёрзшем грунте, а шпунт его преодолевал весьма успешно. Первая идея была в том, что шпунт погружается в грунт, как змея, в силу бегущих вдоль него продольных волн. Но эту идею пришлось от- вергнуть, так как в силу очень большой скорости распространения бегу- щих волн вдоль шпунта и небольшой его длины он практически двигал- ся, как целое. Тогда я принял самую естественную модель, что с боков шпунт испытывает сухое кулоновское трение, а своим торцом трамбует и раздвигает грунт. Эта модель представлена схематически на рис.40.2, а соответствующая математическая модель имеет вид: mx = P + Fcos(<ot)-F^-FlM, (40.1) где Fcos (cot) - гармоническая сила вибратора, действующая на шпунт, Р- вес шпунта вместе с вибратором, F6oK и FnO6- силы бокового и лобо- вого сопротивлений, х - перемещение шпунта, отсчитываемое вниз. Грунт с боков от шпунта принимался неподвижным, и тогда Fa* = Qsign(х). (40.2) Уровень грунта под торцом шпунта имеет координату у, и её увели- чение требует некоторого усилия R. Если х - координата нижнего торца шпунта, а у - уровень продавливаемого им грунта, то чоб о R при х = у и х > О, при х < у либо X = у И X < О, причём О X при X = у И X > 0, при х < у либо X = у И X < 0. (40.3) (40.4) Сегодня решение уравнений (40.1) - (40.4) на ЭВМ не представляло бы затруднений, но в то время это была сложная, трудоёмкая вычисли- тельная задача. Но оказалось возможным приближённо аналитически найти её решение, предполагая, согласно запомнившейся мне осцилло- грамме движения шпунта, показанной Барканом, что х = acos( cot) + vt, (40.5) где a - амплитуда его колебаний, со - частота, a v - скорость погруже- ния. Принимая это предположение и интегрируя уравнение (40.1) по пе- риоду, считая, что имеет место (40.5), непосредственно находим, что 2 я /со 2я / со 2я/со J mx-dt = P— - J FCx r dt - = ’ Ю '( / ° (40.6) 2тг ( 2л А _ ( 2л А -----<3 + С4-------/? = 0. со V со ) \ со ) Смысл моментов времени /0, tx и t3 указан на осциллограмме движе- ния шпунта (40.5), представленной на рис.40.3. Они находятся из очевидных уравнений, и при этом приближённо со- отношение (40.6) принимает вид:
40. Модели вибропогружения 333 — Р—*Lq—*Lr=o, со асо асо откуда v — я асо Q+R (40.7) P+F coscot Рис.40.2. Упрощенная модель шпунта с вибра- тором, погружаемого в грунт, с учетом лишь бокового и лобового сопротивлении, описанных формулами (40 2) и (40 3) h график колебаний сваи с указанием определенных моментов времени to, tj, (з и to+2n/co Этот «удивительный» результат можно трактовать как то, что под влиянием вибраций силы Рбок и Рлов усредняются и оказываются эквива- ,, Q + R ,, лентными силе вязкого трения с коэффициентом -. Этот коэффици- я асо ент вязкого трения убывает с ростом амплитуды колебаний а и частоты F со. Очень грубо, принимая, что F » Q + R, амплитуда а = , , и то- Мсо гда коэффициент вязкого трения h = Q±^=(Q + R)MGi (40.8) я асо я F Таким образом, действительно, при вибропогружении силы сопротив- ления грунта подобны вязкому трению, но это не от того, что грунт яко- бы разжижается. Разжижение не требуется. Рассматриваемая модель весьма проста, она хорошо объясняет суть явления вибропогружения, но она не даёт хороших совпадений с экспе- риментом. Дело в том, что грунт обладает ещё упругостью, как с боков
334 40. Модели вибропогружения от шпунта, так и в его торце. Эта упругость проявляется в виде некото- рых, ярко или неярко выраженных, резонансных явлениях: шпунт в грун- те обладает некоторой собственной частотой, он подобен осциллятору. Более полная модель, учитывающая упругость грунта, изображена на рис.40.4. P+F cosco t Рис.40.4. Улучшенная модель, описанная уравне- ниями (40.9), вибропогружаемого шпунта с упро- щенным учетом упругих свойств грунта под дей- ствием боковых и фронтальных воздействий; масса грунта не учитывается Теперь уже модель описывается тремя переменными, х, у и z: х - положение шпунта, у - смещение бокового грунта, z - смещение донышка ямки в грунте. Как и прежде, проскальзывание шпунта и про- давливание грунта происходит при силах Q и, соответственно R, но при этом боко- винка и донышко грунта имеют упругость к& и кл соответственно. Математическая модель теперь состоит, как и ранее, из уравнения (40.1) для х, уравнений для у и z и формул, опре- деляющих силы F6oK и Fno^ х *рЦ 0 -РЦ kxy < е, V =2; х при &7(x-z) = /? и х>0, 0 при kA(x-z)<R\ (40.9) Frm=k,y, F.,« = k.(x-z) при x>z, 0 при x<z. Едва ли и сегодня имеет смысл исследовать эту модель (40.9) прибли- жённо тем же, что и ранее, очень простым методом. Формулы получают-
40 Модели вибропогружения 335 ся громоздкие и не всегда приемлемые. Просчёт же на ЭВМ легко и бы- стро осуществим. Существенно новым является совсем другая зависимость амплитуды колебаний шпунта от частоты и возможность её существенного возрас- тания при приближении частоты к резонансной частоте колебаний шпун- та. В этой уточнённой модели эффект перехода при вибрациях сил со- противления погружению в вязкое трение остаётся тем же самым, а с ростом амплитуды «вязкое трение», как и ранее, уменьшается, так что выгодно работать в режиме резонанса. Вот, пожалуй, и всё. Может быть, следует отметить, что дальнейшее совершенствование этого метода виб- ропогружения привело к переходу от центробежных вибраторов - гене- раторов силы Fcos(cot) - к виброударным механизмам, которые в неко- тором отношении оказались предпочтительнее. Простейшая модель виб- роударника была рассмотрена методом точечных отображений [1, 2], а изложенное опубликовано в работах [3,4]. Более полное математическое исследование описанных моделей вибропогружения также методом то- чечных отображений содержится в работах [5,6]. Можно еще отметить, что рассматривались и более полные модели с учетом вязкости грунта и его массы. Но чего-то существенно нового, кроме очевидного, это для приложений и понимания не давало. ЛИТЕРАТУРА 1. Неймарк Ю.И. Метод точечных отображений в теории нелинейных колебаний. М.: Наука. 1972.471с. 2. Беспалова Л.В. К теории виброударного механизма. И Инж. жур- нал. ОТН. 1957. №5. 3. Неймарк Ю.И. Теория вибрационного погружения шпунта. // Гид- ротехническое строительство. 1952. №4. С.24-27. 4. Неймарк Ю.И. Теория вибрационного погружения и вибровыдер- гивания. И Инженерный сборник. 1953. Т.4. С.13-48. 5. Баталова З.С. Изучение вибропогружения шпунта при лобовом со- противлении грунта. И Инж. журнал. Механика твердого тела. 1966. №2. С. 165-173. 6. Баталова З.С., Канторович Е.Б., Трусенкова А.И. Изучение вибро- выдергивания шпунта. // Инж. журнал. Механика твердого тела. 1966. №5. С. 173-180.
336 41 ОСНОВНАЯ МАТЕМАТИЧЕСКАЯ МОДЕЛЬ СОВРЕМЕННОЙ НАУКИ И ТЕОРИЯ КОЛЕБАНИЙ Настоящая книга - это лекции автора, читаемые им студентам млад- ших (2-3) курсов, магистрам, аспирантам и по другим поводам, обрабо- танные, как единое целое о математических моделях и моделировании. Но по мере приближения к переднему краю науки, к тому, что сделано в 20 веке, последовательность и цельность изложения уступает место фрагментарности и, компенсируя ее, впервые делаются ссылки на лите- ратуру. Эта глава не лишена этого недостатка: она по существу перера- ботанное изложение докладов автора 1998 и 2001 годов на международ- ных конференциях, посвящённых памяти Я.З.Цыпкина и его и моего учителя А.А. Андронова, как учёных, имеющих мировую известность. Оба доклада тематически связаны между собой и настоящей книгой: в основе теории колебаний лежит математическая модель «динамическая система», которая и есть основная модель современной науки и основ- ная модель настоящей книги. Александр Александрович Андронов, уче- ник Л.И.Мандельштама, признанный в мире создатель новой науки - теории нелинейных колебании, и поэтому весьма естественно связать изложение содержания, роли и места теории колебаний в науке именно с ним. 1. Динамическая система как основная математическая модель современной науки. Научное понимание мира человечеству пришло с небес. Невозможно представить себе другой объект, нежели Солнце, Лу- на и планеты на фоне величественного звёздного ночного или дневного неба, одновременно столь привлекающие внимание, значительные, зага- дочные и, вместе с тем, обладающие яркими простыми закономерностя- ми. Не погода, приходящая тоже с небес, а именно Солнце, Луна, плане- ты и звёзды, потому что капризы погоды неуловимы, а то, что предска- зуемо, тесно связано с Солнцем и звёздами, т.к. обнаруживается неиз- менная причинная связь. Птолемей, Коперник, Галилей, Ньютон - вот привычные вехи в истории познания неба и, наконец, Лаплас, перенес- ший причинную обусловленность небесных явлений на явления земные, провозгласивший причинную обусловленность и предсказуемость всех явлений мира и его изменений, всего, что в нём происходит. И это сделал тот самый Лаплас, который разрабатывал теорию вероятностей и ввёл в эту науку самую известную случайную величину с распределением, но- сящим его имя. Детерминизм Лапласа основывался на потрясающих воображение ус- пехах астрономии и механистической трактовке мира, и повседневно на- блюдаемая случайность его не поколебала. Это потом все явления мира
4 J. Основная математическая модель современной науки и теория колебаний 337 разделили на предсказуемые и непредсказуемые, случайные, резко про- тивопоставив их друг другу. А сегодня принцип детерминизма имеет всеобщий смысл, и в расширенном понимании он справедлив и для мар- ковских случайных процессов, статистической физики и квантовой ме- ханики. Он лежит в основе нашего понимания мира и воплощён в модели динамической системы, включающей описание, называемое состоянием, и однозначный оператор его прогнозирования. Состояние может не быть непосредственно наблюдаемым и измеряемым, но оно как-то связано с наблюдаемыми и измеряемыми величинами. Следующая привычная историческая веха - Анри Пуанкаре. Будущее следует за настоящим и им определяется. Этот принцип детерминизма реализуется в описаниях природных явлений дифференциальными урав- нениями. До Пуанкаре усилия исследователей были направлены на полу- чение их решений: аналитических, приближённых и численных. Пуанка- ре стал изучать всю совокупность решений в их геометрической интер- претации в фазовом пространстве. Это повлекло новую топологическую точку зрения на совокупность всех решений, как на разбиение фазового пространства на фазовые траектории, и привело к качественной теории дифференциальных уравнений и теории динамических систем. Фазовый и бифуркационный портреты динамической системы позволили соста- вить полное качественное представление о динамике, свойствах и явле- ниях в изучаемом объекте, которые могут в нём происходить с измене- нием времени и параметров. Построение математических моделей эволюционных процессов в виде динамических систем - это проблема отыскания, выдумки, изобретения самодостаточного описания - состояния - и нахождение оператора его изменения со временем. В отыскании этого самодостаточного описания человечество проявило громадную изобретательность. В механике со- стояние - это положения и скорости всех материальных точек, в элек- тродинамике - придуманные М.Фарадеем фантастические электриче- ские и магнитные поля, в квантовой физике - знаменитая функция у/, для случайных марковских процессов и описываемых ими физических явлений - плотность вероятностей. Состояние конструируется человеком как самодостаточное описание, по которому возможен прогноз такого же описания. Изучения биологических и общественных явлений, возможно, приведут к совершенно новым неожиданным конструкциям состояния. Для систем управления состояние - не только самодостаточное описа- ние для прогноза, но и полная информация для организации управления. Понятия управляемости и наблюдаемости исходят из состояния, его управляемости и его наблюдаемости. Изучению динамической системы как математической модели уже бо- лее ста лет. С одной стороны, результаты этого исследования огромны, и мы очень много узнали, а с другой - и сегодня достаточно полное изуче- ние конкретной многомерной системы - очень трудная и часто неразре- шимая задача. Регулярный успех достигнут только для размерности, при
338 41. Основная математическая модель современной науки и теория колебании п <2, п = 3 трудно, и доступно лишь благодаря новой вычислительной технике, а при п >4- очень трудно и часто невозможно. До последнего времени существовала пропасть между известными, конкретными системами, в подавляющем большинстве с простой струк- турой фазового портрета и простыми движениями, и теоретически от- крытыми в работах А Пуанкаре и Д.Биркгофа сложными структурами и движениями, рекуррентными и устойчивыми по Пуассону, непериодиче- скими и нерекуррентными. Устойчивые по Пуассону - это те, которые мы сегодня называем хаотическими и стохастическими, и странными ат- тракторами Новое, что принесли 60-80 годы, состоит не в открытии но- вых движений и странных аттракторов, а в осмыслении и наглядном по- казе, как эти сложные движения возникают в динамических системах, описываемых простыми по виду дифференциальными уравнениями, и как и почему эти движения, несмотря на соблюдение теоремы о единст- венности решения дифференциальных уравнений, оказываются непред- сказуемыми и случайными. Мне представляется, что первым ударом по устоявшимся ограничен- ным представлениям о поведении динамических систем, ударом, послу- жившим спусковым крючком, были работы начала 60-х годов XX века математика С.Смейла. До него представления о диссипативных динами- ческих системах в значительной мере ограничивались тем, что наблюда- лось у грубых двумерных систем [1, 2, 3]. Смейл показал, что в много- мерном случае, п > 2, существуют грубые динамические системы с очень сложными движениями, что у грубых систем может быть беско- нечное число периодических движений, что в пространстве динамиче- ских систем могут быть области негрубых систем и что, тем самым, не- гру бость не есть необщность [4, 5, 6]. Эти неожиданные факты в короткое время вызвали бум, который в 70-80 годах вовлёк в свой вихрь новых людей, в основном физиков и ме- хаников, не знающих ни классической теории динамических систем Пу- анкаре-Биркгофа, ни исследований геодезических линий (траекторий свободного движения материальной точки) на поверхности отрицатель- ной кривизны, начатых ещё Ж Адамаром, ни символической динамики, ни более поздних работ по теории нелинейных колебаний и исследова- нию конкретных систем. Им казалось, что всё происходит впервые. Для них это так и было. Если говорить о произвольных динамических системах, то несомнен- но, что среди них очень много и, возможно, подавляющее большинство таких, которые мы никогда не сможем изучить. Но скорей всего, что это и не очень нужно. То, что является общим и частным с формально мате- матической точки зрения пространства динамических систем, не всегда совпадает с тем, что интересно и встречается в реальных системах Мне кажется, что хорошим примером этого различия может служить вопрос об общности и частоте встречаемости устойчивых равновесий. Однажды А.А Андронов сказал мне, увлекающемуся пространством коэффициен- тов полиномов, что с точки зрения этого пространства при больших раз-
41. Основная математическая модель современной науки и теория колебаний 339 мерностях устойчивость - очень редкая вещь. Я с этим согласился, но на предложение этим заняться никак не откликнулся. Позднее этот вопрос увлёк других исследователей, показавших, что это действительно так [7]. Вместе с тем мне представляется, что это не имеет никакого отношения к частоте встречаемости устойчивых равновесий в природе, и особенно технике. Всё дело в том, как выбрано пространство параметров, в кото- ром выделяется область устойчивости, какие параметры выбирает при- рода, и какие конструирует человек. Вхождение варьируемых парамет- ров определяется физической структурой системы. В своё время были интересные и отчасти забытые работы И.И.Гальперина по выделению структурных схем линейных систем управления, устойчивых при любых значениях параметров, устойчивых в силу своей структуры [8]. Сегодня упорно во всём мире ищутся системы управления, малочувствительные к изменениям своих параметров, грубые - по терминологии Андронова- Понтрягина, робастные - по-английски. Мне кажется, что в этом вопросе представляет интерес отыскание систем, робастных по своей структуре. Поведение нашего мира, по-видимому, существенно отличается от изучаемых нами динамических систем с компактным фазовым простран- ством. Свойство повторяемости, имеющее место у установившихся дви- жений динамических систем, не присуще нашему миру. В нём, скорее всего, всё происходит наново. Эклезиаст был не прав, говоря, что всё, что было - и будет. Прав был Демокрит. Но на ограниченных промежутках времени в ограниченных масштабах упрощающая идеализация, прини- маемая теорией динамических систем, вполне приемлема. По-видимому, самая простая, эффективная и практически значимая классификация движений динамических систем - это разделение их на устойчивые и неустойчивые, на устойчивые и неустойчивые по Ляпунову и орбитно устойчивые и неустойчивые. Различие между устойчивостью по Ляпунову и орбитной устойчивостью весьма значительно. Устойчи- вость по Ляпунову - это близость законов изменения состояния во вре- мени для невозмущённого и возмущённого движений. Орбитная устой- чивость - это неограниченное пребывание возмущённого движения в ма- лой окрестности невозмущённого. Законы изменения состояний возму- щённого и невозмущённого движений при этом могут значительно раз- личаться. Из сказанного следует, что из устойчивости по Ляпунову все- гда следует орбитная устойчивость, а обратное не имеет места. Простые установившиеся движения динамических систем - это устой- чивые состояния равновесия и периодические движения. Сложные - ус- тойчивые по Пуассону, отличные от простых. Они обладают ослаблен- ным свойством периодичности, состоящем в повторяемости со временем с любой степенью точности любого из пройденных ранее состояний, они орбитно устойчивы, но вообще неустойчивы по Ляпунову. Устойчивость и неустойчивость по Ляпунову в общем случае с точки зрения значений показателей Ляпунова - это экспоненциальная устойчи- вость или неустойчивость. Предполагая эту общность, сложные движе- ния - это орбитно устойчивые движения, экспоненциально неустойчивые
41. Основная математическая модель современной науки и теория колебаний по Ляпунову, т.е. такие, от которых почти всякое возмущённое движение локально экспоненциально удаляется, а в целом всё время блуждает по некоторой области - аттрактору. Однако устойчивое по Пуассону и экс- поненциально устойчивое или асимптотически устойчивое движение обязательно просто периодическое. Почти все остальные движения асимптотически приближаются к про- стым или сложным установившимся движениям, состояниям равновесия, периодическим движениям и движениям, устойчивым по Пуассону В дополнение к сказанному я хотел бы кратко ответить на вопросы предсказуемости и непредсказуемости движений динамических систем и механизма возникновения непривычных, сложных, непредсказуемых и случайных движений. Они уже затрагивались ранее при рассмотрении стохастического осциллятора - «часов наоборот». Ниже о том же, но в более общем плане. В отсутствие неизвестных возмущений и погрешностей счёта все дви- жения предсказуемы. Фактическая непредсказуемость возникает, с одной стороны, от наличия неустранимых случайных или неизвестных возму- щений, а с другой - столь же неизбежных погрешностей вычислений. Различие между этими двумя факторами состоит в неповторяемости пер- вого и повторяемости второго при использовании идентичных цифровых вычислительных средств. Однако результирующее действие этих неуст- ранимых факторов погрешностей может быть существенно разным. Возможно, что с уменьшением неизбежных погрешностей неограни- ченно растёт и достижимая точность прогноза для всех t > 0. В этом случае мы склонны считать, что имеет место предсказуемость. Но воз- можен и совершенно другой случай, когда, сколь бы ни были малы неиз- бежные погрешности, ошибка прогнозирования может быть не меньшей некоторой конечной величины, которая может существенно превосхо- дить допустимую. В этом случае мы вынуждены признать, что имеет ме- сто непредсказуемость. Именно это имеет место для сложных движений в силу их экспоненциальной неустойчивости по Ляпунову. Динамическую систему можно рассматривать и с привычной специа- листам по теории управления точки зрения, как звено со входом и выхо- дом, однако при этом следует считать, что в звене могут автономно про- исходить динамические процессы, которые возмущаются входным слу- чайным воздействием. При таком подходе в зависимости от этих авто- номных движений звено может быть преобразователем, усилителем или генератором стохастичности [9]. Преобразователь стохастичности - это то, что хорошо известно и настойчиво изучалось. Усилитель и генератор стохастичности - нечто совершенно неожиданное, ранее никак не учиты- ваемое. Дисперсия выхода усилителя стохастичности может быть намного большей дисперсии входного воздействия, и даже с локальным коэффи- циентом усиления, стремящимся к бесконечности при уменьшении слу- чайного входа. При этом стохастические свойства выхода, по-прежнему, как и в случае преобразователя стохастичности, определяются исчезаю-
41 Основная математическая модель современной науки и теория колебаний 341 ще малым случайным входом, но выход неограниченно уменьшается вместе с входом. Для генератора стохастичности при сколь угодной ма- лости случайного входа дисперсия выхода остаётся большей некоторой конечной величины, а его статистическое описание не зависит от входа. Оно полностью определяется самой невозмущённой системой, её детер- минированным описанием. Наконец, о механизме возникновения сложных, устойчивых по Пуас- сону, движений усилителей и генераторов стохастичности. В своё время рождение теории автоколебаний было неразрывно связано с открытием Андроновым связи между ними и предельными циклами Пуанкаре. В ка- кой-то мере это повторилось и со сложными движениями, но теперь не благодаря введённым и изучаемым Пуанкаре предельным циклам, а от- крытым им гомоклиническим и гетероклиническим кривым [10]. Откры- тым в связи с безнадёжно и длительно изучаемой им ограниченной про- блеме трёх тел. Гомоклинические и гетероклинические фазовые кривые или движения динамической системы - это двоякоасимптотические дви- жения при t —> со и t —» -оо, стремящиеся к одному и тому же или, соот- ветственно, разным неустойчивым седловым периодическим движениям. Вот эти, естественно и общим образом возникающие гомоклинические и гетероклинические кривые (движения), асимптотические,’ казалось бы, к несущественным неустойчивым седловым периодическим движениям, как выяснилось, могут порождать сложные, орбитно устойчивые и неус- тойчивые по Ляпунову движения [9, 11-14]. О сложности этих движений писал уже А.Пуанкаре, но он, по-види- мому, не подозревал, что они могут порождать сложные установившиеся движения. Сложные движения, как оказалось, могут порождать двоякоа- симптотические движения не только к периодическим движениям, но и состояниям равновесия, или к тем и другим (будем называть их также гомоклиническими и гетероклиническими). Широко известно, что устойчивое периодическое движение может ро- диться от теряющего устойчивость состояния равновесия (бифуркация Андронова). Аналогично, сложное движение, орбитно устойчивое и не- устойчивое по Ляпунову, может родиться от замкнутых контуров, со- ставленных из гомоклинических и гетероклинических кривых [15]. Выше речь шла об описании и поведении изолированной системы, не подверженной влиянию внешних воздействий, её ещё называют авто- номной. Только в этом случае состояние и его изменение определяются самой системой. В неизолированной системе, подверженной внешним по отношению к системе воздействиям, это уже не так: изменение состояния зависит не только от самого состояния, но и внешних воздействий. Ди- намическую систему с внешним воздействием называют ещё автоматом, с которым мы встречаемся при описании игр, целесообразного поведения и распознавания (персептрон). Автомат ещё предполагает наличие выхо- да, определяемого его состоянием, либо состоянием и внешним воздей- ствием. Это сближает понятие автомата со звеном со входом и выходом, а в случае его линейности - с коэффициентом передачи и амплитудно фазовой частотной характеристикой. Если внутреннее устройство звена
342 41. Основная математическая модель современной науки и теория колебаний нам неизвестно, а можно регистрировать только его вход и выход, то та- кое звено называют ещё чёрным ящиком. Неизолированная, неавтоном- ная система, безусловно, общее изолированной и автономной, но не- смотря на это, всё же именно изолированная, автономная система остаёт- ся основной моделью, поскольку именно она описывает базовые осново- полагающие законы природы, и поскольку путём расширения рассматри- ваемого объекта всегда, как мы думаем, можно достичь его изолирован- ности и автономности. С этой точки зрения неавтономность есть резуль- тат выделения некоторой части в изолированной автономной системе. 2. А.А. Андронов и теория колебаний как наука об эволюционных процессах и явлениях. Александр Александрович Андронов создал но- вую науку - теорию нелинейных колебаний, всемирно известную науч- ную школу и оставил учеников, продолживших его дело [25]. Теория ко- лебаний сегодня - это широкая всеобъемлющая наука об эволюционных процессах в природе, технике и обществе, в механике, физике, астроно- мии, химии, биологии, и во всём, что нас окружает, и в нас самих. Бук- вально и в восприятии многих людей название «Теория колебаний» не адекватно тому, что я сказал. Но так распорядилась история: название пришло от колебаний маятника, механического и электрического осцил- ляторов, и история же определила мощь и значимость теории колебаний как науки всеобъемлющей, воплощающей в себе великую идею изомор- физма и единства природы и мира. Совсем недавно, да и сейчас механика - теоретическая и прикладная - включают в себя и теорию колебаний, и теорию устойчивости, и отчасти даже теорию управления. Во всяком случае, эти разделы имеются в че- тырехтомнике «Механика в СССР за 50 лет» и в программах традицион- ных съездов по механике. Более того, основоположник современной тео- рии устойчивости А.М. Ляпунов был академиком по отделению механи- ки. Лагранж, создавший теорию малых колебаний, основывался на меха- нике. Знаменитый трактат Рейли, от которого, по нашим представлениям, ведет свое начало наука о колебаниях, назывался «Теория звука», т.е. от- носился к механике. Известная книга Уитткера «Аналитическая механи- ка» включает не только теорию колебаний и теорию устойчивости, но и теорию динамических систем. Знаменитый труд Пуанкаре, основопола- гающий теорию динамических систем, называется «Новые методы не- бесной механики». Широко известные инженерные книги по теории ко- лебаний Ден Гартога и Тимошенко рассказывают о колебаниях механи- ческих систем. Если этим ограничиться, то создается впечатление, что теория колебаний целиком относится к механике. Однако сказанное го- ворит лишь об огромной роли механики в возникновении и становлении теории колебаний. Уже в лекциях Л.И. Мандельштама 1930-31 и 1931- 32 учебных годов на физфаке МГУ и изданных в 1955 г. теория колеба- ний предстаёт как самостоятельная наука. В них идёт речь о колебаниях не только в механике, но и во многих разделах физики. Благодаря ус- пешным исследованиям школы Мандельштама, в 1931 г. состоялась пер-
41. Основная математическая модель современной науки и теория колебаний 343 вая Всероссийская конференция по теории колебаний. Именно на этой конференции А.А. Андронов выступает с широким и обстоятельным док- ладом о математических проблемах теории колебаний Следующей ре- шающей вехой в становлении теории колебаний как самостоятельной науки является книга А.А. Андронова, А.А. Витта и С.Э. Хайкина «Тео- рия колебаний», вышедшая в 1937 г. Следует отметить и замечательную книгу Г.С. Горелика «Колебания и волны» в 1950 г. Первая книга зало- жила основы теории нелинейных колебаний, вторая ещё более расшири- ла охват теорией колебаний разнообразных физических явлений. Значительный вклад в становление теории колебаний как само- стоятельной науки внесла и школа Крылова - Боголюбова - Митрополь- ского. Именно она инициировала и организовала длительную традици- онную серию Международных конференций и симпозиумов по теории нелинейных колебаний с разделами «Аналитические и качественные ме- тоды исследования и их приложения» и проводила весьма длительную серию научных школ по этой тематике. В более поздний период с 1972 г., когда уже самостоятельность теории колебаний как науки не вызывала сомнений, следует отметить научные школы, организуемые в Горьком (Н. Новгороде) НИРФИ, затем ИПФ, а также конференции, проводимые НИИ ПМК Имевший место на них бум, вызванный «открытием» хаоти- ческих и стохастических колебаний, охватил всю страну. Теорию коле- баний стали ассоциировать с нелинейной физикой, нелинейной динами- кой и синергетикой. Теория колебаний стала наукой об общих законо- мерностях эволюционных процессов в механике, физике, радиотехнике, радиофизике, гидродинамике, теории управления, химии, биологии, нау- ке об обществе,.... Одновременно теория колебаний обрела прочную математическую опору в качественной теории дифференциальных урав- нений и теории динамических систем, не только используя их, но и су- щественно определяя их проблематику и направления исследований. Из сказанного видно, сколь многообразны связи теории колебаний с другими науками, и что другие науки - не только объект приложений её методов, но и неиссякаемый плодотворный источник новых вопросов, задач и проблем. Ядром теории колебаний являются математические модели законов природы и происходящих в ней процессов, включая технику и общество. В основе этих моделей лежит понятие состояния и оператора его измене- ния. Состояние изобретается, оператор открывается. Фарадей изобрёл электрические и магнитные поля - состояние, Максвелл написал уравне- ния, определяющие оператор. В зарождении и развитии каждой науки основную роль играют так или иначе установленные факты, методы изучения и общее понимание. В теории колебаний факты - это накопленные знания математических мо- делей и характера протекания описываемых ими процессов и сопровож- дающих их явлений; методы - это способы изучения этих математиче- ских моделей в виде обычных дифференциальных уравнений или урав- нений в частных производных, или в виде динамических систем того или
344 41. Основная математическая модель современной науки и теория колебаний иного вида; общее понимание - это, прежде всего, наглядные представ- ления о возможных эволюционных процессах, их закономерностях и со- провождающих их явлениях, в частности, представления о фазовом про- странстве, состояниях равновесия и периодических движениях, автоко- лебаниях, хаосе и странном аттракторе, волнах, волновых и модовых взаимодействиях, дисперсии, резонансе, синхронизации, бифуркациях и бифуркационном портрете, локальной и глобальной устойчивости, об- ласти притяжения, мягком и жёстком возбуждениях, гистерезисе, прин- ципе суперпозиции, скользящих движениях и разрывах и т. д.. Огрублённо и крупно основные типы эволюционных процессов - это: 1) порядок, синхронизация и предсказуемость на основе асимптоти- ческой устойчивости по Ляпунову; 2) хаос, непредсказуемость и стохастичность на основе экспоненци- альной неустойчивости при орбитной и глобальной устойчивости; 3) гомеостаз, реализация цели или программы и самоорганизация на основе направленных обратных связей и управления. В этом кратком перечислении преодоленные в 20 веке многовековые заблуждения, огромные новые знания, новое научное мировоззрение и понимание эволюционных процессов в природе, технике и обществе. В этом не только вчера и сегодня теории колебаний, но и предвидимое зав- тра. Одно из важнейших различий вчера и сегодня - это то, что вчера теория колебаний в основном изучила и освоила простейшие установив- шиеся движения - состояния равновесия и периодические движения, хо- тя неявно сложные движения проявляли себя в статистической термоди- намике и физике, турбулентности жидкостей, газов и плазмы, а сегодня стало возможным всё это рассматривать с единых позиций, как проявле- ние всё той же динамической системы. Но не только это, ещё и зарожде- ние изучения процессов, основанных на направленных связях и управле- нии, изучения выходящего за рамки бурно развивающейся технизиро- ванной теории автоматического регулирования. Важно это не только для понимания живого, но и того, как создавать интеллектуальные машины, как будет эволюционировать человек и человеческое общество. Многие очень крупные открытия в науке совершаются дважды: пер- вый раз абстрактно-теоретически, отдельными людьми, и это открытие никого не волнует и не трогает, его не замечают, и второй раз практиче- ски жизненно, когда оно овладевает многими умами и потрясает людей, открывая им что-то ранее неведомое, неожиданное и очень важное. В теории колебаний так было с открытием автоколебаний и с открытием хаотических и стохастический колебаний. У крупных открытий есть и третья фаза, когда они становятся общеиз- вестными и как бы «исчезают». Так произошло с великим открытием, что Земля - шар и ничем не поддерживается, что Земля вращается вокруг Солнца, что две массы или два заряда взаимодействуют друг с другом, хотя между ними пустота. Так произошло и с автоколебаниями и проис- ходит сейчас с хаотическим и стохастическим движениями, так про-
41. Основная математическая модель современной науки и теория колебании 345 изошло даже со специальной теорией относительности: она уже никого не удивляет, и студенты воспринимают её как должное и даже обычное. Первый раз устойчивые предельные циклы открыл Анри Пуанкаре. Анри Пуанкаре, по типу мышления великий геометр, изобразил решения дифференциальных уравнений в виде кривых в пространстве их пере- менных, и именно поэтому естественно и легко обнаружил предельные циклы. Они были естественны потому, что в некоторых общих ситуациях замыкание кривой было неизбежным, и эту неизбежность, во всяком случае на плоскости, Пуанкаре сделал очевидной, благодаря введению секущего отрезка и функции последования на нём (рис.41.1). Была оче- видна не только неизбежность замыкания кривой, т.е. периодичность решения дифференциального уравнения, но и возможность его устойчи вости. И именно эта естественность и простота до примитивности спо- собствовали тому, что никто на это не обратил особого внимания, и ни- кому не пришло в голову, что это интересно, очень важно и несёт откры- тие человечеству. Рис.41.1. Секущий отрезок, функ- ция последования и диаграмма Ла- мерея. и* - неподвижная точка, отвечающая устойчивому предель- ному циклу U=f(u) Второй раз, спустя значительное время, устойчивые предельные цик- лы в виде автоколебаний реальных систем открыл А.А.Андронов [16] Открыл не как абстрактные устойчивые замкнутые кривые, а как практи- чески жизненно важные явления в механике, электричестве, астрономии, химии и биологии. Как явления в природе и технике: в далёких звёздах цефеидах, охватывающей весь мир радиопередаче, звучании музыкаль ных инструментов, шимми автомобиля и флаттере крыла самолёта, мо- гущих их разрушить, в вибрациях инструмента при механической обра- ботке, препятствующей её точности, и многом, многом другом. Это второе открытие вызвало революцию во взглядах инженеров и учёных. Подчас оно воспринималось с недоверием, с большим трудом, и
346 41. Основная .математическая .модель современной науки и теория колебаний нередко активно отвергалось, как это, например, имело место в химии с известной реакцией Белоусова, даже несмотря на то, что эта реакция де- монстрировалась в прозрачной колбе с химическим раствором, периоди- чески меняющим свой цвет. Даже в механике, где, казалось бы, всё дос- таточно просто, наблюдалось длительное неприятие и, например, шимми автомобиля трактовалось как резонанс с воздействием неровностей доро- ги, а вибрации при точении трактовались как тот же резонанс, вызванный отрывами стружки, и т.п. Признание автоколебаний было без помех, по- жалуй, только в зарождающейся радиотехнике. Но там податься было некуда, на них всё основано. А.А.Андронов не просто указал на идентичность предельных циклов А.Пуанкаре и автоколебаний в реальных объектах и системах [17]. Он нашёл их и изучил во многих реальных конкретных системах, обнаружил и исследовал явления захвата и затягивания - сегодня синхронизации - при периодическом воздействии на автоколебательную систему и при взаимодействии её мод, опираясь сначала на метод малого параметра А.Пуанкаре, а затем в сильно нелинейных системах на метод точечных отображений [18]. Он изучил, как возникают и исчезают автоколебания при изменении параметров (рис.41.2-41.5) - это широко сейчас известная бифуркация рождения автоколебания - предельного цикла - из теряюще- го устойчивость равновесия и другие (от замкнутой сепаратрисы седла, при слиянии и исчезновении устойчивого и неустойчивого равновесий) Рис.41.2. Бифуркация рождения авто- колебания (мягкое возбуждение) при изменении параметра р. Диаграмма Ламерея и бифуркационная диаграмма Рис.41.3. Жесткое возбуждение автоколебаний
41. Основная математическая модель современной науки и теория колебаний 347 Рис.41.4. Рождение автоколебания от сепаратрисы седла Рис.41,5. Рождение автоколебания при слиянии седла и узла Эти открытия были сделаны применительно к гладким системам вто- рого порядка. Обобщение на многомерный случай и более общие систе- мы (кусочно-гладкие и сингулярно возмущенные) было делом после- дующих исследований, как и использование новых возможностей вычис- лительной техники (рис 41.6-41.8 ) Рис.41.6. Новые бифурка- ции автоколебания в много- мерном случае (удвоение пе- риода, рождение тора) Всё это привело к тому, что вместо мифических механизмов возник- новения колебаний человечество научилось открывать истинные причи- ны колебаний и устранять их там, где они вредны и опасны, и вызывать, где нужны и полезны А в современной технике обоих случаев очень много. И барьер неприятия автоколебаний, возникающих как бы из ниче- го, был преодолён. Ведь до этого были понятны затухающие и в идеали- зации незатухающие колебания маятника, грузика на пружинке, упругой среды, ... , понятны вынужденные колебания, вызываемые действием пе- ременной силы или напряжения, было понятно и удивительное явление резонанса, но как могут возникать колебания «из ничего», без вызываю- щего их воздействия, было непонятно и неприемлемо, и этот психологи-
348 41 Основная математическая модель современной науки и теория колебаний ческий барьер был преодолён, и сегодня автоколебания уже всем при- вычны и понятны. Рис.41.7. Новые возможные равно- весия О в разрывных кусочно-гладких системах (в точке равновесия пра- вые части дифференциальных урав- нений в нуль не обращаются) Рис.41.8. Разрывные авто- колебания в предельной син- гулярно возмущенной систе- ме Такова сравнительно простая и ясная история открытия автоколеба- ний и связанных с ними понятий устойчивости, фазового портрета, би- фуркаций, бифуркационного портрета, синхронизации, грубости и дру- гих. Нечто похожее, но в большем масштабе, в соответствии с увеличе- нием числа вовлечённых в науку людей и трудностью проблемы, про- изошло и с открытием сложных установившихся движений: хаотических и стохастических. Но теперь число непосредственных участников огром- но, всё переплетено и запутано, а причина неприятия неоднозначна. Опи- сать всё это в докладе сколько-нибудь полно невозможно. История эта противоречива: с одной стороны, движения как бы не принимались, а с другой - на них базируются статистическая термодинамика и физика, не отрицается и турбулентность. Так что скорее дело не в непризнании, а непонимании, как детерминизм может порождать непредсказуемость и случайность и связанную с ними сложность. Но и это не совсем так: об- щее объяснение этому давали и Пуанкаре, и Крылов, и другие. Не было ясного приемлемого механизма, как это происходит — наверно, это глав- ное. С этой точки зрения, опять первый Пуанкаре [10], и опять это про- шло незаметно. Открытие Пуанкаре - это гомоклинические и гетероклинические кри- вые и связанное с ними необычайно сложное и запутанное поведение со- седних кривых, которые Пуанкаре даже не пытался изобразить. Обнару- жил их Пуанкаре в процессе упорно и безнадёжно решаемой им ограни- ченной проблемы трёх тел. Именно в этой непостижимой сложности увидел Пуанкаре камень преткновения в её решении. Но он не придал
41. Основная математическая модель современной науки и теория колебаний 349 этому большого значения, точнее, не продолжил исследование. Почему так случилось, трудно сказать, возможно, не пришло время, отвлекли другие проблемы. Гомоклинические и гетероклинические кривые уже не так просты, как предельные циклы, секущий отрезок и функция последования. Вместо секущего отрезка Пуанкаре прибёг к секущей плоскости и порождаемому На рис.41.9 седловое периодическое движение Г п гомоклиническая к нему кривая у. На рис.41.10 их сечение двумерной плоскостью, на кото- рой О — седловая неподвижная точка пересечения Г с секущей, а точки ..., M.i, Мо, Mi, ... - последовательные точки пересечения секущей с го- моклинической кривой у и одновременно часть точек пересечения инва- риантных кривых Уи S*седловой точки О. Сложность, о которой гово- рил Пуанкаре, - это поведение кривых У и S*: ни одна из них не пересе- кается сама с собой, но они пересекаются друг с другом в бесконечном числе точек и неограниченно продолжаются. Как они это делают, Пуан- каре описывать не стал. Можно заметить, что если выделить показанную на рис.41.10 область D, то области ..., cr.i, с>о, — и области ..., v.i, vo, vi, ..., показанные на рис.41.10 при точечном отображении Т, последовательно переходят друг в друга, образуя один поток входящих в область D точек, и другой - вы- ходящих из неё. Чтобы понять всю сложность происходящего с ними внутри области D, укажем, что в области G, рис.41.11, составленной из окрестности е (I) седловой замкнутой кривой Г и окрестности е (у) го- моклинической кривой у имеется бесчисленное множество разных седло-
350 41. Основная математическая модель современной науки и теория колебаний вых кривых. Полнее, если окрестности е(Г) и е (у) достаточно малы, то всякой бесконечной в обе стороны последовательности целых чисел вида -•-,7-2, 7/, Jo. ji. j-2.--- U-2>N) отвечает единственная седловая кривая, которая последовательно обора- чивается ....j-2, j-h Jo, Ji, j-2, — раз возле кривой Г в е(Г), а между ними возвращается в s (Г), проходя вдоль гомоклинической кривой у в её окрестности е (у) [11-13]. Из этого следует, что, кроме гомоклинической кривой у, в G существует бесконечное множество других гомоклиниче- ских кривых, возле каждой из которых есть, в свою очередь, такие же кривые, и так до бесконечности. Рис.41.10. Гомоклиническая структура на секущей поверхности Теперь сквозь магический кристалл общий механизм образования сложных движений можно представить в виде последовательно- параллельного прохождения фазовых траекторий вблизи гомоклиниче- ских и гетероклинических кривых [13]. При этом происходит сложное и тонкое их разделение, подобно тому, как это происходит с входным по- током областей ..., сг2, сг_/, сгд, сг/, ... . Если область о; пересекается с v ., то она выбрасывается наружу (во вне области D), как точка областей и_у+/,..., и/, v0, И, -•• Вариантов тут очень много, но механизм один. На- глядно и схематически этот механизм похож на то, что происходит с
41. Основная математическая модель современной науки и теория колебаний 35 1 горошинами на доске Гальтона, если бы их снизу собирать и сыпать в верхнюю воронку снова и снова. Рис.41.11. Окрестно- сти гомоклинической структуры Со сложными движениями столкнулся и Ж.Адамар [21], изучая геоде- зические линии на поверхности отрицательной кривизны в динамической интерпретации свободного движения материальной точки по ней. Это открытие было воспринято математиками и привело к символической динамике и её статистическому описанию [22]. Здесь можно обратить внимание на не выявленную в то время связь с движениями в гомокли- нической структуре. Сложные движения присутствуют и в теории центральных движений Д.Биркгофа [23], но скорее это то, что может быть, а не как это может быть. Всё сказанное выше можно отнести к первому этапу открытия слож- ных движений. Второй этап массового повального увлечения сложными хаотическими и стохастическими движениями детерминированных ди- намических систем вызван, пожалуй, не столько новыми теоретическими открытиями этого первого этапа, сколько реальной возможностью их по- лучения и наблюдения во многих конкретных системах с помощью ком- пьютера. Компьютер стал решающим доводом их существования и ре- альности, и это породило своеобразное компьютерное понимание и тол- кование их происхождения и классификации. После сказанного хочу из- ложить взгляды А.А.Андронова на сложные движения, относящиеся к первому этапу. А.А.Андронов знал о сложных центральных движениях Биркгофа и говорил о них в опубликованном докладе первой Всероссийской конфе- ренции по колебаниям в 1931г. [17]. Он говорил об общей классифика- ции движений динамических систем, центральных движениях Биркгофа, включая рекуррентные и устойчивые по Пуассону - сегодня хаотические и стохастические - и о том скромном месте, которое занимают среди них автоколебания. Но поставив ряд насущных проблем теории колебаний,
352 41 Основная математическая модель современной науки и теория колебаний он не ставит задачу существенного расширения круга исследуемых дви- жений, и история показала, что это было бы несвоевременным, для этого нужны были другие, более мощные подходы и средства, чем те, которы- ми располагала математика и наука в то время. Расширение этих иссле- дований произошло много позднее, в 60-80 годах XX века. Его выступ- ление относилось к тому времени, когда основным освоенным инстру- ментом исследования было сочетание метода малого параметра Пуанкаре и теории устойчивости Ляпунова. В их рамках сложные движения не об- наруживаются. Кроме этого, у А.А.Андронова были другие соображения, по которым он не счёл нужным это сделать. Его привлекала новая общая дисциплина - динамика машин, он счи- тал, что теория колебаний должна привести к ней и позволит её создать. Он оставил наброски содержания этой предполагаемой книги, которую ему не было суждено написать. Машина, как он ее понимал, для того, чтобы функционировать, должна обладать свойством грубости, а её ра- бочее движение должно быть асимптотически устойчиво по Ляпунову [24]. С этих позиций единственные подлежащие изучению установив- шиеся движения - это асимптотически устойчивые равновесия и перио- дические движения. Возможно, именно поэтому в широко известной книге «Теория колебаний» [1] в примечании к введению он написал: «Однако, по-видимому, требование грубости системы запрещает все ос- тальные рекуррентные движения, кроме состояний равновесия и перио- дических». Заметьте - речь идёт не об устойчивых по Пуассону неперио- дических движениях, а только о рекуррентных. Рекуррентных - потому, что устойчивые по Пуассону он, по-видимому, считал вообще не подхо- дящими и не нужными для машин. Понятие же грубости - это ещё до ра- боты с Понтрягиным [20] - понималось очень широко и имело несколько аспектов: физическая реализуемость, математическая корректность мо- дели, приближённая вычислимость и даже общность. Сказанное относится к 30-м годам. Позднее, во второй половине 40-х годов, Андронов проявил интерес к сложным движениям в конкретных системах. Его аспиранты Н.А Фуфаев и А.С.Алексеев обнаружили и ис- следовали их в электромагнитном прерывателе и регуляторе температу- ры с опережением. Дальше эти исследования были продолжены его уче- никами и учениками учеников [9]. Но это уже выходит за рамки моего доклада. Отмечу только, что они внесли значительный и существенный вклад как в первый этап, так и во второй — этап повального увлечения сложными хаотическими и стохастическими движениями, которые сего- дня обнаруживают всюду и о которых сейчас знают все. Пожалуй,еще следует отметить, что наиболее значительные результа- ты в общей теории динамических систем были получены в 60-е годы С.Смейлом, как он сам пишет, под влиянием работ А.А.Андронова. В заключение позвольте мне шуточный пример на два крупнейших открытия 20 века в познании динамики эволюционных процессов. Пред- ставьте нашу жизнь в виде скачущего по лестнице мячика сначала вверх потом вниз. Вверх - потому, что он молод и коэффициент отскока боль-
41. Основная математическая модель современной науки и теория колебаний 353 ше единицы, вниз - потому, что повзрослел и коэффициент отскока уже меньше единицы. На рис.41.12 приведены диаграммы Ламерея для по- следовательных значений скоростей отскока от ступенек лестницы. Рис.41.12. Прыгающий по лестнице мячик ck> 1 ик< 1 ЛИТЕРАТУРА 1. Андронов А.А., Витт А.А., Хайкин С.Э. Теория колебаний. М.: Нау- ка, 1981. 2. Андронов А.А., Леонтович Е.А., Гордон И.И., Майер А.Г. Качест- венная теория динамических систем второго порядка. М.: Наука, 1966. 3. Андронов А.А., Леонтович Е.А., Гордон И.И., Майер А.Г. Теория бифуркаций динамических систем на плоскости. М.: Наука, 1967. 4. Смейл С. Структурно устойчивые гомеоморфизмы с бесконечным числом периодических точек // Труды Международного симпозиу- ма по нелинейным колебаниям. Киев: АН УССР. 1963. С.365-366. 5. Смейл С. Структурно устойчивые системы не всюду плотны И Ма- тематика. 1967. Т.11:4. С.107-112. 6. Смейл С. Дифференцируемые динамические системы // Успехи мат. наук. 1970. Т.25. № 1. С.И 3-185.
354 41. Основная математическая модель современной науки и теория колебаний 7. Немировский А.С., Поляк Б.Т. Необходимые условия устойчивости полиномов и их использование // Автом. и телемех. (А. и Т.) 1994. № 11. С.113-119. 8. Неймарк Ю.И. О работах Гальперина, посвящённых условиям структурной устойчивости динамических систем // А и Т. 1953. Т.14. №1. С.88-92. 9. Неймарк Ю.И., Ланда П.С. Стохастические и хаотические колеба- ния. М.: Наука, главная редакция физ.-мат. литературы, 1987. 10. Пуанкаре А. Избр. труды. Т. II. М.: Наука, 1972. 11. Неймарк. О движениях, близких к двоякоасимптотическому дви- жению //ДАН СССР. 1967. Т.172. № 5. С.1021-1024. 12. Неймарк Ю.И. Структура движений динамической системы в ок- рестности гомоклинической кривой // Пятая летняя математическая школа (Ужгород, июнь, 1967) / АН СССР. Киев. 1968. С.400-435. 13. Неймарк Ю.И. Об одном классе динамических систем И Труды Международного симпозиума по нелинейным колебаниям / АН СССР. Киев. 1970. Т.2. С.363-376. 14. Неймарк Ю.И. Метод точечных отображений в теории нелинейных колебаний. М.: Наука, 1972. 15. Неймарк Ю.И. Инвариантные многообразия и стохастические движения динамических систем. Проблемы асимптотической тео- рии нелинейных колебаний. Киев: Наукова Думка. 1977. С. 128-134. 16. Андронов А. А. Предельные циклы Пуанкаре и теория колебаний И Доклады VI съезда русских физиков, 1928. Собр. трудов А.А. Андронова. Изд-во АН СССР, 1956. 17. Андронов А.А. Математические проблемы теории автоколебаний // Собр. трудов. М.: Изд-во АН СССР. 1956. С.84-124. 18. Андронов А.А. Теория точечных преобразований Пуанкаре— Брауэра-Биркгофа и теория нелинейных колебаний // Вестник АН СССР. 1944. № 6. 19. Андронов А.А., Леонтович Е.А. Некоторые случаи зависимости предельных циклов от параметров // Учёные записки ГГУ. 1939. Вып.6. № 3. С.3-33. 20. Андронов А.А., Понтрягин Л.С. Грубые системы // ДАН СССР. 1937. Т.14. №5. С.247-250. 21. Hadamar J.// Bull. Sos. Math. France. 1901. V.29. P.224-228. 22. Mors E., Hedlund G.A. Symbolic Dynamics. I, II // Amer. J Math. 1938. V.60. P.813-866; 1940. V.62. 23. Биркгоф Дж. Д. Динамические системы // М.: Гостехиздат. 1944. 24. Андронов А.А., Витт А.А. Об устойчивости по Ляпунову // ЖЭТФ. Т.З.Вып. 5. 1933. 25. Неймарк Ю.И. Создатель нелинейной динамики и физики. К 100- летию со дня рождения академика А.А.Андронова // Вестник РАН. 2001. Т.71. №4. С.231-236.
355 42 МАТЕМАТИЧЕСКАЯ МОДЕЛЬ КАК ПЛОДОТВОРНАЯ ИДЕЯ НАУЧНОГО ИССЛЕДОВАНИЯ. D-РАЗБИЕНИЕ Поскольку эта книга о математических моделях, то естественно отме- тить и обратить внимание на все аспекты и методы их использования. А они действительно широки и незаменимы, поскольку только с помощью модели можно найти ответы на многие вопросы, если их удаётся сфор- мулировать на математическом языке. Этот ответ может следовать толь- ко из каких-то известных нам сведений, а эти сведения, сформулирован- ные на математическом языке, и есть математическая модель. Поэтому все внутриматематические исследования, как и исследования всех мате- матически поставленных задач естествознания, техники и прочего - это тоже математическое моделирование. Так, теория целых положительных чисел - это изучение математической модели, состоящей из элементов ai, ci2, связанных соотношениями ап + ао = ап+/ = an + aj, п = 0, 1, 2, .... Среди сравнительно давно сложившихся и широко используемых весьма эффективных внутриматематических моделей можно указать на модели геометрий, топологий, всевозможных групп, линейных и нели- нейных уравнений, дифференциальных уравнений и много, много друго- го. Среди них, конечно, и основная математическая модель настоящей книги - динамическая система, которую можно трактовать и как полу- группу, а при взаимной однозначности её оператора, как одномерную группу Ли. Пример того, как простые математические модели указывают путь решения очень сложной и, казалось бы, неприступной проблемы, уже был - это распознавание образов и персептрон. Там такими моделя- ми были модели объекта, образа и распознавания образов соответственно в виде точки многомерного пространства, множества точек в нём и узна- вания принадлежности нового объекта этому множеству. Теперь будет описан другой пример, в котором речь идёт о проблеме устойчивости движения. Рассказ состоит из двух частей. В первой части речь идёт о том, как под влиянием настоятельных потребностей приложений сфор- мировалась эта простая модель, во второй - к каким новым научным ре- зультатам она привела. Теория управления как наука - детище XX века, но зародилась она ещё во второй половине XIX века в работах гениального физика Д.К.Максвелла (1868) и выдающегося инженера И.А.Вышнеградского (1877). Появились они под давлением острой практической потребности обеспечения устойчивости и стабилизации скорости вращения паровых машин - основного источника механической энергии начавшейся про- мышленной революции. Создал паровую машину Д.Уатт вместе с цен-
356 42. Математическая модель как плодотворная идея научного исследования. Р-разбиение тробежным регулятором скорости вращения, и вот эти регуляторы нача- ли обнаруживать непокорный нрав: чем, казалось бы, лучше их делали и большего хотели от них получить, тем хуже они работали, подчас приво- дя к авариям. Возникшая инженерная проблема была достаточно мас- штабной: только в Англии было порядка ста тысяч паровых машин, а за- тем к ним присоединились и паровые турбины. Непокорный нрав регуля- торов - неустойчивость - породил математическую теорию устойчиво- сти, начавшуюся с упомянутых работ Максвелла и Вышнеградского, впитавшую затем идеи и методы великих А.Пуанкаре и А.М.Ляпунова, и разросшуюся вширь и вглубь в результате интенсивной деятельности многих выдающихся исследователей разных стран. Историю теории автоматического управления можно рассматривать, как историю разрешения конфликта между устойчивостью и качеством управления. Именно этот конфликт проявился в центробежных регуля- торах Уатта, именно он привёл к изодромному регулятору, релейным системам, адаптивному и робастному управлениям. Выбор стратегии управления ограничивается требованием к динамике реализующей её системы, что влечёт во многих случаях необходимость предварительного теоретического исследования, важнейшим элементом которого является определение условий устойчивости. Для линейных систем, во всяком случае с формальной точки зрения, проблема устойчивости полностью решается известными критериями Раута и Гурвица, возникшими вскоре под влиянием работ Максвелла и Вышнеградского. Поначалу эти алгеб- раические критерии устойчивости Раута и Гурвица казались исчерпы- вающими. Потом выяснилось, что они не поддаются обобщению на не алгебраические уравнения и не вполне удовлетворяют практическим по- требностям, особенно в вопросах конструирования новых систем управ- ления, машин и устройств. Инженерам нужен был метод исследования устойчивости, позволяющий понять, в каких пределах они могут выби- рать и менять параметры конструируемой системы, не нарушая её устой- чивости, какой свободой они обладают для выполнения остальных тре- бований. Именно поэтому уже в первой половине XX века возникли но- вые критерии устойчивости, среди которых широкую известность полу- чили графические критерии Михайлова и Найквиста. Отметим, что уже Вышнеградский, получивший критерий устойчивости в виде алгебраиче- ского неравенства, представив его в виде области устойчивости на плос- кости двух параметров - неравномерности и специально введённого вяз- кого трения. На этой диаграмме конфликт между устойчивостью и каче- ством стабилизации скорости вращения паровой машины получил на- глядное геометрическое воплощение, как то, что определяющие их вели- чины должны находиться в некоторой области D, вид которой таков, что уменьшение одного параметра требует увеличение другого. Из сказанно- го следует, что требовалась новая постановка математической задачи, более общая и адекватная потребностям приложений, чем воспринятая математиками проблема Раута—Гурвица, состоящая в отыскании необхо- димых и достаточных условий, что все корни полинома лежат в левой
42. Математическая модель как плодотворная идея научного исследования. Р-разбиение 357 полуплоскости, условий, что Rezv<0 при всех v. Центральным момен- том появления нового подхода к описанному выше кругу задач, помимо ошеломляющей загадочности не вполне обоснованного, но верного кри- терия Найквиста, является недоумение по поводу того, как это может быть, что корни полинома найти нельзя, а условия того, что они лежат на левой полуплоскости или внутри единичного круга - можно. Выводы критериев Раута, Гурвица, Найквиста, Михайлова и других, известные в середине 40-х годов, ответа на этот естественный вопрос не давали. Вме- сте с тем ответ на него прост и сразу вознаграждается [1, 2, 3]. Дело в том, что хотя корни действительно найти нельзя, легко установить, когда они выходят за пределы левой полуплоскости или любой заданной об- ласти G комплексной плоскости (заметим, что сами по себе они исчез- нуть или возникнуть при изменении коэффициентов не могут, а могут только непрерывно перемещаться по плоскости комплексного перемен- ного z). Для того, чтобы установить, когда это имеет место, достаточно располагать параметрическим уравнением границы области G в виде z=f (со), со е Q.. Имеется в виду, что z пробегает границу области G, ко- гда действительное переменное со пробегает множество /2. При этом ко- рень характеристического уравнения % (z) = 0 при его изменении пересе- кает границу области G тогда и только тогда, когда при некотором со е £2 z(/W)=0. (42.1) Пусть теперь система, у которой надлежит исследовать устойчивость равновесия по параметрам и, имеет характеристическое уравнение X(z, и) = 0, (42.2) а устойчивость означает, что все корни этого уравнения лежат в области G комплексной плоскости Z. Далее, пусть точка z принадлежит гра- нице области G тогда и только тогда, когда при некотором co е £2 z^f(o>). (42.3) Из этого следует, что граница области устойчивости состоит из точек, для которых % (f(co), и) = 0, со е £2. (42.4) Множество точек N&, удовлетворяющих условию (42.4), содержит все граничные точки области устойчивости, но может содержать и другие точки. Это множество Na в целом определяет разбиение пространства параметров и на области D(j) с разными числами j корней уравнения (42.2) в области G. Назовём это разбиение D-разбиением. В нём нас ин- тересует только область устойчивости D(0). Но оказывается, для оты- скания области D(0) полезно рассматривать всё D-разбиение в целом. В этом и состоит новая идея исследования устойчивости. В её основе ле- жит модель, определяемая условием (42.4). А моделью устойчивости яв- ляется принадлежность точки области D(0). Описанная модель не пред- полагает характеристическое уравнение (42.2) полиномом по z. Это мо- жет быть любая функция, и область G может быть не только левой по- луплоскостью, а рассматриваемая система описываемой обыкновенными дифференциальными уравнениями. Её возможности значительно шире.
358 42. Математическая модель как плодотворная идея научного исследования. D-разбиение Теперь последовательно используем эту математическую модель ус- тойчивости для 1. Построения области устойчивости по комплексному параметру w; 2. Обнаружения, что область устойчивости для полинома z" + aiz п'1 + d2Z?‘2+...+ал по параметрам ар а2, ...» ап , односвязна и выпукла по каждому из них; 3. Обоснования и обобщения известного критерия Найквиста; 4. Построения области устойчивости по двум действительным пара- метрам для ультрацентрифуги; 5. Решения проблемы о мере робастной устойчивости. Этим перечислением не ограничиваются полезные использования описанной модели устойчивости [4]. Более того, понятие устойчивости может быть заменено другим с подобными общими свойствами. 1. Пусть ради простоты комплексный параметр w входит в характери- стическое уравнение линейно, так, что оно может быть записано в виде f(z)+Wg(z) = 0. (42.5) Граница области устойчивости D(0) входит в границу £)-разбиения, которую обозначим Nf0. Она является отображением границы области Rez<0, т.е. мнимой оси плоскости Z, для точек которой z = ico, -оо < со <оо, и, следовательно, на плоскости FT имеет место уравнение w = -w < со < °о, (42.6) g(ia>) причём при этом левая сторона мнимой оси отображается в левую же сторону кривой N(!), определяемой уравнением (42.6). Заштрихуем эту левую сторону, считая, что кривая N(l) пробегается в направлении воз- растания параметра со, тогда при переходе на комплексной плоскости W со штрихованной стороны кривой N на нештрихованную один корень уравнения (42.5) становится чисто мнимым и переходит с левой полу- плоскости Rezv<0 на правую. Кривая N(o разбивает плоскость W на какие-то области, среди которых могут быть и области устойчивости. Если известно число 5 корней слева от мнимой оси в какой-нибудь точ- ке w* то во всех точках области, к которой она принадлежит, число кор- ней 5 одно и то же. Более того, если из точки w* мы перемещаемся по кривой у в любую другую точку й7 *, то в ней число 5 уменьшается на число пересечений кривой Nm со стороны штриховки и увеличивает- ся на число пересечений её против штриховки. Области устойчивости, D(0), отвечает s = 0. Остальные области с s > 0 обозначим через D(s). С помощью этих обозначений сказанное иллюстрируется на рис.42.1, где стрелка на кривой Nfl) указывает направление её пробегания, согласно (42.4), при росте со, а пересекающая её стрелка — переход из одной об- ласти D(s) в другую, D(s+1). При этом 5 возрастает на единицу, при обратном переходе s убывает на единицу. Вывод, который следует из сказанного, состоит в том, что для отыскания области устойчивости D(0)
42. Математическая .модель как плодотворная идея научного исследования Р-разбиение 359 по комплексному параметру w достаточно построить кривую Nfl) и за- штриховать её левую сторону и ещё знать число корней справа от мни- мой оси .у уравнения (42.5) для какого-нибудь значения и> = и>* D(s+1) Рис.42.1. Иллюстрация к . М» правилу штриховки кривой 1-<**Г*П***^"^ Na D-разбиения D(s) 2. В качестве примера и использования сказанного в пункте 1 постро- им область устойчивости по параметру w для характеристического урав- нения вида: zn+aizn a2Zn'2+...+an—w zm = О, 0<m<n, (42.7) где aj, a2, ..., an - заданные действительные числа, для которых уравне- ние (42.7) при w = 0 имеет все корни слева от мнимой оси, т.е. точка w = 0 принадлежит области устойчивости D(0). Кривая Na имеет урав- нение и> =—-—(z +atzn + — + an)-i(0 =—~—(ico-Zj)-‘(ico-z ), (42.8) (ico)m 1 (ico)m 1 ” где zi, z2, .... zn - корни уравнения (42.7) при w = 0. Все они лежат слева от мнимой оси. Из (42.8) непосредственно видно, что при изменении со от -оо до оо arg w возрастает на величину лп, а I и’ | всё время отличен от нуля и при со = 0 обращается в бесконечность. Левая сторона, а, следова- тельно, и штриховка кривой N<o при этом всё время обращена в сторону точки w = 0, и всякий луч, выходящий из точки w = 0 , пересекает кри- вую Му только со стороны штриховки. Поэтому областью устойчивости по действительному параметру Re w или параметру ат + Re w является единственный отрезок, содержащий точку w = 0. Из этого следует, что область устойчивости D(0) по параметрам a]t а2, ...» ап в пространстве этих параметров выпукла по каждому из этих параметров, т.е. пересека- ется с любой прямой, параллельной любой из осей О as этого простран- ства по единственному отрезку, либо вообще с ней не пересекается. 3. Знаменитый критерий Найквиста утверждает, что если разомкнутое линейное звено с входом х и выходом у устойчиво, т.е. если с некоторого момента to х = 0 , то выход у—у 0 при t—y оо, то замкнутая система, получаемая из разомкнутой, когда выход у подаётся на вход х, т.е. когда х = у, тоже устойчива, если точка w = 1 комплексной плоскости W ле- жит вне кривой w = K(ico), (42.9) амплитудно-фазовой частотной характеристики разомкнутого звена. Этот критерий оказался весьма удобным и применимым во многих слу- чаях, но и несколько загадочным, поскольку не имел убедительного и полного обоснования. С позиций, изложенных выше, критерий Найкви- ста и его обобщения непосредственно следуют из рассмотрения области
3 42. Математическая модель как плодотворная идея научного исследования Р-разбиение устойчивости по комплексному параметру w для характеристического уравнения замкнутой системы, которое может быть записано в виде P(z)-wQ(z) = 0, (42.10) где P(z)nQ(z)~ некоторые, не имеющие общих нулей, целые функ- ции, определяемые тем, что K(z) = ^-- Q(O Уравнение (42.10) при w = 1 является характеристическим для замк- нутой системы, а при и> = со - для разомкнутой. Граница области устой- чивости Му для (42.10) определяется уравнением (42.9), а точка w = а? принадлежит области устойчивости, и поэтому, если точка w = 1 не от- делена от точки и- = оо кривой Му, то замкнутая система устойчива. Это и есть критерий Найквиста. Из приведённого краткого рассуждения не- посредственно следуют обобщения критерия Найквиста на случай, когда точка w = 1 не охватывается или охватывается кривой Му (42.9), но так, что, выходя из неё и двигаясь к точке w = сс>, числа пересечений этой кривой с разных сторон штриховки и нештриховки равны. Очевидно и обобщение на случай, когда разомкнутое звено имеет известное число степеней неустойчивости, т.е. известно число 5 корней справа от мни- мой оси у уравнения (42.10) при w = оо. 4. Ультрацентрифуга - это очень быстро вращающееся тело, которое не может быть жёстко закреплено, потому что малейший дисбаланс при- водит к громадным силам инерции. Закрепление должно быть мягким, самоцентрирующимся, но тогда оно не обеспечивает устойчивого вра- щения центрифуги. Эту устойчивость можно обеспечить введением спе- циальных демпфирующих возможные колебания устройств. Как твёрдое тело, центрифуга имеет 4 степени свободы, две поступательных и две вращательных, и также две степени свободы демпфера, т.е. диффе- ренциальные уравнения её движения 12 порядка. Такова же степень ха- рактеристического уравнения, от корней которого зависит устойчивость. Устранение неустойчивости надлежит реализовать за счёт подбора пара- метров демпфера. Их два -к и h. Двенадцатый порядок действительного характеристического уравнения в виду наличия круговой симметрии мо- жет быть уменьшен до шести, но при этом характеристический полином будет уже комплексным. Это комплексное характеристическое уравне- ние записывается в виде: %(z) = (k + v z + Е + hz)(P4(z) - iP3(zj) = 0, где Р3 и Р4- действительные полиномы степеней 3 и 4 соответственно. Граница области устойчивости D (0) на плоскости параметров к, h оп- ределяется, как и ранее, параметрическими уравнениями (к - со2 + е + i hco) (Р4 (z со) - iP3 (z со)) = 0, которые могут быть разрешены относительно к и h и записаны в виде: k = f(co), h = g(co), -со < со < со, (4211)
42. Математическая модель как плодотворная идея научного исследования. D-разбиение 361 позволяющем быстро с помощью ЭВМ построить кривую Му, нанести на ней штриховку и выделить область устойчивости D(0). Одна из возмож- ных картинок граничной кривой определяемой уравнениями (42.11), представлена на рис.42.2. Из неё следует, что область устойчивости D(0) ограничена двумя участками этой кривой N& верхний отвечает высоко- частотному нарушению устойчивости, а нижний - низкочастотному, со- ответственно большим и малым значениям частоты со. Из этого же рис.42.2 видно, что выбор и обеспечение нужных значений параметров довольно деликатен и без этой картинки едва ли возможен. Ведь каждый неудачный выбор - это авария и разрушение центрифуги. Рис.42.2. D-разбиение и область устойчивости ультрацентрифуги по параметрам kuh к 5. Переходим к последнему пункту: робастной устойчивости и мере робастной устойчивости. Проблемы робастной устойчивости некоторое время бурно обсуждались и изучались. Робастная устойчивость - это ко- гда устойчивость сохраняется при достаточно больших изменениях па- раметров. Как следует из предыдущего, эта проблема полностью решает- ся, если речь идёт об одном комплексном параметре или двух действи- тельных, когда построение области устойчивости D (0) не вызывает больших затруднений. Но совсем иначе обстоит дело, когда параметров много, и наглядно представить область устойчивости очень трудно, если вообще возможно. И в этой ситуации, естественно, возникает вопрос, ко- гда область простого вида лежит в области устойчивости. Простые об- ласти - это шар, эллипсоид, параллелепипед, .... И более того, как сде- лать эту область возможно большей. Эти вопросы привели к следующей общей математической задаче: найти максимальное р = р*, при котором все функции комплексного переменного z вида %( z) = axcpx(z) +... + ancpn(z), (42.12) где р = кх (ах - ах +... + кп (ап - ап *)т < р*, (42.13) имеют корни только в заданной области G комплексной плоскости Z. Здесь cpi(z), ..., cpn(z) - заданные функции z, а/*, ...» ап* - некоторые номинальные значения действительных параметров aj, .... ап, при кото-
362 Математическая модель как плодотворная идея научного исследования D-разбиение рых все корни функции (42.12) лежат в области G, klt kn - произ- вольные положительные числа и т>1. Заметим, что при т = 2 и т = оо неравенство (42.13) определяет простые области - эллипсоид и параллелепипед. Согласно принятой нами модели устойчивости, найти меру робастной устойчивости р* сравнительно просто: она равна минимуму величины р, определяемой (42.13), по всем параметрам alt ...» ап, лежащим на грани- це области устойчивости, т.е. удовлетворяющим при каком-нибудь со е Q условию X (z(co): aj, ..., ап)= О, где z (со) любая точка границы области G при подходящем со е £2. Не бу- дем решать этой задачи условной оптимизации, это не имеет отношения к основной теме книги. Отметим, что её решение возможно и не очень сложно [5-7]. Так, например, для полинома или квазиполинома, записан- ного в виде sh(TjZ) + aj2,^zsch(TjZ)\ когда область G - левая полуплоскость, и полинома вида X (О=s И' + и-+')+1 когда область G- единичный круг, . J N” + Ы" I л* = тт\ 7----г—г + 7------г—г >, “вО1(ф/Г/>»Г (фЛ/Я" J г 2 ™ ^Хк где Ф к~ векторы с компонентами (к .ср kj)r , у =-, срК = -—. J т-\ да ЛИТЕРАТУРА 1. Неймарк Ю.И. К задаче распределения корней полиномов И ДАН СССР. 1947. Т.58. №3. С.357-360. 2. Неймарк Ю.И. Структура D-разбиения пространства квазиполино- мов и диаграммы Вышнеградского и Найквиста. // ДАН СССР 1948. Т.60. №9. С. 1503-1506. 3. Неймарк Ю.И. Динамические системы и управляемые процессы. М.: Наука, 1978. 336с. 4. Неймарк Ю.И. Вопросы устойчивости в теории управления в рабо- тах научной школы А.А. Андронова // Вестник Нижегородского университета им. Н.И. Лобачевского. 2001. Вып.1(23). С. 168-197. 5. Неймарк Ю.И. Робастная устойчивость линейных систем. И ДАН СССР. 1991. Т.319, №3. С.578-580. 6. Неймарк Ю.И. Мера робастной устойчивости и модальности ли- нейных систем. И ДАН СССР. 1992. Т.325, №2. С.247-249. 7 Неймарк Ю.И. Область робастной устойчивости и робастность по нелинейным параметрам // ДАН СССР. 1992. Т.325, №3. С.438-440.
363 43 ИДЕАЛИЗАЦИЯ, МАТЕМАТИЧЕСКАЯ КОРРЕКТНОСТЬ И РЕАЛЬНОСТЬ Эта тема или проблема необычайно широка и многообразна. С ней сталкивается всякий, строящий и исследующий новую или частично но- вую модель, не имеющую испытанных аналогов или прототипов После- дующее ограничивается двумя конкретными примерами: центробежный фрикционный регулятор скорости вращения и известная проблема пара- докса Пэнлеве. Их объединяет то, что в обоих случаях речь идёт об идеа- лизации реальных упругих тел и податливых связей идеальными абсо- лютно твердыми и жёсткими 1. Фрикционный регулятор скорости вращения Рис.43.1 На рис.43 1 схематически изображен очень простой фрикционный ре- гулятор скорости вращения. По идее своего устройства он должен стаби- лизировать скорость вращения благодаря тому, что с её ростом возраста- ет сила трения об ограничительное кольцо, а при её убывании сила тре- ния уменьшается. Центробежная сила, прижимающая шарик к кольцу, равна (псо)2 г , и поэтому в весьма упрощенных предположениях
364 43. Идеализация, математическая корректность и реальность СО* = (43.2) (43.3) Jeb = М -к(псо)2Г'гп, (43.1) где введённые обозначения ясны из рисунка. Из (43.1) непосредственно находим, что скорость вращения имеет устойчивое равновесное значение ' М ' Jcr2n3} Из (43.2) следует, что дифференциальная неравномерность равно- весной скорости вращения со* по моменту М равна dco * _ 1 dM ~ 2со*кг2п3 и уменьшается с ростом коэффициента передачи шестерёнок п. Описан- ный регулятор, в частности, использовался при астрономических наблю- дениях для компенсации вращения Земли, и при этом величина момента М зависела ещё и от момента, необходимого для вращения астрономиче- ских приборов: рефракторов, рефлекторов и др. И как видно из (43.3), требуемая точность вращения могла быть обеспечена за счёт выбора дос- таточно большого п. Но при этом обнаружилось, что центробежный ре- гулятор может быть неустойчив и не выполняет своего назначения. Се- годня причину неустойчивости регулятора было бы естественно искать в падающей характеристике трения, т.е. в том, что коэффициент трения * dk _ „ зависит от скорости вращения, и что при скорости со = со* -< 0. Этот dco механизм неустойчивости рассматривался ранее. Конечно, так может Л dk быть, но неустойчивость, как оказалось, возможна и при —>0, и для dco того, чтобы понять её происхождение и устранить её, необходимо учесть реальную податливость кольца, изменение г с изменением давления ша- рика регулятора на ограничительное кольцо. Это удивительно и интуи- тивно не чувствуется: причём здесь податливость кольца, кажется, что можно считать его абсолютно жёстким. Но это не так, и выясняется только после учёта податливости. Учтём неабсолютную жёсткость ограничения, накладываемого коль- цом на движение шарика центробежного регулятора, зависимость мо- мента сухого трения от скорости и силу тяжести. В качестве обобщённых координат примем угол поворота пер вертикальной штанги центробежно- го регулятора и угол & отклонения шарика от нее. Функция Лагранжа без учёта сил трения, момента М(ер) и давления кольца на шарик, но с учё- том силы тяжести, записывается в виде: L = - \j„<p2 +J,(3 )п2ф2}+-В&2-V(9 ), 2 2 а дополнительные обобщённые силы равны = М(ф ) - к(n<p)N(&) I sin Я Q9 = -Z N(&), где N(9) - силы нормального давления кольца на шарик. Остальные обо- значения очевидны. (43.4)
43. Идеализация, математическая корректность и реальность 365 (43.6) Теперь непосредственно записываем нелинейные уравнения движения Лагранжа в виде: +n2J}($)](p + n2J} (&)& ф = М(ф)-к(пср )nl sin& N(9 ). ” 1 2 ' 2 , (43.5) В& (&)ф2 +V'($)=-IN(S). Из них интересующее нас равномерное вращение ф = со*, <9 = «9 * на- ходится из уравнений: М(со*) -к(п со*) п I sin i9 * N(В*) = 0, + V'(S* )=-lN(9*). Пусть его решение со*, <9* нам известно. Заметим, что из (43.6) можно найти дифференциальную неравномерность регулирования , * *2+Г" асо* _ 2 dm n3J,'co* kN'+(lN'—-n2 J"a>2 + V" )(к'Nn2lsin9*-M ) При N' -> оо она неограниченно убывает с ростом п. В этом нет ни- чего нового. Но исследование устойчивости равномерного вращения те- перь приводит к линеаризованным уравнениям (со = со* +<£, <9 = >9 * +т?): (Io +n2Jx)£ -М'% +Jx'n со*т] + к'(nco*)n2Nlsin&*^ = 0, Bij--JI"co*2 - Jtn26j*+1Ntj+ к"'т] = 0 и совершенно новым и неожиданным условиям устойчивости n2k'N'lsin9*-M'>0. ( 1 (-M'+nk'NsinS*) —^co^J/'+lN'+V I 2 (43.7) + n2co* JxnN'lsinS* > 0, (-M ,+n2k,Nlsin &*) n Jx '-I N'sin 3(I0 +n2J)k>0, из которых видно (последнее неравенство), что при 7V' -> оо неизбежно наступает неустойчивость. Таким образом, с одной стороны, учёт даже ничтожно малой упругости по углу i9 в ограничении кольцом приводит к неустойчивости, а с другой стороны,неравенства (43.7) показывают, что если искусственно ввести не очень большую жёсткость в контакте шари- ка с кольцом, то можно добиться устойчивости центробежного регулято- ра. Математическая некорректность модели (43.1) состоит в том, что сколь угодно малая податливость кольца ведёт к резкому качественному изменению поведения модели. Эта некорректность модели обнаружи- вается не столь непосредственно, как это имело место ранее, например, для модели Вольтерра «хищник - жертва». Теперь некорректность связа- на с неочевидным увеличением размерности модели, переходом от диф- ференциальных уравнений первого порядка к третьему. А в случае моде- ли «хищник - жертва» эта некорректность обнаруживалась в рамках ис-
366 43. Идеализация, математическая корректность и реальность ходной модели при малых изменениях правых частей дифферен- циальных уравнений второго порядка. Вместе с тем, то, что фактически происходит с фрикционным регулятором при его неустойчивости из-за слишком большой жёсткости контакта с ограничивающим кольцом, даёт некоторую подсказку, что же ещё следует учесть. А нарушение устой- чивости ведёт к прыганию шарика вдоль кольца, прыганию, при котором шарик от него отделяется, и это подсказывает, что нужно учесть ещё од- ну степень его свободы по углу «9, что и было сделано. 2. Парадокс Пэнлеве и автоколебания при кулоновском трении В самом конце XIX века французский механик П.Пэнлеве, читая па- рижским студентам учебный курс о трении и стремясь к общей теории, обнаружил, что для некоторых простых механических систем с трением уравнения движения, составляемые по общим правилам механики, не- разрешимы. Он опубликовал книгу о трении [1], где привёл и эти удиви- тельные примеры, что через десять лет вызвало бурную дискуссию с уча- стием выдающихся учёных того времени: Р.Мизеса, Л.Прандтля, Ф.Клейна, Г.Гамеля, Л.Лекорню и др. и, конечно, самого П.Пэнлеве. Об- наруженный П.Пэнлеве казус получил название парадокса Пэнлеве. Он и сегодня, спустя сто лет, не имеет решения, позволяющего с уверенно- стью сказать, как поведут себя очень простые механические системы с кулоновским трением. Невозможность точного предсказания вызвана тем, что в системах с парадоксом Пэнлеве обнаруживается существенная зависимость их поведения от весьма непривычных в таких задачах малых и трудно определяемых параметров и закономерностей. Последующее имеет целью ознакомление с существом парадокса Пэнлеве и обнаружение того, что он влечёт неожиданную и не известную ранее возможность возникновения неустойчивости и автоколебаний, не- смотря на то, что характеристика трения не имеет падающего участка. Возникающие колебания в естественном предельном описании являются разрывными или, по существующей математической терминологии, кон- трастными структурами со скачками и всплесками, которые с физиче- ской точки зрения можно назвать «внутренними» ударами. Разрывные колебания в виде периодических контрастных структур возникают пото- му, что математическая модель систем с парадоксом Пэнлеве является сингулярно возмущённой системой дифференциальных уравнений. На рис.43.2 приведены некоторые известные примеры механических систем с парадоксом Пэнлеве: система Пэнлеве-Клейна о движении стержня между параллельными направляющими L1M.L2, из которых одна (£/) гладкая, а другая (£2) шероховатая, под действием постоянной силы Fq- пример а); тормозная колодка, прижимаемая с силой Fo к колесу, вращаемому моментом М - пример б); круг (цилиндр), вращаемый мо- ментом М и вжимаемый в угол силой Fo, одна из сторон которого шеро- ховатая, а другая гладкая - пример в). Уравнения движения во всех трёх случаях приводятся к одному и тому же виду:
43. Идеализация, .математическая корректность и реальность 367 V = l-F, F = 1^ Л7#и и, /2V-/l + F = 0, (431) где и - линейная либо угловая скорость, F nN - силы трения и нормаль- ного давления, / и Л - параметры (/>0, - 7 < Л < 7) [2]. Рис. 43.2 Как динамическая система, уравнения (43.1) содержат одну фазовую переменную и. При заданном начальном условии и = ио для получения их решения u(t), F(t), N(t) необходимо из двух последних уравнений (43.1) найти F. Но именно это при % < 1 невозможно: решения может не быть или их оказывается два. Именно, в случае % < 1 уравнения F = \N\signu, %N-X+F=0 (43.2) при sign и = sign Л имеют два решения, а в противном случае его нет. Это непосредственно видно, если на плоскости переменных 7V и F, рис.43.2, нанести графики функций, отвечающие уравнениям (43.2).
368 43. Идеализация, математическая корректность и реальность Здесь ломаные линии 1 и 1' отвечают первому из уравнений (43.2) со- ответственно при и> 0 и и< 0, а прямая 2 соответствует второму урав- нению в (43.2) и предполагает 0< % <1, Л> 0. Согласно рис.43.3, в этом случае при и > 0 решений 2, а при и < 0 их нет. При о<%<1 и Л <0 си- туация аналогичная. В этой невозможности найти нужное единственное решение системы (43.2) и состоит парадокс Пэнлеве. Он указывает на то, что классическое описание (43.1) при О < / < 1 дефектно. Уже на упомянутой дискуссии было высказано мнение, что необходи- мо учесть реальную упругость твёрдых тел. Различные способы такого учёта применительно к задачам Пэнлеве-Клейна (рис.43.2а) делались во многих работах, они действительно избавляли от парадокса, но приводи- ли к разным результатам. В каком-то смысле они делались вслепую, без понимания истинной причины парадокса Пэнлеве, хотя тот или иной способ учёта упругости приводил к устранению парадокса Пэнлеве. А причина была, и её выяснение требовало нового понимания силового взаимодействия в случае сухого трения, более полной трактовки закона Ньютона о действии и противодействии, требовало обнаружения направ- ленности действия. Понимания, что в законе Кулона нормальная сила 7V, вызывающая силу трения F, имеет направленный характер от N к F и реализуется не за счёт силы N, а некоторого стороннего источника энер- гии. Понимание этого давало новую трактовку соотношениям (43.2) как замкнутого цикла направленных воздействий от N к F (первое соотноше- ние в 43.2) и от F к N (второе соотношение в 43.2). Этот направленный цикл взаимодействий изображён на рис.43.4. При X < 1 он влечёт парадокс Пэнлеве, потому что в этом цикле взаи- модействия мгновенны и его коэффициент усиления, равный 1 /X, при X < 1 больше единицы. В реальной же системе парадоксальности нет при всех X > 0, потому что связи от N к F и от F к N не мгновенные в силу фактической вязкоупругой податливости твёрдых тел и связей между ни- ми. Отметим, что этот же замкнутый цикл, вызывающий парадокс Пэнле- ве, используется в технике в так называемых системах самоторможения, когда тормозят не дополнительными силовыми воздействиями, а за счет направленных связей этого цикла: сила трения вызывает нормальное дав- ление, оно увеличивает силу трения, в результате — быстрое само по себе возникающее торможение и остановка. Торможение мгновенное, мгно- венное, подобно удару, если тормозится конструкция абсолютно жесткая.
43. Идеализация математическая корректность и реальность 369 Рис.43.4. Цикл мгновенных направленных связей в сис- теме с парадоксом Пэнлеве a) F— /N /sign и b)N=Z-‘(A-F) Такое понимание парадокса Пэнлеве позволяет предложить простей- ший способ учёта вязкоупругих инерционных податливостей реальных твёрдых тел и связей между ними в виде временных релаксационных за- держек, записав уравнения (43.1) в виде: u-l-F, Tj F + F = |2V|.szgnL>, t2 N + N = 1 (F), (43.3) где t} > 0 и t2 > 0 - малые временные задержки. Введение этих задержек и запись сингулярных уравнений (43.1) в виде сингулярно возмущённых дифференциальных уравнений (43.3) устра- няет парадокс Пэнлеве, но теперь вместо системы (43.1) первого порядка появляется система третьего порядка, и её изучение далеко не просто. Можно исследование упростить, предполагая ту и Т2 стремящимися к ну- лю, поскольку они на самом деле малы, но при этом, как оказывается, результат зависит от соотношения Т] / Г2, и, если его не фиксировать, то вообще никакого предельного поведения у системы (43.3) нет. Конечно, модель (43 3) не точна, она феноменологическая, и реальный характер задержек в некоторых случаях может быть сложнее, но всё же это пусть и грубое, но уточнение парадоксальных уравнений (43.1), и оно по меньшей мере позволяет понять, что же может происходить в сис- теме с парадоксом Пэнлеве. Отметим, что некоторые модельные способы учёта вязкоупругих свойств твёрдых тел приводят к похожим уравнени- ям и результатам. Но перед этими конкретными способами уточнения уравнений (43.1) у уравнений (43.3) есть определённое преимущество: уравнения (43.3) более общие и содержат два существенных малых па- раметра, Т] и Т2, а модельные конструкции учитывают только один из них. Это, в частности, объясняет, почему конкретные уточнения приво- дят к разным результатам. Перейдём к исследованию сингулярно возмущённых уравнений (43.3), точнее, к некоторым фрагментам этого исследования, позволяющим со- ставить представление о возможных порождаемых ими движениях и яв- лениях. Начнём с рассмотрения крайних частных случаев уравнений (43.3): Т] = 0 и Т2 = 0. При этом порядок уравнений (43.3) уменьшится. Исключая переменную F, запишем их для возможности сравнения в од- них и тех же фазовых переменных V и N : tN = -N [/+ sign(vN)\+х~‘Л (
370 43. Идеализация, математическая корректность и реальность и соответственно v = l-|7V|^™, (435) г ?/=-ЛЦ1 + / SZgw(L>^J+/ При т -> 0 обе модели (43.4) и (43.5) переходят в парадоксальную мо- дель (43.1), отвечающую абсолютной жёсткости твёрдых тел. Обе они не только содержат одни и те же фазовые переменные и и 7V, но и зависят от одних и тех же двух параметров X и Л и, как оказывается, испытывают бифуркации на одних и тех же линиях, и в силу этого имеют одинаковые разбиения плоскости параметров на области с различными фазовыми портретами, которые не всегда одинаковые. Плоскость параметров раз- бивается на шесть областей: А, В, С, D, Е и G (рис. 43.5). Первые три со- ответствуют парадоксальности (X < 1), остальные не парадоксальны. Так, в области А фазовые портреты для моделей (43.4) и (43.5) показаны на рис. 43.6 и 43.7. В обоих случаях финальным является равноускоренный разгон Г+. В первом случае при т —> 0 финальному движению могут предшествовать один или два удара, сопровождающиеся неограниченным значением си- лы N и конечным скачком скорости v. При этом коэффициент скачка скорости v равен /1 = ( %-1)( % +1)1. Во втором случае возможны мгновенные остановки, т.е. удары с коэффициентом /1 = 0. Наглядные представления об ударах можно получить, изобразив соответствующие рис. 43.6 и 43.7 предельные фазовые портреты при г —> 0 (рис. 43.6а и 43.7а). На рис. 43.6а точка М мгновенно переходит в точку М'в М'\..., и, наконец, в М, после чего наступает равноускоренный разгон. На рис. 43.7а аналогично точка М переходит в М', М' в М, а точка К пе- реходит в К', К'в К = М .Из послеударной точки М =К начинается равноускоренный разгон с нулевой начальной скорости.
43. Идеализация, математическая корректность и реальность 371 В области В фазовые портреты для моделей (43.4) и (43.5) изображе- ны соответственно на рис. 43.8 и 43.9. На каждом из них по два установившихся предельных движения: ус- тойчивое состояние равновесия О и равноускоренный разгон Г+. Между устойчивыми состояниями равновесия О есть существенное различие: в первом случае область притяжения (рис. 43.8) при г -» 0 неограниченно уменьшается и исчезает, во втором (рис. 43.9.) - сохраняется (она за- штрихована). Как и ранее, при г —> 0 возможны удары с указанными ра- нее величинами коэффициента скачка скорости v и бесконечным значе- нием N. Удары и предельные движения в виде устойчивого равновесия возможны и в парадоксальной области С. В непарадоксальных областях
372 43 Идеализация, .математическая корректность и реальность D, Е и G ударов при г —> 0 не возникает, и предельные установившиеся движения одинаковые и единственные Подчеркнём, что в парадоксаль- ном случае В имела место неединственность предельного движения, и оно могло быть разным при г —> 0 в разных моделях (43.4) и (43 5) Рис. 43.8 Рис. 43.9 Таковы особенности поведения упрощённых моделей систем с пара- доксом Пэнлеве Уточнение модели с учётом обоих временных задержек позволяет обнаружить значительно большее разнообразие возможных движений и неожиданную возможность автоколебаний, которые при г —> 0 могут принимать вид так называемых контрастных структур, или неограниченно увеличивать свою частоту при сохранении конечности амплитуд колебаний сил N и F Не вдаваясь в детали довольно сложного и в значительной степени численного компьютерного исследования, кратко опишем основные факты, причём сделаем это для модели (43.3) с учётом ещё и вязкого трения, т е для модели вида: V = I-F, т, F + F = \N\sgnV+hV, т2 N + N = (Я-F). (43 6) Хорошо известно, что сухое трение в механических системах может приводить к неустойчивости и автоколебаниям, но для этого нужно, что- бы характеристика трения имела падающий участок. Как оказывается, последнее не обязательно, когда механическая система с сухим трением парадоксальна по Пэнлеве. В парадоксальной системе неустойчивость и автоколебания возможны из-за наличия в ней цикла направленных воз- действий с подкачкой энергии, и эту его роль не только не может нару- шить добавок вязкого трения, но в некотором смысле ее усиливает В изложении нового факта состоит цель дальнейшего. При малых, но конечных задержках г/ и г? обнаруживается неустойчивость и рождение автоколебаний в соответствии с бифуркацией Андронова При г/ и тз, стремящихся к нулю, автоколебания принимают вид контрастных струк-
43 Идеализация, математическая корректность и реальность 373 тур, т.е. сопровождаются разрывными скачками скорости V («внутрен- ние» удары), при которых силыFhNобращаются в бесконечность. Равновесия системы (43.6) определяются уравнениями: A-F = 0, %N-A + F = 0, F = \N signV + hV. (43.7) Из них следует, учитывая, что А < 1, что равновесие имеется только при h> О, / > 7 - Я , К > 0, и для него F* = l, = (43 8) Согласно (43.6), характеристическое уравнение имеет вид Ttz2z3 +(т, + t2)z2 + (1 + сг % +hT2)z + h = 0, где сг = signN* <0, и единственное условие устойчивости состоит в вы- полнении неравенства (т, + т,)( 1 + сг х~‘ +h?2)-T,T2h > О, которое при исчезающих малых положительных Г/ и тз сводится к един- ственному требованию X > 7. Таким образом, единственное равновесие (43.8) существует при X > 1 - Я, оно устойчиво при X > 7, неустойчиво при X < 7 и теряет устойчивость через фокус. Компьютерное исследование показывает, что при потере устойчиво- сти рождается устойчивое периодическое движение, возникают автоко- лебания. При уменьшении и тз этот предельный цикл вытягивается, частично удаляясь в бесконечность, и приобретает вид контрастной структуры со скачками или всплесками, рис. 43.10а, 43.106. Описанное происходит в области параметров 7 > j > 7 - Я, А>0, h>0. В другой области параметров, / < 7 - Я, Л> 0, h> 0, при Г/ и тз, стремящихся к нулю, также возникают автоколебания в виде периодиче- ских контрастных структур, рис. 43.10в. Механизм их возникновения от- личен от приведённого выше и состоит в наличии в рассматриваемой сингулярно возмущённой системе (43.6) такой структуры фазового про- странства, при которой 1) существуют по крайней мере два многообразия медленных движе- ний, из которых только одно устойчиво; 2) существует область начальных значений, при которых возможен уход фазовой траектории в бесконечность при т, 0, т2 ->0 ; 3) существует особенность структуры, которая обеспечивает воз- врат фазовых траекторий из бесконечности; 4) существует механизм срыва фазовой точки с устойчивого многооб- разия. В более простом случае, т2 =0, когда система (43 6) становится дву- мерной, типичный пример возникновения автоколебаний типа контраст- ных структур в результате выполнения условии 1-4 приведён на рис. 43.11. Здесь Г и Г - устойчивое и неустойчивое многообразия мед- ленных движений, определяемые вырожденными, т, =т2 =0, уравне-
374 43. Идеализация, математическая корректность и реальность ниями (43.6) при % <1-2, Л> 0, h> О, КС - периодическое движение типа контрастной структуры со всплесками при т; -> 0 . При h = 0 периодических контрастных структур при стремлении г/ и к нулю не возникает, но при конечных т/ и Т2 име- ются автоколебания, которые при г/ и ?2, стремящихся к нулю, неограниченно уве- личивают свою частоту. При этом ампли- туда колебаний скорости и стремится к нулю, а амплитуды колебаний сил F и N остаются конечными. Итак, сухое кулоновское трение само по себе или в сочетании с вязким трением (h > 0) при наличии парадокса Пэнлеве может вызвать автоколебания, которые в случае h > 0 при увеличении жёсткости входящих в систему твёрдых тел и связей между ними переходят в раз- нообразные периодические контрастные структуры - разрывные перио- дические автоколебания. Их наличие обусловлено замкнутым циклом
43. Идеализация, математическая корректность и реальность 375 направленных связей со сторонним источником энергии и подобно тому, что имеет место в релейных системах автоматического регулирования с реле, имеющим такую же характеристику, как кулоновское трение. Под- черкнём, что средняя скорость автоколебаний всегда положительна, и внешняя сила Fc и момент М совершают на каждом периоде определён- ную работу. Специфика этих автоколебаний в том, что они могут быть близки к разрывным колебаниям и иметь вид разнообразных контраст- ных структур со скачками и всплесками. Особенность систем с парадок- сом Пэнлеве ещё и в том, что их поведение существенно зависит от ма- лых параметров и соотношений между ними. В рассматриваемых моде- лях (43.3) и (43.6) малые параметры - это Г/ и rj, а соотношение между ними - это отношение Г/ / Т2 [3]. ЛИТЕРАТУРА 1. Пэнлеве П. Лекции о механике. М.: Гостехиздат. 1954. 2. Неймарк Ю.И., Смирнова В.Н. Идеализация, математическое мо- делирование и парадокс Пэнлеве. // Вестник Нижегородского госу- дарственного университета. Сер. Математическое моделирование и оптимальное управление. 1999. Вып.2. С.53-66. 3. Неймарк Ю.И., Смирнова В.Н. К столетию проблемы парадокса Пэнлеве // Там же. 2001. Вып.2. С.7-33. 4. Неймарк Ю.И., Смирнова В.Н. Идеализация, сингулярность и па- радокс Пэнлеве // Доклады РАН. 2002. Т. 386. № 6. С. 742-745.
376 44 ДИНАМИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ И ГЛОБАЛЬНОЙ ПОИСКОВОЙ ОПТИМИЗАЦИИ С АДАПТИВНОЙ МОДЕЛЬЮ Основой для описания эволюционных процессов и явлений в природе и технике, построения их математических моделей и исследования явля- ется динамическая система. Все модели этой книги - динамические сис- темы. Последующее имеет целью обратить внимание на возможность, есте- ственность и целесообразность динамической трактовки некоторых вы- числительных, поисковых и алгоритмических процедур на примерах из- вестного и широко используемого метода наименьших квадратов и гло- бальной поисковой оптимизации с адаптивной стохастической моделью оптимизируемой функции. Первый пример демонстрирует возрастание возможностей и эффективности приложений МНК в результате его ди- намического представления, второй - широту понятия и возможностей описания в виде динамической системы. 1. Универсальная рекуррентная форма метода наименьших квад- ратов Метод наименьших квадратов (МНК) - это метод оценивания неиз- вестных параметров теоретических моделей по косвенным измерениям Авторами его считаются К.Гаусс и А.Лежандр Классический «метод уравнивания Гаусса» был установлен в 1795г. и успешно использован Гауссом в 1801г. для определения траектории астероида Церера. Но пер- вое изложение элементов метода и само название «метод наименьших квадратов» даны в 1806г. Лежандром в работе, посвященной вычисле- нию орбит комет. Однако, вероятностное обоснование метода в 1809- 1810гг. и глубокая разработка вычислительных проблем принадлежат Гауссу. Дальнейшее развитие этот метод получил в работах многих из- вестных математиков: Лапласа, Чебышева, Неймана, Рао и др. Особенно большой вклад внесли А.А.Марков и АН.Колмогоров, которым принад- лежат строгое обоснование и установление границ содержательной при- менимости МНК Главные достоинства решения задачи оценивания с использованием МНК связаны с ее априорной разрешимостью и такими замечательными свойствами получаемых оценок, как несмещенность, эффективность и состоятельность. Благодаря этому МНК является одним из наиболее ши- роко известных и многообразно используемых математических методов
4 4. Динамическая интерпретация метода наименьших квадратов и глобальной поисковой оптимизации с адаптивной моделью 377 обработки наблюдений и экспериментальных данных. Он позволяет на основе приемлемых гипотез и математических моделей определять неиз- вестные параметры и закономерности не только в задачах прямой обра- ботки данных, но и в задачах фильтрации, идентификации, распознава- ния образов, сжатия описания (кодирования), автокорреляционного ана- лиза и др. Но существуют две трудности применения классического МНК. Первая связана с обращением матрицы, подчас большой размерно- сти, без уверенности в ее корректности. Вторая трудность вызвана тем, что задача анализа данных, осуществляющая преобразование от «исход- ных данных» к «результату», обычно требует многочисленных и много- кратных изменении в выборке данных и в принимаемых гипотезах в от- ношении изучаемых процессов и явлений МНК в своей классической форме при любых изменениях используемых данных, принимаемых мо- делей и гипотез требует полного повторения всех вычислений Именно поэтому уже в 1821г. Гаусс предложил рекуррентный вариант процеду- ры, позволяющий корректировать ранее вычисленную оценку с учетом вновь поступивших дополнительных измерений без необходимости по- вторять все предшествующие вычисления, для случая, когда наблюдение представляется скаляром В 1950г Плакетт обобщил эту идею на случай векторной величины Рекуррентная форма МНК получила очень широкое распространение, особенно в теории идентификации, адаптивного управ- ления и современной теории фильтрации. Дальнейшее расширение ре- куррентной формы МНК для случая поиска единственного решения с минимальной нормой путем псевдообращения матрицы данных осуще- ствлено в работах А Алберта Универсальная рекуррентная форма МНК предложена в работе [1]. В ней МНК рекуррентен не только в отношении добавляемых и устраняемых данных, но и используемых моделей базис- ных функций, отыскиваемых параметров и линейных ограничений на них. В основе МНК лежит минимизация квадратичного функционала N / т > J(a,,a2..."J = X| ^а,д>,(к‘)-bl j=l X. i=l J (44.1) при линейных ограничениях п/ 4 = ~^=° (k = J-2......4 (44 2) 1=1 по искомым значениям параметров ф, aj, .... ат, Здесь в (44.1) х1, Ьд х2, Ъ2; Z, Ьм, Ьм - используемые данные. Гипотеза, положенная в осно- ву применения МНК, состоит в том, что при искомых значениях пара- метров aIf ci2, ат и лишенных погрешностей используемых данных имеют место зависимости, зануляющие функционал J и обращающие все Lk в нуль. Эти предположения, которые могут быть точными или прини- маемыми приближениями, определяются выбранными базисными функ- циями (pi(x), (р2(х),. .. <рт(х) и линейными ограничениями (44 2) и вместе
4 4. Динамическая интерпретация метода наименьших квадратов и глобальной поисковой оптимизации с адаптивной моделью 378 составляют модель, положенную в основу конкретного применения МНК. Методами линейной алгебры и оптимизации (метод множителей Ла- гранжа для условной оптимизации) можно найти в виде явных формул значения параметров, минимизирующие функционал (44.1) при условиях (44.2). Это МНК в своей исходной классической нерекуррентной форме. О трудностях и неудобствах такого прямого его использования сказано выше. Преобразование, определяемое МНК, от входных данных и управ- ляющих команд исследователя к выходным результатам можно предста- вить схематически, как показано на рис.44.1. Прямоугольник символизи- рует вычислительную процедуру МНК, А, В и С - входы для данных, не- обходимых для вычислений (А - исходные данные, В - базисные функ- ции, С - линейные ограничения), D - выход, дающий значения искомых параметров и достигнутое значение минимизируемого функционала J. Классическая форма МНК, как она описана выше, предполагает, что сна- чала поступают все входные данные, а затем выполняются вычисления и выдаются требуемые выходные данные. А мнк D С В Рис. 44.1. Представление универсального МНК в виде преобразователя с входом и выходом Универсальная рекуррентная форма МНК состоит в том, что все время на входы А, В и С могут подаваться извне новые данные или исключать- ся старые и в соответствии с ними выход D выдает соответствующие им значения искомых параметров, и происходит это не путем многократного повторения вычислительной процедуры МНК, а рекуррентно на основе вводимого состояния 6 в виде совокупности пяти матриц, в частности, содержащих значения параметров as и функционала J При этом [1] ок*‘ = Т(ик*') ек, ак*' =feM . (44.3) Здесь в (44.3) вк и - состояния на Л-ом и следующем А+/-ом так- тах вычислений, akt - вектор искомых значений параметров на к+1 ша- Л+ / v re, и - вектор входа используемых данных и управляющих воздеист- Л+1 вий исследователя, поступающих после к-ro шага. Вектор и пред- ставляет собой одно из следующих шести, объединенных попарно, трех перечисляемых ниже возможных входных воздействий:
4 4. Динамическая интерпретация метода наименьших квадратов и глобальной поисковой оптимизации с адаптивной моделью 379 1. Введение новых входных V, bj данных или исключение старых; 2. Введение новой функции (pt (х) или исключение какой-то преж- ней с соответствующим введением нового параметра а{ или ис- ключением прежнего; 3. Добавление нового линейного ограничения или исключение старого. Реализация оператора управляемой динамической системы (44.3) не требует обращения матриц, а только их сложения и умножения. Вместе с тем описание этого оператора Т(и) достаточно громоздко и поэтому не приводится. Описанная универсальная рекуррентная форма и ее представление в виде управляемой динамической системы придает МНК новые более широкие возможности практического использования и необходимую адаптивность к решаемой задаче. В частности, не требуется обращения матриц, обходится проблема плохой обусловленности информационной матрицы, легко исключается ошибка начального приближения, неизбеж- ная при прежней частичной рекуррентности, значительно эффективнее поиск подходящей модели, устранение ошибочных или случайно сильно уклоняющихся данных. Появляется возможность построения приспособ- ленного базиса и сжатия описания и кодирования, текущей обработки потоковых данных и др. 2. Поисковая глобальная оптимизация с адаптивной моделью [2]. Алгоритм поисковой глобальной оптимизации, минимизации функции Q(x) на множестве X определяется правилами назначения следующей точки: х " =f(x', Q' X"-',Q (Q ‘ = Q(x ‘)) (44.4) и остановки поиска g(x', хп, Qn) > 0. (44.5) После остановки в качестве «минимума» функции Q(x) на X прини- мается значение Qrnm = min [Q', ,Q"J = Qs, (44.6) которое принимается в точке хтп = Xs. При этом функция Q(x) предпола- гается заданной в том смысле, что для любого х е X может быть найдено значение Q(x). Выбор, следующей после х , х2, хп точки хп +/, может опираться на самые разнообразные соображения. Ниже будем исходить из наибольшей вероятности того, чтобы в новой выбранной точке хп+1 вероятность неравенства Qmin Q(x)>T] >0 (44.7) была максимальна. Для возможности такого выбора принимается стохас- тическая модель функции Q (х), которая строится по уже известным зна- чениям функции Q (х) в точках х1, х2, ...» хп. Согласно этой модели, веро- ятность того, что Q (х) < Q равна
4 4. Динамическая интерпретация метода наименьших квадратов и глобальной поисковой оптимизации с адаптивной моделью 380 рш < в/*' (44.8) ч j В ней функции (р(Е), Cs(x) и ys(x) выбираются из доступных общих представлений о функции Q(x). В соответствии с ними (p(Q- неубы- вающая функция £ меняющаяся от 0 до 1 при изменении £ от -оо до -ню, Cs(x) - функции х такие, что Cs(x) —>0 при возрастании расстояния ps точки х от точки Xs и Cs (xk) = 8Sk (символ Кронекера), ys(x) - возрастаю- щие функции расстояния pSi например, Ds ps, , где Ds - коэффициент, оценивающий скорость изменения функции от точки х к точке Xs. В каче- стве конкретных видов функций (р (%) и Cs(x) можно, например принять <?(£) = — е* при ^<0, 2 1~е~* при £>0. (44.9) Подчеркнём, что стохастическая модель (44.8) функции Q (х) вобрала в себя не только априорные представления о функции Q (х), но и сведе- ния, полученные о ней после п шагов поиска. С каждым следующим ша- гом поиска эта модель уточняется. Именно поэтому она названа адаптив- ной стохастической моделью оптимизируемой функции. Следующая точка, хл+/, находится как точка максимума вероятности неравенства (44.7), определяемой как максимум (44.8) при Q = £)т].п - rj. Поэтому описанный метод оптимизации имеет практический смысл лишь, если задача максимизации функции (44.8) много проще такой же задачи мак- симизации функции Q(x), что может иметь место при значительных трудностях или больших необходимых затратах для вычисления функ- ции Q (х), когда эти вычисления требуется по возможности сократить. Определение следующей точки поиска на каждом шаге требует зада- ния величины Т] >0 в неравенстве (44.7). Эту величину т] можно рассмат- ривать как управляющий параметр поиска. Интуитивно ясно, что в нача- ле поиска надлежит стремиться к возможно более быстрому уточнению модели и лишь после этого отыскивать минимум, что в процессе поиска их следует целесообразно сочетать. В начале поиска можно надеяться на значительное уменьшение значений Q, в дальнейшем они менее вероят- ны. Из этого следует, что вначале следует выбирать большие значения Г], а затем их уменьшать. Как можно предполагать, при больших т/, и это подтверждает эксперимент, происходит уточнение модели, а при малых т] небольшие уменьшения минимума. Но всё это не более, чем общие эв- ристические соображения, подкрепляемые экспериментами. Более обос- нованный выбор ту на каждом шаге можно сделать, если располагать при- мерным графиком зависимости Р (Q (х) < Qmin - rj) от числа г}. Эта вероятность не возрастает с т], а вообще убывает с ту, и это убывание может быть медленным или быстрым. При медленном
44 . Динамическая интерпретация метода наименьших квадратов _________и глобальной поисковой оптимизации с адаптивной моделью_ 381 убывании естественно увеличивать 7] до разумного предела, при очень быстром убывании его следует выбирать меньшим, предпочитая малый, но достижимый результат, несколько большему, но весьма мало вероят- ному. Мне представляется, что здесь мы сталкиваемся именно с тем слу- чаем, когда природная интуиция человека и его опыт играют решающую роль, и едва ли попытки уточнения теории, во всяком случае в рамках принятой модели и метода поиска, могут быть реально полезны. Но мы уклонились от основной темы, и нам надлежит описанный процесс поис- ка минимума привести к управляемой динамической системе, т.е. надле- жит определить понятие состояния, пространства состояний и указать оператор изменения состояния, который будет зависеть от управляющей переменной ту. Определение следующей точки поиска, x”+I, требует зна- ния всей предшествующей последовательности значений xJ, Q /; х2, Q2; х", Qn и отыскания максимума по х функции (44.8) при за- данном Q = 2min _ 'П • Напомним, что х,ши - это значение х$, при котором Qs - максимум из всех известных значений Q1, Q2, .... Q п. Из сказанно- го следует, что в качестве состояния следует принять всю последова- тельность значений x},Q!; хп, Qn. Пространство состояний - это множество всевозможных таких последовательностей для всех п > 1 с х1 е X и Q1 = Q (х’), а. оператор определяется тем, что х n+I есть макси- мум функции (44.8) при Q = Qmin -т], где т]> 0 - задаваемая на каждом шаге управляющая переменная. ЛИТЕРАТУРА 1. Электронный журнал «Исследовано в России», 59, 641-650, 2002, hup // hurnal ape relarn.ru / articles / 2002 / u59.pdf. 2. Неймарк Ю.И. Динамические системы и управляемые процессы. М.: Наука, 1978. 336с.
382 45 ИГРОВАЯ МОДЕЛЬ ЧЕЛОВЕЧЕСКОГО ОБЩЕСТВА 1. Введение. Математические модели, которые рассматривались до сих пор, - это подчас весьма упрощённые, но модели существующих или заведомо осуществимых объектов и процессов. Когда речь шла о моде- лировании, предполагалось, что это моделирование реальных объектов, но математические модели могут относиться и к несуществующим объ- ектам, воображаемым, гипотетическим и даже фантастическим. В одних случаях осуществимость их не вызывает сомнения, в других - это не так. Моделируя полёт на Луну, можно понять, реализуем ли он и что для это- го требуется. Но могут быть модели, для которых реализация весьма проблематична, даже если в принципе и возможна. Такая ситуация имеет место при моделировании будущего устройства общества людей или возможных в будущем попыток моделирования новых генетических кон- струкций живых организмов и человека. Такое, назовём его фантастиче- ским, моделирование тоже имеет право на жизнь и, более того, интерес- но и может быть полезным. Эти вводные слова написаны в предварение завершающей книгу фан- тастической игровой модели человеческого общества. Пожалуй, это не только фантастическая модель, но и непривычная, поскольку по необхо- димости её построение опирается не на точные знания и точные науки, а на общие гуманитарные и естествознанческие соображения и доводы, но следующие из них выводы неожиданны и интересны и согласуются с не- которыми определяющими тенденциями, наблюдаемыми в современном обществе. Даже при математическом изучении общества гуманитарные соображения неизбежны, и роль математики состоит не в том, чтобы их обойти, что невозможно, а лишь в том, чтобы помочь сделать их более чёткими и чётко разделить, что принимается от того, что из этого следу- ет, и вывести то, что нужно и интересно. Дальнейшее представляет собой попытку постижения организации и функционирования современного общества, тенденций и перспектив его эволюции и развития с позиций точной науки: математического модели- рования, теории управления и теории колебаний; математического моде- лирования, потому что мы хотим построить математическую модель и на ней основывать дальнейшие выводы. Общество и его деятельность пред- ставляются очень сложными, и в понимании их мы довольствуемся раз-
45. Игровая модель человеческого общества 383 личными мнениями. И кажется, что точная наука здесь ничем помочь не может, а уж математика и подавно. Но это не так. Не так в силу феноме- на простых математических моделей, которые описывают изучаемый объект в целом, отражая лишь некоторые, нас интересующие, важнейшие его особенности и стороны. Теории управления потому, что функционирование общества основа- но на целесообразной синхронизации действий отдельных людей, созда- ваемой и поддерживаемой не без использования управления. Теории колебаний потому, что она всеобъемлющая наука об эволюци- онных процессах, а функционирование общества - это эволюционный процесс. Общество и составляющие его люди в своих организации и функцио- нировании похожи на живой организм, состоящий из клеток. Сообщест- во клеток обеспечивает жизнь всего организма, а жизнедеятельность кле- ток обеспечивается гомеостазом среды обитания клеток в организме. Не- что аналогичное имеет место и в человеческом обществе. Для его жизни необходимо обеспечить соответствующую среду, назовём её базовым уровнем общества. По мере совершенствования многоклеточного живого организма, как необходимое условие жизни, помимо гомеостаза среды, возникли ещё гуморальные и нервные управления. В современном обще- стве они имеют аналог в организации жизни и действий людей, осущест- вляемые государством и общественными организациями. В живом орга- низме всё происходит как бы само собой, в силу законов природы, её тенденций самоорганизации, ещё недостаточно понятых нами. В челове- ческом обществе, в отличие от дикой природы, многое организуется на сознательном уровне при целенаправленном вмешательстве людей в свою жизнь. Отмеченная аналогия между живым организмом и челове- ческим обществом очевидна, но столь же, если не более, разительны от- личия. Общество по отношению к живому организму находится на сле- дующем уровне эволюции жизни, когда клетка становится мыслящей и приобретает возможность прямого воздействия на его организацию и деятельность. Такого результативного, прямого и быстрого воздействия у клеток на организм нет. Это существенное различие влечёт гигантские ускорения эволюции жизни, совершенствования и развития общества людей по сравнению с живым организмом клеток. Над тем, как функционирует человеческое общество, начали думать давно, но только сейчас, как мне представляется, появилась необходимая научная база, и проблема назрела. До каких-то пор смена и формирова- ние общественных, социальных и экономических структур общества происходили в основном подобно развитию всего живого на Земле - эво- люционно биологически, не без проб, ошибок, тупиков и отбора. Вместе с тем. на этот процесс оказывали влияние традиции, верования, общие представления и естественно-научные взгляды. В изучении общества с времён древней Греции наметились два подхода. Их можно обозначить «от человека» и «от государства». Восторжествовал государственный подход как в описании исторических событий, так и текущей жизни об-
384 45. Игровая модель человеческого общества щества. В основе всего происходящего и судеб общества ставились госу- дарство и власть, их интересы и цели. Лишь в последнее время наметился перелом, и отчасти учитываются интересы всех людей в обществе в це- лом. Всё это довольно естественно, поскольку государство и власть вы- полняли необходимую всему обществу жизнеобеспечивающую функцию защиты от внешней агрессии, порабощения и истребления. Развитие ма- териальной производственной основы общества перешагнуло эти рамки и приняло характер всеобщей научно-технической и информационной революций, и они в значительной мере определяют структуру современ- ного общества. Мне представляется, что сегодня нечто подобное воз- можно и в социально-экономической и общественной сферах. Если угод- но, пришло время, и, я думаю, и вы со мной согласитесь, что сегодня нет более важного и актуального объекта научного изучения, чем человече- ское общество. Изучение не локальных вопросов экономичности, рента- бельности, доходности и эффективности предприятий, производства, сельского хозяйства, оборота товаров и денег, что само по себе тоже очень важно, а механизмов функционирования общества и общих прин- ципов его организации и управления. Глобальная математическая модель и основанная на ней теория функ- ционирования, организации и управления обществом очень нужны и могли бы помочь человечеству в преодолении угрожающих ему соци- альных, экологических, экономических кризисов и катастроф, способст- вовать социальной революции, аналогичной промышленной и информа- ционной. Но, как мне представляется, изменения не произойдут сами со- бой, как это имело и имеет место для технической и информационной революций, и этому есть по крайней мере две причины: одна - отсутст- вие непосредственной заинтересованности тех, от кого это зависит, а вторая - недостаточная компетентность тех, от кого это зависит. В сфере материального производства, чтобы преуспеть, необходимо и то, и дру- гое, и заинтересованность, и умение, что совершенно не обязательно для власти. Заинтересованность, если и может возникнуть, имеет весьма призрач- ные основания, не следующие из коренных интересов власти, компе- тентность и вовсе не нужна, точнее, не нужна компетентность, необхо- димая для социальной революции. Чтобы стать сапожником, надо учить- ся, для обувной промышленности готовятся кадры в специальных техни- кумах и институтах. Чтобы стать строителем, тоже надо учиться. Чтобы стать врачом, нужно пройти пятилетний срок специального обучения, и потом ещё клиническую практику, и затем ещё всё время учиться и учиться; чтобы стать старшим научным сотрудником, надо не только окончить институт или университет, но и защитить кандидатскую, а то и докторскую диссертации. И после всего этого выдержать конкуренцию, требующую личной заинтересованности, позволяющей проявить необхо- димую активность. А что нужно изучить, уметь и обязательно знать, чтобы стать членом думы, правительства, областной или городской администрации? Таких
45. Игровая модель человеческого общества 385 жёстких требований нет. Их нет потому, что власть сама себе хозяйка, и никто ей не указ. И ещё потому, что для проникновения во власть нужны в первую очередь совсем другие качества, чем те, благодаря которым люди совершили научно-техническую революцию, совершают информа- ционную и могли бы совершить научную социально-экономическую. Для того чтобы могла произойти, основанная на знаниях и разуме, на- учная социально-экономическая революция, совершенно необходимы открытость деятельности власти, наличие жесточайших критериев оцен- ки делаемого властью и наличие механизма отсечения некомпетентных действий, обмана и туфты, постоянного притока во власть деятельных и талантливых людей. Что же может привести к осуществлению этих требований? Мне пред- ставляется, что только осознание неизбежности глубочайшего и жёстко- го кризиса, осознание наступления катастрофы, угрожающей существо- ванию всех, в том числе и власти, в сочетании с пониманием своих инте- ресов и выгод не только в кратковременном, сиюминутном, но и долго- срочном плане, понимания единства всех людей и их судьбы как вида и, наконец, понимание того, что нужно делать и к чему следует стремиться, чтобы избежать катастрофы. Величайшим искушением всякой власти является силовое управление обществом и миром. Однако управлять сверхсложным и, самое главное, активным объектом, каким является человеческое общество, силовыми, и даже всесокрушающими методами невозможно, не разрушая его, не ли- шив его совершенно необходимых качеств, способности к самоорганиза- ции, ведущей к его эффективности и процветанию. Силовое управление в конечном счёте ведёт к фактическому уничтожению человеческого об- щества. Властное управление должно быть не силовым, а способствую- щим активности всех людей, наилучшему их использованию. Управле- ние человеческим обществом не может быть полностью централизован- но, его основой должна быть его способность к самоорганизации, кото- рой властное управление должно способствовать и наличие чего должно обеспечить. Коллективный разум и деятельность людей не может заме- нить никакая централизованная власть: он основа жизни и эволюции об- щества. Многое из того, что сказано выше в связи с желанием построить и об- судить глобальную математическую модель базового уровня человече- ского общества, позволяющую понять принципы его функционирования, организации и управления, бездоказательно, и выражает точку зрения автора. Она высказывается не для того, чтобы вы с ней обязательно со- гласились, и далеко не всё, что высказано, будет использовано. Это, если угодно, приглашение к обсуждению, к тому, чтобы вы задумались. Вместе с тем математическое рассмотрение предполагает наличие ис- ходных утверждений, которые должны быть приняты. Обычно это обще- принятые представления точной науки, и они как бы за кадром: они не обсуждаются, из них исходят, строя дальнейшую теорию. Теперь посту- пить так нельзя: формулировка исходных положений для общества тре-
386 45. Игровая модель человеческого общества бует обсуждения и аргументации, они не просты и не очевидны. В дан- ном случае исходные положения - это игровое восприятие жизни, стремления людей, составляющих общество, и то, что мы хотим от него. Только после того, как все это будет обсуждено и принято, можно перейти к выводам, которые можно назвать принципами организации и управления обществом. Исходным положением будет то, что общество создается и существует для человека, для всех людей, и поэтому должно соответствовать приро- де человека и его стремлениям и желаниям, совместимым между собой и приемлемым для всех людей. Это положение, естественно, нельзя дока- зать, его можно только аргументировать и не более, потому что всегда может найтись человек, который скажет: «Нет, общество создано только для меня или нас, а государство - это я» или «мир и все люди существу- ют только для моего народа, и все должны подчиняться и служить ему». Такие точки зрения тоже имеют свои веские аргументы как в природе человека, так и потому, что совершенствование жизни до сих пор осуще- ствлялось через жесткую борьбу за существование. Это нельзя оспари- вать, это так было, но на современном этапе развития жизни это уже не так. Этот механизм эволюции изжил себя, его необходимо заменить, по- тому что он перестает служить в должной мере цели прогресса жизни на земле. Борьба за существование должна принять другие формы. Так ду- мают сейчас многие, но не все. В этих основах все же легче разобраться, чем в человеческом обществе. В этом и состоит возможная помощь точ- ной науки: сложные и очень сложные вопросы она сводит к менее слож- ным и даже простым. Для нас то, что общество в равной мере для всех людей и ради всех людей - аксиома. Борьба за существование как механизм эволюции и совершенствования жизни должна быть смягчена и заменена чем-то другим. Необходимость этой замены вызвана тем, что период чисто фи- зиологического и физического совершенствования живого дополнился, если не сменился, периодом его интеллектуального совершенствования. Интеллектуальное совершенствование открывает новые возможности и пути эволюции и прогресса жизни, более быстрые и эффективные. А борьба за существование в условиях наличия высокого интеллекта ведет совсем не к тем последствиям, которые были бы желательны и способст- вовали бы совершенствованию жизни и успешной деятельности людей. В формулировании исходных постулатов нет логики, но есть доводы и соображения. От нежелательных последствий борьбы за существование живая природа создавала ограничивающие инстинкты. Человек это мо- жет и должен сделать сознательно. Вначале он это делал на основе рели- гиозных представлений и верований, которые как бы спускались с небес, почитаемых и устрашающих. Сегодня это необходимо сделать, опираясь на интеллект и естественные и точные науки. Необходимая коррекция борьбы за существование - это превращение ее в конкуренцию на основе стремления к достижению поставленной це- ли и в рамках жестко соблюдаемых правил. Эту трансформацию борьбы
45. Игровая модель человеческого общества 387 за существование можно назвать игрой. Игрой, где все равны в возмож- ностях, никто не нарушает правил, и победители признательны побеж- денным, потому что без них не было бы ни победы, ни ее радости, ни са- мой игры. Без побежденных игровой механизм состязательного совер- шенствования человечества не работает. Итак, игра вместо борьбы за существование, равенство прав и воз- можностей всех людей и, наконец, все это ради людей. Таков итог пред- варительных соображений о постулатах, которые будут положены в ос- нову дальнейших, уже логических выводов. Я предвижу и уже слышал веские возражения: «Все это так, но люди в силу своей природы, инстинктов и эгоизма никогда это не будут соблю- дать, даже если и примут». К сожалению, это правда. Почти правда, по- скольку я все же вижу два возражения: одно в том, что природа все же наделила человека моралью и этическими представлениями и нормами, душой, и, второе, что люди все же способны осознать, что прямолиней- ный эгоизм и стремление к сиюминутной выгоде неизбежно приведут к кризису и катастрофе, что изменения и принятие ограничений в поведе- нии в конечном счете просто выгоднее. Изменению поведения людей может способствовать объяснение ре- ально сложившейся грозной ситуации и возможных путях ее преодоле- ния. Вот именно здесь точная наука, убедительность ее доводов и логики могут помочь. Конечно, народы разных стран и разные люди находятся на разных стадиях способности это понять, осмыслить и изменить свое поведение, и это не произойдет мгновенно, но это должно произойти: трудно поверить, что гигантские возможности самоорганизации природы дадут сбой. Более того, соответствующие тенденции, несомненно, име- ются в цивилизованных странах. 2. Игровое восприятие жизни и игровая модель общества. Несо- мненно, вы любите играть, кто как и с кем, или с чем. Жизнь человека тоже игра, точнее, ее можно воспринимать и описывать как игру, подчас комичную, трагичную, интересную, скучную, увлекательную, посты- лую, ..., но почти всегда желанную. Наверное, вы все помните слова из арии Елецкого (Пиковая дама) «Что наша жизнь - игра...». Этой фразой открывается по телевидению показ игры «Что, где, когда?» в элитарном клубе, где каждый может зарабатывать большие деньги своим интеллек- том. Известный писатель М.Пришвин написал: «Жизнь желанная - это иг- ра, все, кто может, играют, а кто не может - трудится в надежде когда- нибудь поиграть». Природа наделила человека многими качествами, которые способст- вуют его активному, подчас самозабвенному участию в игре: самолюби- ем, честолюбием, желанием первенствовать и добиваться своего,.... По- беда в игре может вызвать незабываемые по приятности и привлекатель- ности эмоции. Люди способны многими годами истязать себя трениров-
388 45. Игровая модель человеческого общества ками ради единого мига ощущения восторга и торжества победы на Олимпийских играх или других состязаниях. И еще я приведу слова А.Эйнштейна: «Успех - это неустанный труд плюс умение относиться к жизни как к игре ...». Так что игра не только желанна и любима, но она эффективна и спо- собствует успеху в жизни. Игра - приемлемая, желанная и эффективная форма и образ жизни людей. Вы привыкли, что когда играют, то кто-то выигрывает, а кто-то про- игрывает. Все выиграть не могут. Это кажется бесспорным, но это не так, точнее, есть много игр, для которых это не так. И, прежде всего, не так для игр человека с природой, это не так и для социальных игр, т.е. игр человека в обществе. Кроме того, вы привыкли, что, играя, надо свои «карты» прятать, скрывать, как вы хотите и будете играть. Но оказывается, что и это не всегда так. Может быть, совсем наоборот, и выгодно показать свои «кар- ты» и даже договориться с партнерами о совместных действиях. Допускаю, что вы удивлены и мне не верите. Я постараюсь объяснить, почему-то, что я сказал, может быть и во многих играх естественно. Дело в том, что игры понимаются гораздо шире, чем те, в которые мы ради удовольствия играем между собой. Математика описывает игру, точнее, простейшую одноходовую игру, как-то, где каждый игрок делает свой ход, и каждый получает выигрыш, зависящий от его хода и ходов ос- тальных игроков. Сказанное можно наглядно представить в виде табли- цы, где в первой строке представлены все игроки I]tI2, во второй - ходы, которые они могут сделать, и при этом каждый игрок Is выбирает любой ход xs из своего множества Qs разрешенных ему ходов; в послед- ней строке стоят получаемые в результате сделанных ходов выигрыши каждого из игроков: игрок Is, сделав ход xs е получает выигрыш fs(xl,x2,...,xn). Это простейшая одноходовая игра п лиц, но уже ее дос- таточно, чтобы продемонстрировать сказанное выше об играх. Для этого воспользуемся уже обсуждённым ранее примером Ю.Б.Гермейера. В придуманной им игре каждый игрок Is выбирает любое число xs(s = 1, 2, ..., п), п >3 , заключенное между 0 и 7, и получает выигрыш f,(x,......................xj = xs+'^i(l-xj). (45.1) Пусть каждый игрок знает только свою функцию выигрыша (45.1). Смотря на нее, он видит, что может максимально способствовать своему выигрышу, выбрав xs = 7. И так поступают все, т.е. все выбирают х/ =Х2= ... =хп = 7, и в результате этого выбора, согласно (45.1), каждый получает выигрыш в одну единицу. Если же все игроки рассекретят свои функции выигрыша, и каждый о них узнает, то, немного подумав, они могут сообразить, что выиграют значительно больше, если договорятся, что все будут в «ущерб себе» выбирать xs = 0 (s =1, 2, .... п). После этого выигрыш каждого равен и -7, и больше прежнего, равного 7 (п>3).
45. Игровая модель человеческого общества 389 Вместе с тем каждый игрок имеет искушение не выполнить договорен- ность, выбрав вместо нуля единицу и выиграть на единицу больше: вме- сто п -1 п. При этом все остальные игроки получат на единицу меньше, и, скорее всего, это приведет к развалу договоренности, и все окажутся в убытке, получив вместо п - 1 единицу. Нетрудно догадаться, почему в этой игре все не так, как в привычных нам играх. В этой игре сумма всех выигрышей положительна, в то время как в привычных нам играх она равна нулю, и выигрыш одних получает- ся только за счет проигрыша других. При игре двух игроков с нулевой суммой выигрышей игра носит антагонистический характер со всеми вы- текающими отсюда привычными нам следствиями. Но в игре с природой, за счет природы и ее ресурсов и даров, сумма выигрышей всех с ней иг- рающих может быть положительной. Теперь можно сформулировать игру, в которую мы играем, живя в обществе и участвуя во всеобщей трудовой или иной деятельности. Каждый человек Is, по желанию или в силу тех или иных обстоя- тельств и соображений выбирает из множества возможных игр О игру, в которую он намеревается играть. Выбрав игру Os, он одновременно вы- бирает множество своих возможных действий и функцию выигрыша fs(xt,...,xn). Игра состоит в последовательном выборе каждым из игро- ков множеств действия xs и получении соответствующего выигрыша fs(xI,...,xn), зависящего как от его действия xs, так и действий осталь- ных игроков. Каждый игрок в течение своей жизни делает много ходов и может менять игры, но последнее обычно происходит редко. Обратим внимание, что действия, которые выбирает игрок Is из мно- жества Qs, определяются не только множеством но и реальными воз- можностями игрока. Это обстоятельство можно было бы отразить тем, что выбираемое действие должно принадлежать некоторому присущему данному игроку множеству a>s, определяемому всей его предысторией и, в частности, предшествующей игрой и ее результатами. В принципе мо- жет меняться со временем и функция выигрыша. 3. Принципы организации и управления обществом. Постараемся сформулировать, чего каждый человек, живя в обществе, добивается и хочет, и чего хотят люди от общества. Кажется, что сделать это очень трудно и даже невозможно: людей очень много, и они все разные. Но не нужно входить в детали, ограничимся тем, что является общим для всех или почти всех. Ведь мы хотим взять в основу и обсудить простую мо- дель, а не модель, достаточно адекватную обществу во всех его проявле- ниях. Общим для всех людей является: 1. Стремление к возможно большему удовлетворению своих потреб- ностей и, 2. Несмотря на естественную конкуренцию, желание объединиться в общество для более эффективного производства продукта и большего удовлетворения своих потребностей.
390 45 Игровая модель человеческого общества Вопрос о том, что люди хотят от общества, кроме того, что указано в пункте 1, в соответствии с предшествующим обсуждением, можно сфор- мулировать в виде: 3. Стремления отдельных людей к максимальному удовлетворению своих потребностей в конечном счете должны привести к возможно большему удовлетворению потребностей всех членов общества, и так, что успех каждого одновременно и успех всех. Обсудим условия осуществимости постулатов 1-3 (стремлений людей и их желаний) в рамках игровой модели общества, точнее, условия, не- обходимые для их выполнения, и назовем их принципами организации и управления обществом. Прежде всего, отметим, что равенство прав и возможностей всех лю- дей общества заложено в самой игровой модели. Некоторое неравенство все же имеется в силу неодинаковости множеств cos, но это неравенство столь же неизбежно, как и различие данных, которые получает человек от природы, от того, каким он родился и как проявлял себя. Возможно, что общество должно как-то компенсировать это естественное неравен- ство, что и наблюдается. Далее, согласно 1-3, совершенно необходимо соблюдение правил иг- ры, в частности, только при их соблюдении имеет место равенство прав и возможностей. Только при соблюдении этих правил игра привлекатель- на, желанна и может быть эффективной. С современной точки зрения, соблюдение правил игры можно трактовать как соблюдение прав челове- ка, точнее, прав и обязанностей каждого человека. Для соблюдения этих прав и успешности игры, которая требует возможно большей информа- ции о ней, необходима открытость функционирования общества и про- исходящих в нем процессов принятия решений, от которых зависят функции выигрыша каждого из игроков. Не будем детализировать, что и в какой мере нужно знать или уметь прогнозировать. Для нас сейчас важно лишь то, что для этого необходима открытость общества. Итак, открытость общества - это одна из необходимых гарантий соблюдения прав человека и возможности успешной игры всех людей общества. Воз- можно, что эта многогранная и существенная роль открытости общества послужила тому, что Дж.Сорос выдвинул ее как основную характеристи- ку желаемого общества и стремление к его созданию. И еще одно необ- ходимое условие вытекает из того, что чем шире множество допустимых ходов, тем шире возможности оптимизации выигрышей. Это требование максимально допустимой широты множеств f2s допустимых действий можно трактовать как принцип минимальности принуждения, мини- мальности ограничений действий людей. В результате мы пришли к трем принципам организации и управления обществом: соблюдения прав че- ловека, открытость общества и минимальность принуждения. Теперь обсудим, как обеспечить выполнение привнесенной и сформу- лированной в пункте 3 цели общества. Ранее потребление и продукт мог- ли трактоваться весьма широко. Ниже это только деньги, сами по себе
45. Игровая модель человеческого общества 391 или их эквивалент. Денежную часть выигрыша fs обозначим f s. Вве- дем еще фактический денежный выигрыш (ps каждого игрока. Ясно, что общий денежный выигрыш F всего общества равен F = Выигрыш каждого будет способствовать выигрышу всех остальных иг- роков и общему выигрышу, если принять, что f, =a,F (as >0. ^,а. = 0, но при этом все игроки лишены возможности оценивать реальный эф- фект своих действий, кроме того, игроки теряют интерес к игре, так как выигрыш игрока фактически не зависит от его действий. Этого можно было бы избежать, приняв fs = Ps<Ps (Ps>o, £ но при этом не выполняется способствование выигрыша каждого выиг- рышу всех. Оба требования могут быть соблюдены, если принять, что fs = <*SF + fs<Ps (<*s >0,Ps>0). (45.2) При этом коэффициенты Д не должны быть слишком малыми, а ко- эффициенты as слишком большими. Это необходимо для того, чтобы изменения функции выигрыша, по которым игрок может судить об эф- фективности своих действий, в основном определялись функцией <ps, точнее, позволяли понять, как меняется cps. Цель общества 3 предполагает еще максимизацию общего выигрыша F через максимизацию всех индивидуальных выигрышей (р5, т.е. макси- мум функции F или близкая к нему величина F должна достигаться при оптимизации каждой из функций <ps по переменной xf. Можно заме- тить, что если каждая из функций <ps зависит только от xs, то из опти- мизации всех cps по xs следует оптимизация общего выигрыша F, как функции всех переменных хих. ,...,хл. Можно надеяться, что нечто близкое будет и в том случае, когда в функции <ps ведущей, самой суще- ственной переменной является х5. Интересно заметить, что игры с вы- полнением такого условия наиболее привлекательны. Подведем итог тому, что мы узнали о принципах функционирования, организации и управления современным обществом. Принцип функцио- нирования общества - это игра, принципы организации - это 1.1) открытость, свободный доступ к информации о функционирова- нии, процессах и событиях происходящих в обществе; 1 2) принцип наименьшего принуждения, минимальность ограничений в действиях членов общества; 1.3) принцип прав человека, т.е. правил жизненных игр, обязательных и одинаковых для всех членов общества
392 45 Игровая модель человеческого общества Управление обществом должно устанавливать правила игры, т.е. ве- личины выигрышей f и множества допустимых действий /2Л и делать это так, чтобы 2.1) каждый из игроков был лично заинтересован в игре и выигрыше, располагал достаточной информацией и возможностью ее оптимиза- ции; 2.2) общий выигрыш F способствовал всем индивидуальным выигры- шам fs; 2.3) оптимизация индивидуальных выигрышей была бы одновременно в достаточной мере и оптимизацией общего выигрыша F. Кроме того, управление обществом должно обеспечить соблюдение правил установленной игры и способствовать их совершенствованию. Стремление людей к совершенствованию потребления может осуществ- ляться не только за счёт более целесообразных действий в играх, но, в более широком плане, за счёт создания новых игр и новых действий. Но- вые игры и новые допустимые действия - это новые орудия труда, типы и способы производства, добычи и обработки, новые технологии, произ- водственные, сельскохозяйственные и другие процессы, новые условия жизни и труда, способствующие более полному удовлетворению потреб- ностей человека. Совершенствование игр происходит на основе познава- тельной деятельности людей, благодаря их любознательности и интел- лекту, желанию понять, исследовать и улучшить. Игра должна охваты- вать в должной мере и эти виды деятельности человека, что ведёт к большей привлекательности совместной игровой жизни и способствует общему прогрессу. Основой этих нововведений является познавательная, исследователь- ская и поисковая деятельность людей на основе преемственности знаний и умений, обеспечиваемых воспитанием и образованием. Инстинкты и природа человека способствуют этим видам его деятельности, но не во все времена они пользовались поддержкой общества и включались в де- нежный выигрыш. Общество в этом вопросе проявляло явно недостаточ- ное внимание к своей выгоде, что лишь отчасти компенсировалось цар- ской милостью, меценатской и благотворительной деятельностями У этого недопонимания есть веское основание: отсутствие денежной оцен- ки таких действий, отдалённость их эффекта и заинтересованность в них общества в целом, а не конкретных людей. Это привело к тому, что од- ним из важнейших факторов стимуляции научных и технических иссле- дований стали вооружённое противостояние и конфликты. Неприемле- мость этой ситуации очевидна, но исправить её очень не просто. Агрес- сивность и стремление к главенствованию тоже в природе человека, и ещё недавно являлись, как представляется, основными механизмами эво- люции жизни на Земле. Вооружённые конфликты тоже игры, в историче- ском плане великие, но едва ли приемлемые в настоящем и будущем. С точки зрения рассматриваемой игровой модели общества, они противо-
45. Игровая модель человеческого общества 393 речат его цели, а включение игр с познавательными действиями (наука, техника, культура, обучение и др.) для неё естественно, поскольку рас- ширяет привлекательность игр, соответствует врождённым устремлени- ям и склонностям многих людей и существенно, если не решающе, рас- ширяет эффективность игр всех людей и общества в целом. 4. Идеальная игра людей в обществе. Исходя из игровой модели общественной жизни людей, их стремлений, сформулированных в пунк- тах 1 и 2, и привнесённой цели общества 3, мы пришли к необходимости соблюдения ряда общих принципов. Нельзя сказать, что они неожиданны или новы. В той или иной мере они высказывались и даже отчасти осу- ществляются в цивилизованных странах. Но наряду с этими высказыва- лись и реализовывались совершенно другие принципы. В отношении вы- игрыша (2) можно сказать, что он имеет место в любом обществе. Обще- ство с as = 1 / п и Д = 0 можно назвать идеальным коммунистическим, а общество с as = 0 и Д = 1 диким капитализмом. В цивилизованном обществе член ps(ps в формуле (45.2) - это прямой заработок, а член asF, отчасти или полностью, - это то, что член обще- ства получает в виде образования, медицинского, культурного, социаль- ного, правоохранительного обеспечений и поддержек и других бесплат- ных услуг. Новое, что мы узнали, - это то, каких принципов следует придержи- ваться, если мы принимаем исходные постулаты, и из каких соображений определяются коэффициенты а5 и Д. При этом выясняется, выполне- ние каких функций обеспечивается каждым из этих принципов, и в чём содержание каждого из них. В целом они призваны способствовать при- влекательности и эффективности игр и тем самым соблюдению их пра- вил. В частности, были сформулированы требования к всеобщей игре, в том числе и экономической, людей, составляющих общество. В своей полно- те они едва ли выполнимы, но это и не требуется, достаточно лишь неко- торое приближенное их соблюдение. Вместе с тем изучение игр, удовле- творяющих этим идеальным требованиям, представляет определенный интерес и позволяет сформулировать принципы, на основе которых в обществе возможны их приближенная организация и самоорганизация. Напомним, что игра состоит в том, что каждый из игроков Is, s = 1,п, выбирает значение своей переменной xs и получает при этом выигрыш fsfri, ...» х^. Естественной стратегией каждого из игроков является мак- симизация своего выигрыша по доступной ему переменной xs. Назовем игру идеальной, если эта стратегия максимизации личного выигрыша ве- дет к максимизации общего выигрыша всех игроков. Это требование можно записать как-то, что maxfs(x1,...,xn), s = l,n (45.3)
394 45. Игровая модель человеческого общества достигается в той же точке O(xi хп *), что и max F(xlt...,xn), F = Zfs(xIt...,xn). (45.4) Х1..xn s Будем считать, что каждый из игроков умеет увеличивать свою функ- цию выигрыша по своей переменной меняя ее в соответствии с урав- нениями \=es(t)~-. e(t)>0, s = l,n cxs или аналогичными с малыми задержками. (45.5) Условия успешности индивидуальных поисков наибольших выиг- рышей. Вопрос, который решается ниже, - это когда стратегия (45.5) приводит к достижению условия (45.3) и когда точка О единственная. Возьмем функцию V вида (45-б) и найдем ее производную по времени при изменении переменных xs со- гласно (45.5) г=-Ул(0 2 Г + У£-^ (45.7) гае 6 i = 1.П. OXj Сходимость поисковой стратегии (45.5) к выполнению (45.3) может иметь место, если только при этом функция V стремится к нулю. Послед- нее будет выполнено тогда, когда t lim\8(t)dt = ^, (45.8) /->00 о где 8 = VV~'. Это необходимое и достаточное условие. Из (45.6) и (45.7) видно, что для выполнения (45.8) естественно при- нять, что квадратичная форма ^2 /* <45-9> oxsdxk определенно отрицательная, так что Ф<-/(£2+... + £,2), z>0. (45.10) Далее из (45.6), (45.7) и (45.10) непосредственно находим, что 8(t)< А — В, где А < £ g(0 ^(0 В < -2Z min £s(f), s
45. Игровая модель человеческого общества 395 и поэтому при 0 <e<£s(t)<£ <со условие (45.8) выполняется, по- скольку g/O gyW -2% \min£s(T)dT <итах« 1п^,1п— п £ £ > - 2%£ t . о о Из последней оценки следует, что V(t)<V(O)ea~bt, a,b>0. (45.11) Согласно (45.11), приход из любой точки области, для точек которой K(xp...,xw) < с < оо в область К(х,,...,хд) < d , где <7>0, совершается за время, не большее некоторого Т < оо. Отсюда следует, что все точки об- ласти V(xi, . . , Хп) < с < о? за конечное время переходят в точки одной и той же области V(xj, ..., xj <d,a все точки области d при достаточно ма- лом d> 0 в единственную точку O(xj , хп ), для которой — = — = ... = — = 0, (45.12) дх. дх, дхп 14 П и других таких точек в области V(xi, ..., х^ < с нет. Поскольку с - любое конечное положительное число, то других таких точек нет вообще. Точка O(xi , ...,хп ) единственная, и для нее, согласно (45.9), а2/ — —Ц-<0, s = l,n, (45.13) dxs и поэтому в ней имеет место максимум каждой из функций fs по пере- менной xs. Итак, уравнения (45.12) имеют единственное решение - точку O(xi ,... ,хп ), и она же есть глобально устойчивое состояние равновесия поисковой стратегии, описываемой системой уравнений (45.5), и она же точка максимума всех выигрышей fs(x7 , хп*) по соответствующей пе- ременной xs (45.3). Допустимость небольших временных задержек. Пусть стратегия (45.5) реализуется с некоторыми временными задержками, так что Xs = us, Тй 4- u = £ , (45.14) cx5 где ради простоты примем £s постоянными, большими £ > 0. Для доказа- тельства сформулированного в заглавии утверждения достаточно взять в качестве используемой ранее функции V другую функцию вида (45.15) где А>0 затем подбирается нужным образом.
396 45. Игровая модель человеческого общества Когда стратегия максимизации индивидуальных выигрышей при- водит к глобальному максимуму общего выигрыша? Ответ на по- ставленный в заголовке вопрос сводится к тому, чтобы установить, когда точка O(xi , хп ) - единственное глобально устойчивое равновесие системы (45.5) и одновременно единственная точка максимальности всех выигрышей (4 по переменной х5) была бы еще и единственным глобаль- ным максимумом функции общего выигрыша F=fi + Единственность максимума, и, следовательно, его глобальность, функ- ции F будет иметь место, если квадратичная форма _ v-1 £. д2 F £ ф/ = 2Л я я & oxsoxt отрицательно определенная, и имеет место оценка вида (45.10). Можно заметить, что Ф/ = IX + X • 05.16) s.k UXgUXk s.k.p*s OXsGXk Первая квадратичная форма этой суммы двух слагаемых определенно отрицательна в силу (45.10), ее главные квадратичные члены - это д2 F 2 —-gs , и естественно предположить, что этот член и самый сущест- дх, венный - больший по величине, поскольку переменная , скорее всего, самая существенная у выигрыша fs. Аналогичный член второй квадра- q2' j' тичной формы (45.16), £------выглядит значительно внушитель- р** dxs ней, но он не более, чем суммарный результат жесткостей влияния хода игрока Is на выигрыши всех остальных игроков, которых не так уж много и которые могут усредняться. Сказанное - не более, чем довод для при- нятия условия отрицательной определенности квадратичной формы Ф/ и оценки Ф/ < -// (£/2+ ... +£п2), которая обеспечивает предполагаемую единственность и глобальность максимума общего выигрыша F, а его совпадение с точкой O(xj ,..., хп ) будет иметь место при — = £^- = 0, 5 = (45.17) Qx дх Если трактовать —- как жесткость влияния игрока Is на игрока Ipi то сумма (45.17) - сумма всех жесткостей давления игрока Is на остальных игроков 1Р, (р Ф s). По сравнению с чем эта сумма жесткостей должна быть мала, чтобы можно было ожидать близости максимума общего вы- игрыша к общему выигрышу в точке О(х‘,..., х*)? Этот вопрос рассмат- ривается в следующем разделе.
45. Игровая модель человеческого общества 391 (45.18) Основной принцип совместной идеальной игры в обществе. Опти- мальный общий выигрыш находится из уравнений dF & — ---= ^-+> —- = 0, s = l,n. dXs т.е. добавочный член в уравнении (45.18) тем менее существенен, чем ez & fs Р О гг больше —-у-по сравнению с > —-. Это следует из первого приближе- dxs dxs ния для изменения ds по отношению к х5, т4^+2?£-=0- s = 1-n • <4519> p*s ^Xs Итоговый вывод о близости точки глобального максимума общего вы- игрыша F к точке О(х/ , хп ) максимума личных выигрышей можно сформулировать как требование малости сумм жесткостей влияния хода каждого игрока на общий выигрыш всех остальных игроков. Этого мож- но достичь за счет малости каждого из влияний отдельно, а можно и за счет малости суммарного влияния, учитывая возможность их компенса- ции. Сказанное можно сформулировать как некий принцип поведения в общей идеальной экономической игре людей в обществе: с одной сторо- ны, каждый игрок должен стремиться к своему личному выигрышу, не- уклонно его оптимизируя, а с другой - по возможности в целом не вре- дить и не способствовать выигрышам других. Как способствование, так и препятствование выигрышам других, оказывается, уменьшает возмож- ный общий выигрыш. Действительно, первое приближение общего вы- игрыша над суммой индивидуальных максимизированных выигрышей, согласно (45.17), равно Г8х s ^8х. p*s dxs ^Х^2 у7 ) >0 и всегда положительно, и тем более, чем более квадраты сумм жестко- стей влияния. Можно заметить, что это превышение, во всяком случае в первом приближении, тем меньше, чем «острее» максимумы личных вы- игрышей (больше по величине второе производное от fs по xs). О целесообразной организации и самоорганизации экономических игр в обществе. Под целесообразной организацией понимается близость к идеальной игре. Как можно судить из предыдущего, оптимальное эко- номическое функционирование при идеальной игре требует от ее участ- ников только умения и успешности в оптимизации своих личных выиг- рышей. Но оптимальная игра едва ли реальна, да и кто должен ее органи- зовывать и определять? Значительно реальнее некоторое к ней прибли- жение, достигаемое целесообразной стратегией самих экономических игр и экономической политики. Основной принцип этой самоорганизации, ведущей к близости экономической игры к оптимальной, состоит в том,
398 45. Игровая модель человеческого общества что каждый игрок должен возможно больше стремиться к своему лично- му выигрышу и одновременно организовывать ее так, чтобы было воз- можно меньшим суммарное влияние на других игроков, достигаемое тем, что он сам, выбирая игру, стремится максимально возможно избавиться от влияния остальных игроков. Такая самоорганизация естественно предполагает, что игроки располагают весьма широкими возможностями выбора игры, удовлетворяющей этим требованиям, что, в частности, тре- бует достаточно хорошей информированности и понимания последствий своих действий. Тривиальный случай идеальной игры - это когда каждая из функций выигрыша fs зависит только от xs. Этого положения можно достичь пу- тем объединения игроков с сильными зависимостями в «одного», а мож- но путем организации взаимоотношений, которые не допускают больших влияний друг на друга. Следует отметить и еще одну особенность иде- альной игры: успешность оптимизации выигрышен целиком зависит от личных действий каждого игрока, когда его прогнозы проще и надежней, и он может сосредоточиться только на эффективности своих действий, используемых средств и технологий. Может показаться, что в своей пол- ной осуществимости идеальная игра как бы исключает конкуренцию, но это не так, потому что она присутствует, но не на уровне базовых игро- вых действий, а в сопоставлении их результатов. Это отдельная важная тема. 5. Проблема включения управленцев и власти в общее игровое взаимодействие. Выше определена функциональная структура низшего базового уровня общества, как общества игрового, и основные принципы его организации и управления, следующие из требований эффективности игры и её общей приемлемости. Прежде чем перейти к теме этого разде- ла, позволим себе немного повториться. Как уже отмечалось, общество и составляющие его люди в своих организации и функционировании по- хожи на живой организм, состоящий из клеток. Сообщество клеток обес- печивает жизнь всего организма, а жизнедеятельность клеток обеспечи- вается гомеостазом среды их обитания. Нечто аналогичное имеет место и в человеческом обществе: для его жизни необходимо обеспечение соот- ветствующей среды, называемой базовым уровнем общества. Однако по мере совершенствования многоклеточного живого организма, как необ- ходимое условие жизни, помимо гомеостаза среды, возникли ещё гумо- ральное и нервные управления. В обществе их аналогом можно считать управление жизнью людей, осуществляемое государством и его власт- ными и полномочными структурами. В живом организме всё происходит как бы само собой, в силу законов природы и тенденций её самооргани- зации В человеческом обществе многое организуется при целенаправ- ленном вмешательстве людей. Теперь естественно возникает очень важ- ный вопрос: где и как пролегает граница в современном человеческом обществе между централизованным управлением и тем, что можно на- звать самоорганизацией, возникающей на основе базового уровня обще-
45. Игровая модель человеческого общества ства, между сознательным централизованным управлением и тем, что можно назвать самоорганизацией, требующей лишь обеспечения базово- го уровня? Кроме того, сама организация базового уровня требует нали- чия механизмов формирования игр и соблюдения их правил. Как это де- лается, выходит далеко за рамки рассматриваемой игровой модели, но сама проблема власти возникает уже внутри неё, и с её позиций можно сформулировать её существо и что требуется для её разрешения. На наличие этой проблемы указывала и ранее рассмотренная матема- тическая модель «производители - продукт - управленцы», поскольку в ней управленцы возникали не потому, что они нужны и полезны, а пото- му, что общество может их содержать. В этом их трагическое сходство с паразитическими элементами общества. С позиции игровой модели об- щества проблема состоит в том, чтобы включить управленцев и оба вида власти в равноправное всеобщее игровое взаимодействие, в общую для всех игру. Сам статус в обществе управленцев и власти как бы препятст- вует равноправию, и вместе с тем его необходимо соблюсти В этом и состоит, на мой взгляд, центральная проблема современного человече- ского общества - проблема власти. На вопрос, как это делается, матема- тическая модель ответить не может, но она позволяет ответить на вопрос, что для этого нужно сделать. А сделать нужно так, чтобы ни один из управленцев или власти, выполняя свои функции, т.е. играя в одну из игр, не имел возможностей за счёт своих властных полномочий изменять правила своей игры или позволять себе их не исполнять. Для этого нуж- но целенаправленное и полное разделение полномочий между отдельны- ми исполнителями и структурами управленческих и властных полномо- чии. Разделения, исключающего не только непосредственную возмож- ность использования власти в своих целях, но и сговора. Организация власти, удовлетворяющая этим требованиям, автоматически приведёт к высоким профессиональному уровню и компетентности управленцев и власти, так как только при их наличии они смогут успешно играть и вы- держать естественную общую конкуренцию. В какой-то мере именно в этом направлении происходят изменения в цивилизованных обществах: разделение властей, открытость её намерений и действий, выборность и сменяемость. 6. Заключение. Безусловно, рассмотренная выше игровая модель до примитивности проста по сравнению с реальной жизнью общества лю- дей на Земле с ее многообразными непостижимыми сложными взаимо- отношениями людей, их коллективов, стран и народов. Все это объять и адекватно отобразить в математической модели невозможно, Да и не о такой модели идет речь Речь идет только о модели базового уровня об- щества, о фундаменте, на котором оно стоит, и среде, в которой функ- ционирует. О среде, которая позволит и будет способствовать активной и эффективной деятельности людей, деятельности желанной почти всеми, в целом почти всеми приемлемой и почти всех устраивающей. Все ос- тальное, что сверх базового уровня и его обеспечения, создается как бы
400 45. Игровая модель человеческого общества само собой активной деятельностью людей и их способностью к самоор- ганизации. Все остальное люди создадут в процессе участия во всеобщей игре, включая и помогающее им математическое моделирование воз- можных сторон их деятельности и жизни. К модели базового уровня не нужно и нельзя предъявлять требования полноты и адекватности реальному обществу людей. Нельзя - потому что сколько-нибудь полная модель настолько сложна, что едва ли позво- лит сделать какие-то общие выводы. От модели базового уровня нужно и можно требовать, чтобы конструируемый базовый уровень обеспечивал и порождал достойную жизнь людей на Земле с ее условиями, окружаю- щей природой и свойствами людей. Был основой, обеспечивающей эф- фективное удовлетворяющее людей функционирование общества. Принципы организации, функционирования и управления, сформули- рованные выше, - это лишь необходимые условия - они получены как необходимые - и они будут достаточными, если эта основа - базовый уровень - устойчив и самодостаточен. Устойчивость требует приемлемости и желанности такого базового уровня для подавляющего числа людей. Возможности его реализовать и поддерживать, фактической невозможности его дезорганизации и разру- шения. Самодостаточность можно видеть в том, что наличие базового уровня достаточно для того, чтобы в его рамках его поддерживать и соблюдать, т.е. когда факторы устойчивости базового уровня в нем самом. Я не думаю, что базовый уровень нужно и можно насильственно вне- дрить и организовать, нет, напротив, я думаю, что он - тот, о котором шла речь выше — будет организовываться сам по себе благодаря естест- венной деятельности людей и начало этой организации явно видно; но для ускорения и облегчения этого эволюционного процесса, устранения ложных действий и тупиков, совсем не лишнее понимание существа его целей и перспектив. С точки зрения высказанного основного постулата желанности и наибольшей эффективности игрового восприятия жизни, устойчивость и самодостаточность должны иметь место. При этом, по- видимому, самая трудная проблема человечества в осуществлении вклю- чения всех видов власти в общую игру, а также наличие стран и народов с большим отставанием в развитии. Конечно, может быть, что все будет совсем не так и то, что высказано - лишь гипотеза, которой не суждено осуществиться. Именно поэтому выше в самом начале рассматриваемая модель названа фантастической. Все же, пожалуй, еще нужно несколько слов сказать об одной особенно- сти процесса самоорганизации общества. Вернемся к отмеченной выше аналогии живого многоклеточного орга- низма и человеческого общества. Аналогом базового, уровня в клеточном организме является гомеостаз среды их обитания. Однако, кроме гомео- стаза, как необходимое условие жизни возникают гуморальные и нерв- ные системы управления, поддерживающие гомеостаз и не сводящиеся только к этой функции. В человеческом обществе аналогом гуморальных
45. Игровая модель человеческого общества 401 и нервных управлений являются осознанные властные управления, более или менее централизованные в виде государства и его структур и инсти- тутов. Это управление как в организме, так и в обществе возникает в процессе их самоорганизации. В человеческом обществе властные струк- туры также необходимы не только для поддержания базового уровня, их полномочия значительно шире, и это обстоятельство приводит к пробле- ме организации дополнительных властных управленческих структур, проблеме включения их в общее игровое взаимодействие. Это ставит во- прос о том, где и как пролегает граница между властным управлением и тем, что можно назвать стихийной и естественной самоорганизацией, для которой требуется только обеспечение базового уровня. Не отвечая на очень не простой вопрос о границе, отметим, что решение проблемы этой дополнительной власти также нужно видеть в надлежащем разделении властей, требовании открытости ее (власти) намерений и действий, ее предсказуемости в пределах возможного, эффективной контролируемо- сти, которые в целом обеспечивают ее включение в общую игру.
Юрий Исаакович Неймарк МАТЕМАТИЧЕСКИЕ МОДЕЛИ В ЕСТЕСТВОЗНАНИИ И ТЕХНИКЕ Учебник Редактор Е.В.Тамберг Формат 70x108/16. Печать офсетная. Бумага офсетная. Гарнитура «Таймс». Уч.-изд. л. 32,2. Усл. печ. л. 35,3. __________________Тираж 400 экз. Заказ 475.______________ Издательство. Нижегородского госуниверситета им. Н.И.Лобачевского _____________603950, Н. Новгород, пр. Гагарина, 23_______ Типография Нижегородского госуниверситета им. Н.И.Лобачевского Лиц. № 18-0099 от 04.05.01 г. 603000, Н. Новгород, ул. Б. Покровская, 37
Неймарк Юрий Исаакович (родился 24 ноября 1920 г.) - доктор технических наук, профессор и почетный профессор Нижегородского государственного университета им. Н.И. Лобачевского, почетный соросовский профессор, зас- луженный деятель науки РФ, академик РАЕН, лауреат премий А.А. Андронова и Н. Винера, награжден орденом «Знак Почета» и медалями К.Э. Циолковского и А.С. Попова за. заслуги в развитии отечественной космонавтики и изобретательстве, член Национального комитета России по теоретической и прикладной механике. Автор 9 монографий, 4 из которых переведены на английский, польский и испанский языки, более 400 научных работ и 20 изобретений, а также автобиографической книги «Сухой остаток», в которой большое место уделено научной школе А.А. Андронова.