/
Автор: Самарский А.А. Михайлов А.П.
Теги: вычислительная математика численный анализ математика математическое моделирование
ISBN: 5-9221-0120-X
Год: 2001
Текст
УДК 519.6 ББК 22.19 С17 Издание осуществлено при поддержке Российского фонда фундаментальных исследований по проекту 01-01-Ц075 Самарский А. А., Михайлов А. П. Математическое моделирова- моделирование: Идеи. Методы. Примеры. — 2-е изд., испр. — М.: Физматлит, 2001. — 320 с. — ISBN 5-9221-0120-Х. В монографии изложены универсальные методологические подходы, позво- позволяющие безотносительно к конкретным областям приложений строить адекват- адекватные математические модели изучаемых объектов. Представлены методы и приме- примеры построения и анализа математических моделей для различных задач механики, физики, биологии, экономики, социологии на основе использования фундаменталь- фундаментальных законов природы, вариационных принципов, иерархических цепочек, метода аналогий. Для специалистов по математическому моделированию, аспирантов, студен- студентов, изучающих и использующих методы математического моделирования, вычис- вычислительного эксперимента. Первое издание — 1997 г. Табл. 5. Ил. 123. Библиогр. 89 назв. Научное издание САМАРСКИЙ Александр Андреевич, МИХАЙЛОВ Александр Петрович МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ: ИДЕИ. МЕТОДЫ. ПРИМЕРЫ Редактор Е.Ю.Ходан Компьютерный набор А.С.Болдарева, Н.Г.Сиротенко ЛР № 071930 от 06.07.99. Подписано в печать 25.04.01. Формат 60 х 90/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 20. Уч.-изд. л. 22. Тираж 400 экз. Заказ тип. № ISBN 5-9221-0120-Х Издательская фирма «Физико-математическая литература» МАИК «Наука/Интерпериодика» 117864 Москва, ул. Профсоюзная, 90 Отпечатано с готовых диапозитивов в ППП «Типография «Наука» 121099 Москва, Шубинский пер., 6 785922 101202 ISBN 5-9221-0120-Х © Физматлит, 2001 © А.А.Самарский, А.П.Михайлов, 1997, 2001
ОГЛАВЛЕНИЕ ВВЕДЕНИЕ ГЛАВА I ПРОСТЕЙШИЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ И ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ 1. Элементарные математические модели 11 1. Фундаментальные законы природы A1). 2. Вариационные принципы A6). 3. Применение аналогий при построении моделей A9). 4. Иерархический под- подход к получению моделей B1). 5. О нелинейности математических моделей B3). 6. Предварительные выводы B5). Упражнения B6). 2. Примеры моделей, получаемых из фундаментальных законов природы 26 1. Траектория всплытия подводной лодки B6). 2. Отклонение заряженной части- частицы в электронно-лучевой трубке B8). 3. Колебания колец Сатурна C0). 4. Дви- Движение шарика, присоединенного к пружине C2). 5. Заключение C3). Упражне- Упражнения C4). 3. Вариационные принципы и математические модели 34 1. Общая схема принципа Гамильтона C4). 2. Третий способ получения моде- модели системы «шарик—пружина» C5). 3. Колебания маятника в поле сил тяжес- тяжести C7). 4. Заключение C9). Упражнения D0). 4. Пример иерархии моделей 40 1. Различные варианты действия заданной внешней силы D0). 2. Движение точ- точки крепления, пружина на вращающемся стержне D1). 3. Учет сил трения D2). 4. Два типа нелинейных моделей системы «шарик—пружина» D4). 5. Заключе- Заключение D7). Упражнения D7). 5. Универсальность математических моделей 48 1. Жидкость в U-образном сосуде D8). 2. Колебательный электрический кон- контур E0). 3. Малые колебания при взаимодействии двух биологических популя- популяций E0). 4. Простейшая модель изменения зарплаты и занятости E1). 5. Заклю- Заключение E2). Упражнения E2). 6. Некоторые модели простейших нелинейных объектов 53 1. О происхождении нелинейности E3). 2. Три режима в нелинейной модели популяции E3). 3. Влияние сильной нелинейности на процесс колебаний E5). 4. О численных методах E6). Упражнения E7). ГЛАВА II ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ ПРИРОДЫ 1. Сохранение массы вещества 58 1. Поток частиц в трубе E8). 2. Основные предположения о гравитационном режиме течения грунтовых вод F0). 3. Баланс массы в элементе грунта F1). 4. Замыкание закона сохранения массы F3). 5. О некоторых свойствах уравнения Буссинеска F4). Упражнения F6). 2. Сохранение энергии 66 1. Предварительные сведения о процессах теплопередачи F6). 2. Вывод закона Фурье из молекулярно-кинетических представлений F8). 3. Уравнение баланса тепла G0). 4. Постановка типичных краевых условий для уравнения теплопро- теплопроводности G2). 5. Об особенностях моделей теплопередачи G4). Упражнения G6). 3. Сохранение числа частиц 76 1. Основные понятия теории теплового излучения G6). 2. Уравнение баланса числа фотонов в среде G8). 3. Некоторые свойства уравнения переноса излуче- излучения (80). Упражнения (82).
4 ОГЛАВЛЕНИЕ § 4. Совместное применение нескольких фундаментальных законов ... 82 1. Предварительные понятия газовой динамики (82). 2. Уравнение неразрывнос- неразрывности для сжимаемого газа (83). 3. Уравнения движения газа (84). 4. Уравнение энергии (85). 5. Уравнения газовой динамики в лагранжевых координатах (86). 6. Краевые условия для уравнений газовой динамики (88). 7. Некоторые особен- особенности моделей газовой динамики (90). Упражнения (92). ГЛАВА III МОДЕЛИ ИЗ ВАРИАЦИОННЫХ ПРИНЦИПОВ, ИЕРАРХИИ МОДЕЛЕЙ Уравнения движения, вариационные принципы и законы сохранения в механике 93 1. Уравнения движения механической системы в форме Ньютона (93). 2. Урав- Уравнения движения в форме Лагранжа (95). 3. Вариационный принцип Гамильто- Гамильтона (99). 4. Законы сохранения и свойства пространства-времени A01). Упраж- Упражнения A05). Модели некоторых механических систем 105 1. Маятник на свободной подвеске A05). 2. Непотенциальные колебания A09). 3. Малые колебания струны A11). 4. Электромеханическая аналогия A15). Упражнения A17). Уравнение Больцмана и производные от него 118 1. Описание совокупности частиц с помощью функции распределения A18). 2. Уравнение Больцмана для функции распределения A20). 3. Распределение Максвелла и //-теорема A21). 4. Уравнения для моментов функции распределе- распределения A24). 5. Цепочка гидродинамических моделей газа A30). Упражнения A35). ГЛАВА IV МОДЕЛИ НЕКОТОРЫХ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ Универсальность математических моделей 136 1. Динамика скопления амеб A36). 2. Случайный марковский процесс A40). 3. Примеры аналогий между механическими, термодинамическими и экономи- экономическими объектами A46). Упражнения A50). Некоторые модели финансовых и экономических процессов 150 1. Организация рекламной кампании A50). 2. Взаимозачет долгов предприя- предприятий A54). 3. Макромодель равновесия рыночной экономики A60). 4. Макромодель экономического роста A67). Упражнения A69). Некоторые модели соперничества 170 1. Взаимоотношения в системе «хищник—жертва» A71). 2. Гонка вооружений между двумя странами A73). 3. Боевые действия двух армий A75). Упражне- Упражнения A79). Динамика распределения власти в иерархии 180 1. Общая постановка задачи и терминология A80). 2. Механизмы перераспреде- перераспределения власти внутри иерархической структуры A86). 3. Баланс власти в инстан- инстанции, условия на ее границах и переход к непрерывной модели A89). 4. Правовая система «власть—общество». Стационарные распределения и выход власти за рамки полномочий A94). 5. Роль основных характеристик системы в феномене превышения (принижения) власти A98). 6. Интерпретация результатов и выво- выводы A99). Упражнения B01). ГЛАВА V ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 1. Применение методов подобия 202 1. Анализ размерностей и групповой анализ моделей B02). 2. Автомодельные (са- (самоподобные) процессы B08). 3. Различные режимы распространения возмущений в нелинейных средах B14). Упражнения B21). 2. Принцип максимума и теоремы сравнения 221 1. Формулировка, некоторые следствия B21). 2. Классификация режимов с обост- обострением B26). 3. Расширение «автомодельного метода» B29). Упражнения B34). 3. Метод осреднения 235 1. Локализованные структуры в нелинейных средах B35). 2. Различные спосо- способы осреднения B38). 3. Классификация режимов горения теплопроводной сре- среды B41). Упражнения B46).
ОГЛАВЛЕНИЕ 5 § 4. О переходе к дискретным моделям 246 1. Необходимость численного моделирования, элементарные понятия теории раз- разностных схем B46). 2. Непосредственная формальная аппроксимация B51). 3. Интегро-интерполяционный метод B56). 4. Принцип полной консерватив- консервативности B59). 5. Построение разностных схем с помощью вариационных прин- принципов B62). 6. Использование иерархического подхода к получению дискретных моделей B65). Упражнения B69). ГЛАВА VI МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ СЛОЖНЫХ ОБЪЕКТОВ § 1. Задачи технологии и экологии 270 1. Физически «безопасный» ядерный реактор B70). 2. Гидрологический «барьер» против загрязнения грунтовых вод B74). 3. Сложные режимы обтекания тел газом B77). 4. Экологически приемлемые технологии сжигания углеводородных топлив B81). § 2. Фундаментальные проблемы естествознания 283 1. Нелинейные эффекты в лазерной термоядерной плазме B83). 2. Математи- Математическая реставрация Тунгусского феномена B88). 3. Климатические последст- последствия ядерного конфликта B92). 4. Магнитогидродинамическое «динамо» Солн- Солнца B96). § 3. Вычислительный эксперимент с моделями трудноформализуемых объектов 299 1. Диссипативные биологические структуры B99). 2. Процессы в переходной эко- экономике C02). 3. Тоталитарные и анархические эволюции распределения власти в иерархиях C06). СПИСОК ЛИТЕРАТУРЫ 313
Светлой памяти академика Андрея Николаевича Тихонова посвящается ВВЕДЕНИЕ Невозможно представить себе современную науку без широкого применения математического моделирования. Сущность этой методо- методологии состоит в замене исходного объекта его «образом» — математи- математической моделью — и дальнейшем изучении модели с помощью реали- реализуемых на компьютерах вычислительно-логических алгоритмов. Этот «третий метод» познания, конструирования, проектирования сочета- сочетает в себе многие достоинства как теории, так и эксперимента. Рабо- Работа не с самим объектом (явлением, процессом), а с его моделью дает возможность безболезненно, относительно быстро и без существенных затрат исследовать его свойства и поведение в любых мыслимых си- ситуациях (преимущества теории). В то же время вычислительные (ком- (компьютерные, симуляционные, имитационные) эксперименты с моделями объектов позволяют, опираясь на мощь современных вычислительных методов и технических инструментов информатики, подробно и глу- глубоко изучать объекты в достаточной полноте, недоступной чисто тео- теоретическим подходам (преимущества эксперимента). Неудивительно, что методология математического моделирования бурно развивается, охватывая все новые сферы — от разработки технических систем и управления ими до анализа сложнейших экономических и социальных процессов. Элементы математического моделирования использовались с са- самого начала появления точных наук, и не случайно, что некоторые методы вычислений носят имена таких корифеев науки, как Нью- Ньютон и Эйлер, а слово «алгоритм» происходит от имени средневеко- средневекового арабского ученого Аль-Хорезми. Второе «рождение» этой мето- методологии пришлось на конец 40-х—начало 50-х годов XX века и было обусловлено по крайней мере двумя причинами. Первая из них — по- появление ЭВМ (компьютеров), хотя и скромных по нынешним меркам, но тем не менее избавивших ученых от огромной по объему рутинной вычислительной работы. Вторая — беспрецедентный социальный за- заказ — выполнение национальных программ СССР и США по созданию ракетно-ядерного щита, которые не могли быть реализованы традици- традиционными методами. Математическое моделирование справилось с этой задачей: ядерные взрывы и полеты ракет и спутников были предва- предварительно «осуществлены» в недрах ЭВМ с помощью математических моделей и лишь затем претворены на практике. Этот успех во мно- многом определил дальнейшие достижения методологии, без применения которой в развитых странах ни один крупномасштабный технологи- технологический, экологический или экономический проект теперь всерьез не
ВВЕДЕНИЕ 7 рассматривается (сказанное справедливо и по отношению к некото- некоторым социально-политическим проектам). Сейчас математическое моделирование вступает в третий прин- принципиально важный этап своего развития, «встраиваясь» в структу- структуры так называемого информационного общества. Впечатляющий про- прогресс средств переработки, передачи и хранения информации отвечает мировым тенденциям к усложнению и взаимному проникновению раз- различных сфер человеческой деятельности. Без владения информацион- информационными «ресурсами» нельзя и думать о решении все более укрупняю- укрупняющихся и все более разнообразных проблем, стоящих перед мировым сообществом. Однако информация как таковая зачастую мало что да- дает для анализа и прогноза, для принятия решений и контроля за их исполнением. Нужны надежные способы переработки информацион- информационного «сырья» в готовый «продукт», т. е. в точное знание. История методологии математического моделирования убеждает: она может и должна быть интеллектуальным ядром информационных технологий, всего процесса информатизации общества. Технические, экологические, экономические и иные системы, из- изучаемые современной наукой, больше не поддаются исследованию (в нужной полноте и точности) обычными теоретическими методами. Прямой натурный эксперимент над ними долог, дорог, часто либо опасен, либо попросту невозможен, так как многие из этих систем существуют в «единственном экземпляре». Цена ошибок и просчетов в обращении с ними недопустимо высока. Поэтому математическое (шире — информационное) моделирование является неизбежной со- составляющей научно-технического прогресса. Сама постановка вопроса о математическом моделировании како- какого-либо объекта порождает четкий план действий. Его можно условно разбить на три этапа: модель — алгоритм — программа (см. схему). На первом этапе выбирается (или строится) «эквивалент» объек- объекта, отражающий в математической форме важнейшие его свойства — законы, которым он подчиняется, связи, присущие составляющим его
8 ВВЕДЕНИЕ частям, и т. д. Математическая модель (или ее фрагменты) исследу- исследуется теоретическими методами, что позволяет получить важные пред- предварительные знания об объекте. Второй этап — выбор (или разработка) алгоритма для реализации модели на компьютере. Модель представляется в форме, удобной для применения численных методов, определяется последовательность вы- вычислительных и логических операций, которые нужно произвести, что- чтобы найти искомые величины с заданной точностью. Вычислительные алгоритмы должны не искажать основные свойства модели и, следова- следовательно, исходного объекта, быть экономичными и адаптирующимися к особенностям решаемых задач и используемых компьютеров. На третьем этапе создаются программы, «переводящие» модель и алгоритм на доступный компьютеру язык. К ним также предъяв- предъявляются требования экономичности и адаптивности. Их можно назвать «электронным» эквивалентом изучаемого объекта, уже пригодным для непосредственного испытания на «экспериментальной установке» — компьютере. Создав триаду «модель—алгоритм—программа», исследователь получает в руки универсальный, гибкий и недорогой инструмент, ко- который вначале отлаживается, тестируется в «пробных» вычислитель- вычислительных экспериментах. После того как адекватность (достаточное соот- соответствие) триады исходному объекту удостоверена, с моделью прово- проводятся разнообразные и подробные «опыты», дающие все требуемые качественные и количественные свойства и характеристики объекта. Процесс моделирования сопровождается улучшением и уточнением, по мере необходимости, всех звеньев триады. Будучи методологией, математическое моделирование не подменя- подменяет собой математику, физику, биологию и другие научные дисципли- дисциплины, не конкурирует с ними. Наоборот, трудно переоценить его син- синтезирующую роль. Создание и применение триады невозможно без опоры на самые разные методы и подходы — от качественного ана- анализа нелинейных моделей до современных языков программирования. Оно дает новые дополнительные стимулы самым разным направлени- направлениям науки. Рассматривая вопрос шире, напомним, что моделирование присут- присутствует почти во всех видах творческой активности людей различных «специальностей» — исследователей и предпринимателей, политиков и военачальников. Привнесение в эти сферы точного знания помогает ограничить интуитивное умозрительное «моделирование», расширяет поле приложений рациональных методов. Конечно же, математическое моделирование плодотворно лишь при выполнении хорошо известных профессиональных требований: четкая формулировка основных поня- понятий и предположений, апостериорный анализ адекватности используе- используемых моделей, гарантированная точность вычислительных алгоритмов и т. д. Если же говорить о моделировании систем с участием «чело- «человеческого фактора», т. е. тру дно формализуемых объектов, то к этим требованиям необходимо добавить аккуратное разграничение матема- математических и житейских терминов (звучащих одинаково, но имеющих разный смысл), осторожное применение уже готового математическо-
ВВЕДЕНИЕ 9 го аппарата к изучению явлений и процессов (предпочтителен путь «от задачи к методу», а не наоборот) и ряд других. Решая проблемы информационного общества, было бы наивно упо- уповать только на мощь компьютеров и иных средств информатики. По- Постоянное совершенствование триады математического моделирования и ее внедрение в современные информационно-моделирующие систе- системы — методологический императив. Лишь его выполнение дает воз- возможность получать так нужную нам высокотехнологичную, конку- конкурентоспособную и разнообразную материальную и интеллектуальную продукцию. Различным аспектам математического моделирования посвящено немало, хотя явно недостаточно, хороших и разных книг. При написа- написании данной книги авторы ставили перед собой цель отобрать и из- изложить подходы к построению и анализу математических моделей, общие для различных областей знания, не зависящие от конкретной специфики. Окружающий людей мир един, и исследователи эффектив- эффективно используют этот дар природы, выражающийся в том числе в уни- универсальности математических моделей. Конечно, содержание книги связано в определенной мере с личным опытом авторов. Тем не менее, придерживаясь сформулированной выше точки зрения, нам было лег- легче расширять рамки изложения и демонстрировать широкие возмож- возможности математического моделирования — от механики до социальных наук. Этим, как полагают авторы, данная книга и отличается от книг наших коллег. Что касается стиля книги, то мы стремились избегать громозд- громоздких и строгих процедур (которые заинтересовавшийся читатель мо- может найти в специальных изданиях), а обращали основное внимание на описание идей и соответствующих им примеров. Поэтому книга со- содержит большое количество иллюстраций и упражнений, ее материал без особых затруднений может быть использован для формирования учебных курсов по различным конкретным направлениям математи- математического моделирования. Небольшой объем книги не позволил осветить ряд важных тем; хотелось бы более подробно рассмотреть подходы к построению дис- дискретных моделей и численные методы, вопросы «оснащения» моделей и их идентификации, их синтеза и декомпозиции и т. д. По этой же при- причине список литературы включает лишь необходимый минимум — это либо работы, результаты которых непосредственно отражены в текс- тексте, либо ключевые книги, где можно найти дальнейшие ссылки. Подбор материала и манера его изложения отвечают концепци- концепциям отечественной школы математического моделирования, всегда на- находившейся на мировом уровне и широко трактующей данную ме- методологию. Поэтому мы не можем назвать всех своих коллег, об- общение с которыми так или иначе повлияло на содержание книги. Авторы считают своим приятным долгом поблагодарить доктора физико-математических наук Н. В. Змитренко, взявшего на себя не- нелегкий труд по прочтению рукописи и сделавшего ряд ценных заме- замечаний, докторов физико-математических наук Б. Н. Четверушкина, В. Ф. Тишкина и академика РАН А. А. Петрова за предоставлен-
10 ВВЕДЕНИЕ ные материалы и плодотворные дискуссии по актуальным проблемам математического моделирования. Авторы признательны также докто- доктору физико-математических наук В. Я. Карпову, кандидату физико- математических наук А. Е. Королеву, кандидату технических наук В. А. Овсянникову, инженеру В. И. Зелепневу, экономисту О. А. Бу- Бусыгину, финансисту Н. И. Коленько за полезное обсуждение некоторых специальных вопросов. Мы благодарны также сотрудникам Институ- Института математического моделирования РАН Н. Г. Сиротенко и А. С. Бол- дареву, профессионально изготовившим оригинал-макет книги. Надеемся, что наша книга будет интересна и полезна как начи- начинающим, так и опытным исследователям и педагогам, использующим методы математического моделирования и вычислительного экспери- эксперимента в своей научной деятельности. Москва, июнь 1997 г. А. А. Самарский, А. П. Михайлов Вышедшее в свет около трех с половиной лет назад первое издание нашей книги (ее английский перевод будет опубликован в текущем го- году крупным британским издательством «Taylor and Francis publishing group» под названием «Universal Principles of Mathematical Modelling») оказалось весьма востребованным — двухтысячный тираж разошелся в течение трех-четырех месяцев, многие коллеги обращались к нам с просьбой помочь в ее приобретении. К сожалению, большинство этих просьб авторы удовлетворить не могли. Мы надеемся, что второе, ис- исправленное издание в значительной степени смягчит этот объяснимый, но нежелательный дефицит и поможет, через расширение круга чита- читателей книги, дальнейшему развитию отечественной школы математи- математического моделирования. Москва, март 2001 г. А. А. Самарский, А. П. Михайлов
ГЛАВА I ПРОСТЕЙШИЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ И ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ § 1. Элементарные математические модели Рассмотрим некоторые подходы к построению простейших мате- математических моделей, иллюстрирующие применение фундаментальных законов природы, вариационных принципов, аналогий, иерархических цепочек. Несмотря на простоту, привлекаемый материал даст возмож- возможность начать обсуждение таких понятий, как адекватность моделей, их «оснащение», нелинейность, численная реализация и ряда других принципиальных вопросов математического моделирования. 1. Фундаментальные законы природы. Наиболее распро- распространенный метод построения моделей состоит в применении фун- фундаментальных законов природы к конкретной ситуации. Эти законы общепризнаны, многократно подтверждены опытом, служат основой множества научно-технических достижений. Поэтому их обоснован- обоснованность не вызывает сомнений, что, помимо всего прочего, обеспечивает исследователю мощную психологическую поддержку. На первый план выдвигаются вопросы, связанные с тем, какой закон (законы) следует применять в данном случае и как это делать. а) Сохранение энергии. Этот закон известен почти двести лет и занимает, пожалуй, наиболее почетное место среди великих зако- законов природы. Полагаясь на него, эксперт по баллистике, желающий быстро определить скорость револьверной пули и не имею- имеющий поблизости специальной лаборатории, может воспользоваться относительно прос- простым устройством типа маятника — груза, подвешенного на легком жестком и свободно вращающемся стержне (рис. 1). Пуля, заст- застрявшая в грузе, сообщит системе «пуля— груз» свою кинетическую энергию, которая в момент наибольшего отклонения стержня Рис> 1 от вертикали полностью перейдет в потенциальную энергию системы. Эти трансформации описываются цепочкой равенств ////////////////Л I mv2 = (М V2 т) — = (М m)gl(l- cos a).
12 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I Здесь mv2/2 — кинетическая энергия пули массы т, имеющей ско- скорость г?, М — масса груза, V — скорость системы «пуля—груз» сразу после столкновения, д — ускорение свободного падения, / — длина стержня, а — угол наибольшего отклонения. Искомая скорость опре- определяется формулой v = 2(М + m)gl(l -cosa) т A) которая будет вполне точной, если не учитываемые нами потери энер- энергии на разогрев пули и груза, на преодоление сопротивления возду- воздуха, разгон стержня и т. д. невелики. Это, на первый взгляд, разум- разумное рассуждение на самом деле неверно. Процессы, происходящие при «слипании» пули и маятника, уже не являются чисто механическими. Поэтому примененный для вычисления величины V закон сохранения механической энергии несправедлив: сохраняется полная, а не механи- механическая энергия системы. Он дает лишь нижнюю границу для оценки скорости пули (для правильного решения этой простой задачи надо воспользоваться также законом сохранения импульса — см. упр. 1). Сходные рассуждения может применить и инженер для оценки времени tk сверления слоя металла толщины L лазером с мощнос- мощностью W, излучение которого перпендикулярно поверхности материала (рис. 2). Если энергия лазера полностью идет на испарение столбика W W W 0<t<tk dt) t = tk Рис. 2. Начальная, промежуточная и конечная стадии сверления металла лазером металла массы LSp (S — облучаемая площадь, LS — объем столбика, р — плотность вещества), то закон сохранения энергии выражается равенством Ео = Wtk = hLSp, B) где h — энергия, требуемая для испарения единицы массы. Величина h имеет составную структуру: h = (Тпл — Т) h\ + /12 + ^3 •> поскольку
§ 1] ЭЛЕМЕНТАРНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ 13 материал необходимо последовательно нагреть до температуры плав- плавления Тпл, а затем расплавить и превратить в пар (Т — исходная температура, hi — удельная теплоемкость, /i2 и h% — соответственно удельная теплота плавления и парообразования). Изменение глубины выемки l(t) со временем определяется из де- детального баланса энергии в промежутке времени от t до t + dt. На испаренную за это время массу [l(t + dt) -l(t)]Sp = dlSp тратится энергия dl hSp, равная энергии W dt, сообщаемой веществу лазером: dlhSp = Wdt, откуда получается дифференциальное уравнение d/ _ W_ dt ~ hSp ' Его интегрирование (с учетом того, что начальная глубина выемки равна нулю) дает где E{t) — вся энергия, выделенная лазером к моменту времени t. Следовательно, глубина выемки пропорциональна затраченной энер- энергии (причем величина tk, когда l(tk) = L, совпадает с вычисленной по формуле B)). В действительности процесс сверления гораздо сложнее рассмот- рассмотренной схемы — энергия тратится на нагрев вещества, на удаление паров из выемки, которая может иметь неправильную форму, и т. д. Поэтому уверенность в правильности предложенного математического описания значительно меньше, чем в случае с пулей. Вопрос о соответ- соответствии объекта и его модели — один из центральных в математическом моделировании, и в дальнейшем мы будем неоднократно к нему воз- возвращаться. б) Сохранение материи. Именно этим соображением руководству- руководствуется школьник, решающий задачу о заполнении бассейна водой, вте- втекающей и вытекающей из двух труб. Конечно же, область применения этого закона несравненно шире. Пусть, например, имеется небольшое количество радиоактивного вещества (урана), окруженного толстым слоем «обычного» матери- материала (свинца), — ситуация типичная либо при хранении делящихся материалов, либо при их использовании в энергетике (рис. 3). Под словом «небольшой» подразумевается упрощающее обстоятельство, а именно то, что все продукты распада, не испытывая столкновений с атомами вещества, беспрепятственно покидают область I. Другими словами, длина свободного пробега продуктов распада Ai в первом ве- веществе значительно больше характерных размеров самого материа-
14 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I Рис. 3 ла Li, т. е. Ai ^> L\. Слова «толстый слой» означают, что в согла- согласии с целями хранения продукты деления полностью поглощаются в области П. Это гарантирует- гарантируется при выполнении противопо- противоположного условия Ац <С Ьц, где Ац — длина пробега продук- продуктов распада во втором вещест- веществе, Ьц — его характерный раз- размер. Итак, все, что вылетает из области I, поглощается в области II, и суммарная масса обоих веществ со временем не меняется. Это и есть закон со- сохранения материи, применен- примененный к данной ситуации. Если в начальный момент времени t = 0 массы веществ были равны Mi@) и Мц@), то в любой момент времени справедлив баланс Mi @) + МП @) = Mi («) + МП (*). D) Одного уравнения D), очевидно, недостаточно для определения те- текущих значений двух масс — M\(t) и Mn(t). Для замыкания матема- математической формулировки необходимо привлечь дополнительное сообра- соображение о характере распада. Оно гласит, что скорость распада (число атомов, распадающихся в единицу времени) пропорционально общему числу атомов радиоактивного вещества. За небольшое время dt между моментами t и t + dt всего распадется Ni(t + dt) -Ni(t) = -aNi(t + ?dt), a > 0, 0 < f < 1, атомов. Здесь вторично использован закон сохранения вещества, но применительно не ко всему процессу, а к отрезку времени dt. В этом уравнении, описывающем баланс атомов, в правой части стоит знак минус (вещество убывает), а величина N\ (t + ? dt) отвечает некоторо- некоторому среднему значению числа атомов за рассматриваемое время. Пере- Перепишем его в дифференциальной форме: dt = -aNi(t). Учитывая, что M\(t) = лучаем ), где атомный вес вещества I, по- dMi(t) = -aMi(t). E) При самопроизвольной радиоактивности любой атом имеет неко- некоторую не зависящую от состояния окружающего вещества вероятность распада. Поэтому чем больше (меньше) самого радиоактивного ве- вещества, тем больше (меньше) выделяется продуктов распада в еди- единицу времени. Коэффициент пропорциональности а > 0 (постоянная распада) определяется конкретным веществом.
§ 1] ЭЛЕМЕНТАРНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ 15 Уравнения D), E) вместе с условиями Ai ^> Li, Ац <С Ьц, а также величинами a, Mi@), Мц@) и составляют математическую модель рассматриваемого объекта. Интегрируя E), получаем, что масса делящегося материала убы- убывает по экспоненциальному закону и при t —У оо в области I вещество полностью исчезает. Так как суммарная масса в соответствии с D) остается постоян- постоянной, то в области II количество вещества растет: Mn(t) = Мц@) + Mi(O) - Mi(O) e~at = Мц@) + Mi(O) (l - е"а*) , и при t —у оо продукты распада полностью переходят из области I в область П. в) Сохранение импульса. Неподвижно стоящая в безветренную по- погоду на поверхности озера лодка начнет двигаться вперед, если сделать несколько шагов от ее носа к корме. Так проявляет себя закон сохране- сохранения импульса, утверждающий: полный импульс системы, не испыты- испытывающей действия внешних сил, сохраняется. На передвижение гребца лодка реагирует смещением в противоположную сторону. Принцип реактивного движения положен в основу многих заме- замечательных технических устройств, например, ракеты, выводящей на орбиту вокруг Земли искусственный спутник, для чего ей требуется развить скорость примерно 8 км/с. Простейшая математическая мо- модель движения ракеты получается из закона сохранения импульса в пренебрежении сопротивлением воздуха, гравитацией и другими си- силами, исключая, конечно, тягу реактивных двигателей. Пусть продукты сгорания ракетного топлива покидают располо- расположенные в кормовой части выхлопные сопла со скоростью и (для со- современных топлив величина и равна 3-5 км/с). За малый промежуток времени dt между моментами t и t + dt часть топлива выгорела, и масса ракеты изменилась на величину dm. Изменился также импульс ракеты, однако суммарный импульс системы «ракета плюс продукты сгорания» остался тем же, что и в момент t, т. е. m(t) v(t) = m(t + dt) v(t + dt) - dm [v(t + ?dt)-u], где v(t) — скорость ракеты, v(t + ?dt) —и, 0 < ? < 1 — средняя за про- промежуток dt скорость истекающих из сопел газов (обе скорости берутся относительно Земли). Первый член в правой части этого равенства — импульс ракеты в момент t + dt, второй — импульс, переданный исте- истекающим газом за время dt. Учитывая, что m(t + dt) = m(t) + (dm/dt) dt + O(dt2), закон сохра- сохранения импульса можно переписать в виде дифференциального уравне- уравнения dv dm т —- = — и, dt dt
16 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I в котором член — (dm/dt) и, очевидно, не что иное, как сила тяги ра- ракетных двигателей, и которое, будучи преобразованным к виду dv d(ln m) dt ~ dt ' легко интегрируется: m(t) где г?о, то — соответственно скорость и масса ракеты в момент t = = 0. Если г?о = 0, то максимальная скорость ракеты, достигаемая при полном сгорании топлива, равна т / то \ v = ит[ . (о) \тр + msj Здесь Шр — полезная масса (масса спутника), ms — структурная масса (масса собственно ракетной конструкции — топливных баков, двига- двигателей, систем управления и т. д.). Простая формула Циолковского F) позволяет сделать фундамен- фундаментальный вывод о конструкции ракеты для космических полетов. Вве- Введем величину Л = , которая характеризует при тр = 0 отно- ТПо — ТПр шение структурной и начальной масс ракеты. Тогда для практически реальных значений Л = 0,1, и = 3 км/с получаем при тр = 0 v = и\п{1/\) = 7 км/с. Отсюда следует, что даже в самой идеальной ситуации (полезная масса равна нулю, отсутствуют гравитация и сопротивление возду- воздуха и т. д.) ракета рассматриваемого типа не способна достичь первой космической скорости. Тем самым необходимо использовать многосту- многоступенчатые ракеты — вывод, к которому пришли основоположники кос- космонавтики. Данный пример иллюстрирует также своего рода принцип «наи- «наибольшего благоприятствия», часто используемый на начальной стадии математического моделирования сложных объектов: если объект, по- поставленный в наилучшие условия, не в состоянии достичь требуемых характеристик, то надо изменить сам подход к объекту либо смягчить требования к нему; если же требования в принципе достижимы, то следующие шаги связаны с исследованием влияния на объект допол- дополнительных осложняющих факторов. 2. Вариационные принципы. Еще один подход к построению моделей, по своей широте и универсальности сопоставимый с возмож- возможностями, даваемыми фундаментальными законами, состоит в приме- применении так называемых вариационных принципов. Они представляют собой весьма общие утверждения о рассматриваемом объекте (систе- (системе, явлении) и гласят, что из всех возможных вариантов его поведения (движения, эволюции) выбираются лишь те, которые удовлетворяют определенному условию. Обычно согласно этому условию некоторая
§1] ЭЛЕМЕНТАРНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ 17 связанная с объектом величина достигает экстремального значения при его переходе из одного состояния в другое. Допустим, автомобиль, движущийся с постоянной скоростью v, должен попасть из точки А в точку В и при этом коснуться некото- некоторой прямой линии С (рис. 4). Водитель автомобиля очень торопится и выбирает из множества траекторий путь, требующий минимальных Рис. 4. Различные траектории движения из точки А в точку В с касанием прямой С. Жирной линией выделен быстрейший путь затрат времени. Представим затраченное время как функцию величи- величины а — угла между прямой и отрезком пути от точки А до прямой: , ч а Ь t{a) = — + . ш л • г? sin a vsm/j(a) Здесь а и Ъ — длины перпендикуляров, опущенных из точек А и В на прямую, Р(а) — угол между прямой и отрезком пути из точки касания до точки В. Условие экстремальности t(a) по аргументу а означает, что dt(a) da ИЛИ a cos a sin2 a + = о, sin2/3(a) da G) Для любых значений а справедливо равенство а Ъ с = tga tg/3(a) ' 2 А. А. Самарский, А. П. Михайлов
18 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I где с — расстояние между проекциями точек А и В на прямую (оди- (одинаковое для всех траекторий). Дифференцируя его, получаем соотно- соотношение а sin2 a sin2 j3(a) da (8) которое вместе с условием минимальности G) означает cos a = cos /3(a), т. е. равенство углов а и [5 (см. упр. 5). Далее нетрудно найти сами значения ат-ш, tm-in через заданные ве- величины а, 6, с. Однако сейчас для нас важно другое — условие мини- минимальных затрат времени привело к выбору соответствующей траекто- траектории по правилу «угол падения равен углу отражения». Но ведь такому закону подчиняется и ход светового луча, попадающего на отражаю- отражающую поверхность! Может быть, и в общем случае лучи света движутся по траекториям, обеспечивающим быстрейшее попадание сигнала из одной точки в другую? Да, именно так и происходит согласно извест- известному вариационному принципу Ферма, опираясь на который, можно получить все основные законы геометрической оптики. Покажем это, рассмотрев преломление лучей на границе двух сред (рис. 5). Свет, выходящий из точки Л, движется в первой среде со ско- скоростью vaj преломляется и, переходя через линию раздела, двигается I va С п щ Рис. 5. Возможные траектории световых лучей, идущих из точки А в точку В и преломляющихся на линии С — границе раздела двух сред. Жирной линией выделена траектория, отвечающая закону преломления cos a/ cos /3 = va 1щ во второй среде со скоростью Уь и попадает в точку В. Если а — угол падения луча, а C(а) — угол его преломления, то время прохождения
§ 1] ЭЛЕМЕНТАРНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ 19 из А в В равно а Ъ vsma Условие минимальности t(a) записывается в виде (ср. с G)) a cos a b cos a d/3 _ vasma Vb sin C{a) da а продифференцированное по а условие постоянства величины с по- прежнему выражается формулой (8). Здесь величины а, 6, с имеют тот же смысл, что и в предыдущем случае. Исключая из последней формулы производную d/3 /da, приходим к равенству cosa г^ cos р vt т. е. к известному закону преломления света. Сформулированные применительно к какому-либо классу явлений вариационные принципы позволяют единообразно строить соответ- соответствующие математические модели. Их универсальность выражается также в том, что, используя их, можно в определенной степени отвле- отвлекаться от конкретной природы процесса. Так, водитель автомобиля, следующий принципу «минимального времени» и желающий попасть из точки Л, находящейся на песчаной почве (одна скорость), в точ- точку Б, расположенную на травянистом лугу (другая скорость), обязан поехать не по прямой, соединяющей А и Б, а по ломанной траекто- траектории, сделав необходимое «преломление» на линии, разделяющей песок и траву. 3. Применение аналогий при построении моделей. В огром- огромном числе случаев при попытке построить модель какого-либо объекта либо невозможно прямо указать фундаментальные законы или вариа- вариационные принципы, которым он подчиняется, либо, с точки зрения наших сегодняшних знаний, вообще нет уверенности в существова- существовании подобных законов, допускающих математическую формулировку. Одним из плодотворных подходов к такого рода объектам является использование аналогий с уже изученными явлениями. Что, казалось бы, общего между радиоактивным распадом и динамикой популяций, в частности изменением численности населения нашей планеты? Од- Однако на простейшем уровне такая аналогия вполне просматривается, о чем свидетельствует одна из простейших моделей популяций, назы- называемая моделью Мальтуса. В ее основу положено простое утвержде- утверждение — скорость изменения населения со временем t пропорциональна его текущей численности N(t), умноженной на сумму коэффициентов рождаемости a(t) ) 0 и смертности /3(t) ^ 0. В результате приходим к уравнению *W. = [a{t)-0(t)]N(t), A0) весьма похожему на уравнение радиоактивного распада и совпадаю- совпадающего с ним при а < C (если а и [3 постоянные). Это неудивительно, 2*
20 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I так как при их выводе использовались одинаковые сображения. Интег- Интегрирование уравнения A0) дает N(t) = N@) ехр dt где iV@) = N(t = to) — начальная численность. На рис. 6 приведены графики функции N(t) при постоянных а и /3 (разным подобным друг другу кривым соответствуют разные to — значения времени начала процесса). При а = /3 численность остается постоянной, т. е. в этом случае решением уравнения является рав- равновесная величина N(t) = N@). Равновесие между рождаемостью и N@) toi = 0 to 2 ^03 ^04 Рис. 6. Изменение численности популяции со временем в модели Мальтуса смертностью неустойчиво в том смысле, что даже небольшое наруше- нарушение равенства а = /3 приводит с течением времени ко все большему отклонению функции N(t) от равновесного значения N@). При а < /3 численность населения убывает и стремится к нулю при t —> оо, а при а > C растет по некоторому экспоненциальному закону, обращаясь в бесконечность при t —> оо. Последнее обстоятельство и послужило ос- основанием для опасений Мальтуса о грядущем перенаселении Земли со всеми вытекающими отсюда последствиями. Как в данном примере, так и в ряде рассмотренных выше случаев можно указать немало очевидных ограничений применимости постро- построенной модели. Конечно же, сложнейший процесс изменения численнос- численности населения, зависящий к тому же от сознательного вмешательства самих людей, не может описываться какими-либо простыми законо- закономерностями. Даже в идеальном случае изолированной биологической популяции предложенная модель не отвечает реальности в полной мере хотя бы из-за ограниченности ресурсов, необходимых для ее сущест- существования. Сделанное замечание тем не менее нисколько не умаляет роли ана- аналогий в построении математических моделей очень сложных явлений.
§ 1] ЭЛЕМЕНТАРНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ 21 Применение аналогий основано на одном из важнейших свойств моде- моделей — их универсальности, т. е. их приложимости к объектам прин- принципиально различной природы. Так, предположения типа «скорость изменения величины пропорциональна значению самой величины (или некоторой функции от нее)» широко используются в далеких друг от друга областях знаний. 4. Иерархический подход к получению моделей. Лишь в редких случаях бывает удобным и оправданным построение матема- математических моделей даже относительно простых объектов сразу во всей полноте, с учетом всех факторов, существенных для его поведения. Поэтому естествен подход, реализующий принцип «от простого — к сложному», когда следующий шаг делается после достаточно подроб- подробного изучения не очень сложной модели. При этом возникает цепочка (иерархия) все более полных моделей, каждая из которых обобщает предыдущие, включая их в качестве частного случая. Построим такую иерархическую цепочку на примере модели мно- многоступенчатой ракеты. Как было установлено в конце п. 1, реальная одноступенчатая ракета неспособна развить первую космическую ско- скорость. Причина этого — затраты горючего на разгон ненужной, от- отработавшей части структурной массы. Следовательно, при движении ракеты необходимо периодически избавляться от балласта. В практи- практической конструкции это означает, что ракета состоит из нескольких ступеней, отбрасываемых по мере их использования. Пусть rrii — общая масса г-й ступени, Xrrii — соответствую- соответствующая структурная масса (при этом масса топлива равна величине A — Х)гпг), тр — масса полезной нагрузки. Величины Л и скорость истечения газов и одинаковы для всех ступеней. Возьмем для опреде- определенности число ступеней п = 3. Начальная масса такой ракеты равна 7710 = Шр + ?71i + 7712 + Ш3. Рассмотрим момент, когда израсходовано все топливо первой ступени и масса ракеты равна величине nip + Ami + га2 + га3. Тогда по формуле F) первоначальной модели скорость ракеты равна гп0 171 — U In га2 + га3 После достижения скорости v\ структурная масса Ami отбрасывается и включается вторая ступень. Масса ракеты в этот момент равна тр + 1712 + ?^3- Начиная с этого момента и до момента полного выгорания топлива второй ступени, ничто не мешает пользоваться уже построенной мо- моделью, применив ее к рассматриваемому случаю. Все рассуждения о сохранении суммарного импульса и соответствующие выкладки оста- остаются в силе (следует только учесть, что у ракеты уже есть начальная
22 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I скорость i?i). Тогда по формуле F) после выгорания топлива во второй ступени ракета достигает скорости v2 = vi + ит тр + га2 + га3 —-— тр + Лга2 + га3 Такие же рассуждения применимы и к третьей ступени ракеты. После отключения ее двигателей скорость ракеты равна , f тр + т3 v3 = v2 + ит[ —-— \тр + Ага3 Эту цепочку нетрудно продолжить для любого числа ступеней и получить соответствующие формулы. В случае же п = 3 для оконча- окончательной скорости имеем ^о_ _л ) i шо \ ( тр + т2 + т3 \ ( тр + т3 и \ \тпр + Arai + т2 + т3) \тр + Хт2 + т3) \тр + Агаз га^о тПг, + т2 + газ или, вводя величины а\ = , а2 = — , а3 = rrip + m2 + m3 rrip + газ rrip + га3 = — , получаем гао а2 \ а3 — =1п и Данное выражение симметрично по отношению к величинам а\, а2, аз, и нетрудно показать, что его максимум достигается в симметричном случае, т. е. при а± = а2 = а3 = а. При этом для г = 3 1-А Р - ехр (- ^Л V 6U/ Произведение aia2«3 = <^ равно, как легко проверить, отношению /р, или з гао / 1 - Ах 3 Р-\, Для многоступенчатой ракеты, аналогично, имеем га0 /1-А P-\ где п — число ступеней. A1)
§ 1] ЭЛЕМЕНТАРНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ 23 Проанализируем формулу A1). Примем vn = 10,5 км/с, Л = 0,1. Тогда для п = 2, 3, 4 получаем т0 = 149 тр, т0 = 77 тр, т0 = 65 тр соответственно. Это значит, что двухступенчатая ракета пригодна для выведения на орбиту некоторой полезной массы (однако при од- одной тонне полезного груза необходимо иметь ракету весом 149 тонн). Переход к третьей ступени уменьшает массу ракеты почти в два раза (но, конечно же, усложняет ее конструкцию), а четырехступенчатая ракета не дает заметного выигрыша по сравнению с трехступенчатой. Построение иерархической цепочки позволило относительно прос- просто прийти к этим важным выводам. Иерархия математических моде- моделей часто строится и по противоположному принципу «от сложного к простому». В этом случае реализуется путь «сверху вниз» — из до- достаточно общей и сложной модели при соответствующих упрощающих предположениях получается последовательность все более простых (но имеющих уменьшающуюся область применимости) моделей. 5. О нелинейности математических моделей. Простота рас- рассмотренных выше моделей во многом связана с их линейностью. В математическом плане это важное понятие означает, что справедлив принцип суперпозиции, т. е. любая линейная комбинация решений (на- (например, их сумма) также является решением задачи. Пользуясь прин- принципом суперпозиции, нетрудно, найдя решение в каком-либо частном случае, построить решение в более общей ситуации. Поэтому о качест- качественных свойствах общего случая можно судить по свойствам частно- частного — различие между двумя решениями носит лишь количественный характер. Например, увеличение в два раза скорости истечения ракет- ракетного топлива ведет также к двукратному увеличению скорости ракеты, уменьшение угла падения светового луча на отражающую поверхность означает такое же изменение угла отражения и т. д. Другими слова- словами, в случае линейных моделей отклик объекта на изменение каких-то условий пропорционален величине этого изменения. Для нелинейных явлений, математические модели которых не под- подчиняются принципу суперпозиции, знание о поведении части объекта еще не гарантирует знания поведения всего объекта, а его отклик на изменение условий может качественно зависеть от величины этого из- изменения. Так, уменьшение угла падения луча света на границу разде- раздела двух сред приводит к уменьшению угла преломления, но только до определенного предела. Если угол падения становится меньше крити- критического (см. формулу (9)), то происходит качественное изменение — свет перестает проникать через границу раздела во вторую среду, ес- если она менее плотная, чем первая. Тем самым преломление света — пример нелинейного процесса. Большинство реальных процессов и соответствующих им матема- математических моделей нелинейны. Линейные же модели отвечают весьма частным случаям и, как правило, служат лишь первым приближени- приближением к реальности. Например, популяционные модели сразу становятся нелинейными, если принять во внимание ограниченность доступных популяции ресурсов. При их выводе считается, что: 1) существует «равновесная» численность популяции Np, которую может обеспечить окружающая среда;
24 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I 2) скорость изменения численности популяции пропорциональна самой численности, умноженной (в отличие от модели Мальтуса) на величину ее отклонения от равновесного значения, т. е. dN a>0- A2) Член A — N/Np) в этом уравнении обеспечивает механизм «насыще- «насыщения» численности — при N < Np (N > Np) скорость роста положи- положительна (отрицательна) и стремится к нулю, если N —> Np. N(t) ЛГр/2 Рис. 7. Логистические кривые, соответствующие различным значениям начальной численности N@) Представляя уравнение A2) в виде dN dN + — = adt Np-N N и интегрируя его, получаем - ln(Np - N) + In N = at + С. Постоянная интегрирования определяется из условия N(t = 0) = iV@), т. е. С = In ((Np - N@))~гN@)). В результате находим АГ(О) N~NpNp- N@) или, в окончательном виде, eat - N „at p - N@) ' N(t) = NpN@) e ,at Np - N@) A - e at\ Поведение функции N(t) описывается так называемой логистической кривой (рис. 7). При любом N@) численность стремится к равновес-
§ 1] ЭЛЕМЕНТАРНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ 25 ному значению Np, причем тем медленней, чем величина N(i) ближе к N@). Тем самым равновесие, в отличие от случая модели A0), устой- устойчиво. Логистическая модель более реалистично отражает динамику по- популяции в сравнении с моделью Мальтуса, но сама она с необходимос- необходимостью становится нелинейной и поэтому более сложной. Заметим, что предположения о механизмах насыщения используются при построе- построении многих моделей в различных областях знаний. 6. Предварительные выводы. Процесс построения моделей мо- может быть условно разбит на следующие этапы. 1. Конструирование модели начинается со словесно-смыслового описания объекта или явления. Помимо сведений общего характера о природе объекта и целях его исследования эта стадия может содержать также некоторые предположения (невесомый стержень, толстый слой вещества, прямолинейное распространение световых лучей и т. д.). Данный этап можно назвать формулировкой пред моде ли. 2. Следующий этап — завершение идеализации объекта. Отбрасы- Отбрасываются все факторы и эффекты, которые представляются не самыми существенными для его поведения. Например, при составлении балан- баланса материи (п. 16)) не учитывался, ввиду его малости, дефект масс, ко- которым сопровождается радиоактивный распад. По возможности идеа- идеализирующие предположения записываются в математической форме (подобно условию Ai ^> L\ в п. 16)), с тем чтобы их справедливость поддавалась количественному контролю. 3. После выполнения первых двух этапов можно переходить к вы- выбору или формулировке закона (вариационного принципа, аналогии и т. п.), которому подчиняется объект, и его записи в математической форме. При небходимости используются дополнительные сведения об объекте, также записываемые математически (например, постоянство величины с для всех траекторий лучей света, вытекающее из геомет- геометрии задачи; п. 2). Следует иметь в виду, что даже для простых объ- объектов выбор соответствующего закона отнюдь не тривиальная задача (см. упр. 1). 4. Завершает формулировку модели ее «оснащение». Например, необходимо задать сведения о начальном состоянии объекта (скорость ракеты и ее массу в момент t = 0) или иные его характеристики (ве- (величины /, д в п. la); a, Ai, Ац в п. 16); a(t) и /3(t) в п. 3), без знания которых невозможно определить поведение объекта. И, наконец, фор- формулируется цель исследования модели (найти закон преломления света, достичь понимания закономерностей изменения популяции, определить требования к конструкции ракеты, запускающей спутник, и т. д.). 5. Построенная модель изучается всеми доступными исследовате- исследователю методами, в том числе со взаимной проверкой различных подходов (см., например, упр. 4, 7). В отличие от рассматриваемых в § 1 прос- простейших случаев, большинство моделей не поддаются чисто теорети- теоретическому анализу, и поэтому необходимо широко использовать вычис- вычислительные методы. Это обстоятельство особенно важно при изучении нелинейных объектов, так как их качественное поведение заранее, как правило, неизвестно.
26 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I 6. В результате исследования модели не только достигается по- поставленная цель, но и должна быть установлена всеми возможными способами (сравнением с практикой, сопоставлением с другими подхо- подходами) ее адекватность — соответствие объекту и сформулированным предположениям. Неадекватная модель может дать результат, сколь угодно отличающийся от истинного (ср. формулу A) и результат упр. 1), и должна быть либо отброшена, либо соответствующим об- образом модифицирована. УПРАЖНЕНИЯ 1. В первой задаче п. 1, а) примените для нахождения величины V (скорости системы «пуля—груз» сразу после столкновения) не закон сохранения энергии, а закон сохранения импульса. Убедитесь, что для скорости пули v получается форму- формула, дающая значение в ((М + т)/т) /2 раз меньше, чем получающееся по формуле 2. Пусть мощность лазера, сверлящего материал (п. 1, а)), зависит от време- времени, т. е. W = W(t). Как изменится формула C)? Остается ли в силе утверждение о том, что глубина выемки пропорциональна затраченной энергии? 3. Найдите момент времени, когда распадается последний атом радиоактив- радиоактивного вещества (п. 1, б)). Почему в модели E) вещество распадается полностью лишь при t —> оо? 4. Предположим, что в п. 1, в) рассматривается «идеальная» одноступенчатая ракета, у которой непрерывно отбрасывается отработавшая и ставшая ненужной часть структурной массы (к моменту полного сгорания топлива ms = 0). Поль- Пользуясь законом сохранения импульса, покажите, что максимальная скорость такой ракеты определяется по формуле v = A — Л) и\п(то/тр). Сравните ее с формулой F). Почему идеальная ракета может достичь любой скорости? 5. Проверьте с использованием (8), что условие G) есть условие минимальнос- минимальности для величины t(a). Из рис. 5 определите, какая скорость больше — va или уь? Пользуясь формулой (9), найдите, при каких углах а лучи света не проникают из среды а в среду Ь, т. е. когда реализуется эффект «полного внутреннего отражения света», используемый в ряде технических устройств. 6. Определите, как себя должна вести при больших t величина r(t) = a(t) — — C(t) > 0 в модели Мальтуса A0), чтобы численность популяции оставалась огра- ограниченной при t —>¦ оо. 7. Перейдите в формуле A1) для многоступенчатой ракеты к пределу при п —> оо и убедитесь, что ее предельная скорость вычисляется по формуле для иде- идеальной ракеты из упр. 4. Почему результаты совпадают? 8. Рассмотрите в логистической модели A2) малые отклонения от положе- положения равновесия, т. е. ситуацию, когда решение имеет вид N(t) = Np + SN(t), где \SN(t)\ <C Np. Покажите, что для величины SN(t) в первом приближении справед- справедлива линейная модель типа модели Мальтуса A0). § 2. Примеры моделей, получаемых из фундаментальных законов природы По сравнению с п. 1 из § 1 более подробно и для более сложных объектов рассмотрим модели, следующие из законов Архимеда, Нью- Ньютона, Кулона и других хорошо известных законов. Обсудим некоторые свойства рассматриваемых объектов. 1. Траектория всплытия подводной лодки. Пусть подводная лодка, находящаяся в момент времени t = 0 на глубине Н от поверх- поверхности моря и движущаяся с постоянной горизонтальной скоростью v
§2] МОДЕЛИ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ ПРИРОДЫ 27 (рис. 8), получает приказ подняться на поверхность. Если промежу- промежуток времени, за который цистерны подлодки освобождаются от воды и заполняются воздухом, с тем чтобы ее средняя плотность pi ста- стала меньше плотности воды ро, невелик, то можно считать, что в момент t = 0 на подлодку начинает дей- действовать выталкивающая сила, большая, чем вес лодки. По закону Архимеда вытал- выталкивающая сила равна F = gVpo, где д — ускорение свободного падения, V — объ- объем подлодки. Суммарная сила, действую- действующая на подлодку в вертикальном направ- направлении, — разность между F и весом тела Р = gVpi, а сообщаемое ею ускорение по второму закону Ньютона равно d2h „ „ "* Рис. 8 Координата /, характеризующая горизон- горизонтальное положение подлодки, изменяется по закону движения тела с постоянной скоростью: dl Решая эти уравнения, находим, что (i) и что лодка всплывет на поверхность в момент t = tk, когда tk = PiH 72 pi '" \g(po-pi)/ При этом в горизонтальном направлении подлодка пройдет расстояние PiH L = vtu = д(ро -pi) Исключая из A) время, найдем траекторию движения подлодки в координатах (l,h) которая оказывается параболой с вершиной в точке / = 0, h = 0 (при вы- выводе A) вертикальная скорость лодки, а также величины / и h прини- принимались равными нулю в момент t = 0). Считалось также, что никакие другие вертикальные силы, кроме F и Р, на подлодку не действуют. Это предположение верно лишь при малых скоростях всплытия, когда можно пренебречь сопротивлением воды движению лодки (см. упр. 1). Итак, непосредственное применение закона Архимеда, определяю- определяющего величину выталкивающей силы, и закона Ньютона, связывающе-
28 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I го силу, действующую на тело, и его ускорение, позволило легко найти траекторию подлодки. Очевидно, что параболической траекторией об- обладает любое движущееся в плоскости тело, имеющее по одному из направлений постоянную скорость и на которое в другом направлении действует постоянная сила (уравнения A) фактически дают парамет- параметрическую запись параболы). К таким движениям относятся, например, полет камня, брошенного с высоты Н с горизонтальной скоростью v или полет электрона в электрическом поле плоского конденсатора. Од- Однако в последнем случае получить траекторию тела непосредственно из фундаментальных законов нельзя, требуется применить более де- детальную процедуру. Рассмотрим этот вопрос подробнее. 2. Отклонение заряженной частицы в электронно-лучевой трубке. Будем считать, что обкладки конденсатора электронно- электроннолучевой трубки (рис. 9) представляют собой бесконечные плоскости Рис. 9 (предположение справедливо в случае, если расстояние между обклад- обкладками много меньше их размеров, а электрон движется на большом удалении от их краев; упр. 2). Очевидно, что электрон будет притя- притягиваться к нижней обкладке и отталкиваться от верхней. Сила при- притяжения F двух разноименных зарядов элементарно определяется из закона Кулона F = Г2
§ 2] МОДЕЛИ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ ПРИРОДЫ 29 где q\ и д2 — величины зарядов, г — расстояние между ними. Слож- Сложность заключается в том, что в данном примере на обкладке находит- находится бесконечно много зарядов, каждый из которых расположен на своем расстоянии от движущегося электрона. Поэтому необходимо сначала найти силу, индуцируемую каждым зарядом, и затем, просуммировав все элементарные силы, определить результирующее действие обкла- обкладок на электрон. Разобьем всю плоскость нижней обкладки на элементарные «по- «полоски», характеризующиеся координатами г\, г2, т3; — оо < т\, г3 < оо; г2 = О (см. рис. 9). Подсчитаем силу притяжения электрона зарядом, находящемся на элементарной площадке ds = dr\ dr3 и равным dq = qods, где qo — поверхностная плотность заряда на обкладке. Если частица находится на расстоянии г2 от заряженной плоскости, то d (у dn = r2 (tg(a + da) - tga) = r2 — COS OL (здесь учитывается малость величны da). Для определения величины dr^ имеем г3 + dr3 = tg(/3 + df3) r3 = tg/3 ri + dri sin(a + da) r2 tga Из последних двух формул находим А ( , А dr3 = (n + d sin a где, аналогично предыдущему, учтена также и малость величины d/3. Умножая dr\ на dr3 и отбрасывая член более высокого порядка ма- малости, получаем ds = r2ri da d/3/(cos2 a cos2 /3 sin a). Сила притяжения электрона с зарядом qe к элементарной площадке ds равна da df3 r2 cos2 a cos2 C sin a ' где f — «среднее» расстояние от электрона до площадки, кото- которое с учетом малости величин da, dC вычисляется по формуле г = = r2/(cosacos/3). В итоге для элементарной силы имеем П dad/3 qeq0 dp = qeqo ; = da dp, r2 sin a cos a а для ее вертикальной составляющей dF± = dF cos /3 cos a = qeqo cos /3 da d/3. Проинтегрировав выражение для F± по [3 от [3 = 0 до [3 = тг/2, найдем силу притяжения электрона к части элементарной «полоски», расположенной в квадранте г\ > 0, г3 > 0: = qeqoda.
30 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I Просуммировав dF^~ a по а от а = 0 до а = тг/2, т. е. по всем полоскам квадранта г\ > 0, гз > 0, определим силу притяжения, индуцируемую зарядами, расположенными в этом квадранте: dF+ = -qeqo. Учитывая действие всех четырех квадрантов плоскости нижней обкладки и проводя аналогичные рассуждения для верхней обкладки, получим результирующую силу притяжения (отталкивания) электро- электрона ко всем зарядам конденсатора F = 4irqeq0. B) Сила F направлена вдоль оси г 2 к нижней обкладке (составляющие F по осям ri, Гз, очевидно, равны нулю в силу симметрии — чтобы убе- убедиться в этом, достаточно рассмотреть действие заряда, находящегося на площадке, расположенной в квадранте г\ < 0, гз < 0 и симметрич- симметричной площадке ds). Поскольку сила F не зависит от г 2, а по горизонтальной оси час- частица движется с постоянной скоростью v, то приходим к ситуации предыдущего пункта — применив второй закон Ньютона, легко полу- получить формулы, аналогичные A), описывающие движение электрона по параболической траектории и дающие возможность вычислить все ее параметры. Однако в отличие от случая с подлодкой прямое приме- применение фундаментального закона Кулона для получения модели движе- движения электрона оказывается невозможным. Потребовалось, опираясь на фундаментальный закон, сначала описать элементарный акт взаимо- взаимодействия зарядов, и уж затем, просуммировав все эти акты, удалось найти результирующую силу. Подобная ситуация и последовательность действий весьма типич- типичны при построении моделей, так как многие фундаментальные за- законы устанавливают взаимоотношения как раз между элементарными частя- частями исходного объекта. Это, разумеется, справедливо не только для электричес- электрических сил, но, например, и для сил тяго- тяготения. 3. Колебания колец Сатурна. Построим модель движения точечной массы Мо в поле сил тяготения, соз- создаваемом материальным кольцом с ра- радиусом Rq и линейной плотностью ро. Кольцо считается бесконечно тонким, движение происходит вдоль оси кольца Рис- 10 (рис. 10). Данная схема может рассмат- рассматриваться как идеализация процесса колебаний колец Сатурна. Тем не менее, несмотря на существенные упрощения, непосредственное ис- использование закона всемирного тяготения _ — I
§ 2] МОДЕЛИ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ ПРИРОДЫ 31 где F — сила притяжения двух тел, имеющих массы то и mi, г — расстояние между ними, j — постоянная тяготения, не может дать окончательной модели движения колец Сатурна, так как массы то, mi должны быть точечными. Поэтому вычислим сначала силу притяжения между точечной массой Mq и массой dm, содержащейся в малом элементе кольца dl, которую уже можно считать точечной: Здесь R, г — соответственно расстояние от массы Mq до кольца и до центра кольца. Очевидно, что при 0 ^ а ^ тг/2 (для тг/2 ^ а ^ 2тг выкладки аналогичны) Ro . Ro г г —— = sin а = —. , — = — cos а = —; Поскольку dm = ро dl = poRo df3 = —portgadf3, то db = —7 rtgadp = —7 sm a cos a ap. Найдем проекцию силы dF на ось г (именно эта проекция определяет интересующее нас движение): dF± = dF cos a = —j sin a cos2 a dC. r Просуммировав теперь силы тяготения, создаваемые всеми элемента- элементами кольца, т. е. взяв интеграл от dF± по C от C = 0 до C = 2тг, найдем результирующую силу: F = -2тг7 —— sin a cos2 а = -7М0М1 ^- , C) (г2+Д§)* где Mi = 27rRopo — полная масса кольца. Как и в предыдущем пунк- пункте, горизонтальная проекция результирующей силы равна нулю из-за симметричного расположения кольца относительно массы Mq. Сила тяготения C) существенно отличается от выражения, давае- даваемого законом для точечных масс, переходя в него лишь при г ^> i?o, когда кольцо можно уподобить точечной массе благодаря большому, в сравнении с размерами кольца, расстоянию между тяготеющими те- телами. Если же г <^ Ro, то M0Mi и сила притяжения, в противоположность случаю точечных масс, убы- убывает с уменьшением расстояния между объектами (еще один предель- предельный переход рассмотрен в упр. 3).
32 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I Применив к массе Mq второй закон Ньютона, получим уравнение ее движения вдоль оси г: сРг г — = -1М1 — -j- , которое, в отличие от п. 1 и п. 2, существенно нелинейно и становится линейным лишь при г <С Ro- d2r Mx D) 4. Движение шарика, присоединенного к пружине. В полу- получении моделей пп. 1-3 главную роль играли фундаментальные законы, определявшие происхождение и величину сил, действующих на объект, а второй закон Ньютона был как бы вспомогательным и применялся на последней стадии построения мо- модели. Конечно же, такое деление чис- чисто условно. Ведь если речь идет о за- задачах динамики, то можно использо- использовать и другую схему — сначала свя- зать с помощью закона Ньютона про- Рис и екции ускорения тела с проекциями действующих на него сил, а затем, исходя из тех или иных соображений, вычислить эти силы как функ- функции координат, получив замкнутую модель. Продемонстрируем этот подход на примере модели движения шарика, присоединенного к пру- пружине, с жестко закрепленным концом (рис. 11). Пусть г — координата шарика вдоль оси пружины, лежащей на горизонтальной плоскости, и направление движения шарика совпадает с ее осью. Тогда по второму закону динамики d2r F = ma = m — , где m — масса шарика, а — его ускорение. Будем считать плоскость идеально гладкой (т. е. движение происходит без трения), пренебре- пренебрежем также сопротивлением воздуха и примем во внимание то, что вес шарика уравновешивается реакцией плоскости. Единственная си- сила, действующая на шарик в направлении оси г, очевидно, сила упру- упругости пружины. Определим ее, используя закон Гука, гласящий, что для растяжения (сжатия) пружины необходимо приложить силу F = -кг, где коэффициент к > 0 характеризует упругие свойства пружины, а г — величну ее растяжения или сжатия относительно нейтрального, ненагруженного положения г = 0. Уравнение движения шарика прини- принимает вид (уравнение элементарного осциллятора) d2r m — = -кг, t > 0. E)
§ 2] МОДЕЛИ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ ПРИРОДЫ 33 Оно описывает его гармонические колебания и имеет общее решение г = A sin cut + В cos cut, F) где uj = \fkjm — собственная частота колебаний системы «пружина— шарик». Значения А и В легко определяются из начального состояния объекта, т. е. через величины r(t = 0) = го и v(t = 0) = vo (v(t) — ско- скорость шарика), причем r(t) =0 при г о = vo = 0. Заметим, что урав- уравнение D) с точностью до обозначений совпадает с E), поэтому в п. 3 речь также шла о процессе колебаний, но применительно к системе «Сатурн—кольцо». Подходы, с помощью которых строились модели данного пара- параграфа, не должны, разумеется, противоречить другим фундаменталь- фундаментальным законам природы. Соответствующая проверка непротиворечивос- непротиворечивости (если она возможна) весьма полезна для установления правильнос- правильности моделей. Поясним это, используя для вывода уравнения E) не за- закон Ньютона, а закон сохранения энергии. Поскольку точка крепления пружины неподвижна, то стенка не совершает работу над системой «пружина—шарик» (и наоборот), и ее полная механическая энергия Е остается постоянной. Вычислим ее. Кинетическая энергия определяет- определяется движением шарика (пружина считается невесомой): mv2 m (dr/dt) Потенциальная энергия системы «содержится» в пружине, ее не- нетрудно найти, определив работу, необходимую для растяжения (сжа- (сжатия) пружины на величину г: г г Еп = - [ Fdr' = [ kr'dr' = кГ—. Для неизменной со временем величины Е = ЕК + Еп (интеграла энергии) получаем _ т (dr/dtJ kr2 Е= 2 + ^~- Так как dE/dt = 0, то, продифференцировав интеграл энергии по ?, приходим к выражению dr d2r dr dr ( d2r \ dt dt2 dt dt \ dt2 ) т. е. к уравнению E), проверив тем самым правильность его получе- получения. Подобную процедуру нетрудно провести и для примеров пп. 1—3. 5. Заключение. 1. Даже в простейших ситуациях для построения модели может по- потребоваться использование не одного, а нескольких фундаментальных законов. 3 А. А. Самарский, А. П. Михайлов
34 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I 2. Прямое формальное применение фундаментальных законов к объекту, рассматриваемому как целое, не всегда возможно (пп. 2, 3). В этих случаях требуется просуммировать элементарные акты взаимо- взаимодействия между его частями, принимая во внимание свойства объекта (например, его геометрию). 3. Одними и теми же моделями могут описываться совершенно разные по своей природе объекты, подчиняющиеся разным фунда- фундаментальным законам, и, наоборот, данному закону могут отвечать принципиально разные модели (например, линейные и нелинейные; см. п. 3). 4. Необходимо использовать все возможности для проверки пра- правильности построения модели (предельные переходы — пп. 2, 3, другие фундаментальные законы — п. 4 и т. д.). УПРАЖНЕНИЯ 1. В задаче о всплытии подводной лодки учитывается сопротивление воды. Принимая силу сопротивления равной F± = —кои, где ко > 0 — коэффициент, за- зависящий от свойств воды и формы подлодки, и — вертикальная скорость лодки, найдите максимальную глубину Н, при всплытии с которой силой F\ можно пре- пренебречь в любой момент времени t <C t^ (должно выполняться требование F\ <C <F-P). 2. Повторяя рассуждения п. 2, найдите силу притяжения электрона к обклад- обкладкам конденсатора, имеющим конечные размеры Ri, R3. Убедитесь в том, что при R\ —>¦ 00, R3 —>¦ 00 полученное выражение переходит в формулу B). 3. В задаче п. 3 введите толщину кольца d, найдите силу F и убедитесь, что полученное выражение при d —>¦ 0 совпадает с формулой C). 4. Пусть расстояние между точкой нейтрального положения пружины г = = 0 и стенкой, к которой она крепится, равно L (см. рис. 11). Найдите, пользуясь формулой F), условия на величины го, vo, при выполнении которых шарик не может удариться о стенку (в противном случае модель E) неверна, так как при соударении со стенкой шарик испытывает с ее стороны действие некоторой силы, не учитываемой в уравнении E)). § 3. Вариационные принципы и математические модели Дадим упрощенную формулировку вариационного принципа Га- Гамильтона для механической системы. На его основе выведем уравнения движения шарика на пружине и маятника в поле сил тяжести. Сопо- Сопоставим результаты получения моделей из фундаментальных законов и из вариационного принципа. 1. Общая схема принципа Гамильтона. Пусть имеется меха- механическая система, формального и строгого определения которой пока давать не будем, имея в виду, однако, что все взаимодействия между элементами такой системы определяются законами механики (один из простейших примеров — рассмотренная в п. 4 § 2 система «шарик— пружина»). Введем понятие обобщенных координат Q(t), полностью определяющих положение механической системы в пространстве. Ве- Величина Q(t) может быть декартовой координатой (например, коор- координата г в системе «шарик—пружина»), радиусом-вектором, угловой координатой, набором координат материальных точек, составляющих
§ 3] ВАРИАЦИОННЫЕ ПРИНЦИПЫ И МАТЕМАТИЧЕСКИЕ МОДЕЛИ 35 систему, и т. д. Величину dQjdt естественно назвать обобщенной ско- скоростью механической системы в момент времени t. Набор величин Q(i) и dQjdt определяет состояние механической системы во все моменты времени. Для описания механической системы вводится функция Лагран- Лагранжа, построение которой — отдельный вопрос, более подробно рас- рассматриваемый в гл. III. В простейших случаях функция Лагранжа имеет ясный смысл и записывается в виде L(Q,dQ/dt) = EK-En, A) где Ек, Еп — кинетическая и потенциальная энергии системы соот- соответственно. Для целей данного параграфа нет необходимости давать общее определение величин Ек, EUJ поскольку в рассматриваемых при- примерах они вычисляются очевидным образом. Введем далее величину S[Q], называемую действием: B) Интеграл B), очевидно, является функционалом от обобщенной координаты Q(t), т. е. функции Q(t), заданной на отрезке [ti,^], он ставит в соответствие некоторое число S (действие). Принцип Гамильтона для механической системы гласит: если сис- система движется по законам механики, то Q(t) — стационарная функция для S[Q], или ? S[Q + eip]e=0 = 0. C) Фигурирующая в принципе наименьшего действия C) функция ip(t) — некоторая пробная функция, обращающаяся в нуль в моменты ti, ^2 и удовлетворяющая тому условию, что Q(t) + ?<p(t) — возможная координата данной системы (в остальном tp(t) произвольна). Смысл принципа C) в том, что из всех априори мыслимых (допус- (допускаемых) траекторий (движений) системы между моментами t\, ?2 вы- выбирается (реализуется) движение, доставляющее минимум функциона- функционалу дейстия (отсюда происходит и название принципа). Функция ?(f(i) называется вариацией величины Q(t). Итак, схема применения принципа Гамильтона C) для построе- построения моделей механических систем состоит в следующем: определяются обобщенные координаты Q(t) и обобщенные скорости dQ/dt системы, строятся функция Лагранжа L(Q, dQ/dt) и функционал действия S[Q], минимизация которого на вариациях ?(f(t) координаты Q(t) и дает ис- искомую модель. 2. Третий способ получения модели системы «шарик— пружина». Воспользуемся принципом Гамильтона для построения модели движения шарика, соединенного с пружиной (п. 4 § 2). В ка- качестве обобщенной координаты системы естественно выбрать обыч- обычную эйлерову координату шарика r(t). Тогда обобщенная скорость
36 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I dr/dt = v(t) — обычная скорость шарика. Функция Лагранжа A), рав- равная L = Ек — Еп, записывается через уже найденные в п. 4 § 2 значения кинетической и потенциальной энергии системы: _ т (dr/dtJ r2 dt. Для величины действия получаем выражение ti t2 tl t! Теперь, в соответствии со схемой п. 1, вычислим действие на вариа- вариациях eip(t) координаты r(t): т (dr\ к ~2\dt) ~2' т dt. Последнюю формулу необходимо продифференцировать по е (учиты- (учитывая, что функции г, </?, dr/dt, dtp/dt от е не зависят): m 2 dr\ U dr -к{г2 dt = и положить в ней е = 0: d de } dr Правая часть этого выражения (равного нулю в согласии с принципом Гамильтона — см. C)) с помощью интегрирования ее первого члена по частям и с учетом того, что </} = 0в моменты ti, ?2, преобразуется к виду de' f Г d2r 1 = - / (f \m —- + kr\dt = 0. e=0 J Y dt J Поскольку пробная функция ip(t), фигурирующая в формулировке принципа наименьшего действия, произвольна, то часть выражения,
§ 3] ВАРИАЦИОННЫЕ ПРИНЦИПЫ И МАТЕМАТИЧЕСКИЕ МОДЕЛИ 37 стоящая под знаком интеграла в квадратных скобках, должна быть равна нулю во все моменты времени t\ < t < t^- V//////////// т. е. движение системы должно описываться уравнением E), получен- полученным в § 2 из закона Ньютона (первый способ) и закона сохранения энергии (второй способ). Все три подхода оказываются эквивалентны- эквивалентными (так как между ними существует глубокая связь, более подробно изучаемая в гл. III). 3. Колебания маятника в поле сил тяжести. Приведем не- несколько более сложный пример применения принципа Гамильтона с подробным рассмотрением начальной стадии построения модели — описанием механической системы. Пусть на неподвижном шарнире подвешен маятник — груз массы т, находящийся на конце стержня длины I (рис. 12). Шарнир счита- считается идеально гладким в том смысле, что в нем не происходят потери энергии на трение. Неподвижность шарнира означает, что от не- него энергия в систему «стержень—груз» не по- поступает, такой шарнир неспособен совершить над ней какую-либо работу. Стержень счита- считается невесомым и абсолютно жестким, т.е. его кинетическая и потенциальная энергии рав- равны нулю, а груз не может совершать движе- движений вдоль оси стержня. Груз имеет небольшие размеры по сравнению с длиной стержня (ма- (материальная точка), ускорение свободного па- падения д постоянно, сопротивлением воздуха пренебрегается, колебания происходят в фик- фиксированной вертикальной плоскости (для чего, очевидно, вектор на- начальной скорости груза должен лежать в этой плоскости). После всех этих упрощающих предположений ясно, что положе- положение маятника определяется лишь одной обобщенной координатой, в качестве которой выберем угол a(t) отклонения стержня от вертика- вертикали. Обобщенная скорость в данном случае — угловая скорость da/dt. Кинетическая энергия системы дается формулой Рис. 12 а потенциальная энергия выражением Еп = mgh = — тд (I cos а — I), где h — отклонение маятника от наинизшего положения по вертика- вертикали. В дальнейших выкладках величину mgl в Еп опустим, так как потенциальная энергия определяется с точностью до постоянной.
38 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I Теперь нетрудно вычислить функцию Лагранжа A) и действие B): da . y, —— = ml ' dt ' da „r , / -L / иск \ 5[a] =ffll -Z — + #cosa dt. Находя действие на вариациях а + eip(t): ^2 Ь\а + ещ —mil J У 1 (a d(f - И — + е— 2 \dt dt Л 1 a + eip) dt = дифференцируя его по г и полагая е = 0, получаем — 5[а + еф\ е=0 1 . . da d(f . . = ml I \l — — (pgsmа| dt = 0. CLT CLT Как и в п. 1, интегрируем первый член выражения в скобках по частям и, учитывая, что ip(t) = 0 в моменты ti, ?2, приходим к следую- следующему уравнению: d2a . i , —— + gsina at = 0, ml которое в силу произвольности ip(t) может удовлетворяться лишь если для всех t\ < t < ^2 справедливо ^ = -fsina. D) Заметим, что уравнение колебаний маятника D) в отличие от уравнения E) § 2 нелинейно. Это обстоятельство связано с более слож- сложной геометрией системы «стержень—груз», а именно: ускорение, испы- испытываемое грузом, не пропорционально координате, как в случае закона Гука, а является более сложной функцией отклонения от положения равновесия (угла а). Если же эти отклонения малы, то sin a « а, и модель малых колебаний линейна: d2a g
§ 3] ВАРИАЦИОННЫЕ ПРИНЦИПЫ И МАТЕМАТИЧЕСКИЕ МОДЕЛИ 39 Они описываются формулой, аналогичной F) из § 2, где ш = = л/#А — собственная частота малых колебаний, а величины Ау В / \ da определяются через a(t = 0), — (t = 0). at 4. Заключение. Примеры использования принципа Гамильтона для построения моделей механических систем рисуют весьма четкую программу действий, в общем виде описанную в п. 1. Универсальность, строго формализованные последовательные процедуры, не зависящие от деталей конкретной системы, безусловно, весьма привлекательная черта вариационных принципов. В приведенных выше простых слу- случаях модели могут быть относительно легко получены и иными спо- способами. Однако для многих других, более сложных объектов, вариа- вариационные принципы оказываются фактически единственным методом построения моделей. Так, например, механические части большин- большинства робототехнических устройств состоят из большого количества разнообразных элементов, связанных между собой различными спосо- способами. Их математические модели включают большое число уравнений, единообразно получаемых в основном с помощью вариационных прин- принципов. Этот подход успешно применяется также и для систем иной природы (физических, химических, биологических), для которых фор- формулируются соответствующие общие утверждения о характере их эво- эволюции (поведения). То обстоятельство, что принцип Гамильтона и другие подходы да- дают совпадающие модели, естественно, поскольку они описывают один и тот же исходный объект. Разумеется, такое совпадение гарантиро- гарантировано только при одних и тех же исходных предположениях об объекте. Если его идеализация (как один из первых этапов построения модели) проводится одинаково, то разные способы получения моделей долж- должны давать тождественные результаты. Пусть, например, в системе «шарик—пружина» появляется дополнительная постоянная сила не- некоторого внешнего воздействия на шарик Fq . Тогда из второго закона Ньютона нетрудно получить уравнение движения шарика сРг (ср. с E) § 2). Применяя принцип Гамильтона к такой системе, не- необходимо учесть наличие этой силы. Очевидно, что определения об- обобщенной координаты, обобщенной скорости и кинетической энергии Ек остаются неизменными. В то же время выражение для потенциаль- потенциальной энергии существенно изменяется (ср. с п. 2) на величину, равную работе, произведенной этой силой над системой: 2 } 2 Еп = fc у + у Fi dr = А; у + For. о Проводя аналогичные п. 2 выкладки с соответствующим образом из- измененными величинами L и Q, нетрудно убедиться в том, что принцип Гамильтона дает написанное выше уравнение с внешней силой Fq .
40 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I УПРАЖНЕНИЯ 1. Проверьте, что модель D) построена правильно, получив ее с помощью второго закона Ньютона. 2. Используя результаты п. 2 § 2 и принцип Гамильтона, постройте модель ко- колебаний маятника в электрическом поле, создаваемом заряженной горизонтальной плоскостью, над которой подвешен маятник. Заряд груза равен q, поверхностная плотность зарядов на плоскости равна —qo (силой тяжести пренебречь). Почему, несмотря на различную природу действующих сил, получается модель, аналогич- аналогичная D)? § 4. Пример иерархии моделей Для движения шарика, соединенного с пружиной, построим иерар- иерархическую цепочку моделей по принципу «снизу вверх». Последователь- Последовательно введем новые усложняющие факторы и дадим их математическое описание. 1. Различные варианты действия заданной внешней си- силы. Пусть на шарик действует известная внешняя сила F(r,i), за- зависящая от времени и положения шарика. Она может порождаться полем тяготения (см. упр. 1), иметь электрическое или магнитное про- происхождение и т. д. Из второго закона Ньютона сразу получаем, что по сравнению с базовой моделью колебаний d2r т^ = ~кг A) в правой части уравнения A) появляется дополнительный член: d2r m— = -kr + F(r,t). B) Простейший вариант уравнения B) отвечает постоянной силе F(r, t) = Fo. Проведя замену f = г — Fo/k, получаем для f d2f т. е. постоянная сила не вносит изменений в процесс колебаний за тем исключением, что координата нейтральной точки, в которой сила, дей- действующая на шарик, равна нулю, сдвигается на величину Fo/k. Гораздо более сложная картина движения может порождаться за- зависящей от времени силой F(i). Рассмотрим для определенности пе- периодическую внешнюю силу F(t) = Fq d2r m -—r = -kr + F(t) = -kr + Fo sinuit. C) dtz Решение линейного уравнения C) находится как сумма общего решения однородного уравнения (формула F) § 2) и частного решения неоднородного уравнения C), которое будем искать в виде n(t) = Csino;it. D)
i 4] ПРИМЕР ИЕРАРХИИ МОДЕЛЕЙ 41 Подстановкой этого выражения в C) находим Fo Fo С = к — muj2 m (uj2 — со2) где lj = у/к/т — частота колебаний пружины в отсутствие внешних сил, или собственная частота системы. В итоге для общего решения C) имеем Fo r(i) = A sin cut + В cos cut -\ —— «т- sin uj\t. m(uo2 - uo() Итак, внешняя сила F(t) приводит не только к появлению в сис- системе дополнительных колебаний с частотой ^,ноик возникновению резонанса — неограниченному росту амплитуды колебаний при ио\ —У 2. Движение точки крепления, пружина на вращающемся стержне. Резонанс в системе может быть вызван также благодаря действию сил инерционного происхождения. Пусть точка крепления пружины движется по заданному закону ro(t) = f(t). Тогда в системе координат, связанной с этой точкой, на шарик действует, помимо на- натяжения пружины, сила инерции, равная ma(t), где a(t) — ускорение, обусловленное движением системы координат, a(t) = d2 f /dt2. В этой системе координат движение шарика описывается уравнением d2r m— = -kr + F(t), где F(t) = —ma(t) = — т d2 f /dt2 — некоторая заданная функция време- времени. Как и в предыдущем случае, при соответствующем периодическом движении точки крепления в системе возникает резонанс. При более сложной геометрии силы инерции системы могут за- зависеть не только от времени i, но и от координаты г. Если пружина надета на стержень, движущийся с угловой скоростью w(t), то центро- центробежная сила инерции равна F = mv2(t)/R = muj2(t) R, где v(t) = u(t) R, R = Rq + r, Rq — длина пружины в ненагруженном состоянии, г — отклонение шарика от нейтрального положения, г > —Ro- Уравнение движения шарика принимает вид d2r m— = -kr + F(r,t), E) где F(r,t) = muj2(t) (До + г), или d2r т — = -(к - muj2(t)) r + muj2(t) До, ах причем, очевидно, при г ^ Ro линейное уравнение E), общее решение которого здесь не выписывается в силу его громоздкости, переходит в уравнение вида C) с F(t) = —muo2{t) До- Однако в данном случае резонанс невозможен, так как внешняя сила всегда направлена в одну сторону и не в состоянии раскачать систему.
42 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I Заметим, что усложненная по сравнению с исходным случаем гео- геометрия отнюдь не всегда означает более сложное поведение объекта. Рассмотрим, например, шарик, прикрепленный к двум пружинам с жесткостью к\ и &2 (рис. 13). Нача- ~21Г —^2т л0 координат поместим в точку, где силы, действующие на шарик со сто- Р° °бе ПРУЖИН> уравновешива- ют друг друга (при этом должно со- блюдаться некоторое условие на па- Рис. 13 раметры системы, чтобы шарик не мог касаться одной из точек крепле- крепления — см. упр. 2). По закону Гука при отклонении г на шарик со стороны левой пружины действует сила —к\г, а со стороны правой — сила — &2г (обе силы направлены в одну сторону, так как при растяже- растяжении первой пружины вторая пружина, наоборот, сжимается). В итоге приходим к такому же уравнению, как и в случае одной пружины, d2r m ——г = — к\т — къг = — кг, dt2 но с увеличенной жесткостью к = к\ + &2, складывающейся из жест- костей обеих пружин. 3. Учет сил трения. В рассматриваемой системе силы трения могут появляться по крайней мере из-за двух причин. Первая из них — неидеальность поверхностей шарика и плоскости, по которой он дви- движется. В этом случае сила трения равна F = к\Р, где к\ — коэффи- коэффициент трения, Р = гпд — вес шарика. Она всегда направлена против движения шарика, ее знак противоположен знаку скорости шарика v = = dr/dt, т. е. F = —kimgsign(dr/dt). Движение шарика подчиняется уравнению d2r 7 dr . ч m--r = -кг - кхтпдsign — , F) dtz dt которое внешне похоже на уравнение B) с постоянной силой F(r, t) = = Fq. Однако из-за знакопеременности силы оно не сводится к стан- стандартному уравнению колебаний. Это обстоятельство служит выраже- выражением того, что уравнения A) и F) описывают существенно разные про- процессы. В частности, амплитуда колебаний шарика в последнем случае уменьшается со временем. В этом нетрудно убедиться, переписав F) в виде dv 7 m — + кг = — kimgsigrvv, умножив обе части этого выражения на и/2: v dv v . v m2~dt+2= -kim9Signv - , и с учетом того, что v = dr/dt, получив m dv2 к dr2 1
4] ПРИМЕР ИЕРАРХИИ МОДЕЛЕЙ 43 Последнее уравнение эквивалентно уравнению d fmv2 7 r2\ 1 7 ,_ + к\ k G) dt V 2 Принимая во внимание, что в левой части G) под знаком производной стоит сумма кинетической и потенциальной энергии системы E(t) = = EK(t) + En(t), а правая часть G) при v ф 0 отрицательна, имеем dE(t) dt ' V ^ т. е. полная энергия E(t) убывает со временем. Поскольку в моменты достижения шариком максимальной амплитуды |rm(?)| его скорость (и кинетическая энергия Ек) равна нулю, то в эти моменты Еп = = kr1ra{t)/2 — E(t), и в силу убывания E(t) амплитуда |rm(?)| — также убывающая функция времени. Более подробно рассмотрим результат действия силы трения ино- иного происхождения, возникающей из-за сопротивления среды, в которой движется шарик (воздуха, воды и т. д.). В этом случае сила трения не постоянна, а существенно зависит от скорости движения. Эта зависи- зависимость описывается известной формулой Стокса dr dt ' где коэффициент /л > 0 определяется размерами шарика, плотностью среды, ее вязкостью и т. д. Уравнение движения в вязкой среде имеет вид d т dv m- = -kr + F(V) = -kr-,-. (8) Найдем общее решение линейного уравнения (8), избавившись предварительно от члена с первой производной. Подстановка в (8) за- замены r(t) = f(t) eat дает для новой функции f(t) уравнение / nf d2f n+ df n+ df о nf\ m e —— + ae — + ae —- + a e r = \ dt2 dt dt ) = -kfeat - /ieat %- - /iaeatf. dt Сократив в нем множитель eat и положив а = — /л/Bт), придем к урав- уравнению В отличие от уравнения A) первый множитель в правой части (9) может менять знак в зависимости от значений параметров k, /i, m системы, что с учетом связи r(t) = eatf(t) приводит к существенно иному ее поведению относительно стандартного случая.
44 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I При малой вязкости, т. е. при к — /j?/Dm) = к\ > 0 решение f(t) дается формулой F) § 2, и для r(t) имеем г = feat = e-^/Bm) (A sin ujt + В cos ut), где о; = (ki/m) '2, а константы Л, 5 находятся через го, vq. В системе происходят затухающие со временем колебания (см. также упр. 3) с частотой ио. Если к\ = 0, то величина df/dt постоянна, или, что то же самое, f(t) = ct + с\. Для r{t) с учетом начальных данных получаем r(t) = e-WB.») {ct + Cl) = e-W(N (YVo + W t + r A . V V 2m / / В данном случае колебания отсутствуют благодаря подавляющему действию сил вязкого трения. Система может лишь один раз прой- пройти точку г = 0, для чего необходимо и достаточно выполнения условий г?о < — /iro/Bm), го > 0 или г?о > —/хго/Bш), го < 0, т. е. начальная ско- скорость шарика должна быть достаточно велика и направлена к точке г = 0. При этом, очевидно, скорость шарика г?(?) = dr/dt может менять знак лишь один раз. Наконец, при большой вязкости действие силы трения настоль- настолько значительно, что для любых го, г>о шарик «застревает» в среде, никогда не проходя точку г = 0, а лишь односторонне приближаясь к ней при t —у оо. Действительно, при к\ < 0 решение уравнения (9) (см. также упр. 4) знакопостоянно (предположение о противном сразу же приводит к противоречию с уравнением), следовательно, величина r(t) также не меняет знак. Поведение функции r(t) при t —У оо можно понять из свойств первого интеграла уравнения (9) fdfV , 2 т —- = — k\T + const, \dt) который нетрудно получить, умножая обе части (9) на df/dt и интег- интегрируя один раз по t. Предположения о том, что f(t) —у оо или f(i) —У —У С\ ф 0 при t —У оо противоречат последнему равенству. Остается единственный вариант f(i) —У 0, t —У оо, и, таким образом, r(i) —У О, t -у оо. Итак, движение системы в вязкой среде отличается большим по отношению к идеальной ситуации разнообразием, причем во всех слу- случаях оно происходит с затуханием. 4. Два типа нелинейных моделей системы «шарик—пру- «шарик—пружина». Формула Стокса справедлива, строго говоря, только для уста- установившихся движений, когда действие постоянной внешней силы урав- уравновешивается силой вязкого трения так, что в итоге тело перемещается с постоянной скоростью. Вполне возможны ситуации, при которых си- сила сопротивления вязкой среды при малых скоростях меньше, а при больших скоростях больше, чем вычисляемая по формуле Стокса; на- например, F(v) = —/IV \v\a, где /I > 0, а > —1. Тогда искомая величина
§ 4] ПРИМЕР ИЕРАРХИИ МОДЕЛЕЙ 45 r(t) определяется из уравнения d2r т-— = -kr + F(v) = -кг - /av \v\a. A0) Уравнение A0), в отличие от всех рассмотренных ранее моделей, нелинейно, и его решение выписать, вообще говоря, нельзя (хотя мож- можно провести достаточно детальное изучение системы и в нелинейном случае, в частности, установить, пользуясь приемом, применявшимся для уравнения F), затухающий характер движения системы). Поэто- Поэтому ограничимся здесь приближенным анализом поведения системы в двух ее предельных положениях — в окрестности точек v = 0 и г = 0. Оба положения, очевидно, не могут достигаться одновременно, так как это означало бы, что система покоится. Если v(to) = 0 (здесь момент to — один из моментов достижения максимальной амплитуды го), то вторым членом в правой части урав- уравнения A0) можно пренебречь по сравнению с первым, и оно принимает вид сРг т^ = -кг0. Поскольку рассматривается малая окрестность At около момента to, то пренебрегается также отклонением Аг в сравнении с го- Учитывая, что v(to) = 0, получаем Аг = г - г0 = - - — г0 (t - t0J, т. е. шарик движется с постоянным (в первом приближении) уско- ускорением, так как на него действует лишь сила натяжения пружины, постоянная в окрестности точки г = го, а сила трения равна нулю. При г (to) = 0 (to — один из моментов прохождения системой на- начала координат, если, конечно, точка г = 0 достигается хотя бы один раз) первый член в правой части мал по сравнению со вторым, и и т* ш— = -nvo\vo\a. Здесь также пренебрегается отклонением Av от значения v$ = = v(to) ввиду его малости. Так как г (to) = 0, то из последнего уравне- уравнения следует Значит, и в этом положении система испытывает постоянное (в первом приближении) ускорение, определяемое лишь силой трения, посколь- поскольку натяжение пружины равно нулю. Данный вывод вполне очевиден и справедлив для всех положений системы, хотя ускорение шарика при v ф 0, г ф 0 определяется уже совместным действием обеих сил. Ис- Исключение составляет лишь точка, где кто — ~^Щ \vo\a, когда правая часть уравнения A0) обращается в нуль и первый член в ускорении системы в этот момент t = to равен нулю. Разлагая r(t) в ряд Тейлора
46 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I в окрестности точки t = to'- dr r(t) = r(t0) + -? (t0) (t - t0) + 1 cPr ... ч9 1 d3r ... ., + 2 dP (*o) (t ~ to) + 6 H* (to) (* ~ h) + '''' где точками обозначены члены более высокого порядка малости, и при- d r нимая во внимание, что —у (t = to) = О, находим (Л Аг = r(t) - го = ^ (to) (* - *о) + \^ (to) (t - t0K + ..., т. е. в главном члене ускорение системы в окрестности точки t = t0 не постоянно, а является линейной функцией времени (см. также упр. 5). Еще один тип нелинейности может обусловливаться изменяющи- изменяющимися механическими свойствами пружины. Закон Гука действителен, вообще говоря, лишь при малых отклонениях (деформациях) пружины от ненагруженного нейтрального положения. При заметных деформа- деформациях пружина, в зависимости от материала, из которого она изготов- изготовлена, и величины деформации, может вести себя как «мягкая», и тогда сила натяжения будет меньше, чем полагается по закону Гука (в слу- случае «жесткой» пружины — наоборот). Жесткость пружины в такой ситуации становится функцией координаты, т. е. к = к (г), и уравнение движения принимает вид d2r т— = -к(г)г, A1) где, разумеется, к (г) > 0. Например, если к (г) = ко/A + |г|), то пружи- пружина мягкая. Уравнение A1) нелинейное так же, как и A0), но достаточно очевидны по крайней мере два различия между A0) и A1). В отличие от A0), можно выписать (неявное) решение для A1) с двукратным использованием квадратуры. Кроме того, переписывая A1) в виде m г / г \ йТ (&т ат dr d Г diC \ — —- = — к(г) г — — — / к (г )г dr = —- / к (г )r dr , dt dt2 dt y J dt dr J y J dt \J y J / ' \ / учитывая, что левая часть этого выражения равна mv dv jdt = 1 dv2 = - m —— , и интегрируя его по ?, получаем 1 {dr\2 f ЕК + Еп = -ml — +/ k(rf) r' dr' = const > 2 \dt J J 0. A2) Это означает консервативность движения, описываемого мо- моделью A1), или постоянство полной энергии системы. Существование
ПРИМЕР ИЕРАРХИИ МОДЕЛЕЙ 47 первого интеграла A2) позволяет установить общий со случаем линей- линейной системы факт — колебательный характер изучаемого движения. Действительно, из A2) следует ограниченность функций v(t) = dr/dt и r(t) при любых t > 0. Решение не имеет предела при t —> оо, так как при v(t —> оо) —> Vqq ф 0 это противоречило бы ограниченности функции r(t) при t —> оо, а для v(t —> оо) —> v^ = 0 невозможно, чтобы r(t —> оо) —> Гоо ф 0 — тогда из A1) следовала бы неограниченность величины v(t) при t —> оо (случай же v^ = г^ = 0 противоречит A2)). Тем самым шарик колеблется. Он неограниченное число раз проходит точку г = 0 (в противном случае величина r(t) была бы знакоопреде- ленной вместе с ускорением d2r/dt2 (см. A1)) и v —У оо, t —У оо). 5. Заключение. Приведенные в этом параграфе построения демонстрируют иерархическую цепочку моделей системы «шарик— пружина», получающихся одна из другой при последовательном от- отказе от предположений, идеализирующих изучаемый объект. В одних случаях усложнение не вносит ничего нового в поведение системы (по- (постоянная внешняя сила, шарик на двух пружинах), в других ее свойст- свойства меняются существенным образом. Путь «от простого к сложному» дает возможность поэтапно изучать все более реалистичные модели и сравнивать их свойства. Существует и другой путь построения и изучения моделей — «от общего к частному». Из результатов данного параграфа очевидно: до- достаточно общее уравнение движения системы «шарик—пружина» за- записывается в виде d2r к > О, У = f{x) где к и F могут быть разнообразными функциями своих аргумен- аргументов. Опираясь на эту общую модель, можно, проводя соответствующие конкретизации, последовательно по- получать и изучать более простые мо- модели. Например, зависимость к от г и t отвечает следующему после E) уравнению и уравнению A1), зави- зависимость F от г, t — наличию внеш- внешней силы или силы инерции (уравне- (уравнения B), C), E)), а от dr/dt — сопро- сопротивлению среды (уравнения F), (8), A0)). Данный подход также широко применяется, в том числе и потому, что позволяет сразу установить некоторые общие свойства объекта, конкретизируя и дополняя их в частных ситуациях. УПРАЖНЕНИЯ 1. Получите уравнение движения шарика на пружине, перемещающегося по идеальной поверхности с непостоянным наклоном под действием силы натяжения пружины и силы тяжести. Уравнение поверхности: у = /(ж), у' ^ 0 (рис. 14). Рис. 14
48 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I 2. Подберите величины к±, /с2, т, го, vq так, чтобы в системе на рис. 13 отсутствовало соприкосновение шарика с точками крепления. 3. Пользуясь приемом, применявшимся при анализе уравнения F), покажите, что в случае уравнения (8) движение происходит с затуханием. 4. Выпишите решение уравнения (9) при к\ < 0 через гиперболические функ- функции и убедитесь в том, что решение уравнения (8) стремится к нулю при t —> оо. 5. Пользуясь разложением в ряд Тейлора функции r{t) в окрестности точки t = to, где правая часть уравнения A0) равна нулю, найдите величину d3r/dt3(to). § 5. Универсальность математических моделей Рассмотрим процессы колебаний в объектах различной природы. Покажем, что несмотря на разную сущность объектов им соответству- соответствуют одни и те же математические модели. 1. Жидкость в U-образном сосуде. Жидкость занимает часть сосуда U-образной формы, представляющего собой изогнутую трубку радиуса г о (рис. 15). Масса жидкости Mq, ее плотность ро. Стенки сосуда идеально гладкие, поверхностным натяжением пренебрегается, атмосферное давление Ро и ускорение свободного падения д постоянны. Ро h2)/2 = h М*) У///////////////////////////////////////Л Рис. 15 В состоянии равновесия жидкость, очевидно, покоится, ее высота в обоих коленах сосуда одинакова. Если ее вывести из равновесия, то начнется движение, характер которого установим с помощью закона сохранения энергии, поскольку в силу сделанных предположений ее потери в системе отсутствуют. Потенциальную энергию системы вычислим через работу, кото- которую необходимо совершить, чтобы переместить ее из состояния рав-
§ 5] УНИВЕРСАЛЬНОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 49 новесия (где hi = h2) в положение, изображенное на рис. 15. Она равна = ^ 2 2 Еп = - Pdh2 = - poso (hi - h)gdh, h = ~^r^-» so = h h где P — вес той части жидкости в левом колене, уровень которой пре- превышает величину h2. Работа сил атмосферного давления равна нулю, так как для разных колен соответствующие перемещения направлены в разные стороны. Неизвестные величины hi(t) и h2(t) связаны очевидным соотно- соотношением h\(t) + h2(t) = const > 0, выражающим постоянство полной длины столба жидкости в сосуде с постоянным сечением. Подставляя последнее равенство в выражение для Еп, получаем после интегриро- интегрирования Еп = -Posog (-h22(t) + Ch2(t) + Ci). При вычислении кинетической энергии учтем постоянство сечения трубки и несжимаемость жидкости. Это означает, что столб жидкости движется как целое, и ее скорость v(i) одинакова во всех сечениях. Примем за v(i) величину dli2(i)/dt, и тогда а из закона сохранения энергии следует E(t) = EK(t) + En(t) = ^ (^f) - posog (-h22 + Ch2 Так как dE/dt = 0, то, продифференцировав это выражение, получаем Mo —7j?- = posog (-2/12 + С), что, с учетом такого же соотношения для величины hi(t), дает урав- уравнение Мо -^ = -posogh = -npor^gh, где h = (h,2 — hi)/2 — отклонение уровня жидкости от положения рав- равновесия. Оно, с точностью до обозначений, полностью совпадает с уравнением A) § 4 для системы «шарик—пружина» (в данном слу- случае аналогом шарика служит столб жидкости, а роль пружины играет тяготение). Последовательный отказ от идеализации объекта дает более пол- полные его модели (как и в § 4). Например, учет силы поверхностного натяжения, равной сго2тгго (сто — коэффициент поверхностного натя- натяжения) и всегда направленной против движения жидкости, приводит к уравнению вида G) § 4 для величины h (см. также упр. 1). 4 А. А. Самарский, А. П. Михайлов
50 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I 2. Колебательный электрический контур. Это устройство представляет собой конденсатор, соединенный проводами с индуктив- индуктивной катушкой. В момент t = 0 цепь замыкается, и заряд с обкладок конденсатора начинает распространяться по цепи (рис. 16). Сопротивление проводов будем считать равным нулю, емкость конденсатора равна С, индуктивность катушки L. Для изменяющейся со временем величины q(t), где q(t) — заряд на обкладках конден- конденсатора, необходимо получить соответствующее уравнение. Очевидно, что ток i(t) и напряжение v(i) также являются функциями времени. По физическому смыслу величины С в лю- любой момент времени имеем равенство v(i) = q(i) С (емкость равна величине заряда, который необ- необходимо поместить на обкладки конденсатора для увеличения разности потенциалов между ними на единицу). Рис 1б Так как электрическое сопротивление в цепи отсутствует, то падения напряжения на проводах нет, и разность потенциалов v(t), существующая на конденсаторе, по- подается непосредственно на катушку. При переменном токе в катушке возникает электродвижущая сила самоиндукции, равная е = —Ldi/dt. Закон Ома для цепи в отсутствие сопротивления выглядит следующим образом: v(t) = -e(t), или q(t)C = -e(t) = Ldi/dt. Так как по определению г = —dq/dt (при изменении заряда на кон- конденсаторе в цепи возникает ток), то из последнего соотношения полу- получаем уравнение описывающее процесс колебаний величины q(t) (а следовательно, и ве- величин i(i), v(i)) в простейшем электрическом контуре, тождественное A) § 4. В системе «емкость—индуктивность» колебания происходят так же, как и в системе «шарик—пружина» (и так же усложняются соответствующие модели при учете дополнительных процессов — см. упр. 2). 3. Малые колебания при взаимодействии двух биологи- биологических популяций. Пусть на одной и той же территории прожива- проживают две биологические популяции с численностями N(t) и M(t), причем первая растительноядная, а вторая употребляет в пищу представите- представителей первой популяции. Скорость изменения N(t) складывается из определяемой по пер- первому члену в правой части формулы A0) § 1 скорости прироста благо- благодаря рождаемости (эффект насыщения не учитывается; ср. с A2) § 1)
§ 5] УНИВЕРСАЛЬНОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 51 и из скорости убывания благодаря соседству со второй популяцией: riN {a1p1M)N, A) где oil > 0, Pi > 0, член j3\MN описывает вынужденное убывание (ес- (естественной смертностью популяции пренебрегаем). Численность второй популяции растет тем быстрее, чем больше численность первой популяции, а при ее отсутствии уменьшается со скоростью, пропорциональной численности M(i) (тем самым ее рож- рождаемость не учитывается, как и эффект насыщения): ^ M, B) at где а2 > 0, fa > 0. Очевидно, что система находится в равновесии при Mq = ai//?i и Щ = «2//?2Э когда dN/dt = dM/dt = 0. Рассмотрим малые отклонения системы от равновесных значений, т. е. представим решение в виде N = No + п, М — Мо + m, п <С 7V0, m < Мо. Подставляя А^ и М в уравнения A), B), получим, отбрасывая члены более высокого порядка малости, = frNom, C) ^ = -f32M0n. D) Дифференцируя C) по t и подставляя в полученное уравнение функцию dm/dt, определяемую из D), придем к уравнению d2n —— = -aia2n, dtz аналогичному по форме уравнению A) § 4. Следовательно, в систе- системе происходят малые колебания численности с частотой со = д/сёТсё^, зависящей только от коэффициентов рождаемости и смертности а± и Заметим, что величина m(t) подчиняется такому же уравнению, причем если отклонение n(i) равно нулю в начальный момент t = 0, то m(t = 0) имеет максимальную амплитуду, и наоборот (см. решение уравнения колебаний F) § 2). Эта ситуация, когда численности n(t) и m(t) находятся в противофазе, воспроизводится для всех моментов U = гГ/4, г = 1, 2,..., (Г — период колебаний) и отражает запаздыва- запаздывание реакции численности одной популяции на изменение численности другой (см. также упр. 3). 4. Простейшая модель изменения зарплаты и занятос- занятости. Рынок труда, на котором взаимодействуют работодатели и наем- наемные рабочие, характеризуется зарплатой p(t) и числом занятых N(t). Пусть на нем существует равновесие, т. е. ситуация, когда за плату Ро > 0 согласны работать Щ > 0 человек. Если по каким-то причинам 4*
52 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I это равновесие нарушается (например, по возрасту часть работников уходит на пенсию либо у предпринимателей возникают финансовые трудности), то функции p(t) и N(t) отклоняются от значений ро, Nq. Будем считать, что работодатели изменяют зарплату пропорцио- пропорционально отклонению численности занятых от равновесного значения. Тогда ^ = -<*i(N-N0), ai>0. Предположим, что число работников увеличивается или уменьша- уменьшается также пропорционально росту или уменьшению зарплаты отно- относительно значения ро, т- е- dN — = а2 (р-ро), а2 > 0. Дифференцируя первое уравнение по t и исключая из него с помо- помощью второго уравнения величину N, приходим к стандартной модели колебаний d2(p-po) , ч _ = -а1а2 (р - ро) заработной платы относительно положения равновесия (аналогично и для величины N(t)). Из первого интеграла этого уравнения ai (N - N0J +а2(р- роJ = const > 0 видно, что в некоторые моменты ? = ^,г = 1,2,..., когда р = ро (т. е. зарплата становится равной равновесному значению), имеем N > Щ, т. е. число занятых больше равновесного, а при N = Щ получаем р > > ро, т. е. зарплата превышает равновесную. В эти моменты фонд заработной платы, равный pN, превышает равновесное значение роЩ (или меньше его), если при подходе к моменту ti выполнено р > ро или N > Nq (и наоборот). Но в среднем за период колебаний величина pN равна роЩ (упр. 4). 5. Заключение. Построенные в данном параграфе модели в од- одних случаях основаны на точно известных законах (пп. 1, 2), в дру- других — на наблюдаемых фактах и либо на аналогиях (п. 3), либо на правдоподобных представлениях о характере объекта (п. 4). Хо- Хотя и сущность рассматривавшихся явлений, и подходы к получению отвечающих им моделей совершенно различны, построенные модели оказались идентичны друг другу. Это свидетельствует о важнейшем свойстве математических моделей — их универсальности, — широко используемом при изучении объектов самой разнообразной природы. УПРАЖНЕНИЯ 1. Пусть в задаче об U-образном сосуде левое колено имеет переменное се- сечение, т. е. г = ro(h). Покажите, применяя второй закон Ньютона и предполагая отсутствие горизонтальной компоненты у скорости жидкости, что для величины h получается уравнение вида A1) § 4.
§ 6] НЕКОТОРЫЕ МОДЕЛИ ПРОСТЕЙШИХ НЕЛИНЕЙНЫХ ОБЪЕКТОВ 53 2. Вводя в LC-контур сопротивление R и используя закон Ома, убедитесь в том, что модель колебаний в ЬСЯ-контуре аналогична уравнению (8) § 4. 3. Сведите нелинейную систему A), B) к уравнению второго порядка и пока- покажите, что она (как и ее линейный аналог C), D)) имеет первый интеграл. 4. Пользуясь формулой F) § 2 для общего решения уравнения колебаний, пока- покажите, что среднее значение фонда заработной платы pN (п. 4) за период колебаний равно равновесному. § 6. Некоторые модели простейших нелинейных объектов Обсудим происхождение нелинейности и рассмотрим некоторые ее последствия, проявляющиеся в поведении изучаемых объектов. Про- Проиллюстрируем неизбежность применения численных методов для их анализа. 1. О происхождении нелинейности. Как уже отмечалось в п. 5 § 1, линейные модели подчиняются принципу суперпозиции. В этом случае, находя частные решения и суммируя их, как правило, удается построить и общее решение (типичные примеры — формула F) § 2 и формула для общего решения уравнения C) § 4 в моделях колебаний). Для нелинейных моделей принцип суперпозиции неприменим, и общее решение можно найти лишь в редких случаях. Отдельные же частные решения нелинейных уравнений могут не отражать характер поведения объекта в более общей ситуации. Источниками нелинейности могут быть многие причины. Фунда- Фундаментальные законы природы — закон тяготения и закон Кулона — из- изначально нелинейны (квадратичная зависимость силы взаимодействия между массами или зарядами), и потому основанные на них модели, вообще говоря, также нелинейны. Свой вклад в нелинейность моделей вносят более сложная геометрия явления (см. упр. 1 § 4 и упр. 1 § 5), различные внешние воздействия (см. уравнение A0) § 4) и, конечно же, изменение характера взаимодействия в самом объекте при изменении его состояния (эффект насыщения в моделях популяций, меняющаяся жесткость пружины). В сущности, реальным явлениям отвечают только нелинейные мо- модели, а линейные справедливы лишь при описании незначительных изменений величин, характеризующих объект. 2. Три режима в нелинейной модели популяции. В отличие от модели Мальтуса A0) § 1 и модели A2) § 1 коэффициент рождае- рождаемости будем считать зависящим от численности популяции N(i), т. е. а = a(N). Коэффициент смертности C также зависит от N. Уравнение динамики популяции ^- = (a(N)-C(N))N A) at нелинейно благодаря изменению характеристик взаимодействия внут- внутри популяции при изменении ее состояния. Положим для определенности /3(N) = /Зо = const, a(N) = «oiV, т. е. рождаемость пропорциональна численности (например, потому
54 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I что члены популяции заинтересованы в ее росте). Тогда уравнение A) преобразуется к виду B) с квадратичной нелинейностью (характерной также для некоторых хи- химических реакций). Рассмотрим поведение функции N(i) при различ- различных начальных численностях N@) = Щ (рис. 17). а) При Щ < NKp = /Зо/с^о численность монотонно уменьшается со временем, стремясь к нулю при t —> оо. Решение дается формулой, ана- аналогичной формуле для решения уравнения A2) § 1, где t заменяется на —t (обратная логистическая кривая; ср. с рис. 7, § 1). б) При критическом значении Щ = NKp численность популяции не зависит от времени. в) При Щ > NKp характер решения принципиально изменяется по сравнению со случаями а) и б): численность растет со временем, причем настолько быстро, что обращается в бесконечность за конечное время t = if. Величина tf тем меньше, чем больше Щ (см. упр. 1). лг01 лг02 ЛГоз лгкр J --^^. ^^—¦ J —^_ > */1 */2 Рис. 17 Нелинейность уравнения B) порождает большое разнообразие эф- эффектов, содержащихся даже в простейшей модели: три возможных режима изменения численности со временем; неустойчивость режима б) — при малых отклонениях в область а) или в) решение удаляет- удаляется от линии 7VKp = Ро/ао; сильную чувствительность функции N(t) к начальным данным TVq; наконец, катастрофический рост численности популяции за конечное время при TVq > AfKp. Заметим, что последнее свойство не частный результат, а имеет место для любых моделей вида t > О, JV(O) > О, F(N) > О,
i 6] НЕКОТОРЫЕ МОДЕЛИ ПРОСТЕЙШИХ НЕЛИНЕЙНЫХ ОБЪЕКТОВ 55 если при больших N функция F(N) растет быстрее первой степени iV, точнее, если для F(N) справедлив критерий dN < 00, 7V@) C) получающийся непосредственным интегрированием уравнения. 3. Влияние сильной нелинейности на процесс колебаний. Уравнение колебаний то м2 - k{r)r, где функция к (г) > 0 описывает жесткость пружины, — одно из отно- относительно немногих нелинейных уравнений, для которого можно выпи- выписать общее решение. Вводя величину скорости v = dr /dt, перепишем C) в виде dv dr т —- = —к(г) г, — = v: dt w ' dt деля первое из этих уравнений на второе, получим нелинейное уравне- уравнение первого порядка dv к(г) г dr v Разделяя в D) переменные: mv dv = —к(г) г dr, и дважды интегрируя последнее уравнение, находим 2 г ^2=(^) =-2 [k'(r')r'dr' + C, к'(г) = \dt) J о D) к(г) т dr ~dt ~ \ С -2 г I kf(rf)rfdrf, А -1 = ±fdf\ С-2 jk'(r')r'dr' +Q, E) где в неявно выписанном общем решении E) константы С, С\ можно определить, зная начальные данные. Заметим, что данная процедура по отношению к уравнениям вида A0) § 4 неприменима (переменные не разделяются), и найти их общее решение этим способом уже нельзя.
56 ПРОСТЕЙШИЕ МОДЕЛИ И ПОНЯТИЯ [ГЛ. I В линейном случае (к(г) = ко) интегральные кривые уравнения D) представляют собой концентрические круги с центром в начале ко- координат, радиус которых определяется начальной энергией системы и «движение» по которым описывает периодический во времени процесс колебаний (рис. 18). Рассмотрим теперь сильно нелинейную систему, в которой пружи- пружина ведет себя как «сверхмягкая», например, к (г) = 1/(г2 + а), а > 0. В предельном случае а = 0 уравнение D) принимает вид dv 1 т — = — vr и его решение принципиально отличается от решения D) (см. рис. 19) тем, что энергия не сохраняется и, более того, неограниченно растет Рис. 18 Рис. 19 при г —у =Ь0. При ослаблении нелинейности процесс колебаний приоб- приобретает обычный характер (упр. 2). 4. О численных методах. Рассмотренные здесь примеры доста- достаточно убедительно свидетельствуют о неизбежности применения чис- численных методов для моделирования нелинейных объектов из-за явной недостаточности чисто теоретических подходов и сложного, разнооб- разнообразного поведения характеризующих эти объекты величин. Впрочем, этот вывод справедлив и для линейных моделей, содержащих боль- большое число неизвестных величин, независимых переменных, парамет- параметров и имеющих сложную пространственную структуру. Для постро- построения соответствующих численных моделей широко используются ме- методы, подходы и приемы, разрабатываемые при создании исходных моделей, и возникают свои специфические проблемы, требующие глу- глубокого изучения. Поясним последнее утверждение простым примером. Для уравне- уравнения A0) § 1 dN — = (a-P)N = 'yN, ?>0, 7V@)=7V0, dt
§ 6] НЕКОТОРЫЕ МОДЕЛИ ПРОСТЕЙШИХ НЕЛИНЕЙНЫХ ОБЪЕКТОВ 57 где для определенности (а — C) > О, вполне логично предложить сле- следующую численную схему (разбив ось t на равные отрезки величины г = ti+i —tii г = 0,1,2,...; ?q = 0 и заменив производную на конечную разность): ^ Ni i = 0,1,...; N(to)=No. (б) Г Из F) получаем что дает для его решения N, = A + т7) No, N2 = A + r7J No, Ni = A + rT)i No = A + r7)*/r 7V0, т.е. при ^ —> oo решение F) может отличаться от искомого сколь угод- угодно сильно. Следовательно, для получения нужной точности необходимо должным образом выбирать шаг г в зависимости от величины отрезка интегрирования Т (упр. 3). УПРАЖНЕНИЯ 1. Пользуясь заменой, примененной при анализе уравнения (8) § 4, найдите решение уравнения B) при No > NKp и вычислите величину tf через No, qo, /?o- 2. Найдите ограничение на рост функции к(г) —>¦ сю, г —>¦ 0 в уравнении C), при выполнении которого система «шарик—пружина» была бы консервативной, т. е. сохранялась бы ее полная энергия. 3. Используя представление числа е в виде соответствующего предела, пока- покажите, что для заданных величин 7? ^о5 Т решение уравнения F) стремится при тчОк решению исходной задачи. В заключение, основываясь на материале данной главы, выделим ряд тем, являющихся ключевыми для развития и применения мето- методологии математического моделирования. К ним относятся: вопро- вопросы идеализации исходного объекта и формулировка соответствующих предположений; применение как строгих процедур (фундаментальные законы, вариационные принципы), так и метода аналогий и других подходов к построению математических моделей (в том числе и труд- ноформализуемых); методы качественного исследования нелинейных моделей; построение эффективных вычислительных алгоритмов, реа- реализующих модели. Эти вопросы, наряду с описанием некоторых акту- актуальных приложений, составляют основное содержание последующих глав. Библиография к главе I: [7, 16, 25, 40, 47, 57, 60, 66, 73, 76-79, 81, 83, 84].
ГЛАВА II ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ ПРИРОДЫ § 1. Сохранение массы вещества На основе составления баланса массы вещества и некоторых до- дополнительных соображений построим модели потока невзаимодейст- невзаимодействующих частиц и движения грунтовых вод в пористой среде. Опишем ряд свойств полученных моделей и обсудим их возможные обобще- обобщения. 1. Поток частиц в трубе. В цилиндрической трубе с по- поперечным сечением S (рис. 20) движутся частицы вещества (пы- (пылинки, электроны). Скорость их дви- жения u(t) > 0 вдоль оси х, вооб- ще говоря, изменяется со временем. Например, заряженные частицы мо- ^ ^х гут ускоряться или замедляться под действием электрического поля. Для ^ИС- zu построения простейшей модели рас- рассматриваемого движения введем следующие предположения: а) частицы между собой не взаимодействуют (не сталкиваются, не притягиваются и т. д.). Для этого, очевидно, плотность частиц должна быть достаточно малой (в этом случае заряженные частицы не толь- только не сталкиваются, но и не оказывают друг на друга влияния из-за большого расстояния между ними); б) начальная скорость всех частиц, находящихся в одном и том же поперечном сечении с координатой ж, одинакова и направлена вдоль оси х; в) начальная плотность частиц также зависит только от коорди- координаты X] г) внешние силы, действующие на частицы, направлены вдоль оси х. Предположение а) означает, что скорость частиц может изменять- изменяться лишь под действием внешних сил, предположения б)-г) обеспечива- обеспечивают одномерность процесса переноса, т. е. зависимость искомой плот- плотности потока частиц только от координаты х и времени t ^ 0. Итак, по заданной начальной плотности p{x,t = 0) = ро(х) необ- необходимо найти плотность частиц р(х, t) в любой момент времени для
§ 1] СОХРАНЕНИЕ МАССЫ ВЕЩЕСТВА 59 любых х (скорость движения u(t) задана). Прибегнем к закону сохра- сохранения массы, подсчитав баланс вещества в малом элементе трубы от х до х + dx за время dt (рис. 21). Слева в элементарный объем входит количество вещества с мае- <- сой, равной Su(t) dt p(x,t ¦ где Su(t) dt — объем вошедшего за проме- () жуток времени dt вещества. Через правое ис' сечение элемента за то же время выходит масса, равная -Su(t) dtp(x + dx,t + ?dt), (К ?^ 1, т. е. суммарное изменение массы равно dm = Su(t) (р(х, t + ?dt) - р(х + dx, t + f ей)) dt. В силу малости промежутка dt скорость u(t) считается постоянной. Ве- Величины p(x,t + ?dt) и р(х + dx,t + ?dt) — средние по времени значения плотности в сечениях х и х + dx. Другой способ подсчета изменений в фиксированном объеме S dx очевиден из смысла величины p(x,t): dm = S dx (p(x + r\dx,t + dt) — p(x + fjdx^t)), 0 < 77,77 < 1, где p(x + 77 dx, t + dt) и p(x + fj dx, t) — средние по пространству зна- значения плотности в моменты t и t + dt. Приравнивая оба полученные для dm выражения и устремляя dx и dt к нулю, приходим к уравнению для p(x,t), отвечающему закону сохранения массы, тг + тг u(t) = 0, -оо < х < оо, t > О, A) а^ ох с начальным условием р(ж,О) = ро(х), -оо < ж < оо. B) Величина ри (поток вещества, или поток массы) равна коли- количеству вещества, проходящему в единицу времени через единичную поверхность поперечного сечения трубы. Как видно из A), скорость изменения плотности вещества со временем в любом сечении опре- определяется «скоростью» изменения потока вещества по координате х. Схожим свойством обладают многие модели, отвечающие законам со- сохранения и описывающие совсем другие процессы. В случае постоянной скорости u(t) = щ приходим к простейшему линейному уравнению в частных производных ^7+^0^ = 0, -оо<ж<оо, ?>0. C) at ох
60 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II Его общее решение нетрудно найти, приняв во внимание, что уравнение C) имеет характеристики — линии х = u$t + С, на которых значения искомой функции постоянны во времени, т. е. р[х = not + C,t) = рс-, или, в эквивалентной записи, р(х, t) = р(х + щ (t - t0),t0), t -to ^ 0. Выбирая ?0 = 0, получим p(x,t) = uot). D) p(x,t) Рис. 22 Интеграл D) и является общим решением уравнения C). Из фор- формулы D) и начальных данных B) легко найти искомую функцию, при- причем она зависит не по отдельности от переменных ж, t, а от их комбина- комбинации ? = х + uot (бегущая вол- волна). Пространственный про- профиль плотности без искаже- искажений переносится вдоль потока (рис. 22) с постоянной скорос- скоростью (уравнение C) называ- называют также уравнением перено- переноса). Это основное свойство ре- **х шения уравнения C) несколь- несколько модифицируется в случае, когда скорость частиц зави- зависит от времени (см. упр. 1) — профиль плотности переносится за рав- равные промежутки времени на разные расстояния. Если же по каким-то причинам скорость потока зависит от плотности (и = и(р)), то уравне- уравнение A) становится нелинейным, и поведение его решения может иметь качественно иной характер (см. п. 7 § 4). 2. Основные предположения о гравитационном режиме те- течения грунтовых вод. Пористая среда представляет собой пласт во- водопроницаемого материала (песок, глина), ограниченного снизу грун- грунтом, не пропускающим воду (гранит), а сверху — поверхностью зем- земли (рис. 23). Если из-за интенсивной работы артезианских скважин или в результате обильных осадков уровень воды в каком-либо месте слоя изменяется, то под действием силы тяжести начинается движение жидкости, выравнивающее ее свободную поверхность. Для описания этого процесса введем прежде всего ряд предполо- предположений: 1) вода рассматривается как несжимаемая жидкость с постоянной плотностью р\ 2) толщина пласта много меньше его ширины и длины; 3) подстилающая поверхность не имеет разрывов и изломов, за- задающая ее известная функция Н(х,у) — достаточно гладкая функция своих аргументов; 4) свободная поверхность воды h = h(x,y,t) плавно меняется с из- изменением координат х, у; 5) грунтовые воды нигде не выходят на поверхность земли, причем на свободной поверхности жидкости давление постоянно;
§1] СОХРАНЕНИЕ МАССЫ ВЕЩЕСТВА 61 6) грунт однороден, т. е. его физико-механические свойства не за- зависят от аргументов ж, у, z. Первое предположение вполне естественно, поскольку в рассмат- рассматриваемом процессе не могут достигаться давления, способные замет- заметно изменять плотность воды. Остальные предположения упрощаю- упрощающие. Например, второе предположение (тонкий пласт) означает, что течение жидкости двумерное и все его характеристики не зависят от координаты z, последние два предположения позволяют постро- построить модель, единообразную во всех точках грунта, и т. д. Вместе с тем предположения 1)-6) отнюдь не выхолащивают сути процесса, так как они выполняются в большом количестве реальных ситуа- ситуаций. Рис. 23 3. Баланс массы в элементе грунта. Выделим в пласте эле- элементарный объем, образующийся в результате пересечения вертикаль- вертикальной призмы ABCD подстилающей и свободной поверхностями грунта. Поскольку размеры призмы dx и dy малы, а функции Н и h гладкие (предположения 3), 4)), то получившееся тело с хорошей степенью точ- точности можно считать параллелепипедом. Введем неизвестные функции v = v(x,y,i) и и = u(x,y,t) — составляющие скорости жидкости вдоль осей ж, у (рис. 24). Подсчитаем количества жидкости, входящей в параллелепипед и выходящей из него за промежуток времени dt. Через грань DC в элемент грунта входит масса воды, равная объ- объему прошедшей через нее жидкости, умноженному на плотность р, т. е. величина ри (Н + h) dy dt,
62 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II а через грань АВ выходит масса воды ри (Н + h)dydt+ <— [ри (Н + h)] dx \ dy dt. В этом выражении по сравнению с предыдущим добавляется член, опи- описывающий приращение функции ри (Н + К) при переходе от плоскости dy dx/ В с h(x,y,t) ( '77 Рис. 24 x к плоскости х + dx. Сама же величина ри (Н + /г), как и в п. 1, имеет смысл потока массы (вещества). Итак, при движении жидкости вдоль оси х в элементе грунта на- накапливается масса - — [ри (Н + h)] dx dy dt. ox Проводя аналогичные рассуждения для граней AD и ВС, получа- получаем изменение массы воды за счет ее движения вдоль оси у: - —- [pv (Н + h)] dx dy dt. ду Поскольку вдоль оси z в элемент грунта жидкость не втекает и не вытекает из него (снизу — подстилающий пласт, а через свободную поверхность нет потока вещества), то суммарное изменение массы во- воды в элементе грунта равно - | А [ри (я + Л)] + j- [pv (Я + h)]\ dxdydt. E) Общее количество жидкости в параллелепипеде равно его объему, умноженному на плотность р и на коэффициент пористости т < 1 (так как часть объема занята грунтом): тр (Н + h) dxdy. Изменение массы воды в элементе за время dt, очевидно, равно — [рт (Н + h)] dx dy > dt.
§ 1] СОХРАНЕНИЕ МАССЫ ВЕЩЕСТВА 63 Учитывая, что dH/dt = 0, dp/dt = 0, из последнего выражения получаем Г\ 7 тр — dx dy dt F) ot и, приравнивая E) к F), приходим к уравнению неразрывности, вы- выражающему закон сохранения массы в рассматриваемом процессе: mp— = - — [pu(H + h)}-—[pv(H + h)]. G) В уравнении G) скорость изменения рассматриваемой величины (в данном случае массы) со временем определяется дивергенцией по- потока этой величины — свойство, характерное для многих моделей, по- получаемых из законов сохранения (ср. с уравнением A)). С учетом того, что др/дх = 0, др/ду = 0, уравнение G) перепи- переписывается в более простой форме: L[{H+h)]^[{H+h)] (8) 4. Замыкание закона сохранения массы. Уравнение (8) со- содержит три неизвестных величины — /г, u, v. Следовательно, для за- замыкания модели необходимо привлечь какие-то дополнительные со- соображения о характере процесса. Их дает полуэмпирический закон Дар си dp dp и » " " (9) где р(ж, у, z, i) — давление в жидкости, \i > 0 — коэффициент, опреде- определяемый свойствами грунта. Согласно закону Дарси компоненты ско- скорости течения жидкости пропорциональны соответствующим компо- компонентам градиента давления. Заметим, что по своему физическому смыслу градиент давления — это сила (отнесенная к единице объ- объема). В то же время по второму закону Ньютона действующая на те- тело сила пропорциональна его ускорению, а не скорости, как в законе Дарси. Однако данное противоречие кажущееся, так как при течении через грунт (фильтрации) жидкость преодолевает сопротивление его частиц, в отличие от свободного течения (ср. с уравнением движения жидкости в § 4). В формулах (9) используется новая неизвестная величина — дав- давление жидкости. Ее связь с уже введенными величинами нетрудно найти, приняв предположение о медленном и почти горизонтальном течении воды. Тогда динамической составляющей давления можно пренебречь и вычислять его по чисто гидростатическому закону как давление, создаваемое столбом жидкости: р(х, у, z, t) = pg (h(x, у, t)-z) + const, где const — давление на поверхности жидкости (например, атмосфер- атмосферное), g — ускорение свободного падения.
64 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II Подставляя последнюю формулу в (9), получаем dh dh и, используя A0) в уравнении неразрывности (8), окончательно при- приходим к уравнению движения грунтовых вод т или к уравнению Буссинеска, содержащему лишь одну неизвестную функцию h(x,y,t). 5. О некоторых свойствах уравнения Буссинеска. Урав- Уравнение A1) нестационарное (искомая функция h зависит от ?), дву- двумерное (h зависит от i и t/j, относящееся к параболическому типу. Оно неоднородное, так как функция Н зависит от ж, у, и нелиней- нелинейное, поскольку в его правой части присутствуют члены вида (hhx)x и (hhy)y. В сравнении с уравнением A) уравнение Буссинеска — гораз- гораздо более сложный математический объект. В силу нелинейности его общее решение не может быть найдено аналитически, однако относи- относительно нетрудно получить некоторые вполне содержательные частные решения (см. упр. 2), которые служат также тестами при разработке численных методов для уравнения A1). Для построения завершенной модели движения грунтовых вод не- необходимо знать входные данные для уравнения A1): форму подстилаю- подстилающей поверхности Н(х, у), коэффициент к и краевые условия, задающие функцию h в начальный момент времени и на границах пласта (и, быть может, в некоторых выделенных областях пласта, например, на арте- артезианской скважине). Более подробно формулировка краевых условий для уравнений параболического типа обсуждается в § 2. Здесь отме- отметим только, что простейшим вариантом формулировки краевых усло- условий для уравнения A1) является задание лишь начального условия — функции h(x,y,t) в момент t = 0: h(x,y,t = 0) = ho(x,y), -оо < х < оо, — оо < у < оо. Такая постановка отвечает задаче Коши для уравнения A1), ре- решаемого, естественно, также в области — оо < ж < оо, — оо < 2/ < оо. В задаче Коши по известному распределению уровня грунтовых вод ho находится функция h для всех t > 0. Рассмотрение пласта бесконечных размеров, конечно же, идеали- идеализация. Однако если изучается течение в небольшой центральной об- области пласта на относительно небольшом промежутке времени, то влиянием границ пласта можно пренебречь, и решение задачи Коши описывает вполне реальный процесс. Отметим также, что некоторые краевые условия были фактически неявно введены в модель при выводе уравнения Буссинеска. Предпо- Предположение о непроницаемости пласта было использовано при получении
§ 1] СОХРАНЕНИЕ МАССЫ ВЕЩЕСТВА 65 уравнения баланса, а без предположения 5) о «зазоре» между поверх- поверхностью земли и поверхностью грунтовых вод (т.е. когда вся жидкость находится в пористой среде) нельзя было бы использовать закон Дар- си во всей рассматриваемой области. Разумеется, выполнение этих и других предположений должно контролироваться при изучении дан- данного объекта на основе построенной модели. При введении дополнительных предположений общая модель упрощается. Так, если по каким-то причинам решение не зависит от времени t (стационарный процесс), то приходим к эллиптическо- эллиптическому уравнению для решения которого, естественно, не требуется задание функции h в начальный момент. В простейшем случае A2) превращается в урав- уравнение Лапласа (см. упр. 3). Если подстилающая поверхность горизон- горизонтальна (Н(х,у) = Hq = const), то уравнение Буссинеска становится однородным: dh 7 д f1dh\ В f1dh k{h)+%{h При дополнительном предположении об одномерности течения, когда искомое решение зависит лишь от одной пространственной пе- переменной, например, координаты ж, приходим к уравнению dh 1 д / dh называемому также одномерным уравнением типа нелинейной теп- теплопроводности (см. § 2) или одномерным уравнением изотермичес- изотермической фильтрации. Одномерными являются, например, течения в плас- пластах, сильно вытянутых по одному из направлений, так что измене- изменением величин вдоль поперечного сечения пласта можно пренебречь (если через ограничивающие его в поперечных направлениях поверх- поверхности жидкость не протекает). Наконец, самая простая модель течения грунтовых вод дается уравнением теплопроводности (или уравнением диффузии вещества) получающимся при условии h <С Hq, т. е. для малых изменений уровня жидкости по сравнению с толщиной пласта. Последние три уравнения относятся к параболическому типу, при- причем уравнение A4) линейное и существуют хорошо известные мето- методы получения его общего решения. Разумеется, кроме перечисленных возможны и другие упрощения исходной модели, например двумерное уравнение A3). Из уравнения Буссинеска относительно нетрудно получить и бо- более сложные модели, когда неверны некоторые из сформулированных 5 А. А. Самарский, А. П. Михайлов
66 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II в п. 2 предположений. В частности, во многих случаях грунт неод- неоднороден, т. е. т = т(х,у), \i — /j(x,y), и необходимо учитывать по- поступление жидкости в пласт в результате осадков. Тогда обобщение уравнения Буссинеска имеет вид т(х,у) dh д \ , wrr 7Ч dh pg dt дх I/"'4" ' "' дх Г\ Г Г\ 7 + — \fi(x,y)(H + h)—\ +q{x,y,t), A5) где q(x,y,t) характеризует мощность осадков в точке ж, у в момент времени ? (см. упр. 4). Итак, применение фундаментального закона сохранения массы позволило получить разнообразные модели рассматриваемых про- процессов. Различие между моделями определяется типом полученных уравнений (гиперболический, параболический, эллиптический), их пространственно-временными характеристиками (стационарное, не- нестационарное, одномерное, многомерное), наличием или отсутствием нелинейностей, а также постановкой краевых условий. Таким обра- образом, в зависимости от конкретных свойств объекта и дополнительных предположений, основываясь на одном и том же фундаментальном за- законе, можно получить совершенно различные математические модели. С другой стороны, как будет не раз показано в дальнейшем, одни и те же математические модели могут, в силу своей универсальности, отвечать объектам совершенно разной природы. УПРАЖНЕНИЯ 1. Найдите замену переменных, сводящую уравнение A) к уравнению C), и покажите, что решение в случае и = u(t) имеет вид D), где ? = х + f u(t) dt. 2. Решение уравнения A3) вида h(x, t) = u(t) 0(х) (т. е. в разделяющихся пере- переменных) называется упорядоченным режимом Буссинеска в случае, если u{t) —>¦ О, t —>¦ сю. Покажите, что u(t) — степенная функция времени при больших t. 3. Установите, при каких предположениях уравнение A2) сводится к уравне- уравнению Лапласа. 4. Пользуясь законом сохранения массы и законом Дарси, получите уравнение A5). § 2. Сохранение энергии Закон сохранения энергии вместе с некоторыми дополнительными предположениями применим для построения моделей распространения тепла в сплошной среде. Сформулируем типичные краевые задачи для уравнений теплопередачи. Обсудим некоторые физические и матема- математические свойства полученных моделей. 1. Предварительные сведения о процессах теплопереда- теплопередачи. Тепловая энергия, или тепло — это энергия хаотического движе- движения атомов или молекул вещества. Обмен теплом между различными участками материала называется теплопередачей, а сами материа- материалы, обладающие хорошо выраженным свойством теплопередачи, —
§ 2] СОХРАНЕНИЕ ЭНЕРГИИ 67 теплопроводными. К ним относятся, например, металлы, в которых тепловая энергия переносится в основном свободными электронами, некоторые газы и т. д. Процессы передачи тепла рассматриваются в условиях так называемого локального термодинамического равнове- равновесия (ЛТР). Понятие ЛТР для газов вводится при А < L, т. е. когда длина свободного пробега частиц вещества много меньше характерных размеров рассматриваемого объекта (сплошная среда). ЛТР подразу- подразумевает также, что процессы изучаются при временах, больших, чем г (время между столкновениями частиц), и на размерах, больших, чем Л. Тогда в областях вещества, размеры которых превосходят вели- величину Л (но много меньше величины L), устанавливается равновесие и для них можно ввести средние величины плотности, скорости теп- теплового движения частиц и т. д. Эти локальные величины (разные в разных точках среды) при сформулированных предположениях нахо- находятся из равновесного максвелловского распределения частиц (см. § 3 гл. III). К ним относится и температура Т, определяющая среднюю кинетическую энергию частиц: где т — масса частицы, v — средняя скорость хаотического движения, к — постоянная Больцмана (в случае так называемого больцмановско- го газа). Связанная с хаотическим движением частиц энергия вещества (внутренняя энергия) определяется через температуру с помощью ве- величины удельной теплоемкости с(р,Т), а именно ^1, с(р,Т)>0, где р = тип — плотность вещества (п — число частиц в единице объе- объема), е(р,Т) — внутренняя энергия единицы массы. Другим словами, теплоемкость — это энергия, которую надо сообщить единице массы вещества, чтобы увеличить его температуру на один градус. Наиболее простое выражение для теплоемкости получается в слу- случае идеального газа (газа, частицы которого взаимодействуют лишь при непосредственном столкновении и, подобно биллиардным шарам, без потери суммарной кинетической энергии). Если в некотором объе- объеме идеального газа содержится N частиц, то их полная внутренняя энергия есть где М = Nm — суммарная масса частиц, а удельная внутренняя энер- энергия, или энергия на единицу массы, дается формулой ^_зА М " 2 т ' т. е. теплоемкость идеального газа равна 3fc/Bm) и не зависит от ве- величин р, Т. 5*
ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II В общем случае связь между внутренней энергией и температурой более сложная. Например, помимо кинетической энергии движущих- движущихся частиц, внутренняя энергия содержит составляющую, связанную с потенциальной энергией их взаимодействия, зависящей от среднего расстояния г между ними. В свою очередь г « (п)~1//з = (р/т)~ '3, где п — число частиц в единице объема, т. е. е зависит от плотности р. Поэтому в теории теплопередачи величины е (или, что то же самое, с) являются, вообще говоря, функциями от р и Т. Их конкретный вид определяется свойствами рассматриваемой среды. 2. Вывод закона Фурье из молекулярно-кинетических представлений. Для получения математической модели теплопере- теплопередачи необходимо, помимо описанных в п. 1 понятий, ввести важное по- понятие потока тепла. Потоком тепла (или тепловой энергии) в данной точке называется количество тепла, переносимое в единицу времени через единичную поверхность, помещенную в данную точку вещества (ср. с понятием потока массы в § 1). Очевидно, что поток тепла — векторная величина (поскольку она в общем случае зависит от ориен- ориентации единичной поверхности в пространстве). Выделим в среде точку с координатами ж, ?/, z и вычислим компо- компоненты потока W тепла по соответствующим осям (величины Wx, Wy, Wz). Расположим площадку единичной величины (штриховая линия на рис. 25) перпендикулярно оси х. Частицы, движущиеся вдоль оси ж, пе- пересекают ее справа налево и слева направо с равной вероятностью. Однако если тем- температуры частиц (а, следовательно, и их кинетические энергии) разные по правую и левую стороны площадки, то в единицу времени через нее справа и слева перено- переносятся разные энергии. Разность этих энер- энергий и формирует поток тепла вдоль оси х. Выделим на рис. 25 области, отстоящие на расстояние Л = vr от площадки справа и слева. Из частиц, находящихся в правой области, примерно 1/6 часть движется налево, так как все шесть на- направлений (вверх — вниз, вперед — назад, направо — налево) равно- равновероятны. За время г эта часть частиц с необходимостью пересечет площадку и перенесет энергию, равную Рис. 25 б 2 ' где г?п — скорость частиц в правой области (величины п, Л считаются в первом приближении равными по обе стороны площадки). Аналогично, частицы из левой области переносят энергию 1 mvl Л где vn — скорость частиц слева от площадки. Разность этих энергий,
§ 2] СОХРАНЕНИЕ ЭНЕРГИИ 69 отнесенная к единице времени, представляет собой величину mvl\ mnv где ?л, еп — внутренняя энергия вещества соответственно слева и справа от площадки, а в качестве v берется средняя между vn и vu ско- скорость частиц. В первом приближении величины ?л, еп можно выразить через величину е (энергию в точке ж, т. е. на площадке) следующим образом: де дТ гп = г + А —- = ? + Ас — , ох ох -е-Х— -г-Ас — Подставляя эти формулы в выражение для Wx, получаем W. = -*™, A) где к — pcXv/3. Проводя такие же рассуждения для компонент Wy, Wz, приходим к выражениям W=-x^, Wz = -x^. B) у ду ' z dz Объединение A) и B) дает закон Фурье W = -xgradT. C) Величина к называется коэффициентом теплопроводности. Заметим, что коэффициент теплопроводности зависит в общем случае от плотности и температуры вещества: *=*f^0, D) поскольку не только теплоемкость с, но и длина свободного пробега А также может быть функцией от р, Т. Так, например, в газе, нахо- находящемся в обычных условиях, тепло переносится молекулами (молеку- (молекулярная теплопроводность). Для величины А в этом случае справедливо А ~ 1/р, а, так как v ~ у/Т, то из D) имеем кш ~ у/Т (теплоемкость считается постоянной). В плазме (где основную роль в переносе тепла играют электроны) длина пробега электрона зависит от р, Т, так что А ~ Т2р~х, и для величины ке справедливо ке ~ Т5/2 (с — постоянная). Итак, закон Фурье гласит: поток тепла пропорционален градиен- градиенту температуры. Так как тепловая энергия непосредственно связана с температурой, то в определенном смысле можно считать, что «поток» температуры пропорционален градиенту самой температуры. Совер- Совершенно таким же свойством обладает близкий по сущности процесс
70 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II диффузии вещества (закон Фика). Аналогичную интерпретацию мож- можно придать закону Дарси A0) из § 1, хотя движение грунтовых вод по своей природе принципиально отличается от процесса диффузии тепла (и закон Дарси не имеет столь относительно простого теоретического обоснования, как законы Фурье и Фика). 3. Уравнение баланса тепла. Применим закон сохранения энергии для математического описания процесса теплопередачи. Бу- Будем при этом считать, что внутренняя энергия вещества изменяет- изменяется лишь благодаря механизму теплопроводности, т.е. другие виды энергии полагаем несу- несущественными (например, пре- ^dx t/ небрегаем изменением внут- ~ТЪс у + dy z) X Реннеи энергии за счет хими- 4 ческих реакций или за счет ра- работы сил давления, сжимаю- сжимающих некоторый объем газа, и т. д.). Выделим в теплопровод- теплопроводной среде элементарный ку- Рис. 26 бик со сторонами dx, dy, dz (рис. 26) и приведем подсчет изменения содержащейся в нем тепловой энергии за малый промежу- промежуток времени dt. По сделанным предположениям это изменение может быть вызвано лишь разностью потоков тепла, входящих и выходящих через разные грани кубика. Так, потоки вдоль оси х приводят к умень- уменьшению или увеличению внутренней энергии объема на величину [Wx(x,y,z,t) -Wx(x-\-dx,y,z, t)] dy dz dt, где dy dz — площадь грани, перпендикулярной оси х. В этой формуле считается, что Wx как функция времени не сильно изменяется за про- промежуток dt, и можно взять ее значение в момент t. Точно таким же образом вычисляются изменения внутренней энергии по осям у, z: [Wy(x,y,z,t) - Wy(x,y + dy,z,t)]dxdzdt, [Wz(x,y,z,t) -Wz(x,y,z-\-dz, t)] dx dy dt. Суммарное изменение энергии АЕ = E(t + dt) — E(t) есть АЕ = - div W dx dy dz dt. С другой стороны, величину АЕ можно выразить через изменение тем- температуры объема и через его теплоемкость по формуле АЕ = (T(t + dt) - T(t)) c(p, T) p dx dy dz, в которой из-за малости объема берутся некоторые средние по нему значения температуры и плотности. Приравнивая два последних выражения друг другу и устремляя dt к нулю, получаем общее уравнение, описывающее распространение
§ 2] СОХРАНЕНИЕ ЭНЕРГИИ 71 тепла: C^=div(xgradT), E) имеющее в развернутой форме вид „дТ д ( дТ\ д ( дТ\ д ( дТ\ dt дх \ дх J ду \ ду) dz \ dz) где С = рс. Уравнение F) — нестационарное, трехмерное (функция Т зависит от времени t и трех пространственных переменных ж, у, z) уравнение параболического типа. Оно неоднородное, так как теплоемкость, ко- коэффициент теплопроводности и плотность могут быть, вообще говоря, разными в разных точках вещества, и нелинейное, поскольку функции с и к могут зависеть от температуры Т (т. е. от искомого решения). При дополнительных предположениях о характере процесса теп- теплопередачи уравнение F) может упрощаться. Так, если процесс ста- стационарный, т. е. температура не зависит от времени, то F) превраща- превращается в уравнение эллиптического типа д ( дТ\ д ( дТ\ д а если функции с, к не зависят от температуры, то F) становится линейным параболическим уравнением, которое в случае однородной среды (х, с, р не зависят от ж, у, z) принимает вид дТ Ж = *оЛТ, (8) где величина ко = н/С называется коэффициентом температуропро- температуропроводности. Для уравнения (8) относительно нетрудно выписать общее решение. В одномерном случае (температура зависит лишь от t и х) из F) получаем ??(i) Уравнение (9) сводится к уравнению типа нелинейной теплопро- теплопроводности ди д ( Лди at дх \ дх при допущении, что дС/дх = 0, дн/дх = 0 (ср. с уравнением A3) из § 1). Наконец, если к = xq, С = Со, где xq, Со — постоянные, то из A0) получается уравнение теплопроводности — простейшее уравнение параболического типа ди д2и & A1)
72 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II Как и в случае уравнения Буссинеска, из основного уравнения F) можно получить различные обобщения, соответствующие более слож- сложным, чем рассмотрение выше, механизмам теплопередачи. Так, для неизотропной среды (т.е. когда коэффициенты теплопроводности раз- разные по разным направлениям) с энерговыделением вместо F) имеем С -я7 = 7Г\Хх1г)+7Г\>су7г)+7Г\>с*7г) + f(x,y,z,t,T), dt дх \ дх) ду V ду) dz \ dz) A2) где хж, ?су, kz — коэффициенты в законе Фурье C) по осям ж, у, z, a функция / — мощность выделения (или поглощения) энергии. Неизо- Неизотропность, например, в случае электронной теплопроводности, может вызываться достаточно сильным магнитным полем, затрудняющим движение переносчиков тепла поперек силовых линий поля, а выделе- выделение энергии может быть связано с идущими в веществе химическими реакциями или протеканием электрического тока. Все полученные в данном пункте уравнения выведены с помощью фундаментального закона сохранения энергии и закона Фурье (ср. с выводом уравнения Буссинеска в § 1). Вместе с заданными функция- функциями с, х, р и краевыми условиями они представляют собой замкнутые математические модели процесса теплопередачи. 4. Постановка типичных краевых условий для уравнения теплопроводности. Для простоты будем рассматривать одномерные процессы теплопроводности. Они имеют место, например, в длинном и тонком металлическом стерж- стержне (рис. 27), нагреваемом с од- T(x,t) iT(l,t)\ ного из торцов, при условии, что стержень изотропен, его начальная температура в лю- любом поперечном сечении не за- зависит от у, z (это же свойство должно соблюдаться и на тор- цах стержня), а потерями теп- тепла с боковой поверхности мож- можно пренебречь. Будем считать также, что теплоемкость стержня по- постоянна. Тогда температура зависит только от х и t, и ее распре- распределение вдоль стержня в различные моменты времени описывается уравнением справедливым при 0 < х < /, t > 0. Для определения функции T(x,t), т. е. решения, достаточно задать начальную температуру стержня: T(x,t)=T0(x), O^x^l, A4) и знать температуру на концах стержня в любой момент времени: T(l,t)=T2(t), i>0. A5)
§ 2] СОХРАНЕНИЕ ЭНЕРГИИ 73 Задача A3)—A5) называется первой краевой задачей для пара- параболического уравнения A3) на отрезке х Е [0,1]. Физически условие A5) соответствует тому, что на концах стержня с помощью каких-то внешних источников тепла поддерживается определенная температу- температура, зависящая, вообще говоря, от времени. Если же на торцах стержня задаются вместо A5) потоки тепла как функции времени: х=0 дТ — = W2(t), *>0, A6) x=l то такая задача называется второй краевой задачей на отрезке [О,/]. Данная ситуация реализуется, например, когда торцы стержня нагре- нагреваются лучами лазерного света известной мощности. Более сложный (нелинейный) вариант условий на торцах отвечает сильно нагретому и поэтому излучающему энергию стержню, не кон- контактирующему с какими-либо телами. Тогда в единицу времени стер- стержень теряет на своих границах (торцах) энергию, равную сгТ4@,?) и aT4(l,t) соответственно, и вместо A5) или A6) получаются условия ВТ ВТ — A7) х=0 t > О, где а > 0. Возможны также и иные виды краевых условий, соответствую- соответствующие иным физическим ситуациям. Разумеется, допустимы различные комбинации условий A5)—A7), например, на левом конце известна тем- температура, а на правом поток тепла, и т. д. Разнообразие постановок краевых условий для уравнений теп- теплопередачи связано и с различными идеализациями исходной задачи A3)—A5). При анализе распространения тепла около одного из торцов длинного стержня в течение сравнительно короткого времени влияни- влиянием другого торца можно пренебречь. Вместо A5) достаточно задать лишь одно из условий (для определенности на левом конце): T@,t) = Ti(t), t > 0, A8) и решать уравнение в области х > 0 (A3), A4), A8) — первая краевая задача в полупространстве). Обсуждавшаяся уже на примере уравнения Буссинеска (§ 1) за- задача Коши рассматривается во всем пространстве — оо < х < оо. Для уравнения A3) задается лишь начальное распределение температуры A4). Такая постановка вполне разумна, когда рассматриваются про- процессы в центральной части стержня и влияние обоих торцов можно считать несущественным. Для многомерных уравнений теплопроводности постановка крае- краевых условий по сравнению с одномерным случаем существенно не меняется: на границах области задаются либо температура, либо по- поток тепла, либо какие-то более сложные их комбинации, а также (в
74 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II момент t = 0) начальное распределение температуры. Заметим, что в случае стационарного уравнения G) задаются лишь граничные усло- условия. Краевые условия для уравнения движения грунтовых вод из § 1 вполне аналогичны описанным в этом пункте (при этом аналогами температуры и потока тепла в уравнении Буссинеска служат уровень грунтовых вод и поток массы). 5. Об особенностях моделей теплопередачи. Наиболее прос- простая из всех обсуждавшихся выше задач теплопроводности — задача о стационарном процессе для уравнения A1) на отрезке [0,/]: |^0, T@)=Ti, T(l)=T2. Ее решение — линейная функция координаты х: гр гр Т(х)= 2Т 1ж + Гь 0<х<1. A9) I Решение A9) имеет вполне очевидный физический смысл. Дейст- Действительно, при стационарном процессе потоки тепла, входящие в любое поперечное сечение стержня и выходящие из него, равны (иначе темпе- температура в сечении менялась бы). Поэтому поток должен быть постоянен в любой точке ж, что по закону Фурье C) при я = к$ = const возможно лишь при линейном «профиле» температуры. Вместе с тем применение закона Фурье приводит к появлению одного не имеющего физического смысла эффекта, характерного для уравнений параболического типа. Поясним его, рассмотрев для урав- уравнения A1), решаемого во всем пространстве — оо < х < оо, задачу о так называемом мгновенном точечном источнике тепла. Требуется найти распределение температуры при всех ? > 0, — оо < ж < оо, вы- вызванное выделением в момент t = 0 в плоскости х = 0 некоторого ко- количества тепла Qo- Начальная температура считается равной нулю: Т(ж,0) = То (ж) = 0, —оо < х < оо. Такая постановка — идеализация реального процесса, справедливая при выполнении соответствующих условий (например, по центру холодного стержня пропускается мощ- мощный поперечный импульс электрического тока, действующего очень короткое время и затрагивающего малый участок металла). Решение поставленной таким образом задачи дается формулой t>0, С = 1, B0) что проверяется непосредственной подстановкой в уравнение A1). Симметричная функция B0) в силу известного равенства сю / dy =
§2] обладает свойством СОХРАНЕНИЕ ЭНЕРГИИ 75 сю / T(x,t)dx = T(x,t) так что закон сохранения энергии выполняется. В то же время соглас- согласно B0) температура в любой точке пространства в любой момент t > 0 отлична от нуля. Тем самым модель A1) и многие другие модели теп- теплопередачи описывают процессы с бесконечной скоростью распро- распространения возмущений (темпера- (температура при t = 0 была нулевой для всех х). Этого недостатка лишены (но лишь при определенных условиях) уравнения типа нелинейной теп- теплопроводности A0) (в частности, уравнение A3) § 1). Для модели A0) с к(Т) = к0Та, сг > 0 рассмот- рассмотрим процесс распространения теп- тепла в полупространство х > 0 при Рис 28 заданной на границе температу- температуре: Т@,?) = T\(t). Начальная температура среды считается нулевой: Т(ж, 0) = То (ж) =0, ж ^ 0. Частное решение этой задачи, отвечающее граничному закону t>0, имеет вид бегущей волны (ср. с решением D) § 1), распространяю- распространяющейся от границы вглубь вещества не с бесконечной, а с конечной скоростью D > 0 (рис. 28): T(x,t) = t>0. B1) 0, x > Dt, Однако это свойство реализуется лишь при распространении тепла в холодную среду и теряется в случае отличной от нуля начальной температуры вещества (более подробно этот круг вопросов рассмат- рассматривается в гл. V). Описанный дефект, связанный с неприменимостью закона Фурье (и закона Дарси в случае уравнения Буссинеска) в окрестности фронта распространения тепловой энергии, не препятствует широкому при- применению параболических уравнений (из B0) видно, что доля энергии, содержащейся в веществе при достаточно больших значениях ж, нич-
76 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II тожно мала в сравнении с полной энергией Qq). Они служат хоро- хорошим примером универсальности математических моделей, описывая большое количество разнообразных процессов (см. также § 1 гл. IV), имеющих принципиально разную природу. УПРАЖНЕНИЯ 1. Найдите интегральную замену функции Т, с помощью которой уравнение (9) принимает вид A0). 2. Используя те же рассуждения, что и при выводе закона C) и уравнения F), получите уравнение A2). 3. Получите решение B0) для задачи о мгновенном точечном источнике тепла, представляя его в виде T(x,t) = f(t) <р(?)> гДе ? — x/y/4kot. 4. Постройте решение B1) для уравнения A0) с к(Т) = коТа, а > 0, предста- представив температуру в виде T(x,t) = Af(?), A > 0, ? = Dt — х. Убедитесь в том, что в точке фронта волны х = Dt поток тепла равен нулю. § 3. Сохранение числа частиц Введем некоторые понятия теории теплового излучения, перено- переносимого в среде световыми квантами. Закон сохранения числа квантов используем для получения кинетического уравнения, которому подчи- подчиняется функция распределения фотонов. Обсудим некоторые свойства построенной модели лучистого теплообмена в веществе. 1. Основные понятия теории теплового излучения. В ве- веществе, нагретом до достаточно высокой температуры, большую роль играют процессы переноса энергии световыми квантами (фотонами). Распространяясь в среде, рассеиваясь и поглощаясь на атомах и мо- молекулах вещества, а также испускаясь ими, фотоны обеспечивают лу- лучистый теплообмен между различными участками среды. Благодаря именно этому механизму горящий камин нагревает воздух в помеще- помещении. Поле излучения, заполняющее пространство, можно рассматри- рассматривать как электромагнитное излучение с частотой колебаний v и длиной волны Л, связанными через скорость света с (Л = с/и). Если же гово- говорить о поле излучения как о совокупности большого числа частиц — световых квантов, то необходимо ввести понятие энергии кванта hv (h — постоянная Планка), движущегося со скоростью с. В отличие от поля температур, характеризуемого координатами х, у, z и временем ?, для описания излучения важно знать также его частоту v (вообще говоря, разную для разных квантов) и направление движения квантов в любой точке пространства в любой момент t. Проследить траекторию каждого из огромного числа фотонов в веществе попросту невозможно. Поэтому в теории излучения использу- используется статистический вероятностный подход, основанный на введении функции распределения частиц. Это важное понятие успешно исполь- используется для изучения совокупности большого числа частиц или иных объектов в различных областях знания (см., например, § 3 гл. III).
§3] СОХРАНЕНИЕ ЧИСЛА ЧАСТИЦ 77 Функция распределения фотонов / = f(v, г, 0,?) зависит от час- частоты квантов, радиуса-вектора г (т. е. от координат ж, у, z), направ- направления движения частиц О и времени t. Ее смысл состоит в следующем. Рассмотрим в некоторый момент времени t элемент объема dr около точки г (рис. 29). Тогда величина A) ->у Рис. 29 по определению — это число квантов, нахо- находящихся в спектральном интервале {у, v + + dv) (т. е. их частота лежит между значе- значениями v и v + dv), занимающих объем dr и имеющих направление движения в диапазоне от О до О + dfi (О — единичный вектор). Размер объема ^предполагается гораздо больше длины волны Л, так что волновые эффекты несущественны. Функция распределения A) — одно из исходных понятий теории лучистого теплообмена, с помощью которого вводятся и вычисляются все остальные характеристики, описывающие этот процесс. Величина Iv, определяемая по формуле называется спектральной интенсивностью излучения. Она представ- представляет собой количество лучистой энергии в спектральном интервале от v до v + dv, переносимое фотонами за еди- единицу времени через единичную площадку, помещенную в точке г и перпендикуляр- перпендикулярную к направлениям их полета (которые лежат в диапазоне углов от О до О + dU; рис. 30). Действительно, так как энергия кван- кванта равна hz/, а общее число квантов с часто- частотой от v до v + dv и с направлением полета от О до О + dfi в единице объема равно / dv dfi, то переносимая ими за 1 с через расположенную перпендикулярно полету площадку в 1 энергия равна hvcf dvdU, что согласуется с определением B). Рис. 30 см2 Спектральная плотность излучения = hv f fdu = - I Ivdu с J 4тг 4тг C) представляет собой количество лучистой энергии квантов, содержа- содержащихся в 1 см3 пространства в точке г в момент t в единичном интер- интервале частот и имеющих частоту v. Еще одной важной характеристикой служит спектральный поток излучения Sv. Фотоны, пересекающие единичную площадку с направ- направлением нормали п, переносят через нее энергию (в 1 с в интервале от v
78 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II до v + dv) равную hue J f cosO dU (рис. 31). Аналогично вычисляется 2тг энергия, распространяющаяся через площадку справа на- лево, но интегрирование ведется по левой полусфере. Их разность и дает величину Sv\ Sl/(f,t,n) = hvc I fcosOdU, 4тг D) Рис. 31 где 0 — угол между направлением движения квантов и нормалью. Величина Sv — проекция вектора Sv на нормаль п, а сам вектор есть Sv = ¦/¦ 4тг ds Заметим, что при изотропном (не зависящем от направления Г2) излучении спектральная плотность, как следует из C), равна Uv = 4tt/iz//, а из E) видно, что поток Sv равен нулю в любой точке пространства. Полные интенсивность, плотность и поток излучения можно по- получить из спектральных характеристик интегрированием по всему спектру частот v. 2. Уравнение баланса числа фотонов в среде. Выведем уравнение, описывающее перенос излучения в среде, пользуясь за- законом сохранения числа час- частиц и следующими предполо- предположениями: 1) процесс распростране- распространения квантов одномерный, т. е. / = /(!/, ж Д*); 2) рассеянием квантов све- света на атомах или молекулах (т. е. изменением их направле- направления) можно пренебречь; 3) известен характер по- о х х + dx ~x глощения и испускания све- Рис 32 та атомами и молекулами ве- вещества; 4) фотоны самопроизвольно не исчезают и не появляются. Рассмотрим баланс частиц в элементарном цилиндре, имеющем ось в направлении О, длину ds = dx/ cos 0 и основание da (рис. 32), где в — угол между осью х и вектором О. Будем интересоваться излуче- излучением частоты v в единичном интервале частот, распространяющимся внутри единичного телесного угла в направлении О.
§ 3] СОХРАНЕНИЕ ЧИСЛА ЧАСТИЦ 79 В соответствии с A) (см. также определение B)) за время dt в левое основание цилиндра входит число частиц, равное с/(г/, ж, Q,?) da dt. За то же время из его правого основания выходит число частиц (с/(г/, ж, О, t) + с df) da dt, где величина df описывает приращение функции / при переходе от од- одного основания к другому. Поскольку / = /(г/, О, х, t), то эту величину можно представить в виде где первое слагаемое отвечает ее приращению по времени за проме- промежуток dt, а второе — приращению по координате s. Учитывая, что скорость фотонов равна с и dt = ds/c, получаем Итак, число фотонов в цилиндре за время dt изменилось на величину ^~ + с^ I dsdadt = - ( ^ + ccos<9^-) dsdadt. F) dt ds J \dt dxj Напомним, что через боковую поверхность цилиндра фотоны, имею- имеющие направление полета О и не претерпевающие рассеяния, не проле- пролетают. Таким образом, изменение числа квантов в объеме цилиндра мо- может вызываться лишь их поглощением или испусканием атомами и молекулами вещества, находящегося внутри цилиндра. Для вычисле- вычисления этой величины вводится понятие равновесного излучения, когда число квантов, поглощенных веществом, равно числу испущенных час- частиц (излучение и вещество находятся в равновесии) в любой момент времени. Равновесная функция распределения /р есть (закон Планка) где Т — температура вещества (считается, что среда находится в условиях локального термодинамического равновесия, и в любой ее точке можно ввести такие характеристики, как температура, внут- внутренняя энергия и т. д.). В отсутствие равновесия между излучением и веществом интен- интенсивность поглощения (испускания) фотонов пропорциональна разнос- разности между /р и /, т. е. величине
80 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II где kv — k1v (I — exp(/iz//кТ)), a k1v — коэффициент поглощения, опре- определяемый состоянием среды и ее свойствами. Изменение числа квантов в объеме цилиндра за время dt равно Kv(f - fP)dadsdt. (8) Приравнивая F) и (8), получаем для функции распределения ки- кинетическое уравнение, описывающее перенос излучения в среде: dt дх v p где /р задается формулой G). Уравнение (9) вместе с функциями /р, к1у и краевыми условиями представляет собой замкнутую модель распро- распространения лучистой энергии при сделанных выше предположениях. 3. Некоторые свойства уравнения переноса излучения. Полученное на основании закона сохранения числа частиц нестацио- нестационарное одномерное неоднородное гиперболическое уравнение (9) может быть обосновано также и с помощью закона сохранения энергии. Дей- Действительно, в цилиндре рассматривался баланс частиц, имеющих оди- одинаковую частоту v и, следовательно, одинаковую энергию hv. Учиты- Учитывая это, (9) легко переписать как уравнение относительно спектраль- спектральной интенсивности излучения Iv — hvcj\ которое эквивалентно (9), но имеет более непосредственный физичес- физический смысл. ^ При интегрировании A0) по телесному углу О (т. е. по всем на- направлениям полета квантов) получаем уравнение, связывающее плот- плотность излучения C) и его поток D): dUv dSv -^г + ^— = c^i/ (E/i/p - Uv). A1) ox ox Это уравнение можно трактовать как уравнение неразрывности для излучения данной частоты, выражающее закон сохранения излу- излучения и вполне аналогичное уравнению G) § 1 в теории движения грун- грунтовых вод и уравнению E) § 2 в теории теплопроводности. Наиболее очевидна эта аналогия в трехмерном случае, когда уравнения A0) и A1) принимают вид с dt Хотя уравнения (9)—A3) линейные, нельзя, вообще говоря, утверж- утверждать, что модели лучистого теплообмена проще нелинейных моделей, рассмотренных в § 1,2. Ведь, решая (9)—A3), можно получать каждый
§ 3] СОХРАНЕНИЕ ЧИСЛА ЧАСТИЦ 81 раз лишь спектральные (т. е. для данной частоты v) характеристи- характеристики излучения, распространяющегося в заданном направлении О. Для полной картины необходимо найти нужные величины для всех значе- значений г/, О (или какие-то интегралы от них), что является гораздо бо- более трудной задачей. К тому же в более сложных ситуациях (наличие рассеивания фотонов и т. д.) сами модели (9)—A3) могут значительно усложняться. Наиболее простая модель переноса излучения получается из A0), если поглощением и испусканием квантов можно пренебречь и рас- рассматривать случай, когда все частицы движутся в одном направле- направлении. Тогда для любых значений v можно положить cos# = 1 и прийти к уравнению с dt дх полностью идентичному уравнению C) § 1 для потока невзаимодейст- невзаимодействующих материальных частиц. Если интенсивность излучения не зависит от времени, то A0) пре- превращается в неоднородное линейное дифференциальное уравнение cos в • —^ + ycvlv = ку1уъ, A4) dx общее решение которого имеет вид X Т (т\ — / Т* Т р~ж\Х ) Aq*1 _|_ Т p~>c\x0) (~\ К\ J Хо Здесь к(х') = /жж, kv dx", k{xq) = J^ >cv dx" (для простоты в A5) по- положено cos# = 1), Iy0 — постоянная интегрирования. Не останавливаясь подробно на физическом смысле решения A5), поясним, что первый член обязан своим происхождением излучению, возникшему в веществе на отрезке от хо до х (и ослабленному погло- поглощением). Второе слагаемое представляет собой излучение от каких-то внешних источников, входящих в вещество на его граниице хо (и также ослабленное поглощением по мере распространения по среде). Если 1ир и ни — известные функции координаты х (для этого должны быть известны температура и плотность вещества вдоль тра- траектории частиц), то решение уравнения A4) сводится к квадратуре. В противоположном рассмотренному случае пространственно од- однородного поля излучения из A0) получаем -Sf = М^р-^)- A6) с dt p Процесс, описываемый уравнением A6), соответствует ситуации, когда в неограниченной и первоначально холодной среде (т. е. в момент t = 0 излучения нет) с постоянной плотностью происходит быстрый на- нагрев вещества до некоторой температуры Т, которая затем поддержи- поддерживается неизменной во времени. Поскольку потерь излучения с границ 6 А. А. Самарский, А. П. Михайлов
82 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II нет, то пространственные градиенты Т равны нулю и kv, Iup не за- зависят от ж, ?/, z. Возникшее в результате нагрева излучение также имеет нулевой градиент (т. е. Iv = Iv{t)) и? обмениваясь энергией с веществом, стремится с течением времени к равновесному значению по экспоненциальному закону. УПРАЖНЕНИЯ 1. Проверьте правильность выражения E). 2. Повторяя рассуждения п. 2, получите трехмерное уравнение (9) или A0) в случае, когда функция распределения зависит от ж, у, z. 3. Используя определения C), D), выведите из A2) уравнение A3). 4. Получите решение A5) уравнения A4) и конкретизируйте его в случае постоянных ycv, IUp. 5. Убедитесь в том, что решение уравнения «насыщения» A6) (ср. с уравне- уравнением A2) § 1 гл. I) имеет экспоненциальный вид, и найдите показатель экспоненты. § 4. Совместное применение нескольких фундаментальных законов Законы сохранения массы, импульса, энергии используем для по- построения математической модели, описывающей течение сжимаемого газа. Обсудим отличия полученной модели от моделей, рассматривае- рассматриваемых в § 1-3, а также некоторые следующие из нее свойства газодина- газодинамических движений. 1. Предварительные понятия газовой динамики. Заметное изменение плотностей жидкостей и твердых тел может достигаться лишь при огромных давлениях в десятки и сотни тысяч атмосфер и выше. Газообразные среды гораздо легче подвергаются сжатию: при перепаде давления в одну атмосферу плотность газа, первоначально находившегося при атмосферном давлении, уменьшается или увели- увеличивается на величину, сопоставимую с начальной его плотностью. В газовой динамике, изучающей движение сжимаемых сред под действием каких-либо внешних сил или сил давления самого вещества, считается выполненным неравенство А ^С L, где Л — длина свободного пробега, L — характерные размеры области рассматриваемого тече- течения (сплошная среда). Считается также выполненной гипотеза о JITP (см. п. 1 § 2). В условиях ЛТР сжимаемую среду можно рассматри- рассматривать как совокупность большого числа жидких частиц с размерами, много большими Л, но много меньшими, чем L. Для каждой такой час- частицы, связанной с небольшой фиксированной массой среды, вводятся характеризующие ее средние величины — плотность р, давление р, температура Т, внутренняя энергия е и т. д., а также скорость v ее макроскопического движения как единого целого. Все эти величины в общем случае зависят от трех пространственных переменных х, у, z и времени t. В дальнейшем будем также предполагать отсутствие в среде про- процессов теплопередачи, вязкого трения, источников и стоков энергии, например, излучения, и, кроме того, отсутствие внешних объемных сил и источников (стоков) массы в веществе.
СОВМЕСТНОЕ ПРИМЕНЕНИЕ НЕСКОЛЬКИХ ЗАКОНОВ 83 2. Уравнение неразрывности для сжимаемого газа. При- Применим рассуждения, аналогичные тем, что использовались для вывода уравнений неразрывности G) § 1, E) процесса теплопередачи. Рассмот- Рассмотрим в некоторой области простран- пространства, занятой движущимся газом, элементарный кубик со сторонами dx, dy, dz и подсчитаем в нем ба- баланс массы за время dt (рис. 33). Здесь vx, vy, vz — компоненты ско- скорости по соответствующим осям. По оси х через грань с коорди- координатой х в кубик за время dt посту- поступает масса газа, равная pvx dy dz dt, Рис. 33 поскольку величина pvx не что иное, как поток массы по направлению оси х. За то же самое вре- время из грани с координатой х + dx вытекает масса [pvx -\-d(pvx)]dydzdt, где через d(pvx) обозначено приращение потока массы при переходе от координаты х к координате х + dx. Суммируя оба последних выраже- выражения и учитывая, что d(pvx) = — (pvx)dx, получаем величину изменения массы в кубике за время dt благодаря движению газа вдоль оси х: 2 для течения грунтовых вод и dmx = - —- (pvx ox I dx dy dz dt. (i) Точно таким же образом находим изменения массы за счет дви- движения по осям у, z: dmy = — — (pvy) dx dy dz dt, dmz = — — (pvz) dx dy dz dt. оz B) В фиксированном объеме кубика изменение находящейся в нем массы газа выражается также через изменение его плотности со вре- временем: dm = — dt dx dy dz. C) Суммируя dmx, dmy, dmz и приравнивая результат к dm, полу- получаем из A)-C) искомое уравнение неразрывности — + divpv = О, D)
84 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II t + dt р(у) выражающее закон сохранения массы вещества применительно к дви- движению сжимаемого газа. По своей форме и смыслу (скорость изменения величины определяется дивергенцией потока этой величины) оно впол- вполне аналогично уравнению неразрывности G) § 1 и уравнениям E) § 2, (и) § з. Однако аналогия с течением грунтовых вод на этом заканчи- заканчивается. При свободном движении газа его динамика определяется лишь силами давления самого га- газа, в отличие от движения жидкос- жидкости, испытывающей сопротивление р(у + dy) частиц грунта. •< 3. Уравнения движения га- газа. Для их получения применим второй закон Ньютона к элемен- элементарной жидкой частице, имеющей ^ в некоторый момент t форму куби- у ка с гранями dx, dy, dz (рис. 34). Жидкая частица — это переме- перемещающийся в пространстве и ме- Рис. 34 няющий свою форму объем, содер- содержащий в разные моменты времени t одни и те же атомы и молекулы газа. Тем самым его масса dm по- постоянна. Для простоты вывода будем считать, что за короткое время dt кубик не меняет своей формы и смещается по всем направлениям на расстояние, много меньшее его размеров. Определим сначала силу, действующую на кубик, например в на- направлении оси у. Она, очевидно, равна разности давлений на левой и правой гранях, умноженной на их площади (иных сил по предположе- предположению нет): Fy = \р(х, у, z, t) - р(х, у + dy, z, t)] dx dz. Сила Fy равна ускорению жидкой частицы в направлении у, умножен- умноженному на ее массу dm = pdxdy dz: —— CLX Fy = —— p dx dy dz. CLX E) Заменяя в первом выражении для Fy разность давлений через произ- производную от давления по у и приравнивая его к E), приходим к уравне- уравнению, описывающему движение газа вдоль оси у. dvy dp dt dy ' Точно так же получаем уравнения движения по направлениям х, z: dvx dp dt dx ' G) dvz S~dt dp (8)
§ 4] СОВМЕСТНОЕ ПРИМЕНЕНИЕ НЕСКОЛЬКИХ ЗАКОНОВ 85 имеющие, как и F), очевидный физический смысл. В векторной форме уравнения F)—(8) имеют вид p— = -gradp. (9) at Поясним, что в F)-(9) через df /dt обозначена полная (субстан- (субстанциональная, т. е. связанная с фиксированными частицами газа) про- производная по времени какой-либо величины, характеризующей данную неизменную массу газа. Раскрыв df /dt через частные производные по ж, у, z и t в соот- соответствии с правилом df /dt = df /dt + (i/grad) /, придем к уравнениям движения Эйлера — + (i/grad) v = - - gradp. A0) Будучи записаны покоординатно, они принимают вид dvx dvx dvx dvx 1 dp at dx dy dz p ox A2) A3) В отличие от течения грунтовых вод, градиенты давления в урав- уравнениях движения газа F)—A3) определяют компоненты ускорения ве- вещества, а не компоненты его скорости (ср. с законом Дарси (9) § 1). Уравнения D), A1)—A3) содержат пять неизвестных величин — /?, р, 1?ж, vy, vz. Для их замыкания естественнее всего использовать закон сохранения энергии. 4. Уравнение энергии. Для его получения используем ту же упрощенную схему, что и в п. 3: будем рассматривать изменение внут- внутренней энергии фиксированной массы газа dm за короткий промежуток времени dt. Так как по сделанным допущениям в веществе отсутству- отсутствует теплопроводность, вязкость и источники (стоки) энергии, то это изменение вызывается лишь работой сил давления на гранях кубика при его сжатии или расширении. Работа давления, связанная с движением граней объема вдоль оси ж, очевидно, равна dAx = p (vx (х) — vx (х + dx)) dt dy dz, где слагаемые в скобках можно, отбрасывая члены второго порядка малости, переписать через производую dvx/dx и получить dAx = —р —— dx dy dz dt. dx dvy dvz dvy dvz dx dvy У ду dvz У ду dvy Vz~dz~ ~ dvz Vz~dz~ ~ 1 dp p dy ' 1 dp p dz '
86 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II Здесь р — среднее давление в элементарном объеме. Аналогично, (/11 dAy = —р —У- dx dy dz dt, dvz dAz = —p -—— dx dy dz dt. 0z Полная работа, совершенная над газом за время dt, есть dA = dAx + dAy + dAz = — p div v dx dy dz dt. Она равна изменению внутренней энергии объема, т. е. dA = pde dx dy dz, e — удельная внутренняя энергия. Приравняв оба выражения для dA и устремив к нулю dt, окончательно получим р— +р div#= 0, A4) at где de/dt — полная (субстанциональная) производная внутренней энер- энергии по времени. Заметим, что с помощью уравнений неразрывности и движения уравнение A4) приводится, подобно D), к дивергентному виду = -div И (+ Слева в A5) стоит производная от полной (внутренней и кинетической) энергии газа в данной точке пространства. Так как термодинамические свойства вещества предполагаются известными, то г — известная функция уже введенных величин рир, и уравнение A4) либо A5) дает недостающую связь для определения искомых газодинамических величин. 5. Уравнения газовой динамики в лагранжевых коорди- координатах. В полученных моделях течение газа характеризуется зависи- зависимостью величин от декартовых координат х, у, z и времени t. Этот способ описания (эйлеров подход) трактует движение среды с точки зрения неподвижного стороннего наблюдателя и удобен, например, при изучении обтекания газом моделей летательных аппаратов в аэроди- аэродинамических трубах. В лагранжевом подходе координата связывается не с определенной точкой пространства, а с определенной, фиксирован- фиксированной частицей вещества — жидкой частицей. Лагранжевы координаты удобны, например, при анализе некоторых внутренних процессов, про- протекающих в частице, скажем, химических реакций, скорость которых определяется не пространственным положением частицы, а ее темпе- температурой и плотностью. Лагранжев подход может быть полезен и по другим причинам: он, например, неявно использовался в пп. 3, 4 для упрощенного вывода уравнений движения и энергии (рассматривалась жидкая частица в виде кубика).
§ 4] СОВМЕСТНОЕ ПРИМЕНЕНИЕ НЕСКОЛЬКИХ ЗАКОНОВ 87 Особенно наглядную и простую форму газодинамические уравне- уравнения в лагранжевых координатах имеют в одномерном случае. Дейст- Действительно, взяв в направлении оси х столб единичного сечения, левая граница которого подвижна и связана с фиксированными частицами вещества, можно ввести лагранжеву координату по правилу х т(х) = / p(x,t)dx, dm = pdx, A6) Хо где xo(t) — координата частиц столба на его левом конце, x(t) — те- текущая координата (в качестве частицы с координатой xo(t) можно выбрать частицу около твердой стенки, ограничивающей газ, или у границы с пустотой, если таковые имеются). Величина т(х) — масса столба между точками жо, х. Связь A6) дает наиболее естественный и простой способ введения лагранжевой переменной (называемой в этом случае массовой коорди- координатой). Теперь все газодинамические величины трактуются как зави- зависящие не от ж, t, а от m, t. Получим для них уравнения движения из одномерных уравнений в эйлеровой форме dp dp _ dv dv dv _ 1 dp dt дх р дх ' de de _ p dv dt dx p dx Выражения, стоящие в A7) слева, это уже вводившиеся субстан- субстанциональные производные, описывающие изменение со временем вели- величин, относящихся к фиксированной массовой координате т. Тогда, ис- используя A6), из A7) получаем д 1 dv !=-&• Здесь d/dt — субстанциональная производная по времени от соответ- соответствующих величин. Физическая трактовка уравнений движения A9) и энергии B0) та же, что и в эйлеровых координатах (в отличие от уравнения неразрывности A8)). Последнее представляет собой оче- очевидное свойство: объем (а с ним и плотность) фиксированной жидкой частицы изменяется со временем благодаря разности скоростей на ее границах.
88 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II С помощью A9) уравнение энергии можно записать в дивергент- дивергентном виде 5 И) = -?<""• ™ где слева стоит производная по времени относительно полной энергии частицы. Если решение лагранжевых уравнений найдено, в частности, най- найден удельный объем V(m,i) = l/p(m,i), то зависимость газодинами- газодинамических функций от эйлеровой координаты находится из квадратуры (см. A6)) т dx = V(m,t) dm, x(m,t) = / V(m,t) dm + xo(t). о С помощью таких же рассуждений нетрудно получить лагран- жевы уравнения в случае цилиндрической и сферической симметрии, когда газодинамические величины зависят лишь от одной простран- пространственной координаты г (г — расстояние от оси или от центра симмет- симметрии) и от времени t. Они также имеют весьма простой и наглядный вид, чего нельзя сказать о двумерном и трехмерном случае. Несмотря на разные формы записи, эйлеровы и лагранжевы урав- уравнения газовой динамики обладают, естественно, аналогичными свой- свойствами, являясь нелинейными гиперболическими уравнениями в част- частных производных (нестационарными и в общем случае многомер- многомерными). На их основе получаются более сложные модели движения сжимаемых сред, включающие дополнительные физические процес- процессы. Так, для газа, обладающего теплопроводностью, участвующей в процессе переноса энергии, уравнения неразрывности A8) и движения A9) остаются в силе, а уравнение энергии приобретает вид де_ dv__9W dt~ Рдт dm' [ > где W = —крдТ/дт — поток тепла, к — к(р, Т) — коэффициент теп- теплопроводности. Внутренняя энергия жидкой частицы такого газа изме- изменяется не только за счет работы сил давления, но и из-за наличия теп- теплопередачи. Более простые, чем A8)—B0), модели газовой динамики получаются при соответствующих дополнительных предположениях (см. п. 7). 6. Краевые условия для уравнений газовой динамики. Наиболее наглядна их постановка в случае одномерного течения га- газа, описываемого уравнениями A8)—B0). Рассмотрим такое течение в трубе, внутри которой помещен газ, ограниченный справа и слева непроницаемыми твердыми стенками — поршнями (рис. 35). Части- Частицам, находящимся у левой стенки, припишем координату m = 0; тогда координата частиц у правой стенки равна m = М, где М — полная масса газа между поршнями в столбе единичного сечения. Внутренние
СОВМЕСТНОЕ ПРИМЕНЕНИЕ НЕСКОЛЬКИХ ЗАКОНОВ частицы имеют координату 0 < т < М. Уравнения A8)—B0) рассмат- рассматриваются в области 0 < т < М и при t > 0. Для определения течения при всех 0<т<Ми?>0 необходимо задать: 1) начальные условия, т. е. состояние газа в момент t = 0, v(m, 0) = г>0(га), p(m, 0) = ро(т), р(т, 0) = ро(т), B3) 0 М; в B3) вместо р или р можно, пользуясь уравнениями состояния среды, задавать начальную температуру T(m,0) = ХЬ(т); 2) граничные условия, т. е. зависимость от времени газодинами- газодинамических величин на границах т = 0, т = М, например, закон изменения давления , t) = , *) = р2 (t), 0, B4) или закон изменения скорости поршней (т. е. их траекторию в эйлеро- эйлеровых координатах, так как дх/dt = v) v(M,t)=v2(t), t>0. B5) P(M,t) Знание краевых условий B3) и B4) (либо B5)) полностью опре- определяет однозначное решение рассматриваемой задачи о поршне. В качестве граничных условий допускаются также различные комбинации B4) и B5), когда на левой границе поддерживается из- известное давление р\ (t), а на правой задается известная скорость V2 (t) (или наоборот, как на рис. 35). Если интересоваться лишь течением в окрестности одного из поршней, считая влияние второго поршня несущественным, то доста- достаточно задать лишь одно из условий B4) (или B5)), например, при т = 0, и условие B3) при всех т > 0 (газ за- занимает полупространство, ограни- ограниченное слева поршнем). Наконец, граничные условия B4) или B5) вообще не задаются, когда влиянием границ на движе- движение газа в центральной области мож- можно пренебречь (рассматривая про- процесс при достаточно малых време- временах). Тогда из исходной задачи для уравнений A8)—B0) получается задача Коши — задача об эволюции со временем некоторого пер- первоначального распределения газодинамических величин, заданного в неограниченном пространстве. При этом начальные данные B3) опре- определены для всех — оо < т < оо, а уравнения решаются в области — ос < < т < оо, t > 0. Важный класс краевых условий — условия на границе с вакуумом. Пусть сильно сжатый газ, имеющий высокое давление, начинает ис- истекать в сравнительно разреженную среду, находящуюся при низком М Рис. 35
90 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II давлении. Идеализируя этот процесс, можно считать давление и плот- плотность в пространстве, в которое истекает газ, равными нулю, т. е. задавать условие p1(t) = 0, t > 0, либо p2(t) = 0, t > 0 (либо p1(t) = = p2(t) = 0, t > 0), в зависимости от конкретной постановки задачи. 7. Некоторые особенности моделей газовой динамики. Для пояснения этих особенностей предварительно упростим уравнения A8)—B0), используя два обстоятельства. Первое из них — отсутствие в среде (по предположению) изменений энергии за счет теплопроводнос- теплопроводности, вязкости, излучения, внешних источников и стоков энергии и т. д. С термодинамической точки зрения это означает, что процесс адиа- адиабатический и энтропия S каждой фиксированной жидкой частицы со временем не меняется. Тогда уравнение энергии B0) можно переписать в эквивалентной форме !-• В этом нетрудно убедиться, также чисто формально применяя второе начало термодинамики TdS = de+pdV B7) к жидкой частице. Второе обстоятельство — особенная простота выражения энтро- энтропии через давление и плотность в случае идеального газа: S = Cv\npp-^ + S0, B8) где 7 > 1 — показатель адиабаты, равный отношению удельной теп- теплоемкости при постоянном давлении (Ср) и постоянном объеме (Су), So — несущественная константа. Из B6) с учетом B8) имеем -^) = dt что эквивалентно выражению рр-^ = (р(т), B9) означающему независимость от времени энтропии любой частицы га- газа. Функция (р(т) описывает распределение энтропии по массе газа, определяемое по заданным в момент t = 0 функциям ро(т), ро(т). Используя интеграл B9) вместо дифференциального уравнения B0), сведем A8), A9) к дифференциальному уравнению второго по- порядка относительно плотности: №р_^д_( ^+1 <V dt2 dm где по = 7^о5 а постоянная сро — энтропия, предполагаемая не завися- зависящей также и от массовой координаты (случай изэнтропического тече- течения). Гиперболичность уравнения C0) и тем самым уравнений газовой динамики легко установить не прибегая к вычислению характеристик, а получив его линейный аналог. Для этого рассмотрим малые возму- возмущения газодинамических величин в окрестности постоянного решения
§ 4] СОВМЕСТНОЕ ПРИМЕНЕНИЕ НЕСКОЛЬКИХ ЗАКОНОВ 91 p(m,t) = pQ. Представляя возмущенное решение в виде p(m,t) = ро + р и предполагая малыми как сами возмущения, так и их производные, из C0) получаем уравнение для р (черточку опускаем): 92 Р 2 92р C1) Линейное уравнение C1) полностью аналогично уравнению коле- колебаний струны из § 2 гл. III, имеющему, как известно, гиперболический тип. Оно описывает распространение малых (звуковых) возмущений в газе (уравнение акустики) со скоростью звука со = \/7Ро/А) и, в силу линейности, для него нетрудно найти общее решение. Еще одно упрощение уравнений A8), A9), B9) получается в пред- предположении о том, что течение имеет характер простой волны, т. е. любые газодинамические величины являются функциями какой-то од- одной выбранной величины, например плотности. Из A8), A9), B9) и с учетом того, что v = v(p), получаем 1 dp dp dp ^_л dp p2 dt dm dt dm где vp — производная скорости по плотности. Исключая из последних уравнений величину vp, приходим к уравнению Хопфа Уравнение C2) первого порядка, но оно содержит типичную га- газодинамическую нелинейность, и поэтому служит хорошей моделью для изучения нелинейных эффектов, характерных для течений сжи- сжимаемого газа. Самый яркий из них — «градиентная катастрофа», за- заключающаяся в появлении в волнах сжатия бесконечных градиентов газодинамических величин, несмотря на то, что в начальный момент времени все функции являются гладкими. Поясним это понятие следующими простыми рассуждениями. Уравнение Хопфа может быть записано в характеристическом виде Здесь индекс s означает, что полная производная по времени бе- берется вдоль характеристики — линии в координатах т, ?, на которой значение решения (плотности) остается постоянным во все моменты. Раскрывая C3) в виде где ms(t) — значение координаты т для данной характеристики в разные моменты времени, и сравнивая C2) и C4), находим уравнение характеристики ms(i) = y/a^p^t + ms@).
92 ПОЛУЧЕНИЕ МОДЕЛЕЙ ИЗ ФУНДАМЕНТАЛЬНЫХ ЗАКОНОВ [ГЛ. II Из этого выражения видно, что состояния с большим значением плотности распространяются по массе газа с большей скоростью, чем состояния с меньшей плотностью, и в какой-то момент времени «дого- «догоняют» последние. В решении образуется неоднозначность, его градиен- градиенты в точке «слияния» состояний с разными плотностями неограничен- неограниченно возрастают. Схематически этот процесс изображен на рис. 36, где показана эволюция со временем начального профиля плотности тре- треугольной формы: вершина треугольника через некоторое время оказы- оказывается в точке с той же координатой т/., что и его передний фронт. p(m,t) тк Рис. 36 «Градиентная катастрофа» — нелинейный эффект (подробнее см. гл. V). Он не возникает в линейном уравнении C1) и линейном уравнении переноса C) § 1, получающемся из C2) при рассмотрении малых возмущений в окрестности постоянного решения. Существо- Существование этого эффекта приводит к необходимости рассматривать раз- разрывные решения уравнений газовой динамики (заметим, что при про- прохождении разрыва через жидкую частицу ее энтропия изменяется). В этом состоит важное отличие нелинейных гиперболических уравнений от параболических (модели в § 1, 2). УПРАЖНЕНИЯ 1. Получите уравнение B1) из B0), используя уравнение A9). 2. Используя закон сохранения энергии применительно к внутренней энергии жидкой частицы, выведите уравнение B2). 3. Убедитесь в эквивалентности уравнений B6) и B0), используя B7) и B8). 4. Получите уравнение C1) не из C0), а из A8), A9), B9), применяя те же рассуждения. 5. Используя характеристическую форму уравнения Хопфа, найдите момент tk и точку тк «градиентной катастрофы» для ситуации на рис. 36. Библиография к главе II: [30, 43, 44, 55, 69, 74].
ГЛАВА III МОДЕЛИ ИЗ ВАРИАЦИОННЫХ ПРИНЦИПОВ, ИЕРАРХИИ МОДЕЛЕЙ § 1. Уравнения движения, вариационные принципы и законы сохранения в механике Приведем элементарные сведения из классической механики, ил- иллюстрирующие связь между уравнениями динамики Ньютона и Ла- гранжа, вариационным принципом Гамильтона, законами сохранения для механических систем и свойствами пространства-времени. 1. Уравнения движения механической системы в форме Ньютона. Динамика системы, состоящей из N материальных точек, испытывающих действие каких-либо сил, описывается уравнениями сРг- mi-j-^- = Fi, i = l,...,N, A) где rrii — масса материальной точки, t > 0 — время, fi — ее радиус- вектор, Fi = Fi(t,f,df/di) — результирующая всех действующих на нее сил. Через г обозначено множество координат всех точек сис- системы. Величины Fi считаются заданными и могут зависеть как от времени, так и от пространственных координат и скоростей (причем не только выделенной г-й точки, но и всех рассматриваемых точек). Система A) — математическое выражение второго закона Ньютона, примененного к совокупности материальных точек. Записанная в по- покоординатной форме она, очевидно, состоит из 3N уравнений второго порядка относительно 3N неизвестных координат Xi(t), yi(t), Zi(t), i = = 1,...,7V. Если известны начальные координаты а^@), 2/г@), ^г(О), г = 1,..., N, точек и их скорости dxi/dt, dyi/dt, dzi/dt в момент t = 0, то система A) дает возможность найти координаты и скорости всех точек при любых t > 0, т. е. решить основную задачу классической механики. Уравнения динамики в форме A) справедливы для инерциалъной, или галилеевой системы отсчета. В ней свободная материальная точ- точка, т. е. точка, не испытывающая каких-либо воздействий, движется равномерно и прямолинейно. Другими словами, в этой системе коор- координат выполняется первый закон Ньютона. Примером может служить система отсчета, жестко связанная с поездом, движущимся с посто- постоянной скоростью по прямой и горизонтально ровной железнодорож-
94 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III ной колее. Шарик, пущенный по гладкому полу вагона такого поезда, будет двигаться относительно него равномерно и прямолинейно (это свойство сразу же утрачивается при торможениях и ускорениях поез- поезда, на поворотах, подъемах и спусках — система отсчета становится неинерциальной). Конечно же, инерциальная система отсчета — иде- идеализированное понятие, оправданное, однако, при рассмотрении мно- многих важных механических явлений. Очевидное отсутствие инерциаль- ности системы отсчета, жестко связанной с Землей (хотя бы из-за ее вращения), не мешает с хорошей точностью описывать ряд «земных» движений таких, как движение поезда по ее поверхности (для полета баллистической ракеты подобное описание может быть уже неточным). Любая система отсчета, покоящаяся или прямолинейно движу- движущаяся с постоянной скоростью по отношению к некоторой инерциаль- ной системе, также является инерциальной. Множество таких систем, «порождаемых» исходной системой ж, ?/, z, ?, определяется следующи- следующими преобразованиями координат и времени: х* = х + а, у* = у + b, z* = z + с, t* = t, х* = х, у* = у, z* = z, t* = t + а, B) ж* = ж cos а + ^/sin а, у* = — ж sin а + 2/cos а, z* = z, t* = t, x* = x — vxt, у* = у — Vyt, z* = z — vzt, t* = t, a также любыми комбинациями этих преобразований. Здесь а, 6, с, vx, ^у, vz — произвольные постоянные так же, как и а — угол поворо- поворота системы отсчета относительно одной из осей координат (в данном случае оси z). Классическая механика исходит из принципа относительности Га- Галилея — равноправия всех инерциальных систем B), т. е. из того, что законы механики одинаковы в любой из них. Этот принцип отражает, в частности, однородность пространства и времени (первое и второе преобразования B)) и изотропность пространства — отсутствие в нем выделенных направлений (третье преобразование). Последнее из пре- преобразований B) — переход к системе отсчета, движущейся с постоян- постоянной скоростью относительно исходной, — называется преобразованием Галилея. Заметим, что если по каким-то причинам приходится рассматри- рассматривать движение в заведомо неинерциальной системе отсчета, то второй закон Ньютона в форме A) не выполняется. Так, шарик, пущенный по гладкой горизонтальной поверхности вращающегося диска от центра к его краю, в системе отсчета, жестко связанной с диском, движется уже не прямолинейно, а по кривой траектории, как бы испытывая дейст- действие некоторой внешней силы. Для неинерциальных систем уравнения A) и другие законы механики становятся справедливыми при их отно- относительно несложной модификации. Ее суть заключается в добавлении к действующим на систему силам «фиктивных» внешних сил инер- цищ величина которых определяется из характера движения неинер- неинерциальной системы отсчета по отношению к выбранной инерциальной
§ 1] ВАРИАЦИОННЫЕ ПРИНЦИПЫ В МЕХАНИКЕ 95 системе. Обычно же исходная система отсчета в механике считается инерциальной, а ее неинерциальность специально оговаривается. Неизменность законов механики по отношению к преобразованиям B) может выражаться различным образом. Если для уравнений, соот- соответствующих этим законам, при переходе к новой системе отсчета 1) не меняется их структура, 2) не меняется вид функций от координат, скоростей и ускорений, фигурирующих в уравнениях (ими являются силы, энергия, количест- количество движения и другие механические величины), то уравнения инвариантны по отношению к заданному преобразова- преобразованию. Примером служат уравнения mi ——^ = -k(l + гг - г2), dtz C) d2r2 1 ( п т2 -j-j- = -к(г2 -П -I), неизменные при любом преобразовании B) (см. также упр. 1). Уравнение, описывающее колебания колец Сатурна, из п. 3 § 2 гл. I инвариантно при «сдвиге» времени t* = t + а, но изменяет свою форму при «сдвиге» координаты г* = г + а: d2r* п/г п/г г* -а ММ М2 dt* в том смысле, что выражение, стоящее в его правой части (т. е. сила), как функция координаты записывается иначе, чем в исходном урав- уравнении. Форма записи уравнений механики, теряющая свойство 1), но сохраняющая свойство 2) при преобразованиях B), называется кова- риантной. Из покоординатной записи уравнений A) непосредственно следует их ковариантность относительно преобразований B) (однако при более сложных преобразованиях исходной системы отсчета, на- например, при переходе к цилиндрическим и сферическим координатам, ковариантность уравнений движения в форме Ньютона утрачивается). 2. Уравнения движения в форме Лагранжа. Уравнения Ла- гранжа — удобная запись второго закона Ньютона, ковариантная по отношению к гораздо более широкому классу преобразований систем отсчета, нежели B) (ковариантность понимается в том же смысле, что и при преобразованиях инерциальных систем). Поясним, как получа- получаются эти уравнения, на примере самой простой механической системы, состоящей из одной материальной точки, совершающей одномерное движение. В исходной инерциальной системе координат оно описыва- описывается уравнением
96 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III Пусть задано преобразование координат r(t) = r(q(t),t), где q(t) — новая координата материальной точки. Для ее скорости получаем сле- следующее выражение через функции r(q) и q(t): dr dr . dr ,_ + E) Здесь q = dq/dt — «скорость» точки в новых координатах (это в об- общем случае уже не реальная кинематическая скорость, а всего лишь характеристика темпа изменения координаты q точки со временем). «Настоящая» же скорость v в новой системе отсчета, в отличие от старой, становится согласно E) функцией координаты q и скорости q, т. е. v = v(q,q,t). Вычислим теперь ускорение точки со в новых коор- координатах, представив его предварительно в эквивалентном виде: d f дг -г v ^ ~№ ~dt~ dr/dq dtdq~ dr/dq [dt\} dq) l' didq Продифференцировав E) no q, получим дг dv т. е. выражение для преобразования первого члена в квадратных скоб- скобках. Для второго члена, учитывая E), имеем цепочку равенств d dr(q(t),t) _ (Pr . д^г _ д \дг . дг] _ dv dt dq dq24 dqdt dq [dq4 dt\ dq' Используя два последних равенства, придем к окончательному вы- выражению Ш(<7'д'*} " дфq [dt dq подставив которое в D), получим уравнение dt dq dq dq В F) величина F(q, q, t) — сила, стоящая в правой части уравнения D), но записанная в новых координатах, зависимость ее от аргументов g, g, t в общем случае не такая, как от г, г, t. Уравнение F) — простейшее уравнение движения в форме Лагранжа. В его левой части под знаками дифференцирования стоит, очевидно, кинетическая энергия точки, а в правой — действующая на нее сила, умноженная на величину dr/dq, характеризующую связь между старыми и новыми координатами. При трехмерном движении точки вместо координат ж, у, z необхо- необходимо ввести три новые координаты gi, #2, #з- Повторим рассуждения, предшествовавшие выводу F), но возьмем в качестве v, и, F пооче- поочередно vx, vyj vz; LJXJ (jjyj ljz; FXJ Fyj Fz — соответственно проекции скорости, ускорения и силы. Рассмотрим поочередно их как функции
§ 1] ВАРИАЦИОННЫЕ ПРИНЦИПЫ В МЕХАНИКЕ 97 аргументов qi, qi,t; ^2, Ц_2-> t\ #з5 #з5t и подставим полученные выраже- выражения в записанные покоординатно уравнения Ньютона mdvx/dt = Fx, mdvy/dt = Fy, mdvz/dt = Fz. В результате придем уже к трем уравнениям, аналогичным F). Например, первое из них имеет вид d дТ дТ _ дх ду dz 37 тг- т;— — ^х 75 г г у у tz -— , {() dt oqi oqi oqi oqi oqi где T = m (v% -У Vy + v2z)/2 — кинетическая энергия точки. Из этих примеров ясна процедура для общего случая движения N точек, положение каждой из которых определяется тремя коорди- координатами Xi(i), yi(i), Zi(i), i = 1,..., TV (выкладки вполне схожи с теми, что использовались при получении F), G), и не приводятся ввиду их громоздкости). Переход к новым координатам задается произвольным преобразованием (8) где г = 1,..., N, п = SN. В (8) величины qj, I ^ j ^ SN, — так на- называемые обобщенные координаты. Их общее число, как и в старой системе отсчета, естественно, равно 3N. При переходе к координатам qj любая старая координата может зависеть, вообще говоря, от всех новых (как, например, в случае перехода от декартовых координат х, у, z к сферическим координатам р, </?, ф). Поэтому в правых частях формул (8) предусмотрена зависимость от всех величин qj. После подсчета «проекций» (точнее, компонент) всех векторов щ, йг, Fi, г = 1,..., N, на все новые «координатные оси» qj, подстановки полученных выраженией в покоординатные уравнения A) и их сумми- суммирования по индексу г при фиксированном значении j приходим к общим уравнениям Лагранжа dt dqj dqj JJ В (9), как и при N = 1, величина Т — кинетическая энергия системы N 2 N -> -> i=l i=l записанная в координатах qj. Величины N / г\ о о \ 7V г=1 ч ^ ^J ^J y i=l ^ можно понимать как выраженные в координатах qj «проекции» сил F\ на оси qj — обобщенные силы (функции \dfi/dqj\ — коэффициенты 7 А. А. Самарский, А. П. Михайлов
98 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III Ламе\ через А • В обозначено скалярное произведение векторов А и В). В указанной трактовке уравнения (9) представляют собой запись второго закона Ньютона A) в «проекциях» на оси qj. Они заметно упрощаются в случае, когда все силы потенциальны, т. е. существует функция П(жь.. .,xN;yi,. • -,Vn]Zi,. • -,zN;t) такая, что гх~ dXi> гу~ %' lz~ dzr *-*¦,•••>*• Подставим эти выражения в A0) и получим __А/апаж? дП% дП dzj Заменяя в последнем равенстве в функции П старые аргументы на новые, приходим к выводу, что его правая часть представляет собой частную производную некоторой функции V(q,t), называемой потен- потенциалом, по аргументу qj, т. е. ** = - — dqj Другими словами, если исходные силы потенциальны, то и обоб- обобщенные силы потенциальны, и уравнения (9) приобретают вид dt dqj dqj L = T-V. A2) При получении A1), A2) учтено, что функция V(q,i) не зависит от q, и поэтому dL/dqj = dT/dqj. В уравнениях Лагранжа A1) величина L — разность кинетической и потенциальной энергий системы, вы- выраженных в новых координатах. Ее называют функцией Лагранжа, лагранжианом или кинетическим потенциалом системы. Уравнения (9), A1), полученные из уравнений Ньютона A), кова- риантны, как следует из их вида, относительно произвольного преоб- преобразования (8) исходной системы отсчета, а входящие в них функции имеют ясный механический смысл. Для их написания применитель- применительно к конкретной системе необходимо выполнить следующие действия: выбрать независимые координаты q\,..., qn; найти обобщенные силы A0) как функции новых координат (если силы потенциальны, то этого делать не нужно); выразить в новых координатах кинетическую энер- энергию Т и потенциальную энергию П и найти лагранжиан A2) (в случае потенциальных сил); подставить полученные выражения в (9), A1). Эта стандартная процедура называется лагранжевым формализ- формализмом. После ее реализации получается система из SN дифференциаль- дифференциальных уравнений второго порядка для координат q\,..., qn, всегда раз- разрешимая относительно их вторых производных: Qj=Gj(q,q,t), j = l,2,...,n. A3)
§ 1] ВАРИАЦИОННЫЕ ПРИНЦИПЫ В МЕХАНИКЕ 99 При известных начальных значениях ^j(O), Qj(O), j = l,...,n, уравнения A3) дают возможность описать движение системы в лю- любой момент t > 0, т. е. решить основную задачу механики. Преимущества лагранжева подхода заключаются в его единооб- единообразии (ковариантность), в получении относительно простого матема- математического описания движения очень сложных механических устройств (например, робототехнических) в произвольных системах отсчета (в том числе, как видно из (8), и в неинерциальных системах без введе- введения дополнительных сил инерции). Заметим, что уравнения A) также могут быть выписаны в виде, ковариантном по отношению к преоб- преобразованиям (8). Однако они не разрешаются относительно старших производных и содержат гораздо больше (по сравнению с уравнением (9)) функций от новых координат, не имеющих к тому же простого механического смысла. Еще одно преимущество описанного формализма проявляется при изучении систем с механическими связями (во всех предыдущих рас- рассуждениях для упрощения рассматривались свободные системы). Свя- Связи накладывают на движение точек системы определенные ограниче- ограничения, вызванные присутствием материальных объектов, непосредствен- непосредственно в нее не входящих. Примерами служат связи из-за наличия жесткой поверхности, ограничивающей движение катящегося по ней шарика, или невесомого жесткого стержня, соединяющего две точечные массы, и т. п. Связи задаются набором К соотношений вида fk (fi, r, t) = 0, 0 ^ ^ к ^ К ^ SN, которым должно удовлетворять решение уравнений Ньютона A). Сами же уравнения A) в этом случае модифицируются, в их правых частях следует (при некоторых предположениях о ха- характере связей) подставить вместо Fi величину Fi + Щ. Сила Щ — вычисляемая из тех или иных соображений реакция связей. Поэтому при подходе Ньютона описание несвободных систем по сравнению со свободными может заметно усложниться. При подходе Лагранжа реакции связей для очень широкого клас- класса функций fk(ri,r,t) учитываются автоматически, в результате чего обобщенные силы A0) не содержат в себе величин Щ (сама процедура получения уравнений Лагранжа полностью аналогична случаю сво- свободных систем). Более того, число уравнений Лагранжа равно коли- количеству так называемых степеней свободы I = 3N — К и может быть значительно меньше, чем для системы без связей. Число новых неза- независимых координат qj, естественно, также равно 3N — К. Итак, уравнения Лагранжа выводятся из уравнений Ньютона, и наоборот (упр. 2). Таким образом, лагранжев подход, как и подход Ньютона, может быть положен в основу механики. 3. Вариационный принцип Гамильтона. В качестве фунда- фундамента механики могут рассматриваться не только дифференциальные уравнения A), (9) или A1), связывающие механические параметры в данный момент времени ?, но также некоторые общие свойства, ха- характеризующие движение механической системы в целом, на любом произвольном отрезке времени от to ДО t\. Убедимся в этом, анализи- 7*
100 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III руя величину Q = JL(q(t),q(t),t)dt, to A4) ">92 называемую действием по Гамильтону на отрезке [to,^i]. Очевидно, что A4) является функционалом, зависящим от того, как движется система в моменты to ^ t ^ t\. Возьмем в (п + 1)-мерном пространстве q, t две точки Mo(q(to),to) и Mi(q(ti),ti), зафиксировав тем самым моменты to, t\ и положе- положение системы в эти моменты («скорос- («скорости» q в моменты to, t\ не фиксиру- фиксируются). Из точки Мо в точку Mi сис- система может попасть, двигаясь в про- пространстве q, t, вообще говоря, по лю- любым кинематически возможным тра- траекториям («путям»), т. е. по путям, допускаемым существующими связя- связями (см. рис. 37 для случая простран- пространства gi, #2, t). Пусть среди этих пу- путей имеется так называемый прямой путь (сплошная линия). На нем функ- функции qj(t), j = l,...,n, в любой мо- момент времени подчиняются уравнени- уравнениям Лагранжа A1). Остальные пути называются окольными (штрихо- (штриховые линии). Принцип Гамильтона формулируется так: действие Q имеет на прямом пути экстремальное по сравнению с окольными путями значе- значение. Охарактеризуем все возможные пути однопараметрическим се- семейством функций qj = qj(t,a), to ^ t ^ ti, \а\ ^ [3 < оо, j = l,...,n, где значению а = 0 отвечает прямой путь, а значениям а/0 — околь- окольные пути. Тогда действие A4), очевидно, является функцией парамет- параметра а: Рис. 37 Q(a) = to Вариация Q при варьировании параметра а есть to A5) т. е. равна сумме приращении, вызванных вариацией координат Sqj(t,a) и скоростей Sqj(t,a).
§ 1] ВАРИАЦИОННЫЕ ПРИНЦИПЫ В МЕХАНИКЕ 101 Проинтегрировав по частям второй член в правой части A5), по- получаем *1 г, to to 1 = 1 или, используя перестановочность операций варьирования по а и диф- дифференцирования по t: d Г д приходим к равенству - / Y, (- ^~ - —) 6qi dt A6) to to J~ По построению вариации 5qj(a) равны нулю в моменты to, t\, т. е. равен нулю первый член в правой части A6). Для прямого пути по определению справедливы уравнения Лагранжа A1), поэтому равен нулю также и второй член. Таким образом, на прямом пути 5Q = 0. В этом состоит математи- математическое выражение принципа Гамильтона. Его еще называют принци- принципом наименьшего действия, поскольку действие вдоль прямого пути, как можно показать при некоторых дополнительных предположени- предположениях, имеет наименьшее в сравнении с окольными путями значение. Для более общих механических систем (не подчиняющихся уравне- уравнениям A1)) схожее утверждение называется принципом Гамильтона— Остроградского. Напомним, что в терминах вариационного исчисления уравнения A1) называются дифференциальными уравнениями Эйлера для вариа- вариационной задачи SQ = 5 L(q,q,t)dt = O, прямой путь — экстремалью, а отвечающее ему число Q(a = 0) — стационарным значением функционала Q. Нетрудно убедиться в справедливости утверждения, обратного принципу Гамильтона: если для некоторого пути выполняется свой- свойство SQ = 0, то этот путь является прямым (упр. 3). Поэтому все три рассмотренных выше подхода равноправны и могут быть положены в основу математического описания механических систем. 4. Законы сохранения и свойства пространства-времени. Анализ интегральных механических характеристик не сводится к фор- формулировке принципа Гамильтона и различных его обобщений. Он поз- позволяет установить и другие фундаментальные свойства механических
102 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III систем. Продемонстрируем некоторые из этих свойств в случае дви- движений в потенциальных полях, когда как внешние, так и внутренние силы, действующие на точки системы, потенциальны. Для этого по- понадобится вычислить вариацию действия Q на более общем, нежели совокупность прямых и окольных путей из п. 3, семействе кривых в (п + 1)-мерном пространстве gi,..., qn, t. Рассмотрим это однопараметрическое семейство где а — параметр, однозначно определяющий кривую, в частности ее «нижний» и «верхний» концы в пространстве q, t (рис. 38). На пучок A7) не накладывается каких-либо ограничений, поэтому кривые мо- могут «начинаться» и «кончаться» в разные моменты времени to(a) и ?i(a), пересекаться между собой, разные кривые могут совпадать в начальные и конечные моменты и т. д. Вариация действия to(<x) '42 SQ = 6 f L(q,q,t)dt to(a) Рис. 38 на пучке A7) находится с помо- помощью рассуждений, вполне анало- аналогичных тем, что использовались при получении A6), однако соответствующие выкладки гораздо слож- сложнее, так как начальное и конечное положения кривых семейства в пространстве g, t зависят от параметра а. Поэтому приведем только конечный результат: общая формула для 5Q в случае однопараметри- ческого пучка A7) имеет вид d dL dL . _ 7 , ч —— \8qj dt. A8) t0 (a) t0 (a) J Смысл функций pj и Н будет разъяснен ниже. Очевидно, что если начала и концы всех кривых пучка совпадают, то Sqj = St = 0, и из A8) сразу следует A6), или принцип Гамильтона. Функции pj и функция Н называются соответственно обобщен- обобщенными импульсами и гамильтонианом системы. Величины pj вводятся как частные производные лагранжиана по скоростям q\j: Pj = щ;=Рз(я,Я,*), j = l,...,n, A9) и в простейшем случае движения точки в декартовых координатах в стационарном потенциальном поле (функция П из п. 2 не зависит явно от времени) совпадают с проекциями количества движения на
§ 1] ВАРИАЦИОННЫЕ ПРИНЦИПЫ В МЕХАНИКЕ 103 оси ж, у, z. В силу не обсуждаемых здесь общих свойств лагранжиана соотношения A9) могут быть разрешены относительно обобщенных скоростей: Qj = hj(q,p,t), т. е. существует взаимно однозначный переход от лагранжевых пере- переменных q, q, t к так называемым гамилътоновым переменным g, р, t. Функция Н определяется равенством п L, B0) где лагранжиан L и обобщенные скорости выписаны в переменных q, р, t. Гамильтониан играет важную роль при изучении потенциаль- потенциальных движений, в частности потому, что из уравнений Лагранжа A1) получаются уравнения движения в форме Гамильтона (канонические уравнения) p 1 и наоборот (упр. 4). Функция Н имеет ясный механический смысл: если преобразования исходной системы (8) стационарны (явно не зависят от ?), то в любой момент времени гамильтониан численно равен полной энергии системы, т. е. Н = Т + П = Е. После этих пояснений установим связь законов сохранения в ме- механике со свойствами пространства и времени. Рассмотрим однопара- метрическое преобразование системы отсчета q, t q) =(fj(q,t,a), j = l,...,n, t* =i/>(q,t,a) B2) такое, что оно тождественно при а = 0 и для него существует обратное преобразование. Пусть лагранжиан заданной механической системы, движущей- движущейся в потенциальном поле, инвариантен относительно преобразований B2). Это значит, что новый лагранжиан L*(q*,q*,?*) не зависит от а и как функция q*, q*, t* имеет тот же вид, что и исходный лагранжиан в переменных g, g, t. Тогда существует функция от р, g, t не меняющая на прямых путях своего значения с течением времени (первый интеграл движения). В B3) pj, H — соответственно обобщен- обобщенные импульсы A9) и гамильтониан B0), записанные в переменных р, q, t. Схема доказательства сформулированного утверждения (теорема Нётер) выглядит так. В пространстве q, t выбирается кривая q(t), на которой SQ = 0, т. е. отвечающая части некоторого прямого пути на
104 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III отрезке [to, ^i]- В соответствии с B2) эта кривая «порождает» в про- пространстве g*, t* семейство кривых q*(t*, а). На них, в силу инвариант- инвариантности лагранжиана, вариация действия равна нулю при всех значениях а, или, по формуле A8), примененной для пространства q*, Г, &q* dt* = 0. B4) Если в B4) положить а = 0, т. е. взять тождественное преобразова- преобразование, то подынтегральное выражение обращается в нуль, так как в координатах q, t кривая q(t) — прямой путь, и на нем удовлетворяют- удовлетворяются уравнения Лагранжа A1) для L = L*. Значит, необходимо, чтобы выполнялось = 0. Отсюда с учетом свойств преобразования B2) нетрудно вычислить 5q* и St* и, устремив а к нулю, получить формулу B3). Поскольку прямой путь и точки to, t\ были выбраны произвольно, то утверждение теоремы справедливо для любого прямого пути (для всех истинных движений) системы. Из теоремы Нётер следует закон сохранения полной механичес- механической энергии для систем, лагранжиан (так же как и гамильтониан) которых явно не зависит от времени, или консервативных систем. Действительно, взяв в качестве B2) сдвиг по времени Qj=Qj, t*=t легко убедиться в инвариантности лагранжиана и из B3) получить -ф = Н = Т + П = const. Аналогичным образом устанавливаются закон сохранения количест- количества движения для замкнутой (не испытывающей действия внешних сил) системы (упр. 5) и ряд других законов механики. При рассмотре- рассмотрении движений не на одном прямом пути, а на некоторых выделенных множествах прямых путей получаются более общие первые интегралы механических систем — интегральные инварианты. Некоторые из них могут быть положены, как и принцип Гамильтона, в основу механики. Глубокая связь уравнений движения, законов сохранения, вариа- вариационных принципов и свойств симметрии позволяет эквивалентным образом использовать разнообразные подходы для построения матема- математических моделей механических систем. Заметим, что инвариантные
§2] МОДЕЛИ НЕКОТОРЫХ МЕХАНИЧЕСКИХ СИСТЕМ 105 свойства объектов эффективно применяются не только для построе- построения, но и для анализа (см., например, гл. V) моделей многих явлений. УПРАЖНЕНИЯ 1. Покажите, что уравнения C) описывают движение шариков с массами mi, Ш2, соединенных невесомой пружиной с жесткостью к (I — длина ненагружен- ной пружины, r\(t) <C r2(t)). Проверьте инвариантность уравнений при переходе от одной инерциальной системы к другой. 2. Взяв в качестве (8) тождественное преобразование исходной системы от- отсчета, убедитесь в том, что из уравнений (9) получается покоординатная форма записи уравнений A). 3. Проверьте, используя равенство A6), что для пути, вдоль которого 5Q = 0, удовлетворяются уравнения Лагранжа A1). 4. Установите эквивалентность уравнений Гамильтона B1) и Лагранжа A1) на примере движения одной материальной точки в стационарном потенциальном поле, рассматривая его в декартовых координатах ж, у, z. 5. В отсутствие внешних сил потенциальная энергия системы, а значит, и функция Лагранжа не меняются при сдвиге начала координат. Взяв в качестве B2) преобразование декартовых координат ж* = Х{ + а, у* = гц, z* = Z{ (i = 1,..., N), t* = t, убедитесь в том, что B3) имеет вид ф = J^-, f^%^% = const, т. е. что для такой системы справедлив закон сохранения количества движения в проекции на ось х. § 2. Модели некоторых механических систем Уравнения Лагранжа и принцип Гамильтона применим для описа- описания различных типов движения маятника и малых колебаний струны, а также колебаний электрического тока в контуре, для чего используем электромеханическую аналогию. Обсудим некоторые свойства изучае- изучаемых процессов. 1. Маятник на свободной подвеске. Система состоит из двух точечных масс, mi и Ш2, соединенных невесомым жестким стержнем длины I (рис. 39). Движение происходит в поле силы тяжести и счи- считается плоским, т. е. рассматривает- рассматривается в системе отсчета ж, у, t. Точка с массой mi (подвеска) не закреплена, а может перемещаться вдоль оси х (ср. с п. 3 § 3 гл. I). Для описания плоского движе- движения двух точек в исходной систе- системе отсчета необходимо, вообще го- говоря, найти из уравнений A) § 1 че- четыре функции времени, xi(t), yi(t), X2(t), V2(t)i т. е. декартовы коорди- координаты первой и второй точек. Однако изучаемая система несвободна, по- поскольку содержит две механические связи (п. 2 § 1). Одна из них описывается уравнением yi = 0 (подвеска не может совершать вертикальных перемещений), а вторая — урав- уравнением (xi — Х2J + у2 = I2 (расстояние между точками при любом t У i 0 { Pi 0\ mi \ )m2 m2g Рис. 39
106 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III равно длине стержня). Поэтому при переходе к уравнениям Лагран- жа достаточно выбрать (по числу степеней свободы) лишь две новые независимые координаты. Возьмем в качестве обобщенных координат величины qi(t) = x\(t) и q2(t) = a(t), где а — угол между вертикалью и осью стержня. Такой выбор соответствует преобразованию (8) § 1 вида х\ — q\, х2 = q\ + I sin q2, 2/2 = —/ cos q2. Выразим сначала кинетическую энергию системы Т = Т\ + Т2 в координатах q\, ^2 • Для подвески имеем _ 1 ~ 2 Для маятника получаем С помощью равенств v2x—x\-\-ldi cos a, v2y = la sin а, первое из кото- которых учитывает составное движение массы т2 вдоль оси х как сумму движений вместе с подвеской и относительно нее, запишем величину Т2 как функцию xi, а: Рассмотрим теперь силы, действующие на точки mi, m2. Сила тя- тяжести и вертикальная проекция R\y реакции стержня Д]_, приложен- приложенные к подвеске, уравновешиваются реакцией опоры, и поэтому верти- вертикальная равнодействующая сила равна нулю. Сила Т\х представляет собой, очевидно, горизонтальную проекцию реакции стержня (связи) R\x. При лагранжевом подходе силы реакции стержня на движение как подвески, так и маятника, т. е. силы R\ и Л2, учитывать нет не- необходимости (конкретный пример содержится в п. 2). Поэтому из всех действующих сил достаточно принять во внимание только силу тяжес- тяжести J-2, действующую на маятник. Для ее проекций имеем равенства Г\"ГТ Ъх = 0, Т2у = -т2д = -т2 — , где ПB/2) — гп29У2 — потенциальная энергия маятника. В координатах #1, #2 Щ2/2) выражается формулой У{я.2) — —rri2lg cos а. Так как изучаемое движение потенциально, то следует воспользо- воспользоваться уравнениями Лагранжа A1) § 1, где j = 1,2, г = 1,2,и L = Т - V = Тг + Т2 - V, или, в развернутом виде, L = х\ Л (la2 + 2x\6l cos a) + rri2lg cos a. A)
§ 2] МОДЕЛИ НЕКОТОРЫХ МЕХАНИЧЕСКИХ СИСТЕМ 107 Из A) дифференцированием по gi, gi, q2, Ц2 (напомним, что q\ — х\, q2 = а) получаем - = 0, -^— = (Ш1 + ТП2)Х1 + TTT^/aCOSO' <9<?i dq1 dL 1 dL —— = — m2/ sina (xia + a), —— = 777,2/ (la + #i cosm. 9^ <9<? Подставляя полученные выражения в уравнения Лагранжа и произво- производя дифференцирование по ?, приходим к двум уравнениям относитель- относительно xi, a: (mi + 777,2) ?1 + 777,2/ cos a • а = 777,2/ sin a • a2, B) cos ax'i + la = —g sin a, представляющим собой модель изучаемой системы. В соответствии с общими свойствами лагранжева формализма уравнения B) разреши- разрешимы относительно х\, а и при известных значениях начальных обобщен- обобщенных координат и обобщенных скоростей позволяют найти координаты и скорости точек в любой момент времени. Нелинейная система четвертого порядка B) легко сводится к урав- уравнению второго порядка, например исключением из нее величины х\: I (mi + 777,2 sin2 а) а = — sin a [777,2/ cos а • а2 + (mi + 777,2) д\- C) Этот результат — следствие инвариантности лагранжиана A) от- относительно двух однопараметрических семейств преобразований. Пер- Первое из них дается формулой x\—x\-\-^[L не меняется при сдвиге коор- координаты xi), а второе — формулой а* = а + 777, sign/3 2тг, где ттт, = 1, 2,...; C — параметр преобразования (L не меняется при повороте системы координат на угол, кратный 2тг). Согласно теореме Нётер (п. 4 § 1) у системы имеются два первых интеграла, определяемые по формуле B3) § 1, и поэтому ее порядок может быть понижен на две единицы. Еще один интеграл системы очевиден: лагранжиан A) не зависит явно от времени (консервативность), и сохраняется ее полная энергия Н = = Т + V. Это свойство обеспечивает возможность понижения порядка системы B) еще на одну единицу и сведения C) к уравнению первого порядка (упр. 1). Данный пример хорошо иллюстрирует различие между лагран- жевым и ньютоновым подходами к описанию движения механических систем. Уравнения Ньютона для подвески и маятника в координатной форме выглядят так: m2x2 = -Д1 (х2 - xi)/l, D) ГП2У2 = -Я2У2/1
108 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III где R\ = R2 = R — модуль вектора реакций стержня, приложенных к массам mi и rri2 (см. рис. 39), причем очевидно, что R\ = —R2. Ре- Реакция создается натяжением стержня, который в идеализированной постановке считается абсолютно жестким, и его деформацией пренеб- регается. Три уравнения D) содержат четыре неизвестных величины: х±, %2-> 2/2, R- Систему D) можно замкнуть, используя уравнение связи (х2 — xiJ + у2 = I2, и прийти к некоторому нелинейному уравнению второго порядка (см. также упр. 2). Однако в случае более сложных систем эта громоздкая процедура становится фактически неосущест- неосуществимой. При составлении уравнений Лагранжа она не требуется (что и послужило первоначальной причиной разработки лагранжева форма- формализма). Кроме того, инвариантные свойства лагранжиана ясно указы- указывают на существование первых интегралов движения, что существен- существенно упрощает исследование. Получающееся из C) уравнение первого порядка относительно не- нетрудно изучить в плоскости функций a, da/dt (фазовой плоскости) и определить все характеристики движения в зависимости от началь- начальных данных. Ограничимся рассмотрением малых колебаний системы, когда а <С 1. Отбрасывая в C) члены более высокого порядка малости, приходим к уравнению д mi + ш2 а = - а, / mi которое, очевидно, имеет общее решение a(t) — A sin cut + В cos cut, где константы А и В определяются из начальных данных, а частота колебаний дается формулой I \ mi В сравнении с жестко закрепленным маятником, для которого lj$ = = уд/1, частота увеличивается, зависит от значении mi, rri2 и растет тем больше, чем больше становится отношение шг/Ш1, что связано со свободным движением точки крепления. Этим же объясняется еще одно отличие, заключающееся в следующем. Пусть в начальный мо- момент t = 0 отклонение маятника равно а@) > 0, а его скорость, как и скорость подвески, равна нулю, т. е. энергия системы сосредоточена в потенциальной энергии маятника. Она полностью преобразуется в его кинетическую энергию при прохождении им низшей точки. В этот момент скорость маятника равна V2X = х\ + la. При ее вычислении учтем, что в данном случае a(t) = а@) cosa;? и что х\ = —la — да (по- (последнее равенство вытекает из линеаризованной системы B)). Таким
§ 2] МОДЕЛИ НЕКОТОРЫХ МЕХАНИЧЕСКИХ СИСТЕМ 109 образом, t х1 = —la — / ga(t) dt, о или t V2X — ~9 I а@) cos cut dt. о В интересующий нас момент t = тг/Bо;) /B / J 2ж (а = 0) = -#а@) / cos utdt = - J Это значение в lj/ujo Р^з меньше максимальной скорости маятника на жесткой подвеске — запасенная вначале энергия частично переходит в кинетическую энергию подвески. Если же ?7ii —У оо (очень массивная подвеска), то, естественно, как малые, так и конечные колебания системы совпадают с движением жестко закрепленного маятника. 2. Непотенциальные колебания. Учтем теперь действие сил трения на маятник и подвеску, считая их пропорциональными скорос- скоростям: Так как силы трения зависят от скоростей, то движение непотенциаль- непотенциально, и следует использовать уравнения Лагранжа (9) § 1 с обобщенными силами в правых частях. Выбирая, как и прежде, q\ = xi, q2 = а, по- получаем из общей формулы A0) § 1 дх\ ду\ дх2 ду2 ф - т dxi +т dyi -l т до°2 + т ду2 dq2 y dq2 dq2 y dq2 где J~iXj Fly, J~2xj J~2y — компоненты равнодействующих сил, при- приложенных к массам mi, m2 (см. рис. 39). Приняв во внимание, что Т\у — 0, и равенства dx\jdq\ — dx2jdq\ — 1, dyi/dqi = dx\jdq2 — О, dx2/dq2 = /cos^2, dy2/dq2 = /sin^2, упростим выражения для Фь Ф2: Jr2ylsinq2.
110 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III Выразим компоненты действующих сил в координатах q\ = xi, ^2 = ol\ Fix — Fix + Rix — ~^\v\x + Rix — -l^ixi + Rs'ma, ^2X = ^2ж + R^x — —^2^2x + Rix — —№ (xi + lot cos a) — Д sin a, ?2У = ^2j/ + ^2^ -mg = -/J,2V2y + ^2^ - rn2g = = —[i2lcx sin a + it! cos a — где .R — величина силы реакции стержня. Подставляя их в E), полу- получим ф: = — (^ + jj,2) x\ — \i2l0L cos a, (в) $2 = A^2^i cos a — fi2l2a — rri2gl В соответствии с общим свойством лагранжева формализма ре- реакции связей, как видно из F), не вошли в окончательное выражение для Ф]_, <1>2. Кинетическая энергия системы Т найдена в п. 1: _ mi +m2 .0 ^2^/7.2 Т = х{ + —- (la2 Вычисляя аналогично п. 1 производные dT/dqi^ и dT/dqi^ и диф- дифференцируя по t, придем к уравнениям Лагранжа применительно к рассматриваемой системе (mi + 777,2) xi + ^-2^ cos a • a = тг/ sin a • a2 + Ф1, G) 777,2/ cos a • x\ + rri2l2OL — Ф2. Как и для потенциального движения, нелинейная система четвер- четвертого порядка G) разрешается относительно старших производных, и при заданных начальных значениях #i@), ^i(O), «@), d@) из нее опре- определяются положения и скорости масс mi, 777,2 в любой момент времени. Однако, в отличие от системы B), у изучаемого движения нет трех первых интегралов (теорема Нётер справедлива для потенциаль- потенциальных движений), и ее порядок может быть понижен лишь на единицу (упр. 3). Еще одно отличие заключается в виде балансного энергети- энергетического соотношения (8) где Е@) — полная начальная энергия системы, E(t) = T(t) + V(t) — текущая полная энергия, A(t) — работа сил трения, произведенная к моменту t. Механический смысл (8) состоит в том, что величина утраченной (диссипированной) энергии системы равна работе, совер- совершенной над нею непотенциальными силами трения. Получим равенство (8) для простоты в случае jj,2 = 0 (трение ис- испытывает лишь подвеска). Из F) имеем Ф1 = —/JbiXi, Ф2 = —777,2/g sin a.
§ 2] МОДЕЛИ НЕКОТОРЫХ МЕХАНИЧЕСКИХ СИСТЕМ 111 Подставим эти выражения в G), умножим первое уравнение на х\, второе — на d, сложим оба уравнения и придем к равенству х\ ((mi + 7712) xi + 777,2/ cos a • а) + a G77,2^1 cos a + rri2l2a) = = 777,2/ sin a • а • xi — тъгд sin a • а — \i\x\. (9) Соотношение (9) совпадает с продифференцированным по времени ра- равенством (8), в котором полная энергия в момент t есть E(t) = —Ц-—- х\ + —?- (la2 + 2fia cos a) - m2lg cos a, а работа силы трения дается формулой t t t t o Fi da;i = / /ii^i da;i = fJ.i —jj- dxx = pi ( —jj- j dt. 000 0 Таким образом, (9) эквивалентно равенству или, что то же самое, равенству (8). Так как dE(t) \ то в сравнении с консервативной системой п. 1 полная энергия в данном случае не постоянна, а убывает со временем. При малых колебаниях жестко закрепленного маятника из G) по- получаем уравнение № . 9 а = а а, 777,2 * эквивалентное уравнению движения в вязкой среде шарика на пружин- пружинке (п. 3 § 4 гл. I) и имеющее простое общее решение. 3. Малые колебания струны. Применимость принципа Га- Гамильтона не ограничивается системами материальных точек. Он рас- распространяется на объекты, не являющиеся, строго говоря, совокупнос- совокупностями точечных масс. Примером служит упругая нить или струна — сплошная среда, которую, однако, можно рассматривать как множес- множество примыкающих друг к другу материальных точек. Будем считать, что толщина струны много меньше ее длины / и что она имеет по- постоянную линейную плотность ро. Натянутая с силой Fq струна в со- состоянии равновесия неподвижна и представляет собой прямую линию. При отклонении от равновесия, например, в результате удара, стру-
112 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III на изгибается, ее участки начинают двигаться (рис. 40). Колебания считаются плоскими и малыми — их амплитуда значительно меньше длины струны. Это предположение позволяет пренебречь продольны- продольными смещениями и скоростями участков струны, рассматривая только поперечное их движение. Представим струну как совокупность N материальных точек с равными массами mi = pol/N = роАх, ъ = 1,..., N. Длина каждого участка струны, содержащего массу rrii, равная Ах в положении равно- равновесия и несильно, ввиду малости колебаний, изменяющаяся при откло- отклонении от него, считается малой. Поэтому положение г-й «материальной точки» в любой момент времени можно охарактеризовать величинами Xi(i) (продольной координатой центра г-ro отрезка) и yi{t) (попереч- (поперечным отклонением центра отрезка от положения равновесия). Введен- ные таким образом обобщенные (в данном случае — декартовы) ко- координаты полностью описывают плоское движение рассматриваемой системы. В силу малости отклонений, как уже отмечалось, dxi(t)/dt = = yix = 0, т. е. координаты Х{ не зависят от времени. Составляющие струну «материальные точки» связаны между со- собой и при N —У оо, Ах —у 0 образуют для любого момента времени в плоскости ж, у некоторую кривую У = y(x,t). A0) В отличие от рассматривавшихся выше механичеческих связей, которые всегда считаются заданными, «связь» A0) неизвестна, и функция y(x,i) подлежит определению. Если она найдена, то тем са- самым известны координаты yi = y(xi,i), и поскольку координаты xi не меняются с течением времени, полностью известно движение системы. Кинетическая энергия г-й массы определяется по формуле dVi При получении этой формулы использовано равенство dyi/dt = dyi/dt, справедливое потому, что dxi/dt = 0. Полная кинетическая энергия
§ 2] МОДЕЛИ НЕКОТОРЫХ МЕХАНИЧЕСКИХ СИСТЕМ 113 системы равна (f) Е = 5 Е Вычислим теперь силы, действующие на г-ю массу. По предполо- предположению о малых колебаниях Т\х = 0. Вертикальная компонента Т%у определяется как сумма вертикальных компонент силы натяжения струны на правом и левом концах г-го отрезка. Его удлинение при отклонении от положения равновесия мало, поэтому силу натяжения струны можно считать неизменной и равной Fq. Тогда вертикальные составляющие сил, приложенных к правому и левому концам, соответ- соответственно равны (/77 / /* Т Т- = -Fo sin a = -Fo т^Ы + СУП ( /\ Т* Т+ = Fo sin/3 = Fo^-[xi-—- (см. рис. 40; напомним, что сила натяжения направлена по касательной к струне). В итоге получаем Ъу = F++F-=F0 [yx (x - Дяг/2) -ух{х + Дж/2)], или, учитывая малость отрезка Дж, Tiy = -F0(yxx)i Ах. Примем во внимание, что из A0) следует ду = ух • дх, и перепишем последнее выражение в виде Отсюда сразу видно, что все силы Tiy, i = l,...,iV, потенциальны, причем потенциальная энергия г-й массы дается формулой Vi=1-F0(yl)iAx, а полная потенциальная энергия струны есть Поскольку движение системы потенциально, то к нему приложим принцип Гамильтона, сформулированный в § 1. Из A1), A2) получаем лагранжиан 8 А. А. Самарский, А. П. Михайлов
114 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III Действие по Гамильтону вычисляется по формуле Q(y,y,t) = j Ldt = to to 1 N г=1 р^т дх Axdt, A3) где to, t\ — два произвольных момента времени, в которые система имеет координаты yi(to), yi(t\). Перейти из состояния с yi(to) в со- состояние с yi(t\) можно, вообще говоря, многими путями. Принцип Га- Гамильтона выделяет из этого множества «истинный» прямой путь, для которого вариация действия SQ равна нулю. Вычислим с помощью A3) вариацию SQ, придавая вариацию 8yi координатам и 8yi — скоростям г-х точек: ti 8Q = 8 [ Ldt = N to t0 г~1 L Первый член в правой части A4) возникает в результате варьиро- варьирования скорости iji, а второй — при варьировании координаты у{. Для преобразования первого члена проинтегрируем его по частям, исполь- используя перестановочность операций варьирования и дифференцирования по t, и, принимая во внимание, что Sy(to) = Sy(ti) = 0, получим to to Второй член с учетом равенства ду = ухдх переписывается в виде ti N ?де, ( to г~1 L J to После подстановки этих выражений в A4) получим Перейдем от дискретной системы «материальных точек», которой первоначально была заменена струна, к сплошной среде. Для этого в последнем равенстве устремим N —> оо, заменим Ах на dx и опустим индекс г: to 0
§ 2] МОДЕЛИ НЕКОТОРЫХ МЕХАНИЧЕСКИХ СИСТЕМ 115 На прямом пути 5Q = 0, что возможно, лишь если в последнем равен- равенстве подынтегральное выражение равно нулю при всех х и ?, т. е. z. — а2 ~. а2 — _2. О < х < I t > 0. A5) C/t (УХ Ог\ Следовательно, при малых колебаниях струны ее отклонение подчи- подчиняется уравнению A5), из которого при соответствующих краевых условиях определяется функция у = y(x,t). Принцип Гамильтона применительно к рассматриваемой ситуа- ситуации можно трактовать как способ получения уравнения «связи» A0). В силу свойств лагранжиана полная энергия Н = Т + V струны сохра- сохраняется со временем (консервативность движения нетрудно установить также непосредственно из уравнения A5); см. упр. 4). Уравнение малых колебаний струны A5) (и = 2тгао/А — частота колебаний с длиной волны А) — линейное уравнение второго порядка в частных производных гиперболического типа. Принцип суперпозиции позволяет получить его общее решение как сумму частных решений, используя соответствующие методы теории уравнений математичес- математической физики. Основной краевой задачей для A5) является первая краевая за- задача на отрезке [0,/], когда для однозначного определения решения задаются начальные отклонения у(х,0) = уо(х), 0 < х < Z, скорости у(х,0) = уо(х), 0 < х < Z, и граничные значения функции y(O,t) = 2/i(t), ? > 0 и 2/@, Z) — 2/г(?)? ^ > 0. Основная задача допускает различные мо- модификации, самая простая из которых — задача Коши, решаемая на всей прямой — оо < х < оо. Такая идеализация оправдана в случае, ес- если рассматривается движение центральной части струны в течение непродолжительного времени, и влиянием границ можно пренебречь. Для решения задачи Коши достаточно знать начальные скорости и координаты струны, т. е. функции уо(х), уо(х) при — оо < х < оо. Для частного вида движений, обладающих свойством dy/dt = = сду/дх, с = const (простые волны), уравнение A5) переходит в изученное в § 1 гл. II гиперболическое уравнение первого порядка, или уравнение переноса (см. также упр. 5). Отметим, что обычно уравнение A5) получают с помощью непо- непосредственного применения второго закона Ньютона и закона Гука к элементарному участку струны. При этом предположения о малости колебаний, однородности струны и т. д. в обоих подходах одни и те же. Поэтому и математические модели движения струны в обоих случаях одинаковы. 4. Электромеханическая аналогия. Распространение принци- принципа Гамильтона возможно не только на процессы движения сплошных сред, но и на некоторые немеханические объекты. Рассмотрим уже изучавшийся в § 5 гл. I колебательный контур, состоящий из конден- конденсатора с емкостью Со и катушки с индуктивностью Lq. В начальный момент времени цепь разомкнута, заряд сосредоточен на обкладках конденсатора. При замыкании цепи конденсатор начинает разряжать- разряжаться, и по ней идет ток.
116 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III Электромеханическая аналогия заключается в следующем. Об- Обобщенной координате отвечает заряд на обкладках конденсатора — неизвестная функция времени q = q(t). Величина электрического то- тока q(t) = dq(t)/dt = i(t) играет роль обобщенной скорости. Для пра- правильного определения аналогов кинетической энергии (энергии движе- движения) и потенциальной энергии (энергии конденсатора) будем руковод- руководствоваться следующими наводящими соображениями. Энергия пере- перемещающихся по проводнику зарядов (энергия тока) пропорциональна квадрату скорости v их направленного движения. С другой стороны, заряд, проходящий через поперечное сечение S проводника в единицу времени (ток), равен г = q^nSv, где go, n — величины элементарного заряда и объемной концентрации переносчиков тока соответственно. Следовательно, энергия движения частиц Т ~ у2 ~ г2, т. е. пропорцио- пропорциональна квадрату тока q(t) = i(t). Коэффициент пропорциональности (аналог массы) берется равным Lq, т. е. Потенциальная энергия контура содержится в конденсаторе. Для его зарядки требуется затратить определенную работу по разделению разноименных зарядов. Согласно закону Кулона сила, препятствую- препятствующая этому, как функция зарядов gi, q2 пропорциональна их произ- произведению qiq2 (если q± = q2 = q, то сила пропорциональна q2). Таким образом, работа по разделению зарядов, т. е. потенциальная энергия системы У, пропорциональна квадрату «обобщенной координаты»: где 1/Со — аналог коэффициента упругой силы в законе Гука (система шарик—пружина), или величине л/g/l в случае колебаний маятника. Примем теперь во внимание, что действующие в контуре си- силы имеют чисто электростатическое происхождение (сопротивлением проводников пренебрегается, т. е. «трение» отсутствует, как отсут- отсутствуют и потери энергии на излучение электромагнитных волн). По закону Кулона эти силы определяются «обобщенной координатой» q и не зависят от q. В этом смысле силы «потенциальны», и вместе с ними «потенциальна» рассматриваемая система. Поэтому у нее су- существует «лагранжиан» L — Т — V и к ней применим аналог принципа Гамильтона: для «истинного» пути системы вариация «действия» Q= Ldt to равна нулю (здесь, как обычно, to, t\ — два произвольно взятых мо- момента времени). Пусть функция q(t,O) = q°(t) отвечает прямому пути системы в промежутке ?о <t<t\. Вариация координаты q(t, а), а^О, равна Sq = q(t,a) — q°(t), где q(t,a) — все возможные «траектории»,
§ 2] МОДЕЛИ НЕКОТОРЫХ МЕХАНИЧЕСКИХ СИСТЕМ 117 имеющие одинаковые координаты q(to, a), q(ti, а). Для вариации «дей- «действия» имеем SQ = S f Ldt = S f\ (b0q2 --^q)dt=l f[L(q) - L(q0)} dt. J J * \ ^o/ * J to to to Так как q = q° + Sq, то подынтегральное выражение можно предста- представить в виде L(q) - L(q°) = Lo [(q0J + 2q° Sq + Sq2] - - i- [(^°J + 2q° Sq + Sq2] - Lo (q0J + -J- (q0J. Отбросив в нем члены второго порядка малости, получим SQ = to Интегрируя член Loq° 5q, где 5q = dEq)/dt, по частям и учитывая, что () = Sq(ti) = 0, придем к окончательному выражению для 5Q SQ = to Из него для заряда q(t) (верхний индекс у q° опущен) следует уравне- уравнение описывающее колебания в электрическом контуре и полученное в § 5 гл. I другим способом. Заметим, что полная энергия колебаний Н = = Т + V сохраняется со временем, что согласуется с инвариантностью «лагранжиана» относительно сдвига по времени. Рассмотренная аналогия применима также к электрическим це- цепям гораздо более сложной конфигурации, на ее основе строятся ма- математические модели протекающих в них процессов. Приведенный пример далеко не единственная иллюстрация широкой применимости принципа Гамильтона и других вариационных принципов. Они часто используются при построении математических моделей не только ме- механических или физических, но и многих химических, биологических и иных явлений. УПРАЖНЕНИЯ 1. Используя замену da/dt = v, сведите уравнение C) к виду dv/da = /(v,a). 2. Переходом в уравнениях D) к координатам Х2 = х\ + /sin a, г/2 = —/cos a получите уравнение C).
118 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III 3. В систему G) величина х\ явным образом не входит. Покажите, используя это свойство, что G) сводится к системе уравнений третьего порядка относительно функций X(t) = dxi/dt, Y(t) = da/dt, Z(t) = a(t). 4. Умножьте обе части уравнения A5) на dy/dt и, интегрируя полученное равенство от t = 0 до t > 0 и от ж = 0 до ж = I, убедитесь в том, что H(t) = Н@) для любых t > 0. 5. Получите решение уравнения A5), описывающее движения струны, для которых dy/dt = сду/дх. § 3. Уравнение Больцмана и производные от него Построим иерархическую цепочку моделей, описывающих дина- динамику большого числа материальных частиц. Основой первоначальной модели будет служить кинетическое уравнение Больцмана для функ- функции распределения. Из него по принципу «сверху вниз» путем после- последовательного введения упрощающих предположений получим модели для вязкого теплопроводного газа, уравнения Эйлера и уравнения акус- акустики. 1. Описание совокупности частиц с помощью функции распределения. В пространстве ж, у, z находится «жидкость» или «газ» — большое число материальных частиц (молекул, атомов, элек- электронов, ионов), свободно движущихся в промежутках между взаимны- взаимными «столкновениями». Если известны координаты и скорости любой частицы как функции времени, то тем самым полностью известны ос- основные характеристики рассматриваемого ансамбля. Они определяюся начальным состоянием каждой частицы, характером взаимодействия между ними (например, электроны и ионы притягиваются или оттал- отталкиваются по закону Кулона), а также действующими на них внешними силами. Задавая в момент t = 0 положение и скорости частиц и зная все действующие на них силы, можно в принципе решить основную за- задачу механики (§ 1) для рассматриваемой системы (имеется в виду, что они подчиняются законам классической механики). Такой подход (применительно к обычному газу он называется молекулярной дина- динамикой) дает исчерпывающую информацию и занимает высшее место в иерархии математических описаний газа. Однако при достаточно большом количестве частиц реализовать его практически невозмож- невозможно в том числе и потому, что их начальные положения и скорости никогда в точности не известны. Кроме того, как правило, нет необхо- необходимости прослеживать поведение каждой частицы, поскольку интерес представляют лишь средние характеристики системы такие, как плот- плотность, скорость, температура и т. п. Поэтому описание с помощью первопринципов, т. е. с применени- применением второго закона Ньютона к каждой из частиц, используется только в специальных случаях. Переход к следующему звену в иерархии мо- моделей основан на отказе от изучения индивидуальной судьбы частиц. Вводится статистическое вероятностное описание их ансамбля с по- помощью функции распределения f(f,v,t), где f,v — радиус-вектор и скорость соответственно. Функция / зависит от «координат» шес- шестимерного фазового пространства ж, у, z, vXj vyj vz (пространства
§ 3] УРАВНЕНИЕ БОЛЬЦМАНА И ПРОИЗВОДНЫЕ ОТ НЕГО 119 состояний) и времени (ср. с функцией распределения фотонов в § 3 гл. II). Величина f(f,v,t) dfdv по определению равна числу частиц, находящихся в момент t (точнее, их среднему значению за короткий промежуток времени dt) в элементе dfdv фазового пространства, т. е. имеющих координаты в интервале от г* до г + df и скорости в диапазоне от v до v + dv. Элемент dfdv считается малым в сравнении с характерными размерами системы, но содержащим достаточно большое число частиц. Для простоты рас- рассматривается газ, состоящий из частиц одного сорта. Через функцию распределения вычисляются средние величины, характеризующие состояние газа в пространстве и во времени. На- Например, очевидно, что выражение n(f,t) = / f(f,v,t)dv, где интегрирование ведется по всем скоростям, есть не что иное, как число частиц, находящихся в единице физического объема с координа- координатой f в момент времени t. В общем случае средние величины находятся следующим образом. Пусть Ф(гГ) — произвольная функция от скорости частицы (кинетичес- (кинетическая энергия, скорость и т. д.). Обозначим через ^Ф усредненную за время dt сумму значений функции Ф по всем частицам, находящимся в элементарном физическом объеме df. Тогда среднее, т. е. приходя- приходящееся на одну частицу, значение Ф получается делением J^ Ф на число частиц в объеме df, которое равно п dr: С другой стороны, число частиц в элементарном фазовом объеме dfdv равно / dfdv, и каждая из них вносит в J^ Ф вклад, равный Ф(гТ), а их общий элементарный вклад равен Ф/dfdv. Учтем теперь, что частицы, находящиеся в физическом объеме df, могут иметь любые скорости v. Поэтому для получения их полного вклада необходимо просуммировать элементарные вклады по всем скоростям: I Ф(гГ) = df Ф(у) f(f, v, t) dv. Сравнивая две последние формулы, получим для среднего значе- значения Ф Ф/dv / Ф/dv
120 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III Такова связь любой средней функции, характеризующей газ, с функ- функцией распределения. Например, если Ф(у) = v, то для скорости газа имеем г V(f, t) = / vf(f, v, t)dv -n Аналогично, по известной функции распределения можно вычислить как функции г и t и другие макроскопические величины, описывающие состояние газа. 2. Уравнение Больцмана для функции распределения. Да- Дадим нестрогий вывод этого уравнения, основываясь на следующих предположениях: 1) время столкновения (непосредственного эффективного силового взаимодействия) частиц много меньше времени, проходящего между их столкновениями; 2) влиянием внешних сил, действующих на частицы (гравитаци- (гравитационных, электрических и т. д.), можно пренебречь; 3) частицы не расщепляются и не объединяются. Рассмотрим частицы, находящиеся в момент t в фазовом объеме drdv (имеющие координаты и скорости в диапазонах от г до г + (if и от v до v + dv соответственно). Пусть столкновения между ними отсут- отсутствуют. Тогда к моменту t* = t + dt скорости частиц не изменяются, а их координаты получат приращения, соответствующие начальным скоростям: v* = у, г* = r + v dt, где, напомним, величины v и г лежат в указанных выше диапазонах. Вычислим фазовый объем частиц dr* dv* в момент t*. Из последних двух равенств имеем dv* = dv, dr* = dr + dvdt = dr + -^ (dtJ + ..., т. e. drdv — dr* dv*:, и фазовый объем частиц сохраняется с точнос- точностью до членов порядка (dtJ. При этом число частиц f(f,v,i) drdv, находившихся в объеме drdv, равно их числу f(f*,v*,t*)df*dv* в объеме dr* dv*. Другими словами, в отсутствие столкновений / = /*, т. е. функция распределения не меняется со временем, частицы лишь сменяют фазовый объем (в данном случае только свои координаты). Учтем теперь возможность столкновений, введя понятие интег- интеграла столкновений S(f). По своему смыслу величина S(f) drdvdt — разность между числом частиц, вышедших благодаря столкновениям за время dt из объема drdv (и не попавших в объем dr* dv*), и числом частиц, попавших из-за столкновений за время dt в объем dr* dv* (и не находившихся в первоначальном объеме drdv). Тогда уравнение ба- баланса (сохранения) числа частиц за время dt при переходе от объема drdv к объему dr* dv* записывается следующим образом: f(f*,v*,t*)df*dv* -f(f,v,t)dfdv = -S(f) drdvdt.
§ 3] УРАВНЕНИЕ БОЛЬЦМАНА И ПРОИЗВОДНЫЕ ОТ НЕГО 121 Очевидно, что (в отличие от процесса без столкновений) при учете столкновений, вообще говоря, / ф /*. Разложим левую часть уравнения баланса в ряд Тейлора, опуская члены порядка (dtJ и выше: /(г, гТ, t) df* dv* + ^f df* dv* dt+%^- df* dv* dt + at or dt + %^df* dv* dt - /(f, v, t) dfdv = -S(f) dfdvdt. ov at В полученном равенстве df/dt = vvi m dv/dt = F, где F — внешняя сила, которая по предположению равна нулю, т — масса частицы. Выберем промежуток dt настолько малым, что за время от t до t* = = t + dt частицы не сталкиваются. Тогда фазовый объем сохраняется, и dfdv = dr* dv*. Поделив обе части равенства на dfdvdt и устремив dt к нулю, придем к уравнению Болъцмана которое является следующей по сложности моделью (после моделей, получаемых из первопринципов) в иерархии математических описаний газа. Оно представляет собой нелинейное интегро-дифференциальное уравнение. Его конкретная запись зависит от характера столкновений частиц, т. е. от вида функции S(f). Заметим, что B) легко обобщается на газ, состоящий из частиц разного сорта, и на случай, когда внешняя сила F отлична от нуля (она может быть вызвана, например, наличи- наличием электромагнитных полей). При отсутствии столкновений, т. е. при S(f) = 0, B) превращается в уравнение переноса из § 1 гл. П. 3. Распределение Максвелла и i^-теорема. Один из наиболее широко употребляемых интегралов столкновений записывается сле- следующим образом: S(f) = jjju'f'i - fh) gb db dip dv,. C) He приводя громоздкого вывода формулы C), поясним смысл входя- входящих в нее величин. Через / = f(f,v,t), Д = fi(f,vi,t) обозначены функции распределения до столкновения, через /; = f (r,v',t), f[ = = f[(f,vl,t) — после столкновения, где v и v\ — скорости двух стал- сталкивающихся частиц. Величина д — модуль их относительной скорости, Ъ — так называемый прицельный параметр (расстояние наименьшего сближения между частицами), ф — угловая характеристика их взаи- взаимодействия. Интегрирование производится по всем возможным значе- значениям величин 6, ф, v\. Интеграл столкновений в форме Болъцмана C) получается сум- суммированием элементарных актов механического взаимодействия меж- между частицами. При этом предполагается следующее: столкновения уп- упругие (сохраняются суммарные масса, импульс, момент импульса и энергия частиц, что означает, в частности, выполнение равенств д = = д'? Ь = Ь')] сила взаимодействия частиц зависит лишь от расстояния
122 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III между ними и значительно больше внешних сил; число столкновений с участием более двух частиц пренебрежимо мало (газ не слишком плотный). При известных конкретных законах взаимодействия частиц из C) следуют более конкретные выражения для интеграла столкно- столкновений, используемые, например, при изучении явлений в плазме, где электроны и ионы притягиваются и отталкиваются по закону Кулона. Используя свойства интеграла C), получим одно простое, но очень важное решение уравнения Больцмана. Рассмотрим газ, находящийся в состоянии термодинамического равновесия, т. е. в ситуации, когда все его макроскопические характеристики постоянны по пространству и не зависят от времени. При этом, очевидно, функция f(f,v,i) также не зависит от ги ?, т. е. / = f(v). Из B) сразу же следует уравнение удовлетворяющееся лишь при выполнении условия /л = /% ИЛИ 1п/(гТ) +1п/1(гТ1) = \nf(v')+\nf[(vi). Другими словами, сумма логарифмов функций распределения сохра- сохраняется, являясь инвариантом столкновения. Но при упругих столкно- столкновениях инвариантны также полная энергия частиц: 2 2 /2 /2 mv mvt mv mv\ и их полный импульс: mv + mvi = mv' + mv[. Эти свойства дают способ нахождения функциональной зависимости / от v. Ради простоты установим эту зависимость для «одномерного» случая, когда векторы всех скоростей параллельны друг другу. Тогда, умножая последние два равенства на постоянные величины ai, 0,2 и вычитая их из предыдущего, получим где использовано обозначение Т(х) = In f(x) — a\mj2 • х2 — с^тж. В этом равенстве аргументы слагаемых произвольны, поэтому оно мо- может выполняться лишь при Т(х) = аз (аз — постоянная). Таким об- образом, для функции распределения справедливо а\т о mj(v) = v + d2mv + 0,3. Выделяя в правой части этого выражения полный квадрат, а2\ а\т ) +а
§ 3] УРАВНЕНИЕ БОЛЬЦМАНА И ПРОИЗВОДНЫЕ ОТ НЕГО 123 и избавляясь от логарифма, приходим к формуле f(v) = ехр |_^_ 1 exp?|— [v+-)j, D) выражающей зависимость / от v. В силу свойств функции f(v) имеют место (см. A)) равенства п = Jfdv, nV = Jvfdv, ^nkT = jm{v~V) fdv, где п — концентрация частиц; V — их средняя (макроскопическая) скорость; Т — средняя температура частиц (по определению), выра- выражаемая через среднюю кинетическую энергию их хаотического движе- движения с тепловой скоростью с = v — V и измеряемая в градусах Кельвина (см. также п. 1 § 2 гл. II); к — постоянная Больцмана. Используя эти равенства и обозначения, исключим из D) величины ai, a2, &з: m \3h ( m Аналогичное выражение справедливо (при замене v на v и V на V) и в «многомерном» случае. Формула E) представляет собой одно из решений уравнения Больцмана, описывающее распределение час- частиц по скоростям в газе, находящемся в состоянии термодинамичес- термодинамического равновесия {распределение Максвелла). Такое же распределение справедливо не только при полном, но и при локальном термодинами- термодинамическом равновесии (ЛТР), когда макроскопические характеристики п, Т, V являются медленно меняющимися функциями fvit. Точнее, при ЛТР функции n(r,t), T(r,t), V(r,t) мало меняются на расстояниях порядка длины свободного пробега / и за время свободного пробега г. Поэтому в условиях ЛТР рассуждения, предшествовавшие выводу формулы E), применимы к любой точке г в любой момент времени t (при этом фигурирующие в E) значения n, T, V разные в разных точках пространства и в различные моменты времени). С помощью распределения Максвелла устанавливается имеющая фундаментальное значение Н-теорема Болъцмана, согласно которой с увеличением времени энтропия газа (описываемого уравнением B)), возрастает. Будем считать распределение частиц по пространству од- однородным (но зависящим от времени). Тогда уравнение Больцмана B) принимает вид . F) i^-функция Больцмана вводится по формуле H(t)= f flnfdv
124 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III и по определению представляет собой энтропию единицы объема га- газа, взятую с обратным знаком, т. е. S(i) = —H(t). Ее производная по времени есть или, с учетом уравнения F), ^¦г = /A +1п/) (/'Л " Аналогично, принимая во внимание симметрию уравнения F) от- относительно функций / и Д, получаем . + 1пА)(/'Л-/Л at j т. е. dH 1 ~dt ~ 2 Вторично используя симметрию уравнения F) (отражающую обрати- обратимость процесса упругих столкновений), нетрудно убедиться в том, что для «обратного» столкновения справедлива такая же формула, т. е. ^пг = \ Л/Л - /70B + In f'f[)g'b' db' dil>'dv' dvl, at Z J но в ней величины /', f[ и /, Д поменялись местами. Выше отме- отмечалось, что для упругих столкновений д = д', b = Ь1 (равны также и дифференциалы: dbd^ — db' d^f, dv dv\ — dv' dv[). Поэтому из двух последних уравнений окончательно получаем JTT Л Г -df = ~4j ( /а — //i) In г gb db d^ dvdvi. G) Знак производной dH/dt определяется знаком функции J-(x, у) = = (х — у) \п(х/у), стоящей под интегралом. Легко устанавливается, что J-(x, у) ^ 0 (равенство J-(x, у) = 0 отвечает равновесному состоянию, когда функция распределения после столкновения не меняется). Поэто- Поэтому —dH/dt = dS/dt ^ 0, т. е. энтропия газа в неравновесном состоянии растет, приближаясь к максимальному значению. Оно достигается в состоянии термодинамического равновесия, в котором частицы распре- распределены по закону Максвелла. Таким образом, кинетическое уравнение Больцмана, в отличие от уравнений классической механики, описы- описывает необратимые процессы. Это — следствие перехода от моделей, основанных на первопринципах, к моделям, использующим осреднен- ное статистическое описание совокупности частиц с помощью функции распределения. 4. Уравнения для моментов функции распределения. Сле- Следующий после уравнения Больцмана уровень в иерархии математи- математического описания совокупности частиц — гидродинамические модели
§ 3] УРАВНЕНИЕ БОЛЬЦМАНА И ПРОИЗВОДНЫЕ ОТ НЕГО 125 газа. Для их получения установим сначала некоторые свойства интег- интеграла столкновений, справедливые не только для больцмановского газа, но и в общем случае. Требуется лишь, чтобы столкновения были уп- упругими. Тогда из неизменности числа частиц до и после столкновения следует равенство rS(№)d0=O, (8) а из законов сохранения импульса и энергии вытекают соотношения (упр. 3) J mvS(f(v))dv = O, J^S(f(v))dv = 0. (9) В дальнейшем также понадобятся формулы A0) легко выводимые из формулы A) для средних функций, описывающих состояние газа. Получим теперь из уравнения Больцмана уравнения для момен- моментов функции распределения, т. е. для величин вида J Ф(у) f dv. Ради простоты выкладки будем проводить для одномерного случая, когда г — х, v = v. Умножим B) на Ф(у) = 1 и проинтегрируем полученное выражение по скоростям: I%dv+r/xdv+Is{f)dv=o- Учитывая, что в силу (8) третий член слева в последнем уравнении ра- равен нулю, и используя формулы A0), перепишем последнее уравнение в виде — + — (n(v)) = 0. at ox Поскольку (v) = 1/, то имеем — + — (nV) = 0, at ox или, умножив данное уравнение на т, приходим к уравнению нераз- неразрывности где р = пт — плотность газа, V — его макроскопическая скорость. В многомерном случае аналогом A1) является уравнение ^ + div(^F) = 0
126 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III либо эквивалентное ему уравнение | = -pdivF. A2) Пусть теперь функция Ф(г?) равна импульсу, т. е. Ф(г?) = mv. По- Повторяя предыдущую процедуру, получим из B) /О ? /* О ? /* — mv dv + / v — mv dv + / S(f) mv dv = 0. at J ox J В силу первой формулы (9) третий член в левой части этого уравнения равен нулю. Используя A) и формулы A0), приходим к уравнению 1 {nmV) + A (nm(v2)) = 0, A3) где (^2) — средний квадрат скорости частиц. Для его вычисления введем хаотическую скорость частиц с (тепловую скорость), представ- представляющую собой разность между собственной скоростью v и скоростью макроскопического движения газа V как единого целого, т. е. с = v — V. Для среднего значения v2 имеем (г,2) = ((V + сJ) = V2 + 2(cV) + (с2) = V2 + (с2). В последнем равенстве учтено, что (cV) = V(c) = 0 в силу хао- хаотичности теплового движения. Используя полученное выражение для {v2), из A3) последовательно имеем Первый и третий члены слева в последнем уравнении в силу A1) вза- взаимно уничтожаются. Поэтому его можно записать как ev эу = 1_э_р m дх р дх у ' В многомерном случае аналог одномерного уравнения A4) имеет вид или, что эквивалентно, ^ = igradP. A5) В уравнениях движения газа A4), A5) использованы следующие обо- обозначения: Pij = —p(ciCj), i,j = 1,2,3; Xi = x,y,z для г = 1,2,3.
§ 3] УРАВНЕНИЕ БОЛЬЦМАНА И ПРОИЗВОДНЫЕ ОТ НЕГО 127 В завершение получим уравнение для изменения энергии, взяв в качестве Ф(у) величину mv2/2, умножив ее на уравнение B) и проин- проинтегрировав его по скоростям: /Я f 2 ¦dv = Q. Третий член слева в данном выражении равен нулю (см. вторую фор- формулу (9)), а первые два записываются по формуле A) через средние величины: д ( /mv2\\ д Снова введем тепловую скорость с = v — V и вычислим величи- величину (v3) = ((V + сK) = (V3 + 3V2c + We2 + с3) = V3 + ЗУ(с2) + (с3) (здесь учтено, что (ЗУ2с) = ЗУ2(с) = 0 в силу хаотичности теплового движения, см. также упр. 4). Используя выражения для (у2) и (у3) и равенство р = пт, получим или, продифференцировав стоящие слева первый и третий члены этого уравнения: 1 д , тл2. У2 ар irdV Id, тл3ч F2 d^F ir2 dV и принимая во внимание уравнения A1) и A4), умноженные соответ- соответственно на V2 и pV, придем к уравнению Представляя в нем третий член слева в виде получим Фигурирующая в A6) величина р(с2)/2 = nm(c2)/2 представляет собой энергию хаотического движения частиц, заключенных в единице объема газа, или его внутреннюю энергию (для простоты считается, что она определяется лишь поступательным движением частиц). Оче- Очевидно, что внутренняя энергия г, отнесенная к единице массы, равна
128 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III s = ^с2)/2. Тогда первый и второй члены слева в A6) можно предста- представить как Тг де 1 хг / 9\ до где при получении второго выражения использовано уравнение нераз- неразрывности A1). Подставив эти равенства в A6), получим де тг де , 9Х dV 1 д , , оЧЧ или, окончательно, В многомерном случае уравнение энергии имеет вид р ^ = -pdivF + ^% |^ - div#. A8) В A7) и A8) величина W определяется как W=P-^ A9) и называется вектором потока тепла (в дальнейшем станет понятна оправданность этого названия). Более сложную структуру имеет введенный выше (см. уравнение A5)) тензор напряжений Р: pij = -p(cicj) = -Psij + Щ, где Sij — символ Кронекера, а величины р, П^- даются формулами B0) Здесь, как нетрудно видеть, р — давление частиц газа, связан- связанное со средней энергией их хаотического движения, т. е. с температу- температурой Т = [т/C&)](с2), соотношением р = пкТ = ркТ/тп (строго говоря, так температура определяется для состояний, близких к равновесным). Второе слагаемое в формуле для Р — тензор вязких напряжений П^-. Вязкие силы обусловлены «трением» между частями газа, имеющи- имеющими разные макроскопические скорости. Его происхождение нетрудно понять, представив себе, например, два плоских слоя газа, движу- движущихся друг относительно друга. Частицы, переходящие через границу раздела из «быстрого» слоя в «медленный» слой, будут увеличивать
§ 3] УРАВНЕНИЕ БОЛЬЦМАНА И ПРОИЗВОДНЫЕ ОТ НЕГО 129 среднюю скорость последнего, и наоборот. Тем самым скорости слоев выравниваются, что означает наличие «силы трения» между ними. Уравнения A1), A2), A4), A5), A7), A8) для моментов записа- записаны относительно средних (гидродинамических) величин, характери- характеризующих газ: плотности, скорости, давления, внутренней энергии. При их выводе не привлекались какие-либо существенные дополнительные предположения, и в этом смысле они принадлежат к тому же иерар- иерархическому уровню, что и уравнение Больцмана. Однако, в отличие от уравнения B), их еще нельзя назвать моделью газа, так как они не- незамкнуты: кроме р, компонент скорости V, р, ? в них содержатся также величины Uij, W, т. е. число уравнений меньше числа неизвестных. Попытка составить по аналогичной схеме уравнения для момен- моментов более высокого порядка с целью нахождения П^j, W приводит к по- появлению в этих уравнениях новых неизвестных величин. Поэтому для получения гидродинамических моделей газа необходимо выразить П^, W через искомые гидродинамические параметры р, V, р, е. Тогда в пя- пяти уравнениях будут фигурировать пять неизвестных величин (напом- (напомним, что внутренняя энергия считается известной функцией плотности и давления: е = е(р,р), или плотности и температуры: е = е(р,Т)). Получить эти выражения для П^, W можно разными способа- способами, например, задавая некоторые полу эмпирические зависимости. Бо- Более строгим является способ, состоящий в приближенном «решении» исходного кинетического уравнения B). Для этого вводится сущест- существенное предположение о том, что длина свободного пробега I (время свободного пробега г) частиц много меньше характерного размера L (характерного времени t) задачи. Другими словами, система близка к состоянию ЛТР, а функция распределения / несильно отличается от локально максвелловской. Тогда, записывая решение в виде бесконеч- бесконечного ряда / = /(°) + /("^ + ... (где /(°) — максвелловская функция E), а f^ — малое отклонение от нее), считая остальные члены ряда пре- пренебрежительно малыми по отношению к /t1) и подставляя выражение f = /(°) + /A) в B), можно найти явный вид возмущения f^\ Пос- После этого уже через известную функцию / = /(°) + /W по формуле A) находится тепловая скорость с — v + V и по формулам A9), B0) опре- определяются величины П^-, W. Например, W вычисляется следующим образом: Заметим, что при / = /(°) вычисления дают П^- =0, W = 0: в газе с максвелловским распределением частиц вязкие напряжения и потоки тепла отсутствуют. Не будем описывать сложный и громоздкий процесс нахождения функции /(-1) путем «решения» B) (при его проведении используется 9 А. А. Самарский, А. П. Михайлов
130 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III предположение I ^ L (г < t)). Приведем конечный результат: д\пТ где А(?) и В(?) — скалярные функции аргумента ? = m \c\2/BkT), вид которых зависит, в частности, от вида интеграла столкновений между частицами. Выражение для /^ содержит неизвестные макроскопические ве- величины Т(г, ?), V(r, i). Поэтому процедуру определения /^ нельзя на- назвать решением уравнения Больцмана в полном смысле этого поня- понятия, т. е. нахождением неизвестной функции f(r,v,i) во всей области ее определения. Под решением здесь следует понимать установление с помощью B) некоторых связей между гидродинамическими парамет- параметрами среды. Использование двух последних формул дает для потока тепла W = -xgradT. B1) Для компонент тензора вязких напряжений справедливы следующие выражения: Щ (g g) ,*,. ,22, Величина к > 0 называется коэффициентом теплопроводности, ве- величины Л > 0, \i > 0 — коэффициентами вязкости. Коэффициенты переноса к, Л, \i могут, вообще говоря, зависеть от р и Т, т. е. от состояния газа. Их функциональная зависимость от р, Г и числен- численное значение определяются, как следует из вида f^\ f^\ свойствами частиц (массой, характером взаимодействия между ними и т. д.). Формула B1) — запись закона Фурье для теплопроводных сред (см. также § 2 гл. II), формула B2) — закон Навъе—Стокса для вязких жидкостей и газов, связывающий компоненты тензора вязких напряжений со скоростями деформации (обобщение закона вязкости Ньютона). 5. Цепочка гидродинамических моделей газа. Законы B1), B2) позволяют при заданных коэффициентах переноса замкнуть вы- выведенные в п. 4 уравнения для моментов и получить модели газа в гидродинамическом приближении. Подстановка B1), B2) в A5), A8) приводит (с учетом A2)) к системе пяти уравнений, состоящей из урав- уравнения неразрывности ^ = -pdivV, B3) at трех уравнений движения (записанных в векторной форме; коэффици-
§ 3] УРАВНЕНИЕ БОЛЬЦМАНА И ПРОИЗВОДНЫЕ ОТ НЕГО 131 енты Л, \i считаются постоянными) — = gradp Л grad div V + vAV B4) at p p и уравнения энергии (H g) B5) где v — /л/р, df/dt = df/dt + (V grad) / — полная (субстанциональная) производная по времени. При известных краевых условиях из этих уравнений находятся пять искомых функций: р, р и три компоненты скорости V. Система B3)-B5) представляет собой следующий после уравнения Больцмана уровень в иерархии математических описаний большого числа взаимо- взаимодействующих частиц — модель сжимаемого вязкого теплопроводного газа. Вместо нахождения функции /, зависящей от шести «координат» г, v (а также времени t), и определения через нее средних величин зада- задача свелась к поиску непосредственно гидродинамических параметров, являющихся к тому же функциями лишь трех декартовых координат и времени. Заметим, что с помощью схожих построений из уравнения B) получаются более сложные, чем B3)-B5), гидродинамические модели, учитывающие, например, анизотропность, наличие внешних сил, хи- химических реакций в среде, заряженных частиц и электромагнитных полей и т. д. Полученная из исходного кинетического уравнения B) модель B3)-B5) имеет ясную интепретацию в гидродинамических терминах. Уравнение B3) — запись закона сохранения массы жидкой частицы, полностью совпадающая с уравнением неразрывности, выведенным в § 4 гл. II другим способом. Уравнение B4) выражает второй закон Ньютона, примененный к фиксированной жидкой частице: ее ускорение определяется суммой сил давления и вязких напряжений. Наконец, B5) описывает изменение со временем внутренней энергии жидкой части- частицы за счет работы сил давления (первый член в правой части), вязкого трения (следующие три члена) и теплопередачи (последний член). В отличие от теплопроводности вязкость, как это сразу видно из B5), всегда приводит к увеличению внутренней энергии газа (то же самое справедливо и для энтропии среды). Модели более низких иерархических уровней получаются из B3)- B5) при соответствующих упрощениях и конкретизациях рассмат- рассматриваемого объекта, определяемых протекающими в нем физическими процессами, его геометрией и т. д. Число образующихся таким образом иерархических цепочек может быть весьма велико. Продемонстрируем некоторые из них. 9*
132 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III В отсутствие теплопроводности, т. е. при к = О, модель B3)—B5) отвечает вязкому сжимаемому нетеплопроводному газу (уравнениям Навъе—Стокса, широко применяемым для описания многих процессов в естествознании и технологии). Для важного частного случая несжи- несжимаемой жидкости, когда p(r, t) = const, из B3) следует, что div V = О, и модель Навье—Стокса состоит из четырех уравнений ^f- = - - gradp + ^ AV, div V = 0, B6) at p p а уравнение энергии B5) заменяется заданной зависимостью е = = е(р,р) =е(р). Когда силы давления гораздо больше сил вязких напряжений, можно положить \i — 0, и из B6) следуют уравнения движения Эйле- Эйлера для несжимаемой жидкости, и вместе с остающимся неизменным уравнением неразрывности получаем ^ = -grad-, divy = 0. B7) at p Если движение, вдобавок, потенциально, т. е. существует скалярная функция (f)(x,y,z,i) такая, что V = grad^ (при этом, как следует из известной формулы векторного анализа, rot V = 0), то система B7) сводится к уравнению Лапласа для потенциала ф причем первое из уравнений B7) удовлетворяется автоматически (см. упр. 5). В отсутствие вязкости система B3)-B5) описывает течения сжи- сжимаемого теплопроводного газа, часто встречающиеся во многих яв- явлениях. В этом случае уравнение энергии (одномерная геометрия) de dV dW JJT дТ at ох ох ох совпадает, с учетом перехода от эйлеровых координат к лагранжевым, с уравнением B2) из § 4 гл. II, полученным с помощью прямого приме- применения закона сохранения энергии к жидкой частице. Для неподвижной среды (V = 0) модель представляет собой уравнение теплопередачи E) из § 2 гл. II которое при постоянных С, к для стационарного процесса превраща- превращается в уравнение Лапласа для температуры Т: АГ = 0. Рассмотрим теперь среду без диссипативных процессов вязкости и теплопроводности (А = 0, ц = 0, я = 0). Тогда из B3)-B5) сразу
§ 3] УРАВНЕНИЕ БОЛЬЦМАНА И ПРОИЗВОДНЫЕ ОТ НЕГО 133 получаются уравнения движения Эйлера для сжимаемой жидкости 8V 1 —- + (V grad) V = gradp, ot р дополненные уравнениями неразрывности и энергии т. е. приходим к модели, совпадающей с системой D), A0), A4) из § 4 гл. II, а в случае р = const — с системой B7). Одна из иерархичес- иерархических последовательностей, порождаемая данной моделью, может быть образована, например, следующим путем. Предположим сначала, что процесс одномерный, и перейдем к мас- массовой координате т. Тогда получим систему A8)—B0) из § 4, гл. II д /1\ dV dV dp де dV dt \pj dm' dt dm ' dt Pdm' где через д/dt обозначена полная производная по времени. Эта систе- система, состоящая из трех уравнений, в случае изэнтропического течения идеального газа сводится к квазилинейному уравнению второго по- порядка (уравнение C0) из § 4 гл. II): д2р д ( +1 др dt2 dm \ dm Из него для движений, представляющих собой малые отклонения от постоянного течения, следуют уравнение акустики (Pl_ (Pp_ dt2 " С° дт2 (аналогичное уравнению колебаний струны из § 2 гл. III; со = = ylPoJpo — скорость звука), либо, если течение — простая волна, уравнение Хопфа др . 7+i др рассмотренные в п. 7 § 4 гл. П. Наконец, из уравнения акустики в слу- случае течения типа простой волны либо из уравнения Хопфа для малых возмущений вытекает полученное в п. 1 § 1 гл. II линейное уравнение переноса которое можно считать простейшей моделью газа в классе уравнений в частных производных. В заключение напомним логику построения иерархии математи- математических описаний большого числа взаимодействующих частиц: 1) наиболее сложные модели основаны на первопринципах, т. е. на применении законов классической механики к каждой частице среды;
134 ВАРИАЦИОННЫЕ ПРИНЦИПЫ, ИЕРАРХИИ МОДЕЛЕЙ [ГЛ. III Исходные модели, основанные на первопринципах Кинетические уравнения типа уравнения Больцмана Система гидродинамических уравнений для сжимаемого вязкого теплопроводного газа Модель Навье—Стокса для сжимаемого газа Модель Навье—Стокса для вязкой несжимаемой жидкости Уравнения для сжимаемого теплопроводного газа Уравнения Эйлера для сжимаемого газа Уравнения Эйлера для несжимаемой жидкости Одномерные уравнения газовой динамики Уравнение изэнтропиче- ского течения идеального газа Уравнение типа нелинейной теплопровод- теплопроводности Уравнение Лапласа для потенциала Уравнения акустики Уравнение Лапласа для температуры Уравнение Хопфа Уравнение переноса Рис. 41. Иерархические цепочки моделей газа. Стрелки — переход к модели более низкого иерахического уровня, цифры — соответствую- соответствующие предположения об объекте: 1 — возможность статистического опи- описания газа с помощью функции распределения, упругие столкновения; 2 — близость процессов к локальному термодинамическому равновесию; 3, 19 — отсутствие теплопроводности; 4, 11 — несжимаемость жидкос- жидкости; 5, 7, 18 — отсутствие вязкости; 6 — идеальная жидкость, потенци- потенциальные течения; 8 — неподвижность газа; 9 — стационарный процесс, постоянство коэффициента теплопроводности; 10 — отсутствие вязкос- вязкости и теплопроводности; 12 — одномерные течения; 13 — идеальный газ, энтропия постоянна; 14, 17 — малые возмущения газа; 15, 16 — течения типа простой волны 2) при переходе к следующему уровню иерархии — кинетическо- кинетическому уравнению Больцмана B) — используется вероятностное описание газа с помощью функции распределения, а для конкретизации интег-
§ 3] УРАВНЕНИЕ БОЛЬЦМАНА И ПРОИЗВОДНЫЕ ОТ НЕГО 135 рала столкновений между частицами вводятся предположения об их упругом характере, об отсутствии тройных столкновений и т. д.; 3) предположение о локальном термодинамическом равновесии — основное для перехода к описанию газа в гидродинамическом прибли- приближении, т. е. к уравнениям B3)—B5); 4) основная гидродинамическая модель B3)-B5) порождает, в за- зависимости от характера рассматриваемых процессов, разнообразные иерархические цепочки, часть из которых была описана выше (рис. 41). Иерархия моделей газа содержит широкий спектр уравнений, су- существенно отличающихся друг от друга и в чисто математическом от- отношении. К ним относятся системы уравнений классической механики высокой размерности, кинетические уравнения, уравнения механики сплошных сред. Последние в свою очередь могут подразделяться на ли- линейные и нелинейные, на уравнения гиперболического типа (уравнения Эйлера и Хопфа), параболического (уравнение теплопроводности) и эл- эллиптического (уравнение Лапласа) типов, а также смешанного типа, на стационарные и нестационарные, многомерные и одномерные урав- уравнения и т. д. Дополнительные вариации построенных моделей связаны с различными вариантами краевых условий и других входных данных. Продемонстрированный в данном параграфе метод построения мо- моделей по принципу «сверху вниз» более универсален, чем способ, осно- основанный на принципе «снизу вверх». Так, например, уравнение Больц- мана невозможно получить из каких-либо моделей более низкого ие- иерархического уровня. При построении и анализе любой модели всегда полезно знать ее место в общей иерархии моделей изучаемого объекта. Это дает воз- возможность правильно оценивать область ее применимости и четко осо- осознавать ее связи с моделями других уровней, т. е. способствует более глубокому пониманию исследуемых явлений. УПРАЖНЕНИЯ 1. Используя свойства функции распределения f(v), выражаемые формулой A), получите из D) формулу E). 2. Проверьте, что фигурирующая в G) функция Т(х,у) неотрицательна. 3. Получите формулы (8), (9), исходя из определения интеграла столкновений S(f(v))- 4. Убедитесь, используя простые конкретные примеры, в том, что величина (с3) не равна тождественно нулю (в отличие от средней тепловой скорости (с)). 5. Используя формулу векторного анализа igrad|y|2 = [Vrot V] + (VV) V и применяя операцию rot к обеим частям первого уравнения B7), получите из него уравнение д (rot V)/dt = rot [У rot V], тождественно удовлетворяющееся в случае потенциальных течений. Библиография к главе III: [3, 11, 20, 42, 43, 45, 69, 72].
ГЛАВА IV МОДЕЛИ НЕКОТОРЫХ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ § 1. Универсальность математических моделей Построим математические модели динамики скопления амеб и случайного марковского процесса. Поведение «живой» материи (аме- (амебы) и «нематериальной» величины (плотность вероятности) опишем теми же параболическими уравнениями, что и явления «мертвой» при- природы, изученные в гл. П. Рассмотрим также аналогии между некото- некоторыми механическими или физическими объектами и экономическими процессами. 1. Динамика скопления амеб. Амеба — одноклеточный орга- организм размером около десяти микрон A0~3 см), обитающий в почве и передвигающийся в ней с помощью ложноножек, т. е. частей своего тела. Питаются амебы в основном бактериями, поглощая их вместе с землей (если пищи достаточно, то амебы размножаются делением на две части). Из наблюдений и эксперимента известно, что динамика развития их сообщества — достаточно большого количества амеб, находящихся на небольшом расстоянии друг от друга, — бывает достаточно слож- сложной. Например, в зависимости от внешних условий амебы могут соби- собираться в огромные (до сотен тысяч штук) скопления, которые начина- начинают двигаться как единое целое, хотя индивидуальность каждой амебы сохраняется. Замечено, что это макроскопическое «организованное» движение происходит в направлении к более высокой концентрации некоторого химического вещества, вырабатываемого самими амеба- амебами. Математическая модель динамики скопления амеб базируется на следующих предположениях: 1) расстояние между амебами мало в сравнении с размерами их скоплений (сотни микрон), их можно рассматривать как «сплошную среду» и вводить концентрацию N(x,y,z,t) — число амеб в единице объема; 2) процесс одномерный, т. е. концентрация амеб и другие величи- величины являются функциями только координаты х и времени t; 3) амебы не рождаются и не умирают в процессе макроскопичес- макроскопического движения, т. е. характерное время движения (несколько часов) мало по отношению к характерным временам размножения и жизни амеб;
§ 1] УНИВЕРСАЛЬНОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 137 4) индивидуальное движение амеб при отсутствии стимулирую- стимулирующих внешних воздействий (пища, тепло и т. д.) беспорядочно, хао- хаотично; выделенных направлений нет и каждая амеба может с равной вероятностью двигаться как вправо, так и влево; 5) если в среде есть «притягиващее» химическое вещество, то к собственному неупорядоченному движению амеб добавляется их на- направленное движение в область с большей плотностью этого вещест- вещества. Составим уравнение баланса амеб в элементе среды dx за время dt, используя «закон сохранения» их числа (предположение 3)). В этом случае общее число амеб в объеме dx (площадь поперечного сечения единична) изменяется лишь из-за разности потока амеб W(x,t) на ле- левой и правой границах элемента. Величина W(x,t) понимается в обыч- обычном смысле: это число амеб, пересекающих единичную поверхность за единичное время. Искомое уравнение выглядит так (ср. с уравнением баланса тепла в § 2 гл. II): [N(x, t + dt) - N(x, t)] dx = [W(x, t) - W(x + dx, t)] dt, где N, W — некоторые средние значения величин на малых промежут- промежутках dx, dt. Устремляя dx и dt к нулю, приходим к дифференциальному уравнению баланса числа амеб dN _ 8W dt dx ' Величина W = Wc + Wd складывается из двух составляющих, Wc и Wd- Часть Wc общего потока формируется за счет хаотического дви- движения амеб, и поэтому по аналогии с законом Фурье для процесса диффузии тепла (§ 2 гл. II) его можно записать через градиент их концентрации: dN We = -"&¦' где /л > 0 — некоторый коэффициент, характеризующий рассматривае- рассматриваемую «среду». Эту формулу для Wc и величину /л нетрудно получить из более подробного анализа процесса на микроуровне, используя те же рассуждения, которые применялись для явлений передачи тепла. При получении выражения для составляющей Wd, описывающей направленный поток амеб, будем считать, что величина Wd тем боль- больше, чем больше градиент плотности «притягивающего» вещества: Здесь rj > 0 — некоторая постоянная, p(x,t) — плотность вещества, а множитель N перед градиентом означает, что при заданном градиенте величины р составляющая потока Wd пропорциональна концентрации амеб в данной точке. Объединяя выражения для Wc, Wd и подставляя их в уравнение баланса, получаем dN д f dN Лтдр
138 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV В уравнении A) две неизвестных функции — N и р. Поэтому необ- необходимо получить, пользуясь законом сохранения вещества, уравнение баланса для величины р. При этом следует учесть, что скорость вы- выделения химического вещества пропорциональна концентрации амеб. Будем учитывать также распад вещества, скорость которого, естес- естественно, пропорциональна его концентрации (аналогично процессу ра- радиоактивного распада; см. § 1 гл. I). Таким образом, в единицу времени в единичном объеме появляется и исчезает количество вещества, рав- равное / = aN - /Зр, где а > 0, C > 0 — константы, характеризующие соответственно ско- скорость его выделения амебами и скорость распада (в этом состоит отли- отличие модели для вещества от модели для амеб, в которой они не умира- умирают и не рождаются). Изменение плотности вещества в элементарном объеме среды происходит также и вследствие разности его потоков на левой и правой границах элемента. Оно диффундирует в среде из мест с большей концентрацией в места с меньшей концентрацией подобно тому, как тепло распространяется от более нагретых участков тепло- теплопроводной среды к менее нагретым. Это движение создает, согласно закону Фика, поток Wp, равный W =-D^, 9 дх ' где D > 0 — коэффициент диффузии (вывод закона Фика аналогичен выводу закона Фурье). Итак, уравнение баланса вещества имеет вид dp _ dWp dt~ дх + •*' или, учитывая выражения для Wp и /, ¦pp. B) Уравнения A), B) вместе со входными данными /i, 77, а, /3, D служат моделью динамики скопления амеб при сделанных выше пред- предположениях. Для однозначного определения решения, т. е. функций N(x,i), p(x,i), необходимо, как обычно, знать соответствующие на- начальные и граничные условия. Наиболее просто они выглядят в слу- случае задачи Коши, когда процесс рассматривается в неограниченном пространстве — оо < х < оо; тогда достаточно задать в момент t = О начальную концентрацию амеб N(x,0) = Nq(x) и плотность вещества р(х,0) = ро(х). Уравнения A), B) взаимосвязаны: в первое из них входит величи- величина р, во втором фигурирует величина N. Система A), B) нелинейна из-за наличия члена r\N dpjdx в скобках, стоящих в правой части A). Рассматриваемые соответственно относительно концентраций амеб N и плотности вещества р уравнения A) и B), как нетрудно видеть, при- принадлежат к параболическому типу.
§ 1] УНИВЕРСАЛЬНОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 139 Если амебы не выделяют «притягивающего» вещества и p(x,t) = = 0, то A) переходит в уравнение теплопроводности (или диффузии) dN _ 82N dt дх2 что легко объяснить, поскольку в потоке W остается лишь составляю- составляющая Wc, соответствующая беспорядочному, ненаправленному движе- движению амеб. Когда амебы по каким-то причинам перестают выделять вещество, коэффициент а в B) становится равным нулю, и с этого момента уравнение B) принимает вид (диффузия с распадом) C) Ub UJb~ и сводится простой заменой (упр. 1) также к уравнению теплопровод- теплопроводности ди _ д2и !Й~ да?' Из-за нелинейности системы A), B) сконструировать ее общее решение нельзя, и поэтому определение пространственно-временной динамики скопления амеб — весьма непростая задача. Однако она значительно облегчается, если изучаются малые отклонения от по- постоянного во времени и по пространству решения N = Щ, р = ро, т. е. когда нелинейная задача становится линейной. Такое решение существует лишь при соотношении аЩ = (Зро, означающем, что выделение вещества и его распад уравновешивают друг друга. Линеаризованная в окрестности постоянного решения система A), B) (ср. с уравнением акустических колебаний в § 4 гл. II) име- имеет вид dN д ( dN дг др\ Х' D) где N и р — малые возмущения (N <С А^о, р ^С ро). Ее общее решение для неограниченного пространства — оо < х < оо (в этом случае нет необходимости удовлетворять граничным условиям) можно построить в виде суммы частных решений (гармоник) N = С\ sin kx e7t, p = С2 sin kx e7t, где к > 0 — волновое число, Ci, C2 — константы. Для частных реше- решений должны выполняться соотношения
140 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV связывающие длину волны гармоники Л = 2тг/к с величиной j — ее инкрементом (или декрементом), характеризующим нарастание или затухание возмущения со временем. Исключая С\ и С2 из E), получаем относительно j квадратное уравнение 72 + &7 + с = 0, F) где Ь = C + к2 (/л + D), с = /ак2 (C + Dk2) - rjaN0k2. Оба корня урав- уравнения F) отрицательны тогда и только тогда, когда с > 0, т. е. при выполнении неравенства /n(f3 + Dk2) >rjaN0. G) Если имеет место G), то для любых значений к амплитуда воз- возмущений с любой длиной волны уменьшается с течением времени, и постоянное решение устойчиво. Неравенство G) заведомо выполнено при /1/3 > rjaN0 (или \i > rjpo), т. е. для фиксированных параметров задачи при достаточно малых концентрациях амеб (и плотностях «притягивающего» вещества). В противном случае возможна неустойчивость постоянного решения (ес- (если в начальном спектре возмущений найдутся длинноволновые гармо- гармоники с небольшими значениями к, растущие со временем), порождаю- порождающая более сложную картину эволюции скопления амеб. Разумеется, линеаризованная модель не дает исчерпывающей картины процесса, но из нее можно извлечь ряд сведений, полезных для более полного исследования. 2. Случайный марковский процесс. Типичным примером по- подобного процесса служит движение помещенной в жидкость маленькой твердой частицы, совершающей хаотические перемещения под дейст- действием беспорядочных столкновений с молекулами жидкости (броунов- (броуновское движение). Ее положение в любой момент времени t ^ to задается координатами ж, у, z трехмерного пространства М3. В дальнейшем для упрощения выкладок будем рассматривать одномерное движение, т. е. случайные блуждания броуновской частицы вдоль оси ж, х G М1. Случайный процесс называется марковским, если по положению точки х в момент времени t однозначно определяется вероятность ее нахождения в произвольный момент t' > t в некоторой части (в любом измеримом подмножестве Е) пространства Ж1. Другими словами, это процесс без последействия, когда события, случившиеся в промежутке времени между t и t', не влияют на положение точки в момент t'. Марковский процесс полностью характеризуется функцией p(t,x,t',xr), х е R1, называемой плотностью вероятности в точке х'', зная которую, не- нетрудно вычислить вероятность р{х, t, t', E)= p{x, t, x',t') dx' Е(х')
§ 1] УНИВЕРСАЛЬНОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 141 нахождения частицы в некоторой окрестности E(xf) точки х' в момент времени t'. Очевидно, что для функции р выполнено условие нормировки p(t,x,t',x')dx' = 1, (8) т. е. в любой момент частица обязательно находится в какой-либо точ- точке пространства Ж1. При построении модели марковского процесса существенным об- образом используется предположение о его сильной непрерывности. Счи- Считается, что частица за малые промежутки времени At может получить заметные приращения координаты Ах ^ S лишь с малой вероятнос- вероятностью. Это значит, что для любого S > О p(t - At, x, t, x') dx' = o(At), или, в эквивалентной записи, lim — / p(t- At,x,t,x')dx' = 0. (9) Предполагается также, что для любых S > 0 существуют равно- равномерные по х пределы lim— / (xf-x)p(t-At,x,t,x')dx'= Ъ>0, A0) \х'-х\<6 lim-— / (x'-xJp(t-At,x,t,x')dx' = 2a>0. A1) \x'-x\<6 Эти предположения имеют следующую интерпретацию: вероят- вероятность для частицы находиться в момент t в интервале \х' — х\ < S пропорциональна Д? (уменьшается с уменьшением промежутка вре- времени, прошедшего от начального момента t — At, что естественно) и обратно пропорциональна некоторой «средней» величине размера ин- интервала \х' — х\ (и его квадрату, что также естественно). Величины а и Ь зависят, вообще говоря, от точки х и момента t, т. е. а = a(x,i), Ь — b(x,t), но для простоты здесь рассматривается частный случай, когда а и Ъ — постоянные. Наконец, последнее используемое ниже предположение состоит в том, что для любых ?, ж, t1, x' существуют непрерывные частные про- производные функции р по х др &р
142 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Основное свойство рассматриваемого процесса выражается тож- тождеством Маркова p(t,x,tf ,х') = p(x,t,t,x) p(i,x,tf ,х') dx, A3) R1 где t < i < t' — некоторый момент времени в промежутке от t до t', a х — координата частицы в момент i, t < i < t', некоторая промежу- промежуточная точка при движении от точки х до t,x t,x t ,x точки х1. Смысл тождества A3) проясня- | А ^Т ется при рассмотрении перехода из точки х в точку х' как последовательности двух t й t x t' х> переходов — сначала из точки х в точку х, • • ¦*• а затем из точки х в точку ж' (на рис. 42 по- F<i-""-"f " \ казаны возможные комбинации этих пере- переходов, причем промежуточные перемеще- *^ t,x *>^ ния изображены штриховыми линиями, а I - ""fc'^n основной переход — сплошными). Вероят- Вероятность события, состоящего из двух после- Рис- 42 довательных независимых событий, равна произведению вероятностей каждого события, поэтому под интегра- интегралом в A3) стоит произведение соответствующих величин. Интеграл берется по всем возможным промежуточным точкам iGl1. Для рассматриваемого процесса тождество Маркова играет роль своеобразного «фундаментального закона», связывая некоторым обра- образом значения функции р в точках ?, х и t', х'. С его помощью вычислим сначала разность величин р в моменты t — At и t: p(t - At, ж, t\ x') - p(t, x, t',x') = = p(t — At,x,t,x) p(t,x,tf,xf) dx — p(t,x,tf,xf) p(t — At,x,t,x) dx. R1 R1 Первому члену в левой части этого равенства отвечает (см. A3)) пер- первый интеграл в его правой части, а второму — тождественный ему член, умноженный на интеграл, который согласно условию норми- нормировки (8) равен единице. Множитель p(t,x,t',х') не зависит от х, и поэтому, внося его под знак интеграла, перепишем равенство в виде pit - At, ж, t', x') - pit, ж, t', x') = = / [pit, x, t1', х') — pit, x, t', x')\ pit — At, x, t, x) dx. R1 Поделим теперь в этом равенстве обе его части на Д? и разобьем интеграл на два — по области \х — х\ ^ S и \х — х\ < 5: p(t-At,x,tf,xf) -p(t,x,tf,xf) _ =/i+/2, A4)
§ 1] УНИВЕРСАЛЬНОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 143 /i = —— / [p(t,x, t',x') — p(t,x, t',x')]p(t — At, ж, t,x) dx, /2 = — / [p(t,x, t',x') — p(t,x, t',x')]p(t — At,x, t,x) dx. \x-x\<5 Интеграл 1\ в силу свойства сильной непрерывности (9) стремится к нулю при At —У 0 (первый сомножитель в подынтегральном выраже- выражении не зависит от At и не влияет на поведение 1\ при At —У 0). Интеграл 12 преобразуем, раскладывая с учетом A2) первый со- сомножитель по степеням [х — х): 12 = д- / ^ [х - х)р(Ъ - At,x,t,x)dx ¦ \х-х\<6 1 \х-х\<6 ^ 1 [и- ,2^d2p(t,x,t',x') .+ /\/ / 2 С/Т \х-х\<5 Устремим в этом равенстве А? к нулю, замечая, что частные про- производные функции р, стоящие под знаком интеграла, не зависят от х. Вынося их из-под интеграла, для первых двух членов получим, в силу предположений A0), A1), что их пределы соответственно равны d2p(t,x,t',x') а ¦ дх ' дх2 а третье слагаемое представим в виде ч 1 d2p(t,x,t',x') 1 Г ,_ ч2 , _ч 7_ е(х-х)- — — / (х-х) p(t- At,x,t,x)dx, \х-х\<5 где ё(х — х) — среднее значение функции е(х — х), причем по опреде- определению величины о[(х — хJ] имеем е(х — х) —У 0 при 5 —У 0. Осуществим в последнем выражении предельный переход сначала при 5 —У 0. Этот предел, очевидно, равен нулю при любых At > 0. Поэтому его пре- предел при At —У 0 также равен нулю. Наконец, предел левой части A4) при At —У 0 равен производной функции р по времени. Суммируя эти результаты, получаем из A4) уравнение Колмогорова для плотности вероятности, справедливое для всех t > to, — 00 < ж < 00: dp(t,х,t',х') _ d2p(t,x,t',x') dp(t,x,t',x') dt дх2 дх
144 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Уравнение A5) — линейное параболическое уравнение. Этими же свойствами обладают и его обобщения. Например, в случае, когда ве- величины Ъ и а в A0), A1) зависят от ?,ж, аналог уравнения A5) имеет вид др , ч д2р 7, ч др , ч Если же точка х принадлежит n-мерному пространству, т. е. х = = (х\, Ж2,..., жп), то для функции р справедливо следующее обобщение A5), A6): где bi(t,x) и a,ij(t,x) вычисляются по формулам A0), A1), но в A0) вместо сомножителя {х' — х) берется величина {х' — х)г, а в A1) вместо (х' — хJ фигурирует выражение (х' — x)i (х' — x)j, i,j = 1, 2,..., п. Заметим, что A7) отнюдь не формальное обобщение A5), A6). Случайные марковские процессы могут протекать не только в реаль- реальном физическом пространстве (броуновское движение), но и в так на- называемом фазовом пространстве. Они характерны для многих техни- технических и иных систем, состояние которых описывается совокупностью фазовых переменных х\, Ж2,..., хп, число которых может быть значи- значительно больше трех. Простейший вариант уравнения Колмогорова получается из A5) при Ь = 0: др и представляет собой уравнение теплопроводности (или диффузии). Однако между математическими моделями теплопередачи и слу- случайного марковского процесса есть существенная разница. При выводе уравнения A5) для функции p(t, x) использовались (в отличие от выво- вывода уравнения теплопроводности) условия сильной непрерывности (9)— A1). Это приводит к тому, что функция p(t,x) не может быть любым решением уравнения Колмогорова. Она оказывается так называемым фундаментальным решением уравнений A5)—A8). Проще всего пояснить это свойство функции p(t, x) в случае прос- простейшего уравнения A8). Пусть функция u(t,x) — решение уравнения A8), определенное при t > to, —оо < х < оо и удовлетворяющее задан- заданному начальному условию u(t,x) —> щ(х) ^ 0 при t —> to. A9) Тогда, если р(х, ?, t1, х') — фундаментальное решение A8), то функция u(t,x) находится по формуле u(t,x)= p(t,x,tf,xf)uo(xf)dxf. B0)
§ 1] УНИВЕРСАЛЬНОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 145 То, что u(t,x), задаваемая в виде B0), — решение A8), нетрудно установить дифференцированием (упр. 4). Свойство A9) доказывается с помощью разбиения интеграла в B0): u(t,x) = / p(t,x,t',x') ио(х') dx' + / p(t,x,t',x') ио(х') dx'. \х'—ж|<5 \х'—х\~^д При t = to точка имеет координату ж, и поэтому по свойству сильной непрерывности вероятность ее нахождения при t' —У t —У to в области \х' — х\ ^ 5 нулевая, т. е. p(t,x,t', ж') —У 0 при t' —У to- Следовательно, из последней формулы получаем lim / p(t,x,t',x') ио(х') dx' = lim / p(t,x,t',x') ио(х') dx'. R1 \x-y\<6 Используя условие нормировки (8) при t' —У to, x' —У ж и учитывая не- независимость левого предела в последней формуле от ?, получаем lim / p(t, ж, t', х') щ(х') dx' = ^о(ж), f —yto J R1 т. е. формулу A9). Тот факт, что функция p(t, ж) не любое, а именно фундаменталь- фундаментальное решение уравнения Колмогорова (для уравнений A5)—A7) доказа- доказательство аналогично), не является дефектом рассматриваемой модели, а отражает естественное свойство случайного марковского процесса. Действительно, в начальный момент t = to блуждающая точка имеет некоторую координату жо, и поэтому р(ж,?о) = 0 при ж ф жо- В то же время из условия (8) при t' — t — to следует, что p(x,to)dx = 1, т. е. начальными данными для уравнения A8) (и уравнений A5)—A7)) служит ^-функция. Решения задачи Коши для линейных параболичес- параболических уравнений с таким начальным условием являются их фундамен- фундаментальными решениями. Простейший пример — функция мгновенного точечного источника тепла для уравнения теплопроводности A1) из § 2 гл. II, даваемая простой формулой B0) из § 2 гл. II и имеющая те же свойства, что и функция p(t,x). Для более общих уравнений A5)- A7) не существует столь простых представлений их фундаментальных решений. Однако то обстоятельство, что величина p(t, x) подчиняется уравнению Колмогорова и является его фундаментальным решением, существенно используется при исследовании объектов, в которых про- протекают случайные марковские процессы, в частности в задачах управ- управления такими объектами. 10 А. А. Самарский, А. П. Михайлов
146 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Таблица 1 Универсальность математических моделей. Параболические уравнения Объект (процесс) Движение грунтовых вод Теплопередача; диффузия вещества Движение скопления амеб Случайный марковский процесс Динамика распределения власти в иерархии Основные предположения и законы Сохранение массы, закон Дарси Сохранение энергии, закон Фурье; сохранение массы, закон Фика Сохранение числа амеб, хаотичность движения амеб в отсутствие «притягивающего» вещества Тождество Маркова, сильная непрерывность процесса Законопослушность, постулат о механизмах перераспределения власти в иерархии Итак, параболические уравнения — один из примеров универсаль- универсальности математических моделей (табл. 1). Они описывают широкий круг процессов совершенно различной природы (последний пример в таблице рассматривается в § 4). Отметим, что параболические уравне- уравнения часто связываются с хаотическими неупорядоченными явлениями (теплопередача, диффузия и т. д.). Однако они применимы и ко многим процессам, которые рассматриваются как детерминированные (движе- (движение грунтовых вод, фильтрация газа в пористой среде и т. д.). Универсальность математических моделей — отражение единст- единства окружающего нас мира и способов его описания. Поэтому методы и результаты, разработанные и накопленные при математическом моде- моделировании одних явлений, относительно легко, «по аналогии», могут быть перенесены на широкие классы совсем других процессов. 3. Примеры аналогий между механическими, термоди- термодинамическими и экономическими объектами. Особое значение «метод аналогий» имеет при математическом моделировании труд- ноформализуемых объектов, для ко- которых фундаментальные законы, ва- вариационные принципы и иные общие и математически строгие утвержде- утверждения либо неизвестны, либо вообще не существуют. К таким объектам отно- относятся, например, системы с заметным вмешательством людей, в частности экономические системы. Одна из важных механико-эконо- механико-экономических аналогий — аналогия меж- Рис. 43 ду равновесием материальной части- частицы в потенциальном поле внешних сил и выбором оптимального плана производства. Рассмотрим ради простоты ее частный случай. Пусть единичная масса (точка на рис. 43) находится в поле силы тяжести и У ii
§ 1] УНИВЕРСАЛЬНОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 147 может занимать, вообще говоря, любое положение в области простран- пространства, ограниченного снизу твердой идеальной поверхностью. Уравне- Уравнение поверхности дается зависимостью у1(х) ^ 0, где ж, у — соответ- соответственно горизонтальная и вертикальная координаты частицы, у1 (х) — гладкая функция. Очевидно, что величина у — расстояние частицы от оси абсцисс — подчиняется неравенству у^у1{х), О^х^х1. B1) Поле силы тяжести потенциально, т. е. существует функция (по- (потенциал) Р(х, у) такая, что компоненты ее градиента определяют внешнюю силу, действующую на материальную частицу в данной точ- точке поля. В рассматриваемой ситуации где д — ускорение свободного падения (горизонтальная компонента, естественно, равна нулю). Следовательно, потенциал дается формулой р = -ду, B2) в которой опущена несущественная аддитивная постоянная. Изменение потенциала при перемещениях частицы в поле силы тя- тяжести равно работе А, совершаемой этой силой, и определяется только начальным и конечным положением частицы (в данном случае только координатой у): Х2,У2 А= J dP = Р(х2,у2) - P(xi,yi) = Р(у2) - P(vi). B3) xi,yi Точка ж*,у* называется положением равновесия, если частица, помещенная в нее и имеющая нулевую скорость, остается в ней лю- любое время (при наложенных связях B1) и внешней силе gradP(x*, у*)). Потенциал в точке равновесия достигает своего экстремального зна- значения. Это свойство хорошо иллюстрирует рис. 43, где равновесными являются точки минимума функции уг(х) (в них сила тяжести уравно- уравновешивается реакцией опоры). Любое виртуальное (не противоречащее связям B1)) малое смещение частицы из этих точек приведет к тому, что над нею будет совершена, как видно из B3), отрицательная работа, и потенциал уменьшится (если перемещение полностью или частично осуществляется по поверхностям у1(х), х = 0, х = ж1, то, поскольку они считаются идеальными и силы трения отсутствуют, а их реакция перпендикулярна перемещению, это не сказывается на величине рабо- работы). Во всех других точках области у ^ у1(х), 0 ^ х ^ х1 потенциал B2) не достигает своего максимального значения. Итак, поиск устойчивого положения равновесия сводится к реше- решению задачи Р(х,у) ->• max при у^у1(х), 0 ^ х ^ х1. B4) Закон покоя Мопертюи B4) аналогичным образом формулирует- формулируется и для общих механических систем, точки равновесия которых на- находятся не столь просто, как в приведенном случае. Например, если 10*
148 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV на частицу действуют, кроме силы тяжести, другие потенциальные силы, то точки равновесия отнюдь не обязаны совпадать с точками минимумов функции у1(х). В экономической интерпретации задача B4) называется задачей нелинейного программирования и часто возникает при планировании производства. Пусть некоторое предприятие выпускает продукцию (кирпичи), объем которой обозначим ж, 0 ^ ж ^ ж1. Для производства предприя- предприятию необходимо затратить некоторый ресурс (глину), остаток которо- которого после выполнения плана обозначим у (начальный ресурс равен у0 и считается независящим от величины плана ж, у0 ^ у ^ 0). Известно, что производство происходит при некоторых ресурсных ограничениях сверху, т. е. У°^У^уЧх), О^х^х1, B5) где уг(х) — минимальное количество неиспользованных ресурсов, ко- которое предприятие по технологическим, финансовым или иным при- причинам обязано иметь в своем распоряжении после выполнения плана х (у1(х) считается заданной гладкой функцией х). В упрощенной постановке прибыль Р(х,у) равна разности меж- между стоимостью выпущенной продукции fx и стоимостью затраченных ресурсов д(у -у0): P(x,y) = fx + g(y°-y), B6) где /, д — цена единицы продукции и ресурса соответственно (осталь- (остальные затраты считаются несущественными). Задача планирования производства состоит в том, чтобы выбрать план ж*, выполнение которого дает максимальную прибыль B6) при ресурсных ограничениях B5): Р(х,у) ->• max при у0 ^у ^ ?/(ж), 0 ^ х ^ ж1. B7) Формулировки, подобные B7), справедливы для весьма общих задач планирования. Для получения полной аналогии несколько усложним задачу о рав- равновесии материальной частицы. Введем дополнительно к силе тяжести потенциальную внешнюю силу (см. рис. 43), действующую на части- частицу в направлении оси ж и равную по величине /. Например, для заря- заряженной частицы эта сила появляется при наличии соответствующего электрического поля. Тогда потенциал есть Р(х,у) = fx + gy, что с точностью до несущественной аддитивной постоянной совпадает с B6). Завершает аналогию введение идеальной твердой поверхности у = у0^ ограничивающей движение материальной частицы сверху; тог- тогда B1) примет вид B5) (с учетом того, что затраты всегда считаются отрицательными).
§1] УНИВЕРСАЛЬНОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 149 Итак, задачи B4) и B7) полностью аналогичны и имеют совпа- совпадающие решения х*,у*. Заметим, что механико-экономические анало- аналогии имеют место не только для общих формулировок проблем, но и для многих содержательных конкретных понятий (сила — предельная прибыль, реакция связей — предельные издержки и т. д.). На плане ж*, у* (оптимальном плане) максимального значения до- достигает не только экономический аналог потенциала — прибыль, но также еще одна величина, которой ставится в соответствие уже не механическое, а термодинамическое понятие, — энтропия. Известно, что предоставленная самой себе термодинамическая система, напри- например, газ в изолированном сосуде (см. п. 3 § 3 гл. III), с наибольшей вероятностью переходит в состояние с наименьшей упорядоченностью параметров, характеризующих составляющие ее частицы (атомы, мо- молекулы). В этом состоянии система находится в равновесии, ее пара- параметры одни и те же во всех ее точках. Поэтому не существует какого- либо способа различить (упорядочить) ее части друг относительно друга: достигается наибольший (в сравнении с другими возможными состояниями) беспорядок — «хаос». Мерой этого беспорядка служит энтропия, являющаяся функцией состояния системы и принимающая максимальное значение, когда система находится в равновесии. Рис. 44 Для некоторого произвольного неоптимального плана (х,у) ф Ф (ж*, ^/*) из задачи B7) рассмотрим г-окрестность всех соседних пла- планов (х,у) (т. е. выполнено |ж — х\ < г, \у — у\ < е). Поскольку план (ж, у) неоптимален, то в его г-окрестности всегда существует непустое множество планов, которые: либо не удовлетворяют ресурсным огра- ограничениям (области А и В на рис. 44); либо не имеют преимущества по прибыли в сравнении с планом (х,у) (область С на рис. 44); либо обладают обоими этими свойствами. Это означает, что в окрестное-
150 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV ти точки (ж, у) можно провести частичное упорядочение планов друг относительно друга, так как известна процедура предпочтения одних планов другим. Объем множества этих «плохих» планов V зависит от ж, у, е и, очевидно, всегда меньше обема г-окрестности: V(x,y,e)<Ve=e2. Рассмотрим теперь г-окрестность оптимального плана (х*,у*). В отличие от случая плана (ж, у) все планы из этой области менее пред- предпочтительны по отношению к (х*,у*) (либо по ресурсным ограничени- ограничениям, либо по величине прибыли, имеющей максимум в точке (х*,у*)). В этом случае объем «плохих» планов равен объему всей г-окрестности: V(x*,y*,e) = Ve. Введем функцию Е(х,у,е) = ^±, которая служит мерой упорядоченности различных состояний данной системы. Чем «ближе» точка (х,у) к «равновесному» оптимальному состоянию (ж*,^/*), тем больше значение функции Е. Очевидно, что Е < 1 при всех (ж,у) ф (ж*,?/*) и достигает своего максимального зна- значения Е = 1 в точке (ж*,у*). Она и является экономическим аналогом энтропии в рассматриваемой задаче. Так же, как и механические аналогии, термодинамические анало- аналогии справедливы для многих весьма общих экономических систем и широко применяются при их исследовании. УПРАЖНЕНИЯ 1. Используя замену вида p(x,t) = (p(t) • u(x,t), сведите C) к уравнению теп- теплопроводности . 2. Убедитесь в том, что квадратное уравнение F) всегда имеет действитель- действительные корни и что необходимым и достаточным условием отрицательности обоих корней является условие с > 0. 3. Получите уравнения A6), A7), используя те же предположения, что и при выводе A5). 4. Дифференцируя интеграл в правой части B0) по t, x и используя уравнение A8), убедитесь, что функция u(t,x) — решение уравнения A8). § 2. Некоторые модели финансовых и экономических процессов Рассмотрим модели рекламной кампании, процедуры погашения взаимных долгов предприятий, простые макромодели равновесия и роста экономической системы. Обсудим роль аналогий, используемых при построении моделей, и некоторые выводы, следующие из их ана- анализа. 1. Организация рекламной кампании. Фирма начинает ре- рекламировать новый товар или услугу. Разумеется, что прибыль от будущих продаж должна с лихвой покрывать издержки на дорого- дорогостоящую кампанию. Ясно, что вначале расходы могут превышать
§ 2] МОДЕЛИ ФИНАНСОВЫХ И ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 151 прибыль, поскольку лишь малая часть потенциальных покупателей будет информирована о новинке. Затем, при увеличении числа про- продаж, уже возможно рассчитывать на заметную прибыль, и, наконец, наступит момент, когда рынок насытится, и рекламировать товар да- далее станет бессмысленно. Модель рекламной кампании основывается на следующих основ- основных предположениях. Считается, что величина dN/dt — скорость из- изменения со временем числа потребителей, узнавших о товаре и го- готовых купить его (t — время, прошедшее с начала рекламной кам- кампании, N(t) — число уже информированных клиентов), — пропор- пропорциональна числу покупателей, еще не знающих о нем, т. е. вели- величине ai(i) (Nq — N(i)), где Щ — общее число потенциальных пла- платежеспособных покупателей, a\(t) > 0 характеризует интенсивность рекламной кампании (фактически определяемую затратами на рекла- рекламу в данный момент времени). Предполагается также, что узнавшие о товаре потребители тем или иным образом распространяют получен- полученную информацию среди неосведомленных, выступая как бы дополни- дополнительными рекламными «агентами» фирмы. Их вклад равен величине a2(t)N(t) (Nq — N(t)) и тем больше, чем больше число агентов. Ве- Величина a2(t) > 0 характеризует степень общения покупателей между собой (она может быть установлена, например, с помощью опросов). В итоге получаем уравнение dN — = [ai(t) + a2(t)N(t)} (No - N). A) При ai(t) ^> a2N(t) из A) получается модель типа модели Маль- Мальтуса A0) из § 1 гл. I, при противоположном неравенстве — уравнение логистической кривой (см. A2) в § 1 гл. I) dN — = N(N0-N), dr = a2(t)dt, ат решение которого изучено в § 1 гл. I (см. также рис. 7). Полученная аналогия вполне понятна, так как при построении данной модели и модели роста численности популяции использова- использовалась одна и та же идея «насыщения»: скорость роста со временем какой-либо величины пропорциональна произведению текущего значе- значения этой величины N(t) на разность No — N(t) между ее равновесным (популяция) либо предельным (покупатели) и текущим значениями. Аналогия между обоими процессами заканчивается, если в какой- то момент времени величина а± + a2N становится нулевой или даже отрицательной (для этого необходимо, чтобы один или оба коэффици- коэффициента ai(t), oi2(t) стали отрицательными). Подобный негативный эф- эффект довольно часто встречается в рекламных кампаниях различного рода и должен побудить их организаторов либо изменить характер рекламы, либо вовсе отказаться от дальнейшей пропаганды. Меро- Мероприятия по увеличению популярности товара могут, в зависимости от значений величин ai(t), oi,2(t), N(t), направляться на улучшение ре- результатов как прямой (параметр ai), так и косвенной (параметр а2) рекламы.
152 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Модель A) лишена очевидного недостатка, присущего логистичес- логистическому уравнению. Действительно, оно не имеет решений, обращающих- обращающихся в нуль в конечный момент времени (из соответствующей формулы для N(t) в п. 5 § 1 гл. I следует, что N(t) —> 0 при t —> —оо). Приме- Применительно к рекламе это означало бы, что часть покупателей еще до начала кампании уже знает о новом товаре. Если же рассмотреть мо- модель A) в окрестности точки N(t = 0) = iV@) = 0 (t = 0 — момент начала кампании), считая, что N ^ Щ, аг(^) N <С &i(i), то уравнение A) принимает вид f = al{t)N0 и имеет решение t = N0Jai(t)dt, B) удовлетворяющее естественному начальному условию при t = 0. Из B) относительно легко вывести соотношение между реклам- рекламными издержками и прибылью в самом начале кампании. Обозначим через р величину прибыли от единичной продажи, какой бы она была без затрат на рекламу. Считаем для простоты, что каждый покупа- покупатель приобретает лишь одну единицу товара. Коэффициент a\{t) по своему смыслу — число равнозначных рекламных действий в единицу времени (например, расклейка одинаковых афиш). Через s обозначим стоимость элементарного акта рекламы. Тогда суммарная прибыль есть t P = pN(t)=pN0 fai(t)dt, C) а произведенные затраты ъ = s Прибыль превосходит издержки при условии pNo > s, и если ре- реклама действенна и недорога, а рынок достаточно емок, то выигрыш достигается с первых же моментов кампании (в реальности между оплатой рекламы, рекламным действием и последующей покупкой име- имеет место так называемый лаг — временная задержка, которая может быть учтена в более полных моделях). При не слишком эффективной или дорогой рекламе фирма на первых шагах несет убытки. Однако это обстоятельство, вообще говоря, не может служить основанием для прекращения рекламы. Действительно, выражение C) и полученное с его помощью условие рЩ > s справедливы лишь при малых значениях N(t), когда функции Р и S растут со временем по одинаковым законам.
§ 2] МОДЕЛИ ФИНАНСОВЫХ И ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 153 При увеличении N(t) отброшенные в A) члены становятся заметны- заметными, в частности усиливается действие косвенной рекламы. Поэтому функция N(t) может стать более «быстрой» функцией времени, чем в формуле C). Этот нелинейный эффект в изменении величины N(t) при неизменном темпе роста издержек дает возможность скомпенсировать финансовую неудачу начальной стадии кампании. Поясним данное утверждение в частном случае уравнения A) с постоянными коэффициентами ai, 0:2- Заменой N = ai/a2 + N оно сводится к логистическому уравнению ^ = a2N (No -N), No = —+ No, D) at 0L2 имеющему решение N(t) = No [1 + (Ща2/аг - 1) exp (-N0a2t)]-1. E) При этом N@) = OL\JOL2^ так что iV@) = 0, и начальное условие выполняется. Из D) видно, что производная функции N(t) и, следо- следовательно, функции N(t) может при t > 0 быть больше ее начального значения (при условии Щ > 2a,i/a,2 или TVq > 0:1/0:2)- Максимум про- производной достигается при N = Щ/2, N = (ai/аг + Щ)/2: 'dN\ fdN Щ В этот период для текущей, т. е. получаемой в единицу времени прибыли имеем dN Р Вычитая из Рт начальную текущую прибыль Ро = р (dN/dt)t=o = (см. B)), получаем _ *т — -L0 — Р т. е. разница между начальной и максимальной текущей прибылью может быть весьма значительной (см. также упр. 1). Суммарный эко- экономический эффект от кампании (его необходимым условием являет- является, очевидно, выполнение неравенства Рт = р {сц/у/а?, + ^/с^ А^оJ/4 > > ol\s) определяется всем ее ходом, характеристики которого вычис- вычисляются из D), E) с помощью квадратуры (см. также упр. 2). Как следует из D), начиная с некоторого момента, продолжать рекламу становится невыгодно. Действительно, при N(t), близких к TVq, уравнение D) записывается в виде dN — =a2N0(N0-N). (б)
154 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Его решение стремится при t —> оо к предельному значению Nq (а функция N(i) — к No) по медленному экспоненциальному закону (упр. 2). В единицу времени появляется ничтожно малое число новых покупателей, и поступающая прибыль при любых условиях не может покрыть продолжающихся издержек. Аналогичные характеристики вычисляются для уравнения A) и различных его обобщений, широко используемых также для описания внедрения технологических и иных новшеств. 2. Взаимозачет долгов предприятий. Любая значительная по своим масштабам экономическая система включает в себя десятки ты- тысяч предприятий (фирм, корпораций и т. д.), обменивающихся между собой товарами и услугами. Даже мелкая фирма, имеющая относи- относительно небольшое число непосредственных партнеров, косвенно связа- связана (через связи прямых и вторичных партнеров) с огромным числом предприятий, входящих в систему, и ее благополучие напрямую за- зависит от их состояния. Это утверждение тем более справедливо для крупных корпораций, поддерживающих партнерство с сотнями и ты- тысячами экономических агентов. Взаимосвязанность всех звеньев экономической системы хорошо проявляется при проведении расчетов между предприятиями за по- поставленную продукцию. Действительно, получив от своих клиентов выручку за предоставленный товар, предприятие тратит ее на за- закупку сырья и машин у других фирм, на зарплату (т. е. на покуп- покупку рабочей силы), на рекламу и на иные действия, необходимые для своего нормального функционирования. Тем самым в экономический оборот дополнительно вовлекается большое число партнеров данного предприятия. В свою очередь клиенты, получившие от предприятия товар, направляют его на дальнейшую перепродажу, используют для производства собственной продукции и т. д., также увеличивая число участвующих в экономической деятельности агентов. Если поставки и платежи за них осуществляются своевременно (в идеале мгновенно), то с точки зрения финансового обращения экономи- экономической системе ничего не грозит. Для продолжения своей деятельнос- деятельности предприятиям нет необходимости ни использовать значительную часть своих финансовых ресурсов, находящихся на банковских счетах, ни, тем более, продавать основные фонды (землю, здания, оборудова- оборудование, технологии). В реальности между поставкой товара и его оплатой (либо предоплатой всего товара или его части и следующей за ней поставкой) всегда существует задержка во времени. Ее минимальное значение определяется чисто техническими причинами, так как всегда требуется время на транспортировку и расфасовку товара, на прове- проведение банковских переводов и т. д. При небольших лагах небольших партий товара (или небольших денежных сумм) предприятия на ко- короткое время привлекают небольшую часть своих свободных финансов и затем быстро пополняют эти затраты из получаемых от своих парт- партнеров платежей. Однако возможны ситуации, когда по каким-либо экономическим, финансовым, внутри- или внешнеполитическим, социальным, психо- психологическим и иным причинам время задержки платежей (поставок)
§ 2] МОДЕЛИ ФИНАНСОВЫХ И ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 155 становится сравнимым со временем оборота финансов, а абсолют- абсолютное значение (объем) невыполненных платежей или поставок — со- сопоставимыми с объемом свободных оборотных средств предприятий. В этом случае возникает так называемый кризис неплатежей, способ- способный привести к серьезному кризису всей экономической системы. В самом деле, предприятие, не получившее деньги за поставлен- поставленную продукцию (или оплатившее товар, но не получившее его), не может расплатиться со своими поставщиками (поскольку объем дол- долгов предприятию сравним с величиной его свободных средств, то их использование не может принципиально улучшить ситуацию). В свою очередь поставщики не расплачиваются со своими клиентами, те — со своими и т. д. Возникают длинные цепочки неплатежей, пронизы- пронизывающие всю систему. Они, очевидно, могут состоять из N звеньев, а их общее число достигать величины порядка N\ (N — общее число предприятий). Сумма абсолютных величин долгов по всем цепочкам может не только превышать свободные средства предприятий, но и становиться сопоставимой со стоимостью их основных фондов (речь идет именно о сумме абсолютных долгов, так как любое предприятие одновременно может быть как должником, так и кредитором своих партнеров). Система заходит в тупик — предприятия либо должны прекратить производство, либо снова занять друг у друга средства, увеличив суммарный взаимный долг. В принципе для разрешения ситуации возможен подход, когда не- некоторое уполномоченное учреждение (например, главный националь- национальный банк) выдает всем предприятиям единовременный кредит, равный сумме всех долгов. Тогда они расплачиваются между собой и затем возвращают кредит. Однако такая кредитная эмиссия может спрово- спровоцировать сильную инфляцию (производство товаров не увеличилось, а денег в обороте вдруг стало значительно больше) со всеми ее отрица- отрицательными последствиями. В любом кризисе неплатежей определенную роль всегда играет чисто «техническая» компонента, связанная с несовершенством самой процедуры расчетов. В дальнейшем будем рассматривать кризисы, по- порождаемые именно этими факторами, отвлекаясь от экономических, политических и других причин их возникновения. Сначала поясним суть проблемы на простом числовом примере для системы из трех предприятий, каждое из которых имеет свобод- свободные средства, равные условно одной финансовой единице, и основные фонды, равные 10 единицам. Пусть первое предприятие должно второ- второму 100 единиц, второе должно третьему 100 единиц, и, наконец, третье первому также 100 единиц. Суммарный абсолютный долг предприятий равен 600 единицам и огромен в сравнении с их фондами C0 единиц), не говоря уже о свободных средствах C единицы). В то же время фи- финансовое положение этой системы фактически благополучное, так как суммарный «долг» каждого предприятия в отдельности (т. е. сум- сумма средств, которые предприятие должно другим, и другие должны ему) равен нулю. Очевидная процедура взаимозачета состоит в одно- одномоментном аннулировании (погашении) всех долгов: объявляется, что никто никому не должен, и партнеры продолжают свою работу, буду-
156 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV чи свободными от долгового бремени. Централизованный кредит при этом, естественно, вообще не требуется. Подобную операцию, произведенную «вручную», нельзя, конечно, реализовать для большого числа предприятий с огромным количес- квом финансовых обязательств. Требуются более глубокие подходы, для рассмотрения которых необходимо, прежде всего, формализовать задачу. Итак, пусть экономическая система состоит из N предприятий, могущих иметь взаимные долги. Обозначим долги n-го предприятия ттг-му через жпт, где 1 ^ n, т ^ N (хпт < 0, если первое предприятие должно второму, и хпш > 0 в обратном случае). Ясно, что т. е. совокупность долгов описывается кососимметричной матрицей размера N х N с нулевой диагональю (хпп = 0, поскольку предпри- предприятие самому себе должно быть не может). Сумма всех взаимных долгов вычисляется через индивидуальные долги по простой формуле N N X = Wb I. G) n=l m=l Величина G) служит одной из интегральных количественных характе- характеристик финансового положения системы: если она сопоставима с сум- суммой всех свободных средств предприятий Xq, т. е. N X ^ Xq = 2_^ хт (8) 71=1 то описываемая неравенством (8) ситуация и означает кризис непла- неплатежей (здесь хп ^ 0 — индивидуальные свободные средства предпри- предприятий). Еще одна важная характеристика — баланс кредитов и долгов (сальдо) каждого предприятия N С — \ Л rn (Q\ п — / ^nm-i \У) т=1 причем, как очевидно из (9), возможны варианты Sn > 0, Sn < 0, Sn = = 0. При Sn > 0 предприятие является в некотором смысле кредитором пред приятии-должников, т. е. тех, у кого Sn < 0 (при Sn = 0 предприя- предприятие в отношении долгов «нейтрально»). При \Sn\ < xn индивидуальное финансовое состояние предприятия по существу нормальное, посколь- поскольку его реальные суммарные долги (или кредиты, «данные» им другим) меньше его свободных средств. Аналогично, суммарное абсолютное сальдо системы N 5=^|5П| A0) 71=1
§ 2] МОДЕЛИ ФИНАНСОВЫХ И ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 157 служит макропоказателем ее возможного финансового «здоровья». Ес- Если S < Xq, to свободных средств в системе больше, чем действитель- действительных долгов, и потенциально она может успешно функционировать (по- (подобно системе трех предприятий из приведенного выше примера). Между величинами X и S всегда существует определенное соот- соотношение. Для любой произвольной матрицы долгов выполняется нера- неравенство х > s, (и) т.е. суммарный долг никак не может быть меньше суммарного сальдо. Задача погашения взаимных долгов состоит в том, чтобы, зная матрицу хпт, найти матрицу х'пш «новых» долгов, для которой вы- выполнялось бы X1 < X. Очевидно, что идеальным ее решением было бы X1 = S, т. е. когда неравенство A1) становится равенством. Заметим, что тогда для благополучной по существу системы с S ^ Xq достига- достигалось бы соотношение X' = S ^ Xq, и после взаимозачета она могла бы нормально работать (хотя уменьшение величины X в любом случае полезно). При построении математической модели процедуры взаимозаче- взаимозачета долгов последовательно используется ряд действий, аналогичных проводимым при исследовании естественнонаучных объектов. Первое из них — отказ на определенном эта- этапе от детального рассмотрения множес- з # ^ ^ тва индивидуальных долгов и соответ- J "^ • • • ствующих связей между предприятиями. Т I Переход с микроуровня на макроуровень j у подобен тому, как при описании боль- 2 \ • М - 2 шого числа частиц газа отказываются V I от необходимости прослеживать траек- \ ' торию каждой частицы и вводят неко- некоторые усредненные характеристики, зна- знания которых, однако, вполне достаточно для получения подробной картины по- поведения объекта (см., например, вывод уравнения Больцмана в § 3 гл. III). Процедура прослеживания цепочек неплатежей, примененная М-2 2 • • М-2 1 м г м Рис. 46 Рис. 47 выше для трех предприятий, не только трудновыполнима для N пред- предприятий, но имеет также и принципиальный недостаток. Действитель- Действительно, рассмотрим сначала цепочку, в которой каждое предприятие с
158 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV первого по М-е (М ^ N) должно другому одинаковую сумму, и та- такую же сумму должно М-е предприятие первому (рис. 45). Цепочка замкнута, и решение очевидно — все долги в цепочке погашаются. Пусть теперь М-е предприятие не должно первому (рис. 46). Тогда цепочка разомкнута, и этот метод неприменим. В то же время прос- простое решение заключается в том, что долги предприятий со второго по (М — 1)-е аннулируются, а долг первого переадресовывается М-му (рис. 47). Экономический смысл переадресации соответствует вексель- вексельному обращению, когда долговое обязательство меняет своих хозяев, и в результате у должника (первое предприятие) появляется новый кредитор (М-е предприятие). В отличие от ситуации с долгами в цепочках полная система дол- долгов по всем цепочкам замкнута, так как рассматриваются взаимные долги. В самом деле, из свойства хпш = —хшп следует, что N N для любой совокупности неплатежей. Учитывая, что Sn = ^2т=1 хпт, из последнего равенства получаем N 5>„ = 0, A2) 71=1 ИЛИ т. е. сумма положительных сальдо предприятий равна по абсолютной величине сумме отрицательных сальдо. Рассматриваемая на макро- макроуровне система взаимных долгов обладает свойством «симметричной консервативности» A3), а «закон сохранения» A2) — аналог обычных законов сохранения (массы, энергии и т. д.) применительно к изучае- изучаемой ситуации. Равенство A3) проясняет построение математической модели иде- идеального взаимозачета, который производится при следующих естест- естественных условиях: 1) все долги хпш известны и признаются предприятиями; 2) при проведении взаимозачета сальдо предприятий Sn остаются неизменными: S'n = *Sn, т. е. индивидуальное финансовое положение каждого из них в этом смысле не изменяется; 3) часть долгов хпт списывается, а часть переадресовывается, т. е. у предприятий могут появиться новые должники и кредиторы и исчезнуть часть старых. Суть макропроцедуры взаимозачета состоит в том, что вместо величин хпш рассматриваются величины Sn. Предприятия с Sn < О объявляются должниками (в размере своих сальдо), а предприятия с Sn > 0 — кредиторами (в тех же размерах). Затем долги предприя- предприятий с Sn < 0 каким-то образом распределяются между кредиторами,
§ 2] МОДЕЛИ ФИНАНСОВЫХ И ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 159 т. е. находится новая система долгов х'пт. При этом выполнены закон сохранения A2), условие 2) и достигается равенство X' = S; поэтому решение задачи является оптимальным. Таких оптимальных решений может быть, вообще говоря, много, так как распределять долги между кредиторами можно разными спо- способами. Приведем два наиболее простых и наглядных. Первое из них дается несложной формулой, по которой новые долги вычисляются че- через старые: / _ «Ьп |«ЬШ| — Ьт \Ьп\ х хпт — g Согласно алгоритму A4) долг любого предприятия (равный 5П, если Sn < 0) расписывается по предприятиям-кредиторам в долях, про- пропорциональных величинам их сальдо (равным Sm, если Sm > 0). Пред- Предприятиям с большим положительным сальдо причитается от каждого из должников большая часть его долгов, причем в сумме они дают ве- величину Sm (упр. 5). Для предприятий с нулевым сальдо взаимозачет сводится к погашению всех их долгов и всех долгов им. Заметим, что в решении A4) для новых долгов имеем х'пт = 0 при Sn < 0, Sm < 0 либо при Sn > 0, Sm > 0 (после взаимозачета должники не должны должникам, а кредиторы — кредиторам). Это означает, что число получившихся финансовых связей между предприятиями значи- значительно меньше максимально возможного, когда каждое предприятие является должником или кредитором любого другого, и матрица дол- долгов не имеет нулевых элементов (кроме, разумеется, диагональных). Количество связей может быть значительно уменьшено, если про- провести предварительное упорядочивание предпрятий по абсолютным значениям их сальдо и установить непосредственные связи между должниками и кредиторами одного масштаба (крупных с крупными, мелких с мелкими и т. д.). Эта процедура допускает простую геомет- геометрическую интепретацию. На рис. 48 на верхней прямой линии описано распределение сальдо кредиторов (в убывающем порядке). Длина от- отрезков этой прямой равна ве- величине сальдо каждого пред- sp=i sp=2 $р=з прятия Sp > 0,1 < р < 7V, а ее ' ? ' ? '—? ' ' общая длина, очевидно, рав- i i i на S/2. На нижней прямой описано распределение саль- сальдо должников Sq < 0, 1 < q < < N, p + q ^ N (сальдо взяты с обратным знаком) также в убывающем порядке. Ее дли- -^ис- ^ на согласно A3) также равна S/2. Штриховые линии, проведенные из узлов нижней прямой, делят «прямую кредиторов» на q отрезков, рав- равных величине долга каждого предприятия. Этот долг либо достается одному кредитору, либо делится между несколькими в соответствии с расположением узлов верхней прямой относительного данного отрезка. Описанный алгоритм оптимален по критерию X' = S и представ- представляется наилучшим по числу связей, остающихся после взаимозачета.
160 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ Таблица 2 Пример взаимозачета в системе с N = 10 и начальной матрицей долгов с 90 ненулевыми недиагональными элементами [ГЛ. IV 2 3 4 5 6 7 8 9 10 2 3 4 5 6 7 8 9 10 1 -25 -1 4 25 -15 3 1 10 1 2 0 0 0 0 1 0 0 0 2 3 4 5 Начальная матрица -20 25 -450 150 -40 -22 322 -25 -2 25 -30 3 -2 -15 -2 Конечная 0 0 0 0 0 -7 -18 0 0 0 0 0 0 0 0 30 20 3 -2 -25 1 -928 5 4 498 -20 6 7 {X = 3729) 25 -15 -800 15 матрица (Xf = S - 0 0 0 0 0 0 -28 0 0 -2 0 0 0 0 4 5 -10 -1 = 62) 0 0 0 8 9 20 -3 30 0 0 0 Пример подобного взаимозачета в системе с N = 10 и начальной мат- матрицей долгов с 90 ненулевыми недиагональными элементами приведен в табл. 2. Конечная матрица содержит лишь 14 ненулевых элементов. В специальных случаях у одного должника остается один кредитор, и наоборот (упр. 6). Отметим, что эти и другие процедуры взаимозачета имеют смысл лишь при выполнении условий 1)-3), т. е. при определенном согла- соглашении между предприятиями. Причины, не позволяющие придержи- придерживаться данного соглашения, могут быть весьма разнообразными — от нежелания платить долги потому, что это выгодно должнику, до последствий санкций международных или иных организаций, когда финансовые средства предприятий замораживаются. Эти обстоятель- обстоятельства и определяют рамки применимости модели взаимозачета, при по- построении которой существенно использовались аналогии с моделями некоторых естественнонаучных объектов. 3. Макромодель равновесия рыночной экономики. Любой участник рыночного экономического процесса действует в соответ- соответствии со своими индивидуальными интересами (извлечение прибыли, улучшение условий труда, минимизация риска, экономия ресурсов и т. д.). Простейший вариант такой системы — экономика с совершенной конкуренцией, когда каждый субъект экономически ничтожно мал и не оказывает непосредственного влияния на уровень производства, цены,
§ 2] МОДЕЛИ ФИНАНСОВЫХ И ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 161 зарплату и другие макропоказатели. В то же время разобщенные дей- действия экономических агентов могут складываться через существую- существующие в системе отношения купли-продажи в совокупную согласованную картину действий работодателей и наемных рабочих, финансистов и вкладчиков и т. д. Если в результате такого коллективного взаимодействия общее производство товаров и услуг в системе согласовано с общим спросом на них, то такое состояние экономики называется равновесным, а уста- устанавливающиеся при этом цены — равновесными рыночными ценами. Баланс между спросом и предложением имеет место, как подразуме- подразумевается, не при произвольных, а именно при этих рыночных ценах, что означает, в частности, платежеспособность спроса. Одна из важных задач экономической науки — определение усло- условий равновесия экономики, и в том числе равновесных рыночных цен. Наиболее простые математические модели экономического равновесия строятся при следующих предположениях: 1) совершенная рыночная конкуренция, означающая отсутствие как крупных производственных корпораций (и, тем более, монополий), так и объединений работников, могущих диктовать свои условия для всей системы; 2) неизменность производственных возможностей системы: обору- оборудование, производственные помещения, технологии не изменяются со временем; 3) неизменные во времени экономические интересы партнеров: предприниматели не пытаются увеличить свою прибыль, рабочие — зарплату, инвесторов устраивают проценты, получаемые по ценным бумагам, и т. д. Отвечающие этим предположениям модели описывают весьма частный случай «застывшей» во времени идеальной рыночной эконо- экономики. Однако они дают ответ на вопрос о возможности существования экономического равновесия, формирующегося из рыночного «хаоса», и, кроме того, связывают между собой основные макропоказатели эконо- экономической системы. Одна из таких макромоделей — модель Кейнса — рассматривает в качестве агентов нанимателей и нанимаемых, потребителей и сберега- сберегателей, производителей и инвесторов, действующих на рынках рабочей силы, продуктов и денег, т. е. распределяющих и обменивающих эти товары (труд, продукты, деньги) между собой. Первый макропоказатель системы— национальный доход У, явля- являющийся единственным (для простоты) продуктом, производимым ею в единицу времени. Этот продукт вырабатывается производственным сектором экономики, а его величина дается функцией F, зависящей от количества и качества ресурсов, состава основных фондов и числа занятых работников R (второй макропоказатель). В соответствии с предположением 2) в состоянии равновесия производственная функция R, а с нею и продукт Y определяется лишь занятостью, т. е. Y = F(R). A5) 11 А. А. Самарский, А. П. Михайлов
162 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Относительно F(R) обычно считается, что F@) = О, F'(R) > > О, R > 0 и F"(R) < 0 при R > 0 (рис. 49). Функция F(R) обла- обладает свойством «насыщения»: с ростом R выпуск растет все медленнее. Такой подход вполне оправдан, поскольку при излишне большом числе занятых на про- производстве для них попросту не найдется соответствующего фронта работ. Один или несколько старателей, обнаружив- обнаруживших золотую жилу, быстро и без помех достигнут своей максимальной произво- производительности; при большом количестве рабочих они начинают мешать друг дру- другу, и их индивидуальная производитель- производительность уменьшается; наконец, при очень большом числе старателей до- добыча золота вообще перестает расти, так как вновь прибывающие не могут подступиться к месту разработки. Соотношение A5) дает связь между рынками труда (R) и продук- продукта (У). Дополнительное соотношение определяется с помощью одного из основных постулатов классической политэкономии: 4) заработная плата s работника равна стоимости продукта, ко- которая была бы потеряна при уменьшении занятости на одну единицу (заработная плата равна предельному продукту труда). Заметим, что в постулате 4) не учитываются (считаются малыми) другие издержки, которые отпали бы в результате сокращения одного рабочего места (затраты на ресурсы, оборудование и т. д.). Таким образом, из постулата получаем Рис. 49 где ДУ^1) — количество продукта, потерянное при уменьшении за- занятости на единицу, р — цена продукта (так что слева в данном равенстве записана величина потерянной стоимости). Если занятость изменилась на величину AR, то из последнего равенства, очевидно, имеем где AY = ДУ^1) AR — стоимость, потерянная или полученная при из- изменении числа работников на AR. Считая AR и AY малыми в срав- сравнении с R и У, перепишем последнее равенство в дифференциальной форме: dY s или, принимая во внимание A5), F'(R) = -. A6)
§ 2] МОДЕЛИ ФИНАНСОВЫХ И ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 163 Поскольку F(R) задана (а с нею известна функция F'(R)), то при известных макропоказателях s и р из A6) можно найти уровень заня- занятости R, а из A5) и величину продукта Y. Напомним: этот уровень отвечает числу работников, согласных трудиться за данную зарплату при данных ценах и других характеристиках системы, а не вообще возможному числу наемных рабочих. Предполагается, что для обес- обеспечения равновесного уровня занятости всегда найдется достаточное количество желающих работать на существующих условиях, т. е.: 5) предложение труда не сдерживает производства, число занятых определяется спросом на труд со стороны предпринимателей. Два уравнения A5), A6) содержат четыре величины. Относитель- Относительно одной из них предполагается, что: 6) заработная плата s в модели считается заданной. Она определяется в результате компромисса между работодателя- работодателями и нанимаемыми (реальная же зарплата зависит также и от уровня цен). Очевидно, для построения замкнутой модели необходимо дальней- дальнейшее рассмотрение рынка продукта и рынка финансов. Произведенный продукт частично тратится на потребление, а частично сберегается: Y = 5 + о;, где ио — потребляемая часть (в экономику не возвращается), a S — сберегаемая часть, возвращающаяся в экономическую систему (или фондообразующий продукт). Соотношение между величинами S и ио определяется из следую- следующих соображений. Относительно величины со считается, что: 7) потребляемая часть выпуска зависит от величины самого вы- выпуска, т. е. и = uj(Y). При этом функция u(Y) обладает свойством «насыщения» так же, как и функция F(R): чем больше выпуск, тем меньшая доля до- дополнительного выпуска АУ тратится на потребление (рис. 49) и тем большая доля сберегается. Величина dco/dY = c(Y) называется склон- склонностью к потреблению и лежит в пределах 0 < с < 1, иначе при ма- малых выпусках потреблялось бы больше продукта, чем производилось бы (величина d = 1 — с — склонность к накоплению). Фондообразующий продукт S = Y-v(Y) A7) вкладывается инвесторами в экономику с целью получить в будущем с этих инвестиций доход. В модели считается, что инвестиции экви- эквивалентны отложенному (отнесенному на будущее) потреблению и по- поэтому определяются еще одним финансовым макропоказателем систе- системы — нормой банковского процента г. Действительно, сделав инвес- инвестиции в размере А и получив через год доход D = Аг, инвестор ничего не теряет (в данном примере и не выигрывает) по сравнению с вложе- вложением этих средств в банк под процент г. В обоих случаях сегодняшнее потребление откладывается ради возможности большего потребления в следующем году. Спрос на инвестиции задается функцией А{г) та- такой, что А'(г) < 0 при 0 < г < Т\ и А[т) = 0 при г ^ г\\ при большой норме процента инвестиции отсутствуют (рис. 50). 11*
164 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV В условиях равновесия предложение фондообразующего продукта S(Y) сбалансировано со спросом на инвестиции А(г): или, учитывая A7), Y - S(Y) = А(г), = A(r). A8) пА,1 Для окончательного замыкания модели рассматривается рынок финансов. Деньги нужны экономическим агентам для покупки фондо- фондообразующего продукта, для потребления, а также как одно из средств накопления. Считается, что деньги выпускает государство, и их ко- количество (предложение) Z является заданным управляющим пара- параметром системы. Относительно спроса на деньги делается следующее предположение: 8) спрос на деньги представляет собой сумму операционного и спе- спекулятивного спроса. Операционный спрос определяется количеством денег, которое на- надо иметь на руках, чтобы производить покупки товара Y (как фондооб- фондообразующего, так и идущего на потребление). Если цена продукта равна р, а время обращения равно т, то операционный спрос равен, очевидно, величине rpY. Спекулятивный спрос связан с величиной нормы процента г. Если норма процента высока, то большую часть денег их владельцы пред- предпочитают хранить в банке, рассчитывая на хороший доход и жертвуя более высо- высокой степенью ликвидности банкнот (спо- (способностью обмениваться на продукты) в сравнении с банковскими обязательства- обязательствами. При низкой процентной ставке спеку- спекулятивный спрос увеличивается: владель- владельцы желают иметь на руках все больше банкнот, аккумулируя в них свои накоп- накопления. Поэтому спекулятивный спрос за- задается функцией 1(г) (рис. 50) такой, что Г (г) < 0 при г > г2 и 1(г) резко возраста- возрастает при г —у г2 (lim/(r) = оо, г —У г2] владельцы денег не приобретают обязательств банка). Естественно считать г2 < п., так как в против- противном случае либо инвестиции равны нулю, и говорить об экономическом равновесии не приходится, либо функция 1(г) не определена, и рассмот- рассмотрение не имеет смысла. Так как финансовый рынок находится в равновесии, то баланс («закон сохранения») денег в системе дается уравнением Z = rpY + I(r). A9) Сводя воедино уравнения A5), A6), A8), A9), приходим к мате- математической модели рыночного равновесия, полученной в предположе- 7*2 Рис. 50 7*1
§ 2] МОДЕЛИ ФИНАНСОВЫХ И ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ ниях 1)—8): F'{R) = s/p, Y-u(Y) = A(r), 165 B0) В модели B0) задаются параметры системы s (ставка заработной платы), Z (предложение денег) и технический параметр т. Функции F, F', (J, Л, / — известные функции своих аргументов с описанными выше свойствами. По этим входным данным из модели определяются четыре неизвестных величины: Y (выпуск продукта), R (занятость), р (цена продукта) и г (норма прибыли). Исключая из B0) величины р, г, У, уравнения B0) легко свести к одному уравнению относительно R rsF(R) Ff(R) B1) где А 1 — функция, обратная к функции А. Найдя из B1) значение R, из B0) нетрудно определить все остальные искомые величины. Докажем с помощью нестрогих, но зато простых построений су- существование решения B1), основываясь на анализе графиков функций, входящих в его левую и правую части. F(R) - R Рис. 51 R Функция F(R) — u(F(R)) — монотонно растущая функция R, рав- равная нулю при R = 0 (рис. 51). Ее монотонность следует из условия duj(F(R))/d(F(R)) = с < 1, а рост по мере увеличения R — из условия dF(R)/dR > 0. Данная функция является аргументом для монотонной функции Л, и из свойств функции А (рис. 50) легко установить ка- качественный вид зависимости А~х от R (рис. 52), причем А~х = 0 при R > R\ (Ri — некоторое значение величины R, 0 < R\ < oo). В свою
166 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV очередь А 1 служит аргументом монотонной функции /, свойства ко- которой таковы (рис. 50), что как функция R она имеет вид, изображен- изображенный на рис. 53 (для значений R > R2 функция / не определена). к -tsF(R)/F'(R) R2 Рис. 53 Д1 R Рис. 54 Рассмотрим теперь левую часть уравнения B1). Функция —rsF(R)/F'(R) равна нулю при R = 0 (считается, что F'@) ф 0); (см. рис. 49). Ее первая производная по R, как следует из свойств функ- функций Ff(R) > 0, F1 (R) < 0, отрицательна, т. е. она монотонно убывает (рис. 54). Совмещая графики левой (кривая 2) и правой (кривая 1) частей уравнения B1) на одном рис. 55, убеждаемся в том, что при достаточно большом значении управляющего параметра Z кривые пересекаются в некоторой точке i?o, 0 < Ro < 00. Точка пересечения единственна в силу монотонности графиков. Следовательно, модель B0) действительно имеет единственное решение, описывающее равновесное состояние экономики. Однако значение модели этим не ограни- ограничивается. Она может быть использована для сравнительного анализа различных, но близ- близких состояний равновесия (не отвечая, естес- естественно, на вопрос, каким образом система при- приходит в равновесное состояние или выходит из него). Допустим, что значения равновесных па- параметров so и Zq изменились на малые величи- величины 5sq и 5Zq при переходе из одного равновесного состояния в другое (параметр г считаем неизменным). Тогда изменятся и все остальные характеристики системы. Их можно найти из B0), имея в виду, что оба сравниваемых состояния равновесны. Например, из второго уравнения B0), используя разложение в ряд Тейлора, получаем Rq R2 Рис. 55 R Ро Р Ро Проведя аналогичную процедуру с остальными уравнениями сис- системы B0) и сводя результаты воедино, получаем — =аг EА + Su) + a2 (SZ - 51) + a35s - a45Y. Ро B2)
§ 2] МОДЕЛИ ФИНАНСОВЫХ И ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 167 В выражении B2) присутствуют все характеристики изучаемой системы (коэффициенты а^<0,г = 1,...,4, определяются равновесны- равновесными значениями величин so, Рсь ^о? гсь функций R, си, А, I и их произ- производных) . Поэтому с его помощью можно анализировать весь комплекс изменений, происходящих при переходе от одного равновесного состоя- состояния к другому (так называемый системный подход). Пусть, например, при неизменном числе занятых (т. е. 5R = О, 5Y = 0), неизменных зар- зарплате Es = 0) и уровне потребления Eио = 0) требуется понизить цену Eр < 0), т. е. увеличить реальную заработную плату работающих. Тогда необходимо стремиться уменьшить инвестиции E А < 0), сни- снизить общий объем денег EZ < 0) и увеличить спекулятивный спрос на них E1 > 0). Заметим, что требования, вытекающие из анализа соотношения B2), могут быть, вообще говоря, противоречивыми. Разумеется, эта и другие системы мероприятий, могущие следо- следовать из построенной модели, не реализуются автоматически путем со- соответствующей вариации параметра Z или s (или обоих параметров). Модель B0) лишь указывает на необходимые изменения в поведении экономических агентов. Вопрос о том, как действительно обеспечить эти изменения, убедив участников рыночного процесса принять их, выходит за рамки рассматриваемой модели. Его решение связано с изучением еще более трудноформализуемых объектов. При исследова- исследовании подобных объектов широко применяются подходы, почерпнутые из естественнонаучной сферы, такие, как идея насыщения, переходы с микро- на макроуровень, использование «законов сохранения», пред- представления о стационарности и равновесности и др. 4. Макромодель экономического роста. В растущей экономи- экономике число работающих R(t) не постоянно, а увеличивается с течением времени. В простейшей модели считается, что темп прироста занятых работников пропорционален числу уже работающих: dR - = aR(t). Поэтому R(t) = Roeat — заранее известная функция времени (величи- (величина а задается, Rq = Д@) — число работающих в начальный момент t = 0). Работники производят национальный доход Y(i), который час- частично идет на потребление и частично на накопление: Y(t) = ш + А. B3) Накопленная часть продукта А возвращается в экономику с тем, чтобы скомпенсировать выбывающие из строя производственные мощ- мощности, а также для создания новых мощностей. Под мощностью M(t) подразумевается максимально возможный выпуск продукта экономи- экономикой. Реальный выпуск продукта зависит, естественно, от числа рабо- работающих и задается производственной функцией вида Y(t) = M(t)-f(x(t)). B4) В формуле B4) величина x(t) = R(t)/M(t) по своему смыслу — ко- количество работающих на единице мощности. Относительно функции f(x) делаются следующие предположения: /@) = 0, f > 0 (выпуск растет с увеличением числа занятых) и /" < 0 (насыщение). Функ-
168 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV ция f(x) определена для значений х на отрезке 0 ^ х ^ хм-> где хм — — Rm/M, a Rm($) — число рабочих мест в хозяйстве при мощности M(t). Если все места заполнены, то выпуск Y(t) по определению равен M(t), т. е. для f(x) должно выполняться условие /(жм) — 1- Одна из главных задач теории экономического роста — нахожде- нахождение оптимальных в некотором смысле способов разделения произведен- произведенного продукта на потребляемую и накапливаемую части. Критерием оптимальности можно выбрать, например, душевое потребление (ко- (количество продукта, потребляемого одним работающим), т. е. величину c(t)=w(t)/R(t). Сбереженный в единицу времени продукт A(t) расходуется на соз- создание новой мощности: A(t)=al(t), где а > 0 — считающееся заданным и постоянным количество фон- фондообразующего продукта, необходимое для создания единицы новой мощности, I(t) — число единиц новой мощности. Темп выбытия существующей мощности предполагается пропор- пропорциональным величине самой мощности, т. е. величине /3M(t), коэффи- коэффициент выбытия /3 > 0 задается постоянным. В итоге для изменения функции M(t) получаем балансное соотно- соотношение ^L=I(t)-CM(t). B5) Уравнения B3)-B5) содержат четыре неизвестных величины — Y(t), uj(t), M(t), l(t). Для замыкания модели предположим, что ско- скорость введения новой мощности пропорциональна величине уже су- существующей мощности: I(t) = jM(t), где j > 0 (величина, обратная характерному времени наращивания мощности) считается заданной и постоянной (естественно, j > /3). Тогда решение уравнения B5) легко находится: М(^) = Мое^-/3^, B6) а вместе с ним определяются и все остальные неизвестные величины. Проанализируем простой, но показательный случай экономическо- экономического роста, когда мощность увеличивается со временем в том же темпе, что и число работающих. Для этого, очевидно, необходимо, чтобы вы- выполнялось равенство 7 - C = а. B7) Оно означает также, что с тем же темпом растут функции Y(t) (по- (поскольку f{x(t)) = f(x = Ro/Mq) = const) и u(t), I(t). Найдем число работающих и соотношение между потреблением и накоплением, при которых душевое потребление работников макси- максимально. По определению 1 ' R(t) R(t) Учитывая, что Y(t) = M(t) f(x), A(t) = ajM(t), и принимая во вни-
§ 2] МОДЕЛИ ФИНАНСОВЫХ И ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 169 мание B6), B7), получаем c(t) = с = /(*)-«(<» + ?) ^ B8) т. е. душевое потребление со временем не изменяется. Его максимум, как очевидно из B8), достигается при условии dc d dx dx \_ x которое дает уравнение для искомой величины хш Xmf'(Xm) ~ f(xm) + CL (a + /3) = 0. B9) Это уравнение всегда имеет единственное решение 0 < хш ^ хм (упр. 9). Заметим, что помимо всех сделанных предположений, для реализации рассматриваемого режима экономического роста необхо- необходимо согласование численности работающих Rq с мощностью Mq в начальный момент времени так, чтобы Rq/Mq = хш. Норма накопления, обеспечивающая максимальное значение ст, находится из равенств Ym = Mmf(xm), Am = а^Мт и из B7), B9): Пт = 1-Хт^4, C0) и называется нормой золотого правила роста Солоу. Если условие B7) не выполнено, то режимы роста экономики ста- становятся более сложными, и оптимизация их характеристик проводится на всем рассматриваемом временном интервале. Напомним, что по- построенная модель и подобные ей модели не учитывают изменений в производственных отношениях (они считаются постоянными) и опе- оперируют в основном технологическими связями, давая, в частности, верхние технологические ограничения на темп экономического роста (упр. 11). При их получении также широко используются аналогии с естественнонаучными объектами. УПРАЖНЕНИЯ 1. Пусть параметры ац, No, p, s фиксированы. Найдите значение параметра Q2, при котором функция Pm(oL2) достигает минимального значения, и убедитесь, что в этом случае текущая прибыль P{t) максимальна в момент t = 0, т. е. на старте рекламной кампании. 2. Неравенство Рт > Q-is (зависящее от а\ > 0 нелинейным образом) является необходимым условием прибыльности рекламы. Считая параметры Q2, ATq, p, s фиксированными, найдите области значения параметра оц, в которых при росте а\ данное неравенство усиливается (ослабляется). 3. Считая, что эффект насыщения от рекламы происходит при N(t) « No, найдите из уравнения F) момент времени, когда продолжение кампании станет заведомо убыточным. 4. Убедитесь в справедливости неравенств A1). 5. Проверьте, используя формулы G), (9), A0), с помощью равенства A3), что для решения A4) выполнены свойство х'пт = —х'тп, условие 2) и критерий оптимальности X' = S.
170 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV 6. Покажите,что в соответствии с описанной процедурой начальная матрица долгов вида 0 +1 ... +1 ... +1 +1 -1 0 +1 -1 -1 -1 -1 +1 +1 +1 +1 -1 -1 -1 ... -1 где N четное, X = N (N — 1), принимает вид 0 0 ... 0 0 -1 0 0 0 +1 0 0 N-1 N -3 0 0 +1 -1 0 0 -(N-3) ... 0 0 0 0 0 -(N-1) причем X' = N2/2 = S < X. 7. Выражение AY = АА/A — с), где А А — изменение в уровне инвестиций, a AY — соответствующий прирост (убыль) выпуска продукта, называется соот- соотношением мультипликатора Кейнса. Получите его из модели B0). 8. Получите выражения для коэффициентов а{, г = 1,..., 4, в B2) и убедитесь в том, что все они положительны. 9. Докажите, используя свойства функции /(ж), существование единственного решения уравнения B9). 10. Используя рассуждения, применявшиеся при выводе C0), покажите, что для величины максимального душевого потребления ст справедливо равенство ст = f'(xm) (величина f'(xm) называется предельной производительностью тру- труда — это прирост выпуска продукта при увеличении занятости на единицу). 11. Покажите, что если весь произведенный продукт идет на накопление и мощности загружены полностью, то экономический рост реализуется с темпом {) i™\ 7m = l/a-p. § 3. Некоторые модели соперничества Построим модели различных видов соперничества — двухвидовой борьбы в популяциях, гонки вооружений, боевых действий. Покажем общность методологических подходов, применяемых при получении и анализе этих моделей.
§ 3] НЕКОТОРЫЕ МОДЕЛИ СОПЕРНИЧЕСТВА 171 1. Взаимоотношения в системе «хищник—жертва». Стро- Строго говоря, эти отношения (как и отношения в аналогичной системе «паразит—хозяин») не могут называться соперничеством. «Соперни- «Соперничество» жертвы с хищником выражается в изменении численности жертвы, которая в свою очередь сказывается на численности хищни- хищника. Действительно, никакой организм (тем более популяция) не живет изолированно, а взаимодействует со своим окружением. Широко рас- распространенный вид взаимодействия — использование одними живыми организмами (животными, птицами, рыбами, насекомыми) других ор- организмов в качестве пищи. Математическая модель наиболее простой, т. е. двухвидовой сис- системы «хищник—жертва» основывается на следующих предположени- предположениях: 1) численности популяций жертв N и хищников М зависят толь- только от времени (точечная модель, не учитывающая пространственное распределение популяции на занимаемой территории; ср. с моделью сообщества амеб в § 1); 2) в отсутствие взаимодействия численность видов изменяется по модели Мальтуса из п. 3 § 1 гл. I; при этом число жертв увеличивается, а число хищников падает, так как им в этом случае нечем питаться: ^=aN, = рм, а>0, C > 0; at at 3) естественная смертность жертвы и естественная рождаемость хищника считаются несущественными; 4) эффект насыщения численности обеих популяций не учитыва- учитывается; 5) скорость роста численности жертвы уменьшается пропорцио- пропорционально численности хищников, т. е. величине сМ, с > 0, а темп роста хищников увеличивается пропорционально численности жертвы, т. е. величине dN, d > 0. Объединяя предположения 1)-5), приходим к системе уравнений Лотки—Волътерра dN A) из которой по начальным численностям N@) = N(t = 0), М@) = = M(t = 0) определяется численность популяции в любой момент t > 0. Нелинейную систему A) удобно исследовать в плоскости перемен- переменных N, М, для чего первое уравнение поделим на второе: dN _ (а- сМ) N ~dM ~ (-р + dN)M' ^ '
172 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Уравнения A), B) имеют положение равновесия (или стационар- стационарное, не зависящее от времени решение) C) а р с ' ° d ' Зададимся вопросом об устойчивости положения равновесия C). Под этим подразумевается следующее. Если начальные численности в точности равны величинам C), то как с течением времени они изменя- изменяются? Если по каким-то причинам численности ненамного отклоняют- отклоняются от величин Mq , TVq , то вернется ли система в положение равновесия? Наконец, если начальные значения TV(O), M@) заметно отличаются от равновесных, то каким образом они меняются со временем относитель- относительно величин TVq, Mq? Чтобы понять временную динамику функций N(t), M(t), преоб- преобразуем уравнение B) к виду dN (-f3 + dN)M = dM (a - сМ) TV, поделим обе части получившегося равенства на величину N М и пере- перенесем все члены в левую часть: D) ние Уравнение D) нетрудно проинтегрировать и получить соотноше- C In TV - dN + a In M - сМ = const, N где константа в правой части определяется по начальным значени- значениям TV(O), M@). Другими словами, урав- уравнение B), или, что то же самое, система A) имеет интеграл вида In TV^ + In e~dN + In Ma + In e~cN = C. Потенцируя последнее выражение, получаем интеграл в виде TV^ e~dN = dM~a ecM, d > 0. E) Существование интеграла E) дает возможность ответить на поставленные вопросы (на рис. 56 изображены фазовые траектории системы A); стрелками показано направление движения по траекториям с течением времени): а) если TV(O) = TVq, М@) = Mq, to во все моменты времени чис- численности популяций не меняются; б) при малом отклонении от положения равновесия численности как хищника, так и жертвы с течением времени не возвращаются к равновесным значениям (при этом из модели A) получается стандарт- стандартное уравнение колебаний; см. п. 3 § 5 гл. I); в) если отклонение от положения равновесия велико, то поведение функций N(t), M(t) такое же, как в случае б). Рис. 56
§3] НЕКОТОРЫЕ МОДЕЛИ СОПЕРНИЧЕСТВА 173 kN(t),M(t) Рис. 57 Эти выводы означают, что численности популяций жертвы и хищ- хищника совершают периодические колебания вокруг положения равно- равновесия. Амплитуда колебаний и их пери- период определяются начальными значения- значениями численностей iV@), М@) (упр. 1, 2), они совершаются не в фазе: максималь- -No ному значению N(i) соответствует сред- среднее значение M(i), и наоборот (рис. 57). Колебания, сущность которых вполне м0 понятна (и они реально наблюдаются в природе) означают возникновение в двухвидовых популяционных системах о значительно более сложных процессов, чем в одновидовых системах (ср. с мо- моделью Мальтуса и логистической моделью в гл. I). Более точные математические описания двухвидовых взаимодей- взаимодействий учитывают неравномерность распределения численности попу- популяций на занимаемых территориях (им соответствуют системы урав- уравнений в частных производных), временное запаздывание между рож- рождением особей и их зрелостью и т. д. Возника- Возникают гораздо более сложные картины взаимодей- М i i ствия как по времени, так и в пространстве. Например, при учете насыщения для популя- популяции жертв в первом уравнении A) появляет- появляется соответствующий логистический член, и оно приобретает вид dN — = (а-сМ- aN) N. F) at Рис. 58 0 N В этом случае фазовые траектории имеют вид спиралей (рис. 58), сходящихся с течением времени к положению равновесия, а амплитуда колебаний уменьшает- уменьшается с течением времени (упр. 3). 2. Гонка вооружений между двумя странами. Предполага- Предполагается, что общее количество вооружений у каждой страны изменяется со временем в зависимости от трех факторов: количества оружия у противника, износа уже существующего вооружения и степени недове- недоверия между противниками. Темпы прироста и уменьшения вооружений пропорциональны указанным факторам, т. е. dt dM2 dt = «1 (t) M2 - А (*) Мг + 7i («), = а2 (*) Mi - C2 (*) М2 + 72 (t) ¦ G) В уравнениях G) M\{t) ^ 0, M2(t) ^0 — объемы вооружений, коэффи- коэффициенты ai(t) > 0, a2(t) > 0, (i\(t) > 0, /32(t) > 0 характеризуют ско- скорости наращивания и «старения» вооружений (аналог процесса амор- амортизации производственных мощностей в моделях экономики), функции
174 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Ji(t) ^ О, J2(t) ^ 0 описывают уровень взаимной настороженности (не- (недоверия) конкурентов, который считается не зависящим от количества вооружений, а определяется другими причинами. Модель G) не учитывает многие важные факторы, влияющие на динамику гонки вооружений, но, тем не менее, дает возможность про- проанализировать ряд существенных свойств этого процесса. Анализ наи- наиболее прост в частном случае, когда функции с^, #, 7ь * — 1, 2, не зависят от времени: (8) dt dt = a2Mx - /32M2 +72. Исследуем систему (8) в плоскости Mi, М2 с целью определить ка- качественное поведение функций Mi(t), M2{t) во времени. Уравнения (8) имеют положение равновесия dMi/dt = 0 и dM2/dt = 0. Равновесные значения Mj3, M® находятся, очевидно, из условий ахМ2 - и равны + 7i = 0, а2Мх - f32M2 + 72 = 0 2 +#271 Р1/З2- (9) Из (9) следует первый важный вывод: для того чтобы равновесие существовало при положительных значениях величин Mj3, M® (по своему смыслу функции Mi(t), M2(t) неотрицательны), долж- должно выполняться неравенство f31f32 A0) Смысл условия A0) прояс- проясняется из следующих рассуж- рассуждений. Пусть, например, пара- параметры «1, #i и /32 неизмен- неизменны, а параметр а2 увеличива- увеличивается. Это означает, что первая страна не меняет свою страте- стратегию в области вооружений, а вторая наращивает вооружения при неизменном темпе износа оружия (параметр C2). Тогда Рис- 59 при достаточно большой вели- величине а2 равновесие станет заведомо невозможным, а неравенство A0) обязательно нарушится. Заметим, что, если оба параметра 71 •> 72? ха- характеризующие взаимное недоверие, равны нулю, то положению рав- равновесия отвечает отсутствие вооружений у обеих сторон. Мл
§ 3] НЕКОТОРЫЕ МОДЕЛИ СОПЕРНИЧЕСТВА 175 Изучим теперь вопрос об устойчивости равновесия (9) при усло- условии A0). В этом случае интегральные кривые уравнения (8) в плоскос- плоскости Mi, M.2 имеют вид, изображенный на рис. 59. Штриховые прямые отвечают изоклинам нуля [М.2 — a^/Z^^i +72/^2) и бесконечности {М_2 = Pi/cxi Mi — 71/^1 )• Изоклина нуля имеет наклон, меньший, чем изоклина бесконечности (это следует из неравенства A0)). Сплошным линиям соответствуют интегральные кривые. Стрелками показано на- направление движения по интегральным кривым с течением времени. Функции Mi(t) и M2(t) при возрастании t стремятся к равновесным значениям. Таким образом, равновесие устойчиво: любое отклонение от него становится ничтожно малым по прошествии достаточно боль- большого промежутка времени (упр. 4, 5). Из построенной модели нетрудно определить некоторые харак- характеристики возможных поведений соперников при переходе от одного положения равновесия к другому. Пусть, например, темп наращива- наращивания вооружений в первой и второй странах изменяется на небольшую величину da (da = da\ = da^). При этом объем вооружений также из- изменяется, причем обе стороны желают, чтобы приращения dM® и dM® были равными и интересы обеих сторон не ущемлялись. Для величин dM®, dM® из (9) получаем ,лл) _ о^272 + Q^27i + Q^i72 + Qi&Ti , ам1 — ——- — aa, (Р1Р2 - olol) 2 ТТГЪ \о аа" \P\P2 ~ 0Ц0С2) Предположим для простоты, что настороженности (недоверия) партнеров равные G1 =72)- Тогда из равенства dM® = dM® получаем условие паритета сторон при небольшом изменении равновесия ах (ai + р2 ~ Pi) = 0L2 (а2 +Pi- у92), которое может быть положено в основу соответствующих договорен- договоренностей между странами, если известны величины ai, «2, /3i, /З2. Так, например, пусть «2 = crai, о > 0. В этом случае из предыдущего ра- равенства получаем а1A-а)=/31-/32. (И) При а < 1 (темп прироста вооружений у второй стороны меньше, чем у первой) для сохранения паритета необходимо /З2 < /3i, т. е. у второй стороны (в соответствии с формулой A1)) темп амортизации вооружений должен быть меньше. При противоположном неравенстве а > 1 имеем, естественно, обратное соотношение между скоростями амортизации. 3. Боевые действия двух армий. В противоборстве могут при- принимать участие как регулярные армии, так и партизанские соедине- соединения. Главной характеристикой соперников в рассматриваемых моделях являются численности сторон Ni(t) ^ 0 и Л^(?) ^ 0. Если в какой-то момент времени одна из численностей обращается в нуль, то данная
176 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV сторона считается потерпевшей поражение (притом, что в этот момент численность другой стороны положительна). В случае действий между регулярными частями динамика их чис- численности определяется тремя факторами: 1) скоростью уменьшения состава из-за причин, непосредственно не связанных с боевыми действиями (болезни, травмы, дезертирство); 2) темпом потерь, обусловленных боевыми действиями противо- противоборствующей стороны (которые в свою очередь определяются качест- качеством ее стратегии и тактики, уровнем морального духа и профессиона- профессионализмом бойцов, вооружениями и т. д.); 3) скоростью поступления подкреплений, которая считается неко- некоторой заданной функцией времени. При этих предположениях для Ni(i), А^(?) получаем систему уравнений ^ = at A2) ^ = -a2(t) N2 - &(*) N, + 72(t), из которой при заданных функциях а^, /%, 7ь * = 1,2, и начальных значениях JVi @), N2 @) однозначно определяется решение в любой мо- момент времени t > 0. В A2) коэффициенты ai^(t) ^ 0 характеризуют скорости потерь в силу обычных (не боевых) причин, j3i^{t) ^ 0 — тем- темпы потерь из-за действий соперника, 71,2 ^ 0 — скорости поступления подкреплений. Война между регулярными и партизанскими частями описывается другой моделью. Главное отличие в том, что нерегулярные соединения в сравнении с армейскими менее уязвимы, так как действуют скрытно, зачастую оставаясь невидимыми для соперника, вынужденного дейст- действовать неизбирательно, по площадям, занимаемым партизанами. Поэ- Поэтому считается, что темп потерь партизан, проводящих свои операции в разных местах на некоторой известной территории, пропорционален не только численности армейских соединений N1 (t), но и численности самих партизан А^(?), т. е. определяется членом вида /3i (i) N1 N2. В результате модель становится нелинейной: ^ = at A3) ^ = -a2(t) N2 - &(*) N,N2 + 72(t). В A3) все величины имеют тот же смысл, что и в A2). Изучим модели A2), A3) (модели Манчестера) в частном случае: 71 — 72 — 0 (стороны не получают подкреплений и как бы предоставлены самим себе); а\ = const, «2 = const; /3i = const, /З2 = const (последнее озна- означает, в частности, что у противников всегда найдется достаточное количество вооружений, которое может использоваться годными к не- несению службы бойцами).
§ 3] НЕКОТОРЫЕ МОДЕЛИ СОПЕРНИЧЕСТВА Модель A2) становится автономной и принимает вид dt dN2 dt -&лг2, = -a2N2-01N1. 177 A4) Из уравнений A4) видно, что в данном случае численности сторон с течением времени могут только убывать. Каков временной характер этого процесса и какая сторона потерпит поражение? Чтобы выяснить этот вопрос, введем еще одно упрощение (вполне оправданное для краткосрочных кампаний): положим а\ = а2 = 0. Другими словами, потери сторон определяются лишь действиями противника. Система A4) упрощается: dt и легко находится ее интеграл dN2 dt - C2Nl@) = С. A5) A6) С = 0 Из A6) однозначно определяется победитель (рис. 60). При С > > 0 побеждает первая армия, при С < 0 — вторая, в случае С = = 0 стороны уничтожают друг друга одновременно, и победите- победителя нет. Смысл этих результатов вполне ясен из вида константы в A6). Для победы важна не только численность сто- сторон в начале боевых дей- действий (iNTi(O), N2@)), но и их выучка, качество их во- вооружений и т. д. (т. е. ко- коэффициенты /3i, /32). Так, если С > 0, то из A6) сле- следует О о и для достижения побе- победы второй стороне сле- следует либо увеличить на- начальную численность, ли- либо улучшить качество боевых действий, либо то и другое одновремен- одновременно. Заметим, что эффект от увеличения коэффициента C2 меньше, чем от такого же увеличения числа Л^@), которое входит в последнее не- неравенство (так называемый квадратичный закон боевых действий) во второй степени. Дифференцируя первое из уравнений A5) и принимая во внимание второе, получаем уравнение для Ni(t) A7) dt2 12 А. А. Самарский, А. П. Михайлов
178 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Из A7) с учетом начальных условий Ni(t = 0) = iVi(O) и dNi/dt(t = = 0) = —/32^2@) находим численность первой армии как функцию вре- времени: N1(t)=N1(O)diy/frfot-N2(O)y/fo/fc8by/frfot, A8) зная которую, нетрудно найти и функцию А^(?) (упр. 7). Рассмотрим теперь действия регулярной армии против партизан в тех же упрощающих предположениях, что и в предыдущем случае. Модель A3) приобретает вид dt dN2 dt A9) Численности сторон, как и прежде, убывают со временем, но по другому закону. Умножим первое уравнение A9) на /3iiVi, второе — на /?2 и вычтем второе получившееся уравнение из первого. В итоге придем к уравнению = о, имеющему интеграл Ц N?(t) - /32N2(t) = Ц N?@) - C2N2@) = B0) Изучим фазовые траектории системы A9) с помощью интеграла B0). Из рис. 61. видно, что при С\ > 0 побеждает армия, при С\ < 0 — лг2а <о = о партизаны, а при С\ — 0 победителя нет. Так же, как и при действии регулярных частей, победа обеспечивается не только начальной чис- численностью, но и боевой выучкой и качеством оружия. Пусть, например, d > 0, т. е. B1)
§ 3] НЕКОТОРЫЕ МОДЕЛИ СОПЕРНИЧЕСТВА 179 Тогда партизанам необходимо обеспечить увеличение коэффициента /?2 и повысить свою начальную численность N2@) на соответствую- соответствующую величину, иначе они обречены на поражение. Причем это увели- увеличение с ростом величины iVi(O) должно расти не линейно, а пропор- пропорционально второй степени iVi(O) (параболический закон боевых дейст- действий). Можно сказать, что в некотором смысле регулярные соединения находятся в более выгодном положении, поскольку неравенство B1) для них достигается при меньшем росте начальной численности, чем противоположное B1) неравенство для численности партизан. Поведение функций Ni(i), А^(?) во времени находится из A9) с использованием интеграла B0). Так, для Ni(i) имеем что эквивалентно уравнению = dt. B2) Интегрируя B2), нетрудно найти Ni(i) и затем А^(?) как неявные функции времени (упр. 7). В заключение отметим, что рассмотренные здесь простейшие мо- модели соперничества соответствуют системам обыкновенных диффе- дифференциальных уравнений второго порядка (в общем случае неавтоном- неавтономных и нелинейных), широко распространенным при описании многих естественнонаучных объектов. Это закономерно, так как использован- использованные при построении подходы (насыщение, пропорциональность темпов роста величины значению этой величины и др.) аналогичны подходам, применяемым в механике, физике, химии. УПРАЖНЕНИЯ 1. Покажите, линеаризуя систему A) в окрестности равновесия C), что соот- соответствующая ему особая точка является центром. 2. Вычислите период колебаний в системе «хищник—жертва» в зависимости от ее характеристик (а, /3, с, d) и начального состояния. 3. Убедитесь, линеаризуя систему уравнений, состоящую из уравнения F) и второго уравнения A), в том, что для нее точка равновесия — устойчивый фокус. 4. Покажите, что точка равновесия (9) — устойчивый узел. 5. Получите оценку для времени прихода системы (8) в равновесие с точнос- точностью до 1% в зависимости от ее характеристик и величины начального отклонения. 6. Установите характер кривизны фазовых траекторий на рис. 60. 7. Найдите функцию A/(t), используя либо уравнение A5), либо интеграл A6), и сравните ее с функцией N\(t) из A8). Убедитесь в том, что выводы, сделан- сделанные на основе анализа интеграла A6), правильны (т. е. что при С > 0 побеждает первая сторона, при С < 0 — вторая). 8. Найдите решение уравнения B2) и определите момент, когда функция N\(t) обращается в нуль (при этом, естественно, С\ < 0). Установите характер кривизны фазовых траекторий на рис. 61. 12*
180 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV § 4. Динамика распределения власти в иерархии Построим и изучим макромодель, описывающую некоторые клю- ключевые взаимодействия в системе «государственная власть—граждан- власть—гражданское общество». Рассмотрим влияние реакции гражданского общества и других характеристик системы на динамику распределения власти внутри иерархии, а также некоторые свойства этих распределений. 1. Общая постановка задачи и терминология. Изучение структур власти — одна из главных задач наук об обществе, преж- прежде всего политологии. Понятие «власть» таинственно, многозначно, с трудом поддается формализации и количественному измерению. Ес- Естественно поэтому, что математические модели политологии носят в основном описательный, феноменологический характер и применяют- применяются к относительно узкому кругу проблем мониторинга: статистическая обработка электоральных ожиданий и результатов выборов, определе- определение рейтингов различных политических сил, прогнозы грядущих пар- парламентских голосований на основе уже состоявшихся и т. д. Построение математических моделей общей политологии разумно начинать с изучения именно государственных иерархий как обладаю- обладающих властью на официальных, т. е. легко формализуемых основаниях. В этом состоит важное отличие государственной власти от власти не- независимых средств массовой информации (СМИ), интеллектуальных и нравственных авторитетов и других видов власти. Под иерархией, или иератической структурой, понимается упоря- упорядоченная по старшинству совокупность институтов (инстанций, долж- должностей, постов, чинов и т. п.), наделенных властными полномочиями от имени государства (т. е. по Конституции, законам, уставам, поста- постановлениям, правилам, инструкциям и т. п.). Имеются в виду не только общегосударственные учреждения, на- например, федеральные министерства, но также межрегиональные, ре- региональные и местные органы, официально имеющие соответствую- соответствующую власть. Слово «иерархическая» подчеркивает, что внутри струк- структуры заранее и четко определен порядок подчиненности. Каждое ее звено (кроме высшего) имеет старшие, «приказывающие» инстанции и (за исключением низшего звена) младшие инстанции, выполняю- выполняющие «приказы», исходящие как от данной инстанции, так и от дру- других старших звеньев. Разумеется, приказы идут только от старших к младшим. Гражданское общество — это часть общества, непосредственно не обладающая государственной властью. К нему относятся гражда- граждане (в том числе государственные чиновники, действующие вне рамок своих служебных обязанностей) и различные их объединения (поли- (политические, культурные, профессиональные), семьи и частные предпри- предприятия и т. д. Очевидно, что члены гражданского общества не могут «приказывать» от имени государства ни друг другу, ни каким-либо звеньям властной структуры. Например, негосударственная корпора- корпорация, какой бы крупной она ни была, не вправе официально принуждать кого бы то ни было к тому или иному поведению. В то же время любая инстанция имеет такую возможность по отношению к определенной
§ 4] ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 181 части гражданского общества, а некоторые — по отношению ко все- всему обществу. Заметим, что одно и то же «физическое лицо» может одновременно как принадлежать ко властной структуре, так и быть членом гражданского общества. Реакция общества — ответ (положительный, отрицательный или безразличный) гражданского общества на действия того или иного ин- института власти (с помощью выборов, референдумов, плебисцитов, че- через СМИ, опросы общественного мнения, митинги, забастовкии т. д.). В модель вводится также понятие «реакция иерархии», смысл ко- которого, как и смысл термина «распределение власти» и другие терми- терминологические уточнения, разъясняется ниже. В о nolt.U Диктатура О i,t) Иерархическая структура 7Z * Анархия "¦" -|- 0 1 % - 1 % г + 1 N -1 N Высшие инстанции Низшие инстанции Конституция, ^ - 1 общество законы, -* Гражданское уставы и т. д. Рис. 62 Иерархическая структура состоит из N + 1 инстанции (рис. 62), каждой из них приписан номер ъ @ ^ ъ ^ N). Высшая инстанция име- имеет номер 0, низшая — номер N. Стрелка 4 обозначает направление подчиненности в структуре «сверху вниз» (или «слева направо»), т. е. направление движения властных распоряжений (приказов), передавае- передаваемых по иерархической лестнице. Конечно же, для любой конкретной и достаточно протяженной иерархической структуры (тем более в масштабах государства, пусть небольшого) определить расположение всех составляющих ее инстан- инстанций в порядке подчиненности — очень сложная и трудоемкая задача. В том числе и потому, что властные органы имеют в реальности «дре-
182 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV весное» строение, могут принадлежать разным ведомствам, быть как персонифицированными, так и коллегиальными и т. д. Понятие «под- «подчиненность» имеет поэтому условный осредненный смысл. Однако для построения математической модели и анализа фун- фундаментальных свойств властных структур достаточно того, что эта задача может быть решена в принципе, впрочем, на основе некоторых количественных критериев. Для прояснения этого вопроса необходимо уточнить различные понимания слова власть. Оно часто употребляется в смысле органы власти (Верховный Суд, городская дума, местное отделение милициии т. п.). Равноценной заменой данного понятия служат термины «инстанции», «иерархичес- «иерархическая структура», «иерархия». Другое важное значение этого слова описывается термином властные полномочия. Считается, что властные полномочия любой инстанции могут быть, вообще говоря, определены с помощью неко- некоторого совокупного количественного критерия, включающего в себя номинальное (формальное) положение инстанции в структуре, объ- объем находящихся в ее распоряжении людских, финансовых, материаль- материальных, информационных, интеллектуальных, законодательных, распоря- распорядительных и иных видов ресурсов, размер и местоположение контро- контролируемой территории, престижность в глазах общественного мнения и экспертов и т. д. В указанном понимании слово «власть» означает воз- возможный уровень (степень, силу) влияния данного властного института на поведение других инстанций и на жизнь гражданского общества. Инстанции, имеющей большие властные полномочия, отводится, ес- естественно, более высокое место (меньший номер) в иерархии по срав- сравнению с инстанцией, имеющей меньшие полномочия. При этом для рассмотрения общих вопросов нет необходимости вводить какие-либо абсолютные единицы измерения власти; достаточно принять власт- властные полномочия высшей инстанции за единицу (или за 100%), тогда полномочия любой другой инстанции будут выражаться в долях (или процентах) по отношению к высшему институту. Дальнейшее уточнение термина «властные полномочия» связано с понятиями максимальные полномочия и минимальные полномочия. Первое описывает те действия, которые орган власти может выпол- выполнить максимально в некоторой ситуации в соответствии с законода- законодательством. Например, губернатор имеет право, при известных обстоя- обстоятельствах, объявить чрезвычайное положение на контролируемой им территории, но никак не правомочен решать вопросы войны и мира. Минимальные полномочия описывают действия, которые власть обяза- обязана предпринимать всегда (Президент обязан представлять ежегодное бюджетное послание в Конгресс). Оба эти понятия хорошо иллюстри- иллюстрируются, например, статьями Уголовного кодекса, определяющими за один и тот же вид преступления максимальные и минимальные сро- сроки наказания. Другими словами, максимальные и минимальные пол- полномочия дают законные верхние и нижние границы власти каждой инстанции. Заметим, что границы власти могут, как известно из практики многих государств, определяться не только законодательством, но так-
§ 4] ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 183 же традициями и системой прецедентов. Однако для краткости всюду дальше речь будет идти о законодательно установленных полномочи- полномочиях. В математической модели максимальные властные полномочия за- задаются некоторой положительной функцией p2(i,i), 0 ^ ъ ^ N (кру- (кружочки на рис. 62), монотонно убывающей с ростом номера г, т. е. в любой момент времени t справедливо р2(г + 1,?) < P2(i,t) < p2(i — — 1, ?), 1 ^ i ^ N — 1. Минимальные полномочия задаются положи- положительной функцией pi(i,i), 0 ^ г ^ N (крестики на рис. 62), также монотонно убывающей с ростом г, т. е. pi(i + l,i) < pi(i,i) < pi(i — - 1,?), 1 ^ г ^ TV - 1 (разумеется, всегда р\ (г, t) < p2(i,t), 0 ^ i ^ N). Обе функции, вообще говоря, зависят от времени ?, поскольку со вре- временем могут изменяться законодательство, территориальное деление и т. п. Чисто умозрительные ситуации, когда в законодательстве запи- записано «власть может делать все» или «власть не обязана делать что- либо», естественно, не рассматриваются, т. е. границы власти (хотя бы формально) всегда определены, и вместе с ними определены функ- функции pi, p2. Подчеркнем еще раз: для рассматриваемой таким образом (в агре- агрегированной обобщенной манере) иерархической структуры положение любой инстанции определяется не только ее номинальным местом, но и всеми относящимися к делу (и зачастую более весомыми) факторами. Таким образом, номер инстанции, отвечающий некоторому «среднему чиновнику» из властного древа, не формальная координата, а коор- координата «по существу». Приведенным выше рассуждениям о властных полномочиях и о способе расстановки инстанций в порядке «подчинен- «подчиненности» нетрудно придать более подробную и строгую математичес- математическую форму (микроописание), однако для изучения принципиальных свойств системы «власть—общество» это не имеет решающего значе- значения. Наконец, еще одно используемое в модели понимание слова «власть» связано с фактически осуществляемым в данный момент данной инстанцией уровнем властного влияния (или величиной влас- власти). Действительно, властные полномочия определяют лишь верхние и нижние законные границы уровня или величины власти (в этом смысле можно понимать известное выражение «объем властных пол- полномочий»). Эти границы, вообще говоря, достигаются не всегда и не всюду. Пусть, например, по некоторой статье Уголовного кодекса, пре- предусматривающей от трех до пяти лет лишения свободы, суды за неко- некоторое время вынесли достаточно много приговоров со средним сроком четыре года. Тогда реализованная ими по данной статье власть соста- составила 80% от их максимальных и 133% от их минимальных полномочий. В математической модели фактически достигаемой власти отве- отвечает неотрицательная функция p(i,t), 0 ^ г ^ N, зависящая от «про- «пространственной» координаты г и времени t (звездочки на рис. 62). Если для каких-то значений г, t выполняется p(i,t) > p2(i,t) (или p(i,i) < < Pi(i,t)), то естественно говорить о «выходе» власти за рамки пол- полномочий, или о превышении (принижении) власти.
184 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Принципиальная разница между функциями pi(i,t), p2(i,i) и функцией p(i,i) состоит в том, что, в отличие от известных, за- заданных (пусть и в самом общем виде) властных полномочий pi(i,i), P2(i,t), функция p(i,i) — неизвестная, искомая величина, описы- описывающая текущее распределение власти в иерархической структу- структуре. Построение соответствующей математической модели и изучение пространственно-временной динамики именно для функции p(i, t) (рас- (распределения власти) в зависимости от всех факторов, присутствующих в изучаемой системе, приводится ниже. Заметим, что понятие реальное распределение власти означает введение в модель следующего предположения 1: все партнеры в системе «власть—общество?» законопослушны: законы соблюдаются, налоги платятся, приказы выполняются (в противном случае функцияp(i,i) — величина власти — становится весьма неопределенной или вовсе теряет смысл). Такой подход «от простого к сложному», т. е. построение модели для сильно идеализированной ситуации и дальнейшее ее усовершенст- усовершенствование, является типичным (а зачастую и единственно возможным) при математическом моделировании сложных объектов. Приведем общее описание взаимодействий в системе «власть— общество». Оно состоит в следующем: а) гражданское общество непосредственно или через своих пред- представителей принимает (дополняет, изменяет) Конституцию (стрелка 1 на рис. 62). Оно, таким образом, выступает как источник (заказчик, хозяин) власти для иерархической структуры, взаимодействуя с нею с учетом существующего законодательства; б) иерархическая структура существует не сама по себе, а как «от- «открытая» система, взаимодействующая с Конституцией и гражданским обществом. Конституция (в широком понимании, включающем зако- законы, уставы и т. д.) служит для иерархии своеобразным резервуаром, из которого ее звенья по мере необходимости могут либо черпать до- дополнительные «порции» власти (стрелка 2), либо возвращать обратно ее избыточные «доли» (стрелка 3). Таким образом, между иерархией и Конституцией осуществляет- осуществляется как бы «обмен властью» и, в неявном виде, как бы обмен властью («свободой») между иерархией и гражданским обществом — учреди- учредителем Конституции; в) внутри самой иерархической структуры происходит перерас- перераспределение текущей власти между составляющими ее инстанциями (стрелка 4) в соответствии с принятыми в иерархии механизмами передачи властных распоряжений; г) по отношению к гражданскому обществу властные структуры выступают как запрещающие (стрелка 5) или разрешающие (стрел- (стрелка 6) институты, вводящие и отменяющие те или иные ужесточения или послабления (типичный пример — ежегодный призыв в армию и демобилизация, когда одна часть населения начинает нести дополни- дополнительную повинность, а другая от нее освобождается). Один из ключевых вопросов для описания взаимодействия в систе- системе «иерархия—общество» — определение «величины» обмена властью
§ 4] ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 185 между иерархической структурой и Конституцией (и, опосредован- опосредованно, в итоге между иерархией и обществом). Вводится следующее предположение 2: знак и величина обмена властью между иерархической структу- структурой и Конституцией определются реакцией системы. Под реакцией системы подразумевается суммарная реакция обо- обоих партнеров (иерархии и общества) на текущее распределение влас- власти p(i,i) в структуре. Например, применительно к реакции общества имеется в виду, что если в данный момент времени оно выражает свое отрицание тех или иных действий данного звена иерархии (сопротив- (сопротивление), то это побуждает инстанцию уменьшить осуществляемую ею власть, как бы отложив про запас некоторое ее «количество» в консти- конституционный резервуар (и уменьшить или вовсе избежать соответству- соответствующих отрицательных, с точки зрения общества, последствий). Под- Подходящий пример — требования смягчить те или иные виды налогов. Положительная же реакция общества (т. е. его поддержка) побуждает инстанцию увеличить уровень реализуемой ею власти, взяв необходи- необходимые «ресурсы» из законодательства (пример — требования усилить борьбу с преступностью). Качественный характер реакции общества связывается с доминирующим в нем типом сознания (правовое, анар- анархическое, авторитарное, смешанное). В рассматриваемой модели реакция общества описывается неко- некоторой задаваемой функцией Fs(iJtJpJpiJp2)J зависящей, вообще гово- говоря, от всех введенных ранее величин: номера инстанции г; времени t; уровня власти, осуществляемой инстанцией р{г, t); властных полномо- полномочий pi(i,t), p2(i,t). Это дает возможность достаточно полно и точно отразить структурированное и меняющееся во времени отношение об- общества к иерархии. Например, если для всех мыслимых значений сво- своих аргументов, т. е. в любой ситуации имеем Fs < 0 (Fs > 0), то в обществе, очевидно, преобладает анархическое (тоталитарное) созна- сознание. Реакция общества представляется величиной, вполне наблюдае- наблюдаемой и измеряемой, и служит основной его поведенческой характеристи- характеристикой в некотором осредненном по всем элементам гражданского общест- общества смысле. При этом подразумевается, что реакция выражена вовремя, верно истолкована инстанцией и учтена ею в своей деятельности. Аналогичным образом в модель вводится одна из поведенческих характеристик властной структуры — реакция иерархии. Это поня- понятие характеризует стремление звеньев иерархии повысить или пони- понизить уровень власти, реализуемый ими в данный момент времени. Ей отвечает задаваемая функция Fu(i, t,P,Pi,P2), зависящая от тех же ар- аргументов, что и Fs, и имеющая тот же смысл, но уже применительно к иерархии (ее можно назвать степенью «властолюбия?» инстанций). В дальнейшем для простоты будем считать Fh = 0, т. е. иерархии безразличен уровень осуществляемой ею власти, и реакция системы F = Fs + Fh определяется лишь «гражданской» компонентой. Данное упрощение не меняет чисто математических свойств модели, посколь- поскольку функции Fs, Fhj F зависят от одних и тех же аргументов. Однако при интерпретации результатов, разумеется, необходимо учитывать роль каждой составляющей Fs, Fh в суммарной реакции F.
186 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV В приведенном общем описании система «власть—общество» предстает как замкнутый самосогласованный и самоорганизующийся объект с различными прямыми и обратными связями. Уровень власти, осуществляемой любой инстанцией иерархии в любой момент време- времени, отнюдь не произволен, а является результатом системного взаимо- взаимодействия всех компонент объекта: идущих по иерархической лестнице властных распоряжений, реакции общества, действующего законода- законодательства, начального состояния системы и т. д. Для получения на ос- основе этой общей схемы математической модели рассмотрим подробнее собственно властную структуру. 2. Механизмы перераспределения власти внутри иерар- иерархической структуры. Внутри иерархии любая инстанция принима- принимает к исполнению какие-то властные распоряжения, идущие от стар- старших звеньев, и в свою очередь передает какие-то приказы млад- младшим звеньям. При этом происходит некоторое перераспределение власти между ступенями иерархии (напомним, что речь идет не о властных полномочиях, а о реально осуществляемом, текущем уровне власти — величине p(i,t)). Вводится основной поведенческий постулат: в иерархии власть может передаваться только от инстанций с большей текущей властью к инстанциям с меньшей текущей влас- властью (причем скорость передачи тем больше, чем больше разница между значениями текущей власти в инстанциях). Рассматриваются два главных механизма, ответственных за пе- перераспределение власти внутри иерархии. а) Близко действие. Условно говоря, этот механизм можно назвать передачей власти по команде, когда начальник отдает властное рас- распоряжение ближайшим подчиненным, которые также взаимодейству- взаимодействуют только со своими непосредственными подчиненными. Данный ме- механизм соответствует хорошо известной бюрократической процедуре (слово «бюрократический» и все другие понятия употребляются без каких-либо эмоциональных оттенков — как рабочий термин). Пусть г-я инстанция передала (г + 1)-й инстанции некий приказ (например, поручила подготовить проект годового отчета о финансо- финансовой деятельности одного из подведомственных учреждений). Что про- произошло в таком элементарном акте взаимодействия между соседями по иерархии? Вместе с приказом подчиненный получил некоторую (пусть небольшую и пусть временно) порцию власти, дополнительную к тому уровню власти, который он реально занимал (например, имея приказ, он в большей степени, чем раньше, изучает финансовые документы). С другой стороны, г-я инстанция утратила некоторую часть от своей текущей власти, переложив контроль за данным участком работы на (г + 1)-е звено. Совокупность передаваемых распоряжений формирует своего рода поток власти, идущей от г-й к (г + 1)-й инстанции. Определим поток власти W(i,t) как количество власти, полученное в единицу времени (г + 1)-й ступенью от г-й ступени. В соответствии с постулатом величина W(i,t) положительна при p(i,t) > p(i + 1,?), отрицательна при p(i,t) < p(i + 1,?) и равна нулю
§ 4] ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 187 при p(i, t) = р(ъ + I, t). Рассматривается весьма общее выражение для W(i,t): W(i, t) = -x\p(i, t) -p(i + 1, t),p(i, t),p(i + l,t),i,i + l,t]x x\p(i + l,t)-p(i,t)], A) где функция к положительна при всех значениях аргументов, от кото- которых она зависит. Формула A) — конкретизация постулата применительно к рас- рассматриваемому механизму близкодействия. Положительность функ- функции к обеспечивает нужный знак величины W(i,i). В частности, если в какой-то момент времени t оказывается, что р(г + 1,?) > p(i,i), т. е. младшая инстанция имеет власть, большую, чем старшая, то поток власти автоматически «срабатывает» в сторону уменьшения разни- разницы p(i,i) — р(г + 1,?), способствуя преодолению этой «ненормальной» ситуации (свидетельствующей о неблагополучии в данных звеньях иерархии). Поток власти растет с ростом разницы p(i,i) — р(г + 1,?), что соответствует второй части постулата (для этого требуется нало- наложить соответствующее ограничение на к как функцию от р{г, t) — p(i + + 1, t)). Это означает, в частности, что начальник (при прочих равных условиях) дает тем больше поручений подчиненному, чем меньше тот в данный момент времени загружен работой. Общность выражения A) в том, что для потока власти преду- предусмотрена, помимо зависимости от разницы p(i,t) — p(i + 1,?), также зависимость от всех введенных ранее величин: значений искомой функ- функции р(г + 1,?), p(ijt); координат г, г + 1; времени t. Зависимость от t и г, г + 1 означает также неявную зависимость от заданных властных полномочий pi, P2 и реакции общества F (впрочем, эту зависимость нетрудно ввести и явным образом). Общность заключается также и в том, что на все эти зависимости не накладывается никаких сущест- существенных ограничений, кроме требования, чтобы при р(ъ + 1,?) = p(i,t) выполнялось W(i,t) = 0. Заметим, однако, что по формуле A) поток власти определяется только величинами, относящимися к непосредст- непосредственно взаимодействующим (в данном случае соседним) инстанциям. Функция к имеет определенный бюрократический смысл, описы- описывая свойства властной «среды», некоторые аспекты взаимоотношений внутри иерархии. Пусть, к примеру, поток власти W(i,i) и величи- величина p(i,i) фиксированы, а х = xq = const, т. е. функция к не зависит от времени и других величин. Тогда по формуле A) получаем, что с возрастанием н$ разница р(ъ + 1, t) — p(i, t) как абсолютно, так и отно- относительно уменьшается. Можно сказать, что с ростом н$ уменьшается «ответственностью старшей инстанции, которая все более терпимо относится к выравниванию своей власти с властью младшего партне- партнера. С уменьшением величины xq ситуация, естественно, обратная. б) Дальнодействие. Образное описание этого механизма может быть дано известным выражением «команда через головую. Это озна- означает, что г-я инстанция отдает властные распоряжения звеньям с дале- далекими номерами, минуя ближайших подчиненных. К такого рода дейст- действиям можно отнести, например, распоряжение о переходе вооруженных сил на летнюю форму одежды, для реализации которого фактически
188 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV не требуется процедура передачи по команде, достаточно опублико- опубликовать соответствующий приказ для сведения (и исполнения) сразу всех военнослужащих. Образующийся благодаря механизму дальнодействия поток влас- власти (смысл тот же, что и в случае а)), получаемый (г + 1)-й инстанцией от j-ro звена (или отдаваемый вниз), может быть выражен достаточно общей формулой V(i + l,j,t) = xW + М),КМ),г + l,j,t) • \p(j,t) -p(i + 1,*)], B) где функция х ^ 0 в согласии с постулатом. По своему смыслу пове- поведенческая характеристика х близка к функции х, но, во-первых, ею описывается взаимодействие не соседних, а удаленных друг от друга инстанций, т. е. j / i + 2, г; во-вторых, величина х может обращать- обращаться в нуль, т. е. предусмотрена возможность отсутствия команд через голову между какими-либо ступенями иерархии. Так же, как и функция х, она зависит только от величин, отно- относящихся к непосредственно взаимодействующим звеньям. Эти зависи- зависимости априори не подвергаются каким-либо ограничениям (требуется только, чтобы V(i + l,j,t) = 0 при р(г + l,t) = p(j,t)) и могут быть дополнены явной зависимостью от других введенных ранее величин. Подчеркнем еще раз, что оба рассмотренных механизма представ- представляют собой усреднение, агрегирование детального микроописания вза- взаимодействий внутри иерархической структуры, имеющей, конечно же, не простую конфигурацию цепочки, а скорее топологию большого ко- количества деревьев со взаимопересекающимися кронами. Сделаем еще одно важное разъяснение. В механизмах а) и б) власт- властные распоряжения, передаваемые от г-й (j-й) к (г + 1)-й инстанции, в нормальной ситуации (т. е. при p(i,t) > р(ъ + 1,?) или p(j,t) > р(г + + 1,?), j < г) несут с собой, согласно постулату и его конкретиза- циям A), B), некоторую положительную порцию власти для (г + 1)-й инстанции. Если же имеет место уже упоминавшийся ненормальный случай, когда р(г, t) < р(ъ + 1, t) или p(j, t) < р(ъ + 1, t), j < г, то по пос- постулату некоторая доля власти переходит уже от младшего к старшему звену. Это предположение естественно и отвечает сути иерархической структуры (если, конечно, конкретный начальник не заблуждается от- относительно реального уровня своей власти по сравнению с реальной властью подчиненного). В то же время постулат, описывая ситуацию «младший не может получить порцию власти от старшего, если тот в данный момент име- имеет меньшую (или равную) реальную власть», не описывает, казалось бы, возможную ситуацию, когда «старший имеет власть, большую, чем младший, но вдобавок еще и отбирает у младшего часть его влас- власти» (это противоречило бы постулату). Рассмотрим эту последнюю ситуацию более подробно, чтобы убе- убедиться, что в точной, правильной интерпретации она фактически не- реализуема (по крайней мере, в некотором «среднем» смысле). Действительно, отобрав часть власти у кого-либо из своих подчи- подчиненных (например, отозвав некоторое поручение), начальник рано или
§ 4] ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 189 поздно все равно «спустит вниз» это поручение в виде какого-либо при- приказа, но, быть может, другими путями. Ибо в любой иерархии никакая инстанция не способна взять на себя непосредственную реализацию за- заметной доли поручений, с необходимостью выполняемых даже малой частью подчиненных ей звеньев (имеется в виду достаточно протяжен- протяженная иерархическая структура). С другой стороны, дело в итоге должно быть сделано, и приказ, а с ним и порция власти, будут так или иначе переданы младшим. Таким образом, введенный постулат естествен и обоснован хотя бы «в среднем». Иное дело — более конкретные взаимоотношения между звенья- звеньями иерархии, внешне похожие на обсужденную выше ситуацию. Они могут быть описаны определенными ранее функциями. Пусть, напри- например, в условной паре «начальник—заместители начальника» первый по каким-либо причинам не удовлетворен работой одного из своих за- заместителей. Старший может, например, предпринять следующие дей- действия: 1) сместить «физическое лицо», заменив его более подходящей фи- фигурой; 2) направить поток властных распоряжений через других замес- заместителей. В этих двух случаях в иерархии в целом и в отвечающей ей модели фактически не меняется ничего, кроме персон. В частности, инстанция «заместители» как целое получает тот же поток власти. В распоряжении начальника могут иметься и такие способы: 3) усилить роль команд через голову данного заместителя; 4) изменить его властные полномочия; 5) упразднить данную должность. Случай 3) отвечает уменьшению величины к и увеличению х, в случае 4) соответствующим образом изменяются функции р\ и р2, в случае 5) уменьшается число звеньев N в иерархии. Разумеется, могут быть реализованы и различные комбинации этих действий (в том чис- числе и по отношению ко всей инстанции «заместители»). Если же началь- начальник, наоборот, весьма удовлетворен каким-либо заместителем, то его действия будут, естественно, противоположными. Все эти изменения не затрагивают существа постулата и описываются с помощью изме- изменения введенных выше функций pi, P25 K-> X-> F. Соответствующая фор- формализация должна, конечно же, проводиться тщательно и аккуратно. 3. Баланс власти в инстанции, условия на ее границах и переход к непрерывной модели. Теперь, когда введены основ- основные модельные понятия, описаны взаимосвязи и предположения, можно сделать последний шаг в построении модели и ответить на вопрос: как найти распределение власти в иерархии, т. е. функцию p(i, i)? Для лю- любого г-го звена властной структуры в любой момент времени t она подчиняется уравнению, при выводе которого используется своего ро- рода локальный закон сохранения власти: скорость изменения (уменьшения или увеличения) величины влас- власти инстанции определяется потоками власти и реакцией системы. Подсчитаем, какое количество власти получает (теряет) г-я ин- инстанция за промежуток времени At между моментами t и t + At. Это
190 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV количество формируется: а) потоком власти, получаемым от (г — 1)-й ступени по механизму A), т. е. величиной б) потоком, отдаваемым в (г + 1)-е звено по аналогичному меха- механизму, Ap+ = -W(i,t)At; в) суммой потоков, получаемых и отдаваемых по механизму B) от удаленных инстанций (j ф г + 1, г — 1), N 3=0 г) скоростью обмена властью между инстанцией и законодатель- законодательством, которая определяется по предположению 2 реакцией гражданс- гражданского общества, ApF — F(i, t,p(i, ?),pi(i, ?),p2(i, t)) At. Складывая величины Ар_, Ар+, Ap^, Api?, получаем суммарное изменение Ap = p(i,t + At) -p(i,t) = TV Л _ w(i,t) + У^ V(h ht) + F(ht,...) At. C) j=o При выводе уравнения баланса C) промежуток времени At пред- предполагается, как обычно, достаточно малым, так чтобы величины W, V, F можно было считать постоянными. Используется также (и это существенно) предположение 1 о законопослушности, означающее, в частности, что в любом звене иерархии властное распоряжение всегда выполняется и поступившая с ним порция власти на деле реализуется (а не исчезает бесследно). Напомним, что введенный выше иерархичес- иерархический постулат уже нашел свое математическое воплощение в формулах A), B). Разделив обе части C) на At, получаем уравнение для скорости изменения власти г-й инстанции со временем N ш з=о Смысл D) ясен из рассуждений, предшествовавших выводу баланса C). Уравнения C), D) записаны для произвольного номера 0 < г < N. Для записи баланса в точке г = 0 необходимо определить величину W(—l,t) потока власти, получаемой самой старшей инстанцией (с но- номером 0) от несуществующей вышестоящей инстанции. Очевидно, что
§ 4] ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 191 этот поток всегда равен нулю (высшей инстанции никто не может при- приказать). Аналогично, величина W(N, t) — поток власти, передаваемый самой младшей ступенью иерархии в несуществующую нижестоящую ступень, также равен нулю (приказывать некому). Итак, поток власти на границах иерархии всегда равен нулю: W(-l,t) = W(N,t) =0. E) Если рассматривается лишь часть иерархии, не включающая выс- высшие и (или) низшие инстанции, то, очевидно, на границах должны за- задаваться (из тех или иных соображений) потоки власти как функции времени. Для замыкания уравнения D) необходимо, помимо условий E), задать также распределение власти в некоторый начальный момент времени t = to, т. е. функцию p(i,to)=po(i) ^0, O^i^N. F) Уравнение D) с условиями E), F) и заданными функциями х, х, F? Pi •> Р2 представляет собой замкнутую дискретную модель распре- распределения власти в системе «иерархическая структура—гражданское общество», математически реализующую общую схему, принятую в п. 1. Она позволяет для любых моментов времени t > to и любых то- точек 0 ^ ъ ^ N найти решение (распределение власти в иерархии), т. е. функцию p(i,t). Осуществим теперь переход к непрерывной модели, рассматри- рассматривая властную иерархию как «сплошную среду», т. е. считая число инстанций достаточно большим (N ^> 1), а все входящие в модель функции — достаточно гладкими. Дискретной координате г ставится в соответствие непрерывная координата х (номерам г соответствуют точки Xi, выбранные, например, по правилу Х{ — г), а целочисленному отрезку [0, N] — отрезок [0, /] (величина / — аналог «длины» иерархи- иерархической структуры, а координата х характеризует место инстанции в иерархии: чем больше ж, тем младше инстанция). Разности видар(г + + l,t)-p(i,t) в A) н p(i,t + At) -p(i,t), W(i,t) -W(i-l,t) в D) заменяются соответствующими первыми производными, сумма в пра- правой части D) — интегралом, а зависимость всех входящих в D)-F) функций от аргументов г, t заменяется на зависимость от ж, t. В результате для функции р(х, t) (подробные выкладки не приво- приводятся, так как они достаточно очевидны; ср. с выводом модели тепло- теплопередачи в § 2 гл. II) получается следующее уравнение: др д \ { dp \ dp ,х\-[р(х',t) -p(x,t)]dx' ^r F(p,pup2,x,t), G) 0 < х < I, t > t0,
192 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV с граничными условиями второго рода = О, W{1, t) = -к -^- = О, t^ t0, (8) x=0 VX x=l и начальными условиями p(x, t0) = po(x) ^ 0, 0 ^ x ^ Z, (9) причем к > 0, x ^ 0, а положительные функции pi, р2 монотонно убывают по х. Уравнение G) представляет собой «параболическое» интегро- дифференциальное уравнение (в том смысле, что в отсутствие интег- интегрального члена оно аналогично уравнению теплопередачи; см. также упр. 1). В математическом отношении модель G)-(9), «аппроксимиру- «аппроксимирующая» исходную модель D)-(б), замкнута и корректна, т. е. однознач- однозначно определяет решение — гладкую неотрицательную функцию р(х, t) для всех O^x^lmt^to (при некоторых несущественных для общ- общности ограничениях на входные данные). Заметим, что при численном моделировании задачи G)-(9) производится обратный переход к задаче D)-F) (см. упр. 2). Напомним смысл величин, входящих в модель G)-(9). Функция р(х, t) (решение) описывает пространственно-временную динамику распределения власти в иерархической структуре, т. е. зависимость величины (уровня) реально осуществляемой инстанцией власти от ее местоположения (координата х) и времени t. Скорость изменения функции р(х, t) (левая часть уравнения G)) определяется следующими характеристиками: 1) разностью потоков власти, получаемой по механизму а) от бли- ближайших соседей по иерархии или отдаваемой им (первый, дифферен- дифференциальный член в правой части G)); 2) суммой потоков власти, получаемой инстанцией по механиз- механизму б) от отдаленных ступеней иерархии или отдаваемой им (второй, интегральный член в правой части G)); 3) реакцией гражданского общества, т. е. функцией F(x,t,p(x,t),p1(x,t),p2(x,t)) (третий член в правой части G)); 4) минимальными и максимальными властными полномочиями иерархии — монотонно убывающими по х функциями pi(x,t) > 0, Pi yXi ") ^ и; 5) внутренними поведенческими свойствами иерархической струк- структуры — функциями 6) начальным распределением власти в структуре — функцией Ро(х) ^ 0. Таким образом, модель G)-(9) — математическая реализация об- общей схемы системы «власть—общество», изложенной в п. 1 и отве- отвечающей самоорганизующемуся объекту с различными прямыми и об-
§ 4] ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 193 ратными связями. Описываемое ею распределение власти в иерархии устанавливается не произвольно, а в результате взаимодействия всех элементов системы. Очертим рамки применимости полученной модели. При ее постро- построении существенно использовались постулат, предположение 1 о зако- законопослушности системы, предположение 2 об определяющем влиянии реакции гражданского общества на скорость обмена властью между иерархией и законодательством, а также считалось, что характер те- текущего взаимодействия между двумя звеньями иерархии зависит от текущего состояния только этих инстанций. Все эти предположения сформулированы в возможно наиболее об- общем виде, три из них представляются вполне естественными и об- обоснованными (что же касается предположения о законопослушности, то эта необходимая на начальном этапе исследования идеализация в дальнейшем может модифицироваться). Будем называть G)-(9) общей математической моделью динамики распределения власти в государ- государственных иерархических структурах, взаимодействующих с граждан- гражданским обществом. Построенная выше модель позволяет анализировать ряд довольно общих проблем, связанных с функционированием и эволюцией системы «власть—общество». Перечислим некоторые из них: 1) получение необходимых и достаточных условий существова- существования (или несуществования) стационарных (т. е. постоянных во вре- времени) распределений власти и условий устойчивости таких стациона- стационаров; 2) анализ и прогноз кризисов власти различного характера: превы- превышение власти; ненормальные, немонотонные распределения власти в иерархии, когда некоторые младшие инстанции осуществляют реаль- реальную власть, большую, чем некоторые старшие ступени; анархические или тоталитарные эволюции распределения власти и т. д.; 3) изучение результатов изменений, происходящих в реакции гражданского общества, в законодательстве, во взаимоотношениях внутри иерархии и т. д., на пространственно-временную динамику распределения власти. Возможно также исследование различных комбинаций проблем 1)—3). Само собой подразумевается, что анализ перечисленных выше и других относящихся к существу дела задач должен сопровождаться тщательной их постановкой и аккуратной интерпретацией результа- результатов в терминах используемой модели. Модель G)—(9) позволяет дать весьма общий ответ на ряд об- общих вопросов, возникающих при изучении проблем 1)—3). Напри- Например, используя теоремы сравнения решений параболических уравне- уравнений (см. § 2 гл. V), нетрудно установить, что при увеличении положи- положительной реакции гражданского общества на действия всех инстанций власть в любой инстанции иерархии также увеличивается, а при уве- увеличении отрицательной реакции — наоборот, а также что большие начальные распределения власти в иерархии приводят при прочих равных условиях к большему уровню власти во всех звеньях во все последующие моменты времени, и наоборот. 13 А. А. Самарский, А. П. Михайлов
194 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Однако первостепенный интерес представляют все же более кон- конкретные вопросы, ответы на которые можно получить при определен- определенных конкретизациях системы «власть—общество». Некоторые из них изучаются ниже. 4. Правовая система «власть—общество». Стационарные распределения и выход власти за рамки полномочий. Одна из наиболее естественно формализуемых систем «власть—общество» — правовая система. Поэтому простейшие конкретизации общей модели G)-(9) отвечают именно этому случаю. Система «власть—общество» называется правовой, если реакция общества на действия любой инстанции иерархии всегда направлена на удержание распределения власти в рамках предписанных ей пол- полномочий. Подразумевается, что максимальные и минимальные полно- полномочия соответствуют праву в общепринятом смысле этого понятия (подобный тип реакции отвечает правовому общественному сознанию). р(х, Рис. 63 В общей модели сформулированное выше определение реализуется заданием соответствующей функции F(p,pi,p2,x,t). На рис. 63 пока- показан качественный вид функций p2(x,i), pi(x,i) — максимальных и минимальных властных полномочий инстанций иерархии в некоторый момент времени t в зависимости от их места (координаты х). По свое- своему смыслу pi(x, i), P2{x-> t) — монотонно убывающие по х положитель- положительные функции, причем P2(x,t) > pi(x,t), 0 ^ х ^ /, t ^ t0 (п. 1). Об- Область, лежащая между кривыми pi, Р25 — правовое поле, область выше значений ръ условно называется диктатурой, область ниже значений Р\ — анархией. Искомое решение — распределение власти р(х, t) — мо- может априори в разные моменты времени либо полностью находиться в правовой области, либо частично или полностью выходить из нее. Качественный вид зависимости функции F(p,pi,p2,x,t) от вели- величины власти р(х, t) (в некоторый момент t для некоторого значения х) показан на рис. 64. Если величина власти превышает максимальные полномочия (р > Р2), то реакция общества отрицательна и растет с ростом этого превышения; если же р < pi, т. е. величина власти мень-
ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 195 ше минимальных полномочий, то, наоборот, реакция положительна и растет с увеличением отклонения. В промежутке р\ ^ р ^ Р2 реакция общества с ростом р монотонно изменяется от положительных к от- отрицательным значениям, обращаясь в нуль в некоторой точке р°(ж,?), Р! <р° <р2, O^X^l, t^t0. Величину p°(x,i) можно назвать идеальным (средним) распреде- распределением власти в том смысле, что при реализации такого распределения реакция общества на действия иерархии всегда и всюду равнялась бы нулю (функция p°(x,t) считается монотонной по х; см. рис. 63). F(p,x,t) Поддержка (F > 0) Сопротивление (F < 0) Анархия Рис. 64 Итак, в правовой системе общество отрицательно реагирует на по- положительное отклонение власти от некоторого среднего ее значения, усиливая величину реакции с увеличением этого отклонения (для от- отрицательных отклонений реализуется противоположная ситуация). По своей количественной амплитуде реакция зависит не только от разнос- разности р — р°, но, вообще говоря, и от времени t; она может быть разной для разных звеньев иерархии (координата х) и может включать более тонкую за- висимость от величины р(х, t) (напри- (например, на рис. 64 интенсивность реакции для областей диктатуры р > р2 и анар- анархии р < р\ заметно выше, чем для пра- правовой области р\ <р <ръ). Перейдем к изучению стационар- стационарных (не зависящих от времени) рас- пределений власти в правовой системе. Начнем с анализа наиболее простой, но вместе с тем содержащей все существенные компоненты модели правовой системы. Для этого будем считать, что в общей модели G)-(9): 1) функция х, соответствующая механизму передачи власти по команде, постоянна, т. е. х = к$ = const > 0; 2) в иерархии нет механизма команд через голову, т. е. х = 0; 13* Рис
196 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV 3) реакция общества — линейная функция отклонения от идеаль- идеального уровня власти и не зависит от ?, т. е. F(p,x) = к1(р°(х)-р), где к\ > 0 характеризует амплитуду реакции (рис. 65); 4) идеальное распределение власти р° и властные полномочия р\, р2 не меняются со временем и линейно убывают с ростом координаты х (рис. 66), т. е. р° = Н-кх, Я>0, рг = A-а)р°, р2 = A + а)р°. Здесь к > 0 — степень убывания функции р° по ж, 0 < а < < 1 — относительная разница между р° и pi, р2 (причем р° = = (pi + р2)/2 — среднее арифметическое от минимальных и мак- максимальных полномочий), р°@) = Я, р°A) = Н — Ы > 0. Величина (Я - Ы)/Н = р°A)/р°@) = Pi@M@) = Р2(ОМ(О) < 1 — отношение полномочий низших и высших степеней иерархии, или перепад полно- полномочий. р(х)к -kl Рис. 66 В результате упрощений 1)—4) получаем базовую модель правовой системы: X < /, t > toj dp дх х=0 dp дх = 0, A0) x=l р(х, to) = Ро(х) ^ 0, 0 где А* > 0, р°(ж) =Н-кх, Я > 0, А; > 0. Заметим, что модель A0) линейна, и для нее относительно нетруд- нетрудно выписать общее решение. Стационарные (p(x,t) = р{х)) решения A0) находятся из задачи
ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 197 содержащей четыре параметра: xq, fci, fc, /, и сводящейся масштабиро- масштабированием (см. § 1 гл. V) р = р/Н, х = ж// к задаче с двумя параметрами ар" = р - A - Ъх), 0 < ж < Z, р'@) = р'A) = О, (П) где а = >cq/(к\ • /2), 6 = kl/Н < 1 (черточки над величинами р и ж в A1) опущены). 1,0 0,5 Идеальный профиль власти Диктатура Сопротивление (F < 0) \ Поддержка (F > 0) ^ Анархия 1-6 0,5 Рис. 67 1,0 Задача A1) имеет хорошо известное единственное (неотрицатель- (неотрицательное) решение, даваемое монотонно убывающей по х функцией р(х) = + A - Ьж). A2) Качественное поведение решения A2) определяется параметром а (параметр Ъ « 1, так что 1 — Ъ ^С 1, поскольку рассматриваются до- достаточно протяженные иерархические структуры с заметным перепа- перепадом полномочий). Вид решения для значений Ъ = 0,9 и трех значений а = 10~3, 10~2, 1СГ1 приведен на рис. 67. С ростом а решение (кри- (кривые 1-3) становится более пологим, и при некотором а > акр решение частично лежит в области р > р2 (кривая 3). Анализируя A2) и рис. 67, можно сделать следующие предварительные выводы: 1) стационарное распределение власти в правовой системе сущест- существует; 2) существует область параметров системы, в которой распределе- распределение власти выходит за рамки полномочий (в данном случае для части
198 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV младших ступеней власть превышена). Нетрудно выписать необходи- необходимое и достаточное условие нахождения власти в правовой области: а'*Ь (еа~1/2 - Л I (еа~1/2 + Л <С A - Ъ) A + а). A3) С ростом величины а критерий A3) нарушается все сильнее, причем если а —У оо, то р{х) —У 1 — Ь/2. Максимальное превышение (достига- (достигаемое в точке х = 1) равно рA) — Р2A) = 1 — Ь/2 — A + а) A — 6), что при Ь « 1 дает рA) — Р2A) ^ 0,5, т. е. превышение составляет 50% от максимальных полномочий; 3) идеальное распределение власти (штриховая прямая на рис. 67) не реализуется, решение всегда имеет «добавку» к величине р°(х) = = 1 — Ъх — второму члену в правой части A2). Ввиду важности выводов 1)-3) необходимо выяснить степень их общности, т. е. понять, не являются ли они свойствами только упро- упрощенной модели A0). 5. Роль основных характеристик системы в феномене пре- превышения (принижения) власти. Введем некоторые обобщения в базовую модель A0). 1) Механизм команд через голову. В правой части уравнения A0) появляется дополнительное слагаемое вида с') — р(х)] dx' о (здесь взято х — Хо = const > 0). Задача для стационарного решения (аналог задачи A1)) после соответствующего масштабирования имеет вид ар" = [р - A - Ъх)} - a J[p(xf) - р(х)} dx', р'@)=р'A) = 0, A4) где а = Xol/ki > 0. Несложной заменой A4) сводится к задаче A1) с ненулевыми краевыми условиями (упр. 3), имеющей решение вида A2). Условие A3) переходит в условие z = которое так же, как и A3), всегда нарушается при достаточно больших значениях а и (или) а (максимальное превышение то же, что и в случае ^0 = 0, так как р{х) —У 1 — Ь/2 при больших а, а). 2) Уточненная реакция граждаского общества. В обществе су- существует часть, которая в принципе не согласна с любыми дейст- действиями иерархии (в базовой модели как бы предполагалось, что такой
§ 4] ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 199 компоненты нет). Подобная реакция может быть описана добавлени- добавлением в правую часть уравнения A0) слагаемого вида &2Р, fe < 0 (т. е. эта часть реакции всегда отрицательна и тем больше, чем больше ве- величина власти). Для функции р(х) в этом случае получается задача, аналогичная A1). Однако при достаточно больших значениях ^ иа решение, очевидно, уходя из области р> Р2-> попадает в область р < р\, т. е. распределение власти выходит за рамки минимальных полномо- полномочий (в данном случае это происходит с высшими инстанциями). 3) Различные механизмы передачи власти по команде. а) В первом члене правой части уравнения A0) рассматривается не функция к — хо = const, а функция к — к§ \др/дх\а, а > — 1. Это значит, что степень ответственности иерархии зависит от градиента величиныp(x,i) (неравенством > — 1 обеспечиваетпараболичностьсо- обеспечиваетпараболичностьсоответствующего уравнения). Для получающейся стационарной задачи существует единственное монотонное решение. При достаточно боль- больших значениях параметра, аналогичного параметрам а и а из A1), A4), распределение власти выходит за рамки полномочий (поскольку с его ростом решение стремится к некоторой константе). б) В первом члене правой части уравнения A0) вместо функции х = х0 = const берется функция к — к$рР, C > —1, т. е. ответствен- ответственность звеньев иерархии зависит от величины реализуемой ими власти. По сравнению с предыдущими случаями результаты принципиально не меняются. В случаях а), б) эти выводы получаются из анализа полей ин- интегральных кривых соответствующих нелинейных уравнений первого порядка (см. упр. 4). 6. Интерпретация результатов и выводы. Итак, из 1K) п. 5 следует, что выводы 1), 2) п. 4 о существовании стационарных распре- распределений власти в правовой системе и наличии феномена превышения (принижения) власти (даже в такой системе) носят достаточно общий характер. Если вывод 1) п. 4 безусловно положительный, то вывод 2) п. 4 необходимо обсудить более подробно, поскольку он означает наличие явного кризиса власти. Во всех случаях, рассмотренных в пп. 4, 5, выход власти за рамки полномочий происходит при достаточно больших значениях некото- некоторых параметров а и (или) а (или их аналогов). Чтобы понять суть проблемы, обратимся к базовой модели п. 4. В задаче A1) параметр а определяется формулой являясь системным параметром (содержащим несколько характерис- характеристик объекта), а также параметром подобия (для систем с различными значениями xq, fci, /, но с одинаковыми значениями а профиль власти имеет один и тот же качественный вид). Из A5) видно, что а увеличивается с ростом параметра xq, харак- характеризующего интенсивность механизма передачи власти по команде, и с уменьшением параметров к\, / — реакции общества и длины иерар- иерархической структуры.
200 МОДЕЛИ ТРУДНОФОРМАЛИЗУЕМЫХ ОБЪЕКТОВ [ГЛ. IV Пусть fci, I фиксированы, а н$ растет (вместе с ним растет и величина а). С ростом н$ уменьшается ответственность всех звень- звеньев иерархии в том смысле, что старшие инстанции все более легко «транспортируют» потоки власти младшим соседям (см. п. 2). Пре- Предельная безответственность (хо = оо) означает, что любая инстанция становится своего рода телетайпом, передающим полученные «свер- «сверху» властные распоряжения (и поступающие с ними порции власти) «вниз» без всякого их изменения. В результате у нижних ступеней ие- иерархии как бы накапливаются излишки власти (кривая 3 на рис. 67), которые не могут быть уменьшены за счет реакции общества (она фик- фиксирована). Поэтому низшие инстанции вынуждены выйти за рамки своих максимальных полномочий. Аналогичная картина наблюдается при изменении параметра а — Xo'/^i (команды через голову). Бюрократический смысл условия A3) и его аналогов заключается в том, что, если характеристики иерархии и гражданского общества известным образом согласованы, то распределение власти остается в правовой области (и наоборот). Рассуждения, сопровождающие анализ соотношения A5), служат выражением общего противоречия, присущего иерархической струк- структуре. Оно состоит в следующем. С одной стороны, в иерархии обяза- обязательно должен быть перепад полномочий (причем весьма значитель- значительный), соответствующих ее высшим и низшим звеньям, иначе иерар- иерархия не имеет смысла. С другой стороны, механизмы передачи власти внутри иерархии всегда работают на сглаживание разницы во власти между инстанциями. Если данные механизмы становятся все сильнее, то остающаяся без изменений реакция гражданского общества даже в правовой системе не в состоянии конкурировать с этими процессами и скомпенсировать сглаживание. Распределение власти становится все более пологим и с необходимостью частично выходит за рамки предпи- предписываемых ей полномочий. Заметим, что данное свойство имеет место не только для правовой системы «власть—общество». Таким образом, справедливы два следующих вывода: 1) для правовой системы всегда существует единственное стацио- стационарное распределение власти в иерархической структуре, причем ве- величина власти монотонно падает при переходе от старших к младшим инстанциям; 2) даже в правовой системе всегда существует область парамет- параметров, при реализации которых распределение власти выходит за грани- границы правового поля. Столь же общим является и вывод 3) из п. 4 о невозможности реа- реализации идеального распределения власти, т. е. такого распределения, при котором реакция общества всегда и всюду была бы нулевой. Этот вывод устанавливается элементарно, и его смысл достаточно ясен: при нулевой реакции иерархия перестала бы взаимодействовать со своим партнером — гражданским обществом. В то же время согласно мо- модели иерархическая цепочка подвержена противоположно направлен- направленным влияниям (поддержка и сопротивление общества, «прибыль» и «убыль» власти в инстанциях). В условиях правовой системы их ди- динамическая конкуренция формирует в итоге стационарный профиль
§ 4] ДИНАМИКА РАСПРЕДЕЛЕНИЯ ВЛАСТИ В ИЕРАРХИИ 201 власти подобно тому, как статическая конкуренция сил тяжести и уп- упругости определяет форму троса, висящего между опорами. В отсут- отсутствие реакции единственно возможным решением в этом случае было бы постоянное по пространству и во времени распределение власти (упр. 4). Из этого вывода, в частности, следует, что при уменьше- уменьшении разницы между максимальными и минимальными полномочиями (в предельном случае это означает равенство величин р\ = Р2 = Р°) распределение власти всегда выходит из правовой области. Другими словами, для действий иерархии не следует отводить слишком узкое правовое поле, иначе она будет «вынужденно» выходить за законные рамки своей власти. При построении рассмотренной модели системы «власть—об- «власть—общество» и ее обобщений широко использовались аналогии, почерпну- почерпнутые из изучения естественнонаучных объектов: переход от дискретной к непрерывной модели (иерархия трактуется как сплошная среда); ана- аналог закона Фурье при описании механизмов перераспределения власти в иерархии; «закон сохранения власти» при выводе основного уравне- уравнения; понятие «поток власти» и др. Эти аналогии допускают разумную интепретацию, их применение позволяет глубже понять принципиаль- принципиальные свойства столь трудноформализуемого объекта. УПРАЖНЕНИЯ 1. Уравнение вида щ = L(uxx, их,и,х, t) называется параболическим, если dx > 0. Получите условия для функции >t(p,px,x,t) в уравнении G), запи- записанном без интегрального члена, при которых оно является параболическим. 2. Положив х — 0, осуществите, используя разложение функций в ряд Тейлора и удерживая главные члены, переход от модели D)-F) к G)—(9). Заменяя произ- производные конечными разностями, выполните обратный переход от модели G)—(9) к D)-(б). 3. Проведя замену v(x) = р(х) A + а) — A — Ьх) — сгВ, где В = JQ p(x') dx', получите из A4) краевую задачу для функции v(x). 4. Представляя стационарное уравнение A0) в виде системы двух уравнений, найдите для случаев н = но, н = но \др/дх\а, а>-1их= x-oV^ •> /5 > — 1 замены, сводящие его к уравнению первого порядка. 5. Проверьте, что при F = 0, х = 0 решение уравнения G) с условиями (8) в стационарном случае имеет вид р(х) = const. Библиография к главе IV: [1, 5, 9, 10, 37, 38, 40, 48-50, 56, 58, 85, 86].
ГЛАВА V ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ § 1. Применение методов подобия Дадим характеристику способов упрощения математических мо- моделей, основанных на свойствах их симметрии. Приведем описание самоподобных (автомодельных) явлений. Исследуем некоторые автомо- автомодельные процессы для нелинейных параболических и гиперболических уравнений. 1. Анализ размерностей и групповой анализ моделей. Од- Одно из фундаментальных свойств природных, технологических, многих экономических и социальных объектов — симметрия (подобие, повто- повторяемость, воспроизводимость) — находит свое отражение в их матема- математических моделях. Наличие какого-либо вида симметрии у изучаемого явления означает большую простоту объекта в сравнении с его менее симметричным аналогом. На этом основываются широко применяемые методы упрощения математических моделей и, следовательно, методы упрощения их анализа. Они состоят в понижении порядка системы уравнений, образующих модель, в уменьшении числа переменных, от которых зависят искомые величины, или числа постоянных парамет- параметров, определяющих процесс, и т. д. (так, симметрия функции трех переменных относительно этих переменных позволила найти макси- максимально возможное значение скорости трехступенчатой ракеты; см. п. 4 § 1 гл. I). Типичный подход к использованию свойств симметрии — анализ размерности величин, входящих в модель. Часть характеристик объ- объектов измеряется в каких-либо единицах, имеющих непосредственный (механический, физический, экономический и т. д.) смысл. Например, масса в граммах, температура в градусах Кельвина, валовый нацио- национальный продукт в рублях. Такие величины называются размерными, их численное значение зависит от выбора единиц измерения. Среди них выделяются величины с независимой (основной) размерностью, или размерно независимые величины. Например, если для описания механических явлений используется система единиц СГС (сантиметр, грамм, секунда), то размерности длины ж, массы т и времени t не- независимы и не выражаются одна через другую. В отличие от них размерность кинетической энергии Е = mv2/2 определяется через раз- размерности основных величин по формуле [Е] = [т][ж]2[?]~2 = г • см2 • с~2,
§ 1] ПРИМЕНЕНИЕ МЕТОДОВ ПОДОБИЯ 203 называемой формулой размерности (здесь v = dx/dt, через символ [/] обозначается размерность величины /). Такие величины называют- называются размерно зависимыми. Напомним, что явления и процессы могут описываться также и безразмерными величинами, скажем, отноше- отношением длины водоносного пласта к его ширине, показателем степени в формуле, дающей зависимость коэффициента теплопроводности от температуры, годовым банковским процентом и т. п. Системы единиц измерения можно выбирать по-разному, причем связи между величинами, характеризующими объект (получаемые из законов природы или иных соображений), не должны изменяться при изменении единиц измерения. Например, второй закон Ньютона F = = та (F — сила, а — ускорение) в системе СИ записывается точно так же, как и в системе СГС. Инвариантность явлений и процессов по отношению к изменению единиц измерения находит свое воплощение в так называемой П-теореме. Пусть имеется функциональная связь а = F(a1,a2,... ,ak,ak+i,... ,ап) A) между п + 1 размерными величинами a, ai, ..., ап, где величины ai, ..., ak имеют независимую размерность, и пусть эта связь не зависит от выбора системы единиц измерения (величина а искомая, а остальные задаваемые). Тогда связь A) может быть записана как П = ^A,...,1,П1,...,ПП_^), B) к п-к т. е. в виде соотношения между п + 1 — к величинами П, Щ, ... ..., Пп-к, представляющими собой безразмерные комбинации из п + + 1 размерных величин a, ai, ..., ап. При этом величины П, Щ, ..., Iin-k связаны с a, ai, ..., ап прос- простыми соотношениями ак+1 = [^ ?, C) ап = Un-kcfi1 ap22 ...а p2 арк к. Здесь показатели степеней mi, ..., тк] /i, ..., 1к] • • •; Ръ • • • •> Рк те же, что и в соответствующих формулах размерностей для размер- размерно зависимых величин a, a^+i, ..., ап, например в формуле [а] = []HM [i]HM Доказательство П-теоремы основано на инвариантности связи A) относительно единиц измерения. Прежде всего проведем обезразмери- вание соотношения A), исходя их того, что любая размерно независи- независимая величина а^, г = 1, ...,&, может быть представлена в виде а^ = a^. Здесь безразмерный коэффициент а^ — числовое значение величины а^
204 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V в применяемой системе единиц, а сомножитель а^ имеет размерность а^ и характеризует масштаб измерения (десятки или сотни фунтов, сотни или тысячи градусов, миллионы или миллиарды рублей и т. д.). Чи- Числовые значения безразмерных множителей для размерно зависимых величин a, a^+i, ..., ап вычисляются с использованием масштабных множителей щ, г = 1,..., /с, по правилу _ а_ rv1^2 7Ji* h h Tk ' an ~ rvPl глР2 TUP* ' непосредственно следующему из формул размерностей для каждой из них. Соотношение A) можно трактовать также и как связь между чи- числовыми значениями величин a, ai, ..., ап (т. е. связь между безраз- безразмерными величинами a, ai, ..., ап), не зависящую, по предположению, от единиц измерения. Таким образом, для любых наборов масштабных множителей щ справедливо а = F(ai,a2,... ,а^,а^+1,... ,ап), Положим теперь а\ = ai, a2 = а2, ..., оси — а>и- Другими слова- словами, выберем масштабные множители так, чтобы в полученной системе единиц измерения величины а\, ..., а^ тождественно равнялись едини- единице. Тогда из последнего соотношения немедленно вытекают формулы B) и C). Применение П-теоремы снижает число величин, фигурирующих в описании объекта, и дает явный способ представления искомой вели- величины а (и величин a^+i, ..., ап) через П, Щ, ..., Пп_^ и ai, ..., a&. Он «безразличен» к конкретному виду функциональной зависимости A), требуется лишь достаточная гладкость функции F. В частности, если п = к, то, как сразу следует из B), П = const, и а = const -a^a™2 ...a™\ т. е. для решения получается простое выражение через задаваемые параметры (чтобы знать точное значение а, остается определить кон- константу). Пусть, например, известно, что период малых колебаний ма- маятника Т (см. п. 3 § 3 гл. I) не зависит от его начального отклонения и скорости, а определяется лишь его длиной /, массой m и ускорением свободного падения д. Функциональная связь Т = ТA,тп,д) содержит четыре размерных величины, три из которых имеют независимые раз- размерности. Выберем в качестве таковых Т, / и т, тогда для размернос- размерности д будем иметь [д] = [/][Т]~2, или [Г] = [/]1//2[g]~1//2, откуда Т = const • л/1/д.
§ 1] ПРИМЕНЕНИЕ МЕТОДОВ ПОДОБИЯ 205 С точностью до безразмерного множителя данная формула совпада- совпадает с полученной из решения уравнения колебаний маятника (попутно выясняется, что их период не зависит от т). Заметим, что безразмерные параметры, характеризующие объект, при вариации единиц измерения не изменяются и поэтому в П-теореме не фигурируют. Процедура обезразмеривания (масштабирования) всегда полезна при изучении математических моделей, поскольку может дать важ- важную предварительную информацию об объекте. Например, в результа- результате масштабирования задачи п. 4 § 4 гл. IV выяснилось, что ее решение определяется фактически не четырьмя, а лишь одним параметром. Получаемые с помощью П-теоремы безразмерные величины III, •••? Пп_/, можно назвать параметрами (критериями) подобия в том смысле, что разные по своим масштабам, но одинаковые по сущ- сущности явления и процессы ведут себя качественно одинаково при за- заданном наборе параметров Щ, ..., Hn-k (и одинаково изменяются при их изменении). Инвариантность моделей по отношению к системе единиц измере- измерения — частный случай более общих свойств их симметрии. Наиболее хорошо разработанный и широко применяемый подход, использующий подобие моделей, основан на так называемом инвариантно-групповом методе исследования дифференциальных уравнений. Действительно, большинство дифференциальных уравнений, представляющих собой составную часть математических моделей многих явлений, остаются неизменными (инвариантными) при некоторых преобразованиях вхо- входящих в них независимых переменных и искомых функций. Например, уравнение теплопередачи E) из § 2 гл. II дТ с—=div(x.gradT) D) инвариантно к «сдвигу» времени t' = t + to и, если функции сих не зависят от г, к «сдвигу» координат г' = г + го. В частном слу- случае с = Со, к = жоТа, т. е. при степенной зависимости коэффициента теплопроводности от температуры, D) не меняет своего вида при пре- преобразованиях «растяжения—сжатия»: t' = at, r1 — /Зг, Т' = jT (числа се, /3, 7 должны подчиняться некоторой связи; см. упр. 1). Аналогичными свойствами обладают, как легко видеть, одномер- одномерные уравнения газовой динамики для идеального политропного газа д /1\ dv dv dp д , , {) & 7) 0 E) записанные в массовых координатах (см. пп. 5, 7 § 4 гл. II). Нетрудно убедиться, что в том или ином виде инвариантность присуща боль- большинству построенных в гл. I-IV моделей. Рассмотренные выше преобразования переменных и различные их комбинации и обобщения относятся к классу так называемых точеч- точечных преобразований, или преобразований Ли (производные от величин
206 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V не преобразуются). Пусть они к тому же удовлетворяют некоторым дополнительным условиям (представляют собой группу). Тогда диф- дифференциальное уравнение, допускающее группу Ли, может быть упро- упрощено: либо понижается его порядок, либо уменьшается число незави- независимых переменных, определяющих искомые функции. Одна из целей группового анализа — определение всех групп преобразований, допус- допускаемых данным уравнением или системой уравнений, и соответствую- соответствующих этим группам так называемых инвариантных решений уравне- уравнений. С точки зрения исследования математических моделей важны, прежде всего, не сложная и громоздкая процедура группового анали- анализа, а его конечные итоги применительно к конкретному уравнению (для большинства базовых математических моделей эти результаты получены). Приведем в качестве важного частного примера итог группово- группового анализа уравнения D) при с = 1, к — >с(Т) в одномерном случае (табл. 3). Номера в левом столбце таблицы отвечают различным груп- групповым преобразованиям, а в ее клетках приведены соответствующие им инвариантные решения для различных видов (спецификаций) функ- Групповая классификация уравнения f Таблица 3 f dt f дх № 1 2 3 4 5 6 7 >f(T) произвольное т = №, t = t т = /@, ? = *-* т = /@, е = «2/* — — — « 1 а 1-2а ? = х (а = 0) ":;;/(e)> Г = 2, +Ж), « ? = х (а = -а/2) He-/*
§ 1] ПРИМЕНЕНИЕ МЕТОДОВ ПОДОБИЯ 207 ции к{Т). Символ « означает повтор выражения, стоящего в строке слева, прочерк — отсутствие инвариантных решений. Через ? обозна- обозначен инвариант — комбинация, не изменяющаяся при данном преобра- преобразовании. При подстановке инвариантного решения T(x,i) в одномерное уравнение D) получается обыкновенное дифференциальное уравнение относительно функции /(?) (также инвариант преобразования). Иссле- Исследовать его гораздо проще, чем исходное уравнение в частных произ- производных. Далее не представляет труда выписать функцию T(x,i) через /(?) и изучить ее свойства, если известны свойства /(?)• Групповые преобразования с номерами 1-4 основные, поскольку допускаются при произвольных спецификациях функции >с{Т). Слу- Случай 1 — стационарное решение (инвариантность D) по отношению к сдвигу по i), 2 — постоянное по пространству решение (инвариант- (инвариантность к сдвигу по ж), 3 — решение типа бегущей волны (инвариант- (инвариантность к одновременному сдвигу по t и ж), 4 — решение с постоянным значением функции T(x,t) в точке х = 0 (инвариантность к преобра- преобразованиям вида t' = a2t, х' = ах, Т'(х',t') = T(x,t)). Расширения основной группы ^называемые подгруппами) проис- происходят при конкретизациях к(Т) = е , к(Т) = Та функции к(Т). Так, для решений пятой подгруппы величина ? инвариантна к преобразова- преобразованию растяжения-сжатия, которое в этом случае допускается исходным уравнением (поясним: решение 4 отвечает фактически частному слу- случаю преобразований растяжения-сжатия для произвольной функции х(Т), а для к(Т) = Та им отвечают решения в разделяющихся пере- переменных). Решения для подгрупп б и 7 порождаются комбинацией из преобразований сдвига и растяжения-сжатия. Заметим: вид почти всех инвариантных решений из табл. 3 был получен еще до группового анализа из других соображений (из тео- теории размерностей, предельными переходами, угадыванием решения и прямой подстановкой его в уравнение D)). Однако это не умаляет достоинства данного метода, по крайней мере в силу двух причин. Он дает строгий и исчерпывающий ответ об основной группе преоб- преобразований и о тех спецификациях уравнений (моделей), при которых эта группа расширяется (заранее известно, что другие спецификации к{Т) в уравнении D), скажем, вида к{Т) = 1пA + Т), не допускают дополнительных к основным решений). Кроме того, свойства симмет- симметрии уравнений могут быть весьма разнообразными и неожиданными. Например, для не описанного в табл. 3 случая к = Т0", а = —4/3 уравнение D) имеет большое число нетривиальных преобразований, определяемых лишь с помощью группового анализа, представляющего собой регулярный способ упрощения математических моделей. Подчеркнем также, что этот метод изучает свойства дифферен- дифференциального уравнения как такового, т. е. свойства лишь части модели исходного объекта (без других входных данных, например без крае- краевых условий). Поэтому пригодность получаемых на его основе тех или иных инвариантных решений для описания конкретного явле- явления должна исследоваться дополнительно. В отличие от группового анализа, теория размерностей (ее можно рассматривать как примене-
208 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V ние частного случая групповой симметрии, сводящейся к растяжению- сжатию единиц измерения) и вытекающая из нее П-теорема оперируют с моделью во всей ее полноте. 2. Автомодельные (самоподобные) процессы. Среди инва- инвариантных решений дифференциальных уравнений выделяется важный класс самоподобных, или автомодельных решений (смысл этого на- названия станет понятным чуть ниже). К ним принято относить широко используемые решения типа бегущей волны (случай 4 из табл. 3 для к = Т°"; см. также упр. 4 § 2 гл. II), степенные автомодельные решения (случай 5; см. также упр. 3 § 2 гл. II) и экспоненциальные автомодель- автомодельные решения (случаи б, 7). Убедимся в полезности построения и анализа автомодельных ре- решений для исследования математических моделей. В качестве первого примера рассмотрим решения типа бегущей волны для системы урав- уравнений E). Они ищутся в виде p(m,t) = р(?) = p(m-Dt), v(m,t) = v(?) = и(m - Dt), p(m,t)=p(?)=p(m-Dt), где D > 0 — некоторая постоянная. Подставляя эти выражения в E) с заменой для единообразия третьего уравнения дивергентным урав- уравнением энергии B1) § 4 гл. II, получим вместо уравнений в частных производных систему трех обыкновенных дифференциальных уравне- уравнений ^ d I dv ^ ^ dv dp ^ -^ d ( v2\ d , . «? Р «? dt; dt; df \ 2 J dt, где е(?) = e(m — Dt) — внутренняя энергия газа (е = г(р, р)). Интегри- Интегрируя их в произвольных пределах ?о5 ?ъ убеждаемся в том, что бегущая волна отвечает течениям, в которых сохраняются три интеграла: 1 v2 D-+v = Cp, -Dv+p = Cp, De + D — -pv = C?. F) В случае непрерывных течений интегралы F) дают единственное ре- решение — постоянные при всех ? значения р, г?, р, е. Нетривиальный результат получается, если учесть, что уравне- уравнения газовой динамики благодаря существованию в них «градиентной катастрофы» могут допускать разрывные решения (см. п. 7 § 4 гл. II). Пусть разрыв функций р(?), v(?), р(?) расположен в точке ? = 0. В об- областях ?>0, ?<0,т.е. справа и слева от него, течение, очевидно, по- постоянно и характеризуется наборами величин ро, г?о, ро и Р\, ^ъ Pi (CM- рис. 68, на котором решение изображено как функция координаты m в моменты времени ti, ?2, ^з; h < ?2 < ?3)- Скачок газодинамических па- параметров не произволен. Покажем это, анализируя смысл написанных выше интегралов (справедливых также и для разрывных течений).
§1] ПРИМЕНЕНИЕ МЕТОДОВ ПОДОБИЯ 209 Описываемый автомодельным решением разрыв движется по мас- массе газа с постоянной скоростью D. Неизменность массовой скорости Рис. 68 обеспечивает равенство потока вещества Ip = D, «втекающего» с од- одной стороны разрыва и «вытекающего» с другой его стороны. Нару- Нарушение этого естественного физического требования означало бы появ- появление или исчезновение при переходе через него какого-то количества вещества. Поток «втекающей» массы равен, по определению, IPo = D = = ро (и — vo), а «вытекающей» IP1 = D = pi (и — i?i), где и — эйлерова скорость движения разрыва, причем и — vo > 0 и и — v\ > 0. Первый интеграл F), как следует из равенства 1р = 1Ро = 1Р1, представляет собой тождество и = и. Обратимся ко второму интегралу F), записав его для величин с индексами 0 и 1: = Ро + ро (и - - Ipu = Ipo - Ipu, — 71-1 —I— П-\ ill 7?-i I / II / / II Pi — Pi I Pi V ^1 / 1plJl — 1p\ ipUj. Фигурирующие в этих равенствах величины IPo, IPl суть потоки импульса 1Р справа и слева от разрыва. Поскольку Ср = СРо = СР1, то они также равны: Ip = IPo = IPl. Иначе при переходе через бесконечно тонкую поверхность разрыва частицы вещества получали бы прира- приращение импульса, что возможно лишь при наличии действующих на нем бесконечно больших сил. Наконец, третий интеграл F) после несложных выкладок записы- записывается по обе стороны разрыва в виде C?l = I?l -и где 1? = р(и — v) е + р(и — v) (и — v2)/2 + р (и — v) — поток энергии. Поскольку в бегущей волне величина С? постоянна и, как уже уста- установлено выше, постоянны величины Ip, Ipj то также постоянен поток энергии I?J что означает равенство I?o = I?l. Энергия, «втекающая» в разрыв, равна «вытекающей» из него энергии (противное означало бы существование внутри него источников энергии бесконечной интен- интенсивности). 14 А. А. Самарский, А. П. Михайлов
210 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Учитывая результаты, следующие из анализа интегралов F), при- приходим к выводу о непрерывности потоков массы, импульса и энергии при переходе через поверхность разрыва газодинамических парамет- параметров: Заметим, что этот вывод справедлив также и в случае D = 0 (кон- (контактный разрыв). Для движущегося по массе газа разрыва (ударной волны) из уста- установленных равенств нетрудно найти при известной скорости D условия Гюгонио — однозначную связь между величинами до и после скачка (см. упр. 2, 3). Эти условия можно также получить и с помощью непо- непосредственного вычисления потоков по обе стороны ударной волны. Од- Однако автомодельные решения типа бегущей волны в силу их свойств позволяют автоматически получать условия Гюгонио для большого числа моделей сплошных сред, в частности для ситуаций, когда скачок происходит не в бесконечно тонком слое, а имеет пространственную протяженность, обусловленную всегда присутствующими в веществе диссипативными процессами. При этом уравнения для бегущей волны описывают еще и структуру переходного слоя. Заметим, что условия Гюгонио допускают как скачки сжатия, ког- когда давление, плотность и внутренняя энергия газа за ударной волной возрастают, так, формально, и скачки разрежения. Последние, однако, могут реализовываться лишь при наличии в среде соответствующих физических процессов, например, специального типа химических ре- реакций. Самоподобность, или автомоде л ьность, построенного решения хо- хорошо видна на рис. 68: оно без изменений воспроизводится в различные моменты времени на различных участках вещества. Решение понима- понимается в обобщенном смысле, поскольку оно удовлетворяет дифференци- дифференциальным уравнениям E) лишь в областях непрерывного течения. Рас- Рассматриваемое в области — оо < т < оо, оно представляет собой одно из обобщенных решений задачи Коши для уравнений газовой динамики. Если же в какой-либо точке с фиксированной массовой координатой, скажем, в точке т = 0, задаются соответствующие граничные усло- условия, то его можно трактовать как решение в области т > 0 задачи о поршне, вдвигающемся с постоянной скоростью в среду с постоянными параметрами. Изучим теперь степенное автомодельное решение для частного случая уравнения D) описывающего распространение тепла в неограниченной среде (—ос < < х < оо) от мгновенного точечного источника. В момент t = 0 в точке х = 0 выделяется количество тепла Qo- Данная постановка полностью совпадает с постановкой аналогичной задачи из п. 5 § 2 гл. II, с той
§ 1] ПРИМЕНЕНИЕ МЕТОДОВ ПОДОБИЯ 211 разницей, что коэффициент теплопроводности (точнее, температуро- температуропроводности) к(Т) = коТа, а > 0, не постоянен, а является растущей степенной функцией температуры. Для нахождения автомодельного решения используем П-теорему. Очевидно, оно зависит от четырех определяющих параметров ж, ?, ко-, Qo, т. е. Т = T(x,t,ko,Qo). Данное равенство связывает пять размер- размерных величин, три из которых имеют независимые размерности. Сле- Следовательно, согласно П-теореме оно сводится к функциональной зави- зависимости П = F(IIi) между двумя безразмерными величинами, П, Щ. Выберем в качестве размерно независимых величины Qo, #, t. Тогда из уравнения G) для ко следует формула размерности [ко] = = [Qo]~°"M°"~2/M- Формулу размерности [Т] = [Qo]/M Для Т получаем из условия ОС -/ Qo= T{x,t)dx, означающего сохранение первоначально выделившейся энергии в не- неограниченной среде без источников и стоков тепла. Из П-теоремы и формул размерности имеем и, с учетом связи П = Перепишем последнее равенство в виде, принятом в табл. 3, вводя обозначение ? = П^ '^ . T(x,t) = или, обозначая ?Ф(?) через /(?), Z = Qo^k~^r^x. (8) Безразмерный инвариант ? называется автомодельной перемен- переменной, функция /(?) — безразмерной функцией (представителем) темпе- температуры, размерный множитель перед /(?) в (8) — масштабным мно- множителем. Фиксированным автомодельным состоянием называется со- состояние, соответствующее фиксированной автомодельной координате ? = &• Анализ размерностей дает возможность получить ценную пред- предварительную информацию о процессе, не находя полностью решения задачи. Так, темп изменения со временем решения в точке ? = ?о5 в частности, в точке ? = 0, определяется лишь масштабным множите- множителем. Поэтому в начале координат х = 0 (? = 0) температура убывает по заранее известному закону 14*
212 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Также заранее известна скорость роста со временем координаты х для состояния ? = ?о: Если принять T(O,t) за характерную температуру нагретой области, а ж(?о) — за ее характерный размер, то их произведение T@,t) • ж(?о) не зависит от времени, что согласуется с условием постоянства тепловой энергии Qo, содержащейся в среде. Подставив (8) в G) и проведя дифференцирование, получим не- нелинейное обыкновенное дифференциальное уравнение второго порядка относительно /(?): / /' / / Преобразуем его к виду B^у ШУ + (Г ГУ = о и один раз проинтегрируем: B + <7)s</ J J Здесь С\ — 0, так как при ? = 0 решение считается ограниченным (/@) < оо), гладким и, по построению, симметричным, т. е. ff@) = = 0. При С\ = 0 переменные в последнем уравнении разделяются и оно легко интегрируется: Поскольку полученная формула при |?| > ?ф дает отрицательные значения, то в этой области /(?) полагается равной нулю (решение в точках |?| = ?ф «сшивается» с тривиальным решением). Величина ?ф = ?ф(сг) > 0 определяется из равенства J^*^ /(?) с?? = J_? /(?) с?? = = 1 — безразмерного аналога условия постоянства энергии в среде [Z -\- a) z I [i-/ z -\- л./б) о-/ -pej- (л I \ 1 атт /z I i л. / а) \ где Г — гамма-функция. Используя (8), приходим к окончательному виду решения задачи о мгновенном точечном источнике тепла в нелинейной среде: T(x,t) = 4J 2B + a)j ' ' '^ ^w' (9) Здесь
§1] ПРИМЕНЕНИЕ МЕТОДОВ ПОДОБИЯ 213 Решение (9) обобщенное, так как при достаточно больших а его производные по х и t в точках \х\ = x$(t) не существуют и в них оно не удовлетворяет уравнению G) в классическом смысле (см. упр. 4). Од- Однако естественное физическое требование непрерывности потока тепла W(x,t) = — коТа дТ/дх в точках \х\ = Жф(?), как и для решения B1) § 2 гл. II, выполняется (противное означало бы наличие в этих точках источников или стоков энергии бесконечной интенсивности). Распространение тепла происходит в виде волны, охватывающей со временем все новые и новые участки вещества (рис. 69). Она дви- движется по среде с конечной скоростью (ср. с решением B0) § 2 гл. II для случая а — 0). Фронт волны — точка, отделяющая нагретую часть пространства от холодной, — продвигается по закону x<$>(t) ~ t^+^, от- отвечая одновременно как фиксированному автомодельному состоянию ? = ?ф5 так и фиксированному физическому состоянию T(x$(t),t) = 0. Рис. 69 Самоподобие решения (9) имеет несколько иное геометрическое выражение, чем в предыдущем примере. Кривые на рис. 69 можно совместить в одну (в функцию /(?)) после их «автомодельной обра- обработки» — соответствующих преобразований растяжения-сжатия как аргументов ж, ?, так и функции T(x,i). Особую роль автомодельные решения играют для нелинейных моделей как важные частные решения, раскрывающие те или иные свойства объектов. Их изучение способствует выработке своего рода элементарного языка нелинейных явлений (ударная волна, тепловая волна и т. д.). Однако этим их значение далеко не ограничивается. При определенных условиях они служат промежуточными асимпто- асимптотиками для большого класса формально неавтомодельных процессов. Очевидно, что выделение тепловой энергии в какой-то части вещества не может быть ни мгновенным, ни точечным. Тем не менее ее рас- распространение в среде (с к(Т) = к^Та, а > 0), достаточно холодной в момент t = 0, по истечении достаточно большого времени и при до- достаточно больших значениях Хф (t) с хорошей точностью описывается
214 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V решением (9). Детали начальной стадии «забываются», и процесс «вы- «выходит» на самоподобный режим (на промежуточную асимтотику). 3. Различные режимы распространения возмущений в нелинейных средах. Если нелинейная модель обладает богатыми групповыми свойствами, то появляется возможность получать не от- отдельные решения, а наборы промежуточных асимптотик с разнообраз- разнообразным поведением. Изучим различные режимы распространения тепла, описываемые уравнением G). Процесс рассматривается в полуограниченной среде О < х < оо, холодной в момент t = to'. Т(х, t0) =To(x)=0, 0 < х < оо, A0) и нагреваемой с левой границы таким образом, что температура в точке х = 0 растет со временем по закону T(O,t) = A0(tf -t)n, n < 0, to^t <tf <oo. A1) Задача G), A0), A1) имеет смысл лишь при t < tf, поскольку в конечный момент t = tf граничная температура обращается в беско- бесконечность. Процессы подобного типа называются режимами с обост- обострением и являются математической идеализацией многих реально на- наблюдаемых явлений, порождаемых геометрией объектов, их нелиней- нелинейностью и т. д. К ним относятся, например, схождение сферической ударной волны к ее центру, схлопывание пузырьков воздуха в жид- жидкостях и другие виды кумуляции (геометрический фактор). Другой пример: рост численности населения Земли N(i) хорошо описывает- описывается в течение нескольких последних веков законом N(i) = No/(tf — i), tf = 2026 (год), следующим из популяционной модели dN/dt = aoN2 (см. п. 2 § б гл. I; сильная нелинейность). Решение задачи G), A0), A1) определяется, очевидно, величина- величинами ж, t, ко, Д), to, tf. Функциональная связь Т = T(x,t,ko,Ao,to,tf) содержит семь параметров, три из которых являются размерно не- независимыми. Избавимся от «мешающих» автомодельности парамет- параметров to, tf. Возьмем (без ограничения общности) момент обострения tf = 0 и будем рассматривать процесс при — оо ^ t < 0, т. е. поло- положим ^0 = — оо (время по-прежнему возрастает, течет от прошлого к будущему). Сформулированная таким образом задача становится, по П-теореме, автомодельной. Проводя выкладки, аналогичные применяв- применявшимся при выводе формулы (8), получим вид искомого автомодельного решения: T(x,t)=Ao(-t)n№, i = k-lhA-"h{-ty1±^x, ^0. A2) Подстановка A2) в G) дает для нахождения /(?) обыкновенное дифференциальное уравнение второго порядка (с краевыми условиями, вытекающими из A0), A1)):
§ 1] ПРИМЕНЕНИЕ МЕТОДОВ ПОДОБИЯ 215 Уравнение A3) в свою очередь допускает преобразование подобия ?' = = а?, /' = /3/, /3 = а 1° (растяжение-сжатие) и поэтому сводится к уравнению первого порядка (упр. 5), исследуемого стандартными ме- методами. Анализ показывает, что решение задачи A3) существует при всех п < 0, а > 0, единственно и монотонно. Его свойства определяются соотношением между параметрами п (скорость роста граничной температуры) и а (нелинейность среды). Критическим является значение п — —1/сг, при котором в уравне- уравнении A3) второй член выпадает и оно интегрируется явным образом (упр. 6). Переписывая его с помощью A2) в исходных переменных, имеем 2/<т Ts(x,t) = { V я*! A4) Jb s* *Ьф , где / сг + 2\1/2 Хф = xs = ( 2/^о^-о ) • A5) Первое из краевых условий A3) выполняется «досрочно» (т. е. при х = Хф(ко, Д), а) < оо), тепловой поток на фронте равен нулю (так же, как и в решении (9)). Решение A4) обобщенное, поскольку его произ- производные в точке х — Хф при достаточно больших а не существуют. При п < —1/сг условия на границе между нагретым и холодным ве- веществом также выполняются в конечной точке ?ф = ?ф(п, а) < оо (зна- (значение координаты фронта для конкретных п, а находится численно). В ее окрестности поведение решения описывается асимптотическим вы- выражением, первый член которого — решение упрощенного уравнения, получающегося из A3) в предположении /(?) —у 0, ? —У ?ф: - па №) = { V 2 'V - " ' * —' A6) Здесь и далее многоточием обозначены члены более высокого порядка малости. Из A6) видно, что решение при п < —1/сг обобщенное с тем же порядком гладкости, что и (9) (гладкость у A4) выше, чем у (9) и A6)). Однако поток тепла в точке фронта, как и для (9) и A4), непрерывен. В отличие от случая п ^ —1/сг, при п > —1/сг условия на фрон- фронте волны выполняются лишь при ? —>¦ оо. Решение — гладкая при всех ? ^ 0 функция, его асимптотическое разложение у фронта дается формулой 2п-2 № = Cf;— + d?— + ..., 1 + па > 0, A7) где С = С(п,а) > 0 (находится численно) и С\ — -Са+1 + [2п Bп + + па -!)]/(! + паJ < 0.
216 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ Для всех п, а при ? —у 0 решение имеет асимптотику [ГЛ. V означающую, что поток тепла на границе среды положителен и энер- энергия поступает в вещество. Перейдем к анализу физических свойств построенных решений, различая случаи п = — 1/сг, п < — 1/сг и п > —1/а. 1) При п = —1/сг фронт тепловой волны неподвижен. Эффектив- Эффективный размер нагретой области, например, полуширина, т. е. точка жЭф(?) такая, что T(x^(t),t)/T@,t) = 1/2, также не изменяется со временем. Автомодельность данного решения, как и всех решений в разделяющихся перемен- переменных (имеющих вид u(x,t) = = U(t) V(x)), выражается в одинаковости его простран- пространственных профилей в раз- различные моменты времени. Профили отличаются в дан- данном случае лишь растущей со временем амплитудой U(t). Таким же свойством обладает упорядоченный режим Буссинеска, для ко- которого амплитуда — убы- убывающая функция времени (упр. 2 из § 1 гл. II). Решение A4) можно на- назвать остановившейся тепловой волной (см. рис. 70, где показаны профили решения для среды с а = 2, крестиками отмечена полуширина). В этом режиме при t —> 0 в вещество посту- поступает неограниченное количество энергии; температура и коэффициент теплопроводности при всех 0 ^ х < xs стремятся к бесконечности. Тем не менее тепло не проникает далее точки с координатой х = = xs, определяемой интенсивностью граничного режима Aq и свойст- свойствами среды ко, а. Решение A4) показывает, что распространение теп- тепла может быть локализовано в области конечных размеров — области локализации (xs — глубина локализации). Поэтому существует прин- принципиальная возможность концентрировать любое количество энергии в ограниченных участках вещества без распространения ее за пределы зоны локализации. 2) В случае п < —1/а координата фронта волны нагрева неогра- неограниченно увеличивается при t —> 0: A'J2 И)^?ф -»¦ оо. То же самое справедливо для полуширины волны x3${t) и координат всех точек x(t,?o) с фиксированным автомодельным состоянием ? = ?о- Хф X
§1] ПРИМЕНЕНИЕ МЕТОДОВ ПОДОБИЯ 217 Проследим за изменением решения в фиксированной точке вещест- вещества х = хо < оо. Отвечающая ей автомодельная координата ?(?, #о), к&к видно из второй формулы A2), стремится к нулю при t —У 0. Раскрывая первую формулу A2), получим при t —У О Т(х0, t) = Ао ЫГ/(?(ж0, *)) -»¦ Ао (-t)nf(O) = A0(t)n -»¦ оо. Таким образом, при приближении к моменту обострения волна охва- охватывает все пространство, температура в любой точке среды неогра- неограниченно возрастает, локализация отсутствует. В этом отношении ре- решение аналогично бегущей волне B1) из § 2 гл. II, однако бесконечные параметры достигаются не при t —У оо, а за конечное время. Происхо- Происходит сверхбыстрый прогрев среды. 3) Совсем по-иному реализуется распространение тепла при п > > — 1/сг. Из A2) видно, что полуширина сокращается со временем по закону о, t -+ о. = о ч Т(х,0) Решение представляет собой тепловую волну с уменьшающейся эф- эффективной глубиной прогрева. С течением времени поступающая в вещество энергия сосредо- сосредоточивается в сокращающей- Т(х>f) t ся области вблизи границы (рис. 71). «Фронт» тепло- тепловой волны, как следует из A7), A2), находится в точке х = оо (при Хф < оо размер нагретой области со време- временем уменьшался бы, что в среде без поглощения энер- энергии невозможно). Для фиксированной точки вещества х = хо i (О < хо < оо) имеем ?(xo,t) —У оо, t —У 0, т. е. координата ?(xo,i) стремится, в отличие от предыдущего случая, к координате фронта. Используя асимптотику A7) и формулу A2), по- получаем при t —У О T{xoi t) ^у С (&q пАо) 1+пст х^ п(т + А- О.л (h^~n А^~а\ 1+псг гГ1+псг (_+\ \ ('\R'\ \^ \у\ V Г) "^0 / О V / *^ ' ' ' \ / Несмотря на неограниченный рост температуры в точке х = 0, во всей остальной среде она при всех t ^tf ограничена сверху предельной кри- кривой (первый член в A8); на рис. 71 — штриховая кривая). В случае 3) также осуществляется локализация тепла, но в другом режиме, чем при п = —1/сг. Анализ автомодельных решений задачи G), A0), A1) позволил с помощью простых математических средств установить существова- существование в теплопроводной среде трех принципиально различных режимов Рис. 71
218 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V распространения тепла и изучить ряд их важных свойств. Они опреде- определяются в основном скоростью подвода энергии к среде при t —> 0 и сте- степенью ее нелинейности. Для «медленных» режимов нагрева (п = — 1/сг, S-режим] п > — 1/сг, LS-режим) имеет место локализация тепла, при «быстром» нагреве (п < —1/сг, HS-режим) этот эффект отсутствует. Наборы разнообразных по своим свойствам автомодельных реше- решений можно получать не только для математических моделей, сводя- сводящихся к квазилинейным параболическим уравнениям, но, например, и для уравнений газовой динамики. Изучим обостряющиеся режимы распространения возмущений для простейшего квазилинейного гипер- гиперболического уравнения — уравнения Хопфа C2) из § 4 гл. II g + W^ = 0, A9) dt dm записанного относительно давления р = p(m, i), а — G + 1)/B7) < 1. Рассмотрим для него задачу о поршне, сжимающем газ, занимаю- занимающий полупространство т > 0, с нулевым начальным давлением: р(т, t0) = ро(т) = 0, 0 < т < оо. B0) Поршень расположен в точке т = 0, давление на нем растет в режиме с обострением: р@, t) = Ао (tf - t)n, n < 0, to^t <tf <оо. B1) Задача A9)—B1) автомодельна, если подобно предыдущему слу- случаю положить ^0 = — оо (как и ранее, возьмем без ограничения общ- общности tf = 0). Ее решение в соответствии с П-теоремой имеет вид p(m,t) = A0(-t)n№, ? = fco-4~CT НГA+шт)т, ?^0. B2) Из A9), B2) получаем для определения /(?) уравнение первого порядка f| (/" + A + паH - "/= 0, B3) которое, будучи записанным в виде df~ nf линейно относительно ?. Оно имеет общее решение Z = f+1/"-r, B4) удовлетворяющее следующему из B1) условию /@) = 1 (при анализе B4) необходимо также следить за выполнением условия /(оо) = 0, вы- вытекающего из B0)). Свойства решений зависят от соотношений между п и а. 1) При п = —1/сг из B4), B2) получаем явное решение в разделяю- разделяющихся переменных (остановившаяся волна сжатия, или газодинами- газодинамический S-режим): {Ао (-^)~1/<т ( 1 ) , rn ^ тФ, V ™*J B5) О, т > Шф,
§1] ПРИМЕНЕНИЕ МЕТОДОВ ПОДОБИЯ 219 где гпф = ?7i5 = коА$ — координата фронта волны сжатия, отделяю- отделяющего пришедший в движение газ от невозмущенного вещества. Фронт волны и ее полуширина постоянны во времени, давление и все осталь- остальные газодинамические величины — скорость, плотность и т. д. — неограниченно нарастают в области 0 ^ т < ms при t —> 0. Однако при т > ms газ остается неподвижным и холодным при всех t < 0 (в эйлеровых координатах это означает, что поршень сжимает прилегаю- прилегающую к нему конечную массу газа ms в бесконечно тонкий слой, никак не затрагивая остальное вещество). Решение B5) демонстрирует эф- эффект локализации сжатия на ограниченной глубине ms, определяемой параметрами задачи, т. е. эффект, вполне аналогичный локализации тепла в S-режиме. 2) Такая же почти полная аналогия справедлива и в случае п > > —1/сг (газодинамический LS-режим). Решение, как видно из B4), монотонно убывает с увеличением ? и обращается в нуль при ? = оо (условие /(оо) = 0 выполнено). Фронт волны сжатия расположен в точ- точке т = оо, ее полуширина сокращается до нуля при t —> 0 (?Эф легко находится из B4) с учетом равенства /(?Эф) — 1/2). Энергия, сообщаемая газу поршнем, концент- концентрируется в уменьшающейся со временем области вблизи границы. Для любого 0 < то < оо имеем ?(то,?) —У оо, t —У 0. Поэтому, разрешая B4) относительно /(?) при ? —у оо: и переходя с помощью B2) к исходным переменным, получаем при 1 + па ^0 А 1+П<Т ^ТТ^ ь.п—1 Решение стремится снизу к предельной кривой (первый член в полу- полученной формуле), обраща- обращаясь в момент t = 0 в беско- f(€)i нечность лишь в точке m = = 0. 3) Для анализа реше- решения при п < —1/сг рас- рассмотрим поле интеграль- интегральных кривых уравнения B3), показанное на рис. 72 (жир- (жирной линией выделена кри- кривая /, для которой /@) = 1, штриховая линия — изо- изоклина бесконечности, разде- разделяющая плоскость на облас- области А и В). Из рисунка вид- Рис- 72 но, что непрерывного решения, отвечающего требованию /(оо) = 0, о
220 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V не существует, так как кривую / нельзя продолжить в область В за линию /; = оо. По этой же причине нельзя построить и разрывные решения, получающиеся с помощью скачков, изображенных стрелка- стрелками. Таким образом, единственная возможность — переход с кривой / скачком, попадающим на ось абсцисс, и продолжение при ? > ?ф, ?ф — координата скачка, решения нулем (значение /(?) = 0 удовлетворяет уравнению B3)). Условие на скачке для решения уравнения A9) можно получить по аналогии с уравнениями E), представив A9) в дивергентном виде др dt д<р(р) dm _ где (f(p) = кора+1 /(а + 1), и построив для него разрывное решение ти- типа бегущей волны p(m, t) = р(т — Dt). Значения функции р до и после разрыва связаны соотношением D = Po -Pi Отсюда для автомодельного решения B2) имеем ^~\ I„ i 1 \ e_ _ •'O Jl D = -( /о-Л где ?ф — автомодельная координата разрыва, D — его обезразмерен- ная скорость, связанная с мгновенной скоростью D(t) соотношением p(m,t) \4 Рис. 73 D = (а + 1)~гкоА^ (—t)n(TD. Для интересующего нас случая /о = 0 на- находим связь между Д и ?ф используя которую нетрудно установить, что точка (Д,?ф) лежит вы- выше линии /; = оо, т. е. искомое разрывное решение действительно су- существует.
§ 2] ПРИНЦИП МАКСИМУМА И ТЕОРЕМЫ СРАВНЕНИЯ 221 Решение как функция т изображено в различные моменты вре- времени на рис. 73. Его фронт m^(t) и полуширина тЭф неограниченно растут со временем по закону тФ(г) ~ тэф(Г) - (-tI+na -юо, t -+ 0. Возмущение в пределе охватывает все пространство, решение в любой точке то < оо стремится к бесконечности при t —> 0 (упр. 7). Таким образом, как и для процессов теплопроводности, в «мед- «медленных» режимах с обострением возмущения локализованы, в «быст- «быстрых» — локализация отсутствует. Заметим, что уравнение A9) выводится из уравнений E) в предпо- предположении о непрерывности и изэнтропичности течения (простая волна). Так как построенные решения в случае п ^ — 1/сг непрерывны, то они удовлетворяют E) и допускают непосредственную газодинамическую интерпретацию (в отличие от разрывного решения при п < —1/сг). УПРАЖНЕНИЯ 1. Проверьте прямой подстановкой, что уравнение D) с с = со, >с = коТа инвариантно к преобразованию растяжения-сжатия при условии аC~2гуа = 1. 2. Убедитесь, используя F), что на разрыве, не движущемся по массе газа (контактный разрыв, D = 0), скорость и давление непрерывны. 3. Ударная волна, для которой р\ ~^> ро, называется сильной. Получите из F) условие Гюгонио по плотности на таком разрыве (в случае идеального газа е = — P/((i ~ 1) р))э полагая для простоты vq = 0. Покажите, что на сильной ударной волне скачок плотности не зависит от D и дается формулой pi/po = (*у -\- 1)/(*у — 1). 4. Установите, что при а ^> 1 первые производные решения (9) по х и t раз- разрывны в точке х = жф(?), а при а ^> 1/2 претерпевают разрыв вторые производные. 5. Проверьте, что замена переменных г] = 1п?, / = ? ^(p(rf), ip = dip/dr] либо замена ц> = —?,f~1f°' df/d?, ip = —?,f1~(T/{df/d{;) сводит A3) к уравнению первого порядка вида dip /dip = ipF{ip, ф) /\(рф(чр, ф)) (во втором случае уравнение исследо- исследовать легче, чем в первом, поскольку функции F, Ф содержат простую нелинейность вида ijjip). 6. Уравнение A3) при п = —1/сг может быть записано в виде (fa+1)" = = —(а + 1) п/. Используя замены и = faJrl, и1 = v, понизьте его порядок и проин- проинтегрируйте полученное уравнение. 7. Убедитесь, используя B2), что при п < —1/сг для любой точки то < сю справедливо ? (mo, t) —>¦ 0, t —>¦ 0 и р(то, t) —>¦ р@, ?) —>¦ оо, ? —>¦ 0. § 2. Принцип максимума и теоремы сравнения Дадим представление о непрерывной зависимости процесса от входных данных. С помощью теорем сравнения и набора автомодель- автомодельных решений построим замкнутую классификацию режимов с обост- обострением в нелинейных средах. Рассмотрим обобщения автомодельного метода. 1. Формулировка, некоторые следствия. Совокупности про- промежуточных асимптотик, какими бы разнообразными они ни были, не могут дать описание объекта в общем случае хотя бы потому, что при их получении всегда приходится делать сильные упрощающие предпо- предположения (нулевой начальный фон температуры в нагреваемой среде, постоянство течения до и после ударной волны, решение на грани-
222 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V це — степенная функция времени и т. д.). Построение достаточно пол- полной картины невозможно без использования устойчивости математи- математических моделей, или непрерывной зависимости решений от входных данных. Под этим подразумевается свойство решений несильно (в неко- некотором смысле) изменяться при несильном изменении краевых условий, коэффициентов уравнений и других характеристик моделей. Устойчи- Устойчивость, математически выражаемая по-разному для разных ситуаций, является одним из необходимых условий корректности моделей, без чего нельзя говорить об их адекватности изучаемому объекту (пред- (предполагается, что в определенном смысле устойчив и сам объект). Для устойчивых моделей наборы частных решений служат своего рода ори- ориентирами или границами среди множества всех возможных решений. Это особенно важно, если задача нелинейна и сконструировать ее об- общее решение из частных нельзя. Применительно к уравнениям параболического типа это свойство находит свое воплощение в принципе максимума и теоремах сравне- сравнения. Рассмотрим задачу Коши для уравнения нелинейной теплопро- теплопроводности: дТ д -оо < х < оо, t > 0, ^ ' Г (ж, 0) = Го(ж) ^ 0, -оо < х < оо. Принцип максимума. Максимум решения Г(ж,?) (темпера- (температуры) в любой момент времени не превосходит максимума началь- начальных данных Tq(х) (начальной температуры): max T(x,t) ^ max T0(x). B) t>0, — оо<ж<оо — оо<ж<оо Неравенство B) имеет очевидный физический смысл. Максимум начального распределения температуры никак не может увеличить- увеличиться с течением времени, ведь по закону Фурье поток тепла переносит энергию от нагретых участков среды к холодным. В случае первой краевой задачи для уравнения A) в полупро- полупространстве принцип максимума имеет столь же ясный смысл и озна- означает, что max Г(ж,*)^тах1 max Г0(ж), maxT@,f) 1 , C) t>0,0<x<oo V J [0^ж<оо V J t^O J где Tq(x) — начальная температура вещества, Г@, t) — задаваемая на его границе температура. Из принципа максимума следуют теоремы сравнения. Для задачи Коши A) формулировка выглядит следующим образом. Пусть T^(x,t), T(x,t), TB\x,t) —решения задачи Коши, соот- соответствующие начальным данным Tq (ж), Го (ж), Tq (x). Тогда если Г0AH) ^ Го (ж) ^ Г0BH) для всех -оо < х < оо,
§ 2] ПРИНЦИП МАКСИМУМА И ТЕОРЕМЫ СРАВНЕНИЯ 223 то T^(x,t) ^T(x,t) ^ТB)(ж,?) для всех -оо < х < оо, * > 0. D) Другими словами, если взять два одинаковых образца теплопро- теплопроводного материала таких, что начальная температура одного из них не меньше, чем в такой же точке другого, то в любой последующий момент времени это свойство сохранится. Для первой краевой задачи в полупространстве теорема сравнения решений означает следующее. Выполнение неравенств Г0A)(ж) <С Го (яг) ^ Г0B)(ж), 0 < х < оо, Г^О,*) ^ Г@,*) ^ ГB>@,*), t > О, влечет за собой неравенства T^(x,t) ^ T(x,t) ^ТB)(ж,?) для всех 0 ^ х < оо, t > 0, E) где T^\x,t), T(x,t), T^2\x,t) —решения задачи, соответствующие краевым условиям Г0A)(ж), Т0(х), Г0B)(ж) и T^(O,t), T(O,t), T^2\0yt). Как и принцип максимума, теоремы сравнения имеют непосред- непосредственный физический смысл: большее тепловое воздействие на фик- фиксированный объект приводит к формированию в нем большего поля температуры. Аналоги сформулированных утверждений справедливы и для дру- других задач теории теплопроводности. Используя частные решения каких-либо задач для уравнений параболического и эллиптического типов, можно оценить (ограничить сверху и снизу) решения более об- общих задач и, не зная их в деталях, сделать выводы общего характера. Непрерывная зависимость решений от входных данных в той или иной форме установлена также для широких классов гиперболических урав- уравнений (например, для уравнения A9) из § 1 она выражается теоремами сравнения, аналогичными теоремам для уравнения A)). Из неравенств D) и свойств решения (9) из § 1 вытекает конечная скорость распространения возмущений в задаче Коши A) для уравне- уравнения A) с к(Т) = коТа, а > 0, при условии, что начальное распреде- распределение температуры Tq(x) — финитная функция, т. е. Tq(x) = 0, \х\ ^ ^ Ro < оо. Пусть Тш — максимальное значение функции Tq(x). Тогда, вводя в формулу (9) из § 1 сдвиг по времени на величину ?о и выбирая постоянные Qo и ^о достаточно большими, нетрудно удовлетворить неравенству Тш ^ Г(До,0), из которого следует неравенство ХЬ(ж) ^ ^ ?о(ж, 0) = ?о(ж), -оо < х < оо, где через T(x,t) обозначено решение задачи о мгновенном точечном источнике тепла. Так как оно мажо- мажорирует решение общей задачи Коши A) по начальным данным, то из теоремы сравнения D) вытекает T(x,t) ^.T(x,t), — оо < ж < оо, ?>0. Поэтому в любой момент времени t > 0 найдется величина R(t) такая, что T(x,t) = 0 для всех \х\ ^ R(t). Это и означает конечную скорость движения фронта тепловой волны.
224 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Путем схожих построений из свойств решения типа бегущей вол- волны B1) § 2 гл. II и неравенств E) легко устанавливается (при фи- финитной функции Tq(ж)) конечная скорость распространения тепла в случае первой краевой задачи в полупространстве. Следовательно, этот эффект имеет общий, а не частный характер. Он связан с осо- особенностями уравнения нелинейной теплопроводности A). Для многих важных процессов температура в некоторых частях вещества может считаться практически равной нулю (например, на начальной стадии сильного взрыва в атмосфере температура вне его зоны ничтожно ма- мала по сравнению с температурой в области, охваченной взрывом). При достаточно сильном росте коэффициента теплопроводности от темпе- температуры величина к(Т) в этих зонах также фактически равна нулю. Раскрывая правую часть уравнения A): дТ убеждаемся, что в точках ж,?, в которых T(x,t) = 0 и, таким обра- образом, k(T(x,t)) = 0, оно вырождается в уравнение первого порядка (в остальной области A) — параболическое уравнение второго порядка). Такова математическая подоплека конечной скорости распространения тепла в среду с нулевым температурным фоном. В точках вырождения решение, как уже было показано на частных примерах, следует пони- понимать в обобщенном смысле, в остальной области оно удовлетворяет уравнению A) в обычном (классическом) смысле. Более подробно рассмотрим доказательство существования эф- эффекта локализации тепла в задаче Коши. Утверждение состоит в сле- следующем: решение T(x,t) задачи Коши для уравнения с начальной функцией \х\ > хо, локализовано в (первоначальной) области \х\ ^ хо в течение времени локализации ?л, не меньшего, чем т. е. Г (ж, t) = 0, \х\ > ж0, *о ^ * ^ *о + tn- В силу B) максимум Tm(t) решения задачи F), G) не превосходит начального при всех t > to:
§2] ПРИНЦИП МАКСИМУМА И ТЕОРЕМЫ СРАВНЕНИЯ 225 причем равенство Tm(t) = Т@,?) следует из симметрии задачи. Рас- Рассмотрим решение T(x,t) в области х > О, обозначив его через T+(x,t). Функцию Т_|_(ж, t) можно, очевидно, трактовать при t > to как решение первой краевой задачи для уравнения F) в области х > 0 с начальным условием Т+(ж,?о) из G) и условием на границе Т+@,?), удовлетво- удовлетворяющим неравенству T+(O,t)=Tm(t)=T(O,t)^TM. По построению функция Т+(ж,?о) не что иное, как решение A4), A5) из § 1 (автомодельный S-режим Ts(x,t), в котором Aq = = [xla/Bk0 (а + 2))]1//<т, ж# = ж0), взятое в момент t0 = —?л = §/(( )^) Сравним решения Т+(ж,?) и Ts(x,t) при ^о ^ ^ < 0 (взаимное рас- расположение функций Т(ж, ?о), Т+(ж, ?) и Ts(x, i), взятых в момент t > to, показано на рис. 74). Начальные данные в обоих случаях совпадают, Ts(x,t) T(x,t0) — Xq 0 xO Рис. 74 а граничное условие для T+(x,i) мажорируется граничным условием для Ts(x,t): Т' (ел -/Л <^ гт~* <^ а ( ¦/¦^ — /с ¦/¦ <^ ¦/¦ ^ г\ Из теоремы сравнения E) и свойств S-режима имеем Т_|_(ж,?) =0, ж > жо, ^о ^ ^ < 0. В силу симметрии Т_(ж,?) = Т+(—ж,^), где Т_(ж,?) — решение T(x,t) в области ж < 0 (см. рис. 74). С учетом этого окончательно получаем сформулированное выше утверждение Из теоремы сравнения D) следует, что любое начальное распре- распределение температуры, мажорируемое функцией G) (и имеющее совпа- совпадающие с ней фронты), также локализовано в области \х\ ^ хо, а время 15 А. А. Самарский, А. П. Михайлов
226 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V локализации оценивается снизу по формуле (8). Таким образом, спра- справедлив вывод общего характера: для среды, теплопередача в которой описывается уравнением F), всегда можно указать профили темпера- температуры, обладающие «инерционностью». Фронты таких профилей, взя- взятых в качестве начальных данных, начинают двигаться по веществу не сразу, а по истечении некоторого времени (см. также упр. 1). Заметим, что в среде с достаточно сильным поглощением тепла (упр. 2) возможны ситуации, когда размер нагретой области ограничен постоянной величиной при всех to ^ t ^ оо (физический смысл этого эффекта очевиден). 2. Классификация режимов с обострением. Инерционность свойственна лишь достаточно «пологим» температурным профилям; это видно из сравнения локализованного распределения G) и, скажем, решения задачи о мгновенном точечном источнике тепла (формула (9) § 1). Одним из способов формирования подобных профилей может быть воздействие на теплопроводную среду соответствующих граничных режимов. Например, в случае решения A4), A5) из § 1 поступление энергии с границы согласовано со свойствами среды таким образом, что в любой момент времени в веществе воспроизводятся инерционные профили вида G) (время локализации которых, естественно, уменьша- уменьшается с ростом температуры). Опираясь на изученные в п. 3 § 1 автомодельные решения и тео- теоремы сравнения, дадим классификацию граничных режимов с обост- обострением по результатам их воздействия на нелинейные среды. Рассмотрим для F) первую краевую задачу в полупространстве х > 0 с граничным условием Г@, t) -> оо, t -> 0, to^t <0, (9) и, для простоты, нулевыми начальными данными T(x,t0) =Т0(х) =0, х^О. A0) Локализация в этом случае, в отличие от задачи Коши, означает су- существование постоянной Г < оо такой, что для решения T(x,t) задачи F), (9), A0) справедливо T(x,t) = 0 при I ^ Г, to ^ t < 0. Другими словами, тепловые возмущения в течение всего процесса нагрева не проникают далее некоторой конечной глубины I* (в противном случае локализация отсутствует). Из теоремы сравнения E) и свойств автомодельного S-режима вы- вытекает, что если то в задаче F), (9), A0) имеет место локализация тепла на глубине Г = xst а ее решение мажорируется функцией Ts(x,i). Если же (9) удовлетворяет неравенству Г@, t) <С Ао И)п, -1/<т < п< 0, to ^ * ^ 0, A1) то решение локализовано на глубине (упр. 3) Г sC BfcoA) (-io)V'+n —) 2, A2) V ° )
§ 2] ПРИНЦИП МАКСИМУМА И ТЕОРЕМЫ СРАВНЕНИЯ 227 и при 0 ^ х ^ Г для него справедлива оценка (упр. 4) T(x,t) ^ C(n,a)(ko~nAo)T^x^^, х ^ Г, to^t<0, A3) следующая из существования предельной кривой A8) § 1 для автомо- автомодельного LS-режима. Неравенство, предшествующее A1), определяет класс граничных режимов с обострением, приводящих к локализации тепла; неравен- неравенство A1) уточняет этот результат: при его выполнении реализуется LS-режим, температура при t —> 0 неограниченно растет лишь в точке х = 0. При ненулевых, но финитных функциях Tq(x) в A0) оба сделан- сделанных выше утверждения о локализации остаются в силе. Необходимо лишь выбрать достаточно большой величину Aq в мажорирующих решение автомодельных S- и LS-режимах; конкретные оценки A2), A3), естественно, претерпевают изменения. Заметим, что для обще- общего LS-режима фронт волны, в отличие от автомодельного, находится не при х = оо, а в конечной точке. Эффект локализации в краевых задачах не связан с быстротой на- нагрева вещества как таковой. Чтобы убедиться в этом, проанализируем поведение решения F), (9), A0) в случае, когда Г@, t) ^ Ао Н)п, п < -l/t7, t0 ^ * < 0. A4) Прежде всего покажем, что в некоторый момент t* (to < t* < 0) реше- решение T(x,i) отлично от нуля в окрестности границы х = 0. Для этого сравним его с решением T(x,t) типа бегущей волны {^[D(t- t0) - x]1/*, x^D(t- to), ко A5) О, x>D(t-t0), для уравнения F), в котором D = [Aq(-to)na~1ko/cr]1^. По построению T(x,to) = 0, а постоянная D подобрана так, чтобы T(O,t) ^ T(O,t) ^ ^ Ао (~t)n, to ^ t < 0. Следовательно, T(x,t) ^ T(x,t), 0 ^ х < оо, to ^ t < 0 в силу теоремы сравнения E). Обратимся теперь к решению A2) из § 1 при п < — 1/сг (авто- (автомодельный HS-режим), обозначив его через Ta(x,i). Выберем в нем величину Аоа ^ Ао такой, чтобы при t = t* оно мажорировалось функ- функцией A5), взятой в момент t = t*, т. е. чтобы Ta(x,t*) ^ T(x,t*), х ^ О и, таким образом, Ta(x,t*) ^ 2\ж,Г), х ^ 0. Из A4) имеем Та@,?) ^ ^ Т@,?) для всех t > t*. Тогда из теоремы сравнения E) получаем неравенство Ta(x,t) ^ T(x,t) для всех х ^ 0 и t ^ Г (мажорирование при t ^ t* автомодельного HS-режима изучаемым решением). Посколь- Поскольку Ta(x,t) —У оо, t —У 0, х ^ 0, то и T(x,t) —>¦ оо при t-^О в любой точке х ^ 0. При выполнении неравенства A4) локализация тепла отсутству- отсутствует, волна нагрева при t —У 0 охватывает все вещество, температура в любой его точке неограниченно растет (данное утверждение тем более справедливо, если T(x,to) ф 0). 15*
228 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Этот вывод завершает классификацию граничных режимов с об- обострением в нелинейных теплопроводных средах. При воздействии на вещество «медленных» S- и LS-режимов (Т@,?) ^ Aq (—?)~1//<T или T@,t) ^ А0 (-t)n, -1/сг < п < 0) энергия локализуется в области ко- конечных размеров, в «быстрых» HS-режимах A4) локализация не имеет места. Для полноты картины поясним, что эффект локализации реали- реализуется и при отказе от требования Т(ж,?о) = 0, х ^ 0 (или от требо- требования финитности функции A0)). В этом случае локализацию следует понимать в более общем эффективном смысле как существование по- постоянной L* < оо такой, что решение задачи F), (9) при произвольной ограниченной функции Tq(x) ограничено при х ^ L*, t ^ to, несмотря на беспредельный рост решения в точке х = 0. Классификация гранич- граничных режимов с обострением не зависит от характера начального рас- распределения температуры и остается прежней. В частности, не имеет значения, существует или нет в рассматриваемом процессе конечный фронт тепловой волны. В качестве примера, иллюстрирующего эти утверждения, рас- рассмотрим для уравнения F) задачу с граничным условием Г@, t) = As (-?)~1/<T, t0 ^ t < 0, A6) отвечающим решению Ts(x,t) — автомодельному S-режиму, но с по- постоянным начальным фоном температуры Ее решение T(x,t), очевидно, мажорирует Ts(x,t): Ts(x,t) ^ Т(ж,^), х ^ 0, to ^ t < 0. Так как температура в точке х = 0 для обоих решений одна и та же, то из последнего неравенства вытекает следующее неравенство на произ- производные в этой точке: дТ_ dTs_ дх _n ^ дх х=0 х=0 а из него — неравенство для потоков тепла на границе дТ3 х=0 ^ дх х=о A8) Физический смысл A8) в том, что при прочих равных условиях первоначально более нагретая среда хуже «воспринимает» поступаю- поступающую с границы энергию по сравнению с менее нагретой. Проинтегри- Проинтегрируем F) с учетом A8) по ж от 0 до оо и по t от to до t < 0 и (поскольку Ws(oo,t) = W(oo,t) =0, t0 ^ t < 0) получим сю сю [[Т(х, t) - Го] dx ^ [[Ts(x, t) - Ts(x, to)} dx,
§ 2] ПРИНЦИП МАКСИМУМА И ТЕОРЕМЫ СРАВНЕНИЯ 229 или, разбив область интегрирования на части от х = 0 до х = xs и от х = xs до х = оо и имея в виду, что Ts(x, t) = 0, х ^ xs, t ^ to, придем к неравенству Xs СЮ Ж5 Аг(аг,«) - То] dx + f[T(x, t) - То] dx ^ f[Ts(x, t) - Ts(x, to)] dx. 0 xs 0 Так как Г (ж, t) ^To, х ^ 0, ? ^ ?о (УПР- 5), то данное неравенство можно переписать в виде сю xs xs О sC f[T(x, t) - То] dx sC f[Ts(x, t) - Т(х, t)] dx + f[T0 - Ts(x, to)] dx, XS 0 0 откуда следует, в силу неравенств T(x,t) ^ Ts(x,t), х ^ 0, t ^ ?о> и ^о ^ ^5(ж, to), х ^ 0, ограниченность функции T(x,t) при всех х ^ xs, to ^ ? ^ 0. Другими словами, в задаче F), A6), A7) осуществляется э$- фектпивная локализация тепла на глубине L* = xs, в точности равной глубине локализации при отсутствии температурного фона. Классификация режимов с обострением для процессов, описывае- описываемых гиперболическим уравнением A9) из § 1, проводится аналогичны- аналогичными методами и приводит к весьма схожим результатам: при действии на среду «медленных» граничных режимов имеет место локализация, в случае «быстрых» режимов этот эффект отсутствует. 3. Расширение «автомодельного метода». Продемонстри- Продемонстрированный в пп. 1, 2 подход, основанный на использовании широких классов автомодельных или иных частных решений и непрерывной зависимости процесса от входных данных, допускает разнообразные обобщения. Покажем, что эффект локализации тепла может осуществлять- осуществляться не только в одномерной, но и в многомерной геометрии, построив соответствующее явное решение уравнения дТ д ( дТ\ 9/ дТ\ 8/ дТ at дх \ ах) ду \ ду рассматриваемого в квадранте ж^О, у ^ 0, z ^ 0 (здесь, как и ранее, Т = Г (ж, у, z, t) — температура). По аналогии с одномерным S-режимом A4), A5) из § 1 будем искать частное решение A9) в разделяющихся переменных, т. е. T(x,y,z,t) = U{t) f(x,y,z). Подстановка этого выражения в A9) дает для U(t) такую же, как и в одномерной геометрии, формулу U(t) = = Ао И)/'. Для функции f(x,y,z) получается сложное эллиптическое уравне- уравнение. Поэтому ограничимся простым случаем, когда пространственная часть решения зависит фактически от одного аргумента: f(x,y,z) = /() ? = ж + 2/ + ^- Тогда /(?) подчиняется уравнению A3) § 1 при
230 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V п = — 1/сг, решение которого уже известно. В итоге приходим к много- многомерному S-режиму Ts(x,y,z,t) = 2 / (-t)-^(l-X + y + Z) \ x + y + z^r*, V J B0) x + у + z > Гф, где Гф = rs = B/^0^-0 (а + ^)/сгI//2 вычисляется по формуле для одно- одномерного решения. Решение B0) описывает нагрев трехмерной тепло- теплопроводной среды в режиме с обострением, поскольку граничная темпе- температура T@,y,z,t),T(x,0,z,t),T(x,y,0,t) обращается в бесконечность (в области ? < rs) при t —> 0. То же самое происходит в этой области и с решением. Однако во всем остальном пространстве ? > rs квадранта ж^0, ?/^0, z^0 температура равна нулю вплоть до момента t = 0. Размер области локализации rs (расстояние от начала координат до плоскости фронта тепловой волны), как и прежде, зависит от свойств среды ко, а и интенсивности граничного режима Aq. Поскольку для решений уравнения A9) справедливы теоремы сравнения, то из B0) сразу определяется класс граничных режимов, приводящих к локализации тепла в рассматриваемой многомерной об- области. Их дальнейшая классификация вполне аналогична полученным в п. 2 результатам. Обратимся теперь к более широкой трактовке автомодельных ре- решений, рассмотрев понятие приближенные автомодельные решения. Проще всего его ввести на примере задачи о нагреве среды с постоян- постоянными теплофизическими свойствами в режиме с обострением: дТ 1 д2Т ^ 0 < ж < оо, ?0 ^ t < О, dt дх2 B1) Положим без ограничения общности T(x,to) = 0, х ^ 0. Общее реше- решение линейной задачи B1) хорошо известно: T(x,t) = -h= I exp (- Г _\(t-r)-^T@,r)dr. B2) С помощью B2) нетрудно провести классификацию решений B1) в зависимости от вида Т@,?). Видно, что, поскольку при г —У ?, t —У —у 0 первый сомножитель в подынтегральном выражении стремится к нулю, а второй и третий к бесконечности, то возможен любой из изучавшихся в п. 2 режимов распространения тепла. Так, для Т@, t) = Лое~ао//^, по > 0 — параметр, характеризующий граничный режим, температура неограниченно растет во всех точках О ^ х ^ xs = 2л/коао при t —У 0, а в области х ^ xs ограничена для
§ 2] ПРИНЦИП МАКСИМУМА И ТЕОРЕМЫ СРАВНЕНИЯ 231 всех t ^ 0. Также ограничена тепловая энергия, содержащаяся правее точки х = xs- оо lim / T(x',t)dxr t^o J v ' < oo, x > т. е. осуществляется эффективная локализация тепла в S-режиме с вычисляемой из B2) глубиной L* = xs = 2^/koao. Рассмотрев краевое условие более общего вида T@,t) = Ло ехр (а0 (-?)п), п < 0, B3) получим, что при — 1 < п < 0 реализуется LS-режим, а для п < — 1 HS-режим. Анализ интеграла B2) не может дать некоторых важных деталь- детальных свойств процесса. Например, для того чтобы получить закон из- изменения со временем полуширины хЭф (t), надо фактически решить ин- интегральное уравнение B2). Задача B1), B3) не допускает, как легко показать с помощью П-теоремы, и построение автомодельных реше- решений. Модифицируем B1), B3) следующим образом: вместо B3) возьмем граничное условие в виде Т@, t) = Ао [ехр (а0 (-t)n) — 1], п < 0 (добав- (добавление константы сделано для удобства и при t —У 0 роли не играет) и проведем замену V(x,t) = Ао \n(T(x,t)/A0 + 1). Тогда для V(x,t) по- получим задачу — -к — — (®У^2 B4) 1/@, t) = Аоао (-t)n, п < 0, ?0 ^ t < 0, V(x,t0) =0, 0 ^ х < оо. Граничное условие B4) — степенная функция времени. Если по аналогии с п. 3 § 1 искать решение задачи B4) в виде, близком к сте- степенному автомодельному решению, то для такого решения при t —У О первый член в правой части уравнения становится ничтожно малым по сравнению со вторым, и им можно пренебречь (упр. 6). Более строгий анализ показывает, что действительно решение за- задачи B4) близко при t —У 0 к решениям более простой задачи ди ко (ди\ -г- = —г- тг~ , 0 < х < оо, —оо < t < О, at Ао \дх) , ч / ч B5) u(O,t) = Аоао \—t)n, п < 0, -оо ^ t < О, и(х, —оо) = 0.
232 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V В отличие от B4) решение u(x,i) задачи B5) — степенное авто- автомодельное решение, проанализировать которое не представляет тру- труда. Функция u(x,i) является приближенным автомодельным реше- решением для задачи B4) и, следовательно, для исходной задачи B1), B3). Относительная точность описания улучшается с течением вре- времени: 1 _ А° Mx,t)/A0 T(tN ->О, Из свойств u(x,t) вытекает закон для полуширины волны нагрева жЭф(?) = (—^(i-™)/2 1п2 [ко/(ао (—п))]1/2, которая уменьшается во всех трех режимах (ср. с нелинейной средой). Заметим, что построение и анализ приближенных автомодельных решений возможны и использу- используются при изучении широкого класса уравнений параболического ти- типа. Еще одно важное расширение автомодельного метода основано на обобщении понятия сравнения решений. Сущность этого подхода со- состоит в сравнении решений задач, отвечающих не только разным кра- краевым условиям, как в пп. 1, 2, но и разным уравнениям (в случае урав- уравнения A) — разным функциям к(Т)). В определенном смысле речь идет об устойчивости процесса теплопередачи по отношению к возмуще- возмущениям тепло физических свойств среды. При этом в качестве одного из сравниваемых решений можно выбрать решение хорошо изучен- изученного уравнения (например, F) или B1)) и получить содержательные результаты для решений более сложных уравнений. Простейший вариант такого подхода продемонстрируем в случае уравнения B1). Рассмотрим решения T^\x,i) и T^2\x,i) двух крае- краевых задач в полупространстве х ^ 0: =Г0A)(ж), Для разности V(x,t) = T^2\x,t) - T^\x,t) из B6), B7) получим еле-
§ 2] ПРИНЦИП МАКСИМУМА И ТЕОРЕМЫ СРАВНЕНИЯ 233 дующую краевую задачу: ^-O^, ,>, «>о, 2)(i)-T1A)(i), t>0, V(x,0) = Vo(x) = Т0B)(ж) - ТоA)(ж), х 2 0. Пусть выполнены требования мажорирования решения решением T^2\x^t) по краевым условиям: T[1]{t)^T[2\t), t>0, B9) Г0A)(аг)^Г0B)(аг), х 2 0, и по коэффициенту теплопроводности: 41} < 42)- (зо) Пусть также для решения T^2\x,t) справедливо г 0, —х— ^ О при х ^ 0, t^O. C1) Свойство C1) неубывания функции T^2\x,t) со временем в любой точке х ^ 0 обеспечивается (при Xq ^ (ж) = 0) неубыванием по t гранич- ного условия Т| (^). Проверим это, продифференцировав уравнение B7) по t и получив для функции Z^2\x,t) = дТ^/dt = -WB\x,t)/k0 задачу дх2 ' Ее решение, как нетрудно показать (упр. 7), неотрицательно при всех х ^ 0, t ^ 0 (в случае Xq ' ф 0 для выполнения неравенства C1) достаточно наложить еще и условие д2То(х)/дх2 ^0, ж ^ 0). При выполнении неравенств B9)-C1) задача B8) для V(x,i) ста- становится задачей ^ = 41H + /(^*), ^>о, *>о, V(O,t)^O, t>0, V0(x) 2 0, х^0,
234 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V с неотрицательными краевыми условиями и неотрицательной функ- функцией f(x,i) (источниками тепла) в правой части уравнения C3). Ее решение неотрицательно при всех х ^ 0 и t ^ 0. Отсюда следует мажо- мажорирование решения задачи B6) с коэффициентом fcg решением задачи B7) с коэффициентом к^ во всей рассматриваемой области: t), t^O, t^O. C4) В случае уравнения A) неравенство C4) справедливо при дополни- дополнительном к B9)-C1) требовании на коэффициенты к^г\Т), к^2\Т), име- имеющем вид [к^(Т)/к^(Т)]'т ^ 0, Т ^ 0. С помощью подобных теорем сравнения (справедливых и для пара- параболических уравнений общего вида) устанавливается, например, прин- принципиально важный результат: для среды с любыми теплофизическими свойствами всегда можно указать класс граничных режимов, приво- приводящих к локализации тепла, и класс режимов, при действии которых на среду локализация отсутствует. Таким образом, этот эффект носит общий характер. УПРАЖНЕНИЯ 1. Используя решение (9) из § 1 и теорему сравнения D), покажите, что лока- локализация возмущенней в задаче Коши возможна лишь в течение конечного времени и что при любой начальной функции То (ж) = 0 координата фронта тепловой волны Хф(г) —>¦ ОО, t —>¦ ОО. 2. В уравнении dt дх (qo > 0) член qoT характеризует зависящую от температуры интенсивность погло- поглощения тепла в среде. Заменами Т = e~qot V, т = A — e~<Tq°t)/(aqo) сведите его к уравнению dV д ( а dV\ дт ~ дх V ° дх)' В качестве решения V(x,r) уравнения без поглощения возьмите то, которое дается формулой (9) из § 1, и сделайте обратный переход от V(x,r) к T(x,t). Убедитесь, что для построенного таким образом решения T(x,t) исходного уравнения Жф(?) —>¦ —>¦ ?,<s>(QokoI/B+a"> (aqo)~1/B+(T") при t —>¦ оо. 3. Сравнивая краевое условие A1) с решением Ts{x,t) (формулы A4), A5) из § 1 ) в точке х = 0, докажите справедливость оценки A2) при начальных данных A0). 4. Убедитесь, что решение задачи F), (9), A0) мажорируется в случае нера- неравенства A1) рассмотренным в п. 3 § 1 решением для автомодельного LS-режима. 5. Проверьте неравенство T(x,t) ^> То, х ^> 0, t^ to, для решения задачи F), A6), A7), используя E) и учитывая, что константа удовлетворяет уравнению F). 6. Проверьте, что если искать решение уравнения B5) при п = — 1 в виде V(x,t) « Аоао^)~г /(ж) (аналог S-режима), то при t —>¦ 0 B4) вырождается в урав- уравнение B5). 7. Докажите от противного неотрицательность решений задач C2) и C3) (используйте теорему сравнения E) и тот факт, что при нулевых краевых условиях решения — тождественные нули).
§ 3] МЕТОД ОСРЕДНЕНИЯ 235 § 3. Метод осреднения Рассмотрим вариант метода осреднения, применяемый для изуче- изучения пространственно-временной динамики локализованных структур. Сформулируем два подхода к осредненному описанию. С их помощью получим классификацию режимов горения в теплопроводных средах. 1. Локализованные структуры в нелинейных средах. Из- Изучавшийся в § 1, 2 эффект локализации возмущений может прояв- проявляться не только при внешних воздействиях на среду, заданных в виде соответствующих граничных режимов с обострением, но и бла- благодаря ее собственным нелинейным свойствам. Достаточно сильная нелинейность (см. простой пример в § б гл. I) порождает режимы с обострением, которые в свою очередь служат причиной возникно- возникновения структур — локализованных в пространстве неоднородностей величин. Изучим пространственно-временное поведение распределения тем- температуры в теплопроводном веществе с нелинейными источниками тепла. Энергия выделяется в результате горения, протекания химичес- химических или иных видов реакций. Среда считается неограниченной (задача Коши), процесс горения одномерным. Он описывается уравнением qo > 0, C > 1, -оо < х < оо, t ^to, с начальной функцией Г (ж, t0) = Го (ж), -оо < х < оо. B) Теплофизические характеристики вещества (коэффициент тепло- теплопроводности и сильно нелинейный (/3 > 1) источник энергии q^T^) — степенные функции температуры, хорошо аппроксимирующие в ря- ряде случаев реальные зависимости. Горение инициируется начальным распределением температуры Го (х) ^ 0 (в противном случае вещество оставалось бы холодным). Построим пример локализованной структуры горения в задаче A), B). Будем искать ее решение в разделяющихся переменных в виде T(x,t) = U(t) f(x). Тогда из A) имеем откуда видно, что переменные разделяются в случае, когда /3 = а + 1, и тогда rr_(CT+1) du _ 1 d / ta df где С > 0 (ищутся режимы с растущей во времени температурой). Для U(t) из C) получаем выражение U(t) = (d - act)-1/", d > 0, D)
236 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V имеющее смысл лишь при t < Ci/(aC) и обращающееся в бесконеч- бесконечность в конечный момент времени. Таким образом, температура рас- растет в режиме с обострением. В дальнейшем положим без ограничения общности С = 1/сг и обозначим С\ —if- Чтобы найти /(ж), заменой /°"+1 = у преобразуем C) сначала к уравнению имеющему вид уравнения колебаний шарика на пружинке с соответ- соответствующей внешней силой (см. п. 1 § 4 гл. I), а затем, используя замену у' = и, к уравнению первого порядка ак0 duo ?/^+1 - qoay а + 1 dy lu Его интегрирование дает связь между си и у: ак0 си2 сг + 1 -±2 у2 У-+1 qcr — + C2. сг + 12 Для определения константы С2 учтем, что функция и = у' = = fa ff((J + 1) с точностью до числового множителя представляет собой пространственную часть в выражении для потока W(x,i) = = —коТсг • дТ/дх = —koUcr+1fcrff. На фронте тепловой структуры как температура /, так и тепловой поток должны обращаться в нуль. Сле- Следовательно, ио = 0 при у = 0 (/ = 0) и отсюда С2 = 0. Переходя в последнем уравнении от у и ш обратно к /, получаем (при С2 = 0) квадратуру (а + 1) ак0 df ах = ± ¦ которая интегрируется явным образом: f = Aca*''Bx, А=\дощ-^\ , В = - ^j^-^. E) Объединяя D) и E), приходим к окончательному виду искомого решения T(x,t) = F) о, И>^, где LT = 2тг л/ko/qo у/(<т + 1)/сг2.
§ 3] МЕТОД ОСРЕДНЕНИЯ 237 Решение F) описывает немонотонное распределение температуры (структуру) с неподвижным фронтом и неизменной полушириной — автомодельный S-режим горения в нелинейной теплопроводной среде. Несмотря на беспредельный рост температуры в структуре при t —У —у tf (при t —У — оо температура обращается в нуль), процесс горения локализован в конечной области \х\ ^ Ьт/2, размер которой опреде- определяется параметрами вещества &о, qo, а. Локализация означает отсут- отсутствие влияния горящей структуры на участки среды, находящиеся за границами области \х\ ^ Ьт/2. Таким образом, горение нелинейной среды может осуществляться в виде любого числа независимых друг от друга тепловых структур (если их максимумы разделены расстоянием, большим Ьт)- Причи- Причина усложнения процесса, распада его на структуры заключается в открытости рассматриваемой системы, в обмене энергией с окру- окружающей средой. В сравнении с такими системами термодинамически замкнутые процессы не допускают возникновения структур. В тепло- теплопроводной среде без источников, как видно из свойств решения задачи о мгновенном точечном источнике тепла (п. 2 § 1) и теорем сравнения, распределение температуры при t —У оо становится пространственно однородным. По аналогии с автомодельными граничными режимами с обост- обострением из § 1 для среды без источников тепла возможно построение также автомодельных LS- и HS-режимов горения. Они ищутся в виде (упр. 1) и обладают схожими со своими граничными аналогами свойствами: в случае LS-режима (/3 > а + 1) полуширина локализованной структуры сокращается со временем, а температура ограничена сверху предель- предельной кривой при всех t ^ tf\ в случае HS-режима (/3 < а + 1) локализа- локализация отсутствует. Но буквальное повторение схемы, применявшейся в § 1, 2, не- неприемлемо для изучения тепловых структур, по крайней мере в силу двух причин. Существование и свойства автомодельных LS- и HS-режимов горения устанавливаются (из-за сложности соответ- соответствующего уравнения; см. упр. 2) гораздо более тонкими, чем в § 1, 2, методами. Кроме того, непосредственное применение автомо- автомодельных решений и теорем сравнения для анализа задачи A), B) в общем случае не дает завершенных результатов. Например, от- относительно нетрудно проверить, что в задаче A), B) при [3 = о + + 1 любые начальные возмущения температуры будут развиваться в режиме с обострением (упр. 3). Доказать же их локализацию да- даже в этом частном случае, используя обычные теоремы сравнения, невозможно.
238 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Действительно, в отличие от граничных режимов с обострени- обострением, различные решения задачи A), B) могут иметь различные и не- неизвестные заранее моменты обострения t* ф t\ (из F) видно, что при прочих равных условиях tf тем меньше, чем больше амплиту- амплитуда структуры в момент t = to). Поэтому одно из сравниваемых ре- решений перестает существовать раньше другого, и дальнейшее срав- сравнение теряет смысл (необходимо использовать более сложные методы сравнения). 2. Различные способы осреднения. Для упрощенного анализа пространственно-временных характеристик тепловых структур вос- воспользуемся методом осреднения. Различные варианты этого метода основаны на отказе от точного описания поведения решения как по пространству, так и по времени, и на переходе к некоторым средним характерным величинам, вычисляемым из более простых моделей. Применительно к тепловым структурам в качестве таких величин можно выбрать пары «амплитуда—полуширина» или «амплитуда— положение фронта». Рассмотрим первую из них. Будем считать начальную функцию То (ж) финитной, имеющей максимум в точке х = 0 и близкой к сим- симметричной функции. Тогда решение T(x,t) задачи A), B) также бу- будет почти симметричным. Приближенное решение ищется в похожем на автомодельный (см. G)) виде где ip(t) и ip(t) — зависящие от времени искомые амплитуда и полу- полуширина структуры, 0(?) — некоторая фиксированная финитная моно- монотонно убывающая функция, причем 6@) = 1. Потребуем, чтобы (8) удовлетворяло интегральным равенствам (законам сохранения) х = 0. Первое их них — закон сохранения энергии, второе моментное уравнение следует из интегрирования A), умноженного на T(x,t) (ср. с п. 4 § 3 гл. III). Для простоты в A) положено ко = qo = 1? что не ограничивает общности, так как эквивалентно использованию замены t1 = qot, х' = х (qo/koI/2. Интегрированием двух последних равенств по частям с учетом того, что при х = =Ьоо поток тепла — Та дТ/дх
§ 3] МЕТОД ОСРЕДНЕНИЯ равен нулю, получаем сю сю 2 dt J J \dx dx Подстановка (8) в (9) дает систему для ip(t), <p(t): где i/i, i/2 j ^з — положительные постоянные, сю = /«•* 239 (9) A0) = 2 A1) = 2 Г 00+1 dU ( При этом предполагается, что функция 0(^) такова, что выражения для i/i, г/2, 1/з имеют смысл. Систему A0) нетрудно разрешить относительно производных: ) 2 V - ^2 A2) Ч> -(*+V = 0, а от A2) — перейти к уравнению Лф ф афР-^у2 - 1 = 0, <р > 0, A3) где а = A/3 — 2/i)/2/2? Ь = (^з ~ 2z/i)/z/2. Потребуем выполнения условия 1/3 > 2г/ь т. е. а > 0, Ь > 0, A4)
240 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V необходимого для того, чтобы система A2) допускала режимы с обост- обострением. Итак, анализ задачи A), B) свелся к изучению обыкновенно- обыкновенного дифференциального уравнения первого порядка. Такое же сильное упрощение получается для осреднения «амплитуда—положение фрон- фронта». Решение ищется в том же виде где ф(?) > 0 — амплитуда структуры, a g(t) > 0 уже не полуширина, а положение ее движущегося фронта. Функция 6(?) выбирается так, что 6@ > 0, 0 < ^ < 1, и 6@ =0, i^ 1, 0@) = 1, 0'(О) = 0. В качестве первого интегрального уравнения для ф и д выберем закон сохранения энергии и аналогично A0) получим m)(t)] il3(t) t>o. Для вывода дополнительного уравнения воспользуемся тем, что g(t) — фронт тепловой волны, и поэтому W(g(t),t) = 0, T(g(t),t) = 0. Дифференцируя второе из этих тождеств по времени: dg dt dt используя A) и записывая производные в виде пределов, придем к ра- равенству dg у \T(g(t),t)-T(x,t) dt \x\->g-(t) \_ g(i) —x \W(g(t),t)-W(x,t) \x\->g~(t) I g(t) — x Оно упрощается, если учесть, что g(t) — точка фронта и dg л T(x,t) л \W(x,t) *, Л -р lim ,\' ' = lim , ; ? ; + Т0(х,t) . dt \x\^g-(t) g{t) - x \x\^g-(t) [g{t) - x \ В окрестности фронта по предположению температура, как и в инерт- инертной среде, имеет следующее асимптотическое представление: T(x,t) ~ ~ (#(?) — |ж|I//<т (см. в § 1 решения с движущимся фронтом для уравне- уравнения A) без источника). Тогда, как нетрудно проверить, второй член справа в последнем равенстве мал и им можно пренебречь (что и объяс- объясняет предположение о малом влиянии источника энергии на структуру решения у фронта). Отсюда получаем формулу *°=Ш™=- lim IT-* 9^\ A7) dt т^о Т т^о I дх) v }
§3] МЕТОД ОСРЕДНЕНИЯ 241 для скорости dg/dt движения фронта волны. Подстановка A5) в A7) дает dg(t) dt 9(t) ' t>0, где щ = -@*)'A)/ст > 0. Разрешая A6) относительно i>'(t), запишем A6), A8) как а затем перейдем к уравнению A8) A9) V ] , 9>0, /*=^- B0) Как и в предыдущем случае, эволюция средних характеристик тепло- тепловой структуры описывается гораздо более простой моделью, чем ис- исходная. 3. Классификация режимов горения теплопроводной сре- среды. Начнем анализ задачи A), B) со случая /3 = а + 1, опираясь на первый способ осреднения. Уравнение A3) имеет простой вид: сир2 — 1 b(f2 — 1 ф > 0, (р > 0, B1) и легко интегрируется: где Со ^ 0 — постоянная, определяемая начальными значениями </?@), ip@). Характер эволюции тепловой структуры наглядно виден из пове- дения фазовых траекторий уравне- уравнения B1) (рис. 75). Жирной линией показана траектория Ч> = Ps = = т- <22) отвечающая автомодельному S-pe- жиму горения F) (она же — изо- изоклина бесконечности уравнения Рис. 75 B1)), штриховая линия — изокли- изоклина нуля (р = а/2 < (fs- Справедливость B2) вытекает из того, что в соответствии с F) функцию 0(?) в (8) естественно взять в виде 16 А. А. Самарский, А. П. Михайлов
242 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Тогда из F) получаем для амплитуды и полуширины соотношения № = L V / J а для коэффициентов v\, z/2, cr + 2 1/1 " 2(<t + 1) ' из A1) — ^2 сг + 4 сг (сг + 2) ' Подстановка этих выражений в B1) приводит к тождеству, т. е. авто- автомодельное решение абсолютно точно описывается методом осреднения. Что же касается неавтомодельных решений, то все они, как видно из рис. 75, развиваются в режиме с обострением, их траектории стре- стремятся к автомодельной: ip(t) —>¦ </?s, t —^ tf. Отсюда следует (упр. 4) t->tf, B3) т. е. на развитой стадии горение протекает по автомодельному зако- закону. На начальной стадии оно может идти более сложным образом: при функциях То (ж) с полушириной, меньшей </?о, температура в струк- Рис. 76 Рис. 77 туре сначала уменьшается и начинает расти лишь после достижения полушириной критического размера <р = <р0. Случай /3 ф а + 1 будем анализировать с помощью уравнения B0). Оно имеет при /3 ф а + 3 общее решение (упр. 5) B4) C - где Со ^ 0 определяется начальными данными, а при C = а + 3 — решение ф2 = [д2 (Со - 2filng)]-\ Co = const > 0. B5) Поведение интегральных кривых уравнения различно в диапазо- диапазонах /3 <а + 1, сг + 1</3<сг + 3, /3 > сг + 3. На рис. 76, 77, соответ- соответствующих случаям /3 < сг + 1, сг + 1</3<сг + 3, штриховыми линиями показаны изоклины нуля фо, жирной — особая траектория (сепарат- (сепаратриса) B6)
§3] МЕТОД ОСРЕДНЕНИЯ 243 существующая при /3 < сг + 1 (и /3 > сг + 3) и отвечающая значению Со = 0 в общем решении. Рассмотрим поведение средних характеристик тепловых струк- структур. В случае /3 < а + 1 (рис. 76) все траектории сходятся к сепаратри- сепаратрисе B6), и структура, как следует из A9), асимптотически стремится к автомодельному режиму (см. G)): ф(г) ~(tf-t)e±, g(t) ~ (tf - t) W^T, t -> tf, причем g(t) —У оо при t —^ tf, т. е. локализация тепла в HS-режиме отсутствует. Более разнообразно поведение тепловых структур LS-режима ([3 > > а + 1). При а + 1<C<а + 3 (рис. 77) любая траектория имеет вертикальную асимптоту с координатой т. е. g(t) \\ t —^ tf, что означает локализацию горения в области ф f < д*. Амплитуда структуры растет по автомодельному закону ф ~ (tf — ?)~1//(^~1), t —> tf (поведение полуширины при данном способе осреднения, естественно, не описывается). Вывод о развитии обостряющейся локализованной структуры справедлив для части траекторий и в случае /3 ^ а + 3, причем для /3 = а + 3 из B5) получаем д* = = ес°/B^. Однако при C > а + + 3 (рис. 78; линии фр и ^о имеют тот же смысл, что и на рис. 76) на фазовой плоскости LS-режима существует сепарат- сепаратриса B6), разделяющая принци- принципиально разные классы реше- решений. Для начальных функций То (ж), отвечающих области вы- выше линии фв, развивается уже изученный режим с обострени- обострением. Если же начальное возмуще- возмущение имеет либо небольшую ам- амплитуду, либо небольшой размер (область ниже линии фо), то режим с обострением не развивается. Температура в структуре (см. B4)) эво- эволюционирует по закону T\ ^о = Colo "+1-" > 0, д ->¦ оо. ф(д) ~ Fo<T\ ^о = Colo "+1-" > 0, д Отсюда и из A9) получаются асимптотические оценки ф{Ь) ~ t~ ^+z, g(t) ~ t^+z, ? —)> оо. Подобное поведение характерно для автомодельных решений в сре- среде без выделения энергии, например, для решения задачи о мгновенном точечном источнике тепла из п. 2 § 1. Итак, в случае [3 > а + 3 при не- недостаточно сильном инициировании процесс горения среды затухает. 16* Рис. 78
244 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Заметим, что в HS-режиме и в обостряющемся LS-режиме существует (аналогично S-режиму) критический размер структуры ip = у?о? ПРИ достижении которого ее температура начинает расти. Метод осреднения позволил получить вполне законченную клас- классификацию структур горения в нелинейной среде. Покажем, что их возникновение не является специфическим свойством процессов, опи- описываемых параболическими уравнениями. Построим простой пример локализованных газодинамических структур. Рассмотрим непрерыв- непрерывное (без ударных волн) сжатие конечной массы газа 2Mq, заключенной внутри цилиндрического поршня (рис. 79). Одномерный процесс описывается систе- системой уравнений *—» p(M0,t) д 1 _ д dv _ dt p dm ' dt dp pp 7 = ip(m) ^ 0, B7) dr m, r 0 < m < Mo, t0 Mo где: t — время; m — массовая координата, Рис- 79 отсчитываемая от оси симметрии и связан- связанная с эйлеровой координатой соотношением dm — pr dr\ p, v, p — искомые плотность, скорость и давление газа; j > 1 — показатель адиабаты; </? — заданная энтропийная функция. Систему B7) нетрудно получить (аналогично п. 5 § 4 гл. II) из уравнений движения в форме Эйлера. Напомним: первые два уравнения B7) — законы сохранения массы и импульса, третье — интеграл адиабатичности (в отсутствие ударных волн энтропия фиксированной частицы газа со временем не меняется), четвертое — кинематическая связь между г и v. По аналогии с тепловыми S-режимами построим решение B7) в разделяющихся переменных: p(m,t) = v(m,t) = ui(t)u(m), r(m,t) =r1(t)R(m), 0 ^ m ^ Mo, t0 ^t < if, B8) причем временную часть B8) без существенного ограничения общнос- общности (упр. 6) сразу возьмем в виде степенных функций B9) р = pO(tf - ?)птг(т), v = u°(tf - i)niu(m), r = r°(tf-t)n2R(m)J 0 ^ т ^ Mo, to^t<tf<oo, и положим в дальнейшем для упрощения выкладок р° = и0 = г° = 1.
§ 3] МЕТОД ОСРЕДНЕНИЯ 245 Подставляя эти выражения в B7), получим п = -2, щ = —^ < О, п2 = - > 0. C0) 7 7 В отличие от плоского случая (см. соответствующее решение в п. 3 § 1), показатель п в законе для давления не зависит от j. Для определения тг, u, R имеем систему 2 1/ _v d(Ru) 1-7 D dvr 1 (f(m) "к h = -^—-, '-U = R-—, u = Я, 7 dm 7 "ш 7 0 < т ^ Мо, которая легко решается. Например, пространственный профиль для тг(т) дается простой формулой тг(т) = 7г(М0) + ^ '-\ , 0 ^ т <С Мо, C1) 7 где тг(Мо) определяется из закона для давления на поршне. Заметим, что в силу уравнения и = —R/j скорость газа на оси цилиндра г = О (т = 0) удовлетворяет естественному условию симметрии г>@,?) = 0. Из B9)-C1) найдем окончательный вид решения для давления: p[m,t) = (tf -t) 7г(М0) + ^~ 72 0 ^ т ^ Мо, to ^t < tf, и (с учетом третьего уравнения B7)) для плотности: G - 1) (ш - Мо) p(m,t) = (tf-t) h(p(m) h 7г(М0) , 2 0 ^ т ^ Мо, ^о ^ t < tf. Положим в последней формуле для простоты тг(Мо) = G — 1) Мо/72 и получим 4V(/)f?4l' 72 J Т 1<Р(гп)\ C2) 0 ^ т ^ Мо, t0 ^t < tf. Из C2) видно, что функция p(m,t), в отличие от р(т,?), может иметь экстремумы. Степень сжатия участка среды определяется его энтропией ip(m) и давлением в нем. Благодаря неизэнтропичности при монотонном профиле давления в волне сжатия возможно достичь большей плотности в областях с меньшим давлением и получить га- газодинамические структуры (в построенном примере структуры любой
246 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V сложности; см., например, упр. 7). Они представляют собой связан- связанные с фиксированной массой газа растущие в режиме с обострением и локализованные немонотонности плотности. УПРАЖНЕНИЯ 1. Положив формально в задаче A), B) to —>¦ — оо и Т(ж, — оо) = 0, найдите с помощью П-теоремы представление ее решения в виде G). 2. Подстановкой G) в A) получите для /(?) нелинейное обыкновенное диффе- дифференциальное уравнение второго порядка. Убедитесь, что оно не допускает преоб- преобразования подобия типа растяжение-сжатие (и поэтому не сводится к уравнению первого порядка). 3. Проверьте, что решение задачи A), B) при C = а + 1 и любых То (ж) ^Ё О обращается в бесконечность при t —>¦ tf < оо. Для доказательства постройте после- последовательно ограничивающие его снизу функции — решение задачи о мгновенном точечном источнике тепла и решение F), а затем примените теорему сравнения. 4. Получите, приближенно решая A2) при ср —>¦ ips, t —>¦ tf, формулу B3). 5. Проверьте, что уравнение B0) допускает преобразование подобия растяже- растяжение-сжатие. Используя замены вида Inip = и, Ing = v, получите его общее решение B4), B5). 6. Подстановкой B8) в B7) проверьте, что функции pi(t), v±(t), r±(t) дают- даются квадратурой, из которой при t —>¦ tf < оо асимптотически следуют временные зависимости B9). 7. Подберите примеры такого распределения энтропии (р^(т) > 0, 0 < т < < Мо, в C2), чтобы плотность имела любое наперед заданное число экстремумов N. Убедитесь, что при этом функция ^р^(т) может быть монотонной. § 4. О переходе к дискретным моделям Дадим представление об элементарных требованиях к численным методам и об основных понятиях теории разностных схем. Рассмотрим некоторые типичные подходы к конструированию дискретных анало- аналогов исходных моделей, используемых для их численного исследования. 1. Необходимость численного моделирования, элементар- элементарные понятия теории разностных схем. Как бы глубоки и разно- разнообразны ни были методы качественного анализа математических мо- моделей, область их применимости весьма ограничена. Это — либо прос- простые, главным образом линейные, модели, либо отдельные фрагменты сложных, в том числе нелинейных моделей. Единственным универсаль- универсальным способом исследования моделей является применение численных методов для нахождения приближенного решения поставленной задачи с помощью средств современной вычислительной техники и информа- информатики. Доступный «пониманию» компьютера вычислительный алгоритм, т. е. последовательность операций (арифметических, логических и т. д.), в результате выполнения которых находится решение, должен удовлетворять весьма жестким и подчас противоречивым требовани- требованиям. К ним относится, прежде всего, необходимость получить решение с заданной точностью за разумное и по возможности минимальное число действий, поскольку время одного расчета должно измеряться мину- минутами и лишь в уникальных случаях — часами. Объемы обрабатывае- обрабатываемой при этом информации не могут превышать возможностей емкости
§ 4] О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 247 машинной памяти, в процессе вычислений нельзя допускать возникно- возникновения не воспринимаемых компьютером слишком больших (малых) чисел, структура алгоритма должна быть достаточно простой и учи- учитывать архитектуру вычислительной системы и т. д. Только отвечающие этим требованиям вычислительные алгорит- алгоритмы позволяют проводить всестороннее численное исследование исход- исходной модели, подвергать ее вычислительному эксперименту, проводя ее анализ в самых разных ситуациях и получая исчерпывающую инфор- информацию об изучаемом объекте. Такое понимание математического моде- моделирования означает не просто уточнение количественных характерис- характеристик явлений, но также изучение основных их качественных свойств. Последнее важно прежде всего для нелинейных объектов, поведение которых может быть весьма разнообразным и неожиданным. Подчеркнем, что проблемы численного моделирования не снима- снимаются сами собой по мере появления все более мощных и дешевых ком- компьютеров. Это связано, по меньшей мере, с двумя причинами: усложне- усложнением выдвигаемых как практикой, так и теорией задач и необходимос- необходимостью проведения большого числа серий вычислительных экспериментов для достаточно полного изучения объекта. Поэтому разработка эффективных вычислительных алгоритмов всегда остается одной из ключевых задач математического моделиро- моделирования. Для их конструирования широко используются методы, идеи и подходы, применяемые при построении исходных математических мо- моделей. Эта связь хорошо прослеживается на примере очень широкого класса моделей — тех, которые сводятся к дифференциальным уравне- уравнениям. Для них процесс создания вычислительных алгоритмов состоит из двух главных этапов: на первом строятся дискретные аналоги ис- исходных моделей и изучаются их свойства, на втором дискретные урав- уравнения решаются численно (элементарный пример приведен в п. 4 § б гл. I). В дальнейшем основное внимание уделим первому этапу, рассмот- рассмотрев сначала простейшую краевую задачу для уравнения второго по- порядка на отрезке иA)=и2, A) предполагая здесь и далее, что ее решение (понимаемое в соответ- соответствующем смысле) существует и единственно. Переход от A) к дискретной модели разбивается на две стадии. За- Заменим непрерывную область 0 < х < I на дискретную — совокупность конечного числа точек N. Самый простой способ — равномерное деле- деление отрезка [0, /] по правилу Х{ — ih, h = l/N, 0 ^ г ^ N. Множество (Jh = шъ, U {х = 0, ж = /}, (Jh = {xi}, г ф О, N, этих точек представ- представляет собой (равномерную) разностную сетку с шагом /г, точки Xi — ее узлы (см. рис. 80, на котором черточками отмечены основные узлы сетки, а крестиками — вспомогательные узлы х^у2 = (жг+i — Хг)/2 с полуцелыми индексами). Все фигурирующие в A) функции рассматри-
248 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V ваются теперь как функции не непрерывного аргумента ж, а дискрет- дискретного аргумента Х{ (сеточные функции), например, аналогом решения г = 0 г = 1 % - 1 г г + 1 % - N - 1 г = N Рис. 80 и(х), 0 ^ х ^ 1, служит аппроксимирующее его приближенное реше- решение y(xi), 0 ^ г ^ N. На второй стадии строятся дискретные аналоги дифференциаль- дифференциального уравнения A) и входных данных. Наиболее естественная дискре- дискретизация дифференциального оператора — замена производных соот- соответствующими конечными разностями. Введем обозначения и(х + К) — и(х) и(х) — и(х — К) их — их Ux = Г > их = Г j ихх = Г • B) h h h Первые два выражения из B) — дискретная аппроксимация производ- производной du/dx, для получения которой достаточно использовать значения функции и(х) лишь в двух точках (двухточечный шаблон). Разлагая и(х) в ряд Тейлора, нетрудно убедиться в том, что du du — (x)=ux + O(h), —(x)=us + O(h), ax ax du ( h\ ^/72ч ^и ( h\ ^/72ч T~ \x + о I =ux + O(h ), -—[x--)=ux-\- O(h ). dx \ 2) dx \ 2) Другими словами, du/dx в целых узлах сетки х = xi аппроксимируется выражениями B) с первым порядком аппроксимации, а в полуцелых точках х = а^_|_у2, х = Xi_y2 (в силу симметрии) — со вторым. Для замены второй производной функции и (третье выражение B)) требу- требуется, очевидно, трехточечный шаблон х — h, x, x + h, причем d W = Uxx + О(Л2) = u(x + h)-2u(x)+u(x-h) + Q{h% т. е. аппроксимация имеет второй порядок (упр. 1). Дискретная аппроксимация входных данных в рассматриваемом случае не представляет труда и осуществляется точно: ipi = f(xi) = Объединяя все эти рассуждения, заменим A) системой N — 1 раз- разностных уравнений для нахождения N — 1 неизвестных значений при- приближенного решения yi в узлах Х{ сетки ио^. Ухх = ~<Р, ИЛИ -Ш -j — = -(pi, h C)
§ 4] О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 249 Система C) с краевыми условиями называется разностной схемой и служит дискретным аналогом модели A). Ее решение находится отно- относительно просто (см. п. 2). Проиллюстрируем, используя A)—C), элементарные понятия, свя- связанные с разностными схемами. Сеточная функция zi = i/i — Ui, г = = 0,..., 7V, т. е. разница между точным и приближенным решениями в узлах сетки х = а^, называется погрешностью. Если zi = O(ha), i = = 1,..., JV; a > 0, то разностная схема (З) сходится (с порядком а), и Zi —У 0, h —у 0 для всех г: при измельчении сетки щ сколь угодно хо- хорошо аппроксимирует точное решение и(х) в узлах Х{. Между узлами искомое решение можно при необходимости доопределить с помощью обычной интерполяции. В этом случае построение разностной схемы достигает своей цели. Чтобы установить сходимость схемы C), рассмотрим сеточную функцию ф{ = и" - Uzxi, г = 1, • • •, N - 1, называемую погрешностью аппроксимации дифференциального опе- оператора разностным, или невязкой (здесь штрихами обозначено диф- дифференцирование по ж, и" = u"(xi)). Если ipi = O(ft^), i = 1,..., N — 1; C > 0, то имеет место аппроксимация: непрерывный оператор прибли- приближается дискретным с порядком [3 (здесь, как уже показано выше, [3 = = 2), и фг -у 0, h-УО, г = 1,..., N - 1. Функция fi~ (fi, г = 0,..., TV, — погрешность аппроксимации правой части (в изучаемом примере она тождественно равна нулю, как и погрешность аппроксимации краевых условий). Вычтем во внутренних узлах сетки г = 1,..., N — 1 уравнение A) из C) и получим Ухх{ ~ и" = -Ifi + /i, I = 1, . . . , N - 1, или, учитывая равенства z = yi — щ, фг = и" — г^ж., ^Pi — ji-, при- придем к системе разностных уравнений для погрешности zi с нулевыми краевыми условиями: гях=<ф, i = l,...,N-l, z@) = z(N)=0, D) правая часть которой — погрешность аппроксимации ф. Данное свойство позволяет установить основную связь между уже введенными понятиями сходимости и аппроксимации схемы C) и по- понятием ее устойчивости. Последнее подразумевает, что для любых допустимых входных данных ip, щ, U2 выполняется неравенство ||j/||=max|jfc|<C|H=Cmax|^|, i = 0,...,N, E) где С > 0 — постоянная, не зависящая от г и от h (в данном случае устойчивость по правой части). Схема D) — частный случай C). Поэтому в случае выполнения E) (см. упр. 2) для нее немедленно имеем \г\^С\ф\, или Zi = O(h0)-yQ, h -у 0, г = 0, ...,i\T,
250 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V т. е. из свойств аппроксимации (ф = O(h@)) и устойчивости E) раз- разностной схемы C) следует ее сходимость (с тем же порядком, что и порядок аппроксимации, а = C = 2). Поясним с помощью качественных рассуждений, что установлен- установленная связь распространяется на, вообще говоря, любые классы разност- разностных схем. Пусть некоторая общая (абстрактная) задача Lu = -f(x), xeG, x = {жь... ,жп}, F) в которой L — линейный дифференциальный оператор, действующий в открытой области х Е G (Г — граница замыкания G = G U Г области G), / и \i — заданные функции х Е W1 (правая часть и значение ис- искомого решения на границе), аппроксимируется некоторой разностной схемой () Vh{lh) = /М, х G 7/i, uh = ujh U 7й, где спТь, о;^, 7^ — разностные аналоги для E, G, Г, через L^ обозначен соответствующий разностный оператор, а сеточные функции у^, (ph, fih — аналоги точного решения и и входных данных /, fi. Введем, как и выше, погрешность Zh = у к — ^к-> невязку ф^ = = (Lu)h — LhUh и, считая аппроксимацию правой части и краевых условий точной, получим с учетом F) LhZh = Фк, х е ион] Zh = Q, x e 7/г- (8) Аналогично случаю схемы C) правая часть разностной задачи для z представляет собой погрешность аппроксимации ф. Если схема G) устойчива, т. е. \\ун\\A) ^ С||<рл||B) (где символами ||-||A) и ||-||B) обо- обозначены некоторые, вообще говоря, разные нормы сеточных функций yh и iph), то из (8) следует Отсюда видно, что аппроксимация (||^|| —У 0, \h\ —У 0) и устой- устойчивость схемы G) обеспечивают ее сходимость (||^|| —У 0, \h\ —У 0). Такие же утверждения справедливы по отношению и к другим зада- задачам для дифференциальных уравнений, аппроксимируемых разност- разностными схемами, в том числе и к нелинейным (при этом определение устойчивости соответствующим образом модифицируется). Таким образом, к дискретным моделям предъявляются по мень- меньшей мере два требования — аппроксимация исходной модели и устой- устойчивость. Тогда при достаточно точном численном решении разност- разностных уравнений (как правило, они представляют собой системы линей- линейных и нелинейных алгебраических уравнений порядка N, где N — число узлов сетки) и достаточно малых шагах получается достаточ- достаточно точное приближенное решение. Подчеркнем: число узлов не может быть слишком большим (а ее шаги слишком маленькими), так как чис-
О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 251 ленное решение необходимо найти за приемлимое число операций, т. е. используя реальные сетки. Рассмотрим некоторые типичные методы построения дискретных моделей. 2. Непосредственная формальная аппроксимация. Этот, исторически первый и, как следует из названия, легко интерпрети- интерпретируемый метод прост, ясен и часто дает дискретные модели хорошего качества. Покажем это, построив разностную аппроксимацию первой краевой задачи на отрезке [0, /] для уравнения теплопроводности '• °<*<г- u(O,t)=u1(t), u@,l)=u2(t), u(x,0) = uq(x), 0 ^ х ^ /. (9) Ее решение u(x,t) предполагается существующим и ищется в области О < х < I при всех 0 <t ^Т (рис. 81). 11 T M-l t1- n i h UhT IhT -г х% а Рис. 81 XN-l I Выберем простейшую дискретизацию расчетной области, разбив ее равномерно N — 1 вертикальными и М горизонтальными линиями. Точки их пересечения между собой и с отрезками [0,1], [0,Т], [1,Т] да- дадут узлы сетки uhr- Такая сетка называется равномерной с шагом по пространству h = l/N, X{ — ih, 0 ^ г ^ N', и по времени г = Т/М, р' = jr, 0 ^ j ^ М; совокупность узлов с одинаковым индексом j — вре- временным слоем (рис. 81). В граничных (принадлежащих отрезкам [0,1], [0,Т], [1,Т]) узлах функция u(x,t) известна из краевых условий (9), и аппроксимация очевидна: у30 = щ(Р), yJN = U2(t3'), j = 0,1,..., М;
252 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Приближенное решение у\ необходимо найти на множестве внут- внутренних узлов LUhr сетки (Jhr = ^hr U 7hr- Проведем естественную ап- аппроксимацию дифференциального оператора разностным, записывая последний одинаково в любой точке (xi, Р) сетки ujhr. Производную по времени заменим первой разностью: ди/dt « (y{+1 — у{)/т- Учи- Учитывая, что в ней фигурируют значения разностного решения с двух временных слоев, вторую производную по х заменим суммой выраже- выражений (полученных в п. 1), взятых на (j + 1)-м и j-м слоях: д2и/дх2 ~ ~ аУ3хх + A ~~ а) У3хх-> гДе 0 ^ сг ^ 1. В итоге вместо (9) придем к схеме с весами (Xi,yJ) G Uhr, ГЩ представляющей собой систему (N — 1) M линейных алгебраических уравнений для нахождения стольких же значений функции yj. Каждое из уравнений A0) записано при а ф 0,1 на шеститочечном шаблоне с использованием узлов с индексами (г — 1, j + 1), (г, j + 1), (г + 1, j + 1), (г — 1, j), (i,j), (i + 1, j). Погрешность ее аппроксимации в общем слу- случае есть величина О(т + /г2), т. е. первого порядка по времени и второго по пространству. Для симметричной схемы с а = 1/2 порядок аппрок- аппроксимации по времени увеличивается до О(т2) (упр. 3). При а — 0,1 из A0) получаются более простые чисто явная (а = 0, четырехточечный шаблон (i,j + l), (г —l,j), (i,j), (i + l,j)) и чис- чисто неявная (а = 1, четырехточечный шаблон (г — 1, j + 1), (г, j + 1), (i + l,j + l), (i,j)) схемы. При ст = 0 каждое из уравнений схемы A0) содержит лишь одну неизвестную величину yj+ . Поэтому ее решение легко находится по явным формулам при переходе от j-ro к (j + 1)-му слою с использова- использованием известных значений решения на границе (на слое j = 0 решение известно из начальных данных). В случае неявной схемы (и всех схем с а ф 0) разностные уравне- уравнения содержат три неизвестных величины: yj^1, yj+ , yj^ ; на каждом временном слое получается задача типа C). Подобные задачи для трех- трехточечных уравнений вида МУг-\ ~ СгУг + Biyi+1 = -FU I = 1, . . . , TV - 1, (П) УО = Х1У1 + jUlj VN = ^N-1 + jU2, где Ai ф 0, Bi ф 0, г = 1,..., TV - 1, при условиях \d\ ^ |^| + \Bi\, i = 1,...,7V- 1; |xa| ^ 1, a = 1,2; |^i| + \x2\ < 2 (для (З) и A0) эти
4] О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 253 условия выполнены) относительно легко решаются методом прогонки. У решения A1) предполагается наличие рекуррентной зависимости вида Уг = OLi+lVi+l + А+Ъ подстановка которой в A1) дает для коэффициентов a^ A2) рекур- рекуррентные соотношения + Из них с помощью краевого условия при г = 0 находятся a^+i, /3^+1 во всех узлах сетки (прямая прогонка). Далее, с помощью усло- условия в точке i = N при известных a^+i, A+i п0 формуле A2) вычис- вычисляются значения у^, i/n-Ij • • • ? 2/ъ 2/о (обратная прогонка). Заметим: простота решения алгебраической системы A0) обусловлена простой (трехдиагональной) структурой ее матрицы. Несколько более сложными, чем в п. 1, рассуждениями устана- устанавливается устойчивость схемы A0), причем существует качественная разница между случаями а = 0 и а = 1. Чисто неявная схема устойчива при любом соотношении между шагами /гиг (безусловная устойчи- устойчивость), в то время как для чисто явной схемы необходимо выполне- выполнение неравенства г ^ С/г2, С > 0 — некоторая постоянная (условная устойчивость). Данное требование (типичное для явных разностных схем, порождаемых параболическими уравнениями) может наклады- накладывать слишком жесткие ограничения на шаг по времени. Поэтому, не- несмотря на свою простоту, явные схемы для решения этих задач прак- практически не используются. Аналогичным образом строятся разностные схемы типа A0) для отличных от (9) краевых задач и более общих параболических урав- уравнений. Например, для уравнения нелинейной теплопроводности ди д / , ч ди -?7 = ^- к(и) — dt дх \ дх одна из очевидных аппроксимаций первой краевой задачи выглядит следующим образом: Уг ~Уг 4i-l yJ0 = wi@, #0, yjN = u2(l, V), j = 0,1,..., M; где ^,i/ и fc^_i/ — некоторые приближения коэффициента теплопро- теплопроводности в полу целых узлах г + 1/2, г — 1/2, взятые для простоты на
254 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V j-m слое. Данная неявная устойчивая схема легко решается, как и A0), методом прогонки. Если же коэффициент теплопроводности аппрокси- аппроксимируется на (j + 1)-м слое, то она становится нелинейной и решается с помощью соответствующих методов последовательных приближений {итерационных процедур). Итак, на основе прямой аппроксимации в ряде случаев просто по- получаются дискретные модели, обладающие нужными качествами. В то же время его формальное применение может привести также и к построению дискретных аналогов исходных моделей, не имеющих ничего общего со своими прообразами. Возьмем весьма естественную аппроксимацию уравнения (9) — разностное уравнение записанное на пятиточечном шаблоне (i,j + l), (i + l,j), (i,j), Вместе с соответствующими краевыми условиями оно образует трехслойную схему (в отличие от двухслойной схемы A0)), имеющую погрешность аппроксимации О(т2 + h2) и легко решаемую по явным формулам. Однако данная схема непригодна, так как неустойчива при любых /гиг {абсолютно неустойчива). Ее решение при ограниченных краевых условиях может становиться сколь угодно большим, когда j —У оо (t —У оо), что противоречит принципу максимума для уравне- уравнения (9). Поясним это, представляя решение уравнения A3) с нулевыми граничными условиями как сумму частных решений (гармоник), каж- каждая из которых имеет вид y{k){x,t) = T^(t) X^k\x), к = 1, 2,..., N — 1 (разделение переменных). Тогда, подставляя у^к)(х, t) в A3) и разделяя переменные, для любой гармоники имеем rpj+1 _ 1(k) j-l где Xk = 4/(h2) • smGrkh/2) > 0 — параметр разделения, или собствен- собственное значение для гармоники с номером к (упр. 4). Временная часть решения ?/(*;) (ж, ?), как следует из A4), подчиня- подчиняется уравнению имеющему частное решение вида T?jt = qkT?k^ (из данной связи сле- следует Ttjt1 = ^+1ТЯч). При этом qk должна удовлетворять уравнению ql + OLkQu — 1 = 0 с действительными корнями, один из которых по модулю больше единицы при любых а^. В силу этого при достаточ- достаточно больших j в общем решении уравнения A3) могут присутствовать сколь угодно большие по абсолютной величине гармоники.
§ 4] О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 255 Подобными примерами не исчерпываются недостатки непосредст- непосредственной формальной аппроксимации. В более сложных ситуациях для порождаемых ею дискретных моделей могут не выполняться даже фун- фундаментальные свойства, присущие исходным объектам. Проиллюстрируем это, рассмотрев следующую задачу для ста- стационарного уравнения теплопроводности: 4 (к(х) г I 0> 0 < ж < 1, к(х) ^ d > О, dx\ dx) и@) = 1, иA)=0. Модель A5) — одна из простейших в теории теплопередачи за тем исключением, что коэффициент теплопроводности к(х) может быть разрывной функцией (теплопроводящий материал состоит из разных веществ). Раскроем дифференциальный оператор A5): d ( du\ d2u dk du dx \ dx) dx2 dx dx ' и используем для полученного выражения совершенно естественные, на первый взгляд, замены (сетка равномерная) d2u dk ki+i — ki-i du — Щ-\ db?~U*x' dx~ 2h ' dx~ 2h ' С учетом граничных условий A5) придем к разностной схеме yi+1 - 2yj + ^i ki+1 - kj yi+1 - yjx h2 + 2/i 2/i ~U' 0 < i < N, 2/о = 1, yN = 0, имеющей порядок аппроксимации O(h2). Пусть к(х) — разрывная кусочно-постоянная функция: (ки 0<ж<?, к{х) = \ A7) [к2, ?<х<1, где ? — иррациональное число, ? = хп + 6h, хп = n/i, 0 < в < 1, к\ф фк2. При такой функции к(х) решение A5), очевидно, линейным обра- образом зависит от ж, причем наклон функции и(х) различен в областях с разными значениями коэффициента теплопроводности. Единствен- Единственное решение определяется из условий сопряжения в точке х = ?, т. е. из условия непрерывности температуры и~(?) = ^+(?) и потока тепла () +() (W(x) = -к(х) du/dx): и(х) = I A8)
256 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Нетрудно найти решение разностной задачи A6) в случае A7), пользуясь тем, что уравнение A6) имеет вид yi-\ — 2yi + yi+i = 0 при % ф n, i /п + 1 и, следовательно, /3A-Xi), Хп+1 ^ X ^ 1. A9) Коэффициенты а, [3 получаются из уравнений A6) в точках г = п, 1 а~ \i + A - \i) i + h (A - в - A - в) ц) ' Ь — к Ън + 1 Из этих формул видно, что а —> ао = (/i + A — /i) ^)~1, /3 —>¦ /Зо = при /г —>- 0. Поэтому при /г —у 0 функция ?/(ж, /г) — решение (9), доопределенное между узлами сетки с помощью линейной интерполя- интерполяции, — имеет предел 1 — аох, 0 ^ х ^ ?, { ? B0) ^() Функции B0) и A9) совпадают лишь в случае я = 1 (fci = ^2). Следовательно, решение разностной задачи стремится при h —> 0 не к решению задачи A3), а к совсем другой функции: разностная схема A6) расходится. Причина ее расходимости устанавливается из анализа решения B0) в точке х = ?: температура в ней непрерывна (и~(?) = и+(?)), а поток тепла претерпевает разрыв (W~(?) Ф И^+(?); упр. 5). Схема A6) нарушает закон сохранения (баланс) тепла в веществе, т.е. фунда- фундаментальный закон, на основе которого получаются все модели процесса теплопередачи. Подобные дискретные модели называются неконсерва- неконсервативными и, как правило, не могут использоваться для исследования исходных моделей. 3. Интегро-интерполяционный метод. Из приведенных при- примеров ясно, что переход к дискретным моделям нельзя осуществлять чисто формально. Он должен оставлять в силе по возможности наи- наибольшее число основных свойств, которыми обладают модели исход- исходных объектов. Применительно к уравнению A5) это означает, что для отве- отвечающей ему разностной схемы необходимо выполнение дискретного аналога закона сохранения энергии. Широко используемый подход к построению таких схем основан на записи этого закона в интег- интегральной форме для ячеек х\-\ ^ х < Xi, х\ = г/г, г = 1,..., N, раз- разностной сетки с последующей заменой получающихся интегралов и производных приближенными разностными выражениями (интегро- интерполяционный метод).
О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 257 Для стационарного процесса теплопроводности без поглощения и выделения энергии уравнение баланса тепла на отрезке я^_у2 < х < < Жг+у2 (выбраны полу целые индексы) означает равенство потоков на его границах: Wt-ifr - Wi+,h = О, i = l,...,N-l. B1) Проинтегрируем равенство W(х) = —к(х) du/dx на отрезке ж,_1 ^ ^ X <^ Х{. Щ-1 - Щ Xi W(x) к(х) dx, и, предполагая W(x) = Wi_i/2 = const при Xi-\ ^ х ^ xi (простейшая интерполяция), получим -/ Xi-l dx откуда приближенное значение для Wi_y2 дается формулой -1 щ - щ-1 /1 I dx h k(x) Подставив ее в B1), придем к консервативной (ср. с A6)) раз- разностной схеме Уг+1 — h 1 h Уг Xi 1 Уг 1 dx k{x) -Уг-1 h -i ) Г ° / ds k(xi + 1 sh) г ^ N -1, -. -1 B2) для которой закон сохранения энергии выполнен как для каждой ячей- ячейки, так и для всего отрезка [0,1] (упр. 6). Таким же образом строятся консервативные дискретные модели для более сложных, в том числе нелинейных и нестационарных процессов теплопередачи. Применимость интегро-интерполяционного и подобных ему мето- методов распространяется на широкие классы моделей. Он важен, в част- частности, для задач газовой динамики, решения которых (см. п. 2 § 1) могут быть разрывными. Построим консервативные разностные ап- аппроксимации для уравнений одномерного течения газа, записанных в массовых координатах (п. 5 § 4 гл. II) в дивергентном виде: dr]dv dvdp dr]__dv_ dv___dp_ д_( v\ _ д ~di~d^' ~dt~~d^' ^V+^"/ ~^ д B3) 0 < m < M0. 17 А. А. Самарский, А. П. Михайлов
258 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Здесь t — время, т — массовая координата; rj = 1/ р — удельный объем (р — плотность), v — скорость, р — давление и е = e(rj,p) — внутрен- внутренняя энергия газа. Введем сетку с равномерными шагами по времени и пространству: uh = {"И = ih, г = 0,1,..., N] h = Mo/N}, иТ = {tj = jr, j = 0,1,..., M; r = T/M}, uhT = Qh U wT. Ради простоты для сеточных аналогов газодинамических величин со- сохраним те же обозначения, относя функцию v к целым точкам сетки (т = шг), а р, ?7, € — к полуцелым (т = ш^_|_у2). Проинтегрируем второе уравнение B3) в прямоугольнике ш^_у2 ^ ^ш ^ mi+y2, P ^t^ tj+1: ^+i, P ^ t ^ P+1\ J (Vj+1 - rj>) dm- j (vi+1 - Vi) dt = 0, а остальные — в прямоугольнике rrii ^ m tj + 1 "Ч+l г / Iе + тJ е + тJ ~ Iе + ~2 tj+1 dm+ I Временные интегралы, входящие в эти тождества, заменим выра- выражениями tj+1 f pdt p^T, vdt tj+1 r, f (pv)idt=p4a3)vla4)r, где /(*«) = aap+1 + A - <ra)fi, aa — веса (a = 1,2,3,4), p#i = = 0,5 (pi-i/2 + Pi+i/2). Пространственные интегралы заменим по оче- очевидному правилу, например, г + 72 + j vdm*Vih, j г] dm
§ 4] О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 259 В итоге придем к четырехпараметрическому семейству разност- разностных схем 7 + 1 7 ^ (°"з) (сг4) _ (сг3) (сг4) _ P*j+1 ^г+1 ^*г Vi Т h где Ei+i/2 = ?i+y2 + (г?| + г>?+1)/2 — полная энергия г-й ячейки газа. Они представляют собой консервативные дискретные аналоги уравне- уравнений B3) при любых аа, а = 1,..., 4. Для них имеют место разностные аналоги законов сохранения массы, импульса и полной энергии в любой ячейке сетки (интегрированием уравнений B4) по сетке пьт нетруд- нетрудно установить справедливость законов сохранения в дискретной форме для всей массы газа 0 ^ m ^ Mq). При а\ — 0, сг2 = сг3 = сг4 = 1 система B4) может быть решена по явным формулам: сначала находятся vj+ , затем rf^y •> а из третьего уравнения B4) и уравнения состояния рг] = G — 1) ? (в случае идеаль- идеального газа) методом прогонки определяются с использованием краевых условий при г = 0, ъ = N значения Pi+y2 для всех г = О,1,...,Л/\ Неяв- Неявные схемы B4) решаются с помощью итерационных методов. В отличие от уравнений параболического типа, явные схемы для гиперболических уравнений устойчивы не при условии г ^ Ch2, а при выполнении гораздо более мягкого неравенства г ^ С/г, и поэтому час- часто применяются на практике. Заметим также, что при практических вычислениях в газодинамические разностные схемы вводится искус- искусственная «вязкостью, сглаживающая сильные разрывы. Это заметно облегчает проведение расчетов, так как отпадает необходимость в спе- специальном выделении областей разрывов (однородные схемы). 4. Принцип полной консервативности. Более существенное отличие дискретных моделей газовой динамики от моделей теплопере- теплопередачи заключается в разнообразии способов математического представ- представления законов сохранения для газа. В частности, третье уравнение B3) может быть записано не для полной энергии Е = е + v2/2, а для внут- внутренней энергии ?, причем по меньшей мере в двух видах: де dv де дг] dt = -pd^> at = -pdt- B5) Для исходной модели эти и другие формы записи эквивалентны и переходят одна в другую при соответствующих преобразованиях урав- уравнений. В случае дискретных моделей данное свойство отнюдь не га- гарантируется. Например, из третьего уравнения консервативной схемы B4), вообще говоря, не следуют дискретные аналоги уравнений B5). 17*
260 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Верно и обратное: для схемы, аппроксимирующей уравнения внут- внутренней энергии, не обязательно выполняется закон сохранения полной энергии. Простым примером служит неконсервативная схема «крест» -vj, +'h г-1/2 Vi+IL Vi-Ll/' B6) erAl л, - < -v] ¦ 3 + r ^+72 h для написания которой используется «шахматная» сетка (см. рис. 82; точками и крестиками обозначены узлы применяемого шеститочечно- шеститочечного шаблона; функции г, р, т\ отнесены к полуцелым, a v — к целым узлам) и легко решаемая в случае pr] = (j — 1) е по явным формулам. Подобная «частичная», неполная консервативность дискретных моделей может сделать их непригодными для численного моделиро- моделирования (сохранение полной энергии не означает, что ее составляющие — ки- кинетическая и внутренняя энергии, а с ними скорость и температура га- газа, — рассчитываются правильно, и т. п.). Поэтому при построении дис- дискретных моделей необходимо отразить в них как можно большее число фун- фундаментальных свойств исходных объ- объектов. Взяв за исходное четырехпара- метрическое семейство консерватив- • з + 72 г ~ 72 i + 1h i + 1 Рис. 82 ных схем B4), получим обладающие сформулированным качеством разностные аппроксимации уравнений B3). Для упрощения дальнейших выкладок введем обозначения Pi =Pi+y2 ?г = ?4А -72' Р = . v = vj, h Vj+l ~ h после чего черту над р, т\ и е будем опускать (кроме специальных случаев). С той же целью будем вместо третьего уравнения B4) рас- рассматривать аппроксимацию первого уравнения B5) для внутренней энергии. Кроме того, понадобится формула -r(j3-a)fu B7) где а и C — любые числа, /(") = af + A — а) /, / = /J+1.
§ 4] О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 261 С учетом сделанных замечаний из B4) получается четырехпара- метрическое семейство схем vt — Рт -> Vt — vm -> ?t — Р Vm , [Z&) от которых потребуем полной консервативности, т. е. того, чтобы они аппроксимировали также уравнение для полной энергии (третье уравнение B3)) и второе уравнение B5). Из второго уравнения B8), равенства Vm = Vm — т (сг4 — — G2) Vmt — Vt + r (^4 — СГ2) Vmt и третьего уравнения B8) следует где 8\Е = — г (сг4 — &2)Pmt • Таким образом, схема B8) аппроксими- аппроксимирует второе уравнение B5) лишь при выполнении равенства <72 = о^. Если это равенство не выполняется, то возникает дисбаланс 8\Е внут- внутренней энергии, вызванный появлением в дискретной среде дополни- дополнительных (фиктивных) источников и стоков энергии. Найдем теперь 62E — дисбаланс полной энергии. Умножим первое уравнение B8) на г>@'5) = 0,5 (v + {?) и получим уравнение после чего сложим его с третьим уравнением B8): (сгч) ((Тл) 0,5 (c"i) /оп\ = —Р JV — V Pffi • v ^/ t Преобразуем правую часть B9) с помощью формулы B7): = (p(ai) + г (сг3 - cri)pt) (^'5) + г (сг4 - 0,5) vmt) + ^@'5)р^ъ где приняты обозначения + г(сг4 -0,5)р^х) +г2 (сг3 -cri) (сг4 -Q, В итоге B9) принимает вид Таким образом, уравнение B9) не аппроксимирует уравнение для полной энергии (то же самое относится и к схеме B6); см. упр. 7). Дис- Дисбаланс 8ъЕ, как и дисбаланс 6\Е, имеет искусственное происхождение.
262 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V Он отсутствует лишь в случае о^ — ох-, о± = 0,5 и, следовательно, а2 = = 0,5. Объединяя эти результаты, придем вместо четырехпараметричес- кого семейства схем B8), полученных с помощью интегро-интерполя- ционного метода, к однопараметрическому семейству _ _J°"i) т - ?.@,5) _ _Г)(сг1) @,5) /оп\ vt — Pfh -> 4t — vm -> ?t — Р Vm {3V) полностью консервативных {8\Е = 82Е = 0) дискретных моделей газо- газовой динамики. Заметим, что третье из уравнений C0) можно заменить одним из уравнений а вместо последнего взять одно из уравнении / о \ / о с е + ^М =-(pW>)m, e + — Схема C0) в общем случае обладает аппроксимацией О(т + /i2), а при о\ = 0,5 аппроксимация по времени имеет второй порядок. При а1 = 0 схема C0) явная, и ее решение находится по простым формулам. Из структуры 8\Е и 82Е хорошо видно, что они особенно велики, если характеристики газа сильно меняются по пространству и по вре- времени (разрывные течения, сильная неоднородность среды, режимы с обострением и т. п.). В этих ситуациях фиктивные источники энергии становятся сравнимыми с реальными величинами, и результаты чис- численного моделирования исходного объекта заметно отличаются от его действительного поведения. Дисбалансы могут быть уменьшены с по- помощью уменьшения шага по времени г, что, естественно, приводит к соответствующему увеличению числа расчетных операций (уменьше- (уменьшение шага сетки по пространству вообще не сказывается на величине 6гЕ, 82Е). Принцип полной консервативности, нашедший применение при ре- решении многих сложных задач, — один из надежных подходов к по- построению дискретных моделей с необходимыми качествами. 5. Построение разностных схем с помощью вариационных принципов. Вариационные принципы, служащие одним из основных способов получения математических моделей различных объектов, ши- широко используются также и для построения соответствующих дискрет- дискретных аналогов. Этому способствуют их универсальность, относитель- относительная простота применения, связь с законами сохранения и свойствами симметрии. Самый естественный путь при таком подходе — дискре- дискретизация исходного объекта (среды), формулировка для полученного объекта вариационного принципа и вывод на его основе связей (урав- (уравнений) для дискретных величин, т. е. завершение конструирования искомой дискретной модели.
§ 4] О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 263 Построим, следуя этой логике, разностные схемы для уравнений B3) одномерной газовой динамики в лагранжевых координатах и срав- сравним их со схемами пп. 3, 4. Будем рассматривать газ как совокупность соседствующих друг с другом материальных «точек» («частиц»), разбив его массу Mq для простоты равномерно на N частей с массой mi+i/2 = Mo/N, i = = 0,1,..., N — 1 (масса ш^+у2 — аналог шага h в B4), B5)). Другими словами, как и в п. 3, введем разностную сетку с узлами в точках г = 0,1,...,А/'и равномерными по массе ячейками. Координаты и ско- скорости частицы (ячейки) охарактеризуем через декартовы координаты Xi, Xi+i и скорости Vi, Vi+i соответствующих узлов. Остальные пара- параметры материальных точек — плотность Pi+y2, удельный объем %+у2, давление Рг+у2, внутреннюю энергию ?г+у2 — отнесем к середине ячей- ячейки (полуцелый индекс). Применим для построенной таким образом дискретной среды принцип Гамильтона, выбрав Xi(i), Xi-\-i(i) в качестве обобщенных координат ячеек (величины Vi(t) = dxi/dt = xi, ^+i(?) = dxi+i/db = = Xi+i играют роль обобщенных скоростей). Кинетическую энергию системы определим достаточно очевидным выражением N-l N-1 2 , 2 т = как сумму энергий каждой частицы (возможны и другие выражения) ,,2 _|_ „,2 vi «Потенциальную» энергию частиц будем соотносить с их внут- внутренней энергией б^+уь = ?г+у2(жг?жг+1)? поскольку ее «высвобождение» дает возможность совершить работу, подобно тому как замыкание обкладок заряженного конденсатора высвобождает запасенную в нем энергию, преобразующуюся в движение зарядов; см. п. 4 § 2 гл. III. Заметим, что такое определение потенциальной энергии для рассмат- рассматриваемой системы, как и обоснование потенциальности ее движения, требует подробного и громоздкого анализа (в п. 3 § 2 гл. III он про- проведен для более простого случая малых колебаний струны). Поэтому ограничимся приведенными выше качественными соображениями. Суммарная потенциальная энергия совокупности ячеек есть N-l N-1 г=0 г=0 где V^_|_y2 — энергия отдельной частицы. «Лагранжиан» дискретной газовой среды дается выражением C1) - \ ц. - i =0
264 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V а функционал действия — формулой Q = Jb(x(t),x(t),t)dt = to J2 mi+i/2 (Щ +4^+1 - ei+ih{xi,xi+1)\ dt. C2) to i=0 V У Проварьируем в соответствии со схемой применения принципа Га- Гамильтона (п. 3 § 1 гл. III) действие C2) по всем кинематически воз- возможным путям, вычислив сначала вариации составляющих его членов. Так как V{ = i^, то Г 7 ^ SXi о Vi Sx 4 ) 4 dxi 2 Вариация внутренней энергии дается формулой а для вариации действия имеем 6Q = *i jv-l / / dt. Проинтегрируем в последнем равенстве члены vi Sxi и г?«+1 ^ж^+i по частям, учтем перестановочность операций варьирования и диф- дифференцирования по времени (Sxi = d(Sxi)/dt) и примем во внимание условие Sxi = 0, г = 0,..., N — 1, при t = to, t — t\. Получим выра- выражение, из которого видно, что в силу независимости вариаций Sxi для 5Q имеем, что 5Q = 0 лишь тогда, когда равны нулю коэффициенты при любой Sxi, т. е. при выполнении уравнений dt ~ dxi дхг ' *-u'---'JV -1- В их левых частях записано ускорение ячеек газа. Чтобы вы- выяснить смысл правых частей, напомним, что для рассматриваемых здесь адиабатических течений справедливы равенства de = —pdrj и e{p,rj) = ?G7) (см. формулы B7), B9) из § 4 гл. II). Отсюда для дис- дискретной среды получаем dei+y2 = -pi+i/2drji+i/2, ei+i/2 = e(rji+i/2) = = e[(xi+i — Xi)/mi+i/2]. Проводя преобразования rn i+i/2
4] О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 265 придем к окончательному виду полученных из принципа Гамильтона уравнений движения газовых «частиц» (на равномерной сетке): ^ Рн1*~Р<-1* < = о лг-1. (зз) Присоединим к C3) уравнение %^ = ^^, i = 0,...,N-l, C4) следующее из равенства ^+у2 = (жг+i — Жг)/^г+у2 (закон сохране- сохранения массы ячейки), а также вытекающее из равенства de^+y2 = = -Рг+у2 *7г+у2 и из C4) уравнение ~5Г = "^ ^Г = -Рн-% ^^- , i = O,...,JV-l, C5) выражающее закон изменения внутренней энергии. Вместе с заданным уравнением состояния б^+уь = ^(^г+Уг) система C3)-C5) представляет собой полудискретную модель динамики газа, отвечающую всем необходимым законам сохранения — импульса, мас- массы, энергии (заметим, что закон сохранения полной энергии Е = Т + V сразу следует из инвариантности лагранжиана C1) по отношению к сдвигу времени). Проводя в C3)-C5) замену производных по времени конечными разностями, переходя к безындексным обозначениям и вводя веса а±, &2, сгз 5 ?, получим дискретную модель газовой динамики vt = -p^m, щ = v{Z2\ st = ~Р(аз)У(ш4\ совпадающую с разностной схемой B8), построенной в п. 3 с помощью интегро-интерполяционного метода (при соответствующем выборе ве- весов она становится полностью консервативной). Применимость продемонстрированного подхода не ограничивает- ограничивается рассмотренным выше простейшим случаем (см., например, упр. 8). Вариационные принципы эффективно используются для получения дискретных моделей в весьма трудных ситуациях (многомерные про- процессы, сетки сложной структуры и т. д.). 6. Использование иерархического подхода к получению дискретных моделей. Основная идея данного подхода — исполь- использование знания о месте подлежащей дискретизации модели в иерархии моделей изучаемого объекта. Если иерархия построена по принципу «сверху вниз», то, проведя частичную или полную дискретизацию об- общей модели, затем переходят к дискретной модели более низкого уров- уровня. Естественно, используется способ перехода, принятый для исход- исходных моделей. В результате выполнения подобной процедуры в постро- построенную дискретную модель привносятся дополнительные черты модели
266 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ [ГЛ. V более высокого уровня, и это может повысить адекватность аппрокси- аппроксимирующей модели исходному объекту. Конкретизируем эти рассуждения, рассмотрев уравнения, описы- описывающие одномерные течения невязкого нетеплопроводного газа (запи- (записанную в дивергентном виде одномерную систему D), A0), A5) из § 4 гл. II) др | д(РУ) = Q dt дх Здесь Е = р (V2 /2 + SRT/2) — сумма кинетической и внутренней энер- энергий единицы объема газа, т. е. его полная энергия, Т = p/(pR) — тем- температура, R = к/т — газовая постоянная, к — постоянная Больцмана, т — масса атома или молекулы газа. Напомним, что в пп. 4, 5 § 3 гл. III уравнения C6) получены из ки- кинетического уравнения Больцмана в результате его «осреднения» при условии, что функция распределения f(x,v,t) локально максвелловская (формула E) § 3 гл. III): где v — скорость хаотического движения частиц газа (при максвеллов- ском распределении в среде отсутствуют вязкие напряжения и потоки тепла). Дискретные аналоги уравнений C6) можно строить любым из описанных в предыдущих пунктах способом. Иерархический подход в данном случае (и для некоторых обобщений C6)) заключается в сле- следующем: 1) функция распределения / (решение уравнения B) § 3 гл. III) и макрохарактеристики газа рассматриваются как функции дискрет- дискретного аргумента Р, j = 0,1,..., т. е. проводится дискретизация по времени исходной модели — кинетического уравнения Больцмана; 2) величина г = Р+1 — Р (шаг дискретизации) берется достаточно малой, чтобы удовлетворить условию г ^ 1/\ (г?) |, где / — характерная длина свободного пробега, | (v) | — модуль характерной скорости час- частиц. Поэтому за время г число столкновений между частицами неве- невелико и ими можно пренебречь (см. вывод уравнения Больцмана); 3) функция распределения /J+1 = f{x,v,P+1) изменяется (см. вы- вывод уравнения Больцмана) в сравнении с функцией /J = f(x,v,P) лишь за счет изменения частицами их фазового объема, поэтому спра- справедлива простая связь f(x,v,tj+1)=f(x-VT,v,tj), C8)
§ 4] О ПЕРЕХОДЕ К ДИСКРЕТНЫМ МОДЕЛЯМ 267 являющаяся решением уравнения Больцмана в отсутствие столкнове- столкнове4) связь C8) упрощается путем разложения f^1 в ряд Тейлора по параметру vr: с точностью до членов третьего порядка; так как функция распределе- распределения экспоненциально убывает с ростом v2, то вклад частиц с большими скоростями считается малым и соответствующие члены в C9) отбра- отбрасываются; 5) подобно тому, как это делалось в п. 4 § 3 гл. III при выводе урав- уравнений для моментов, соотношения C9) последовательно умножаются на функции Ф(у), соответственно равные 1, mv, mv2/2 (сумматор- ные инварианты), и интегрируются по всем скоростям г?; в результа- результате связь между /J+1 и /J преобразуется в связи уже между средними гидродинамическими параметрами газа такими, как плотность, поток массы, полная энергия: /Г f mv2 mfdv, pV = / mvfdv, i? = / fdv, и другими величинами, взятыми в моменты Р, Р+1 (иными словами, получается дискретная по времени гидродинамическая модель среды); 6) после соответствующей дискретизации по пространству стро- строятся окончательные дискретные (и по времени, и по пространству) модели газа, учитывающие некоторые черты исходно