Автор: Бамберг П.   Стернберг Ш  

Теги: математика  

ISBN: 5-7036-0110-Х

Год: 2006

Текст
                    £·-. -ι~.~
*τ
ν»
w
2 *itf£iiWw'' Ь -/ы-W
г.
R
В ■-"-' ьу


Предлагаемый куре лекций известных профессоров Гарвардского университет П Ьамберге и Ш. Стернберга пользуется большой полу- пйрностыо среди физиков и инженеров, считающих для r«fln необходимым освоить основные елвмвнты соиременной метеметики. Помимо традиционных 1имцюсов этот курс содержит и ммшвнив ОСНОв ТОПОЛОГИИ И гоомо? рии, топологический ■ мысп уравнений Мвковеллв, «ом11П41ксный анализ, воимп- юг^оский метод Лапласа и начала термодинамики. Объединение всех втих рдэдолое математики и .|>й1м«и ■ одной монографии, •тсомненнО. П0ЛО1НО ДЛЯ студентов и аспирантов |ми:сииских университетов и позволит им быстро включиться в проходящие - ио и<:вм мире игг ледовыми ■ теоретической и математической физике. ,·♦.; '. * · •••м - » Я. Г. Синай на ступенях МГУ (фоте Я. Г. Синай аяалемикРАН
В. И. Арнольд сентябре 1963 года Moser) История преподавания математического анализа, начиная с его изобретения Ньютоном, изобиловала крутыми поворотами. К середине XX века традиционные изложения стали отличать полное исключение всех геометрических понятий и представлений, с одной стороны, и полный отрыв от физики и всех приложений, с другой. Предлагаемая книга знаменует возвращение преподавания математики к естественнонаучному подходу, для которого характерны явная геометричность и прямое представление математики как части физики, непосредственно пригодной для многочисленных приложений как в естествознании, так и в инженерном деле. Это возвращение математики в русло естественных наук происходит сейчас и на уровне новых научных исследований, а его проявление в преподавании давно стало абсолютно необходимым. β. И. Арнольд академик РАН
Пол БАМБЕРГ Шломо СТЕРНБЕРГ КУРС МАТЕМАТИКИ для СТУДЕНТОВ-ФИЗИКОВ Том II Главы 12-22 ПЕРЕВОД С АНГЛИЙСКОГО к.ф.-м.н., доц. Л.П.Котовой (МФТИ) ПОД РЕДАКЦИЕЙ к. ф.-м. н., доц. А. Н. Якивчика (МГУ) φ МОСКВА 2006
УДК 51 Издание осуществлено при поддержке Центрального аэрогидродинамического <Г*11ДГУГ~------ института имени Η. Ε. Жуковского, директор В. Г. Дмитриев *fe?%> Фонда «КНИГА-НАУКА-КУЛЬТУРА», *vMb27s директор В. Б. Филиппов Бамберг П., Стернберг Ш. Курс математики для студентов-физиков. Том II, главы 12-22. Перев. с англ. Л. П. Котовой под ред. А. Н. Якивчика. — М.: ФАЗИС, 2006. 664c.(xix-xxxvi, 575-1220) ISBN 5-7036-0110-Х Paul Bamberg & Shlomo Sternberg A Course in Mathematics for Students of Physics © Cambridge University Press 1990 (Vol. 2) Издательство ФАЗИС 123557 Москва, Пресненский вал, 42-44 e-mail: publisher@phasis.ru hiip://www.phasis.ru Типография «Наука» Академиздатцентра РАН 121099 Москва Г-99, Шубинский пер., 6 Заказ №3639 ISBN 5-7036-0110-Х © ФАЗИС, 2006
Оглавление тома II Предисловие XXV От издателя русского перевода XXXV Глава 12. Теория электрических цепей 575 Введение 575 12.1. Линейные цепи с резисторами 580 12.2. Топология одномерных комплексов 590 12.3. Коцепи и d-оператор 604 12.4. Базисы и дуальные базисы 607 12.5. Методы Максвелла 610 12.6. Матричные выражения для операторов 614 12.7. Теорема Кирхгофа 626 12.8. Цепи переменного тока в стационарном режиме и фильтры 630 Резюме 636 Задачи 637 Глава 13. Метод ортогональных проекций 645 13.1. Метод ортогональных проекций Вейля 645 13.2. Метод Кирхгофа 650 13.3. Теорема взаимности Грина 656 13.4. Цепи с конденсаторами 661 13.5. Краевые задачи 667 13.6. Решение краевых задач методом ортогональных проекций Вейля 671 13.7. Функции Грина 678 13.8. Ядро Пуассона и случайное блуждание 683 13.9. Теорема взаимности Грина в электростатике 686 Резюме 692 Задачи 693 Глава 14. Комплексы высших размерностей 705 14.1. Комплексы и гомологии 705 14.2. Дуальные пространства и когомологии 728
XXII Оглавление тома II Резюме 737 Задачи 737 Глава 15. Комплексы в пространстве Шп 745 Введение 745 15.1. Внешняя алгебра 749 15.2. fc-формы и оператор d 757 15.3. Интегрирование fc-форм 760 15.4. Теорема Стокса 777 15.5. Дифференциальные формы и когомологии 792 Резюме 805 Задачи 806 Глава 16. Электростатика в пространстве Ж3 817 16.1. От дискретности к непрерывности 817 16.2. Граничный оператор 820 16.3. Телесный угол 822 16.4. Напряженность электрического поля и электрическое смещение 824 16.5. Диэлектрическая проницаемость 836 16.6. Звездный оператор в трехмерном евклидовом пространстве 837 16.7. Формулы Грина 842 16.8. Гармонические функции 844 16.9. Метод ортогональной проекции 848 16.10. Функции Грина 850 16.11. Интегральная формула Пуассона 853 Резюме 859 Задачи 859 Глава 17. Токи, потоки и магнитостатика 863 17.1. Токи 863 17.2. Потоки и векторные поля 865 17.3. Внутреннее произведение 871 17.4. Производные Ли 879 17.5. Магнетизм 883 Приложение: альтернативное доказательство фундаментальной формулы дифференциального исчисления 890 Резюме 893 Задачи 893 Глава 18. Звездный оператор 897 18.1. Скалярные произведения и внешняя алгебра 897 18.2. Звездный оператор 901 18.3. Интеграл Дирихле и лапласиан 909 18.4. Оператор D в четырехмерном пространстве-времени 916 18.5. Алгебра Клиффорда 920 18.6. Звездный оператор и геометрия 931 18.7. Звездный оператор и векторный анализ 933 Приложение: тензорные произведения 936
Оглавление тома II XXIII Резюме 953 Задачи 953 Глава 19. Уравнения Максвелла 969 19.1. Уравнения 969 19.2. Одномерное однородное волновое уравнение 974 19.3. Однородное волновое уравнение в пространстве Ж3 977 19.4. Неоднородное волновое уравнение в пространстве Ж 981 19.5. Лагранжиан электромагнитного поля и тензор энергии-импульса 983 19.6. Волновые фронты и принцип Гюйгенса 988 Резюме 994 Задачи 994 Глава 20. Комплексный анализ 997 Введение 997 20.1. Комплекснозначные функции 999 20.2. Комплекснозначные дифференциальные формы 1001 20.3. Голоморфные функции 1004 20.4. Вычисление вычетов 1010 20.5. Приложения и следствия ,. 1021 20.6. Локальное отображение 1031 20.7. Контурные интегралы 1040 20.8. Пределы и ряды 1047 Добавление: связь между голоморфными и гармоническими функциями 1052 Резюме 1055 Задачи 1056 Глава 21. Асимптотическое вычисление интегралов 1065 Введение 1065 21.1. Метод Лапласа 1066 21.2. Метод стационарной фазы 1072 21.3. Гауссовы интегралы 1076 21.4. Групповая скорость 1080 21.5. Формула обратного преобразования Фурье 1082 21.6. Асимптотическая оценка формулы Гельмгольца 1084 Резюме 1086 Задачи 1087 Глава 22. Термодинамика 1089 22.1. Теорема Каратеодори 1090 22.2. Классическая термодинамика по Борну и Каратеодори 1100 22.3. Энтропия и абсолютная температура 1108 22.4. Системы с одной конфигурационной переменной 1115 22.5. Условия равновесия 1131 22.6. Системы и состояния в статистической механике 1137 22.7. Произведения и образы 1144
XXIV Оглавление тома II 22.8. Наблюдаемые, ожидаемые значения и внутренняя энергия 1149 22.9. Энтропия 1158 22.10. Равновесие в статистических системах 1161 22.11. Квантовые и классические газы 1171 22.12. Определители и следы 1175 22.13. Квантовые состояния и квантовая логика 1182 Резюме 1188 Задачи 1189 Приложение: доказательство теоремы о нормальной форме 1192 Рекомендуемая литература 1201 Предметный указатель 1207
Предисловие В этой книге излагается курс математики, который мы преподавали в Гарварде в течение восьми лет. Курс предназначен для студентов, интересующихся физикой и имеющих хорошую подготовку по математическому анализу функций одной переменной. Полезно некоторое знакомство с линейной алгеброй, но это не обязательно. Большинство наших студентов одновременно с этим курсом изучают сложные курсы по физике, так что они могут соединить излагаемые здесь сведения со своими физическими знаниями. Такое совмещение полезно, но не обязательно. Основное содержание нашего курса — теория и физические приложения линейной алгебры и математического анализа функций нескольких переменных, включая внешнее исчисление. Наш педагогический метод — изложение по «спирали», т. е. мы рассматриваем одну и ту же тему несколько раз, возвращаясь к ней на все более высоком уровне, одновременно расширяя области ее применения. Такое построение мы предпочитаем «прямолинейному» строгому логическому порядку. Надеемся, что при этом мы избежим логических ошибок типа «порочного круга», но часто будем начинать с простого случая того или иного понятия, а затем возвращаться к нему для обобщений, делая это только после ознакомления с родственными понятиями и, как следствие, приобретения более широкого взгляда на предмет. Такой подход требует от студентов определенного доверия и терпения. Но мы надеемся, что, в конце концов, они будут вознаграждены более глубоким интуитивным пониманием предмета в целом.
XXVI Предисловие Теперь расскажем о содержании книги более детально. Цель первых четырех глав — познакомить читателя с алгеброй и анализом квадратных матриц. Таким образом, изучив эти главы, студент должен научиться думать о матрицах как о самостоятельных объектах, а не просто как о наборе чисел, выстроенных по квадрату. В этих главах мы рассматриваем почти исключительно матрицы 2x2, когда самые сложные вычисления сводятся к решению квадратных уравнений. Но каждый раз мы формулируем результаты, имея в виду матрицы более высокого порядка. Глава 1 начинается с объяснения связи закона умножения матриц 2 χ 2 и геометрии прямых линий на плоскости. Далее излагается алгебра матриц 2x2, обсуждается детерминант и его отношение к плоскости и ориентации. Мы вводим определение абстрактного векторного пространства в общем случае, объясняем понятие базиса и замены базиса в одномерном и двумерном векторном пространстве. В главе 2 мы обсуждаем конформную линейную геометрию на плоскости, т.е. геометрию линий и углов и их связь с определенного вида матрицами 2x2. Кроме того, вводятся понятия собственных значений и собственных векторов, столь важные в квантовой механике. Мы пользуемся этими понятиями, чтобы построить алгоритм вычисления степеней матрицы. В качестве примера, где это применяется, обсуждаются основные свойства цепей Маркова. Основная задача главы 3 — показать, что система однородных линейных дифференциальных уравнений с постоянными коэффициентами может быть записана в виде du/dt = Аи, где А — матрица, а и — вектор, и что решение этой системы имеет вид е^*ио, где ио задается начальными условиями. При этом, конечно, требуется объяснить, что означает экспонента, в показателе которой стоит матрица. Кроме того, описывается качественное поведение решений в неоднородном случае, в том числе обсуждается явление резонанса. Глава 4 посвящена изучению скалярных произведений и квадратичных форм. В ней имеется много физических приложений, в том числе обсуждение нормальных форм и детальное изложение специальной теории относительности.
Предисловие XXVII В главах 5 и б изложены основные положения дифференциального исчисления. В главе 5 определяется дифференциал отображения одного векторного пространства на другое, обсуждаются его основные свойства, в частности, правило дифференцирования композиции. В качестве физических приложений рассматриваются задача Кеплера и приближение Борна. Мы даем определения частной производной и производной по направлению, определяем линейные дифференциальные формы. В главе б продолжается изложение дифференциального исчисления. Мы представляем в векторной форме теорему о среднем значении, формулу Тейлора и теорему об обратном отображении. Обсуждаем поведение критических точек и множители Лагранжа. Главы 7 и 8 знакомят читателя с интегральным исчислением. Глава 7 посвящена изучению линейных дифференциальных форм и их интегралов. Особое внимание уделено замене переменных. Кроме того, обсуждаются и другие одномерные интегралы, например, длина дуги. Глава 8 посвящена изучению внешних форм второй степени и соответствующих им двумерных интегралов. Вводится понятие внешней производной и подчеркивается инвариантность относительно замены переменных. Доказывается двумерный вариант теоремы Стокса, т.е. теорема Грина. Рассматриваются поверхностные интегралы в трехмерном пространстве. В главе 9 результаты первых восьми глав используются при построении физической теории — оптики. Вся глава посвящена приложениям, и ее молено опустить без ущерба для понимания последующего материала. В главе 10 мы возвращаемся назад и доказываем основные свойства конечномерных векторных пространств и их линейных преобразований. Обычно это непосредственное обобщение результатов, полученных в первых четырех главах в двумерном случае. Но при этом дан новый алгоритм редукции матрицы по строкам. Вводятся два новых понятия — дуальное пространство и фак- торпространство (в начале курса их было трудно определить). В дальнейшем эти понятия окажутся чрезвычайно важными.
XXVIII Предисловие Глава 11 посвящена свойствам детерминантов матриц η χ п. Тема рассмотрена аксиоматически, показаны основные вычислительные алгоритмы. Главы 12-14 знакомят читателя с математикой формы, т. е. с алгебраической топологией. В главе 12 мы начинаем изучение электрических цепей. При этом рассматриваются два аспекта. Во-первых, изучаются «провода» цепи, т. е. как соединяются между собой различные ветви. На математическом языке это называется топологией одномерных комплексов. Во-вторых, мы изучаем реакцию цепи в целом, если нам известно поведение отдельных ветвей, в частности изменение мощности и энергии. Мы приводим несколько примеров цепей, интересных с физической точки зрения. В главе 13 мы продолжаем изучение цепей. Исследуем краевые задачи, связанные с емкостными цепями, и применяем изложенные методы для решения ряда классических задач электростатики, включающих проводники. В главе 14 мы кратко показываем, как результаты, полученные в главах 12 и 13 в одномерном случае, обобщаются на случай большего числа измерений. Главы 15-18 посвящены разработке внешнего дифференциального исчисления, рассматриваемого как непрерывная версия дискретной теории комплексов. В главе 15 излагаются основные сведения о внешнем исчислении: внешняя алгебра, fc-формы, замена переменных, внешняя производная и теорема Стокса. Глава 16 посвящена электростатике. Мы рассматриваем диэлектрические свойства вакуума как непрерывный аналог емкости цепи, причем эти диэлектрические свойства определяют евклидову геометрию в трехмерном случае. Излагаем основные положения теории потенциалов. В главе 17 мы продолжаем изучение внешнего дифференциального исчисления. Основные темы: векторные поля и потоки, внутренние произведения и производные Ли. Полученные результаты применены для решения задач магнитостатики. Глава 18 заканчивает изучение внешнего исчисления углубленным обсуждением общего случая звездного оператора.
Предисловие XXIX Главу 19 молено считать кульминацией всего курса. В ней результаты, полученные в предыдущих главах, применяются для исследования уравнений Максвелла и связанных с ними волновых уравнений. Главы 20 и 21 никак не связаны с главами 9-19, и их молено читать независимо. Обычно они не включаются в наш годовой курс. А вот главы 1-9, 20 и 21 могут составить самостоятельный краткий курс математики. Материал главы 20 представляет собой относительно стандартное изложение теории функций комплексного переменного, которое вполне доступно для студентов, подготовленных к чтению этой книги. В главе 21 обсуждаются простейшие аспекты асимптотик. В главе 22 показано, как, следуя идеям Бора и Каратеодори, внешнее исчисление молено использовать в классической термодинамике. Большинство математиков и все физики, результаты которых представлены в этой книге, работали в первом десятилетии двадцатого века. Это значит, что изложенному материалу уже по крайней мере 90 лет. И, тем не менее, он еще не вошел в наши элементарные курсы математики, хотя большая его часть (за исключением, может быть, теории цепей) должна изучаться современными физиками, что они и делают на определенном этапе своей карьеры. Причины этого, в значительной мере, исторические. У. Гамильтону (1805-1865) было очевидно, что вещественных и комплексных чисел недостаточно для глубого изучения геометрического анализа, что в декартовой геометрии дву- и трехмерного пространства возникает желание рассматривать числа парами и тройками, как самостоятельные объекты с собственными алгебраическими свойствами. Для этого он разработал алгебру кватернионов, которая была очень популярна в Англии в середине девятнадцатого века. Однако, теория имела ряд изъянов: кватернионы более естественны в пространстве четырех, а не трех измерений. Геометрия трех измерений возникала как часть более общей конструкции, а не как самостоятельная теория. Кроме того, кватернионы имели слишком сложную алгебраическую структуру. Например, очень громоздкой была связь мехеду
XXX Предисловие умножением кватернионов и геометрическими построениями в трехмерном пространстве. (Конечно, первый недостаток сегодня считался бы не очень серьезным, но вместо него возникло бы другое возражение: теория ограничена четырьмя измерениями.) В конце концов, векторная алгебра в трехмерном пространстве с ее скалярным и векторным произведениями была очищена от теории кватернионов. Ее объединили с необходимыми дифференциальными операциями, в результате чего появился векторный анализ, окончательно разработанный Дж. Гиббсом (1839-1903) и обнародованный им в своей знаменитой книге «Элементы векторного анализа», оказавшей сильное влияние на дальнейшее развитие науки. Итак, векторный анализ с его операциями grad, div, curl и т. д. стал стандартным языком изложения геометрических законов физики. Однако, несмотря на то, что векторный анализ прекрасно описывает геометрию трехмерного пространства, он тоже имеет ряд существенных недостатков. Первый — и наименее серьезный — состоит в том, что в нем не просматривается очень важное единство: например, не ясно, что фундаментальная теорема исчисления одна — сейчас ее называют общей теоремой Стокса, а теоремы Грина, Гаусса и классическая теорема Стокса являются ее частными случаями. В рамках векторного анализа мы не можем это увидеть. Более серьезный недостаток состоит в том, что фундаментальные операторы (например, grad, div) предполагают евклидову структуру пространства, т. е. подразумевают трехмерное пространство и ориентацию (например, curl). Это значит, что теория работает только в трехмерном ориентированном евклидовом пространстве. При этом возникает еще одна проблема — при произвольном изменении координат операторы ведут себя неприятно, их выражения в неортогональных координатах очень громоздкие. Уже А. Пуанкаре (1854-1912) в своих фундаментальных научных и философских работах, предшествовавших теории относительности, подчеркивал необходимость делать различие между «топологическими» законами геометрии и физики, т. е. законами, которые зависят только от дифференциальной структуры пространства и поэтому инвариантны относительно гладких преобразований, и законами, зависящими от геометри-
Предисловие XXXI ческой структуры, например, от понятия расстояния. Теория относительности оказала огромное влияние на развитие математики главным образом потому, что она поощряла изучение теории многомерных пространств, которая уже существовала в математической литературе, но не считалась важной для изучения геометрии. Кроме того, необходимо было исследовать произвольные изменения координат. Векторный анализ не мог решить эти две задачи и поэтому позднее его дополнили тензорным анализом. Но и тензорный анализ с его обилием индексов тоже имеет много серьезных недостатков. Главный изъян состоит в том, что невероятно трудно сказать, какие операции имеют общее геометрическое значение, а какие связаны только с данной системой координат. Таким образом, тензорный анализ очень хорош для вычислений, но трудно сказать, что именно вычисляется. Вся работа, начатая еще Гамильтоном и направленная на создание математического аппарата, в котором объекты имеют геометрический смысл, оказалась напрасной. Для того, чтобы заставить теорию работать, необходимо было ввести аффинную связь — довольно изощренную геометрическую конструкцию. Но даже с такой конструкцией геометрическое значение операций не стало прозрачным. По существу интуитивно ясный векторный анализ так и не был вытеснен тензорным анализом из программ начального университетского обучения. Математики в основном уже согласились, а физики постепенно привыкают к тому, что самым удобным аппаратом для геометрического анализа является внешнее дифференциальное исчисление Грассмана и Картана. Его преимущество состоит в том, что наряду с простыми и четкими правилами вычисления все объекты имеют прозрачный геометрический смысл. Внешнее исчисление работает при любом числе измерений, хорошо себя ведет при отображениях и изменениях системы координат, обладает существенным единством основных теорем и четко различает «топологические» и «метрические» свойства. В рамках внешнего анализа геометрические законы физики принимают простую и элегантную форму. Чтобы это продемонстрировать, полезно привести таблицу, взятую из книги «Курс математической физики», написанную Тиррингом.
XXXII Предисловие Таблица 1. История записи уравнений Максвелла. Константы с, μο> и е0 положены равными 1. Однородное уравнение Неоднородное уравнение Самая ранняя форма дВх , дх i" dEz _ ду Шж д% дх дВу ,дВг η ду + Й2 7U оЕу А dEz _ r дх - пУ Шж. R ду ~ °z Шж. + дЕУ дх ду dBz дёу ду dz Шж. _ §В± д% _ ЭВХ дх ду + d-k = p = Эх + Ёх = Зу + Еу = Зг + Εζ Конец XIX века VB = 0 V χ Ε = -Β V-E = p V хВ =j + E Начало XX века *FP*,a = 0 FP°,a = J? Середина XX века dF = 0 SF = J В 1844 году Г. Грассман (1809-1877) опубликовал книгу «Aus- dehnungslehre». Математическое сообщество не оценило эту работу и ведущие немецкие математики того времени проигнорировали ее. Фактически, Грассман так никогда и не получил место в университете; всю свою жизнь он преподавал математику в школе. Однако, похоже, что он прожил счастливую и плодотворную жизнь. У Грассмана была большая семья и он считался признанным экспертом по санскритской литературе. В конце жизни он попробовал еще раз выпустить новое издание «Ausdehnungslehre», но оно также не имело успеха. Толь-
Предисловие XXXIII ко немногие из математиков того времени оценили его работу. Среди них был К.Мебиус (1825-1908). Тем не менее, в книге «Ausdehnungslehre» впервые появились ключевые в современной математике понятия и большинство алгебраических структур, используемых в этой книге. В ней были определены: векторное пространство, внешняя алгебра, внешнее и внутреннее произведение, теорема Стокса в обобщенной форме. В настоящее время общепризнано, что Э. Картан (1869-1951) является крупнейшим специалистом по геометрии в XX веке. Его ранние работы, относящиеся к группам Ли и дифференциальным уравнениям в частных производных, имеющие огромное значение для современной математики, тоже сначала не были поняты. Но в 1920 году они стали известны широкому кругу ученых. К этому времени теория групп Ли начала играть ключевую роль в математике и физике, и Г. Вейль заново представил их в своих статьях. В настоящее время работы Картана по основным узлам и связям (известные под общим названием «калибровочные теории») являются основой теории элементарных частиц. В 1922 году Картан опубликовал книгу «Лекции по интегральным инвариантам», где показал, что изобретенное им внешнее дифференциальное исчисление является гибким инструментом не только для геометрии, но и для вариационного исчисления с широким кругом физических приложений. Как уже было сказано, признание пришло не сразу, но сегодня и физики, и математики считают, что внешнее исчисление позволяет наилучшим образом формулировать геометрические законы физики. И нам кажется, что пришла пора заменить им векторное исчисление в программах начального университетского обучения. Необходимо пояснить, почему в книге так много внимания уделено теории электрических цепей, хотя обычно эта тема не входит в учебные программы по математике. Прежде всего, это оправдано с педагогической точки зрения. Данная тема всегда нравится студентам. Она позволяет на очень приземленном уровне ввести понятия дуального пространства и факторпро- странства. Иначе эти понятия кажутся студентам слишком абстрактными и поэтому трудно воспринимаются ими. Кроме того, в дискретном, алгебраическом подходе к теории цепей теорема
XXXIV Предисловие Стокса появляется, по существу, как естественное определение, что позволяет понять роль оператора d и теоремы Стокса при формулировке внешнего исчисления. Конечно, есть более глубокие, философские причины, почему мы приняли решение подробно рассказать о теории цепей. Уже почти сто лет, как люди думают, что силы, удерживающие макроскопические тела, имеют электрическую природу. Таким образом, понятие твердого тела и отсюда евклидова геометрия вытекают из электростатики (конечно, в нерелятивистском приближении, когда понятия твердого тела и геометрия Евклида имеют смысл). Физические исследования как предельно малых объектов (элементарных частиц) , так и предельно больших (космология) заново ставят фундаментальные вопросы о геометрии пространства и времени. Мы полагаем, что разумно уже в самом начале изучения математики дать студентам представления о связи геометрии и физики. Без сомнения, сторонники компьютеров и ряда современных теорий в физике зададут вопросы о дискретности, противопоставляемой непрерывному характеру пространства и времени (проблема, поднятая Риманом в его диссертации об основах геометрии). Надеемся, что наше обсуждение может быть полезно тем, кто в будущем станет решать эту проблему. Наш курс математики читается в течение одного года, и поэтому мы вынуждены были опустить некоторые важные темы. Мы не обсуждаем бесконечномерные векторные пространства, в частности, гильбертовы пространства; не даем определения и не изучаем абстрактные дифференцируемые многообразия и их свойства. Наш опыт показал, что эти темы слишком сложны для студентов, и усилия, которые необходимо затратить на их объяснение, лучше использовать по-другому. Конечно, в книге есть места, где нам приходится компенсировать отсутствие этих понятий. Однако, более серьезно то, что в книге нет подробного обсуждения гармонического анализа Фурье, классической механики и теории вероятностей. Мы только слегка касаемся этих тем, не давая подробного изложения. Нас может извинить только то, что каждая из этих тем потребовала бы семестрового курса, а их подробное изложение на современном уровне легко найти. В конце книги приводится список рекомендуемой литературы.
От издателя и редактора русского перевода XXXV Нам приятно поблагодарить профессора Даниэла Гороффа, тщательно прочитавшего рукопись, за многочисленные исправления и полезные предложения. Мы искренне благодарим Джин Моррис за отличное качество набора, за то, что она внимательно сопровождала производство книги на протяжении восьми лет — с самого начала проекта до его завершения. От издателя и редактора русского перевода Данный курс является примером глубокого синтеза математических и физических знаний и методов. По нашему мнению, хотя он называется «Курс математики для студентов-физиков», с тем же успехом его молено рассматривать как «Курс физики для студентов-математиков». Первый том содержал изложение основополагающих математических понятий и теорий, таких как дифференциальное и интегральное исчисление, векторные пространства и линейные преобразования, линейные дифференциальные уравнения. На этом этапе в качестве области применения изучались теория колебаний, специальная теория относительности и гауссова оптика. Во втором томе математический аппарат не только заметно развивается, но и находит важные физические приложения. Прежде всего это электромагнитные явления — от теории электрических цепей (глава 12) до уравнений Максвелла (глава 19). Термодинамике и статистической механике посвящена глава 22. То обстоятельство, что курс рассчитан всего на один год, но при этом затрагивает самые разные разделы математики, которые на математических специальностях российских университетов преподаются на протяжении большей части срока обучения,
XXXVI От издателя И редактора русского перевода вынуждает авторов использовать местами весьма конспективный стиль изложения. Это выражается в том, что опускаются детали строгих математических доказательств важных результатов (на которые, впрочем, обычно дается ссылка). А некоторые области, как теория вероятностей или алгебраическая топология, вообще представлены только начальными сведениями. Построение курса также не в полной мере соответствует российской университетской программе. Так, ряды Фурье (без которых трудно представить решение многих современных задач физики и других естественных наук) вводятся только в конце главы 20, посвященной комплексному анализу. (Учитывая важную роль гармонических функций в физике, в частности, как потенциалов силовых полей, редактор сделал к той же 20-й главе небольшое добавление о взаимосвязи между гармоническими функциями двух переменных и аналитическими функциями комплексного переменного.) При переводе и редактировании были исправлены многочисленные ошибки и неточности оригинала. Редакторы (первого и второго томов) добавили к тексту довольно много примечаний. Обновлены и уточнены списки рекомендуемой литературы, даны ссылки на имеющиеся русские переводы. Заново составлен предметный указатель; во втором томе он охватывает материал всей книги. Мы надеемся, что этот современный курс, весьма отличающийся от отечественных образовательных традиций, будет интересен не только студентам, но и преподавателям. Надеемся также, что издание будет полезно широкому кругу научных работников разнообразных физических, технических и математических специальностей. Мы будем благодарны читателям за любые замечания по книге; просим направлять их нам по адресу publisher@phasis.ru. Москва, май 2006
Глава 12 Теория электрических цепей Главы 12-14 молено считать введением в математику формы, т. е. в алгебраическую топологию. В главе 12 мы начинаем изучение электрических цепей. Здесь имеются два аспекта. Во-первых, изучается система проводов цепи с точки зрения связи между собой различных участков. На математическом языке это называется топологией одномерных комплексов. Во-вторых, предполагая, что мы знаем поведение отдельных участков, изучается реакция цепи в целом, в частности, рассматриваются мощность и энергия. Приводятся примеры цепей, интересные с физической точки зрения. Введение Теория электрических цепей является приближением к электромагнитной теории, когда предполагается, что все интересные явления происходят в проводах и других элементах этих цепей. При этом также предполагается, что цепь может быть разложена на различные компоненты с определенным характером поведения, и задача состоит в том, чтобы предсказать поведение всей цепи, если ее компоненты соединяются различными способами. Основные переменные теории цепей хорошо известны по бытовым приборам: это ток, напряжение и мощность. Фундаментальной единицей электромагнитной теории является заряд
576 Глава 12. Теория электрических цепей электрона. К моменту написания этой книги (до обнаружения кварков) частица, заряд которой был бы долей заряда электрона, неизвестна. На практике единицей заряда считается кулон, который противоположен заряду 6.24 χ 1018 электронов. В 1819 году Эрстед заметил, что поток электрического заряда создает силу, действующую на магнитную иголку, причем эта сила пропорциональна скорости потока заряда. Этот эффект измерять гораздо легче, чем электростатические силы, которые требуются для измерения заряда. Поэтому именно ток, а не заряд, считается основной переменной теории цепей. Единицей тока является ампер, причем 1 ампер = 1 кулон/секунду. Ток будем обозначать буквой I. Итак, с® где I — ток, измеряемый в амперах, Q — заряд, измеряемый в кулонах, at — время, измеряемое в секундах. Вообще говоря, мы могли бы ожидать, что ток, протекающий по цепи, зависит от точки наблюдения. В теории цепей предполагается, что ток принимает определенное значение на каждом линейном участке (ветви) цепи (но может и меняться со временем). Пусть а обозначает некую ветвь в цепи, тогда Ia(t) обозначает ток, протекающий через а в момент t. Проходя вдоль участка цепи, элемент заряда приобретает энергию или теряет ее. Изменение энергии (измеряемой в джоулях) на единицу заряда (измеряемого в кулонах) называется напряжением. Это значит, что 1 вольт = 1 джоуль/кулон. Напряжение будем обозначать буквой V. Напряжение (разность потенциалов) между двумя концами ветви α в момент t обозначается Va(t). Произведение тока на напряжение имеет размерность энергии/время и называется мощностью, измеряемой в соответственно ваттах, т. е. 1 ватт = 1 вольт χ ампер = 1 джоуль/секунду. В теории цепей предполагается, что существует три типа ветвей: индукторы, конденсаторы и сопротивления. Для каждого типа имеется определенное соотношение между напряжением и током. В индукторе напряжение пропорционально скорости изменения
Введение 577 тока, т. е. если а обозначает индуктор, то ala _ а La~dt ~ V ' где постоянная La называется индуктивностью. Соответствующая единица индуктивности называется генри, т. е. 1 генри = 1 вольт/(ампер/секунду) = 1 вольт χ секунду/ампер. В конденсаторе ток пропорционален скорости изменения напряжения. Если а — конденсатор, то Са ~~dt где постоянная Са называется его емкостью и измеряется в фарадах, т. е. 1 фарад = 1 кулон/вольт. Для сопротивлений (резисторов) существует функциональное соотношение, связывающее ток и напряжение (но не их производные) . В классической теории линейных пассивных цепей оно имеет вид V = RI, где постоянная R, измеряемая в омах, называется сопротивлением ветви. График1 этого соотношения на плоскости I,V изображен на рис. 12.1. Это прямая линия, проходящая kV Рис. 12.1. Простой резистор Рис. 12.2. Реальная батарея через начало координат. Любой прибор, описываемый (неоднородным) линейным уравнением по I и V, мы будем считать линейным сопротивлением. Например, реальная батарея (рис. 12.2) Называемый вольт-амперной характеристикой. — Прим. ред.
578 Глава 12. Теория электрических цепей с внутренним сопротивлением Ra может быть описана уравнением Va = Wa + RaIai где постоянная Wa называется ЭДС {электродвижущей силой) батареи. Идеальная батарея, создающая напряжение Wa при любом токе, описывается уравнением уа = Wa. На рис. 12.3 изображена горизонтальная линия. Идеальный источник тока, создающий ток Ка независимо от напряжения на его полюсах, описывается уравнением 1а = Ка, т.е. графиком будет вертикальная линия. 1 lV I Рис. 12.3. Идеальная батарея рис. 12.4 Анализируя цепи, в которых напряжение и токи зависят от времени, мы должны рассматривать источники напряжения и тока, тоже зависящие от времени. В этом случае линейное сопротивление в общем виде описывается уравнением Va(t) - Wa(t) = Ra(Ia(t) - Ka(t)), где Wa(t) и Ka{t) — заданные функции времени. В более общем случае рассматриваются нелинейные сопротивления, индукторы и конденсаторы. Например, диод или тер- мистор могут считаться нелинейными сопротивлениями, описываемыми нелинейной функцией Ia = f(Va) типа изображенной на рис. 12.4. Любое обобщенное сопротивление характеризуется функциональным соотношением R(I, V, t) = 0 с единственным ограничением: в него не входят производные / и V. Обобщая понятие индуктора, молено предположить, что индуктивность зависит от тока I, и записать "=ад|-
Введение 579 Такое, например, может реализоваться в индукторе с железным сердечником, используемом для больших токов. Аналогично можно рассмотреть нелинейный конденсатор который получается, если использовать диэлектрик с нелинейным откликом2. Мы еще будем говорить о нелинейных устройствах. Однако валено осознать, что последующая теория, в основном, будет касаться получения уравнений для электрических цепей, а не их решения. Причем эти уравнения будут одинаково применимы как к линейным элементам, так и к нелинейным. А сейчас предположим, что наша электрическая цепь состоит из Ь ветвей трех типов, о которых говорилось выше. Все ветви как-то соединены друг с другом. Мы хотели бы определить токи и напряжения в каждой ветви, т. е. найти 26 неизвестных величин. Для каждой ветви у нас есть только одно уравнение (либо дифференциальное уравнение, либо функциональное соотношение между током и напряжением). Нам надо иметь еще Ь уравнений. Эти уравнения известны как законы Кирхгофа. Кирхгоф, будучи студентом на семинаре Нейманна, впервые исследовал проблемы цепей. Его результаты были опубликованы в период с 1845 по 1847 год. Он доказал существование решения проблемы цепей для случая, когда есть только пассивные линейные сопротивления. Занимаясь этой задачей, Кирхгоф первым стал изучать алгебраические свойства формы. Почти пятьдесят лет спустя Пуанкаре создал абстрактную теорию формы, как математическую дисциплину, которую назвал analysis situs. Сейчас это называется алгебраической топологией. Природа методов алгебраической топологии наиболее очевидна в случае цепей, состоящих из пассивных линейных сопротивлений. Поэтому сначала 2Имеется в виду (нетривиальная) зависимость диэлектрической проницаемости материала между пластинами конденсатора от напряженности электростатического поля. Строго говоря, при достаточно больших значениях напряженности это явление имеется у всякого диэлектрика, так как наступает его пробой (резкий рост диэлектрической проницаемости, а затем переход в состояние проводника). — Прим. ред.
580 Глава 12. Теория электрических цепей мы очень подробно изучим именно эти цепи, прежде чем перейдем к общему случаю. Исследуя такие цепи, мы будем следовать статье Г. Вейля (1923 год), в которой результаты Кирхгофа представлены в форме, прямо показывающей связь с алгебраической топологией. Законы Кирхгофа, переоткрытые Максвеллом, формулируются очень просто. Первый закон вытекает из закона сохранения заряда и состоит в том, что алгебраическая сумма токов, сходящихся в точке разветвления проводников, равна нулю. Второй закон утверждает, что существует такая функция Ф, называемая электростатическим потенциалом, что напряжение в каждой ветви определяется разностью значений Φ на ее концах. Максвелл придумал два метода решения проблемы цепей с сопротивлениями, известные сейчас как метод круговых токов и метод узловых потенциалов. Мы начнем работать с примерами, иллюстрирующими методы Максвелла, и по ходу дела сформулируем язык алгебраической топологии. 12.1. Линейные цепи с резисторами Резисторы соединяются проводами с пренебрежимо малым сопротивлением. Соединение, изображенное на рис. 12.5, называется параллельным. Предположим, что к батарее, создающей постоянное напряжение V, присоединены несколько резисторов, причем г-й резистор имеет сопротивление Ri. Введем величину Gi = RJ , называемую проводимостью3 г-го резистора. Мы хотим вычислить полный ток, поставляемый батареей, а после того, как процесс установится, — ток в каждой ветви. Соединение верхних входов резисторов обеспечивает на них одинаковый потенциал в стационарном состоянии. Аналогично имеются одинаковые потенциалы на нижних входах резисторов. Следовательно, на каждом резисторе мы имеем одно и то же напряжение, равное напряжению V, создаваемому батареей. С точки зрения теории цепей мы можем считать, что все верхние и нижние провода стягиваются в точки. Поэтому рис. 12.5 молено заменить на Единица проводимости, обратная единице сопротивления ом, носит название сименс. — Прим. ред.
12.1. Линейные цепи с резисторами 581 I I I В Рис. 12.5 Рис. 12.6 рис. 12.6, где две вершины А и В (вверху и внизу) соединяют η + 1 ветвей, на одной из которых находится батарея. Поскольку ко всем резисторам приложено одно и то же напряжение V, то из уравнения V = RI или I = GV следует, что токи, протекающие через соответствующие резисторы, равны G\V, G%V, ..., GnV. Согласно первому закону Кирхгофа, ток, протекающий через ветвь с батареей, должен быть равен по величине и противоположен по знаку алгебраической сумме токов в ветвях с резисторами, т. е. -(Gi + G2 + · · · + Gn)V. (На рис. 12.6 стрелками обозначены направления токов, причем токи, текущие сверху вниз, считаем положительными, а токи, текущие в обратном направлении, — отрицательными.) Таким образом, мы решили задачу для этой простейшей цепи, т. е. знаем напряжение и ток в каждой ветви. Из полученного результата следует, что полный ток, подаваемый батареей в этом случае, равен току от батареи, если бы в цепи был только один резистор с проводимостью G = G1 + G2 + ■ · ■ + Gn и сопротивлением R, где 1 - _L JL — R R\ i?2 Rn Итак, если несколько резисторов соединены параллельно, то они эквивалентны одному резистору, обратное сопротивление
582 Глава 12. Теория электрических цепей которого равно сумме обратных сопротивлений всех отдельных резисторов. Это хорошо известный результат, который преподается в элементарных курсах. I—AV—A^^-VW—ι Rl Й2 · ■ · Rn с Рис. 12.7 На рис. 12.7 изображена группа резисторов, соединенных проводами последовательно. Пусть в цепи имеется батарея, создающая напряжение V, в результате чего возникает постоянный ток I. (По первому закону Кирхгофа тот лее самый ток I протекает через каждую ветвь, поскольку в каждом узле алгебраическая сумма токов должна быть равна нулю.) Пусть сопротивления резисторов равны i?i, i?2> ■ ■ ■, Rn соответственно. Поскольку через г-й резистор протекает ток /, то напряжение на нем равно Ril. Из второго закона Кирхгофа следует, что напряжение на батарее должно быть равно сумме напряжений на всех резисторах, т. е. V = (Λι + R2 + ■ ■ ■ + Rn)L Поскольку мы знаем V, то из этого уравнения получаем ток I. Таким образом, задача полностью решена — мы знаем ток и напряжение в каждой ветви. Итак, если несколько резисторов соединены последовательно, то они эквивалентны одному резистору, сопротивление которого равно сумме сопротивлений отдельных резисторов. Опять хорошо известный результат. А теперь давайте рассмотрим более сложную цепь, состоящую из батареи с напряжением V, соединенной с тремя резисторами, обладающими сопротивлениями R\, R2 и R^, так, как это показано на рис. 12.8. Точка, из которой выходят два или более проводов, ведущих к различным элементам, называется узлом или вершиной. Точка А является узлом, к которому подходят два провода: от батареи и от резистора. К точке В подходят провода от
12.1. Линейные цепи с резисторами 583 трех резисторов. К точке С подходят два провода от резисторов и один от батареи. Нижний правый угол схемы не считается узлом, потому что он соединяется с точкой С проводом с нулевым сопротивлением и, следовательно, совпадает с узлом С. Итак, цепь имеет три узла А, В и С и четыре ветви: ветвь с батареей, соединяющая узлы А и С; резистор, соединяющий узлы А и В; два резистора, соединяющие узлы В и С. Длина и форма проводов, соединяющих все эти точки, не имеют никакого значения. Валены только ветви и узлы, и то, как они соединены друг с другом. Таким образом, на рис. 12.8 и рис. 12.9 изображена одна и та же цепь, в которой есть параллельные и последовательные соединения. г—WV—τ ^ΛΛ ►Дз С Рис. 12.8 Ri An + V С Яз Й2 Рис. 12.9 Сопротивления Jfo и Дз соединены параллельно и, следовательно, с точки зрения всей цепи, эквивалентны одному резистору, обратное сопротивление которого равно Щ + Щ , т. е. имеющему сопротивление ^2^3 R2 + R3 Этот эквивалентный резистор соединен последовательно с сопротивлением ili. Это значит, что для батареи есть один резистор с сопротивлением Λ = Λι + R2 + Rz'
584 Глава 12. Теория электрических цепей Ток, вытекающий из батареи, равен I = V/R. Такой же ток протекает через резистор R\, т. е. I\ = V/R. Тогда падение напряжения на резисторе R\ равняется V1 = I\R\. Ток I делится между резисторами #2 и Дз в пропорции, обратной их сопротивлениям, как мы уже видели из обсуждения резисторов, соединенных параллельно. Таким образом, токи, протекающие по резисторам i?2 и R%, равны I Я31 И I Д2/ R2 + R3 R2 + R3 Отсюда мы видим, что падение напряжения, одинаковое для резисторов i?2 иЛз, равно R2R3 т R2+R3 Итак, мы полностью рассчитали цепь, состоящую из резистора ill, соединенного последовательно с резисторами R2 и Дз, которые соединены параллельно. Такая процедура4 очень удобна для расчетов простых цепей. Для сложных цепей необходимо разработать более систематический метод. На примере этой простой цепи мы продемонстрируем оба метода Максвелла. Прежде чем перейти к этому, нарисуем цепь еще раз, изображая ветви (с их ориентацией), узлы и способ их соединения между собой, но не показывая природу отдельных ветвей (рис. 12.10). Итак, у нас есть три узла А, В, С и четыре ветви α, β, η и δ. Ветвь а идет от точки А к точке В. Запишем это символически да = В - А. Символ д называется граничным оператором. Выписанное соотношение интерпретируется следующим образом: ветвь α имеет две граничные точки В и А; ветвь выходит из точки А, поэтому Вышеописанный анализ параллельных и последовательных соединений называют также методом эквивалентных сопротивлений. — Прим. ред.
12.1. Линейные цепи с резисторами 585 мы пишем ее со знаком минус; ветвь приходит в точку В, поэтому мы пишем ее со знаком плюс. Граничные соотношения для других ветвей записываются аналогично: др = С-В, dj = C-B и д6 = А-С. Под траекторией мы будем подразумевать последовательность ветвей, проходимых в их собственном или в обратном направлении так, что конечная точка одного отрезка пути становится началом следующего отрезка. Например, траектория а + β идет из А в В и потом из В в С. Граничное соотношение для этого пути д(а + β) = В — А + С — В = С — А. Траектория β —η идет из В в С вдоль β, потом из С в В вдоль ветви 7- Граничное соотношение для этого пути δ{β — η) = С —В —(В — С) = 0. Траектория представляется как последовательность: узел, ветвь, узел, ветвь, ..., ветвь, узел, в которой каждая ветвь ограничена двумя узлами. Траектория последовательно соединяет первую и последнюю точки. Траектория называется замкнутой, если первая и последняя точки совпадают. В общем случае мы не предполагаем, что все ветви вдоль траектории разные; мы можем проходить через один и тот же узел или вдоль одной и той же ветви несколько раз. Если все элементы траектории различны (кроме первой и последней точек для замкнутой траектории), то она называется простой. Простая замкнутая траектория называется ячейкой5. 5С точки зрения русского читателя естественнее назвать такую траекторию не ячейкой (mesh), а контуром. Термин «ячейка», а чаще «клетка» (cell), более подходит для математической теории комплексов, обсуждаемой в последующих главах. — Прим. ред.
586 Глава 12. Теория электрических цепей Таким образом, Μι = а + β + δ является ячейкой, так же, как и М2 = 7 ~ β (рис. 12.11). В ячейке не важно, что является начальной точкой, т. е. ячейка β + δ + а совпадает с Μχ = α + β + δ. Однако направление имеет значение: —η + β = —Мг не то же самое, что Мг. Рис. 12.11 Рассмотрим третью ячейку Мз = a + j + δ. В каком-то смысле эта ячейка не является независимой от других: если мы формально сложим Μχ и М2, то при выполнении коммутативного закона для сложения получим Μι+Μ2=α. + β + δ + η-β = α + η + δ = Μ3. В следующем параграфе мы подробнее займемся математическим обоснованием таких манипуляций. В рамках метода круговых токов Максвелла выберем набор независимых ячеек (точное определение в следующем параграфе), например, М\ и Μ?. Введем неизвестные токи J\ и J2, протекающие по этим ячейкам (рис. 12.12). Ток J\ течет по резисторам R\, R3 и батарее; ток J2 течет вниз через резистор i?2 и вверх через резистор R-з. Если мы знаем значения токов J\ и J2, то сразу же можем вычислить значения токов во всех ветвях. Действительно, поскольку резистор i?i есть только в ячейке Μχ, то ток через Μχ равен J\. Такой же ток протекает по батарее. Поскольку резистор i?2 принадлежит только ячейке Мг, то ток J2, проходящий через эту ячейку, равен току через резистор i?2· Ветвь, содержащая резистор Яз, делает положительный вклад в ячейку Μχ и отрицательный вклад в ячейку Μ?. Таким образом, ток, протекающий через резистор i?3, равен J\ — J2.
12.1. Линейные цепи с резисторами 587 Рис. 12.12 Согласно второму закону Кирхгофа, при обходе любой ячейки изменение потенциала должно быть равно нулю. Например, в случае ячейки М\ мы имеем падение напряжения R\J\ вдоль ветви а, падение напряжения R^{J\ — J2) вдоль ветви β и рост напряжения V вдоль ветви δ, содержащей батарею. Откуда следует RiJi + Bs{Ji-J2)-V = 0. Аналогично для ячейки М2 получаем R2J2 + R3(J2 - Ji) = 0. Итак, у нас есть два уравнения для двух неизвестных J\ и J2. Очевидно, решив эти уравнения, мы получим предыдущий результат. Таким образом, идея метода круговых токов состоит в выборе независимого набора ячеек, по которым протекают неизвестные токи. Тогда токи в каждой ветви выражаются через токи в ячейках. Затем для каждой ячейки применяется второй закон Кирхгофа, утверждающий, что изменение потенциала при обходе вокруг нее равно нулю. Так получаются уравнения для каждой ячейки, т. е. мы получаем столько уравнений, сколько у нас имеется неизвестных. В каком-то смысле идея метода сводится к следующему: неизвестные токи вводятся таким образом, чтобы автоматически выполнялся первый закон Кирхгофа, а потом используется второй закон. В следующих параграфах мы дадим точное определение «независимых» ячеек и докажем, что этот метод работает, т. е. докажем единственность решения для цепей с резисторами.
588 Глава 12. Теория электрических цепей А теперь попробуем объяснить суть второго метода Максвелла — метода узловых потенциалов. Поскольку функция электрического потенциала определена с точностью до аддитивной постоянной, выберем потенциал равным нулю в одном из узлов. (Если один из узлов соединен с землей, то удобно именно в нем считать потенциал равным нулю.) Рассмотрим тот же пример, см. рис. 12.13. Пусть потенциал равен нулю в точке С. Потенциал в точке А, создаваемый батареей, равен V. Мы не знаем потенциал только в точке В. Обозначим этот неизвестный потенциал буквой х. Применим первый закон Кирхгофа к узлам с неизвестным потенциалом, т. е. в нашем случае к точке В. Токи, протекающие через узел В, запишем через сопротивления каждой ветви, входящей в него, и через разность потенциалов соответствующих узлов. Итак, ток, приходящий в точку В через резистор R\, равен (V — x)/R\; ток, приходящий в точку В через резистор R-2, равен (О — x)/i?2i ток, приходящий в точку В через резистор Rz, равен (О — x)/i?3· Согласно первому закону Кирхгофа, алгебраическая сумма токов в каждом узле равна нулю, т. е. {V - ж)/ill - x/R2 - x/R3 = 0. Мы можем решить это уравнение и получить напряжение и токи во всех ветвях. В следующем параграфе мы приведем обоснование этого метода в общем случае. Рис. 12.13 Заметим, что в нашем примере второй метод работает лучше первого, потому что надо найти только одну неизвестную величину, а не две. Но преимущества этого метода по сравнению с анализом последовательных и параллельных соединений не очевидны.
12.1. Линейные цепи с резисторами 589 Поэтому, рассчитывая цепь в общем случае, мы советуем сначала проверить, насколько легко ее молено представить в виде параллельных и последовательных соединений. Если это трудно, то, вероятно, не имеет смысла заниматься таким разложением. Тогда посмотрите, сколько получается независимых ячеек и соответственно сколько неизвестных токов. Аналогично, определите, сколько неизвестных узловых потенциалов. Выбирайте тот метод расчета цепи, для которого получается меньше неизвестных. (Число неизвестных часто могут сократить соображения симметрии.) Несмотря на то, что мы рекомендуем делать выбор между двумя методами Максвелла только после тщательного рассмотрения, существует и общее правило: если в цепи мало ячеек и много узлов, то лучше работает первый метод (контурных токов), а если в цепи мало узлов и много ячеек, то лучше воспользоваться вторым методом (узловых потенциалов). Другим важным фактором является тип источников питания. Если ток в цепь подается источником с заданным напряжением, то это уменьшает число узлов с неизвестными потенциалами, что говорит в пользу метода узловых потенциалов. Если же заранее известны токи, то это говорит в пользу метода круговых токов. Чтобы учесть все указанные соображения, обычно хорошо нарисовать две диаграммы цепи, на которых отметить число неизвестных в одном методе и число неизвестных в другом. И только после этого сделать разумный выбор между ними. До сих пор мы рассматривали цепи, содержащие только резисторы. Оба метода Максвелла применяются также для изучения стационарного (осциллирующего) поведения линейных цепей с индукторами и конденсаторами. (Линейность означает, что все индуктивности и емкости предполагаются постоянными.) Если все генераторы производят ток с одинаковой частотой ω/2π, т. е. все источники напряжения имеют вид Velujt, а все источники тока — 1еш1, то, как хорошо известно (тривиальное следствие определений)6, для индуктора с индуктивностью L имеем формулу V = iloLI, а для конденсатора с емкостью С — формулу Предлагается рассматривать вывод нижеследующих формул для импе- дансов индуктора и конденсатора из определений на с. 577 как несложное упражнение. — Прим. ред.
590 Глава 12. Теория электрических цепей V = (ΐ/ΊΟω)Ι. Теперь молено воспользоваться теми же правилами, что и раньше, но с комплексными сопротивлениями или импедансами. Однако в этом случае решения существуют не всегда из-за явления резонанса. Например, пусть индуктор с L — 1 соединен с конденсатором, имеющим С = 1. Если мы к ним присоединим генератор тока с частотой ω = 1, то правило сложения сопротивлений дает R = i+1/i = 0, т. е. короткое замыкание с бесконечным током. В следующем параграфе мы обсудим некоторые условия, позволяющие избежать такой нереальной ситуации. 12.2. Топология одномерных комплексов Два термина — ориентированный граф и одномерный комплекс — являются синонимами. Они оба относятся к математической структуре, выражающей соединение различных ветвей в электрическую цепь при условии, что мы не интересуемся природой этих ветвей. Такая структура дает нам возможность изучать законы Кирхгофа в абстрактной форме и видеть, как свойства отдельных ветвей влияют на решение всей задачи. Одномерным комплексом мы называем структуру, состоящую из двух множеств: из множества объектов нулевой размерности, или узлов, обозначаемого {А, В,... } = So, и множества одномерных объектов, или ветвей, обозначаемых {α,β,...} = Si. При этом существует правило, согласно которому каждой ветви соответствуют два различных узла: начальная и конечная точка ветви. Итак, нам дано отображение из Si в So х So-7 В дальнейшем будем считать, что множества So и Si конечны. Определим термины траектория, ячейка и т.д., введенные в предыдущем параграфе. Траектория определяет целое число для каждой ветви, т. е. сколько раз проходится данная ветвь для данной траектории с учетом ориентации. Если ветвь проходится от начальной точки к конечной, то ее вклад равен +1, а если в обратном направлении, то — 1- Таким образом, каждая траектория определяет вектор ρ = (ρα,Ρβ, ■ ■ -)Т с целыми координатами, имеющими индексы, соответствующие ветвям. Например, ра — So х So обозначает декартово произведение множества So на себя, т.е. So х SO является набором упорядоченных пар узлов.
12.2. Топология одномерных комплексов 591 это целое число, которое обозначает, сколько раз ветвь а проходится в положительном направлении, минус сколько раз она проходится в отрицательном направлении. Можно сказать, что распределение тока в цепи определяется вектором I = (JQ, Ιβ,... )г, координаты которого имеют индексы, соответствующие ветвям. Например 1а — это вещественное число, определяющее ток (в амперах), проходящий по ветви α (если наш одномерный комплекс представляет собой ветви электрической цепи). Это значит, что для любого комплекса можно ввести векторное пространство, состоящее из векторов К = (Ка, Κβ,... )т, компоненты которого имеют индексы, соответствующие ветвям. (Если это специально не оговаривается, то полагаем, что все компоненты являются вещественными числами, так что мы имеем вещественное векторное пространство.) Обозначим это пространство С\ и назовем его 1-цепъю. Каждую ветвь к задаем вектором, у которого к-я компонента равна 1, а остальные равны нулю, т. е. α = (1,0,0,... )т, /3=(0,1,0,...)гит.д.8 Аналогично построим вещественное векторное пространство Со, состоящее из векторов, компоненты которого имеют индексы, соответствующие узлам, и назовем его 0-цепъю. Узлу А соответствует вектор, А-я компонента которого равна 1, а остальные равны нулю, так что теперь узел становится элементом векторного пространства Со- В частности, А — В тоже является элементом векторного пространства Со- Заметим, что размерность пространства С\ равна числу ветвей, а размерность пространства Cq — числу узлов. Определим теперь линейное отображение д из С\ в Со, называемое граничным отображением. Чтобы это сделать, достаточно задать его значения для каждой ветви, поскольку ветви образуют базис в пространстве С\. Каждая ветвь имеет начальную и конечную точки, поэтому по определению д(ветви) = (конечный узел) — (начальный узел). Например если α — ветвь, идущая из точки А в точку В, то да = В — А. В этом абзаце и в дальнейшем вектор в пространстве Rn обозначается (*\ (а, Ь,... )Т вместо I, чтобы занимать меньше места.
592 Глава 12. Теория электрических цепей Давайте разберемся, что означает оператор д. Предположим, что К = (Ка, Κβ, ΚΊ,... )т и дК = L, где L = (La,L0, L7,... )т. Вычисляя, например, Ьд, мы получим сумму определенных коэффициентов К, т. е. где δι,..., δι — ветви, входящие в узел А, а ει,..., ε& — ветви, выходящие из него. Таким образом, для узла, изображенного на рис. 12.14, мы имеем Ьд = Кр — Κη — Ка. V? Рис. 12.14 Отсюда видно, что первый закон Кирхгофа имеет очень простую формулировку. Первый закон Кирхгофа: Если I является распределение электрического тока, 01 = 0. то 1-цепью, задающей Напомним, что простая замкнутая траектория называется ячейкой. На рис. 12.15, например, траектория а + β + δ является ячейкой, которой соответствует вектор pi = (1,1,0,1)г; траектория —β-\-η — тоже ячейка, и ей соответствует вектор Р2 = (0, — 1,1,0)г. Сумма этих двух векторов рз = Pi + Р2 = (1,0,1,1)т соответствует ячейке α + η + δ. Очевидно, что каждая из этих ячеек не имеет границ, т. е. dpi = 9р2 = dpz = 0. Для любого одномерного комплекса подпространство Ci, состоящее из 1-цепей К, удовлетворяющих условию дК. = 0, будем
12.2. Топология одномерных комплексов 593 Рис. 12.15 Рис. 12.16 обозначать Z\. Запишем это символически: Z\ = kerd С С\. Элементы подпространства Z\ назовем циклами. Каждая ячейка является циклом, но не каждый цикл является ячейкой. Например, вектор /3/2 \ Ιι = 1 1/2 V3/2/ удовлетворяет условию д1\ = 0, но он не описывает ячейку, потому что его элементы не все равны 1, —1 или 0. Этот вектор представляет на самом деле набор токов, удовлетворяющий первому закону Кирхгофа. По существу, легче всего убедиться, что Ιι является циклом, написав у каждой ветви соответствующий ток и проверив, что алгебраическая сумма токов в каждом узле равна нулю (см. рис. 12.16). Или, по-другому, запишем вектор в виде Ιχ = |ρι + \γ>2- Поскольку pi и р2 являются элементами пространства Z\, то и Ιι принадлежит этому же пространству. В этой простой цепи две ячейки pi и р2 образуют базис пространства Z\. Определив подпространство Z\ С С\ как ядро граничного отображения д, рассмотрим теперь образ д. Пусть Во — подпространство Со, являющееся образом д. Символически это можно записать как Во = dd С Со. Подпространство -Во будем называть пространством границ.
594 Глава 12, Теория электрических цепей Смысл пространства Во может стать яснее, если посмотреть на рис. 12.17. Граница ветви а, равная А — В = (1, — 1,0)г, принадлежит пространству Со и лежит в подпространстве Bq. Аналогично граница β равна В — С = (0,1, — 1)т. Сумма этих двух векторов А — С — (1,0,— 1)т тоже является элементом пространства Со и границей траектории а + β. Однако, не каждый элемент подпространства Во реализуется как граница траектории. Например, (2,—1,-1)т является элементом Во, но не соответствует никакой траектории. Если мы рассмотрим те элементы пространства Со, которые не лежат в подпространстве Во, то увидим, что они не образуют подпространства. Рассмотрим цепь, изображенную на рис. 12.17. Вектора А = (1,0,0)г и В = (0,1,0)т не являются элементами пространства Во, но их разность А — В = (1,-1,0)т лежит в этом подпространстве. Мы можем образовать факторпро- странство До = Cq/Bq, элементы которого суть классы эквивалентности элементов Со, разность которых лежит в Во- Векторы А = (1,0,0)г и В = (0,1,0)г в пространстве Со соответствуют тому же вектору в До, потому что их разность равна вектору (1,—1,0)г, лежащему в Bq- Обозначим этот класс эк- вивалентности А или (1,0,0) . Аналогично векторы (2,0,0)т и (0,1,1)т принадлежат одному и тому же классу эквивалентнос- ■т ти (2,0,0)^ , потому что их разность (2, —1, — 1)т лежит в Bq. Для цепи, изображенной на рис. 12.17, каждый вектор из пространства Cq лежит в том же классе эквивалентности, что и вектор типа (А, 0,0)т, где А — вещественное число. Поэтому фактор- пространство До = Cq/Bq является одномерным векторным пространством, изоморфным пространству вещественных чисел. Л' D па ηβ η в Б< СА Рис. 12.17 Рис. 12.18
12.2. Топология одномерных комплексов 595 На рис. 12.18 изображен пример комплекса, для которого фак- торпространство Щ является двумерным. Векторы (1,0,0,0)т и (0,0,1,0)г не принадлежат одному классу эквивалентности, потому что из разность (1,0, —1,0)г не является границей никакого элемента С\. В этом случае класс эквивалентности вектора (1,0,0,0)г и класс эквивалентности вектора (0, 0,1,0)г образуют базис двумерного векторного пространства До- Заметим, что если бы к комплексу добавить ветвь η, соединяющую А и С, то (1,0, —1,0)т стал бы элементом пространства Во, а факторпро- странство Но стало бы одномерным. Смысл Но и Ζχ Первая задача, стоящая перед нами — дать геометрическую интерпретацию пространств До и Ζ\, что поможет лучше понять метод круговых токов. Мы хотим доказать следующие два факта (точные формулировки дадим в процессе обсуждения): (i) dim Но равна числу связных компонент комплекса; (И) можно найти базис Z\, состоящий из ячеек. Начнем с (i). Что такое связные компоненты? Мы говорим, что траектория соединяет узел А с узлом D, если А является начальной точкой первого отрезка пути, a D — конечная точка последнего отрезка. Если Ρ — 1-цепь с целыми коэффициентами, соответствующая этой траектории, то очевидно, что дР = D — А, потому что значение дР можно вычислить, складывая границы отдельных ветвей. При этом исчезают все промежуточные узлы. Комплекс называется связным, если все его точки могут быть соединены друг с другом. В этом случае произвольную 0-цепь9 L= Σ LNN = (LA,LB,...) N=A,B,C,... можно записать в виде l = J2ln{(a + (n-a)} = J2lnA+ ^ln{n-a), ΝφΑ 9Напомним, что под N здесь в выражении LnN понимается вектор — набор чисел, занумерованный узлами, у которого N-я компонента равна 1, а остальные 0. — Прим. ред.
596 Глава 12. Теория электрических цепей или, что то же самое, L=(LA + LB + ...,0,0,...f + LB(-l,l,0,0,...)T + Lc(-l,0,l,0,...f + --·. Для связного комплекса N — А является границей для всех N &А)и V N / N^A является элементом Во- Таким образом каждая 0-цепь L содержится в классе эквивалентности некоторого кратного А, а каждый элемент факторпространства Hq = Cq/Bq является кратным А — класса эквивалентности А. С другой стороны, само А не является границей, поэтому А ф 0. Итак, мы доказали, что для любого связанного комплекса размерность До равна 1. Пусть А — узел произвольного комплекса. Рассмотрим все ветви, для которых А является граничной точкой, начальной или конечной. Точку А свяжем со всеми узлами, находящимися на другом конце ветвей. Теперь добавим все остальные ветви, исходящие из этих узлов, и все новые точки на концах этих ветвей. Продолжаем эту процедуру до тех пор, пока не останется ни узлов, ни ветвей, которые молено было бы еще присоединить. В результате получим набор узлов Sq(A) и набор ветвей Si(A). Причем граничные точки любой ветви из S\(A) принадлежат набору Sq(A). Таким образом, (So(A),S\(A)) образует подкомплекс начального комплекса. Если он не совпадает со всем комплексом, то можно выбрать узел В, не лежащий в So(A), и повторить всю процедуру. Действуя таким образом, мы получим семейства непересекающихся множеств: узлов So(A), So(B) и т.д. и ветвей Si(A), Si(B) и т.д. При этом связные подкомплексы Sq(A),Si(A), So(B),Si(B) и т. д. не соединены друг с другом. Мы получим соответствующие векторные пространства Со (А) и т.д. и разложения в прямую сумму10 Со = Cq(A) Θ Cq(B) φ · · ■ и С\ — 10Прямая сумма ViffiVb двух векторных пространств Vj. и Vi есть декартово произведение V\ x V-j, превращенное в векторное пространство по естественным Правилам: (v\,V"i) + (w\,W2) = («1 + V)\,V2 + W?) И r(v\,V2) = {rV\,rV2).
12.2. Топология одномерных комплексов 597 СМ) Ф C'i(B) Θ ···, причем dCi(A) С С0{А), dd{B) С С0(В) и т.д. Отсюда мы видим, что Hq = Но(А) Θ Щ(В) + ■ · ■, поэтому размерность Hq равняется числу слагаемых и числу связных компонент. Теперь рассмотрим (И). Ячейка — это простой замкнутый путь. Следовательно, каждая ячейка определяет элемент Μ в С\ с координатами, равными либо +1, либо — 1, либо 0, а это значит, что 9М = 0. Мы говорим, что множество ячеек независимо, если линейно независимы соответствующие элементы С\. (Это и есть строгая формулировка понятия независимости, которое мы использовали в предыдущем параграфе.) А сейчас мы хотим показать, что можно найти такое семейство ячеек, что соответствующие элементы Μχ,..., М2 образуют базис в пространстве Ζ\. В процессе доказательства будет показана процедура нахождения такого семейства ячеек. Заметим, что в силу сказанного при обсуждении пункта (i) достаточно работать со связным комплексом. Если комплекс не связен, то процедура применяется для каждой связной компоненты отдельно. Поскольку компоненты не зависят друг от друга, то мы получим результат для всего комплекса. Связный комплекс, не содержащий ячеек, называется деревом. В дереве имеется по крайней мере один узел, который является граничной точкой только для одной ветви. (Мы исключаем тривиальный случай, когда в комплексе есть только один узел и нет ветвей.) Чтобы доказать этот факт, начнем с любого узла. Если к узлу подходит несколько ветвей, то выберем одну и двинемся вдоль нее к противоположному концу. Если этот новый узел не обладает требуемым свойством, то двинемся вдоль другой ветви (не той, вдоль которой пришли) к следующему узлу. Продолжим эту процедуру. Поскольку в комплексе нет ячеек, мы никогда не Если U и W являются подпространствами векторного пространства V такими, что каждый элемент ν £ V может быть записан единственным образом в виде υ = и + w, где и £ V, υ € W, то υ н-» (и, w) дает изоморфизм V с прямой суммой U и W. В этом случае мы пишем V = U ® W, причем dim V = dim U + dim W. [Обычно говорят, что V является внутренней прямой суммой подпространств U и W, в отличие от описанной вначале внешней суммы независимых векторных пространств, а также используют для внутренней прямой суммы другое обозначение операции, например, V = U + W■ - Ред.]
598 Глава 12. Теория электрических цепей вернемся в исходный узел. Так как в комплексе конечное число узлов, то в конце концов мы придем в узел, который будет границей только одной ветви. Рис. 12.19 Предположим, что у нас есть дерево и мы начали с узла, который является концом только одной ветви. Начиная с этого узла, мы построим все дерево, добавляя по одной ветви (рис. 12.19). Поскольку нет ячеек, то каждый раз, добавляя ветвь, мы добавляем узел. Таким образом, у дерева число узлов на единицу больше числа ветвей: если 6 обозначает число ветвей, an — число узлов, то п = 6 + 1. Мы уже доказали, что dim Hq = 1 для любого связного комплекса. Ввиду Но = Cq/Bq имеем dim Hq = dim Cq — dim Bq, откуда следует, что dim Во = dim Co — dim Hq = η — 1 = 6. Поэтому Во, являясь образом отображения 9, имеет ту же самую размерность, что и пространство С\, где действует д. Мы знаем, что для любого линейного отображения Τ : V —> W выполняется условие dim(ImT) + dim(KerT) = dim V. Применяя его к отображению д, мы получаем, что dim(Kerd) = dimCi — dim Во = 6 — 6 = 0, следовательно, Кегд = {0}, т.е. Z\ = {0}. Таким образом, мы доказали (п) для случая дерева: если нет ячеек, то нет нетривиальных циклов. Предположим, что у нас есть связный комплекс, построенный, как только что было показано, начиная с одного произвольного узла. Каждый раз добавляя ветвь, мы можем добавить или не добавить новый узел. В конце концов, поскольку комплекс связен,
12.2. Топология одномерных комплексов 599 когда мы включим все ветви, мы добавим и все узлы. Итак, в общем случае для связного комплекса мы имеем п< 6 + 1. Поскольку для связного комплекса dim Hq = 1, a dim Со — dim Во = dim До, находим η — dim Во = 1 и dim Во = η — 1. Поскольку Во является образом д и Ζ\ является ядром д, то dim Bq + dim Z\ = dim С\ = 6, или (η — 1) + dim Z\ = 6. Поэтому для любого связного комплекса dim Z\ = b + 1 — η. Чтобы доказать (ii), мы должны найти b + 1 — η независимых ячеек, которые образуют базис в пространстве Ζ\. Для этого сначала разделим множество всех ветвей S\ на максимальное дерево Т, которое содержит все узлы нашего комплекса11, и множество ветвей Т, которые не принадлежат дереву. Делать будем следующим образом: выберем любую ветвь, являющуюся частью ячейки, пусть она будет элементом подмножества Т. Все оставшиеся ветви по-прежнему соединяют все узлы. Повторим эту процедуру, пока не останется ни одной ячейки. Тогда ветви, не помещенные в подмножество Т, образуют максимальное дерево Т. Такая процедура не обеспечивает единственность максимального дерева12. На рис. 12.20 изображены два различных способа, которыми данный комплекс может быть сведен к максимальному дереву (сплошные линии) путем удаления ветвей (пунктирные линии), являющихся частями ячеек. Поскольку Τ образует дерево, связывающее η узлов, то оно содержит η — 1 ветвь. Подмножество Τ содержит 6 — (п — 1) = 6 + 1 — η ветвей. Концы каждой ветви из Τ соединены ветвями из множества Т, поскольку Τ соединяет все Дерево максимально в том смысле, что при добавлении к нему любой новой ветви первоначального комплекса подкомплекс перестает быть деревом. Кстати, как легко видеть, дерево будет максимальным как раз в том и только том случае, если оно соединяет все узлы данного комплекса, что дает альтернативный способ построения такого дерева: не выбрасывать по ветви (как описано ниже), а добавлять по узлу. — Прим. ред. Максимальное дерево единственно только при отсутствии в комплексе ячеек, за исключением ветвей с совпадающими началом и концом. — Прим. ред.
600 Глава 12. Теория электрических цепей Рис. 12.20. Два различных максимальных дерева для одного комплекса узлы. Более того, поскольку Τ не содержит ячеек, то связывающая траектория единственна. Каждая ветвь из Τ в комбинации с этой единственной траекторией в Т, соединяющей ее концы, образует ячейку. Поскольку число ветвей в Τ равно Ь + 1 — п, что совпадает с размерностью Ζ\, нам остается только доказать, что построенные нами ячейки линейно независимы. Для доказательства линейной независимости г-ю ветвь в Τ обозначим oii. Пусть М* обозначает ячейку, содержащую ветвь аг·. Рассмотрим линейную комбинацию ячеек ^сгМг·. Поскольку ветвь аг присутствует только в ячейке Мг· с коэффициентом +1, то коэффициент при аг в сумме должен быть с^. Поэтому ^с^Мг = 0 выполняется только если все сг = 0. Отсюда следует, что ячейки Mj линейно независимы. Деревья и проекции Заметим, что выбор максимального дерева Τ определяет проекцию рт пространства С\ на подпространство Ζ\ по правилу: если a.i € Τ, то рт(рч) = 0; если аг G Т, то рт(оц) = Мг·· Например, для максимального дерева, состоящего из а и β (см. рис. 12.21), проекционный оператор рт есть рт(с) = 0, ρτ{β) = 0,
12.2. Топология одномерных комплексов 601 "β \ \ ι ι Рис. 12.21 Ρτ{ί) = а + β + 7> Рт{$) = —α + δ. (Заметим, что каждая ячейка Mj включает в себя ветвь щ G Τ с коэффициентом +1, а не — 1.) Проекция ρχ может быть записана в виде матрицы /0 0 1 -1\ 0 0 1 0 0 0 1 0 ' \0 0 0 1/ Если мы имеем дело с несвязным комплексом, то (п) доказывается выбором максимального дерева для каждой связной компоненты и построением проекции рт- Метод круговых токов Теперь становятся понятной важность метода круговых токов, разработанного Максвеллом. Выбирая семейство независимых ячеек и приписывая каждой ячейке круговой ток Ji, мы образуем элемент JjMj + · · · + JmMm пространства Z\. Таким образом можно получить наиболее общее выражение для токов, удовлетворяющих первому закону Кирхгофа, т. е. наиболее общий вид элемента пространства Z\. Ранее мы уже пользовались уравнением l-dimZi = n-b (12.1) для связных комплексов. Применяя его к каждой компоненте произвольного комплекса и складывая, получаем dim Но - dim Z\ = dim C0 - dim C\ ■ (12.2)
602 Глава 12. Теория электрических цепей Поскольку dim Hq = dim Cq — dim Во и dim Bo = dim C\ — dim Z\, уравнение (12.2) есть прямое следствие определений различных пространств, связанных с д. В рамках этого метода Максвелла мы считаем, что круговой ток определяет токи в каждой ветви. Это можно сформулировать математически строго: рассмотрим пространство круговых токов как еще одну копию пространства Z\\ назовем его Н\. Это пространство круговых токов, будучи копией Ζχ, рассматривается как абстрактное векторное пространство, не являющееся подпространством С\. А теперь рассмотрим процедуру нахождения токов в ветвях, определяемых круговыми токами, как линейное отображение σ : Н\ —* С\, которое идентифицирует Н\ с подпространством Ζ\ пространства С\. Например, в цепи, изображенной на рис. 12.21, пространство Н\ двумерно. Отображение σ приписывает ячейке Μι токи в ветвях α -\-β-\-η, так что можно написать σ(Μχ) = α+β + Ί и аналогично σ(Μ2) = η-β. Итак, если мы используем Μι и М2 в качестве базиса абстрактного пространства Н\ (пространства токов), а α, β, η, δ — в качестве базиса пространства С\, то матрица σ, связывающая эти базисы, имеет вид /1 0\ 1 -1 О 1 \1 0/ Таким образом, мы видим, что метод круговых токов сводит задачу обращения линейного отображения из пространства Н\ в его дуальное пространство, обозначаемое Н1. Возвращаясь к уравнению (12.2), можно теперь написать dim Hq - dim H\ = dim C0 - dim C\. (12.3) Второй закон Кирхгофа утверждает, что напряжение в каждой ветви может быть получено как разность потенциалов от
12.2. Топология одномерных комплексов 603 потенциальной функции, определенной на узлах. Поскольку имеет смысл только разность потенциалов, мы можем положить потенциал на одном узле каждой связной компоненты равным нулю. Тогда потенциалы всех остальных узлов определят напряжение на ветвях. Например, рассмотрим цепь, изображенную на рис, 12.22. Если положить потенциалы Фл = Ф° = 0, то напряжения ветвей будут равны: Va — Фс, V^ = Фв, Vs = Фс — Фв, V1 = ФЕ. Поскольку число узлов равно dim Co, а число связных компонент равно dim Щ, существует только dim Co —dim Щ независимых способов определения напряжений в ветвях, совместимых со вторым законом Кирхгофа. Это значит, что, грубо говоря, число условий, налагаемых вторым законом Кирхгофа, равно dim Cl — (dim Co — dim Но) = dim H\. С Ε δ Рис. 12.22 Поскольку число независимых распределений токов в ветвях, совместимых с первым законом Кирхгофа, равно dim H\ (числу линейно независимых ячеек), то первый закон Кирхгофа налагает dim Cl — dim H\ условий. Оба закона вместе налагают dim Cl = 6 условий. (Законы независимы, потому что один относится к токам, а второй к напряжениям.) Связь между током и напряжением в каждой ветви дает еще 6 уравнений. Таким образом мы имеем 26 уравнений для 26 неизвестных токов и напряжений. Теорема Кирхгофа для линейной цепи с резисторами утверждает, что эти уравнения могут быть разрешены. Чтобы доказать эту теорему, мы должны обратиться ко второму закону Кирхгофа.
604 Глава 12. Теория электрических цепей 12.3. Коцепи и d-оператор Прежде всего отметим, что напряжение в каком-то смысле двойственно току. Произведение напряжения V1 на ток /7, который течет по ветви 7; дает мощность, выделенную в этой ветви. Поэтому если мы введем вектор напряжений V = (Va, V@,...), то он должен лежать в пространстве, дуальном пространству С\. Тогда введем это дуальное пространство и назовем его пространством 1-коцепей. Обозначим его С1. Таким образом, С1 — это пространство линейных функций в С\. Аналогично введем пространство С0 линейных функций на Со, и назовем его пространством 0-коцепей. А теперь давайте введем несколько обозначений, которые на первый взгляд могут показаться странными, но потом окажутся весьма продуктивными в смысле обобщения. Пусть даны вектора К = (Ка, %...)reCinW = (Wa, W?...) € С1. Значение линейной функции W на векторе К будем обозначать /к W. Тогда L W = WaKa + \νβΚβ + ■ ■ Аналогично значение 0-коцепи / — (/Α, /β,... )Т G С0 на 0-цепи с = (сд, eg,... )т будем обозначать J f. Тогда ί β. / = Гсд + Г ев + ■■■ Следующее обозначение связано с отображением д. Граничное отображение д является линейным отображением из С\в Cq. Его сопряженное будет линейным отображением из С0 в С1. Это сопряженное отображение будем обозначать d и назовем его когра- ничным оператором. Итак, если / есть 0-коцепь и К есть 1-цепь, то значение df на К равно /, вычисленному на ОК.. В терминах уже введенных обозначений, мы можем написать [ df = f f. (12.4) JK. JdK.
12.3. Коцепи и d-оператор 605 (Наши обозначения выбраны таким образом, чтобы это уравнение было похоже на фундаментальную теорему дифференциального исчисления. Конечно, в уравнении нет никаких интегралов; это вычисление линейных функций от векторов в векторном пространстве, т. е. конечных сумм. Однако, если представить, что / — дифференцируемая функция на прямой, df — как f'{x)dx, а К — как интервал А < χ < В, то левая часть уравнения (12.4) может быть интерпретирована как интеграл JK df = JA fix) dx = f{B) — f(A), а правую часть этого уравнения именно так и надо понимать. А теперь мы просим читателя на время забыть эту аналогию. Мы вернемся к ней в параграфе 15.2.) Если а обозначает ветвь и да = В — Л, то уравнение (12.4) принимает вид fadf — f(B) — f(A). Второй закон Кирхгофа утверждает, что для узлов существует такая функция Ф, т. е. 0-коцепь, что Va = Ф(А) — Ф(В) для любой ветви а такой, что да = В — А. Тогда этот закон Кирхгофа можно записать в виде V = -άΦ. (Заметим, что если уравнение /к V = — /9К Φ справедливо для всех ветвей, то оно справедливо для всех 1-цепей, поскольку ветви образуют базис пространства 1-цепей. Тогда V и — άΦ принимают одно и то же значение на всех 1-цепях, т. е. V = — άΦ.) Из двух законов Кирхгофа следует теорема Теллегена. Предположим, что для данной электрической цепи I G С\ обозначает распределение токов по ветвям, которое удовлетворяет первому закону Кирхгофа д\ — 0. Предположим также, что для той же цепи распределение напряжений V удовлетворяет второму закону Кирхгофа V = — άΦ. Тогда полная мощность, выделенная во всех ветвях, равна Ρ = Σναια = /ν = -1άΦ. Однако, по определению оператора с?, Р = _ /(*ф = - / Ф = 0, Л Jdl
606 Глава 12. Теория электрических цепей поскольку д! = 0. Этот результат показывает, что в электрической цепи сохраняется энергия — батареи и генераторы подают ровно столько энергии, сколько рассеивается в резисторах. Важно отметить, что никакие предположения о природе элементов цепи не делаются. Для рассмотрения токов оказалось полезным ввести два подпространства — ядро и образ граничного отображения д: подпространство циклов Z\ = Ker д С С\ и подпространство границ Во = Imd С Со- Давайте сделаем то же самое для кограничного оператора d. Пусть Z0 С С0 обозначает ядро оператора d. Тогда Z0 является подпространством потенциальных функций на узлах, обладающих тем свойством, что все напряжения на ветвях равны нулю. Для связного комплекса все напряжения будут равны нулю тогда и только тогда, когда потенциал во всех узлах одинаков. В общем случае Z0 есть подпространство потенциалов, постоянных на каждой связной компоненте. Сложение элемента из Z0 с элементом из С0 не имеет физического смысла — при этом изменяется только произвольный уровень, от которого отсчитывается каждый потенциал. Пусть Φ является элементом пространства Ζ0, так что άΦ — 0. Пусть сЖ обозначает произвольный элемент пространства границ Во- Тогда / Φ = / άΦ = 0. JdK. Ук Другими словами, элемент из Z0, действуя на элемент из Во, дает нуль. И обратно, предположим, что ]дк Φ = 0 для всех К. Тогда /к άΦ = 0 для всех К. Следовательно, άΦ = 0, т. е. это нулевая функция в пространстве С1 и Φ G Z°. Именно поэтому говорят, что Ζ0 есть пространство, аннулирующее Во- Рассмотрим факторпространство Но = Cq/Bq, элементы которого являются классами эквивалентности элементов пространства Со, разность которых лежит в Bq. Пусть ci и С2 являются элементами пространства Со, разность которых ci — С2 лежит в Во- Тогда для любого Φ G Z° имеем / Φ - / Φ = / Ф = 0. J С\ Jc2 J С\— C2
12.4. Базисы и дуальные базисы 607 Следовательно, /с Φ = Jc Φ, если ci = С2 (mod Во)· Итак, элемент принимает одно и то же значение на любом представителе данного класса эквивалентности. Поэтому Z0 может рассматриваться как пространство линейных функций на До· Связь пространства Z0 с Со, -Во и #0 является примером общего принципа, с которым мы встретились: ядро отображения, сопряженного к линейному преобразованию, является аннулирующим подпространством образа этого преобразования. Оно является также дуальным пространством факторпространства по образу преобразования. В нашем случае мы имеем преобразование д, действующее на С\\ сопряженное преобразование d, действующее в С0, и ядро сопряжения Z0, являющееся аннулирующим пространством Во = Im д и дуальным к пространству Но = Со/Bq. А теперь рассмотрим факторпространство Р° = C°/Z°. Поскольку Z0 состоит из функций, постоянных на каждой связной компоненте, элементы пространства Ρ являются классом эквивалентности функций, отличающихся на каждой связной компоненте только постоянной. Итак, если мы к вектору из пространства С0 добавим физически несущественную постоянную, возможно, разную для каждой связной компоненты, то результирующий вектор остается тем же элементом пространства Ρ . Когда мы прибавляем произвольную аддитивную константу к каждой связной компоненте, то именно Р° соответствует пространству потенциалов. Для данного вектора напряжений V, удовлетворяющего второму закону Кирхгофа, соответствующий потенциал Ф, удовлетворяющий условию V = — άΦ, определен с точностью до элемента пространства Р°, которое определяет Ф. 12.4. Базисы и дуальные базисы Чтобы выбрать базис для Р°, удобно в каждой связной компоненте заземлить один узел. После этого выбрать dim С — dim Z базисных векторов, для которых потенциал равен единице в одном незаземленном узле и нулю во всех остальных узлах. Например, в цепи, изображенной на рис. 12.23, узлы А и D заземлены, а вектор (Φβ,Φσ,Φβ) представляет произвольный элемент Р°.
608 Глава 12. Теория электрических цепей С Ε "5 D Рис. 12.23 Отображение d : С0 —> С1 индуцирует отображение [d] : Р° —> С1, которое будем называть ограниченным пограничным отображением. Матричное представление [d] получается из матричного представления d, если убрать столбцы, соответствующие заземленным узлам. Так, для цепи, изображенной на рис. 12.23, мы убираем первый столбец (А) и четвертый (D), т.е. d = /-1 0 1 ^ о 1 -1 0 0 0 0 1 0 -1 0 0 1 о\ 0 0 -V , a [d] = ( 1 -1 0 ^ о 0 1 -1 0 о\ 0 0 -V Поскольку Ζ — аннулирующее пространство для Bq, любые два элемента С0, отличающиеся на элемент Z0, дают одинаковый результат при действии на элемент Во. Так факторпространство Р° = C°/Z° может быть идентифицировано с дуальным пространством Во- Сопряженным к отображению [d] : Р° —> С1 является ограниченный граничный оператор [д] : С\ —> Bq. Для Bq удобно пользоваться базисом, дуальным к базису, выбранному для Р°. Тогда матричное представление [д] есть просто транспонированное матричное представление [d]. По отношению к этому базису вектор в пространстве Bq есть вектор в пространстве Со, из которого убраны компоненты, соответствующие заземленным узлам. Например, для цепи, изображенной на рис. 12.23, где заземлены узлы А и D, мы имеем да = В - А.
12.4. Базисы и дуальные базисы 609 В векторных обозначениях это выглядит так: кром д = д е того, /-1 0 1 -1 0 1 0 0 \ 0 0 /Л 0 0 W 1 0 -1 0 0 0 0 V о/ о\ 0 0 1 -h 1 [д] но [д] = /Л о о Ί -ι о o^ 0 1-1 0 | = [df ,οοο -ь Пусть В1 обозначает подпространство С1, являющееся образом d. С физической точки зрения В1 — это пространство векторов напряжений на ветвях, подчиняющихся второму закону Кирхгофа. Более того, согласно теореме Теллегена, доказанной нами ранее, В1 является аннулирующим пространством для Ζγ. любое распределение напряжений, удовлетворяющее второму закону Кирхгофа, при применении к любому распределению токов, подчиняющихся первому закону Кирхгофа, дает нуль. Если мы образуем факторпространство Н1 = С1 /В1, то его можно идентифицировать с дуальным пространством .Hi (известным также как Ζ\). Доказательство этого утверждения очень простое. Пусть Vi и V2 — вектора в пространстве С1, а разность между ними лежит в пространстве В , так что Vi — V2 = —άΦ для некоторой функции Ф. Тогда для произвольного вектора тока I G Z\, удовлетворяющего условию д! = 0, имеем / Vi - / V2 = /(Vi - V2) = - ίάΦ = - / Φ = 0, Jl Jl Jl J\ Jd\ откуда следует, что /jVi = |jV2. Таким образом, Vi и V2, которые соответствуют одному и тому же элементу Η , совпадают как элементы дуального пространства Н\. Теперь подведем итог соотношениям между пространствами С0, С1, Ζ\ В1 и Ζχ.
610 Глава 12. Теория электрических цепей о Преобразование d действует в пространстве С0 и отображает С0 -> С1. о Его сопряжение д действует в пространстве С\, отображая С\ —> Со. о Ядро д есть Z\, его аннулятором является В1 = Im d, а его дуальное пространство есть Н1 = С1 / В1. 12.5. Методы Максвелла Мы рассмотрели процедуру построения базиса ячеек в пространстве Z\ путем выбора максимального дерева. Пусть σ обозначает отображение, которое определяет каждый вектор в Ζ\ — Н\ как элемент пространства С\. Теперь выберем базис для Д"1, который будет дуален базису, выбранному для Н\. Пусть s обозначает проекцию пространства С1 на факторпространство Н1 = С1 /В1. Тогда s и σ — взаимно сопряженные преобразования, и матричное представление одного будет транспонированным представлением другого. Матрицы σ и s построить очень просто. Рассмотрим цепь, изображенную на рис. 12.24, с максимальным деревом, состоящим из α и 7· Тогда базис пространства Ζ\ имеет вид /1\ / 0\ Μι = α + β + 7 = М2 = -7 + δ = w о -1 V ι/ Следовательно, матрица преобразования σ есть Заметим, что σ /1 1 1 - ^0 4 )- о\ 0 -1 ■у ( Jl \ J1-J2 \ Ji )
12.5. Методы Максвелла 611 Рис. 12.24 т. е. σ определяет правило, по которому токи в ветвях вычисляются через круговые токи. Матрица преобразования s — транспонированная матрица σ: s = 1 1 О О 1 О -1 1 Заметим, что va + νβ + г>т -υ~ι + νδ откуда следует, что компоненты вектора sV равны напряжениям на ветвях, просуммированным по всем ячейкам, выбранным в качестве базиса Hi. Полученные соотношения сводятся к следующему: эО Μ Л « Н\ Вп [д] Ci«2- Hi. Векторные пространства, расположенные одно над другим, дуальны друг к другу: С1 и Ci; Р° и Bq; Η1 и Hi. Более того, [d] и [д] сопряжены, так же, как s и σ. Оба отображения [d] и σ инъ- ективны (имеют нулевое ядро), в то время как [д] и s сюръектив- ны (все векторное пространство является их образом). Наконец,
612 Глава 12. Теория электрических цепей Ιπίσ = Кег [д] и Im[d] = Kers. Учитывая это, законы Кирхгофа можно записать в симметричной форме. Первый закон Кирхгофа: I = σ3, J G Hi; Второй закон Кирхгофа: V = — [ά]Φ, Φ € P°. Теперь мы можем обсудить теорему Кирхгофа для цепей с резисторами. Предположим, что наша электрическая цепь состоит из резисторов, вольт-амперная характеристика которых для каждой ветви а является прямой линией на плоскости (Ia,Va). Сделаем реалистичное (и упрощающее) предположение, что эта прямая не параллельна ни одной из осей. Это значит, что любой источник напряжения соединен с некоторым резистором последовательно, а любой источник тока соединен с сопротивлением параллельно, т. е. нет источников, подающих постоянное напряжение при любом токе, и нет источников тока, создающих постоянный ток независимо от напряжения. Таким образом, мы предполагаем, что любая ветвь а с да = В — А имеет вид, изображенный на рис. 12.25.13 Напряжение на резисторе равно Va — Wa, а ток, протекающий по нему равен 1а — Ка. Тогда вольт-амперная характеристика системы определяется формулой (Va - Wa) = za(Ia - Ка). Здесь при ζα φ О заданы значения Wa и Ка (причем любое из них может быть равно нулю14). Если в цепи есть только резисторы, 13Показано широко используемое в элементарных курсах физики разложение реального источника питания на простой резистор и идеальный источник напряжения (с нулевым внутренним сопротивлением) или тока (с «бесконечно большими» сопротивлением Ra и напряжением Ua = RaKa)- — Прим. ред. 14 Авторы, вероятно, имеют в виду, что для создания вышеописанной линейной вольт-амперной характеристики вида Va = za(la — Ка) = zaIa — Wa достаточно добавить к резистору источник только одного (любого) из этих двух типов. Принято называть Wa напряжением холостого хода реального источника, а Ка — его током короткого замыкания. Отметим, что ветвь с двумя источниками, удовлетворяющими соотношению Wa = zaKa (при соблюдении указанной полярности), ведет себя с точки зрения остальной цепи как простой резистор. — Прим. ред.
12.5. Методы Максвелла 613 А + /-Ό Рис. 12.25 то ζα — положительное вещественное число. Мы можем также рассмотреть стационарное состояние линейной цепи, содержащей конденсаторы и индукторы. В этом случае ζα — комплексное число, зависящее от частоты. Величины 1а и Va неизвестны. Пусть Ζ : С χ —> С1 — линейное преобразование, матрица которого в базисе, состоящем из всех ветвей, диагональна, и на диагонали стоят соответствующие ζα. Тогда предыдущее уравнение можно переписать в форме V-W = Z(I-K). Комбинируя это соотношение с законами Кирхгофа, получаем уравнения V - W = Z(I - К), Ι = σ3, V = -[ά]Φ для неизвестных J € Н\ и Φ € Р°, при заданных W, К и Ζ. Эти уравнения мы будем пытаться решать одним из двух методов Максвелла, описанных ниже. Метод круговых токов (i) Запишем I = σ3, чтобы удовлетворялся первый закон Кирхгофа. После этого применим s к уранению V — W = Ζ(σ3 — К). Поскольку из второго закона Кирхгофа sV = s(—[ά]Φ) = 0, мы
614 Глава 12. Теория электрических цепей получаем — sW = sZaJ — sZK. или (sZa)3 — s(ZK —W). Правая часть этого равенства известна, как и линейное преобразование sZa. Если преобразование sZa обратимо, то 3 = {sZa)-1s{ZK-W), (12.5) из которого могут быть получены все токи и напряжения, так как I = aJ,V = W + Z(I — К). В этом состоит метод круговых токов. Он зависит от обратимости преобразования sZa. Метод узловых потенциалов (п) Запишем V = — [й]Ф, чтобы обеспечить выполнение второго закона Кирхгофа. После этого обратим преобразование Z, которое задается диагональной матрицей, и получим I — К = Ζ~ι{—[ά]Φ — W). К обеим частям этого равенства применим [д]. Поскольку, в силу первого закона Кирхгофа, [д]1 = О, мы получаем -[д\к = -щг-1ЩФ - ψ\ζ~ΐΛπ или {[д}г-1Щ)Ф = [д]{к - ζ~ιντ). Если преобразование [9]Z_1[d] обратимо, мы получаем Φ = ([д]Ζ"1 ИГ1 β](К - Z^W), (12.6) после чего все токи и напряжения находятся из уравнения У = -ЩФ, I = K + Z-1(V-W). (12.7) В этом состоит метод узловых потенциалов. Он зависит от обратимости преобразования [9]Z-1[d]. 12.6. Матричные выражения для операторов Уравнения (12.5)—(12.7) дают нам суть методов Максвелла. Чтобы можно было с ними работать, надо получить матричные выражения для операторов. Поэтому необходимо выбрать соответствующие базисы и базисы, дуальные к ним. В этом параграфе мы еще раз посмотрим, как это делается и приведем несколько
12.6. Матричные выражения для операторов 615 /-1\ 1 0 0 0 V V , ь2 = /-1\ 0 1 0 0 V о) , Ь3 = /-1\ 0 0 1 0 V V , ь4 = ( °\ 0 0 0 -1 V V примеров. Доказательство того, что эти методы всегда работают в случае цепей с резисторами, мы дадим в начале параграфа 12.7. Базис для пространств Во, Но, Z0 и Р° определяется выбором заземленного узла в каждой связной компоненте цепи. Например, на рис. 12.26 можно сделать заземление в узле А для одной связной компоненты и в узле Ε для другой. Тогда базис пространства Во состоит из границ траекторий, соединяющих заземленные узлы с другими узлами той же компоненты. В этом случае базисные векторы имеют вид bi = Чтобы построить базис факторпространства Но = Со/Во, надо базис пространства Во расширить до базиса пространства Со, введя базисные вектора, у которых на месте какого-либо одного заземленного узла стоит 1, а все остальные элементы равны нулю. После этого для каждого из этих векторов берется класс эквивалентности. В нашем примере это дает Ж О О О 1 W F hi = h2 = Ε Рис. 12.26
616 Глава 12. Теория электрических цепей В пространстве Z0, являющимся ядром d и дуальным к Щ, базисными элементами будут потенциалы с постоянным значением 1 поочередно на каждой связной компоненте. В нашем примере мы имеем ζ = (Л 1 1 1 0 W „2 , ζ - (°\ 0 0 0 1 W которые, очевидно, дуальны hi и Ьг, приведенным выше. Чтобы выбрать базис факторпространства Р° = C°/Z°, мы просто положим последовательно потенциалы на каждом незаземленном узле равными 1 и для каждого возьмем класс эквивалентности. В нашем примере мы получим ί°\ 1 0 0 0 W 2 , Ρ = ί°\ 0 1 0 0 w 3 , Ρ = ί°\ 0 0 1 0 W 4 , Ρ = ί°\ 0 0 0 0 W Очевидно, что эти классы эквивалентности дуальны построенному выше базису {Ьх,Ь2,Ьз,Ь4} в пространстве Во· Поэтому матричное представление [d] : Р° —> С0 является транспонированным к матричному представлению [д] : Со —> -Во· Столбцы [d] и строки [д] отвечают незаземленным узлам, которые соответствуют базисным векторам. Теперь рассмотрим пространства Z\, В1 и Д"1, которые связаны с ядром д и образом d. Для полноты картины рассмотрим также факторпространство G\ = C\/Z\, дуальное к пространству В . Во всех этих пространствах выбор базиса определяется выбором максимального дерева. На рис. 12.27 изображено такое дерево с ветвями α, β и ε. Как мы уже видели, базисные элементы пространства Ζ\ — это ячейки, связанные с ветвями, не принадлежащими макси-
12.6. Матричные выражения для операторов 617 mi = М\ 1 1 0 V о/ Рис. 12.27 мальному дереву. В нашем примере это будут 0 и т2 = 0 1 W связанные соответственно с ветвями η и δ. Для факторпростран- ства G\ = C\ jZ\, которое представляет нарушение первого закона Кирхгофа, мы можем образовать классы эквивалентности векторов, имеющих 1 на месте соответствующей ветви максимального дерева и нули в остальных местах. В нашем случае мы имеем gi Поскольку эти вектора имеют 0 на месте каждой ветви, не принадлежащей дереву, то ни одна линейная комбинация из них не может быть ячейкой. Это значит, что они являются независимыми элементами пространства G\. Для подпространства В1, образованного кограницами — напряжениями ветвей, подчиняющимися второму закону Кирхгофа, мы можем построить базис, приписывая напряжение, равное 1 одной из ветвей максимального дерева, и нулю всем остальным его ветвям. Такая процедура приписывает потенциал каждому узлу (с точностью до константы), и эти потенциалы можно /Λ 0 0 0 VV ι g2 = (°λ 1 0 0 VV , g3 = f°\ 0 0 0 w
618 Глава 12. Теория электрических цепей использовать для определения напряжений на ветвях, не принадлежащих дереву. Или, другими словами, поскольку каждая ветвь, не принадлежащая максимальному дереву, связана с единственной ячейкой, содержащей эту ветвь и другие ветви, которые принадлежат дереву, то каждую такую ячейку можно использовать для определения напряжений на таких ветвях. Например на рис. 12.27 эта процедура приводит к базисным векторам, связанным соответственно с ветвями α, β и ε: b1 = (1 0 1-1 0), b2 = (0 1 - 1 0 0), b3 = (0 0 0-1 1). Эти вектора, аннулирующие ячейки mi и Ш2, дуальны базису gi, g2> g3 пространства G\. Они не совпадают со столбцами [d\, но они задают то же самое подпространство пространства С1. Итак, базисные вектора пространства В1 могут ассоциироваться с ветвями, принадлежащими максимальному дереву. Точно так же базисные вектора Н1 = С1 /В1 ассоциируются с ветвями, не принадлежащими дереву. Они являются классами эквивалентности векторов напряжений, которые имеют 1 на месте одной ветви, не принадлежащей дереву, и нули на всех остальных местах. Таким образом, в нашем примере базисные вектора пространства Н\ имеют вид hx = /о\ 0 1 0 W , ь2 = Л>\ 0 0 1 W Они соответствуют единичным нарушениям второго закона Кирхгофа в ячейках 1 и 2 соответственно. Очевидно, что h1 и h2 дуальны ячейкам mi и Ш2. Вследствие этого матрица преобразования s : С1 —> Н1 является транспонированным по отношению к матрице σ : Ζ\ —> С\. Иногда удобнее пользоваться другим методом выбора базисных векторов в пространстве В1 (напряжений, подчиняющихся
12.6. Матричные выражения для операторов 619 второму закону Кирхгофа). В этом случае потенциал выбирается равным 1 последовательно в каждом незаземленном узле и нулю во всех остальных узлах. На получившиеся потенциалы действуем оператором d. (Или, что то же самое, можно взять потенциалы равными — 1 последовательно в каждом незаземленном узле и записать напряжения на ветвях). В нашем примере заземлен узел А. Базисные вектора, связанные с узлами В, С и D соответственно, имеют вид: а1 = (0 -1 1 0 0), а2 = (1 10-1 0), а 1 Л -1 0 0 V (у , к2 = /1\ 0 0 0 VV , к3 = ( °\ 0 0 0 \-у = (0 0 0 1-1). В качестве дуального базиса в пространстве G\ = C\jZ\ мы должны выбрать распределения токов, для которых единичный ток протекает из заземленного узла вдоль дерева поочередно к каждому незаземленному узлу. В нашем примере мы получаем базисные вектора ki = соответствующие единичным нарушениям первого закона Кирхгофа в незаземленных узлах В, С и D соответственно. Давайте применим оба метода Максвелла к цепи, изображенной на рис. 12.28. Ее топология уже знакома нам по рис. 12.24. Сначала мы произвольно выбираем заземленный узел, пусть это будет узел А. Тогда Фл = 0. Напряжения в ветвях выражаются через потенциалы в других узлах следующим образом: уа = — фв у$ = Фв — Фс, V1 = Фс Vs = Фс. Поэтому для того, чтобы получить V = —[ά]Φ, мы находим /+1 0\ -1 +1 0 -1 0 -1/ н = V
620 Глава 12. Теория электрических цепей ЗА В ЛАА β С —VW—»— Юм 1+ -±г 8В 20м δ 7 ΐ ив 30м •40м 1А Рис. 12.28 Чтобы это проверить, построим матрицу д. Поскольку да = В - А, др = С-В, dj = A-C, Θδ = А - С, мы имеем: /-1 0 +1 +1Ν 0=1+1-1 о о V о +1 -ι -ι, Чтобы получить [9], уберем из матрицы д строку, соответствующую заземленному узлу А. Итак, убирая первую строку, мы получаем '+1 -1 0 0> О +1 -1 -1, Как и ожидалось, матрица [д] является транспонированной матрицей [d]. Если выбрать ячейки Μι и Мг, как показано на рис. 12.28, то токи в ветвях выражаются через токи в ячейках J\ и J2 следующим образом: Ια = Jli Ιβ = Jl, Ιη = Jl — J2, h = Jl- Поскольку I = aJ, мы имеем <\ θ\ 0 -1 V И = σ =
12.6. Матричные выражения для операторов 621 Для проверки построим матрицу s, выражая падение напряжения Ε в каждой ячейке через напряжения на ветвях. В ячейке 1: Ε ι = Va + νβ + V1. В ячейке 2: £2 = -V1 + Vs. Поскольку ε = sV, мы имеем: s = 1 1 О О 1 О -1 1 Как и ожидалось, матрица s является транстпонированной к матрице σ. Далее мы должны записать вектора W и К, которые представляют источники напряжения и тока в четырех ветвях. Договариваемся считать напряжение батареи W положительным, если направление убывания потенциала (от положительного полюса к отрицательному, противоположное направлению ЭДС) совпадает с направлением прохода ветви, указанным стрелкой, в противном случае — отрицательным. Для цепи, изображенной на рис. 12.28, мы имеем: Wa = -8, \¥β = 0, \¥Ί = +11, W& = 0. Аналогично, источник тока дает положительный вклад, если его направление совпадает с направлением прохода ветви по стрелке, и отрицательным, если наоборот. Следовательно, Ка = +3, Κβ =0, ΚΊ = 0, Κδ = +1. Теперь мы можем ввести вектора для описания источников в цепи: /-8\ /3\ о __ о и и к= о V о/ \У Наконец, запишем матрицу Z, описывающую резисторы. Поскольку Ra = 2, Rp = 1, Ry = 3, Rs = 4, W =
622 Глава 12. Теория электрических цепей мы имеем: /2 0 0 0\ Z = 0 10 0 0 0 3 0 • \0 0 0 4/ Чтобы применить метод круговых токов, запишем уравнение J = (sZct)_1s(ZK-W). Перемножение матриц дает /2 0 0 0\ /1 0\ sZa={o о -ι ij 0 10 0 0 0 3 0 1 0 1 -1 (-3 7) ' \0 0 0 4/ \0 l/ следовательно, *Г зз la I со to Кроме того, получаем ZK-W = /2 0 0 0\ 0 10 0 0 0 3 0 ^0 0 0 4^ /з\ 0 0 W /-8\ 0 11 1 о) / 14\ 0 -11 1 V откуда s(ZK-W) = 1 1 1 0 0-1 / ΙΑ 0 -11 V V И, наконец, J = 1 33 1 /66 33 V99 откуда получаем J\ = 2 и J2 = 3. Итак, /1 1 1 \о о\ 0 -1 V ©- ( 2\ 2 -1 1 з/
12.6. Матричные выражения для операторов 623 Если внимательно проследить за процедурой вычисления, то можно убедиться, что для любой цепи справедливы следующие утверждения. 1. В матрице sZa каждый диагональный элемент равен сумме сопротивлений ветвей, образующих ячейку. В нашем случае ячейка Μι, состоящая из ветвей а, /3 и 7> имеет полное сопротивление, равное 6 омам — левый верхний элемент матрицы. 2. В матрице sZa каждый недиагональный элемент равен сопротивлению в ветви, общей для двух ячеек (с точностью до знака ±). В рассматриваемой цепи ячейки 1 и 2 имеют общее сопротивление, равное 3 омам, а знак — возникает из-за того, что ветвь η в ячейках Μι и М2 проходится в разных направлениях. 3. Элементы матрицы (sZa)J равны падению напряжения, которое возникло бы при обходе каждой ячейки при отсутствии источников15. Например, если J\ = 2 и Jz = 3, то при обходе ячейки 1 возникает падение напряжения в 3 вольта. 4. Элементы матрицы ZK. ~ W равны скачкам напряжения16 в ветвях, если бы все токи в ячейках были равны нулю. Например, если J\ = 0, то в ветви α будет ток в 3 ампера, протекающий через резистор с сопротивлением в 2 ома. Тогда скачок напряжения в этой ветви будет равен (2 · 3 + 8) = 14 вольтам. 5. Элементы матрицы s(ZK. — W) являются скачками напряжения при обходе различных ячеек, если бы все токи в ветвях были равны нулю. Например, если J\ = J2 = 0, то при обходе ячейки 1 полный скачок напряжения будет равен 3 вольтам. 15и тех же токах. Это падение напряжения в замкнутом контуре (короткое замыкание) можно интерпретировать как (катастрофический) результат мгновенного отключения ЭДС источника. — Прим. ред. 16Этим (не слишком корректно звучащим) термином обозначается возрастание потенциала (voltage rise) вдоль участка цепи, в отличие от убывания (voltage drop), называемого падением напряжения. — Прим. ред.
624 Глава 12. Теория электрических цепей 6. Поэтому уравнение (sZa)J = s(ZK — W) означает, что для каждой ячейки суммарное падение напряжения в ячейках, создаваемое токами, протекающими через резисторы, равно сумме скачков напряжения, которые получились бы при условии, что все токи в ячейках равны нулю. Тогда полное падение напряжения при обходе каждой ячейки при имеющихся токах в ячейках и источниках равно нулю, что и требуется вторым законом Кирхгофа. Чтобы воспользоваться методом узловых потенциалов, рассмотрим уравнение ф = (щг^щу^д^к - ζ~λντ). Перемножение матриц дает [d]Z^[d} = 1 -1 о о о 1 -1 -1 3/2 -Л -1 19/12/ /1/2 О О 0 10 0 0 0 1/3 0 \ 0 0 0 1/4/ 0\ / 1 0\ -1 1 0 -1 V о -V Откуда <^ί*-^(19/ι: ,;) Кроме того, получаем К - Z_1W = /з\ 0 0 W /1/2 0 0 1 0 0 ^ 0 0 следовательно, щк-z-1 W) -( 1 -1 0 1 0 0 1/3 0 0 -1 - o^ 0 0 1/4, /-8\ 0 11 W = ( 7 \ 0 -11/3 -9 < 7 > 0 11/3 1 J (β/з) ·
12.6. Матричные выражения для операторов 625 Тогда Ф = 24 /19/12 1\ ( 7 \ 24 Лб5/12\ /ΐθ\ 33^ 1 3/2/ 1^8/3/ ~ 33 ^ И )~\8J откуда получаем неизвестные потенциалы на узлах Фв = 10, Фс = 8. Здесь также, внимательно проследив процедуру вычисления, можно увидеть, что для любой цепи справедливы следующие утверждения. 1. Диагональные элементы матрицы [d]Z-1[d] равны сумме обратных сопротивлений (проводимостей) всех резисторов, подходящих к узлу. В нашем примере к узлу В подсоединены два резистора с сопротивлениями 1 и 2 ома. Поэтому левый верхний элемент равен 1 + 1/2 = 3/2. 2. Недиагональные элементы матрицы [d]Z-1[ci] равны (с точностью до знака ±)17 обратному сопротивлению в ветви, соединяющей два соответствующих узла. Поскольку у нас узлы В и С соединены резистором с сопротивлением в 1 ом, то недиагональный элемент матрицы равен — 1. 3. Компоненты вектора [д]/?_1[с£]Ф представляют суммарный ток, который вытекал бы из каждого узла, если убрать из цепи источники. Так, в вышеуказанном примере, если нет источников, Фл = 0 и Фв = 8, то ток в 5 ампер будет течь от узла В к узлу А через резистор с сопротивлением в 2 ома, и ток в 2 ампера будет течь от узла В к узлу С через резистор с сопротивлением 1 ом, создавая полный ток в 7 ампер. Можно проверить, что первая компонента вектора Щг^ЩФ равна 7. 4. Компонентами вектора К — Z-1W являются токи в ветвях, которые возникли бы при условии, что все узловые потенциалы обратились в нуль. В нашем случае, если Фл и Φ 17Выбор знака, как и в методе круговых токов (пункт 2 на с. 623), зависит от направления прохода ветви. Точную формулировку оставим читателю в качестве упражнения. — Прим. ред.
626 Глава 12. Теория электрических цепей приравнять нулю, то в ветви α через резистор с сопротивлением в 2 ома протекал бы ток в 4 ампера, а полный ток был бы равен 4 + 3 = 7 амперам. Первая компонента тока К — Z-1W действительно равна 7. 5. Компонентами вектора [9] (К—Z_1W) являются токи, которые втекали бы в каждый узел при условии, что все узловые потенциалы равны нулю. Итак, если Фл = Фв = Фс = О, то в узел В будет втекать ток в 7 ампер по ветви а. Не будет никакого тока в ветви β, текущего к узлу С. Поэтому суммарный ток в узле В будет равен 7 амперам. 6. Уравнение [д]/?_1[с£]Ф = [д](К — Z_1W) показывает, что сумма токов, вытекающих из каждого узла по ветвям через резисторы в силу имеющейся разности потенциалов на узлах, равна сумме токов, втекающих в этот узел, если бы все узловые потенциалы были равны нулю. Поэтому полный ток, втекающий в каждый узел в силу имеющихся разности потенциалов и источников, равен нулю, что соответствует первому закону Кирхгофа. Если теперь сравнить шесть утверждений, касающихся метода узловых потенциалов, с шестью утверждениями относительно метода круговых токов, то можно увидеть их двойственность. Замените термин узел на ячейку, ток на напряжение и сопротивление на проводимость — и факты замечательно совпадут. В рассмотренном примере есть одна особенность, которая не выполняется в общем случае: размер матрицы, которую надо обращать, был одинаковым для двух методов, поскольку там было две независимых ячейки и два незаземленных узла. Однако число независимых ячеек не всегда равно числу незаземленных узлов, поэтому матрицы могут быть разного размера. 12.7. Теорема Кирхгофа Возникает вопрос: будет ли метод круговых токов работать для любой цепи? Эта проблема сводится к обратимости отображения sZa. Поскольку sZa является отображением из пространства Н\
12.7. Теорема Кирхгофа 627 (пространство круговых токов) на пространство Η , дуальное к нему (пространство напряжений при обходе ячеек), то оба эти пространства имеют одинаковую размерность. Поэтому нам надо только проверить, что sZa — инъективное отображение, т. е. что его ядро равно нулю. Рассмотрим произвольный ненулевой элемент J в пространстве Hi. Его образ (sZo)3 является элементом дуального пространства Н1. Нам надо показать, что этот элемент не равен нулю. Сделаем это, просто вычислив его значение на элементе J. Поскольку s является сопряжением σ, то мы имеем [(sZa)3](3) = [Ζσ3](σ3). Однако σ3 есть просто вектор тока I в ветви, а Ζσ3 = Ζ\. Следовательно, [{sZa)3}3 = (ZI)I = ίζΐ = ΤζΊΙ*, Jl ι где сумма берется по всем ветвям. Если у матрицы Ζ все диагональные элементы положительны, то Jj Z\ > 0, кроме случая, когда 1 = 0. Поскольку σ инъективно, то условие I = σ3 = 0 означает, что J = 0, т. е. все токи в ветвях равны нулю, только если равны нулю все токи в ячейках. Таким образом, для ненулевого J мы имеем [(sZa)3]3 > 0. Отсюда можно заключить, что (sZa)3 не может быть нулевым элементом пространства Н1, если J φ 0. Поэтому sZa, имея нулевое ядро, является обратимым отображением. Следовательно, мы доказали, что метод круговых токов работает для любых цепей, содержащих только резисторы. Аналогичные аргументы показывают, что в этом случае [d]Z_1[d] также обратимо. А это значит, что работает и метод узловых потенциалов. В более общем случае, когда в цепи имеются резисторы, конденсаторы и индукторы, изложенная процедура также дает интересную информацию. Если в цепи Ь ветвей, то Ζ задается диагональной матрицей 6 х 6, с матричными элементами (импедансами ветвей), зависящими от частоты ω/2π. Если каждая ветвь содержит только один конденсатор или один индуктор, то импеданс будет равен либо kuL, либо —i/u>C. Если в цепи есть т независимых ячеек, то sZa будет матрицей т χ т с матричными элементами, зависящими от ω. Определитель этой матрицы приводится
628 Глава 12. Теория электрических цепей к полиному D{u2) степени не выше т. Оператор sZa не будет обратимым при условии D(u)2) = 0. Это значит, что существует не более т значений ω2, для которых sZa необратим. Такие частоты ω/2π называются резонансными частотами системы. Для каждой из этих резонансных частот уравнение (sZa)J = 0 имеет ненулевое решение, несмотря на нулевую правую часть, указывающую на отсутствие источников, т. е. токи могут течь по системе даже без источников напряжения или тока. Решения этого уравнения определяют нормальные моды системы. Аналогичные соображения, примененные к матрице [d]Z_1[d] размера (6 — т) х (Ь — т), показывают, что может быть не более Ь — т резонансных частот. Поэтому для нахождения резонансных частот цепи мы строим матрицу оператора sZa или [d]Z_1[d] (у которой меньше размер) и вычисляем частоты (ω2), для которых определитель матрицы равен нулю. 3 β §2Х ,« II ? II с ι "1 L I и II 2С ι А Рис. 12.29 В качестве примера рассмотрим цепь, изображенную на рис. 12.29. Эта цепь имеет ту же топологию, что и цепь на рис. 12.28. Поэтому 1 1 0 0 1 0\ -1 l)' σ = /1 1 1 о\ 0 -1 V В этом случае матрица Ζ содержит импедансы различных компонент: za = 2'iujL, Ζβ = —Ί/ωΟ, ζΊ = vuL, z$ = —i/2wC.
12.7. Теорема Кирхгофа 629 Ζ = \ Тогда /2ωΙ 0 0 0 \ 0 -{иС)'1 0 0 0 0 uL 0 \ О 0 0 -(2шС)-у Перемножая матрицы, получаем _ . [3uL - (loC)-1 -uL sZa-1y _ωΐ UL - {2ωΟ)-λ Определитель этой матрицы равен Oet(sZa) = -(3uL - (uC)~l){uL - {2ωΟ)~ι) + u2L2, или Oet{sZa) = -2ω2Ι? + 5L/2C - l/2u2C2. Полагая Oet(sZa) = 0, получаем уравнение, квадратичное по ω Ό{ω2) = 2L V - 5Llo2/2C + {2С2)'1 = 0. Оно легко разлагается на множители: {Ьь? - C~l)(2Lu2 - (2С)"1) = 0. Таким образом, резонансные частоты этой цепи равны ω2 = 1/LC и ω2 = 1/4LC. Чтобы найти соответствующие нормальные моды, для каждой резонансной частоты решим уравнение (sZa)J = 0. Например, для ω = y/l/LC 2. значит, что sZo-\-jljc \vm>- Решением уравнения (sZa)J = 0 является I „ I. Это ток в ячейке 2 в два раза больше тока в ячейке 1. Аналогично для ω = yJl/ALC имеем sZa-iH^5 ~1у/Щ
630 Глава 12. Теория электрических цепей так что уравнение (sZa)J = 0 имеет решение 1 Это значит, что в нормальной моде с частотой ω/2π токи по ячейкам J χ и J2 имеют одинаковую амплитуду, но противоположные фазы. 12.8. Цепи переменного тока в стационарном режиме и фильтры Понятие импеданса, использовавшееся в предыдущем параграфе для определения резонансных частот цепей, содержащих индукторы и конденсаторы, может быть использовано для анализа цепей переменного тока в установившемся режиме. Предположим, что все источники тока и напряжения имеют одинаковую частоту ω/2π, так что токи в ветвях образуют вектор ал Au>t V/ а напряжения на ветвях образуют вектор /Va\ V = νβ eiu,i. w Здесь компоненты Ια, Ιβ,... и Va, V@,... являются комплексными величинами; вещественная часть каждой компоненты представляет истинный ток или напряжение. (Вспомним, что eluJt = cos ωί + ίβΐηωί.) Источники напряжения и тока представляются соответственно векторами W fwa\ \ '■■) Λωί и К \; / „iu>t Для каждой ветви по-прежнему выполняется соотношение Va-Wa = za{Ia - Ка),
12.8. Цепи в стационарном режиме и фильтры 631 где za является диагональной матрицей, элементы которой — комплексные импедансы в различных ветвях. Формализм, разработанный нами для цепей постоянного тока, переносится практически без изменения на цепи переменного тока в стационарном режиме. Необходимо сделать только несколько изменений. 1. Физические напряжения и токи в ветвях определяются вещественной частью соответствующей компоненты комплексных векторов IeluJt или VeluJt. 2. Амплитудные значения напряжений и токов в ветвях определяются модулем комплексной величины, которая представляет напряжение или ток, т. е. если в ветви а ток представляется 1а, то его амплитудное значение равно \Ia\ = V(Re/Q)2 + (Im/Q)2. 3. Средняя мощность, выделенная в ветви а, определяется средним значением произведения вещественных частей комплексных величин Va и 1а, т.е. средняя мощность Ρ выражается формулой Ра = Среднее от [Re(VQeiu") Re(/Qeiu")] 1 Среднее от \{VaeluJt + Va*e'luJt){IaeluJt + Гае'ш1)\ Среднее от (VaIae2iuJt + VaI*a + Va*Ia + Va*7*е~21и"), где знак * обозначает комплексное сопряжение. Поскольку члены, содержащие β2ιωί и e~2lurt, при усреднении по времени обращаются в нуль, мы имеем Ра = \ (Va*Ia + VaPa) = \ Ъе{УаГа). В случае, когда ветвь α состоит только из резистора, т. е. Vе* = Ша, это выражение упрощается, и мы получаем
632 Глава 12. Теория электрических цепей Если ветвь состоит только из конденсатора или индуктора, то ее импеданс za чисто мнимый, поэтому средняя выделенная мощность в этой ветви равна нулю. В качестве простого примера цепи в стационарном режиме рассмотрим так называемый низкочастотный фильтр, изображенный на рис. 12.30. Будем считать, что в цепи есть две ветви. Базисом для Z\ является ячейка а + β, так что σ = s = (1 1). Поскольку Ζ R 0 0 -i/uC то сразу же получаем ιζσ=^ Чо -ΐ/ΐσ)(ϊ)-*-ι/ωσ- R Ее Ui(rS\ "β в с Рис. 12.30 Напряжение на ветви α равно Wa = —£e10Jt (полярность ука- рисунке). Тогда ток в ячейке равен J = (sZa)-\-sW) 1 R - i/ωθ £е iu>t Амплитудное значение этого тока равно модулю этого выражения, т. е. И ε R - i/шС ε УД2 + (и2С2) -ι ■ а амплитудное значение напряжения в ветви β равно \νβ\ = \ζβΙβ\ = -i£/uC R - i/uC s/(ujRC)2 + 1
12.8. Цепи в стационарном режиме и фильтры 633 Это значение уменьшается от Ε для ω = О до нуля при ω —> оо. Отсюда и происходит название низкочастотный фильтр18. Эту цепь можно слегка усложнить, присоединив последовательно к конденсатору индуктор. В этом случае импеданс ветви β равняется zl = i(uL — 1/иС), а ток в ячейке равен19 J = S/(R + i(uL - (иСу1)). Легко видеть, что этот ток достигает максимальной амплитуды при L = 1/и2С или ω = \J\jLC. Эта частота называется •резонансной частотой цепи, изображенной на рис. 12.31. Рис. 12.31 На рис. 12.32 изображен более сложный пример цепи. Теперь базис Ζ состоит из двух ячеек Μχ = α+β и М2 = —β-\-η, поэтому σ 1 О -1 1 Поскольку 18Описанное поведение снимаемого с ветви β напряжения — убывание с ростом частоты — дает возможность отделить низкую частоту сигнала (например, звука) от модулированной им высокой частоты электромагнитных волн. Данный принцип лежит в основе работы всей радиосвязи. — Прим. ред. 193десь и далее для упрощения записи опускается фазовый множитель е""*. — Прим. ред.
634 Глава 12. Теория электрических цепей ее Рис. 12.32 мы имеем sZa R О vjjL О -iuL —i/u)C R + koL —koL -koL koL — i/uCJ ' Нетрудно получить обратную матрицу (sZa)'1 = 1 iujL — Ί/ωΟ iuL R(koL - i/uC) + LC'1 \ koL R + koL Чтобы определить токи в ячейках, запишем вектор W = и вычислим J = {sZo)~1{-sW) = ε ikoL — ϊ/ωΟ R(koL - i/uC) + LC'1 \ koL Интересным является решение для резонансной частоты ω/2π, где ljL = 1/иС и J = ( . 1. В этом случае в ячейке Μι L/C \vjjLJ нет тока, и в резисторе не выделяется мощность. Наша техника позволяет анализировать цепи переменного тока произвольной сложности так же легко, как и цепи постоянного тока той же топологии. В качестве примера рассмотрим двухступенчатый фильтр (рис. 12.33).
12.8. Цепи в стационарном режиме и фильтры 635 £ег> Рис. 12.33 Поскольку эта цепь имеет три ячейки и только два незазем- ленных узла, то проще воспользоваться методом узловых потенциалов. Пусть узел А заземлен. Тогда [д] -1 О О -1 и И = / 1 -1 -1 о V о В этом случае \d\z-\d\ -1 -1 О 1 о -1 (-\/uL коС О V о о 1 -1 -ι/ о -i/uL -1/RJ ш>С — 2i/uL Ί/luL i/uL iuC - (i/wL) + 1/R Чтобы обратить эту матрицу, воспользуемся формулой $ = ([d]Z-1[d])-1[d]Z~1W, и определим потенциалы узлов В и С. Ограничимся решением задачи для резонансной частоты, когда ω С = IfuL. В этом случае обращаемая матрица имеет вид да-1 и -vjjC коС шС 1/R
636 Глава 12. Теория электрических цепей Заметим, что для этой частоты [a]^w=(-1fL) = (i5f). Тогда (фв\ = 1 / 1/R -i^C\ (iluC\ \фс) (-iuC/R) - и2С2 \-iiuC -ϊωΟ) \ О ) или \ФС) ~ (-iuC/R) - и2С2 \ uj2C2 J ' Резюме A. 1-комплексы Для заданной схемы, представляющей 1-комплекс, Вы должны знать, как построить максимальное дерево и связанные с ним базисные ячейки пространства Ζ\ и как написать матрицы для σ, s, д и d. Вы должны знать определения подпространств Bq, Hq, Z\, Н°, Р° и β1 и уметь строить для них базисы. B. Цепи с резисторами Вы должны уметь писать соотношение между V и I для ветви, содержащей батарею, источник тока и резистор. Для расчета электрических цепей Вы должны знать и уметь пользоваться методами Максвелла: методом круговых токов и методом узловых потенциалов. C. Цепи переменного тока Вы должны уметь пользоваться методами Максвелла для нахождения стационарных решений и нормальных мод сетей, содержащих индукторы, конденсаторы, синусоидальные источники тока и напряжений.
Задачи 637 Задачи 12.1,2. Для цепей, изображенных на рис. 12.34 и 12.35, сделайте следующее: «,1 + 7В + Юь В Ί С Юм 0" ΙΑ 4Α ЗОм δ 4- 4В + „20м Л Рис. 12.34 20* 0 20м 9В .Юм 20м Рис. 12.35 (а) Найдите множество независимых ячеек и напишите элемент С\, соответствующий каждой ячейке. (Можно воспользоваться обозначениями типа Μι = а + β — j.) Проверьте, что число независимых ячеек гп удовлетворяет условию т = b + 1 - п.
638 Глава 12. Теория электрических цепей (b) Выразите ток в каждой ветви через токи в ячейках и найдите напряжения на ветвях. (c) Применяя второй закон Кирхгофа к каждой ячейке, постройте систему уравнений для токов в ячейках. Решите эту систему. (d) Пусть узел А заземлен. Выразите напряжения и токи через остающиеся неизвестные узловые потенциалы. Применяя первый закон Кирхгофа к каждому узлу, получите систему уравнений для узловых потенциалов и решите ее. 12.3,4.Для комплексов, изображенных на рис. 12.36 и 12.37, сделайте следующее: D В. а, Α δ F G V I Рис. 12.36 (a) Определите размерность пространств С\, Z\, Со и Но- Проверьте, что dim Но — dim Z\ = dim Co — dim C\. (b) Для каждой связной компоненты найдите дерево Г, которое соединяет все узлы. После этого постройте базис пространства Z\ и запишите явно проекцию рт в виде рт(а) = О, ρτ{β) = β + Ί - δ, и т. д. (c) Определите, сколько необходимо иметь уравнений для токов в ячейках и для узловых потенциалов, чтобы рассчитать цепь с данной топологией. 12.5. Для каждой из трех ветвей, изображенных на рис. 12.38, найдите соотношение между V и /. В каждом случае постройте ветвь с тем же соотношением, содержащую только подходящие батарею и резистор (но не источник тока), а потом — источник тока и резистор (но без батареи).
Задачи 639 w 72 G ав F A + 12Β-Ϊ- 20i» Рис. 12.37 С 12В 4-, 4А +- 40к 4А В D F уп = Фл -Фв νβ = Фс -Ф° У"1' = Ф-Е-Ф|Г Рис. 12.38 12.6. Рассмотрите комплекс, изображенный на рис. 12.39. (а) Напишите матрицы д и d, соответствующие порядку ветвей α, β, 7, δ, ε, φ.
640 Глава 12. Теория электрических цепей D ,,ψ Рис. 12.39 (Ь) Покажите, что вектора ft) 0 0 \о) И η 1 1 \1/ образуют базис пространства Н°. Заземлите узлы А и С и покажите, что вектора 1 0 0 W 7 0 0 1 V и 0 0 0 W образуют базис пространства Р° C°/Z°. В этом базисе постройте матрицу оператора [d\ : Р° ^С1. (c) Для каждой компоненты выберите максимальное дерево с ветвями α, δ и ε. Тремя базисными элементами пространства Ζ\ будут ячейки, образованные остальными ветвями β, j и φ с ветвями дерева (ячейку выбирайте так, чтобы /3, 7 или δ имели коэффициент +1). В этом базисе напишите матрицу σ : Ζ\ —> С\. (d) Покажите, что столбцы матрицы [d\ определяют базис В1. Свяжите вектора факторпространства Я1 = С1 /Βλ с тремя ветвями, не принадлежащими максимальным деревьям, получив 1 0 0 0 W 7 (Л 0 1 0 0 W и 0 0 0 0 \1
Задачи 641 Покажите, что эти три вектора образуют базис пространства Н1, дуальный к базису, выбранному для Z\. (e) В этом базисе постройте матрицу s : С1 —> Н1. Убедитесь, что матрица s есть транспонированная матрица к σ. (f) Покажите, что границы траекторий, соединяющих заземленные узлы с незаземленными, образуют базис пространства Во, дуальный к базису пространства Р°. (g) Покажите, что классы эквивалентности заземленных узлов о 0 0 W Ρ и 1 0 V образуют базис пространства Но = С0/В0, дуальный к базису пространства Ζ0. 12.7. Для цепи, изображенной на рис. 12.34 (задача 12.1), постройте [d], [д], σ, s, Z, К и W. Составьте уравнения для токов в ячейках и уравнения для узловых потенциалов, используя эти матрицы и вектора. Проверьте, что получатся в итоге те же уравнения. Примите, что узел А заземлен, а ветви β и δ образуют максимальное дерево. 12.8. Сделайте то же самое для цепи, изображенной на рис. 12.35 (задача 12.2), считая, что узел А заземлен, а ветви α, β и δ образуют максимальное дерево. 12.9. Воспользуйтесь методом круговых токов и найдите токи в ветвях Ια, Ιβ, 1Ί для цепи, изображенной на рис. 12.40. Используйте ячейки, определенные выбором β в качестве максимального дерева. 12.10. Рассмотрите цепь на рис. 12.41. Пусть матрица преобразования s имеет вид _ /-1 +1 0 +ΐλ s ~ \ о о +1 -\) ■ Найдите в явном виде базис пространства Z\, который определяется этой матрицей s. Какое максимальное дерево приведет к этому базису? Пусть базис в пространстве Р° выбран так: р,=(!)· рЧ°Э'
642 Глава 12. Теория электрических цепей а В Ί Рис. 12.41 Выразите вектор I 1 1 через базисные вектора р1 и р2. Напишите W матрицы, представляющие [д] и [d]. Для данной цепи воспользуйтесь методом узловых потенциалов и вычислите Фв и Фс. 12.11. Рассмотрите цепь, изображенную на рис. 12.42. Для этой цепи напишите матрицы д и d. Пусть ветви α и 7 образуют максимальное дерево. Напишите базис пространства Ζ\, соответствующий этому максимальному дереву, и в этом базисе постройте матрицу σ. Воспользуйтесь методом круговых токов и получите токи в ветвях этой цепи.
Задачи 643 β Юм 7 С WV—»- ЗОм Рис. 12.42 12.12. (а) Используя метод круговых токов, определите частоты нормальных мод для цепи, изображенной на рис. 12.43, т.е. определите значения ω/2π, для которых матрица sZa вырождена. Для этих частот найдите решения уравнения (sZa)J = 0. (b) Рассчитайте эту цепь методом узловых потенциалов. Если узел А заземлен, то все равно придется обращать матрицу 3x3. Почему существуют только две нормальные моды? (c) Соединив последовательно ветви ас/Зиосеи убрав узлы С и D, преобразуйте эту цепь в цепь, содержащую только
644 Глава 12. Теория электрических цепей два узла. Рассчитайте цепь методом узловых потенциалов. На этот раз остается работать с матрицей 1x1! 12.13. (а) Используя метод круговых токов, определите частоты нормальных мод для цепи, изображенной на рис. 12.44. Для каждой моды выразите частоту ω/2π через величину ωο = Ι/λ/LoCo и получите отношение токов в ячейках J2/J1. Рис. 12.44 (Ь) Для той же цепи методом узловых потенциалов определите частоты нормальных мод. 12.14. (а) Для цепи, изображенной на рис. 12.45, постройте комплексную матрицу sZa. Г^ Τ 000 ? Θ β Рис. 12.45 (Ь) Предположим, что генератор в ветви а подает напряжение, равное вещественной части £0егш*. Получите выражения для стационарных напряжений V@ и Vs. 12.15. Вернемся к упражнению 12.13 и предположим, что последовательно с конденсатором между узлами А и В соединен источник, создающий ток К = Ке(К0еш°1), где ω0 = l/\fL0Co· Получите выражения для токов в ячейках J\ и J2.
Глава 13 Метод ортогональных проекций В этой главе мы продолжаем изучать электрические цепи. Исследуем краевые задачи, возникающие в цепях с конденсаторами, и используем изложенные методы для решения ряда классических задач в электростатике при наличии проводников. 13.1. Метод ортогональных проекций Вейля Рассмотрим еще два метода, используемых для расчета электрических цепей: метод ортогональных проекций Вейля и оригинальный метод Кирхгофа. Оба метода интересны и их стоит изучить, хоть они и ограничены только цепями с сопротивлениями, т. е. случаем, когда все импедансы za — положительные числа, za = ra> 0. Начнем с метода Вейля. Уравнение, связывающее векторы напряжений на ветвях V и токов в ветвях I, имеет вид V-W = Z(I-K). Перепишем его в виде V = W + Z(I - К) или V = Z(Z-1W + I-K). Матрицу Ζ используем для определения положительно определенного скалярного произведения в пространстве С\ токов,
646 Глава 13. Метод ортогональных проекций протекающих по ветвям: (I, l')z = J ZI' = ταΙαΓα + τβΙβΙ'β + ■■■. Предположим, что у нас есть произвольное распределение токов по ветвям I', удовлетворяющее первому закону Кирхгофа д\' = О, и произвольное распределение напряжений V, удовлетворяющее второму закону Кирхгофа V = — άΦ. Нам известно, что Jv V = 0. Поскольку V = Z(Z^W + I - К), можно написать / Z(Z-1W + 1-K) = 0. Jv Если это соотношение выразить через скалярное произведение, введенное выше, то его можно переписать в виде (I/,Z-1W + I-K)z = 0. Это значит, что вектор (К — Z-1 W) — I ортогонален всем циклам. Теперь мы можем задачу о цепи с сопротивлениями сформулировать по-другому. Нам дано пространство С\, образованное токами в ветвях. Внутри него лежит подпространство циклов Z\. Для сети с заданными векторами источников W и К можно построить вектор К — Z-1W, который описывает токи в ветвях, существующие при условии, что все узловые потенциалы равны нулю. В общем случае этот вектор не является элементом подпространства Z\. Теперь мы хотели бы получить такой вектор I G Z\, чтобы вектор (К — Z-1W) — I был ортогонален всем циклам. Итак, мы свели расчет цепи с резисторами к геометрической задаче, изображенной на рис. 13.1. Для данного вектора К — Z-1W в пространстве С\ надо вычислить его ортогональную проекцию на подпространство Ζ\ относительно скалярного произведения, определенного матрицей Ζ. Тогда вектор К — Z-1W записывается в форме К - Z^W = I + (К - Z~lyW - I), где I принадлежит пространству Z\, а К — Ζ~ΐΛιΝ — I = — Z_1V ортогонален Z\. Пусть π обозначает линейное преобразование,
13.1. Метод ортогональных проекций Вейля 647 Рис. 13.1 которое проектирует С\ ортогонально на Z\. В этом случае решением задачи о цепи является I = тг(К - Z^W), V = Z(7r-l)(K-Z-1W). Геометрически очевидно, что существует единственный проекционный оператор π, а следовательно, существует единственное решение задачи для данной цепи. Одним из способов получения ортогональной проекции из С\ в Z\ основан на выборе ортонормированного базиса. Пусть {βι,β2,... ,ет} — ортонормированный базис пространства Ζ\. Тогда если и — элемент пространства С\, то его проекция на подпространство Ζ\ дается формулой 7П1 = (ei, u)ei + (е2, u)e2 Η + (em, u)em. Процедура вычисления матрицы π довольно утомительна. Сначала мы должны выбрать базис подпространства Ζ\, например, семейство независимых ячеек. После этого применяем процедуру Грама-Шмидта, чтобы этот базис преобразовать в ортонормированный относительно скалярного произведения, определенного матрицей Ζ. Наконец, мы должны брать по очереди каждый базисный вектор пространства С\ и вычислять его проекцию на пространство Ζ\, беря сумму проекций на векторы ортонормированного базиса Ζ\. Каждая такая проекция определяет столбец матрицы π.
648 Глава 13. Метод ортогональных проекций В качестве иллюстрации метода Вейля рассмотрим цепь, изображенную на рис. 13.2. Для этой цепи пространство С\ двумерно. В ней есть только одна ячейка а + β, поэтому подпространство Ζ\ одномерно и натянуто на вектор ( 1. Матрица Ζ имеет вид 1 О О 3 В 4А 1 ·— Q -1В >Юм • • * I β ЗОм ^ 1А А Рис. 13.2 Чтобы вычислить проекционную матрицу 7Г, мы должны по очереди спроектировать два базисных вектора /Л /0' на подпространство Z\. Сначала отнормируем базисный элемент Z\: Ί\ ίίΐ\ (\ 0\ (\ длина вектора | ) равна \Г \0 3 = 4, поэтому мы делим вектор ( 1 на л/4 = 2, в результате получая вектор ( ,„ I, длина которого равна 1. Проекция вектора I ) равна 1 О О 3 1/2 1/2 1/2' 1/2 1/4 1/4
13.1. Метод ортогональных проекций Вейля 649 а проекция вектора равна 1/2' 1/2 1/2 1/2 3/4' .3/4 Отсюда матрица ж = рис. 13.2, получаются вектора К = 1/4 3/4 1/4 3/4 Для цепи, изображенной на 4\ ,„ /-Г и\У = О . Поэтому K-Z~1W = вектору, получаем I = 7г(К - Z_1W) . Применяя матрицу π к этому _ Λ/4 3/4 1/4 3/4 ортогонален I, как и должно Тогда решение имеет вид Ια = Ιβ = 2. Заметим, что вектор быть. Расчет этой цепи графически изображен на рис. 13.3. Поскольку введенное скалярное произведение не является обычным евклидовым, то подпространство Z\ и его ортогональное дополнение представляются не перпендикулярными прямыми. 1 С: ——..__ /' '/2 1. ,' у' Z\ (токи, удовлетворяющие у' первому закону Кирхгофа) -<vk-z-1w-i —■^*k*-2:-1w '""——.. h Рис. 13.3 Понятно, как найти явное выражение проекционного оператора Вейля π, используя решение методом круговых токов. Вспомним, что в этом методе I = σ3, где J = (sZa)~1s(Z'K — W).
650 Глава 13. Метод ортогональных проекций Тогда I = a(sZa) xsZ(K — Ζ 1W). Сравнивая этот результат с формулой Вейля I = π (К — Z-1W), получаем, что 7г = σ(βΖσ)_1βΖ. Легко проверить, что π2 = π, как и должно быть для любого проекционного оператора1. 13.2. Метод Кирхгофа Рассмотрим метод, разработанный самим Кирхгофом. И хотя он был придуман за много десятилетий до метода Вейля, мы обращаемся к нему сейчас, потому что он дает явную формулу для проекционного оператора π через деревья в цепях. Предположим, что у нас есть связный комплекс и пусть Τ обозначает максимальное дерево. Вспомним, что для каждого такого дерева мы определили проекционный оператор рт: Ма) = { ма, если a G Т, если а £ Т, где MQ есть цикл, соответствующий единственной ячейке, содержащей ветвь а, а все остальные ветви принадлежат Т. (Цикл следует выбирать так, чтобы он содержал +а, а не —а.) Например, на рис. 13.4 одна ветвь β образует максимальное дерево. Тогда рт(а) = а - β, ρτ(β) = 0, ртЬ) =1 + β- Поэтому матрица, представляющая эту проекцию рт, имеет вид 1 0 0\ -1 0 1 I . Заметим, что все диагональные элементы рт равны 0 0 1/ либо +1, либо 0. Любой такой оператор рт является проекционным оператором на пространство Ζ\\ его образ есть Ζ\ и рг(М) = Μ для 1 Математическое название этого свойства проекции— идемпотентность. Каждый идемпотентный оператор π в конечномерном векторном пространстве может быть геометрически охарактеризован как проекция на образ Im π вдоль ядра Кег π. — Прим. ред.
13.2. Метод Кирхгофа 651 / В S а1 β \ s \ \ Τ 7 / / Рис. 13.4 Μ G Z\. Однако он не является ортогональным проекционным оператором, потому что его ядро не ортогонально подпространству Z\ (по отношению к скалярному произведению, определенному матрицей Z). Другими словами, рт — не самосопряженный оператор, потому что в общем случае для двух ветвей а и β {ρτα,β)ζ φ {α,ρτβ)ζ- Итак, рт для отдельно взятого максимального дерева Τ — не самосопряженный оператор, но в комплексе есть много различных максимальных деревьев. Открытие Кирхгофа состояло в нахождении процедуры получения самосопряженного оператора: различные проекционные операторы усредняются с определенным весом. Предположим, что для каждого максимального дерева Τ мы имеем вещественное число λτ, причем 0 < А^ < 1 и Στλτ = 1, где сумма берется по всем деревьям. Тогда оператор ρ\ = ζ2ι ^τΡί тоже является проекцией на пространство Ζ\\ его образ есть Ζ\, и он отображает любой вектор в пространстве Ζ\ в самого себя. Вообще говоря, р\ — не ортогональная проекция, но существует такой набор λχ, что ортогональность имеет место. Рецепт Кирхгофа состоит в том, что для каждого максимального дерева Τ определяем Qt = Π r/3'
652 Глава 13. Метод ортогональных проекций т. е. произведение сопротивлений тех ветвей, которые не принадлежат Т. Весовые множители А^ выбираются пропорциональными Qt так, чтобы их сумма равнялась единице, т. е. \t = Qt/R, где R=J^QT. τ Таким образом, мы получили явный вид проекционного оператора Вейля π, а именно π = R^Y^Qtpt. τ Теперь мы должны показать, что этот оператор самосопряженный; другими словами, что самосопряжен оператор Ятг = Y2,tQtPt- Поскольку ветви образуют базис в пространстве С\, то достаточно показать, что для любой пары ветвей а и β мы имеем τ τ Для фиксированных а и β мы суммируем по всем максимальным деревьям. Имеются три случая, изображенных на рис. 13.5. а а а Случай 1 Случай 2 Случай 3 Рис. 13.5 Случай 1. Ветви а и β принадлежат дереву. В этом случае рт{&) = 0 и ρτ{β) = 0. Поэтому от дерева нет никакого вклада в обе части уравнения. Случай 2. Ветви α и β не принадлежат дереву. В этом случае ρτ(οι) является ячейкой, которая не содержит β, поэтому (ρτ(θί),β)ζ = 0. Аналогично (α,ρτ(β))ζ — 0) поэтому опять от дерева нет никакого вклада.
13.2. Метод Кирхгофа 653 Случай 3. Ветвь а не принадлежит дереву, а β принадлежит. В этом случае если β входит в ячейку MQ, образованную α и другими ветвями дерева (иначе ситуация такая же, как в случае 2), то мы имеем (рта, β) ζ = ±»> где берется знак +, если а и β входят в MQ с одинаковыми знаками, и знак —, если эти ветви входят в ячейку в противоположными знаками. Например на рис. 13.6(a) мы имеем рт{&) = α~η — β + δ и (ργ(οί),β)ζ = ~νβ- Всегда существует единственное максимальное дерево Т", образованное заменой ветви /Знаав дереве Т, для которого ρτ'(β) = ±ρτ(α), так что (α, ρτ'{β))ζ = ±га. Такое дерево Т" показано на рис. 13.6(6). а) Дерево Τ б) Дерево V Рис. 13.6 Если из дерева Τ убрать ветвь β, то останутся те же ветви, что и при удалении из Т" ветви а. Значит, для этих двух деревьев справедливо равенство Qti~p = Qr^a, и оба выражения Qxffi и Qrfa являются произведениями сопротивлений остающихся ветвей. Соотношения между Τ и Т" симметричны относительно перестановки ветвей а и β. Тогда (3τ(ρτα,β)ζ = Ят'(сх,ртф)г- Каждому дереву Т, для которого левая часть равенства не равна нулю, соответствует дерево Т", удовлетворяющее этому равенству, и наоборот. Таким образом, если просуммировать по всем Т, то получим желаемый результат ^Qr(pTa^)z = Σ®τ(α>Ρτβ)ζ, τ τ
654 Глава 13. Метод ортогональных проекций где добавлены некоторые нулевые слагаемые. Итак, доказана формула Кирхгофа 7Г = R'1 Σ Q трт, где Ят=Цга, R=J2Qt, афТ Τ и суммирование ведется по всем максимальным деревьям. В качестве иллюстрации метода Кирхгофа рассмотрим цепь, изображенную на рис. 13.7 и имеющую ту же топологию, что и цепь на рис. 13.4. В цепи есть три максимальных дерева: ветвь α (дерево Т\), ветвь β (дерево Тг) и ветвь η (дерево Тз). В Юм 20ь :зоь А Рис. 13.7 Для дерева Т\ /О -1 Г рт, = 0 1 0 | и QTl = 2 · 3 = 6. \0 0 1; Для дерева Тг 1 0 0> рт2 = | -1 0 1 | и Qt2 = 1 · 3 = 3. 0 0 1,
13.2. Метод Кирхгофа 655 Для дерева Т3 /1 0 0\ рТз = О 1 0 и Qt3 = 1.2 = 2. V ι °/ Тогда R = QTi+Qt2+Qt3 = б+ 3 + 2 = 11. Следовательно, тг = γγ[6ρτ! + Зрт2 + 2рт3], или Эта матрица проецирует на подпространство Ζ\, натянутое на 1\ /0\ векторы ячеек ( —1 и I 1 | . Можно проверить, что О/ \Ь Матрица 1 — 7Г равна Она проецирует на ортогональное дополнение к Ζ\. Ее образ, являющийся ядром π, есть одномерное пространство, определяемое /Л /1^ вектором I 3 1. Этот вектор ортогонален обеим ячейкам I — 1 \-2/ I 0; и 111. Заметим, что б\ /1 0 0\ / 6^ 3=0 2 0 3|= -21 \0 0 3/ \-2у
656 Глава 13. Метод ортогональных проекций Как и следовало ожидать, вектор I б задает напряжения в V-6/ ветвях, что соответствует второму закону Кирхгофа. 13.3. Теорема взаимности Грина Изучение цепей с резисторами мы закончим мощным результатом, называемым теоремой взаимности Грина. С этой теоремой мы встретимся еще раз при изучении цепей, содержащих емкости, и в электростатике. Чтобы доказать эту теорему, представим себе цепь, в которой все ветви, кроме двух, содержат только резисторы без источников тока и напряжения, а в двух ветвях а и β, кроме резисторов, могут быть такие источники тока или напряжения. При определенном выборе источников в ветвях а и β мы получим решение с токами I, удовлетворяющими первому закону Кирхгофа, и напряжениями V, удовлетворяющими второму закону Кирхгофа. Выбрав другие источники, мы получим другое решение, для которого токи I и напряжения V также удовлетворяют двум законам Кирхгофа. (Типичная ситуация, к которой применима теорема Грина, показана на рис. 13.8.) Поскольку оба вектора токов I и I удовлетворяют первому закону Кирхгофа, то они лежат в пространстве Ζ\. Аналогично, поскольку оба вектора напряжений V и V удовлетворяют второму закону Кирхгофа, Решение /, V Решение /, V Рис. 13.8
13.3. Теорема взаимности Грина 657 они лежат в пространстве В . Мы знаем, что любой элемент пространства В1, действуя на любой элемент пространства Z\, дает нуль. Отсюда можно сделать вывод, что Тогда, если записать сумму по ветвям, мы получим Σ ™г= Σ ™г по всем ветвям по всем ветвям Из сумм выделим слагаемые, соответствующие ветвям α и β: ναια+νΡιβ+ Σ ν~<ιΊ = ναϊα+νΡϊβ+ Σ νΊΪΊ· по остальным по остальным ветвям ветвям Мы предположили, что все ветви, кроме α и /?, имеют только резисторы. Поэтому ΫΊ = τηΙΊ и V1 = τΊΙΊ. Тогда Σ^7/7 = ΣνΛ = Σ^ и мы можем сократить суммы по другим ветвям в обеих частях уравнения. В результате получаем vaia + v% = vaia + у%, что и называется теоремой взаимности Грина. С помощью теоремы взаимности можно получить ряд удивительных свойств пассивных цепей, содержащих резисторы, т. е. цепей, в которых нет никаких источников. Взяв такую цепь, мы можем добавлять к ней новую ветвь двумя способами, как это показано на рис. 13.9. Начав с цепи, содержащей только резисторы (рис. 13.9(a)), мы можем присоединить новую ветвь а между двумя узлами (рис. 13.9(6)). Такая «спайка» не создает новых узлов. Эта новая ветвь может быть как коротким замыканием, так и содержать источники тока, источники напряжения или резистор. Новую ветвь можно подключить и так, как показано на рис. 13.9(b), т.е. мы можем «перекусить» провод и вставить в разрыв новую ветвь, создав новый узел.
658 Глава 13. Метод ортогональных проекций и т. д. Рис. 13.9. (а) Исходная цепь, (б) Новая ветвь без создания новых узлов (спайка), (в) Новая ветвь с новым узлом (вставка) Предположим, что у нас есть линейная цепь, показанная на рис. 13.10, и к ней присоединены две новые ветви: ветвь а между узлами А и В, а ветвь β между узлами С и D. Несущественно, как мы это сделали: припаяв новый провод или вставив в старый. Из теоремы взаимности можно сделать следующие выводы. να = ε Рис. 13.10 у β = о у а = Q Рис. 13.11 Случай 1. Вставим батарею, создающую напряжение £ в ветвь а, и измерим ток I в ветви β. После этого ту же батарею вставим в ветвь β и измерим ток в ветви а (см. рис. 13.11). Поскольку νβ = 0 и Vе* = 0 (обе ветви соединены накоротко),
13.3. Теорема взаимности Грина 659 из теоремы взаимности следует, что ν?ιβ = vaia. Мы использовали одну и ту же батарею, так что V& = Va = £. Поэтому εΐβ = εϊα и Ι β = Ια. Этот результат интересен тем, что хотя сама цепь не обязана обладать свойствами симметрии, соотношение между приложенным напряжением и возникающим током симметрично. Случай 2. Вставим источник тока j в ветвь а и измерим получившееся напряжение на ветви β в разомкнутом состоянии. Потом тот же источник вставим в ветвь β и измерим ток в ветви а (см. рис. 13.12). Поскольку Ιβ = 0 и 1а = 0 (разомкнутые цепи), то теорема взаимности говорит, что в этом случае Но следовательно, и мы получаем ναια - νΗβ. Ια = ϊβ= j, vaj = vPj, γα _ γβ_ Ια = j + у/5 Ιβ = 0 Ια = О Рис. 13.12 h=3 В общем случае мы можем рассмотреть резисторный п-порт, из которого выходят η пар проводов. Если к различным портам присоединены источники тока Ια, Ιβ,..., то возникающие напряжения Vе*, V&,... будут зависеть от токов согласно формуле У = Ш,
660 Глава 13. Метод ортогональных проекций где R — матрица η χ п. Приведенные соображения показывают, что матрица R должна быть симметричной, потому что для любых портов А и μ зависимость Vх от Ιμ точно такая же, как зависимость νμ от 1\. Теорему взаимности Грина можно также вывести как следствие решения, полученного методом круговых токов. В случае, если нет источников тока, т. е. К = 0, то мы имеем J - (sZa^si-W). Следовательно, I = σ3 = -o{sZo)~1s'W. Матрица Ζ симметрична, а матрица s — транспонированная матрица σ. Поэтому матрица G = -a{sZa)~ls симметрична. Тогда можно написать I = GW, где матрица G, выражающая токи в ветвях через приложенное напряжение батареи, симметрична. Аналогично можно начать с решения, полученного методом узловых потенциалов: ф = (щг^щ^щк - z^w). Если нет источников напряжения, т. е. W = 0, то ν = -ΗΦ = -Η([9]ζ-1ΗΓ1[3]κ. На этот раз матрица [d\ — транспонированная матрица [д]. Тогда матрица R=[d\([d]Z-1[d])-1[d], выражающая напряжения на ветвях через приложенные токи, симметрична. В связи с этим стоит заметить, что зависимость V от W или I от К в общем случае не дается симметричной матрицей.
13.4. Цепи с конденсаторами 661 13.4. Цепи с конденсаторами Немного изменим задачу — вместо цепей с резисторами рассмотрим цепи с конденсаторами. Теперь каждая ветвь может иметь батарею и конденсатор, соединенные последовательно. Когда подсоединена батарея2, на пластинах конденсатора накапливается заряд и со временем устанавливается стационарное состояние. Поскольку заряды не могут пересечь расстояние между пластинами конденсатора, то в цепи не будет никакого тока. Нам нужно узнать величину заряда Qa на конденсаторе в ветви а и напряжение Va на этой ветви. γα — фА _ фВ „ Рис. 13.13 Типичный пример такой цепи изображен на рис. 13.13. На ветви α обозначены знаки зарядов на пластинах конденсаторов. Заметим, что так же, как и раньше, положительные значения Va и Wa относятся к падениям напряжения, когда ветвь проходится в направлении, указанном стрелкой. Положительный знак Qa означает, что сначала проходится положительно заряженная пластина конденсатора. Договорившись об этом, обозначим Са емкость ветви и напишем уравнение V0 Wa = Qa постоянного тока. — Прим. ред.
662 Глава 13. Метод ортогональных проекций Мы можем рассматривать вектор Q = {QaiQfi, ■ ■ ■) как 1-цепь, а вектор V = (Va, V@,... )т — как 1-коцепь. Однако, теперь связь между напряжением и зарядом дает энергию, а не мощность3. В векторных обозначениях мы можем написать V-W = C1Q, где С — диагональная матрица с матричными элементами Са. Если заменить Ζ на С~1 и мощность на энергию, то ситуация формально совпадает с той, что возникает в цепях с резисторами. Напряжение V по-прежнему получается из потенциала V = — άΦ. Поскольку ток не может течь через конденсаторы, то полный заряд на конденсаторах, соединенных с любым узлом, не может изменяться. Если вначале конденсаторы не были заряжены, то полный заряд на каждом узле будет равен нулю и dQ = О, точно так же, как мы имели д! = О для цепей с резисторами. Изолированные цепи конденсаторов, которые вначале не были заряжены и для которых справедливо условие dQ = О, можно рассматривать так же, как мы рассматривали цепи с резисторами. В предыдущих результатах надо только заменить I на Q и Ζ на С~1. Батареи, как и раньше, представляются вектором W, и нет ничего, что играло бы роль источника тока. Тогда по аналогии с методом круговых токов можно ввести заряды ячеек, описываемые вектором Ρ G Z\. В этом случае любое распределение зарядов, удовлетворяющее условию dQ = О, можно записать в форме Q = σΡ. Тогда P = (sC~1a)~1(-sW). Аналогично, мы можем заменить Z~l на С в методе узловых потенциалов и получить Ф = -{ЩС\а\у\д\С^'. Следует напомнить, что в отличие от выделяемой в резисторном участке цепи с сопротивлением R при напряжении U и токе / мощности Ρ = UI = IR2 = U2^1, потенциальная энергия конденсатора емкости С при заряде пластин ±<5 и напряжении U составляет Ε = \UQ = \CU2 = \Q2C~~^\ так что аналогия «мощность—энергия» здесь имеет место лишь с точностью до множителя |. — Прим. ред.
13.4. Цепи с конденсаторами 663 В общем случае, если конденсаторы вначале были заряжены, на пластинах, присоединенных к узлу А, может быть фиксированный полный заряд ρ а- Вектор ρ = {рл-,ΡΒ,- ■ ■) может рассматриваться как 0-цепь. Поскольку мы договорились, что с конечным узлом ветви соединена отрицательная пластина конденсатора, то в общем случае можно написать 0Q = — р. (Посмотрите на рис. 13.14 и убедитесь в правильности знака —.) Сумма зарядов на двух пластинах каждого конденсатора равна нулю, следовательно, по всем узлам + Qa '/?„-<Э/8 Θ "а +С А pa = -Qa - Qe + Q7 Рис. 13.14 Уравнение dQ = —ρ называется законом Гаусса. Закон показывает связь между зарядами узлов и зарядами на пластинах конденсатора в ветвях. В главе 16 мы будем изучать электростатику и там увидим, что аналогом узловых зарядов будет плотность заряда р, а аналогом Q — диэлектрическое смещение D. Мы объясним, что D можно рассматривать как 2-форму в трехмерном пространстве и опишем, как надо ставить физический эксперимент, чтобы измерить значение D. Окажется, что закон Гаусса — это просто трехмерный вариант теоремы Стокса. В большинстве книг электростатика излагается в рамках векторного анализа, где диэлектическое смещение D считается векторным полем. Закон Гаусса становится теоремой о дивергенции. Однако, в рамках нашего исследования цепей с конденсаторами уравнение dQ = —ρ означает, что каждому узлу мы приписываем сумму
664 Глава 13. Метод ортогональных проекций зарядов на пластинах конденсатора, присоединенного к нему. До конца этой главы мы будем изучать цепи без источников напряжения, т. е. с W = 0, где конденсаторы имеют первоначальный заряд. Тогда наши уравнения принимают вид Q = CV, V = -άΦ и 9Q- -р. Эти три уравнения можно собрать вместе и получить -дСаФ = -р. Это уравнение называется уравнением Пуассона. Оно связывает функцию потенциала с зарядами узлов. Оператор —dCd, стоящий в левой части уравнения Пуассона, называется лапласианом и обозначается Δ. Тогда уравнение Пуассона можно переписать в форме ΔΦ = -р. Теперь оператор d отображает С0 —> С1, С отображает С1 —> С\ и д отображает С\ —> Cq. Поэтому лапласиан Δ отображает С0 —> Со- Как и следовало ожидать, потенциал Ф, стоящий в левой части уравнения Пуассона, принадлежит С0, а р из правой части этого уравнения принадлежит Со- Полезно написать явную форму лапласиана. Пусть и — элемент пространства С0, а А — узел. Если ветвь α имеет А в качестве одного из концов, то du(ct) = ±(и(А) - и(В)), если да = ±(А - В). Поэтому С du имеет коэффициент ±Са(и{А) — и(В)) для ветви а. Подействуем теперь оператором д и найдем коэффициент в узле А (суммируя по всем α с условием да = ±(А — В) для узла В): (Аи)(А)= Σ Са(и(В)-и(А)). а: да=±(В-А) В частности, и удовлетворяет уравнению Лапласа Аи = 0,
13.4. Цепи с конденсаторами 665 тогда и только тогда, когда и(А) ΣΟ* Y^Cau{B), где сумма берется по всем узлам В, являющимся концами ветвей, выходящих из узла А, как это показано на рис. 13.15. Другими словами, уравнение Лапласа говорит, что значение и на узле А есть среднее от всех значений на ближайших соседних узлах, причем весами являются емкости соответствующих ветвей. Рис. 13.15 Эту интепретацию следует сравнить с уравнением в частных производных д2и д2и п αχΔ ду* введенным в главе 6. Это уравнение говорит, что значение и в точке Ρ есть среднее от и по малым окружностям с центром в точке А. Там, чтобы определить понятие окружности, мы должны были иметь евклидову геометрию на плоскости. Здесь, чтобы определить усреднение по ближайшим соседям, нам требуется матрица емкостей С. Существует аналогия между выбором матрицы С и выбором евклидовой геометрии на плоскости. Мы рассмотрим что подробнее в главе 16. А пока вернемся к изучению уравнения Пуассона. Заметим,
666 Глава 13. Метод ортогональных проекций что потенциал Φ в левой части уравнения определен с точностью до функции, которая постоянна для всех связных компонент цепи. Действительно, любая такая функция принадлежит ядру d и, следовательно, ядру Δ = —dCd. Величина ρ в правой части уравнения лежит в подпространстве Во пространства Со, поскольку, по определению, узловые заряды получаются в результате действия д на заряды ветвей. Вспомним, что мы ввели факторпространство Р° = C°/Z°, ограниченный кограничный оператор [d] : Р° —> С1 и ограниченный граничный оператор [д] : С\ —> Во. Ситуацию в целом можно изобразить на схеме отображений Это значит, что можно ввести ограниченный лапласиан [Δ] = — [9]C[ci] и рассмотреть ограниченное уравнение Пуассона [Δ]Φ = -ρ для Φ G Р°. (Другими словами, Φ является потенциалом, определенным с точностью до аддитивной постоянной на каждой связной компоненте цепи.) Далее, поскольку оператор С дается положительной диагональной матрицей в стандартном базисе С1 и С\, из теоремы Кирхгофа (с формулировкой для узловых потенциалов), мы знаем, что матрица [9]С[е?] обратима и, следовательно, решение ограниченного уравнения Пуассона имеет вид ф = тещ-1 р. Пример. Задача, где применяется простое уравнение Пуассона, изображена на рис 13.16. На узле В заряд равен 4, на узле С он равен 1. Мы хотим найти потенциалы на всех узлах. (Для конкретности заряд будем определять в микрокулонах, емкость в микрофарадах, а потенциал в вольтах.) Пусть узел А заземлен. Тогда ограниченный граничный оператор и=(ϊ 1 -!)
13.5. Краевые задачи 667 Рис. 13.16 (напоминаем, что убрана строка, соответствующая узлу А). Матрица оператора [d] является транспонированной к матрице [д], т.е. ' 1 0^ И = | -ι ι 0 -1; Ί 0 0> Матрица С равна (020 ,0 0 3; поэтому [d]C[d] = Решение уравнения Пуассона имеет вид (иод)-1 = ^ (: 5 2 2 3 Φ 1 ΪΪ 13.5. Краевые задачи Задача для уравнения Пуассона, которую мы только что решили, аналогична электростатической задаче, когда вычисляется потенциал Ф(г), создаваемый распределением заряда р(г) в
668 Глава 13. Метод ортогональных проекций вакууме, когда не заданы граничные условия. В электростатике возникают более интересные задачи, когда конкретизируются граничные условия для нулевого потенциала на определенных проводниках, или когда фиксируется потенциал на границе области. Здесь мы рассмотрим несколько таких примеров. Рис. 13.17 На рис. 13.17 изображена система конденсаторов, причем ни в одной ветви нет батерей. Узлы этой цепи разделим на два класса: граничные узлы и внутренние узлы. Граничные узлы А п В соединяются с внешними источниками, которые поддерживают на них определенные значения потенциалов. Поскольку заряды могут свободно перетекать по проводам, соединяющим эти узлы с внешними источниками, то нет смысла задавать на граничных узлах значение полного заряда. Внутренние узлы С и D соединены только с другими узлами цепи, и не подходят к внешним источникам. Полный заряд на таких узлах постоянен и может быть задан. При этом нет смысла задавать потенциал на внутренних узлах. Для расчета такой цепи в общем случае мы будем задавать потенциал на граничных узлах и полный заряд на внутренних узлах. Задача в том, чтобы найти потенциалы на внутренних узлах и полные заряды на граничных. По существу эта задача может быть представлена как суперпозиция двух более ограниченных проблем. 1. Задача Дирихле. Полный заряд на каждом внутреннем узле полагается равным нулю, а потенциал на каждом гранич-
13.5. Краевые задачи 669 ном узле имеет определенное значение (в общем случае не равное нулю). 2. Задача для уравнения Пуассона. Потенциал на каждом граничном узле полагается равным нулю, а полный заряд ρ на каждом внутреннем узле имеет определенное значение. Задача именно такого типа изображена на рис. 13.15, где узел А является граничным. Решение общей задачи всегда может быть представлено как суперпозиция решений задачи Дирихле с соответствующими граничными условиями и задачи Пуассона с соответствующими значениями зарядов на внутренних узлах. Разделив узлы на два класса, мы получили два векторных пространства: Со (узловые заряды) и С0 (узловые потенциалы). Пространство Со есть прямая сумма Со = С0грал Θ С0внутр, где Сдран состоит из 0-цепей, имеющих ненулевые коэффициенты только на граничных узлах, и СдНутр состоит из 0-цепей, имеющих ненулевые коэффициенты только на внутренних узлах. Аналогично мы имеем ° — <^гран Φ °в: где Сдран состоит из тех линейных функций, которые обращаются в нуль в СдНутр, а Свнутр состоит из функций, обращающихся в Стран 0 ■ Потенциал Φ может быть разложен единственным способом в сумму элементов из пространства Cj?paH и С®нутр, т.е. Ф = Ф гран + Ф внутр· Для цепи, изображенной на рис. 13.17 с граничными узлами А, В и внутренними узлами С, D, такое разложение имеет вид фВ фС /фЛ фВ 0 V о / + о фС
670 Глава 13. Метод ортогональных проекций Аналогично разлагается вектор, представляющий заряды узлов Р = Р' гран + р] внутр Тогда в цепи, изображенной на рис. 13.17, мы имеем (ра\ (ра\ Рв Рс Рв 0 + о PC \pd) Теперь задачи могут быть сформулированы в терминах разложений этих векторных пространств. 1. Задача Дирихле. Поскольку потенциал задается на каждом граничном узле, вектор Фгран известен. Более того, поскольку на внутренних узлах нет зарядов, вектор рвнУтр = 0. Мы должны найти такой вектор Фвнутр, чтобы на всех внутренних узлах выполнялось условие ^ (фвнутр "Г ^Ргран J = U. На граничных узлах мы имеем уравнение А(ФВНутр + Фгран) = -РГРЭЛ. Решив эти уравнения, мы узнаем потенциалы и заряды на всех узлах. 2. Задача Пуассона. На каждом внутреннем узле задается заряд. Следовательно, вектор рвнУтР известен. Поскольку потенциал равен нулю на каждом граничном узле, Фгран = 0. Мы должны найти такой вектор Фвнутр, чтобы на всех внутренних узлах выполнялось условие А(Фгран + Фвнутр) = -рВН™\ Раз потенциал известен, распределение зарядов на граничных узлах определяется уравнением гран _A(cb ι φ \ И — '-Н^гран ~ ^внутрУ-
13.6. Решение краевых задач методом Вейля 671 13.6. Решение краевых задач методом ортогональных проекций Вейля Сначала мы рассмотрим связную цепь, имеющую щ внутренних узлов и щ граничных узлов. Обе задачи могут быть решены методом ортогональных проекций Вейля. Для определения скалярного произведения напряжений на ветвях в пространстве С воспользуемся емкостной матрицей С : С1 —> С\ и напишем формулу (V,V)C= / V= Υ] CaVaVa. ^ v по всем ветвям Это скалярное произведение положительно определено, потому что С — диагональная матрица, у которой все матричные элементы положительны. Не удивительно, что это выражение может быть интерпретировано через энергию. Действительно, для любого значения V формула \{y^)c = Y^\ca(yaY представляет полную энергию, накопленную в конденсаторах. Относительно этого скалярного произведения пространство С1 разлагается в ортогональную прямую сумму С1 = d{CQ)@C~lZl. Действительно, мы знаем, что d(C°) является аннулирующим пространством подпространства Z\ пространства С\. Вычисление скалярного произведения элемента V из С\ на элемент типа С~11 равносильно вычислению скалярного произведения V на I: (У,С~11)с = fv. Разложим далее пространство d(C°). Поскольку dC®HyTp является подпространством С0, то его ортогональное дополнение внутри dC° есть подпространство dC°, которое обозначим D1. Тогда мы имеем разложение в виде прямой суммы dC° = DX(B dCB°HyTp.
672 Глава 13. Метод ортогональных проекций Следовательно, (13.1) С1 = D1 Θ dCB°HyTp Θ C~lZ, является разложением пространства С1 на три попарно ортогональных подпространства. Заметим, что всякий элемент пространства D1 имеет вид άΦ, потому что D1 С dC°. Кроме того, если V е D1, то V ± аС®нутр, и тогда О = (V, <й>внутр)с = / ЙФвнутр = / Фвнутр- JCV JdCV Для любого внутреннего узла мы можем найти такую функцию Фвнутр> которая не равна нулю на этом узле и обращается в нуль на всех других узлах. Тогда dCV должна иметь нулевые компоненты для всех внутренних узлов, т. е. dCV G Сдран. Но V = —άΦ, следовательно, Δ Φ = 0 для всех внутренних узлов. Другими словами, D состоит из άΦ, где Φ есть решение задачи Дирихле. Тем самым dimC_1Zi = dimZi = т· Если есть по крайней мере один граничный узел, то d : С®нутр —> С1 инъектив- но, поэтому dimdCgHyTp = щ. Кроме того, dim С1 = η + т — 1 = щ — 1 + щ + т. Тогда из уравнения (13.1) следует, что dim Dl = щ — 1. Если исключить заземленный узел, то останется щ — 1 граничных узлов, на которых мы можем задать произвольные значения Ф. Таким образом, задача Дирихле имеет решение всегда. В качестве примера разложения (13.1) рассмотрим цепь, изображенную на рис. 13.18. Здесь А, В и С — граничные узлы, а D — внутренний узел. Поскольку в цепи есть четыре ветви, то dim С1 = 4. Тогда получаются следующие ортогональные пространства. 1. Одномерное подпространство С Z\ с базисным вектором
13.6. Решение краевых задач методом Вейля 673 / 1\ 1/2 -1/2 ν о; дов С Этот вектор соответствует распределению заря- , для которого ρ = О во всех узлах. / Λ 1/2 -1/2 V <У ( Л 1 -1 ^ о/ Конечно, при этом нарушается второй закон Кирхгофа, поэтому эти заряды нельзя получить из потенциала. 2. Одномерное подпространство dC^HyTp с базисным векто- Ι Λ . Этот вектор описывает напряжения на ветвях, ром V-1/ возникающие от потенциала чВ С Φ фЛ _ ф# _ фО _ Q φ 3. Двумерное подпространство D1 с базисными векторами /2/3\ / 1/3\ -1/6 1/6 1/3 1 V о/ V 2/3/
674 Глава 13. Метод ортогональных проекций Эти вектора описывают напряжения на ветвях, возникшие из фА = фС = 0, Фв = 1 и Фл = Фв = О, ФС = 1 соответственно. Причем в обоих случаях р£> = 0. (В общем случае совсем не просто сразу написать базис для Z?1.) Решение уравнения Пуассона Сейчас мы уже можем решить уравнение Пуассона методом ортогональных проекций Вейля. Предположим, что на всех внутренних узлах заданы значения зарядов р. Мы построим любое распределение напряжений V, для которого —дС\ = ρ имеет данные значения на всех внутренних узлах. (При этом V может даже нарушить второй закон Кирхгофа.) Тогда существует единственное разложение •v = v + w, где V является элементом йСвНутр и W ортогонален dC^Hyrp~ Будучи элементом dC^Hyrp, распределение напряжений V может быть получено из потенциала при условии, что на граничных узлах Φ = 0. Поскольку вектор W ортогонален V, то он лежит в D1 Θ C~XZ\ и поэтому удовлетворяет условию 9CW = 0 для всех внутренних узлов. Тогда для внутренних узлов —dCV = —dCV = ρ, и V является решением задачи. Если π обозначает ортогональную проекцию С1 на dC®'нутр, то решение можно записать в форме V = ttV. Решение задачи Дирихле Задача Дирихле тоже может быть решена методом ортогональных проекций. Пусть Φ обозначает потенциал, который принимает определенные значения на граничных узлах и который равен нулю на всех внутренних узлах. Пусть V = — άΦ. Тогда V = 7T-V + (1 - tt)V.
13.6. Решение краевых задач методом Вейля 675 Поскольку πΫ € dC®HyTp, мы можем написать πΫ = —dip, где гр = О на граничных узлах. Если записать (l-7r)V = -άΦ, то поскольку (1 — 7r)V G Ζ?1, на всех внутренних узлах удовлетворяется уравнение ΔΦ = 0. Более того, поскольку -с1Ф = —dip - άΦ и φ = 0 для всех граничных узлов, то на границе Φ = Φ. Тогда Φ и есть желаемое решение задачи Дирихле. Примеры Оба подхода к решению задачи могут быть продемонстрированы на примере цепи, изображенной на рис. 13.19. 7 В Рис. 13.19 Для этой цепи базисом в пространстве dC®H TD является век внутр тор U = / 1\ -1 о V-i/
676 Глава 13. Метод ортогональных проекций квадрат длины которого (в соответствии с определением скалярного произведения через матрицу С) равен 1 + 2 + 1 = 4. Тогда для любого вектора VeC1 мы имеем 7rV=i(V,U)cU. Действуя оператором π на базисные вектора получим матрицы /1-20 -1\ 7Г 1 4 -1 0 W 2 0 0 0 2 0 1 0 У и (1-7r) = i /Л 0 0 7 /о\ 1 0 W W 3 2 0 1 2 0 0 0 4 5 - . . , 1\ -1 0 мы \1 -2 0 Ъ) Предположим, что мы хотели бы решить уравнение Пуассона для рп = 1. Заряд, равный единице на узле £>, может быть в / 0\ случае Qa = Qp = Q1 = 0 и Qs = -1, так что V = ' / 1\ о V-V Тогда 1 7ГУ= - 4 дает нам решение задачи. -1 0 v-v Заметим, что V не обязан удовлетворять второму закону Кирхгофа. Кроме того, ро = 1 и при другом распределении зарядов: Qa = -, Qp = --, Q7 = 1, Qs = -χ- Тогда ^ = ^(3 = / 1/3\ -1/6 V-i/зУ Это распределение напряжений не удовлетворяет второму закону Кирхгофа, потому что сумма падений напряжения при обходе
13.6. Решение краевых задач методом Вейля 677 ячейки β + а — 7 не равна нулю. И тем не менее 1 4 / 1 -1 0 W -2 0 2 0 0 0 2 0 -Λ 1 0 V / 1/3\ -1/6 2 WW 1 4 / 1\ -1 0 w/ 7ГУ что является правильным решением задачи. Чтобы построить V, проще всего (когда это возможно) приписать заряд на каждом внутреннем узле одной ветви, которая связывает эту ветвь с граничным узлом. В сложных цепях, где некоторые внутренние узлы связаны только с внутренними узлами, лучше всего начинать именно с таких узлов и двигаться изнутри наружу. Например, на рис. 13.20 граничные узлы — это А и Е. Лучше всего начинать с узла С Если ρ в = 1, рс = 2, pD = 3, то выберем Q7 = 2. Тогда Qs = 5, Qa = —1> так что Q = /-ι\ о 2 v = /-ι\ о б \2о; ι ? II . ? II ι 1 II . ? II a lJL в ч с ·+2ΐι2 ь wu Рис. 13.20 £ Возвращаясь к рис. 13.19, давайте решим задачу Дирихле для ФА = 0, Фв = 5 и Фс = 6. Положим Φ = Φ на границе и Ф° = 0, Μ Тогда так что V = — άΦ = 5 v = d-*)v = i J д - 2 0 2 0 0 4 2 0 Λ -1 0 V °) 5 5 W /16\ 1 4 4 20 \s) /4\ 1 5 W
678 Глава 13. Метод ортогональных проекций дает правильное решение при Φΰ = 4. То же самое решение можно было бы получить для любого произвольно выбранного значения Ф°. 13.7. Функции Грина Отображение, приписывающее распределению зарядов ρ соответствующий потенциал и, с которым решается уравнение Пуассона, называется оператором Грина. Матричные элементы этого оператора G в базисе Со, состоящем из узлов, будем обозначать G(A, В), где А и В — соответствующие узлы. Мы используем обозначение G(A,B) вместо привычного Gab, потому что позднее, когда будут рассматриваться непрерывные распределения зарядов, они удобнее для соответствующих формул. Таким образом, G(A, В) = потенциалу в узле В благодаря решению уравнения Пуассона с единичным зарядом в узле А. Функция G, приписывающая узлам Аи В матричный элемент G(A, В), называется функцией Грина. Она зависит от двух переменных. Если фиксировать первую переменную и рассматривать зависимость от второй переменной, то получается элемент пространства С^нутр. Пусть Δ2 обозначает оператор Δ, примененный к элементу G(A, ■) пространства С^нугр. Тогда -AG(A,-) = SA, G(A, В) = О для узла В на границе. Повторим эту операцию: ^ ■ ^внутр —* °0 Оператор, обратный к — Δ, есть G, поэтому — Аи = р, если Gp = и.
13.7. Функции Грина 679 Оператор Δ симметричен, следовательно, симметричен и оператор G. Если взять базис, заданный узлами, то и(В) = ^2p(A)G(A,B) для всех В, где суммирование ведется по всем внутренним узлам А. Функцию Грина можно использовать для решения задачи Дирихле. Для этого удобна формула для суммирования, известная как формула Грина. Заметим, что если и и ν — произвольные элементы С0, то Σ u(A)Av(A) = Σ u(A)dCdv(A) по всем А по всем А = u= du=(du,dv), JdCdv JCdv где символ (-,-) обозначает симметричное скалярное произведение в С1. Тогда Σ <Λ)Αν(Α) = Σ Δ<ΑΗΑ). по всем А по всем А Если мы разделим всю сумму на слагаемое по граничным узлам и слагаемое по внутренним узлам, то получим формулу Грина: Σ (u(A)Av(A) - Au(A)v(A)) по внутр. А = - Σ ΗΒ)Δν(Β) - Au(B)v(B)). (13.2) по гран. В Давайте возьмем две внутренних точки А\ и А%, и в формуле Грина положим и = G(Ai,·) и ν = G(A%, ■). Правая часть (13.2) обращается в нуль, потому что на границе G(Ai,-) и G(Az,·) равны нулю. Во внутренних точках и(А) = 0, если Α φ Α\ и u(Ai) = 1. Аналогично для ν и А2- Тогда обращение в нуль левой части (13.2) значит, что G(A1,A2) = G(A2,A1).
680 Глава 13. Метод ортогональных проекций Если мы напишем и = Ф, Аи = —ρ и ν = Φ, Αν = —/5, то уравнение (13.2) преобразуется в Σ (рсФС-/5сФС)= Σ (ρβ*Β-ΡβΦΒ)- (13.3) внутр. С гран. В Итак, мы видим, что формула Грина есть теорема взаимности Грина для цепей, содержащих емкости. Теперь предположим, что Φ является решением задачи Дирихле для заданных значений на границе, так что /3 = 0 внутри. В формуле (13.3) возьмем Φ = G(A, ■). Тогда мы получим Σ (-АО(А,С)Фс-рсО(А,С)) внутр. С = Σ (рвО(А,В) + АО(А,В)Фв). гран. В Вспомним, что —AG(A,C) = 1, если С = А и нулю во всех остальных случаях, потому что G(A, С) есть решение уравнения Пуассона с единичным зарядом в узле А и нулевыми зарядами на других внутренних узлах. Кроме того, мы предположили, что рс = 0 на внутренних узлах. Поэтому в левой части уравнения выживает только один член ФА. В правой части мы имеем G(A, В) = 0. Следовательно, ФА= Σ Δ£(ΛΒ)Φβ. гран. В Таким образом, значение потенциала ФА на внутреннем узле А равно среднему значению потенциалов Фв на граничных узлах с весовым множителем AG(A,B), который является значением отрицательного заряда, индуцированного на граничном узле В, если в узле А помещен единичный положительный заряд, а потенциал на всех границах равен нулю. Матрица (AG(A,B)), представляющая линейное преобразование от Cj?paH к С®тр, называется ядром Пуассона. Давайте применим функцию Грина к расчету цепи, изображенной на рис. 13.18. Поскольку в цепи есть только один внутренний узел D, нам необходимо решить уравнение Пуассона для
13.7. Функции Грина 681 случая ро = 1. Мы уже это сделали и получили вектор напряжений / 1\ -1 о V-V Поэтому, если узлы Л, Б и С заземлены, то потенциал на узле D равен G(D,D) — -. Для этой цепи заряды на граничных ι ι ι m узлах равны: р^ = — ~г, рв = — ^, PC = — -г- Тогда мы имеем AG(D,A) = i AG(D,B) = \ и AG(D,C) = \. С помощью Τ Δι ТГ функции Грина мы легко решаем задачу Дирихле для этой цепи. Если р£) = 0, то Фп является усредненным значением граничных потенциалов с весовыми множителями AG: в Φυ = AG(D, А)ФА + AG(D, В)ФВ + AG(D, С)Ф \С или ф° = -фА + -Фв + -Фс 4 2 4 Существует другой вариант формулы Грина (называемый второй формулой Грина), который иногда бывает полезен. Возьмем граничный узел А. В формуле Аи(А)= Σ Са{и{А) - и(В)) ±да=%В-А) сумму справа разделим на две части: ветвь α соединяет две граничные точки или ветвь соединяет граничную точку с внутренней. Тогда получим Аи(А)= Σ Са(и(А)-и(В)) ±да={В-А) В — внутр. узел + Σ Са(и(А) - и(В)). ±да=(В~А) В — гран, узел
682 Глава 13. Метод ортогональных проекций Вторую сумму обозначим Аграни(А). Ветвь, соединяющую две граничные точки, будем считать отдельной цепью. Тогда Дгран будет оператором Лапласа для этой подцепи, определяемым емкостями ветвей, соединяющих граничные узлы. Следовательно, Σ {η{Α)ΑΓΡΆΗν{Α) - Дгранп(Л)г;(Л)) = О гран. А и поэтому Σ (u(A)Av(A) - Au(A)v(A)) гран. А = Σ «A)Ca(v(A)-v(B)) гран. А да=±{В-А) внутр. В Члены, содержащие и(А) v(A) справа, сокращаются, правая часть равенства упрощается и принимает вид £ Ca(u(B)v(A) - u(A))v(B)). гран. А да=±{В-А) внутр. В Подставляя это в формулу Грина, мы получаем вторую формулу Грина: Σ (u(A)Av(A) - Au(A)v(A)) внутр. А = Σ Ca(u(A)v(B)-u(B)v(A)). гран. А да=±(В-А) внутр. В - Са(и(А) - u(B))v(A)).
13.8. Ядро Пуассона и случайное блуждание 683 13.8. Ядро Пуассона и случайное блуждание Продолжим изучение задачи Дирихле. Пусть Q = AG — ядро Пуассона. Тогда если φ € Сгран определяет конкретный граничный потенциал, то и, определяемое формулой и(А)= Σ Я(А,В)ф(В), гран. В дает решение задачи Дирихле с краевым условием ф. В предыдущем параграфе мы видели, как найти G и, следовательно, Q, используя метод ортогональных проекций. В этом параграфе мы дадим вероятностное построение Q. И хотя этот метод обычно не применяется в конкретных расчетах, он дает нам как новый взгляд на проблему, так и итерационную процедуру вычисления матрицы Q. Сначала вспомним еще раз, в чем состоит задача Дирихле. Пусть А — любой внутренний узел. Пусть В — ближайший сосед узла А, т.е. узел В является началом или концом некоторой ветви β, соединяющей его с узлом А. (Узел В может быть как внутренним, так и граничным.) Пусть Рв,А = Ср[ £ сЛ . \да=±(В-А) ) Тогда условие {Аи)(А) = О совпадает с условием u(A) = ^u(B)PBiA, где сумма берется по всем ближайшим соседям. Заметим, что по построению Ра,в>0, ^Рв,а = 1- в Положим Ρα,α = 1, Ра·,а = 0, А! ф А
684 Глава 13. Метод ортогональных проекций для всех граничных узлов. Тогда пусть Ρ обозначает матрицу η χ η с матричными элементами Ρα,β- Чтобы определиться с обозначениями, будем сначала писать граничные узлы, так чтобы верхний левый угол матрицы Ρ был единичной матрицей к χ к, где к есть число граничных узлов. Столбец, соответствующий внутреннему узлу, будет иметь элемент Ρβ,α на узле В, если В — ближайший сосед узла А, и нулю во всех остальных случаях. Условие Аи = О на внутреннем узле А превращается в и = иР, если рассматривать и = {u(Bi),u{B2),...) как вектор-строку. Если первые к компонент вектора и задаются ф, то таковы же будут и для первые к компонент иР, поскольку первые к столбцов Ρ имеют 1 на к-м месте и 0 на остальных. Итак, задача Дирихле может быть сформулирована следующим образом: иР = и, и первые к элементов и определяются ф. С другой стороны, матрица Ρ имеет структуру матрицы вероятностей перехода. Действительно, предположим, что у нас есть частица, находящаяся в каком-то узле цепи в каждый дискретный момент времени t = 1,2,... Допустим, что она двигается согласно следующему правилу. Если в какой-то момент времени t она находится в граничном узле, то она там и остается. А если она находится на внутреннем узле, то должна перескочить на какой-либо соседний узел, при этом вероятность ее перехода на узел В равна Ρβ,α- Матрица ΡΝ представляет вероятность перехода после N шагов. Очевидно, что предельное поведение матрицы ΡΝ имеет вероятностную интерпретацию. Начав с любого внутреннего узла, после достаточно большого числа шагов получится ненулевая вероятность частице оказаться на граничном узле, и с вероятностью меньше единицы она останется во внутренней части цепи. Последняя вероятность при некотором N допускает единую оценку сверху для всех начальных внутренних узлов, поэтому с дальнейшим ростом числа шагов вероятность частице остаться
13.8. Ядро Пуассона и случайное блуждание 685 на внутренних узлах стремится к нулю. Таким образом, предельное выражение матрицы PN принимает вид я=(о о)' где I — единичная матрица к χ A:, a Q — матрица, у которой к строк ип — к столбцов, причем п — к есть число внутренних узлов. Матричный элемент Q(A, В) представляет вероятность того, что частица, начав двигаться из точки А, в конце концов придет в граничную точку В. (Путь частицы рано или поздно закончится в некой граничной точке.) Тогда PN —> Η и, следовательно, ΡΝ+1 = ΡΝΡ —> Η, откуда HP = Η. Поэтому если ν — какой-то потенциал, то для νΗ выполняется условие (vH)P = vH и, следовательно, u = vH является решением задачи Дирихле, когда краевыми условиями будут первые к компонент вектора v. Если первые к компонент задаются ф, т.е. если ν выбирается в виде ν = (ф, w), w — любой из η — к векторов-строк, то vii является решением задачи Дирихле. Из вида матрицы Η очевидно, что для любого внутреннего узла А выполняется условие u(A) = (vH)(A)= Σ Ф{А)Я{А,В). гран. В Следовательно, Q действительно является ядром Пуассона. Матрице Н, т.е. предельному виду матрицы ΡΝ, можно дать интересную геометрическую интерпретацию. Матричный элемент ΡΝ{Α2,Α\) определяет вероятность перехода из А\ в А2 после N шагов. Эта вероятность равна сумме вероятностей всех iV-шаговых траекторий, ведущих из А\ в А2. (Если Л2 — граничный узел, то некоторые из этих траекторий фактически имеют меньшую длину, т. е. в течение последних г шагов частица стоит
686 Глава 13. Метод ортогональных проекций в точке А2.) Вероятность любой траектории равна произведению Ρβ,Α по всем ветвям а, проходимым вдоль траектории. Если А — внутренний узел, а В — внешний, то очевидно, что с ростом N при вычислении ΡΝ(Β,Α) мы добавляем все более длинные пути. Тогда Q(B,A)= 2_] (вероятность пути). по всем путям, соединяющим А с В 13.9. Теорема взаимности Грина в электростатике В качестве небольшого обобщения цепей с емкостями можно рассмотреть систему заряженных проводников, каждый из которых имеет определенный заряд ρ и определенный потенциал φ (рис. 13.21). Чтобы описать аналог ветви для системы такого типа, требуется введение поля диэлектрического смещения и поэтому должно быть отложено до главы 16, в которой мы будем изучать электростатику. Однако, описание цепи через заряды и потенциалы имеет много общего с описанием емкостных цепей. Полный заряд на каждом проводнике может описываться век- тором ρ = ^β Β пространстве, обозначаемом Со; потенциал же образует вектор φ = (фл, фв, ■..) в его дуальном пространстве С0. Для цепей с емкостями скалярное произведение элемента пространства С0 на элемент пространства Со дает электростатическую энергию системы проводников, т. е. энергию, равную 2 Г'φ = \ ΣραΦΛ· (В главе 16 мы увидим, что это выражение равно интегралу (άφ, άφ) dx dy dz /< по пространству между проводниками, где ф обозначает электростатический потенциал. А сейчас мы просто ограничиваемся описанием того, что происходит в проводниках.)
13.9. Теорема взаимности Грина в электростатике 687 Рис. 13.21 Полный заряд проводника ρ может быть выражен через потенциал φ с помощью оператора Лапласа Δ, т. е. р=-Аф. Оператор Δ зависит от формы различных проводников, от их распределения в пространстве и физических констант электростатики. Кроме ряда частных случаев, когда в системе есть параллельные плоскости, концентрические сферы или цилиндры, вычисление Δ очень трудно. Однако, как мы узнаем в главе 16, для системы проводников выполняется теорема взаимности Грина, точно так же, как она выполняется для цепей с емкостями. Говоря точнее, если риф обозначают возможное распределение полного заряда и напряжений в системе проводников, а р' и ф' обозначают другое распределение, то теорема взаимности Грина утверждает, что ф= Ι ф'. Jp Отсюда немедленно следует, что оператор Δ самосопряжен и представляется симметричной матрицей. Чтобы это увидеть, положим ρ = -Αφ, ρ' = -Αφ'. Тогда / φ = ί φ', J-Αφ' J-Αφ т.е. (Αφ',φ) = (φ',Αφ), ι
688 Глава 13. Метод ортогональных проекций откуда следует, что Δ самосопряжен. В физической литературе оператор Δ обычно называют матрицей емкостных коэффициентов. Матрица, обратная к — Δ, называется матрицей потенциальных коэффициентов. Мы напишем эту матрицу для ряда простых частных случаев через хорошо известные формулы элементарной электростатики. Например, рассмотрим систему двух концентрических сфер (рис. 13.22) с радиусами г^ и rg. Для сферы с радиусом го, обладающей единичным положительным зарядом, электрический потенциал, выраженный в гауссовых единицах, имеет вид ф(г) = ! 1/го (Г - Го)' φ(Τ) \ 1/г (г > го). (См., например книгу Purcell «Электричество и магнетизм», параграф 1.11.) Позднее в параграфах 16.1 и 16.2 мы выведем этот результат альтернативным путем из первых принципов. Рис. 13.22 Если ра = 1, рв — 0, то потенциалы фл — 1/гд, фв = 1/rg. Однако если ρ а = 0, ρ в = 1, то оба потенциала равны фА — фв = 1/гв- Отсюда следует, что _Δ-ι _ lVrA 1/гв 1/гв 1/гв Эта матрица позволяет нам вычислить потенциал двух сфер для произвольного распределения зарядов. Обратная матрица дает
13.9. Теорема взаимности Грина в электростатике 689 оператор Лапласа га -га\ га г в) ' Эта матрица определяет заряды на двух сферах при заданных потенциалах. В случае Фа — 1, Φ в = 0 мы имеем ίρΛ _ гАгв ( 1\ \Рв) г в -гА V-1/ ' т. е. на двух сферах есть два заряда с противоположными знаками, равные г^ГвАгв — га)- Эта величина гагв/(гв — га) называется емкостью двух сфер. Матрицу — Δ-1 одинаково легко написать для любого числа концентрических сфер. Например, для трех сфер, изображенных на рис. 13.23, она равна (1/гА 1/гв 1/гЛ 1/гв 1/гв 1/гс ■ 1/гс 1/гс 1/гс/ Δ \rBrA r\) \-l/rB или гагв / 1 -1 \ тв г в -га \-1 гв/гА/ г в - г а Рис. 13.23
690 Глава 13. Метод ортогональных проекций А сейчас представим себе цепь с емкостями и пусть некоторые проводники будут граничными проводниками, потенциалы которых определяются подсоединенными батареями, а на других проводниках, называемых внутренними, задается заряд. В задаче Пуассона мы имеем потенциалы ф' = 0 на всех граничных проводниках и заряды р' на всех внутренних. Требуется найти ф' для всех внутренних проводников и р' для всех граничных. А в задаче Дирихле нам дано, что ρ = 0 на внутренних проводниках и φ на всех граничных. И мы должны найти φ для внутренних проводников и ρ для граничных. Эти две задачи связаны между собой теоремой взаимности Грина. В общем случае Σ р'лФА+ Σ р'вФв= Σ рлф,а+ Σ ρβφ,β· гран. А внутр. В гран. Л внутр. В Нам дано, что ф' = 0 на граничных проводниках (задача Пуассона) и ρ = 0 на внутренних (задача Дирихле). Тогда получаем Σ р'вФв= Σ ρΆφα- внутр. В гран. А Допустим, что в задаче Пуассона Q(C, А) обозначает заряд р'А на граничном проводнике А, имеется единичный заряд на внутреннем проводнике С, а заряды всех остальных внутренних проводников равны нулю. Тогда слева выживает только один член, и мы имеем фс = -^Я{С,А)фА, где Q{C,A) = -bG(C,A). Эта функция Грина является решением задачи Дирихле. На практике довольно часто для системы проводников можно легко решить задачу Дирихле, а затем с помощью теоремы взаимности решить уравнение Пуассона. Рассмотрим, например, систему из трех больших параллельных проводящих плоскостей, показанную на рис. 13.24. На этой схеме А и С — граничные проводники, а В — внутренний. В этой геометрии потенциал является линейной функцией положения между плоскостями. Следовательно, ФВ = ФА + \{ФС~ФА)
13.9. Теорема взаимности Грина в электростатике 691 В С Рис. 13.24 или Это и есть решение задачи Дирихле. А теперь рассмотрим уравнение Пуассона с зарядом р'в на внутренней плоскости. При этом ф' = ф' =0. Из теоремы взаимности следует, что р'вФв = -р'аФл-РсФС- Однако для произвольной задачи Дирихле фв = ^фл + \фС, следовательно, р'в-\фа + р'в-\фс' = -р'аФа-р'сФс- Отсюда следует, что р'а = ~зр^' Рс 1 , т. е. мы выяснили, как индуцированный заряд распределяется между двумя граничными плоскостями. В общем случае теорема взаимности Грина может применяться в задачах, где имеются как проводники, так и распределения зарядов в области, ограниченной этими проводниками. Например, если заряд -\-q помещен вблизи бесконечной заряженной
692 Глава 13. Метод ортогональных проекций Ρ / \ Я -q (образ) Рис. 13.25 плоскости (рис. 13.25), то электрический потенциал везде на той же стороне плоскости, где находится заряд, может быть определен методом изображений, т. е. Ф(Р) = я-~1 г г (см. параграф 16.1). Для этой потенциальной функции можно получить распределение отрицательного заряда вдоль проводящей плоскости. А это, в свою очередь, дает возможность решить задачу Дирихле, когда везде на плоскости задан потенциал и требуется найти распределение потенциала во всем пространстве. Аналогичным способом строится функция Грина для решения уравнения Пуассона, когда точечный заряд находится внутри заземленной проводящей сферы. Потом эта функция используется для решения задачи Дирихле, когда на поверхности сферы задан потенциал и требуется найти потенциал в области, ограниченной сферой и свободной от зарядов. Резюме А. Ортогональные проекции Вы должны знать свойства самосопряженного проекционного оператора π для цепей с резисторами и использовать его для расчета таких цепей. Вы должны уметь строить оператор π, пользуясь процедурой Грама-Шмидта или методом Кирхгофа.
Задачи 693 В. Цепи с емкостями Вы должны уметь рассчитывать цепи с емкостями с помощью методов Максвелла или обращения оператора Лапласа. Для расчета цепей с емкостями Вы должны уметь решать уравнение Пуассона или задачу Дирихле с помощью ортогональных проекций; должны описывать связанное с этим разложение на ортогональные подпространства. С1 С. Функции Грина Вы должны уметь строить функцию Грина для цепи с емкостями и использовать ее для решения уравнения Пуассона и задачи Дирихле. Задачи 13.1. Рассмотрите цепь, изображенную на рис. 13.26. 20м (а) Напишите базис пространства Z\. Объясните смысл утверждения «оператор π представляет проекцию С\ на подпространство Ζγ». Выполнив соответствующие вычисления, докажите, что матрица 2 3 -1 представляет проекцию С\ на Ζ\.
694 Глава 13. Метод ортогональных проекций (b) Для этой цепи найдите токи в ветвях, используя матрицу π. Сделайте рисунок, показывающий образ и ядро π, покажите, как с его помощью решить эту задачу. (c) Какое линейное преобразование представляется матрицей 7ГТ, транспонированной к π? Назовите и дайте характеристику с физической точки зрения пространству, являющемуся ядром этого преобразования. Обоснуйте свой ответ либо с помощью общей теоремы, либо ссылаясь на соответствующие свойства матрицы πτ. 13.2. (а) Постройте матрицу 2x2, представляющую тг : С\ цепи, изображенной на рис. 13.27. В Ζ, для 4А 70м 20* I 5А А Рис. 13.27 (Ь) Сделайте рисунок, показывающий образ и ядро π. На нем покажите вектора К и I = πΚ. 13.3. Рассмотрите цепь, изображенную на рис. 13.28. (а) Используя процедуру Грама-Шмидта, преобразуйте базис Μι Л 1 0 W , м2 = (°\ -1 1 V 1/ в ортонормальный базис {Ει, Ег} пространства Ζ\. Применяя операцию πΐ = (Ει,Ι)ζΕχ + (Ε2,Ι)ζΕ2 по очереди к каждому из четырех базисных векторов С\, постройте матрицу, представляющую π, и рассчитайте данную цепь.
Задачи 695 2В бОм Рис. 13.28 (b) Для этой цепи докажите формулу π = a(sZa)~1sZ. (c) Постройте матрицу Ζ(\ — π) и покажите, что ее образ есть пространство В1. Ответ: π = 1 — 50 /22 14 8 V 8 28 36 -8 -8 24 -12 36 36 4\ -2 b 6/ 13.4. (а) Для цепи, изображенной на рис. 13.28, постройте матрицу, представляющую т:С1^С\ которая проектирует пространство С1 на В1, причем проектирует ортогонально по отношению к скалярному произведению, определенному преобразованием Z-1, т.е. (V,V')z-i = / V Jz-1v Чтобы построить базис для пространства В1, положите потенциал равным нулю в узле А (заземлите его) и — 1 в узлах В и С. (Ь) Покажите, что V = t(W — ZK) и используйте эту формулу для расчета цепи, изображенной на рис. 13.28. 13.5. (а) Найдите явное выражение для матрицы τ из предыдущего упражнения через [d\, Z-1 и [д]. С помощью этой матрицы
696 Глава 13. Метод ортогональных проекций покажите, что т2 = т, что образ τ есть В1, что τ — самосопряженная матрица по отношению к скалярному произведению, определенному Ζ~λ. (b) Покажите, что для любой цепи матрица Zr\d\([d)Z-\d\)-\d\ + a(sZaylsZ, представляющая линейное преобразование из С\ в С\, является единичной матрицей. 13.6. Для цепи, изображенной на рис. 13.28, с помощью метода Кирхгофа сделайте следующее. (a) В цепи есть пять различных максимальных деревьев. Для каждого дерева получите матрицу рт (4x4). Заметим, что каждая пара ветвей, кроме {α, β}, образует дерево. (Следите за знаками — все диагональные элементы матрицы рт должны быть > 0.) (b) Для каждого дерева вычислите Qt и найдите R = Y^Qt- (Получится R = 50, что совпадает с Det(sZa). Будет ли это так в общем случае?) (c) Воспользуйтесь формулой Кирхгофа τ чтобы получить проекционный оператор π методом Вейля. 13.7. Придумайте изменение в методе Кирхгофа, чтобы построить самосопряженный проекционный оператор τ : С1 —> С1, обладающий таким же свойством V = r(W — ZJt), что и усредненное значение проекций С1 на Z1, взятых с определенными весами, и не являющееся самосопряженным оператором. Один из способов сделать это — начать с метода Кирхгофа в пространстве С\ и потом обе части умножить на Z. 13.8. Докажите формулу для проекционного оператора Вейля π = a(sZa)~1sZ, проверив, что π обладает требуемыми свойствами: (a) π является проекцией: π2 = π; (b) образом π является Ζχ\ (c) π — самосопряженный оператор относительно (■, ·)ζ, τ. е. (τγΙ,Ι')ζ = (Ι,τγΙ')ζ.
Задачи 697 13.9. (а) Для цепи, изображенной на рис. 13.29, постройте матрицу π, представляющую ортогональную проекцию пространства С\ на подпространство Ζ\. Воспользуйтесь этим проекционным оператором для вычисления токов в ветвях I. (Все токи задаются целыми числами.) Рис. 13.29 (Ь) Для этой цепи постройте базис ядра оператора π. Воспользуйтесь им, чтобы показать в явном виде, что ядро π ортогонально его образу. 13.10. В качестве иллюстрации теоремы взаимности Грина рассмотрите цепь, изображенную на рис. 13.30. (а) Если между узлами А и В вставить батарею на 60 вольт, то какой ток потечет между узлами С и D при замыкании их
698 Глава 13. Метод ортогональных проекций накоротко? Если, наоборот, батарею вставить между узлами С и D и устроить короткое замыкание А с В, то какой ток потечет через А В1 (Ь) Если источник тока на 25 ампер вставить между узлами А и В, то какое напряжение возникнет в CD (узлы разомкнуты)? Если, в свою очередь, тот же источник тока вставить между узлами С и D, то какое напряжение возникнет в АВ7 13.11. (а) Для цепи, изображенной на рис. 13.31, постройте симметричную матрицу Ζπ. Используйте ее для определения напряжения на ветвях V, если в ветвь а вставлен источник тока, дающий 8 ампер. Найдите V также в случае, когда тот же источник вставлен в ветвь -у. (Ь) Для той же цепи постройте симметричную матрицу πΖ~λ. Воспользуйтесь ей для определения токов в ветвях I, если в ветвь а вставлена батарея, дающая напряжение 16 вольт? Какой будет ток, если ту же батарею вставить в ветвь 7? т-*г-ллл i-i Юм а ,, 20м 20* "<5 20м Рис. 13.31 Рис. 13.32 13.12. Определите заряд на каждом конденсаторе цепи, изображенной на рис. 13.32, используя метод круговых токов и метод узловых потенциалов. Предположим, что [<9]Q = 0, т.е. что до подключения батарей все конденсаторы не были заряжены. (Если нужно, определим единицы: напряжение V измеряется в вольтах, емкость С — в микрофарадах, а заряд Q — в микрокулонах.) 13.13. В цепи, изображенной на рис. 13.33, рв = 13 и рс = — 1, поэтому РА = —12. Решите уравнение Пуассона ΔΦ = — ρ для этой цепи и определите Фв и Фс. Вычислите заряды на ветвях Q и проверьте, '-12> что <9Q = - | 13
Задачи 699 Рис. 13.33 А (земля) Рис. 13.34 13.14. Для цепи, изображенной на рис. 13.34, напишите матрицы dud. Для ρ в = 10 и рс = — 2 решите уравнение Пуассона и найдите потенциалы узлов Фв и Фс. 13.15. Рассмотрите цепь конденсаторов, изображенную на рис. 13.35. Узлы Ли В — граничные, а узел С — внутренний. α,ι 0 м А С В Рис. 13.35 <А = 3 = 1 >в (a) Постройте матрицу 2x2 оператора π, который является ортогональной проекцией (относительно скалярного произведения, определенного С) С на Л7°нутр. (b) Вектор W = I . 1 соответствует ситуации, когда на узле С находится заряд 4. Воспользуйтесь оператором π для нахождения распределения зарядов в случае, если узлы А и В заземлены. (c) Предположим, что потенциал узла А равен ФА = 0, потенциал узла В равен Фв = 4 и заряд узла С равен нулю.
700 Глава 13. Метод ортогональных проекций Воспользуйтесь оператором π и определите напряжения в ветвях Vе" и V&. 13.16. Рассмотрите систему конденсаторов, показанную на рис. 13.36. В этой цепи узлы А и D граничные, а узлы В я С внутренние. (а) Для этой цепи напишите матрицы д и d. (b) Пусть φι = ί°\ η Ι ι w и ф2 = ί° 3 1 \о векторы в пространстве С0. Вычислите άφχ и άφ2. Покажите, что они ортогональны по отношению к скалярному произведению, определенному матрицей емкостей С. (c) Пусть π представляет ортогональную проекцию из С1 на подпространство, заданное векторами άφχ и άφ2. Вычислите (d) Пусть на узле В находится единичный заряд, на узле С заряд равен нулю, а узлы Атл D заземлены. Воспользуйтесь ортогональной проекцией и вычислите потенциалы узлов В и С- Найдите заряды на узлах А и D. А I I ■ га 1 В β" <с "7 D Рис. 13.36 Рис. 13.37
Задачи 701 (e) Пусть Фл = 5, Ф° = 0, на узлах В и С нет зарядов. Воспользуйтесь методом ортогональных проекций и определите напряжения на ветвях V. (f) Для задачи, поставленной в пункте (е), покажите, как найти Фв, используя функцию Грина из пункта (d). 13.17. Рассмотрите цепь конденсаторов, показанную на рис. 13.37. Узлы А и В — граничные, а узлы С и D — внутренние. (а) Вектора Ψι Л 0 0 \1/ И 1р2 Л о 2 W являются элементами пространства С0. Назовите, какое пространство они задают, и дайте ему физическую характеристику. Определите dipi и dtp2- Покажите, что они образуют ортогональный базис подпространства С1 относительно скалярного произведения, определенного С. (b) Пусть π обозначает ортогональную проекцию пространства С1 на подпространство, для которого только что получен базис. С физической точки зрения дайте характеристику векторам, которые принадлежат ядру оператора π. Вычис- Л 0 лите π „ \1/ (c) Пусть на узле D находится единичный положительный заряд, на узле С заряда нет, а узлы А и В заземлены. Используя результат пункта (Ь), найдите заряды и напряжения всех ветвей. (d) Пусть на узле D находится заряд 2, на узле С заряда нет, Фл = 4 и Фв = 1. Используя только что полученную функцию Грина, определите потенциал узла D. (Указание: эта задача является суперпозицией задачи Дирихле и задачи Пуассона.) 13.18. Рассмотрите цепь, изображенную на рис. 13.38. Узлы А, В и С — граничные, а узлы D и Ε — внутренние.
702 Глава 13. Метод ортогональных проекций Рис. 13.38 (а) Получите базис подпространства С°нутр С С0 и dC®Hy^p С С1. Проверьте, что матрица /8 π = 19 2 1 8 5 2 1 8 5 2 4 6 2 10 2 10 -^ 3 -4 7/ проектирует С1 на это подпространство. (b) Постройте матрицу 1 — π и проверьте, что ее образ ортогонален образу π. (c) Проверьте, что Н1 (образ Ζ\ при действии С-1) является ядром π. (d) Постройте матрицу (1 — π)ά, представляющую преобразование из С0 в С1. Проверьте в явном виде, что если Φ — произвольный базисный вектор в С°ран, то V = — (1 — π)άΦ описывает множество напряжений ветвей, для которых <9CV = 0 на внутренних узлах D и Е. 13.19. Для цепи, изображенной на рис. 13.38, используйте матрицу (1 — π)ά и решите задачу Дирихле для потенциалов Фл — 3, Фв = -5, Фс = 0 при рв = Ре = 0. Получите Ф°, ФЕ, рд, рв и рс. 13.20. В предыдущем упражнении решите уравнение Пуассона для случая, когда pE = h PD=0, Фл = Фв=Фс = 0. (а) Выберите любое значение Q, удовлетворяющее условиям Pd — 0, ре — 1· Постройте вектор напряжений в ветвях V = C^Q.
Задачи 703 (b) Вычислите V = 7rV и определите такой потенциал, чтобы на границе Φ = 0 и — άΦ = V. (c) Повторите пункты (а) и (Ь) с другими значениями Q. Вы должны получить тот же самый ответ. (d) Решите уравнение Пуассона для случая ро = 1, Ре ~ 0. Для этой цепи уже построена функция Грина. Воспользуйтесь ей и решите уравнение Пуассона для ро = 10 и ре = 7. (e) Используя функцию Грина, постройте ядро Пуассона AG(A, В). Это будет матрица с тремя столбцами и двумя строками, которая представляет отображение (9 ■ га Транспонированная к ней матрица отображает Си ■ (») (f) Проверьте, что ядро Пуассона дает правильное решение задачи Дирихле, поставленной в упражнении 13.18(c). 13.21. Конденсатор состоит из трех длинных коаксиальных цилиндров с длиной / и радиусами г а = а, т\в = 2а, гс — 8а. (a) Решите задачу Дирихле, когда цилиндр В не заряжен, а разница потенциалов между цилиндрами А и С равна Ф°. (b) Используя теорему взаимности Грина, решите уравнение Пуассона, если цилиндры А и С заземлены, а заряд Q находится на цилиндре В. 13.22. Три концентрических проводящих сферы имеют радиусы гд = 2, г в = 3, г с — 4 соответственно. (a) Для этой системы напишите матрицу — Δ-1, обратите ее и постройте оператор Лапласа — Δ. (b) Пусть потенциалы равны фл = 0, фв = 1, фс = 0. Определите заряд на каждой сфере. 13.23. Четыре больших проводящих плоскости (площади Ао каждая) находятся на расстоянии / друг от друга (рис. 13.39).
704 Глава 13. Метод ортогональных проекций В С D Рис. 13.39 (a) Решите задачу Дирихле, когда заданы потенциалы фл, ф°, а плоскости В и С не заряжены. (b) Используя теорему взаимности Грина, решите уравнение Пуассона для задачи, когда плоскости А и D заземлены, а на внутренних плоскостях находятся заряды Qb и Qc- Определите потенциалы фв, фс и заряды <?л, Qd-
Глава 14 Комплексы высших размерностей В этой главе мы закончим введение в алгебраическую топологию. Вкратце опишем, как одномерные результаты, полученные в главах 12 и 13, обобщаются на случай большего числа измерений. 14.1. Комплексы и гомологии В этой главе мы прервем изучение электрических цепей и рассмотрим ряд обобщений тех математических методов, которыми мы занимались в предыдущих главах. Мы определили одномерный комплекс как систему, состоящую из объектов нулевой размерности, названных узлами, и одномерных объектов, названных ветвями. Ветви соединяются между собой в узлах. Такие комплексы представляют особый интерес с точки зрения связности, что нашло свое отражение в пространстве До· Важным также является число независимых ячеек, которое равно размерности пространства Н\. В этой главе мы будем рассматривать комплексы с большим числом измерений, т. е. содержащие двумерные, трехмерные и т.д. элементы. В двумерном комплексе или 2-комплексе, помимо узлов и ветвей, имеются двумерные элементы (куски поверхности), которые мы будем называть 2-ячейками пли гранями. На рис. 14.1 показано, что эти грани соприкасаются друг с другом вдоль ветвей. Граница грани состоит из нескольких ветвей, причем каждая входит со знаком плюс или минус.
706 Глава 14. Комплексы высших размерностей Трехмерный комплекс содержит трехмерные элементы (объемные куски), называемые 3-ячейками, которые касаются друг друга вдоль граней. Граница 3-ячейки состоит из нескольких граней, причем каждая входит со знаком плюс или минус. В общем случае η-комплекс состоит из конечного множества η + 1 элементов So, Si, S2, · · ■ , Sn, связанных между собой рядом условий, которые мы опишем позже, после введения обозначений. Множество So состоит из элементов нулевой размерности, т. е. из узлов. Множество Si состоит из одномерных элементов, т. е. из ветвей. Множество S2 состоит из двумерных элементов, т. е. из граней и т. д. Поскольку у нас нет достаточного числа подходящих алфавитов для обозначения объектов различной размерности, то элементы So обозначаем Οι, Ог, Оз, - -., элементы Si обозначаем 1χ, 12,1з, ■ · ·, элементы 5г обозначаем 2ь 2г, 2з .. ■ и так далее. В последующих примерах для обозначения элементов So будем пользоваться латинскими буквами, элементы Si будем обозначать греческими буквами, элементы 52 будем обозначать словами (например, цветами Красный, Синий и т.д.). Для каждого множества Sk введем векторное пространство А;-цепей С к, состоящее из векторов, компоненты которых индексированы элементами Sk- Из изучения электрических цепей нам известны пространства Со и С\. В общем случае размерность пространства Cfc равна числу элементов Sk- Как и раньше, элемент множества Sk будем идентифицировать с вектором, у которого одна компонента, соответствующая этому элементу, равна еди-
14.1. Комплексы и гомологии 707 нице, а остальные компоненты равны нулю. Например, для комплекса, изображенного на рис. 14.1, мы имеем вектора в пространстве С0 :0ι = А = (1,0,0,...)г, 02 = В = (0,1,0,... )г, и т. д.; в пространстве С\ : li = а = (1,0,0,... )г, 21 = β = (0,1,0,... )т и т. д.; в пространстве С2 : 21 = Красный = (1,0)г, 22 = Синий = (0,1)г- Чтобы закончить описание комплекса, мы должны определить граничный оператор, в действительности последовательность граничных операторов, которую будем обозначать тем же символом д : С& —> Cfc_i для любого к. Оператор д приписывает каждому элементу Sk определенную комбинацию элементов множества Sk-i (с соответствующим знаком), которая и образует границу этого элемента. Оператор д определен для каждого базисного элемента Ск и, следовательно, определяет линейное отображение Cfc на Ck-i- (Для к = 0 мы выбираем д = 0, поскольку не существует элементов отрицательной размерности.) Для 2-комплекса, показанного на рис. 14.1, мы имеем да = В-А, 0β = Ο-Α, и т.д. Эти соотношения определяют граничное отображение из С ι в Со, которое представляется матрицей 8x6. Чтобы написать этот оператор в явном виде, необходимо на рисунке изобразить стрелками ориентацию каждой ветви. Аналогично, чтобы написать граничный оператор из С2 в С\, мы должны задать ориентацию каждой грани (по часовой стрелке или против). Границей грани является замкнутый путь вдоль ее периметра, проходимый в направлении, совпадающим с ориентацией грани. Например, на рис. 14.1 д(Красный) = α + η — /3, а д(Синий) = η + ν — ε — δ. В качестве отображения из С2 в С\ граничный оператор задается матрицей / 1 0\ -1 0 1 1 о о о о V о ι/
708 Глава 14. Комплексы высших размерностей в базисах {Красный, Синий} пространства С2 и {α, β,η, ε, Α, υ} пространства С\. При изучении одномерных комплексов мы обнаружили, что полезно рассматривать подпространства ядра и образа оператора д. Обобщим эту идею, определив пространство А;-циклов Zk, которое будет подпространством С к, состоящим из элементов с нулевой границей, т. е. ядро д : Ск —> Ck-i- Например, на рис. 14.1 • Ζ? является нулевым подпространством, потому что нет такой нетривиальной линейной комбинации Красный и Синий, которая имеет нулевую границу; • Ζ\ является трехмерным подпространством, порожденным ячейками Μι = α + 7 - 0, М2 = η + ι>- ε-δ, Μ3 = λ - μ - ι/; • Zq есть все пространство Со, поскольку по определению дс = 0 для любой 0-цепи с. Аналогично определим Вк — пространство А:-границ, которое будет подпространством Ск, состоящим из элементов, являющимися границами элементов пространства Ck+i, т. е. образ д : Ck+i —> С к- Для комплекса, изображенного на рис. 14.1, • В2 является нулевым подпространством, потому что не существует трехмерных элементов в двумерном комплексе (точно так же, как в одномерных комплексах, которые мы рассматривали, Βχ всегда было нулевым подпространством) ; • В χ является двумерным пространством, базис которого образуют д(Красный) = а + η — β и д(Синий) = η + ь> — ε — δ\ • Bq является пятимерным подпространством; так же, как если бы комплекс был одномерным, а не двумерным. В этом примере каждое пространство Вк является подпространством соответствующего Ζ к, т.е. каждая граница является циклом. Немного подумав, можно убедиться, что это свойство должно выполняться для любого двумерного комплекса,
14.1. Комплексы и гомологии 709 схема которого подобна рис. 14.1. Поскольку -Вг нулевое, очевидно, что оно является подпространством Ζϊ. Поскольку граница любого многоугольника — замкнутая траектория, то В\ есть подпространство Ζ\. И наконец, поскольку Zq — это все пространство Со, очевидно, что -Во есть подпространство Zq. Условие Вк С Ζ^ можно вывести и по-другому. Поскольку Вк есть образ д : Ck+i —> С к и Ζ к есть ядро д : С к —> Cfc_i, то условие Вк С Zk означает, что композиция д о д : Ck+i —> Ск-ι равна нулю. Другими словами: граница границы есть нуль. Из последующих примеров станет ясно, почему это справедливо для любого комплекса. Гомологии Поскольку Вк является подпространством Zk, то можно образовать факторпространство Нк = %к/Вк, которое называется пространством к-мерных гомологии комплекса. Оказывается, что оно имеет более фундаментальное значение, чем Zk и Вк по отдельности. Пространства Zk и Вк связаны со свойствами данного комплекса, а Нк, как мы скоро увидим, связано со свойствами пространства, построенного из элементов комплекса. При изучении электрических цепей мы уже встречались с пространствами До и Н\. Вспомним, что размерность Но равна числу связных компонент, а его дуальное пространство Н° интерпретируется как пространство потенциалов, которые постоянны на каждой связной компоненте. Поскольку пространство границ В\ нулевое для 1-комплекса (в нем нет двумерных элементов), то Н\ = Ζ\/Β\ = Ζ\. Таким образом, для любого один-комплекса Η\ есть пространство циклов Ζχ, которое играет столь важную роль в методе круговых токов Максвелла. Давайте рассмотрим пространство Нк Для 2-комплекса, изображенного на рис. 14.1. Поскольку у этого комплекса нет 2-циклов, пространство /?2 есть {0}, аналогично пространство Н? тоже пулевое. Поскольку Ζ\ — трехмерное пространство, aBi — Двумерное, то факторпространство Ηχ = Ζι/Βχ одномерно. Если посмотреть на рисунок, то видно, почему: путь Α — μ — ν пе является границей никакого элемента пространства Сг- Если треугольник CEF добавить к комплексу в качестве третьего элемента Сг, то
710 Глава 14. Комплексы высших размерностей путь А — μ — ν стал бы границей и размерность пространства Hi была бы равна нулю. И наконец, поскольку комплекс связен, пространство Щ одномерно. В качестве примера трехмерного комплекса рассмотрим тетраэдр со всеми его гранями, ребрами (ветвями) и вершинами (узлами), показанный на рис. 14.2(a). Развернутая поверхность тетраэдра изображена на рис. 14.2(6). В комплексе имеется четыре вершины: А, В, С, Ό\ шесть ребер: α, β, η, δ, ε, η; четыре грани: Красный, Жёлтый, Зелёный, Синий. Ориентация каждой грани выбирается так, чтобы стрелка, показанная на рисунке, вращалась против часовой стрелки, если смотреть на тетраэдр снаружи (см. Зелёный и Жёлтый на рис. 14.2(a)), и по часовой стрелке, если смотреть на него изнутри (см. рис. 14.2(6)). D D η η D А а В υ а) б) Рис. 14.2 Из рисунка легко увидеть, что граничный оператор из Сг в С\ определяется формулами д(Красный) = —а — β — η, д(Зелёный) = а + ε — δ. Поскольку граница каждой грани является циклом, то каждая такая граница имеет~нулевую границу, т. е. д[д(3елёный)] = д(а + ε - δ) = (Β - А) + (£> - В) - (D - А) = 0.
14.1. Комплексы и гомологии 711 В этом комплексе имеется один трехмерный элемент — сам тетраэдр. Чтобы написать граничный оператор из Сз в Сг, надо приписать этому элементу ориентацию. (Хотя совсем не просто изобразить эту ориентацию на рисунке.) Мы должны сделать это в абстрактной форме. Выберем так называемую правостороннею ориентацию. Это значит, что когда мы смотрим на элемент снаружи, то все грани, составляющие его границу, должны быть ориентированы против часовой стрелки. Ориентация называется правосторонней, потому что если положить правую руку на поверхность тетраэдра так, чтобы большой палец смотрел наружу, то пальцы правой руки будут поворачиваться так, что грань войдет в границу со знаком плюс. Конечно, это утверждение выглядит короче, если записать его алгебраически через граничный оператор из Сз в С2: д(Тетраэдр) = Красный + Жёлтый + Зелёный + Синий. Если для тетраэдра выбирается левосторонняя ориентация, то все четыре грани войдут в выражение для границы со знаком минус. Таким образом, изменение ориентации любой грани ведет к изменению ее знака в выражении для границы. Очевидно, что граница тетраэдра — замкнутая поверхность, имеющая нулевую границу. Это легко показать алгебраически, используя выражения для граничных операторов их Сз в Сг и из С2 в Сц 9[9(Тетраэдр)] = ^[Красный + Жёлтый + Зелёный + Синий] = (-а - β - 7) + (β + η - ε) + (а + ε - δ) + (7 + δ - η) = 0. Этот результат никак не зависит от выбора ориентации самого тетраэдра, его граней или ребер. (Попробуйте измените ориентацию какой-нибудь грани и пары ребер и убедитесь в этом.) Итак, наши комплексы первоначально были изображены рисунками, потом мы преобразовали рисунки в алгебраические выражения для граничного оператора д. Очевидно, что граничный оператор, как и рисунок, определяет комплекс полностью. Поэтому очень хочется уметь задавать комплекс, не рисуя его, а просто выписывая его элементы и граничный оператор. Когда мы так сделаем, то покажем, что для любого элемента с комплекса выполняется условие д(дс) = 0.
712 Глава 14. Комплексы высших размерностей Давайте разберемся, почему условие д[дс) = О разумно для любого комплекса, даже, например, для поверхности, которую нельзя построить в трехмерном пространстве, или для комплексов, элементы которых включают четырехмерное пространство- время. Чтобы доказать, что условие д(дс) = О выполняется для всех элементов с, достаточно проверить, что оно выполняется для генераторов, т.е. для элементов пространства Sk- Для любого такого элемента мы можем построить подкомплекс, состоящий из этого элемента, всех элементов пространства Sk-i, которые входят в выражение для его границ нетривиальным образом, всех границ и так далее. Граничные соотношения между этими элементами определяются свойствами того элемента, с которого мы начали. Несмотря на то, что взаимосвязи между различными строительными блоками могут быть достаточно сложными, мы ожидаем, что отдельные элементы, из которых построен наш комплекс, будут вполне знакомыми геометрическими объектами. Например, предположим, что каждый элемент пространства 5з является выпуклым многогранником в трехмерном пространстве (по крайней мере, если нам интересны его соотношения с границами, мы допускаем любые непрерывные искажения реальной геометрической формы объекта — так же, как раньше мы не интересовались формой проводов при изучении электрических цепей) . Граница такого многогранника будет состоять из конечного числа многоугольных граней, каждая из которых ориентирована против часовой стрелки, если смотреть на многогранник снаружи (рис. 14.3). Когда мы вычислим сумму границ этих многоугольных граней, каждое ребро будет входить дважды от каждой грани с противоположными знаками. Поэтому сумма всех границ будет равна нулю. В этом случае граница каждого элемента 5з является циклом. Аналогично, мы могли бы предположить, что каждый элемент S2 является выпуклым плоским многоугольником. Очевидно, что граница каждого элемента 5г будет циклом (по существу это соответствует ячейке). Давайте исследуем пространства гомологии комплекса, являющегося тетраэдром. Если нас интересует До, то мы можем проигнорировать С2 и Сз и рассмотреть 1-комплекс, заданный вершинами и ребрами. Это связный 1-комплекс с dim До = 1·
14.1. Комплексы и гомологии 713 Рис. 14.3 Чтобы определить Hi, рассмотрим 2-комплекс, заданный вершинами, ребрами и гранями. Пространство Ζ χ проанализируем с помощью метода, которым мы пользовались при изучении электрических цепей. Рассмотрим рис. 14.2. На нем ветви δ, ε и η образуют максимальное дерево. Каждая из остальных ветвей а, β, 7 определяет независимый цикл. Следовательно, dim^i = 3. Каждый из этих циклов является границей грани, следовательно, сНтВз = 3. Отсюда следует, что dim .Hi = divaZi — dimBi = О, т. е. Hi = {0}. Теперь рассмотрим i?2· Сначала возьмем пространство 2-циклов /?2 — ядро оператора д, действующего на Сг- Мы уже видели, что образ д, т. е. пространство В\ С Сг, трехмерен. Поскольку С? — четырехмерное пространство, ядро д одномерно. Базисом пространства Z2 является элемент Красный+Жёлтый + Зелёный + Синий, т. е. поверхность тетраэдра, которая имеет нулевую границу. Конечно, этот элемент принадлежит и пространству f?2i поскольку он является границей тетраэдра. Следовательно, dimf^ = lj dimz^ = 1 и dim Д2 = 0. Наконец, рассмотрим Н%. Заметим, что в нем нет 3-циклов, так что dim Z3 = 0 и dim H3 = 0. Теорема Эйлера Изучая электрические цепи, мы доказали, что dim Hq — dim Hi = dim Со — dim Ci ■
714 Глава 14. Комплексы высших размерностей Теорема Эйлера обобщает этот результат на п-комплексы: dim Hq — dim Hi + dim H2 — · ■ ■ ± dim Hn = dim Co — dim C\ + dim С2 — · ■ · ± dim Cn. Стоящее в обеих частях этого равенства число называется эйлеровой характеристикой комплекса. Мы скоро докажем этот результат в общем случае, но сначала проверим его для случая тетраэдра. Поскольку dim Но = 1, а пространства Hi, H2 и Нз тривиальны (равны {0}), имеем dim Но — dim Hi + dim H2 — dim H3 = 1. С другой стороны, dim Со - dimCi + dimC2 - dimC3 = 4-6 + 4-1 = 1. Предположим, что вместо тетраэдра (с внутренностью) мы рассматриваем 2-комплекс, состоящий из поверхности тетраэдра. Единственное отличие в том, что теперь в комплексе нет трехмерного элемента. Как и раньше, dim Но = 1 и dim Hi = 0. По- прежнему dim/^ = 1, поскольку поверхность тетраэдра имеет нулевую границу. Однако теперь dim В2 = 0, поскольку нет трехмерного элемента, границей которого был бы какой-нибудь двумерный элемент. Поэтому имеем dimH2 = dim.B2 — dimHj = 1· Тогда для этого комплекса dim Ho—dim Hi+dimH2 = 1—0+1 = 2, a dim Co - dimCi + dimC2 = 4-6 + 4 = 2 Давайте проделаем то же самое для сплошного (трехмерного) куба. Он изображен в перспективе на рис. 14.4(a), а его развернутая поверхность изображена на рис. 14.4(b). Как и в предыдущем случае, dim Но = 1, потому что комплекс связен, и dimH3 = 0, потому что нет 3-циклов. Чтобы найти разверность Ζχ, рассмотрим максимальное дерево, состоящее из семи ветвей, показанное на рис. 14.4 жирными линиями. Каждая из оставшихся пяти ветвей определяет цикл. Следовательно, divaZi = 5, но dimBi = 5, поэтому dim Hi = 0. Теперь займемся пространством Нг- Поскольку dimC2 = 6 и dim.B2 — 5, мы делаем вывод, что dimZ2 = 1. Базисом Z2 является вся поверхность куба. Но эта поверхность является границей куба, поэтому dimHj = 1 и dimH2 = dim Z% — dimHj = 0.
14.1. Комплексы и гомологии 715 Я G а) Ε Η Η D Ε Α Ε F G С В F G F Рис. 14.4 6) Оказывается, что пространства гомологии куба и тетраэдра одни и те же. Для куба мы получаем dim Но — dim Н\ + dim Η2 — dim.ff3 = 1· Нетрудно также проверить, что dim С0 - dimCi + dimC2 - dimC3 = 8-12 + 6-1 = 1. Инвариантность гомологии С точки зрения топологии есть фундаментальная причина, почему комплекс куба и комплекс тетраэдра имеют одни и те же пространства гомологии. Пространство, заполняющее куб, — это то же самое пространство, которое заполняет тетраэдр, и, в свою очередь, совпадает с пространством, заполняющим шар. Все эти пространства могут быть непрерывным образом преобразованы друг в друга1. Аналогично, поверхности куба, тетраэдра и шара представляют одно и то же пространство. Рис. 14.5(a) показывает, как поверхность сферы может перейти при разбиении на Точнее, говорят, что такие пространства гомеоморфны, или топологически эквивалентны — каждое из них допускает взаимно-однозначное непрерывное в обе стороны отображение {гомеоморфизм) на другое. — Прим. ред.
716 Глава 14. Комплексы высших размерностей а) б) Рис. 14.5 грани в поверхность тетраэдра, а рис. 14.5(6) показывает, как эта же поверхность преобразуется в поверхность куба. Конечно, комплекс тетраэдра и комплекс куба отличаются, но они представляют собой различные способы разбиения одного и того же пространства. В топологии имеется теорема, которая, грубо говоря, утверждает следующее. Предположим, что мы строим пространство X, соединяя различные ячейки друг с другом вдоль граничных ячеек, размерность которых на единицу меньше. Например, построим поверхность сферы, соединяя вместе четыре 2-ячейки вдоль их ребер, как это показано на рис. 14.5(a), или соединяя вместе шесть 2-ячеек, как это показано на рис. 14.5(6). Другими словами, мы можем построить трехмерный ансамбль многогранников, соединяя ячейки вдоль их граней, подобно скоплению мыльных пузырей. Тогда теорема говорит, что пространства гомологии результирующего комплекса зависят только от пространства X и не зависят от способа соединения. Если пространство X разложить на ячейки каким-то другим способом, то мы получим другой комплекс. Пространства Н^ для разных комплексов будут изоморфны при каждом к. На рис. 14.6 показано, как сфера может быть разложена в комплекс еще проще, чем преобразование в куб или тетраэдр. Поверхность сферы разбивается на два треугольника, соответ-
14.1. Комплексы и гомологии 717 Рис. 14.6 ствующие северной и южной полусферам, соединяющимся вдоль экватора. У этого 2-комплекса существует только одна ячейка α + β + 7, которая является границей обеих полусферических поверхностей. Следовательно, dim^i = dimBi = 1 и опять dim#i = 0. Сумма этих двух граней имеет нулевую границу, поскольку д(Север) = α + β + Ί, а 0(Юг) = -а- β-Ί. Поэтому так же, как и для поверхности куба или тетраэдра, имеем dim Д2 = dimz^ = 1. И опять замечаем, что для 2-комплекса dim Co - dimCi + dimC2 = 3-3 + 2 = 2 = dim Hq — dim Hi + dim H?. К сожалению, мы не готовы доказать упомянутую выше теорему и даже дать ее точную формулировку. Чтобы это сделать, надо иметь точные определения понятий пространство, деформация, соединение и т. д. Когда эти понятия строго определены, то совсем не сложно сформулировать и доказать теорему, но развитие необходимой для этого базы уведет нас слишком далеко. Тем не менее, мы будем пользоваться этой теоремой, не заботясь о том, насколько точно она сформулирована. С ее помощью мы проделаем ряд вычислений, чтобы получше познакомиться с пространствами Η к-
718 Глава 14. Комплексы высших размерностей Тор Рассмотрим пример 2-комплекса, имеющего пространства гомологии, отличные от тех, которые мы уже рассматривали. Для этого получим разложение двумерного тора, т. е. поверхности бублика. (Вместо того, чтобы разрезать мячик, мы разрежем камеру колеса.) Рис. 14.7(a) показывает, как тор разбивается на две области; рис. 14.7(6) показывает, как эти области делаются плоскими; рис. 14.7(b) показывает, как эти области разделяются. Можно считать, что рис. 14.7(b) показывает элементы тора, и попытаться понять, в чем принципиальное отличие этого набора элементов от набора элементов сферы, который получился бы, если бы мы разделили на элементы рис. 14.5(a). Посчитав вершины, ребра и грани, мы находим dim Со = 4, dim C\ = 8 и dim C2 — 4. Откуда получаем, что dim Cq — dim C\ + dimC2 = 4 — 8 + 4 = 0. (Вспомним, что для 2-комплекса, образованного из поверхности сферы, эта величина всегда равна 2.) Рассмотрим пространства гомологии для комплекса тора. Так как этот комплекс связный, то пространство До одномерно. Поскольку вся поверхность тора имеет нулевую границу, то dim^2 = 1. (Проверьте самостоятельно, что для указанных ориентации ^(Красный + Жёлтый + Зелёный + Синий) = 0.) Мы рассматриваем 2-комплекс, поэтому в пространстве Сг не может быть элементов, являющихся границами. Значит, dimHj = 0 и dim Д2 = dirnz^ — dimHj = 1- (В общем случае очевидно, что по тем же причинам для любого 2-комплекса, полученного делением гладкой связной поверхности, являющейся границей области в пространстве R3, имеет место dim #2 = 1·) Наконец, рассмотрим пространство Hi. Рис. 14.8 показывает максимальное дерево, состоящее только из трех ребер. Самостоятельно проверьте, что если к этому максимальному дереву добавить любое из оставшихся пяти ребер, то получается цикл! Например, α + β является циклом, так же, как ε + А и μ + η. Поэтому для этого комплекса dim^i = 5. С другой стороны, dimC2 = 4. Ядро оператора д, действующего на Сг, — пространство Z2 — является одномерным, а образ д в пространстве В\ имеет размерность 3. Поэтому dimHi = άϊταΖχ - dimBi = 5-3 = 2.
14.1. Комплексы и гомологии 719 Υ (снизу) а) б) в) В 0 ρ » ι »? ζ) ι » ι I » ι ι Л G) с ι » ■ ι Полезно далее построить базисы для пространств Βχ и Н\. Проще всего в качестве базисных элементов в В\ взять ячейки, которые являются границами четырех граней, например, З(Жёлтый) = η- β + ε + δ, д(Зелёный) = а — А — η — μ, д(Синий) = λ + β + μ-δ.
720 Глава 14. Комплексы высших размерностей D а, В в, V —*— Σ) С а<5 λ £> μ £) А D А —· игу —· Л Рис. 14.8 Элементами факторпространства Н\ = Ζ\/Β\ являются классы эквивалентности по модулю В\. Поэтому мы должны найти два цикла, которые не являются границами и, более того, любая их линейная комбинация тоже не граница. Если посмотреть на рис. 14.7(a), то там сразу видно два таких цикла: цикл а + β, идущий вокруг тора в одном направлении, и цикл ε + А, идущий вокруг тора в другом независимом направлении. Поэтому базис пространства Н\ состоит из классов эквивалентности а + β и ε + А. Конечно, есть много других циклов, не являющихся границами, но все они попадают в класс эквивалентности некоторой линейной комбинации α + β и ε + А. Например, цикл η + δ лежит в классе эквивалентности а + β, потому что η-\-δ = α-\-β + д(Красный) + д(Жёлтый). Цикл α + ε + δ — μ может быть представлен в виде (а + β) + (ε + А) - д(Синий). Поэтому он лежит в том же классе эквивалентности, что и α + β + ε + Χ. Смысл пространства Ηχ Сейчас мы уже можем в общем случае понять смысл dim H\. Грубо говоря, это число независимых замкнутых кривых, которые не ограничивают никакой области. На сфере любая замкнутая
14.1. Комплексы и гомологии 721 кривая обязательно ограничивает какую-то область и поэтому dim Hi = 0. С другой стороны, на торе существует два различных типа замкнутых кривых, которые не являются границами подобластей, как это показано на рис. 14.9. Поэтому для тора dim Hi = 2. Заметим, что для комплекса, который мы построили для тора, выполняется условие dim Со — dim C\ + dim C2 = 4 — 8 + 4 = dim Но — dim Hi + dimHl· Посмотрим, как изменится пространство Hi, если мы приделаем к тору ручку (рис. 14.10). Это значит, что на его поверхности вырезаются два диска и на их место вставляется (искривленный) цилиндр, открытый с обоих концов: верхнюю часть цилиндра мы прикрепляем к границе одного диска, а нижнюю — к границе второго диска. Выберем такое разбиение исходной поверхности, чтобы каждый диск был ячейкой этого разбиения. Пусть это будет квадрат, а цилиндр мы представим, как будто он склеен из четырех граней. Присоединяя цилиндр таким образом, мы не создаем новых узлов, но добавляем четыре новых ветви (ребра «квадратного» цилиндра). Теперь удалим из $2 Два элемента (внутренние части дисков) и добавим четыре новых (грани цилиндра), см. рис. 14.11. Для получившейся в результате поверхности по-прежнему пространства Но и Hi одномерны. Вычисляя Z\ для нового комплекса, мы можем выбрать максимальное дерево, которое не содержит ни одну из новых ветвей (поскольку каждая новая ветвь лежит на ячейке — вспомним процедуру построения максимального дерева, которая была сформулирована при изучении электрических цепей). Итак, мы построили максимальное дерево, целиком состоящее из ветвей первоначального комплекса. Каждая ветвь цилиндра теперь дает новую независимую ячейку, что приводит к увеличе- Рис. 14.9 Рис. 14.10
722 Глава 14. Комплексы высших размерностей нию размерности В\ на 4. С другой стороны, размерность Сг и, следовательно, В\ увеличилась на 2. Но тогда и размерность Н\ тоже увеличилась на 2. Итак, мы показали, что добавляя ручку, мы увеличиваем размерность Н\ на 2. Если к сфере прикрепить к ручек, то сНтЯо = 1, dim#i = 2к и dim Яг = I.2 Например, тор можно представить себе как сферу, к которой прикрепили одну ручку (рис. 14.12). Это дает нам еще одно доказательство результатов, полученных для тора. Рис. 14.11 Рис. 14.12 Можно исследовать результат вырезания отверстия в поверхности. В качестве примера рассмотрим комплекс, который (вместе с внутренностью) образует на плоскости квадрат. Очевидно, что для такого комплекса dim#o = 1, dim#i = 0 и dim Яг = 0. Предположим, что из внутреннего квадрата мы вырезали отверстие (рис. 14.13). Если бы у нас было разбиение исходного квадрата, для которого вырезанное отверстие было одним из элементов 5г, то мы бы увидели, что удаление отверстия не изменяет Ζχ, но уменьшает размерность Сг и, следовательно, В\ на 1. Но тогда размерность Н\ увеличивается на 1. Итак, если на плоскости имеется область, из которой вырезаны к отверстий, то dimЯl = к, dimHo = 1 и dim #2 = 0. Аналогичные рассуждения в трехмерном пространстве показывают, что если из трехмерной области вырезать к (трехмерных) отверстий, то diva Но = 1, dimЯl = 0, dim #2 = к и dim#3 = 0. 2 Известно, что всякая замкнутая (не имеющая края) компактная связная ориентируемая двумерная поверхность топологически эквивалентна сфере с добавлением определенного количества ручек, которое называется родом поверхности и обозначается g (genus). Таким образом, род равен половине размерности пространства Hi одномерных гомологии поверхности. — Прим. ред.
14.1. Комплексы и гомологии 723 Рис. 14.13 Рис. 14.14 Бутылка Клейна При изучении электрических цепей Вы, должно быть догадались, что существуют цепи, подобные изображенной на рис. 14.14, которые не могут быть уложены на плоскости так, чтобы не пересекались отдельные провода. Однако, такие цепи всегда можно собрать в трехмерном пространстве. Точно так же существуют 2-комплексы, которые нельзя собрать в трехмерном пространстве. Хорошо известным примером является бутылка Клейна, из поверхности которой получается комплекс, изображенный на рис. 14.15(a). Несмотря на близкое сходство с тором3 (см. рис. 14.7(6)), эту поверхность в трехмерном пространстве построить нельзя. Этот (развернутый) комплекс можно собрать в цилиндр, изображенный на рис. 14.15(6). Но при этом оказывается невозможно соединить вместе ребра ε и А с соблюдением их ориентации. Для комплекса, представляющего бутылку Клейна, гомологические пространства отличаются от гомологических пространств тора. Конечно, dim До = 1> потому что комплекс связный. Однако dim #2 = 0, потому что в пространстве С? нет 3Бутылка Клейна, в отличие от сферы и тора, относится к неориенти- руемым (односторонним) поверхностям. Неориентируемая поверхность может быть получена из ориентируемой заменой на лист Мёбиуса (одностороннюю поверхность с краем-окружностью) одного или нескольких дисков. — Прим. ред.
724 Глава 14. Комплексы высших размерностей элемента с нулевой границей. (Границей всего распрямленного комплекса (см. рис. 14.15(a)) является 2ε + 2А. Проверьте самостоятельно, что при изменении знака одной или нескольких 2-ячеек в пространстве С2 не появится элемент с нулевой границей.) Для комплекса, изображенного на рис. 14.7, dim^i = 5, а для комплекса бутылки Клейна dim .Вι = 4 и dim Их = 5 — 4=1. Это значит, что существует только один независимый цикл, который не является границей. Цикл α + β не является границей ни на рис. 14.7(6), ни на рис. 14.15(a). А вот цикл ε + А, который не является элементом пространства В\ в случае тора, в случае бутылки Клейна становится элементом В\. Это половина границы всего комплекса, изображенного на рис. 14.15(a). В /3" Л* V D X С м<5 λ D а) ий в "0 *А В А 1'С D X б) Рис. 14.15 И для тора, и для бутылки Клейна мы имеем dim Со = 4, dim C\ = 8 и dim С? = 4, так что dim Co - dim C\ + dim C2 = 4-8 + 4 = 0. Полезно заметить, что для бутылки Клейна мы также имеем dim Hq - dim Hi + dim Я2 = 1 - 1 + 0.
14.1. Комплексы и гомологии 725 Доказательство теоремы Эйлера В общем случае докажем формулу dim Hq — dim Hi + dim Я2 — · · · ± dim Hn = dim Co — dim C\ + · · · ± dim Cn, которую мы уже проверили в нескольких частных случаях. Доказательство состоит из очень простых шагов. (1) Поскольку Η к = Zk/Bk, то dim Я/; = dim. Zк — dimS^· (2) Если теорему о ранге и дефекте применить к д : Ск~\ —> Ск, то dimCfc+i = dimZfe+i + dimBfe. (3) Для η-комплекса dimBn = 0, потому что не существует объектов размерности η + 1. (4) dim Zo = dim Co, потому что граница любой ячейки нулевой размерности по определению равна нулю, а в комплексе нет объектов отрицательной размерности. Собирая вместе (1) и (2), получаем dim Нк = dim Ζ к — dim Cfc+i + dim Zk+ι для 1 < к < п. Для к = 0 в силу (4) мы имеем dim Hq = dim Co — dim C\ + dim Z\, а в силу (3) для к — η имеем dim Нп = dim Zn. Таким образом, dim Яо — dim Hi + dim Я2 + · · · ± dim Hn = (dim Co — dim Cl + dim Ζ ι) — (dim Ζι — dim C2 + dim Z2) + (dim Z2 — dim C3 + dim Z3) — · · · ± dim Zn = dim Co — dim Cl + dim C2 — · · · ± dim Cn.
726 Глава 14. Комплексы высших размерностей В качестве применения этого результата рассмотрим выпуклый многогранник, который будем рассматривать как комплекс, образованный в результате разрезания поверхности сферы на отдельные ячейки. Если мы считаем, что согласно теореме, упомянутой раньше, размерности пространств Но, Н\ и Н? такие же, как у любого комплекса, образованного разбиением данной поверхности, то можно сделать вывод, что dim До — dim Αχ + dim Ή-2 = \ — 0 + 1 = 2. Этот результат мы уже получили раньше для куба и тетраэдра. Таким образом, для любого выпуклого многогранника dim Cq — dim C\ + dim C2 = 2 или «(число вершин) — (число ребер) + (число граней) = 2». Ориентация и оператор д Как уже было сказано, мы не дали строгого определения понятия пространства, лежащего в основе комплекса. Здесь мы попытаемся изложить, как следует понимать данную ситуацию. Каждая к- ячейка, т. е. каждый элемент пространства Sk, следует понимать как связный выпуклый многогранник в пространстве R с определенной ориентацией. (Напоминаем, что в пространстве Rfe и, следовательно, в любом его открытом подмножестве мы можем выбирать одну из двух ориентации, фиксировав некоторый упорядоченный базис.) Теперь границей этого выпуклого многогранника будет объединение конечного множества выпуклых многогранников размерности к — 1, лежащих в некотором аффинном подпространстве размерности к — 1. Выбрав начало координат и базис, мы можем отождествить каждое такое подпространство с Rfe~1. Предположим, что в итоге таких идентификаций в нашем комплексе каждый (к — 1)-мерный многогранник соответствует (к — 1)-ячейке, т.е. элементу пространства Sfc-i- Но эти элементы пространства Sk~i имеют определенную ориентацию. Поэтому мы должны увидеть, как ориентация А;-ячейки связана с ориентацией (к — 1)-ячейки на ее границе. Такая информация закладывается в оператор д. Пусть vi,..., Vfe является базисом пространства Rfe, так что v2,---5vfe касателен к выбранной (к — 1)-мерной грани нашей
14.1. Комплексы и гомологии 727 А:-ячейки С. Кроме того, вектор νχ направлен из А:-ячейки наружу. Предположим, что ориентация пространства Rfe, определенная векторами νχ,..., ν&, совпадает с ориентацией С. Тогда V2,..., Vfe определяют ориентацию конкретной (к—1)-мерной грани, соответствующей, скажем, F С Sfc_i· Эта ориентация может как совпадать, так и не совпадать с ориентацией F. Если ориентации совпадают, то мы приписываем подпространству F знак +, в противном случае — знак —. Тогда dC = J^±F, где сумма берется по тем F, которые соответствуют граничным (к — 1)-граням С. Конечно, если базис νχ,...,ν£ соответствует противоположной ориентации С, то знак меняется на противоположный. Если к > 2, то вектор ν& можно заменить на — ν&, если нам требуется получить «хороший» базис. При к = 1 пространство Rfe~1 есть нулевое векторное пространство. Здесь «ориентация» означает выбор знака + или —. Согласно нашим правилам, мы выбираем знак +, если вектор νχ, показывающий ориентацию, показывает наружу, и знак — в противном случае: - vi + Конечно, каждая (к — 1)-ячейка может появиться в границах нескольких А;-ячеек. Но поскольку А;-ячейки образуют базис С, то, как мы показывали раньше, каждая А;-ячейка определяет линейное отображение д : Ск —> Ck-i- Чтобы проверить равенство дд = 0, достаточно проверить, что для каждой А;-ячейки выполнено д(дС) = 0. Теперь каждая (к — 2)-ячейка Е, которая может появиться в выражении д{дС), действительно там появляется, потому что это граница для двух (к — 1)-мерных граней ячейки С, скажем, для Fi и F2. Читателю рекомендуется самому убедиться в справедливости равенства д(дС) = 0, проверив свое понимание понятия ориентации и определения оператора д.
728 Глава 14. Комплексы высших размерностей Рассматривая каждый элемент Sk как выпуклый многогранник, мы можем определить гладкое отображение комплекса в целом в пространство К^. Это сводится к правилу, согласно которому / приписывает каждой точке А:-ячейки точку в пространстве М^. Если отождествить тем или иным образов А:-ячейку С с выпуклым многогранником в пространстве М^, то отображение /, ограниченное на С, можно рассматривать как отображение из выпуклого многогранника в R в пространство М^. Мы хотим, чтобы это отображение было гладким. По существу мы хотим работать с отображением д, определенном в большей области, где оно гладко (так, чтобы включить внутрь области С и все его границы). Мы подробно займемся этим в главе 15. 14.2. Дуальные пространства и когомологии А теперь займемся семейством дуальных пространств к пространствам Cfc. Эти пространства будем обозначать Ск. Элемент такого пространства Ск, называемый А;-коцепью, является линейной функцией элементов пространства Ск, которые мы называем А;-цепями. Если σ является А;-коцепью и с — А;-цепь, то значение коцепи σ на цепи с будем обозначать /ссг, точно также, как мы делали в случаях к = О и к = 1 при рассмотрении электрических цепей. Рассмотрим транспонированное преобразование d к граничному оператору d : Cfc+i —> С к, которое мы будем называть ко- граничным оператором. Итак, d : Ск —> Ск+1 определяется формулой / da — \ σ, где σ G Ск и с G Ск+ь Jc Jdc Из того факта, что граница границы равняется нулю, следует, что dod = 0. (Конечно, имеется в виду композиция d : Ск —> Ск+1 с d : Ck+l —> Ск+2.) В только что введенных обозначениях можно написать / d(dxr) = Ι άσ = ι σ = 0, поскольку д(дс) = 0. Jc Jdc Jd(dc)
14.2. Дуальные пространства и когомологии 729 Для того, чтобы почувствовать смысл коцепи и важность ко- граничного оператора d, рассмотрим 2-комплекс, изображенный на рис. 14.16. Элемент С0, т.е. 0-коцепь Ф, полностью определяется заданием значений в каждом узле. Например, фА = 1} фВ = 3) фС = 2j φΏ = 5 Рис. 14.16 Потенциальные функции, которые играют огромную роль в теории электрических цепей, являются примерами 0-коцепей. Действие кограничного оператора d на 0-коцепь дает 1-коцепь άΦ. Чтобы вычислить значение άΦ на ветви, мы воспользуемся тем, что d сопряжен к д. Например, поскольку да = В — А, то Ld$ = Ιβα Φ = Φβ — ΦΑ· Как нам уже известно, оператор d : Cj —> С1 преобразует потенциальную функцию, являющуюся 0-коцепью или линейной функцией, заданной в узлах, в функцию скачка напряжения, т. е. в 1-коцепь, определенную для ветви как линейная функция. Продолжим исследовать смысл оператора d : С1 —> С2. Примером 1-коцепи может служить линейная функция W, принимающая следующие значения: Wa = 1, \¥β = 2, W1 = 1 W& = 2, We = -3 W = 2. Напряжения на батареях в одном из примеров электрической цепи определяли такую 1-коцепь. Действие оператора d на 1-коцепь W должно давать 2-коцепь dW, которая является линейной функцией 2-цепей. Мы можем
730 Глава 14. Комплексы высших размерностей вычислить значение dW на 2-ячейке Красный, используя определение [ <Ж = f W. ./Красный Jд(Красный) Поскольку д(Красный) = а + β — 7, мы имеем / <№ = Wa + \¥β - W1 = 1 + 2 - 1 = 2. J Красный Аналогично /с dW = Ws-We + Wri = 2 + 3 + 2 = 7. Синий Теперь известны значения cTW в базисе пространства Сг. Но тогда из линейности могут быть получены ее значения на любом элементе пространства С?. В качестве последнего примера, рассмотрим 3-комплекс тетраэдра, показанный на рис. 14.17. Пусть R, Y, G и В обозначают четыре грани тетраэдра, причем все они ориентированы против часовой стрелки, если смотреть на них снаружи. Рис. 14.17 Тогда 2-коцепь Τ определяется ее значениями на гранях, т. е. TR = 1, Τγ = 2, TG = 4, Тв = -1. Действие оператора d : С2 -> С3 на 2-коцепь Τ дает 3-коцепь dT, определенную на элементах пространства Сз- Нам надо только вычислить значение άΎ для сплошного тетраэдра. Если тетраэдр имеет правостороннюю ориентацию, так что д(Тетраэдр) = R+Y + В + G,
14.2. Дуальные пространства и когомологии 731 то J dT = TR + TY + TG + ТВ = 1+2 + 4-1=6. J Тетраэдр Читатель, знакомый с электромагнитной теорией, возможно, уже заметил сходство между кограничным оператором и некоторыми операциями физического происхождения. Например, 2-коцепь Τ может рассматриваться как поток электрического поля через грани тетраэдра. В этом случае 3-коцепь dT по закону Гаусса будет пропорциональна полному электрическому заряду внутри тетраэдра. В предыдущем примере, если 1-коцепь W представляет напряжения, индуцированные изменением магнитного поля, то 2-коцепь dW по закону Фарадея будет пропорциональна скорости изменения магнитного потока через соответствующие 2-ячейки. Действительно, кограничный оператор d преобразуется в дифференциальный оператор, который позволяет дать точные формулировки всех уравнений Максвелла. Чтобы выделить подпространства пространств Ск, рассмотрим образ и ядро кограничного оператора. Говоря конкретнее, образ d : Ск~1 —> Ск называется подпространством кограниц и обозначается Вк, а ядро d : Ск —> Ck+l называется подпространством коциклов и обозначается Zk. Поскольку do d = О, любая кограница обязательно является коциклом, и тем самым Вк является подпространством Zk. Кроме того, мы образуем факторпро- странство Нк = Zk/Bk, называемое пространством к-мерных когомологии комплекса. Многие аспекты этих пространств уже проявлялись при изучении электрических цепей. Например, в случае к = О пространство Z0 (пространство 0-коциклов) было пространством физически осмысленных потенциалов, которые были постоянны на каждой связной компоненте цепи. Пространство В было нулевым, поскольку 0-коцепь никоим образом не могла принадлежать образу d. В результате получалось факторпространство Н° = Z°/B° = Z°. (Раньше при обсуждении этого пространства мы использовали только обозначение Н°.) Для 1-комплекса пространство Z1 совпадает со всем пространством С1. Причина этого очень проста и состоит в том, что при отсутствии 2-коцепей каждая 1-коцепь должна лежать
732 Глава 14. Комплексы высших размерностей в ядре d. Пространство кограниц В1 содержит те распределения напряжений, которые получаются из потенциала. В этом случае факторпространство Н1 = Z1 /В1 совпадает с пространством С1/В . Вспомните, что пространство Н1 дуально пространству Н\ (в случае 1-комплекса оно совпадает с Z\). Простейшим примером ситуации, когда Zk, Bk и Нк не тривиальны, является случай к = 1 для 2-комплекса. Рассмотрим комплекс, изображенный на рис. 14.18. Пространство С1 шестимерно, потому что в комплексе шесть ветвей. Чтобы определить размерность пространства Z1, мы должны посмотреть на образ и ядро оператора d : С1 —> С2. β Рис. 14.18 Сначала рассмотрим образ d : С1 —> С2, т. е. пространство В2. Поскольку пространство С2 двумерно, то В2 не может иметь размерность больше, чем 2. Чтобы показать, что его размерность равна 2, достаточно найти базис С2, который лежит в образе d. 1-коцепь V, которая приписывает значение 1 ветви α и 0 другим ветвям, обладает свойством: dV(KpacHbifl) = 1, сГУ(Синий) = 0. Аналогично, 1-коцепь W, которая приписывает 1 ветви β и 0 другим ветвям, обладает свойством: сГ\У(Красный) = 0, сГ\У(Синий) = 1.
14.2. Дуальные пространства и когомологии 733 Поэтому В2, т.е. образ d, заданный векторами dV и dW, имеет размерность 2. В силу теоремы о ранге и дефекте, ядро d, т. е. пространство Z1, удовлетворяет условию dimZ1 = dim С1 - dimB2 = 6-2 = 4. Обратим теперь внимание на пространство Б1 и рассмотрим d : С0 —> С1. Ядро этого оператора, т.е. пространство Z0 (которое совпадает с Н°), имеет размерность 1, потому что комплекс связен. Следовательно, dimB1 = dim С0 - dimZ0 = 4 - 1 = 3. Значит, существуют три независимых 1-коцепи, которые выводятся из потенциалов. Мы видим, что пространство Z1, состоящее из 1-коциклов, имеет размерность 4, а пространство В1, состоящее из 1-кограниц, имеет размерность 3. Поэтому dim if1 = dim Ζ1 — dimB1 = 4 — 3 = 1. Это значит, что существуют «интересные» коциклы, которые лежат в ядре d, хотя они и не могут быть выведены из потенциала. Класс эквивалентности одного такого коцикла дает базис одномерного факторпространства Z1. Давайте, например, выберем коцикл V, для которого Va = \, V& = \, V"i = ±, Vs = i, Vе = 0, νη = 0. Очевидно, что этот коцикл не может быть выведен из потенциала, потому что сумма падений напряжений при обходе цикла а + β или 7 + δ не равна нулю. С другой стороны, V принадлежит ядру d-.C1 -^ С2, потому что dV(KpacHbifl) = Va-Vs = % - % = 0 τι сгУ(Синий) = V? - V~i = \ - \ = 0. Из этого анализа очевидно, что существование «интересных» коциклов тесно связано с наличием дырок в комплексе. Если добавить к комплексу диск с ветвями η и δ (назовем его Жёлтый), то кограницами будут только коциклы. Например, коцепь V, рассмотренная выше, будет удовлетворять условию dV (Жёлтый) = 1 и не будет коциклом. Именно таким образом пространства когомологии комплекса показывают наличие дырки, точно так же, как анализ пространств гомологии. В этом примере сразу же видно, что пространство Н1 дуально Н\ в том смысле, что базисный элемент V приписывает
734 Глава 14. Комплексы высших размерностей 1 любому циклу, который обходит дырку против часовой стрелки. Рассмотрим, например, цикл I = α + ε — δ + η. Мы видим, что /j V = Va + Vе - Vs + V4 = \ - \ = 0. Однако, все циклы, обходящие дырку один раз против часовой стрелки, образуют класс эквивалентности, который может быть базисом Hi. Кроме того, конкретный выбор элемента V в качестве представителя этого класса эквивалентности не имеет значения. Предположим, что мы выбрали W = V + άΦ. Тогда для любого цикла Μ выполняется условие ν/=ν+άΦ=ν+ Φ = / V, м Jm 7m 7m 7ам 7м поскольку 9М = 0, если М — цикл. В этом смысле класс эквивалентности V (базис для Н1) определяет линейную функцию от класса эквивалентности I (базис для Hi). Для вычисления этой функции находим /jV, взяв любой элемент класса эквивалентности. Попробуем доказать в общем случае, что Нк — это дуальное пространство Η&. Сначала установим, что dimHfe = dimHfe, потом покажем, что любой элемент Нк определяет линейную функцию в пространстве Η/;. Результат получается из того, что мы уже знаем. Ядро сопряженного оператора аннулирует образ; образ сопряженного оператора аннулирует ядро. Рассмотрим следующую диаграмму: /~ik—1 d у~,к Л у~,к+1 ^к-1 *— ^к <— ^к+1 Сначала посмотрим на д : Ck+i —> Ск и его сопряженный оператор d : С —> С +1. Ядро сопряженного оператора d является пространством коциклов Ζ ; оно аннулирует образ д, которое является пространством границ Вк- А теперь рассмотрим д : Ск —> Ск~\ и его сопряженный d : Ск~1 —> Ск. Образ сопряженного оператора есть пространство кограниц Вк; он аннулирует ядро д, которое является пространством циклов Ζ к- Однако, мы знаем, что для любого подпространства пространства Ск сумма размерности подпространства и размерности его
14.2. Дуальные пространства и когомологии 735 аннулирующего пространства должна быть равна размерности Ск. Следовательно, dim Вк + dim Zk = dim Ск = dim Zk + dim Bk. Отсюда следует, что dim Zk - dim Bk = dim Zk - dim Bk, т.е. поскольку dimHk = dim Hfe, Hk = Zk/Bk и Hk = Zk/Bk. Типичным элементом пространства Н является класс эквивалентности V, состоящий из коциклов вида V + άΦ. Если V не является нулевым элементом, то V — не кограница. Аналогично, типичным элементом пространства Нк является класс эквивалентности I, состоящий из циклов вида I + дт. Если I — не нулевой элемент, то I — не граница. Мы определяем значение V, действующего на I, т. е. Jj V, давая возможность любому элементу класса V действовать на любой элемент класса I. Тогда V = / ν + άΦ= / V + άΦ+ V+/ άΦ I Jl+дт J\ J\ Jdr Jdr /v+ ί Φ+ f dV+ j ά(άΦ). J\ Jdl Jt Jt Однако, dl = 0, потому что I — цикл; dV = 0, потому что V коцикл и, конечно, ά(άΦ) = 0. Следовательно, V= / V. ι J\ Другими словами, не имеет значения, какой элемент класса эквивалентности мы выбираем. Мы имеем корректное определение элементов Нк как линейных функций в пространстве Нк. Таким образом, мы произвели отождествление пространства Нк с дуальным пространством Нк.
736 Глава 14. Комплексы высших размерностей Ранее говорилось, что пространства гомологии Н^, относящиеся к комплексу, зависят только от пространства, лежащего в основе комплекса, и не зависят от того, как комплекс был образован. Теперь понятно, что то же самое справедливо для пространств когомологий Нк. Поскольку коцепи, из которых получаются Нк, тесно связаны с физическими величинами, то эти пространства открывают связь топологии и теории электромагнетизма. Прежде чем закончить рассмотрение комплексов, имеет смысл подвести итоги того, что мы изучили, на диаграмме, изображенной на рис. 14.19. Диаграмма нарисована для 3-комплекса, на ней показаны все связи между пространствами, которые мы изучили. οΆ = ζΆ Со = -ΖΌ Ζ0 аннулирует В0 В0 нулевое Я0 = Ζ0 дуально Я0 Ζ2 аннулирует В2 В2 аннулирует Ζ2 Я2 = Ζ2/Β2 дуально Я2 Со/Во Ζ2/Β2 Ζ1 аннулирует В ι В1 аннулирует Ζ\ Я1 = ΖιΙΒι дуально Я1 Вз нулевое В3 аннулирует Ζ$ Я3 = С3/В3 дуально Я3 Zi/Bi Рис. 14.19
Задачи 737 Резюме A. Комплексы высших размерностей Вы должны знать определения пространств Ζ к, -Bfe и Нк для п- комплексов и уметь строить базисы этих пространств. Для заданной диаграммы, представляющей ячейки 2-ком- плекса, надо уметь определить, что это за комплекс: сфера, тор или что-то еще. B. Когомологии и оператор d Для η-комплекса Вы должны уметь определить оператор d и пространства Zk, Bk, Нк; должны уметь строить базисы этих пространств. Вы должны понимать, как доказать и применять дуальность пространств Нк и Нк- Задачи 14.1. Пять 2-комплексов, изображенных на рис. 14.20, представляют в каком-то порядке следующие фигуры: (a) искривленная поверхность цилиндра; (b) лист Мёбиуса («перекрученный» цилиндр); (c) сфера; (d) тор; (e) бутылка Клейна. Опознайте эти фигуры и вычислите для каждой из них dim -Hi и dimii2· В каждом случае найдите базисы пространств Ζχ, Βχ и Н\. Проверьте, что dim Со — dim С\ + dim С2 = dim Щ — dim Hi + dim Яг- 14.2. Для каждого комплекса из предыдущего упражнения постройте базисы пространств Z1, В1 и Η . 14.3. Резиновая надувная игрушка разделена на три части, окрашенные в разные цвета. На рис. 14.21 показаны две из этих областей. (a) Определите ^(Красный) и <9(Синий). (b) Определите размерности пространств Z2, Hz и Hq.
738 Глава 14. Комплексы высших размерностей А В С D А Рис. 14.21 (c) Найдите базисы пространств Z\, B\ и Н\. (d) На рис. 14.22 показана третья область. Каковы будут размерности пространств Со, Cl, Сг, -Hi, H2 после того, как вся игрушка собрана? Получится ли мячик (dimiio = 1, dim Hi — 0, dim Дг = 1), плавательный круг (dim До = 1, dimHi = 2, dim #2 = 1) или что-то другое? Рис. 14.22
Задачи 739 14.4. Трое рабочих завода, выпускающего автомобильные шины, разделили поверхность внутренней камеры на три ориентированных области и подписали каждую своим именем. Получившийся 2-комплекс показан на рис. 14.23. Рис. 14.23 (a) Какова размерность пространства -Но? (b) Определите размерность пространства Дг и выпишите базис этого пространства (2-ячейки имеют имена Эл, Бен и Глем; постройте соответствующие линейные комбинации, следя за ориентацией). Что означает полученный результат для собранной конструкции? (c) Определите размерности dim Со, dim C\ и dim Сг, потом вычислите dim .Hi. (d) Выпишите базисы пространств Ζχ, Β\ и базис факторпро- странства .Hi = Ζι/Β\. (e) Ниже выписаны три 1-коцепи, т. е. элементы С1: σ(α) = σ(/3) = σ(7) = σ(δ) = σ(ε) = σ(λ) = 1 1 2 -2 -2 1 τ{α) = τ(/3) = τ(ητ) = τ(δ) = τ(ε) = τ(λ) = 1 -1 2 2 -2 -1 ω(α) = ω(β) = ω(ητ) = ω{δ) = ω{ε) = ω(Χ) = 1 -1 2 -2 2 -1 Найдите коцепь, которая не является коциклом, и определите 2-коцепь, которая является ее кограницей (б(0(Эл) = 1, с(П(Бен) = 3, йП(Глем) = 2). (f) Определите коцепь, являющуюся кограницей, и напишите О-цепь /, чьей кограницей она будет.
740 Глава 14. Комплексы высших размерностей (g) Покажите, что оставшаяся коцепь является коциклом, но не будет кограницей. Вычислите ее для двух базисных элементов пространства Н\. (h) Постройте второй коцикл, который не является кограницей, но будет вторым базисным элементом пространства .if1. (i) Напишите базисы пространств В1 и Z1. 14.5. Возрожденная Римская империя послала уполномоченного представителя Гая Юлия Цезаря обследовать ситуацию на международной космической станции «Новая Галлия». В его отчете, начинавшемся словами: «Вся Новая Галлия разделена на три части», были три карты, изображенные на рис. 14.24. Карты показывают территории, контролируемые аквитанцами (Aqu), белгами (Bel) и кельтами (Cel) соответственно. Эти враждующие племена не смогли договориться о единой (непротиворечивой) ориентации всей поверхности этой станции. Дайте ответы на следующие вопросы относительно комплекса «Новой Галлии». (а) Вычислите границу каждого региона: <9(Aqu) и т. д. л^ _ _ е. в Рис. 14.24
Задачи 741 (b) Найдите максимальное дерево. С помощью этого дерева вычислите divaZi, dimBi и dim Hi. Постройте базис Н\. В этом базисе выразите а — у + δ — η и β + -γ· (c) Если ω есть 1-кограница (элемент В1), удовлетворяющая условиям ωα = 2 и ωδ = 1, то каковы значения ωΊ и ωνΊ (d) Если τ есть 1-коцепь, значения которой для каждой ветви равны 1, то чему равны cir(Aqu) и с(т(Ве1)? (e) Вычислите dimZ1. Если σ есть 1-коцикл (элемент Ζ\), удовлетворяющий условиям σα = 3, σ@ = 1, σ° = 2, σ^ = 4, то каковы значения σ7 и σε? (f) Постройте базис Η1, дуальный к базису Н\ из пункта (Ь). В этом базисе выразите класс эквивалентности σ. (g) Может ли поверхность «Новой Галлии» быть сферой? цилиндром? тором? 14.6. На небольшой планете живет колония, разделенная на две провинции, Красный и Зелёный, как показано на рис. 14.25. Рис. 14.25 (a) Вычислите ^(Красный) и ^(Зелёный). С помощью результата определите размерность Н% для этого 2-комплекса. Объясните полученный результат и скажите: занимает ли колония всю поверхность планеты или нет? (b) Максимальное дерево для этого комплекса состоит из ветвей α, β и δ. Найдите базисы пространств Z\,B\viH\. Дайте
742 Глава 14. Комплексы высших размерностей географическое объяснение базисному элементу пространства .Hi. (c) Определите пространство В1. Какое пространство оно будет аннулировать? Докажите свой ответ. Рассмотрите 1-коцепь W, для которой Wa = 2, \¥β = -1, Ws = 1. (d) Найдите такие значения W1, W£, Wv, чтобы W было кограницей. (e) Пусть W^ = 3, We = 2, W*1 = 1. Вычислите dW. (f) Найдите такие значения W1, W£, W1, чтобы W было коциклом, но не кограницей. Вычислите эту коцепь в базисе пространства .Hi. 14.7. (а) Найдите размерности пространств: С\, Сг, Ζ ι, B\ и Н\ для комплекса, изображенного на рис. 14.26(a). (b) Найдите размерности пространств До и Н2', докажите, что dim Co - dim Ci + dim Сг = dim#o-dim#i+dim#2· (14.1) (c) Пусть к комплексу добавили новую ветвь σ и новый узел С, как показано на рис. 14.26(6). В явном виде напишите матрицы операторов д : С\ —> Cq и д : С^ —► С\ и вычислите матрицу д о д : С^ —> Со- В а (Красный в а) А 72, 7ι( В В А. , 72, ,7 С 71, .4 В' а ('Зелёный ' (СИНИЙ β в) 1 1 σι σ2 а (Зеленый (ЛЗиний ' в б) β ' ' '7ι '72 si В '7ι С '72 Л Рис. 14.26
Задачи 743 (d) Вдоль ветви σ сделан разрез, разделивший ее на σι (на стороне Зелёный) и G2 (на стороне Синий), рис. 14.26(b). Напишите д : С\ —> Со- Построив базис, найдите размерность Но- Что это говорит о данной цепи? Постройте базис пространства Hi и проверьте уравнение (14.1). (e) Пусть 1-коцепь τ имеет значение 1 на всех ветвях между различными точками и значение 0 во всех остальных случаях. Чему равны б(т(3елёный) и б(т(Синий)? 14.8. На рис. 14.27 изображен 2-комплекс, состоящий из двух частей. Рис. 14.27 (a) Вычислите ^(Красный) и ^(Зелёный), отсюда определите dimZ2. (b) Для этого комплекса найдите максимальное дерево. Используйте его для нахождения dim Z\, dim Β ι и dim H\. (c) Найдите базис пространства Н\, и в этом базисе выразите 7 и а + δ + β. (d) Пусть ω — это 1-кограница, удовлетворяющая условию ω13 = 2. Вычислите ωα. (e) Пусть 1-коцепь τ принимает на каждой ветви значение 1. Вычислите dr. (f) Определите dim В2 для этого комплекса.
I I
Глава 15 Комплексы в пространстве К В главах 15-18 внешнее дифференциальное исчисление излагается как непрерывная версия дискретной теории комплексов. В главе 15 сформулированы основные положения внешнего исчисления: внешняя алгебра, А:-формы, операция переноса (pullback), внешняя производная и теорема Стокса. Введение До сих пор, рассматривая различные комплексы, мы не интересовались тем, как комплекс может быть расположен в пространстве Шп. Изучая электрические цепи, мы пренебрегали формой проводов и даже не ставили вопрос, может ли данная цепь быть реализована на плоскости. Сейчас мы начнем изучать частный случай комплекса, помещенного в пространство Ш.п, чтобы увидеть, как естественным образом из геометрических или физических соображений возникают коцепи. Сначала обсудим 1-комплекс в пространстве R3 типа изображенного на рис. 15.1. В этом пространстве узлы являются точками, а ветви — дифференцируемыми кривыми. Поскольку коцепь однозначно определена своими значениями в каждом узле комплекса, мы можем рассматривать ее как функцию узлов. Один из очевидных путей получения такой функции — это задать функцию, определенную в R3. Каждая такая функция ф(х,у,г)
746 Глава 15. Комплексы в пространстве Ж' Рис. 15.1 определяет 0-коцепь Ф согласно правилу ФА = ф(хА, ул, ζΛ), где χ , у , ζ являются координатами узла А. Функция φ может рассматриваться как зародыш 0-коцепи в том смысле, что она определяет 0-коцепь для любого комплекса, расположенного в этом пространстве. Чтобы таким же способом получить 1-коцепь, нам надо иметь правило, по которому любой ветви комплекса приписывается число. Такое правило получается, например, из дифференциальной 1-формы ω, определенной в пространстве R3. Тогда если каждая ветвь комплекса является дифференцируемой дугой, то, интегрируя ω вдоль каждой ветви, мы можем построить 1-коцепь. Например, если ветвь α описывается параметризованной кривой α(ΐ), то 1-коцепь, определенная ω, будет принимать на ветви α значение f ω. Таким образом, 1-форма ω может рассматриваться как зародыш 1-коцепи. Она определяет 1-коцепь для любого комплекса, расположенного в R3. Предположим, что φ — непрерывно дифференцируемая функция, и мы образуем ее дифференциал, т. е. 1-форму ω = άφ. Предположим, что для ветви а выполняется условие да = В — А, так /x(t)\ что а описывается кривой I y(t) I с условиями: 1/(1)
Введение 747 Тогда [ ω= ί άφ= ί α*άφ= Ι ά(α*φ) JOL JOL JO JO = α*φ{1) - а*ф(0) = φ{Β) - ф{А). Функция φ определяет 0-коцепь Ф с условиями ФА = ф{А) и Фв = ф(В). Из этой 0-коцепи мы можем образовать 1-коцепь άΦ, значение которой на ветви а равно ί άΦ= ί Φ = ΦΒ - ΦΑ = φ{Β) - φ(Α). J a J да Мы используем одно и то же обозначение d для двух различных ситуаций: во-первых, как линейный оператор, действующий на 0-коцепь Φ и образующий 1-коцепь άΦ; во-вторых, как дифференциальный оператор, который действует на функцию φ и образует дифференциальную форму άφ. Сейчас становится очевидным, что такое использование d корректно в том смысле, что если из функции φ получается 0-коцепь Ф, то из 1-формы άφ получается 1-коцепь άΦ. В пространстве R3 рассмотрим пространство гладких функций Ω°(Μ3) и пространство гладких 1-форм Ω1(Μ3). Тогда можно построить диаграмму, отражающую непротиворечивость определения d: СО —Ё_> С1 1) ► П\Ш3) Эта диаграмма коммутативна в том смысле, что от функции φ к 1-коцепи можно перейти как через С0, так и через Ω1. Теперь мы должны проделать нечто похожее для 2-коцепей и 3-коцепей. В следующем параграфе мы введем объекты, называемые дифференциальными 2-формами и 3-формами, из которых в результате соответствующего интегрирования получатся 2-коцепи и 3-коцепи соответственно. Надо будет определить такой дифференциальный оператор d, который преобразует 1-формы
748 Глава 15. Комплексы в пространстве Μ в 2-формы и 2-формы в 3-формы. Причем это преобразование должно быть совместимым с действием оператора d на соответствующие коцепи. В частном случае 2-комплекса, расположенного на плоскости, мы можем увидеть, как будет работать эта программа. Зародыш 2-цепи должен будет приписывать число каждой ориентированной области на плоскости; значения, приписываемые каждой ячейке Q этого комплекса, будут определять 2-коцепь. Сейчас мы можем перейти от 1-формы (зародыша 1-коцепи) ω к 2-форме Τ двумя различными способами, как это показано на рис. 15.2. Рассмотрим, например, путь а + β + 7, являющийся границей ячейки Q. Один способ состоит в том, чтобы образовать 1-коцепь W из ω, вычисляя интеграл по пути вдоль каждой ветви комплекса. А уже потом подействовать оператором d : С1 —> С2. Это дает Q dW Q W = \να + \¥β + \¥Ί = ω+ ω + dQ ω. ky Рис. 15.2 Другой способ состоит в том, что действуя дифференциальным оператором d на ω, есть надежда получить 2-форму г, которую можно проинтегрировать по области Q и получить значение 2-коцепи Τ на ячейке Q. В этом случае теорема Грина на плоскости говорит нам, какую форму должен иметь оператор d. Вспомним, что согласно
15.1. Внешняя алгебра 749 этой теореме, если ориентированная область Q на плоскости имеет границу 9Q, то интеграл по траектории1 /. f (дВ дА\ , Adx + Bdy = / — -—} dxAdy. dQ JQ\dx ду В этом частном случае кажется целесообразным ввести 2-формы вида τ = f(x, у) dxA dy. В результате повторного интегрирования из 2-формы получается 2-коцепь, и 2-форма может быть получена из 1-формы согласно правилу d(A dx + Bdy) = [ — -— ) dx Л dy. \ox dy J 15.1. Внешняя алгебра В случае 0-коцепей и 1-коцепей мы уже имеем дифференциальный оператор, прекрасно согласующийся с кограничным оператором. Зародышем 0-коцепи является дифференцируемая функция ф, которая каждой точке приписывает вещественное число. Зародышем 1-цепи является 1-форма ω, приписывающая каждой точке элемент пространства V*, дуального к используемому нами основному пространству V. Функция φ принадлежит пространству Ω°(ν"), а 1-форма ω принадлежит пространству Ω1(Κ). Мы определили оператор d : Ω°(ν") —► Ω1 (К), согласованный с кограничным оператором. Сейчас мы будем строить последующие пространства Ω2(ν^), U3(V), ..., ftk(V), которые позволят обобщить дифференциальный оператор d. Элемент ω, принадлежащий пространству Clk(V), называется дифференциальной к-формой. Каждой точке области ω он будет приписывать элемент пространства Ak(V*). Обычно это называют «к-я внешняя степень пространства V*», для нас это — обобщение дуального пространства V*. Чтобы определить fc-коцепь, мы будем интегрировать fc-форму. После этого мы сможем определить дифференциальный оператор 1 Напомним, что в русской математической литературе он называется криволинейным интегралом второго рода. — Прим. ред.
750 Глава 15. Комплексы в пространстве Ш' d : Qk(V) —► Qk+1(V), который будет согласован с преобразованием комплексов d : С —> С +1. В качестве первого шага в этом направлении введем пространство Ak(V*). Пусть V — некое векторное пространство размерности n, a V* — его дуальное пространство. Дуальное пространство V* является пространством линейных функций из V в R, т. е. £(V; R). Сначала рассмотрим B(V, V; R) — пространство билинейных функций из V х V в R. Мы говорим, что функция r(vi,V2) билинейна, если для фиксированного значения v2 функция r(vi,V2) линейно зависит от первого аргумента, т.е. τ{αν\ +/?wi,V2) = ar(vi,V2) +/?t(wi,V2) и, аналогично, для фиксированного значения vi функция т линейно зависит от второго аргумента. Пространство B(V, V;W) является векторным пространством, где выполняются обычные правила сложения функций и умножения функции на число. Внутри пространства функций B(V, V; Ж) есть подпространство, обозначаемое Л (V*). Это пространство кососимметричных билинейных функций, удовлетворяющих условию r(vi,V2) = —r(v2,vi). Из любой билинейной функции σ(νχ,ν2) мы можем построить кососимметричную функцию t(vi,v2) = cr(vbv2) -σ(ν2,νι). Из элементов пространства V* не сложно построить элементы A2(V*). Для заданных элементов ω\ω3' G V* введем функцию ω1 Λ ω3 согласно определению ω1 Λω^νχ,ν^ = ы%{у\)и?(у2) - ωι(ν2)ω·'(νι). Поскольку функции ω1 и ω3 линейны, то ω'Λω·' билинейна. Более того, ω% Aujj(y2,vi) = ωι(ν2)ω·7(ν1) - ω1 (νι)ω3 (ν2) = -ω1 Л ω3(νχ, ν2), следовательно, функция ω1 Λ ω3 — кососимметричная. Из определения внешнего произведения следует, что оно дистрибутивно по сложению: {ω1 + ω2) Λ ω3, = ω1 Λ ω3 + ω2 Λ ω3.
15.1. Внешняя алгебра 751 Чтобы доказать это утверждение, рассмотрим произвольные вектора vi и V2- Тогда [(ω1 +ω2)Λω3](νι,ν2) = [(ω1 +ω2)(ν1)]ω3(ν2) - [(ω1 + ω2)(ν2)]ω3(ν1) = μ^νχ) +ω2(νι)]ω3(ν2) - [ω\ν2) + ω2(ν2)]ω3(ν1) = ω1 Λω3(νι,ν2) +ω2 Λω3(νι,ν2). Предположим, что мы выбрали дуальные базисы: базис βχ, е2, ..., еп пространства V и базис ε1, ε2, ..., εη пространства V*; таким образом, £Че) = | *' еСЛИ i = :i' ■" \ О, если г φ j. Если выразить ω1 и ω2 через базис V*, то ωι л ω2 = (οίε1 + α2ε2 + ■ ■ ■) Λ (61ε1 + Ъ2г2 + · · ·) будет суммой членов вида ε1 Α ε·7. Однако, ε·7 Λ ε1 = —ε1 Λ ε·7. Поэтому каждый элемент вида ω1 Λ ω2 может быть выражен через элементы вида ε1 Λ ε·7, где i < j. В общем случае, пусть τ является элементом пространства A2(V*). Вследствие билинейности и кососимметричности τ оказывается, что г определяется значениями r(ei,ej) для г < j. Введем новое обозначение r(ei,ej) = Ьц. Величина £] 6^·ει Λ ε·7 принимает те же значения, что и г, на всех ед., е;. Следовательно, г = ^ 6^·ει Λ ε·7. Значит, элементы ε1 Λ ε·7 порождают пространство A2(V*). С другой стороны, легко проверить, что все они линейно независимы. Тогда из η базисных элементов пространства V* мы можем построить \п(п — 1) линейно независимых элементов пространства A2(V*), потому что элементы ε1 Α ε·7 при г < j образуют базис пространства A2(V*). В случае, когда пространством V является R3, в качестве базисных элементов V* удобно взять dx, dy и dz. Тогда базис Л2(М3*) состоит из трех элементов dx Ady, dx Adz и dy A dz. Взяв два элемента пространства V*, мы можем, воспользовавшись внешним произведением и правилом ω·7 Αωι = —ω1 Α ω·7, умножить и упростить, например, (dx + dy) A (dx + 2dy - 3dz) = 2dxAdy — 3dxAdz + dyAdx-3dyAdz = dx Ady — Ых Adz — Ыу Adz.
752 Глава 15. Комплексы в пространстве Ш' Действие элемента пространства A2(V*) удобно выразить через определитель, т. е. u,1Au,2(v1,v2)=DetK(Vl! ^Ю· ' \ω ζ{νι) luz(v2)J Мы воспользуемся этой формулой для обобщения внешнего произведения на случай, когда множителей больше двух. Функция /, зависящая от трех векторов в пространстве V, называется трилинейной, если /(vi,V2,V3) зависит линейно от Vj (г = 1,2,3), когда два других вектора фиксированы. Трилинейная функция / называется кососимметричной, если /(ν2,νι,ν3) = -/(νι,ν2,ν3) и /(νι,ν3,ν2) = -/(νι,ν2,ν3). Из этих соотношений следует, в частности, равенство /(ν3,ν2,νι) = -/(νι,ν2,ν3). Например, определитель матрицы 3x3 является трилинейной кососимметричной функцией столбцов. А теперь давайте построим пространство Аг(У*), т.е. пространство кососимметричных трилинейных функций из V в R. Элементы этого пространства можно построить, воспользовавшись обозначениями внешнего произведения и обобщив определение на языке определителей следующим образом: /V(vi) ω'(ν2) ω'(ν3)\ ω1 Λω3' Λο/(νι,ν2,ν3) = Det Ι ^(νχ) ω^(ν2) luj(vz) Ι . \^fe(vi) LOfe(v2) Lukiv3)J Функции ω* Λωϊ Лик обладают рядом свойств, являющихся следствием линейности ω1 (ν) и элементарных свойств определителя. (a) Для фиксированных векторов ν2 и ν3 функция ω1 Λ ω·7 Λ и;к линейно зависит от νι, потому что элементы первого столбца определителя линейны по νχ, а определитель является линейной функцией элементов первого столбца. (b) Функция ω1 Л ω·7 Л ик линейна также по ν2 и ν3, т.е. она трилинейна.
15.1. Внешняя алгебра 753 (c) Функция ω1 Λ ω·7 Λ ujk изменяет знак при перестановке двух соседних аргументов (т.е. ν ι и V2 или V2 и V3) меняются местами, потому что определитель меняет знак при перестановке соседних столбцов. (d) Функция ω1 Λ ω·7 Λ ик меняется знак на противоположную при перестановке двух соседних «множителей» в ней (т.е., например, ε·7 Λ ε1 А ек = —ε1 Αε^ Аек), так как определитель меняет знак при перестановке соседних строк. (e) ω1 Α ω% А ик = О, потому что определитель с двумя одинаковыми строками равен нулю. (f) Тройное внешнее произведение дистрибутивно относительно сложения по каждому множителю, потому что определитель дистрибутивен по каждой строке. (g) Если vi, V2 и V3 линейно зависимы, то ω1 Λ ω·7 Ao;fe(vi,V2,V3) = 0, потому что определитель равен нулю, если линейно зависимы его столбцы. (h) Если ω1, ω·7 и ujk — линейно зависимые элементы пространства V*, то ω1 Λ ω·7 Ли;к = 0, потому что определитель равен нулю, если линейно зависимы его строки. Как и раньше, несложно доказать, что элементы ε1 Α ε·7 Λ ек при % < j < к образуют базис пространства AS(V*), если ε1, ε·7, ек являются базисными элементами пространства V*. Существует η возможностей выбрать г, затем η — 1 возможность выбора j и η — 2 возможности выбора к, потому что если любые два индекса равны, то ε1 Α ε·7 Λ ек = 0. Но комбинация из трех индексов допускает 3-2-1 = б перестановок, соответствующих только одному элементу с г < j < к. Следовательно, dimA3(V*) = -n(n-l)(n-2)= n! б v A ' 3!(n-3)'
754 Глава 15. Комплексы в пространстве Μ Теперь мы можем дать определение пространства Ak(V*) при произвольном к. Это подпространство пространства2 полилинейных функций £(V, V,...,V; Ш), которые кососимметричны в том смысле, что функция изменяет знак при перестановке любых двух соседних элементов. Элемент пространства Ak(V*), называемый fc-формой, может быть построен из к элементов пространства V* согласно правилу: ω*1 Λ ω<2 Л · · · Л α/*(νι, ν2,..., vfc) /^ι(νι) ω"(ν2) ■■■ uh{vk)\ ^(vi) c>2(v2) ··· w<2(vfc) = Det \wifc(vi) ωι*(ν2) ■■■ ulk{yk)J Размерность пространства Ak(V*) равна п\/(к\(п - k)\),3 а его базис состоит из всех элементов ε4 Α ε12 Л · · · Л ε1* при условии «1 < «2 < · * · < Ч-4 Заметим, что пространство An(V*) одномерно, и его единственный базисный элемент равен ε1 Α ε2 Л · · · Л εη, а в случае к > η пространство Ak(V*) = {0}. Для нас будет валена еще одна алгебраическая операция — «внешнее» умножение элемента пространства AP(V*) на элемент пространства Aq(V*), в результате чего получается элемент Ap+g(V*). Если пользоваться базисными элементами, то внешнее умножение определяется формулой (είιΑεί2Α···Αεί')Α(είιΑεί2Α···Α^9) = eh Λ· · •AeipAeil Λ- · ■ Αε^. Это определение может быть продолжено на линейные комбинации базисных элементов так, чтобы сохранялась линейность по 2обычно называемого пространством тензоров типа (fc,0), или к раз ко- вариантных. Таким образом, Afc(V*) есть пространство кососимметрических тензоров типа (к,0). — Прим. ред. 3Это выражение представляет собой биномиальный коэффициент С„ (другой вариант обозначения - (J)), а именно, коэффициент при хк в разложении многочлена (1+х)п, равный числу способов выбора неупорядоченного набора к элементов из п-элементного множества. — Прим. ред. 4Как и прежде, имеется в виду, что е1, е2, ..., е™ — некоторый базис пространства V*. Доказательство линейной независимости указанных элементов и порождения ими всего Л (V*) оставляем читателю в качестве упражнения. — Прим. ред.
15.1. Внешняя алгебра 755 каждому множителю отдельно, т. е. должен выполняться дистрибутивный закон умножения. Например, если ω = 5ε1 Λ ε7 + 3ε2 Λ ε4 и σ = 6ε1 Λ ε5 + 2ε3 Λ ε5 - 9ε3 Λ ε6 являются элементами пространства A2(V*), то элемент ωΑσ пространства Л (V*) вычисляется следующим образом: ω Α σ = 5(εχ Λε7)Λσ + 3(ε2 Λ ε4) Α σ = 30ε1 Λ ε7 Λ ε1 Λ ε5 + 10ε1 Λ ε7 Λ ε3 Λ ε5 - 45ε1 Λ ε7 Λ ε3 Λ ε6 + 18ε2 Λ ε4 Λ ε1 Λ ε5 + 6ε2 Λ ε4 Λ ε3 Λ ε5 - 27ε2 Λ ε4 Λ ε3 Λ ε6. Первое слагаемое в правой части равно нулю, потому что в него элемент ε1 входит два раза. Остальные слагаемые надо преобразовать, чтобы превратить их в базисные элементы; при этом возможны изменения знаков. Например, ε1 Λ ε7 Λ ε3 Λ ε5 = ε1 Λ ε3 Λ ε5 Λ ε7, потому что ε7 надо переставлять на два места назад, а ε2 Λ ε4 Λ ε3 Λ ε6 = -ε2 Λ ε3 Λ ε4 Λ ε6. Итак, ω Λ σ = 10ε1 Λ ε3 Λ ε5 Λ ε7 - 45ε1 Λ ε3 Λ ε6 Λ ε7 + 18ε1 Λ ε2 Λ ε4 Λ ε5 - 6ε2 Λ ε3 Λ ε4 Λ ε5 + 27ε2 Λ ε3 Λ ε4 Λ ε6. Мы настоятельно рекомендуем читателю сделать побольше примеров внешнего умножения, чтобы почувствовать, как устроена эта операция. До конца книги внешнее умножение будет одним из основных вычислительных методов. Поэтому усилия, вложенные в приобретение подобных вычислительных навыков, окупятся сторицей в дальнейшем. Читатель должен убедиться в справедливости следующих правил: Ассоциативный закон: (ω Λ σ) Λ τ = ω Λ (σ Л г). Дистрибутивный закон: ωΛ(σ + τ)=ω/\σ+ω/\τ.
756 Глава 15. Комплексы в пространстве W Антикоммутативность (сегодня это часто называют суперкоммутативностью) значит следующее5: ωΑτ = (-1)ρ4Αω, если ω £ AP(V*) и TeAq{V*). Эти правила ускоряют процедуру вычисления внешнего произведения. С логической точки зрения наше определение не совсем удовлетворительно, потому что кажется, что есть зависимость от выбора базиса. Строго говоря, мы должны доказать, что если выбрать другой базис в пространстве V, соответственно получив другой базис пространства AP(V*), то результат умножения элементов не изменится. Это можно показать непосредственным вычислением, что довольно утомительно. Гораздо лучше дать более абстрактное определение умножения, которое будет автоматически удовлетворять всем правилам, так что формула для умножения станет следствием этого определения. Мы сделаем это в приложении к главе 18, но если читателю это очень интересно, пусть прочитает это приложение прямо сейчас — оно независимо от остального материала. Гораздо важнее приобрести навык вычисления внешнего произведения. В качестве примера рассмотрим четырехмерное пространство V. Имея в виду очевидную интерпретацию как пространства- времени, обозначим базисные элементы пространства V* как dt, dx, dy и dz. В этом случае получим полный набор пространств кк(у*): • пространство A°(V*) одномерно; единственный базисный элемент назовем 1; • пространство Л1 (К*) четырехмерно; это пространство V*, его базисные элементы: {dt,dx,dy,dz}; • пространство A2(V*) шестимерно; базисные элементы: dt А dx, dt A dy, dt A dz, dx A dy, dx A dz, dy A dz; • пространство A^(V*) четырехмерно; базисные элементы: dt A dx A dy, dt A dx A dz, dt A dy A dz, dx Ady A dz; 5Аккуратное доказательство этого свойства также является хорошим упражнением. — Прим. ред.
15.2. fc-формы и оператор d 757 • пространство A4(V*) одномерно; базисный элемент dtAdxA dy A dz. 15.2. fc-формы и оператор d Чтобы перейти от пространства Ak(V*) к пространству Qk(V), мы сделаем такое же расширение, как мы делали, переходя от дуального пространства V* (обозначаемого также Л1 (К*)) к пространству Ω1(νΛ). Элементом пространства Qk(V) является функция, которая каждой точке приписывает элемент пространства Ak(V*), т.е. коэффициентами базисных элементов Ak(V*) становятся функции, принимающие вещественные значения. Например, общий вид элемента пространства Ω2(Μ3) — это а(х, у, z)dx A dy + b(x, у, z)dx Adz + с(х, у, z)dy A dz, где a,b,c — вещественнозначные функции. Что касается алгебраических операций, в том числе сложения и внешнего умножения, то элементы пространства Clk(V) ведут себя так же, как элементы пространства Ak(V*). Элементы пространства Qk(V), называемые дифференциальными k-формами или просто к-формами, будут выступать как зародыши А;-ко цепей. Мы должны научиться дифференцировать и интегрировать их. Рассмотрим пространство V = Rn и пусть da;1,... , dxn образуют базис пространства V*. (Мы используем также обозначения dx, dy и т.д.) Мы уже знакомы с дифференциальным оператором d, приписывающим 1-форму 0-форме. Если f(x,y,z) — дифференцируемая функция (0-форма), то At 9f A ^°f A ±9f А Of = — dx + — dy + — dz. ox ay oz В конечном счете мы хотим построить А;-форму как объект, который мы будем интегрировать по «fc-мерной гиперповерхности». Кроме того, мы хотим доказать теорему Стокса, которая говорит, что Ι άω= [ JS Jd ω, dS
758 Глава 15. Комплексы в пространстве М' где S — это «fc-мерная гиперповерхность» и OS — ее граница. В главе 8 мы видели, что это уравнение, примененное к инфините- зимальным параллелограммам, давало определение оператора d, действующего на 1-формы. Тогда мы получили, что d(fdg)=dfAdg. Поскольку любая 1-форма является суммой таких выражений, то это давало нам определение d для 1-форм. Может быть, сейчас полезно вернуться назад и еще раз посмотреть на основные формулы главы 8, выписанные на с. 425. Давайте в качестве примера проделаем алгебраические выкладки для 1-формы. Мы хотели бы получить d{f dg A dh А ■ ■ ■) = df A dg A dh A ■ ■ ■ . (*) Это заставляет нас определить действие оператора d на А;-форму в следующем виде: если τ = f dx4 Λ · · · Λ dx%k + g dxjl Λ · · · Λ dxjk Η , то dr = df A dxh Λ · · · Λ dxik + dg A dxh Λ · · · Λ dxjk. (15.1) После действия оператора d бывает необходимо перегруппировать члены, чтобы собрать коэффициенты при каждом базисном элементе. Рассмотрим пример действия d на 2-форму в пространстве R3. Пусть τ = Bxdy A dz — Bydx A dz + Bzdx A dy, где Вх, Βυ, Bz — дифференцируемые функции х, у, ζ, которые можно рассматривать как компоненты векторного поля. Тогда dr = dBx Ady Adz — dBy Adx Adz + dBz Adx Ady. Подставляя дифференциалы и используя тот факт, что внешнее произведение равно нулю, если совпадают любые два множителя, мы получаем , (дВх дВу дВЛ, . . dr = Ι -τ— + -т-^ + —— I dx A dy A dz. Те, кто знаком с векторным анализом, могут заметить сходство между d : Ω2(Μ3) —► Ω3(Μ3) и операцией div. Оператор d обладает рядом полезных свойств, которые следует отметить. Каждое свойство достаточно проверить для случая
15.2. fc-формы и оператор d 759 fc-формы вида Ω = / dx A dy Л · · · . Общий случай становится понятным в силу линейности оператора d. Первое свойство связано с результатом действия оператора d на произведение функции и fc-формы. Пусть f и д — дифференцируемые функции и Ω = д dx A dy Л · · ·. Тогда d(fQ.) = d(fgdx A dy Л · · ·) = d(fg) A dx A dy Л · · ·. Но для дифференциалов существует правило d(fg) = fdg + gdf. Отсюда следует, что d(fQ.) = / dg A dx A dy Л · · · + д df A dx A dy Л · · · или ε£(/Ω) = / d(g dx Л dy Л · · ·) + df А (д dx A dy Л · · ·). Тогда мы получаем d(fQ) = f dQ + df Λ Ω. Второе свойство относится к действию опрератора на произведение р-формы ω и д-формы Ω. Пусть ω = f dx1 Л · · · Л dxp и Ω = gdy1 Л · · · Л dy9, где / и д — дифференцируемые функции. Имеем ά(ω Λ Ω) = d(fgdxx Л · · · Л dxv Л dy1 Л · · · Л dyq). Поэтому ά(ωΑΩ.) = f{dg Adx1 Л · · · Adxp Ady1 Л · · · Adyq) + gdf Adx1 A ■ ■ ■ A dxp A dy1 Л · · · Л dyq. В первом члене переставляем dg и множитель dx1 Л · · · Л dxp, в результате чего получается знак (—1)р. Тогда ά(ω Λ Ω) = (-l)p(f dx1 A ■ ■ ■ A dxp) A (dg A dy1 A ■ ■ ■ A dyp) + (df A dx1 A ■ ■ ■ A dxp) A (gdy1 A--- A dyp). Поскольку каждая р-форма есть сумма членов вида / dx1 Л · · · Л dxp и каждая д-форма есть сумма членов вида gdy Л · · · Л dyp, мы имеем ά(ωΛΩ) = (-1)ρωΑάΩ + άωΑΩ. (15.2) Третье свойство касается двукратного действия оператора d. Сначала рассмотрим d(df), где f(x, у,...) — дважды дифференцируемая функция. В этом случае fdf df \ d2f d2f d(df) = d ί -±dx + -±dy + ···) = Q-j^dyAdx+-^-dxAdy+- ■ ■ . Из равенства смешанных частных производных и соотношения dyAdx = —dxAdy следует, что d(df) = 0. Теперь рассмотрим более общий случай fc-формы ω = f dx A dy A ■ ■ ■ . В этом случае άω = dfA(dxAdyA·- ■) ηά(άω) = dfAd(dxAdyA- ■ -)+d(df)AdxAdyA- ■ ■.
760 Глава 15. Комплексы в пространстве Ж Однако d{dx Л dy Л · · ·) = 0 и d{df) = 0. Отсюда следует, что в общем случае d(dw)=0. (15.3) Это согласуется со свойством кограничного оператора: Конечно, уравнение (*) теперь следует из (15.2) и (15.3). Если мы считаем, что dx — это результат действия оператора d на координатную функцию х, то определение (15.1) становится следствием (15.2) и (15.3). Поэтому, когда Вы убедились в существовании оператора d, остается только запомнить следующие его свойства: (1) df = (df/dx)dx + (df/dy)dy + - ■ ■ , где χ, у,... координатные функции; (2) d аддитивен, т. е. ά{ω + σ) = άω + da; (3) как оператор d действует на произведение, т.е. (15.2); (4) dod = 0. С помощью этих четырех правил можно вычислить действие d на любую форму. 15.3. Интегрирование к- форм Чтобы закончить идентификацию fc-форм в качестве зародышей к-коцепей, мы должны объяснить, как fc-форма Ω приписывает fc-коцепь каждому комплексу с дифференцируемыми ячейками, находящемуся в n-мерном пространстве. Сначала рассмотрим случай к = 1. Пусть в пространстве Rn имеется гладкая кривая, соединяющая точки А и В, и мы хотим вычислить интеграл от 1- формы ω на этой кривой. Для этого выберем произвольную гладкую параметризацию кривой, т.е. произвольное гладкое отображение а : R —> Шп, которое отображает отрезок [0,1] в желаемую кривую с условиями а(0) = А и а(1) = В, как это показано на
15.3. Интегрирование fc-форм 761 рис. 15.3. Затем произведем перенос (pullback) 1-формы ω и получим α*ω, выражение типа g{t) dt. Определим интеграл ϊτο траектории от формы ω вдоль кривой а формулой $ ω = JQ (α*ω). Это определение полезно тем, что результат не зависит от способа параметризации кривой а. В этом случае интеграл по кривой сводится к интегрированию по отрезку [0,1]. Ключевым пунктом построения является процедура переноса для 1-формы: если ω = fdx + gdy Η , то α*ω = (a* f) d(a*χ) + (a*g)d(a*y) Η . Очень важно доказать (с помощью цепного правила), что результат не зависит от параметризации. Рис. 15.3 В этом определении и в соответствующей теории двумерного интегрирования, которую мы обсуждали в главе 8, перенос играет чрезвычайно важную роль. Поэтому в первую очередь мы должны обобщить эту процедуру. Пусть φ : Шк —> W1 — дифференцируемое отображение. Мы хотим определить операцию φ*, называемую переносом, которая любой дифференциальной форме ω (любой степени) в пространстве Rn приписывает дифференциальную форму φ*ω (той же степени) в пространстве R . При этом нужно, чтобы ф* сохраняла операции сложения и умножения, т.е. выполнялись равенства φ*(ω\ + ω2) = φ*ωι + φ*ω2 (15.4) φ*(ωι Λ ω2) = φ*^ι Λ φ*ω2. (15.5)
762 Глава 15. Комплексы в пространстве М1 Кроме того, мы хотим, чтобы ф* оставалось нашей прежней операцией переноса, когда она действует на 0-формы (т. е. на функции) и на линейные дифференциальные формы. Это значит, что если / G Ω°(Μη) — функция, то должны выполняться равенства Φ*ί = ί°Φ, (15-6) и φ*ά/ = ά(φ*/). (15.7) Условия (15.4)-(15.7) полностью детерминируют построение. Например, рассмотрим отображение φ : R3 —> R3, определяемое следующим образом: χ = г sin θ cos φ, у = r sin θ sin φ, ζ = r cos θ. Тогда, как следует из (15.6), ф*х = г sin θ cos φ, и так далее. Предположим, что нам надо вычислить φ(άχ Λ dy Л dz). Мы имеем ф* {dx Л dy Л dz) = φ*άχ Λ ф*ау Л φ*άζ из (15.5) = (άφ*χ) Л {аф*у) Л (άφ*ζ) из (15.7) = [d(rsin#cosi/')] Л [d(rsin#sini/')] Л [d(rcos#)] из (15.6). Внутри каждого множителя этого тройного произведения мы пользуемся обычными правилами вычисления дифференциала от функции, так что d{r sin θ cos φ) = sin θ cos фаг — r sin θ sin φ άφ + r cos θ cos φ άθ и т.д. Затем мы пользуемся правилами внешнего умножения, чтобы выразить тройное произведение через drAd6/\ άφ. В результате получаем где ф*(ахЛау Adz) = r2sm6dr Λάθ Λάφ.
15.3. Интегрирование fc-форм 763 (Обычно эту формулу называют евклидовым объемом в сферических координатах6.) В общем случае следствием условий (15.4)-(15.7) является определение <l>*o(fdxilAda?aA---Ada?k) = (/оф)а(х11оф)А---Аа(х^оф), (15.8) где хг (г = 1,2,... , п) — координаты в пространстве Rn. В силу условия (15.4) наиболее общий вид ф* является суммой таких выражений. Если взять (15.8) и его обобщение на суммы в качестве определения процедуры переноса, то мы должны вернуться назад и проверить, что условия (15.4)-(15.7) выполняются. Это простое вычисление, и мы оставляем его читателю как упражнение. Из определения оператора d и свойств процедуры переноса следует, что φ*[ά(/ dxi A dxj Л · · ·)] = φ*[ά/ A dxl Л · · · ] = ά(φ*/)Λάφ*α?Λ··· = ά[{φ*/)άφ*α*Λ···] = а[ф*(/ах*А ■■■)]■ Проделав такие вычисления с суммами выражений такого вида, мы получаем основную формулу φ*άω = άφ*ω. (15.9) Этот результат чрезвычайно важен. Он показывает, что если сначала подействовать оператором d и потом применить перенос, то получится то же самое, что и если сначала сделать перенос, а потом подействовать оператором d. Есть еще одна важная формула для процедуры переноса, которую следует отметить. Пусть φ : MP —> Rfe, так что мы можем рассмотреть композицию φ ο φ : MP —> Rn. Тогда мы знаем, что для любой функции / справедливо равенство {фоф)* f = f о{фоф) = {f о ф) оф = ф*ф* f. 6он же — определитель матрицы Якоби отображения координатного пространства г,9,ф в координатное пространство х,у,ζ; смысл определителя в двумерной ситуации обсуждался в разделе 8.5 (с. 407). — Прим. ред.
764 Глава 15. Комплексы в пространстве Ж' Но тогда из полученных правил следует, что {φοφ)*ω = φ*{φ*ω) (15.10) справедливо для любой дифференциальной формы ω. Давайте соберем вместе различные правила внешнего дифференциального исчисления. Алгебраические операции — сложение и умножение дифференциальных форм: • При сложении и умножении на скаляр дифференциальные формы (любой заданной степени) образуют векторное пространство. • Произведение формы степени ρ на форму степени q образует форму степени ρ + q. • Дистрибутивный закон: (ωχ + ω2) Λ σ = и>\ Л σ + ω2 Λ σ. • Ассоциативный закон: (ωχ Λ ω2) Λ ω% = ωι Λ (^2 Л ω^)· • Антикоммутативность: ω^Λω2 = (—1)pqlu2Alui, если степень ω\ равна ρ и степень ω2 равна q. Оператор d: • Если ω является формой степени р, то άω будет формой степени ρ + 1, где df = (df /dx)dx + (df /dy)dy + ■ ■ ■ в координатах (χ, у,...). Кроме того, ά(ω\ + ω2) = άω\ + άω2, ά(ω Λ σ) = άω Λ σ + (—1)ρω Λ άσ, если степень ω равна р, и d{(L·) = 0.
15.3. Интегрирование fc-форм 765 Перенос: ΦΊ φ* {ωχ + ω2) φ*(ω Λσ) φ*ά и (φ ο φ)* =φ* οψ*. Во всех рассуждениях предполагалось, что отображения φ, ψ и т. д. и формы ω, σ и т. д. определены во всем пространстве. Конечно, это не обязательно. Мы можем определить различные операции над формами, отображениями и так далее, когда они определены на различных открытых множествах. Надо только быть уверенным, что области определения соответствуют друг другу. Так, если φ определено на некотором открытом множестве U, то достаточно, чтобы ω было определено на открытом множестве О, которое содержит ф(и). Тогда мы сможем определить перенос φ*ω. Если ψ определено только на открытом множестве О, то мы должны предположить, что ψ(0) С U, если хотим определить φ ο ψ. Определение интегрирования по областям в пространстве Rfe. Сейчас мы хотим определить интеграл от fc-формы по ориентированной области U в пространстве Rfe, т.е. мы рассматриваем ситуацию, когда степень формы равна размерности пространства. Предположим, что U — ограниченная область, и она «хорошая» в следующем смысле. Пусть на пространство К наложена сетка с ячейками ε, так что К оказывается составленным из неперекрывающихся кубиков с ребром ε. Пусть Ιηηε(ί7) обозначает полный объем всех тех кубиков, что целиком лежат в области U, a Out£(i7) — полный объем всех кубиков, которые хотя бы частично лежат в данной области (см. рис. 15.4). Тогда можно составить разность / о φ для функции /, φ*ωχ + φ*ω2, φ*ω Λ φ*σ, άφ* Out£{U) - lim£(U)
766 Глава 15. Комплексы в пространстве Μ Рис. 15.4 и сделать ее достаточно малой, выбрав соответствующее малое значение ε. Это значит, что, вычисляя аппроксимирующие рима- новы суммы, мы не должны беспокоиться о кубиках вдоль границы. Например, очевидно, что любой ограниченный многогранник в этом смысле «хороший». Кроме того, если U — хорошая область ит/) — дифференцируемое отображение, определенное в области немного большей, чем U, то из теоремы о среднем значении следует, что ψ(υ) тоже хорошее. (Вы можете доказать это самостоятельно или прочитайте главу 8 книги Loomis and Sternberg, Advanced Calculus, где подробно объясняются основные факты об интегралах Римана в n-мерном пространстве.) Предположим также, что ориентация U стандартная (задаваемая стандартным базисом и соответствующими координатами ж1,..., хк). Пусть Ω обозначает fc-форму в пространстве Шк. Тогда можно написать Ω = fdx1 Л··· Adxk, где / — дифференцируемая функция. Для любой ячейки ε можно составить аппроксимирующую риманову сумму Σ/(Ρί)νο1(ϋΟ = ε*^/(ρΟ, где pj £ Ц и Dj пробегает по всем кубикам сетки в области U (или хотя бы частично попадающим в нее). Непрерывность (равномерная) / гарантирует, что эта сумма стремится к пределу при ε —> 0, не зависящему от выбора как р^ в кубиках, так и от самой сетки. Этот предел будем обозначать / Ω. Ju
15.3. Интегрирование fc-форм 767 Важно помнить, что в этом определении область U имеет стандартную ориентацию пространства R . Приведем очевидные свойства этого интеграла. Предположим, что U = U\ U · · · U Up является конечным объединением хороших подобластей, имеющих стандартную ориентацию. Тогда Ιω=Ιω+Ιω+-+Ιω. Ju Jui Ju2 Juv Игнорирование множеств меньшей размерности. Будем говорить, что множество S имеет нулевую меру , если для любого положительного числа δ мы имеем Out£(s) < δ при достаточно малом выбранном значении ε. (Другими словами, S имеет нулевую меру, если полный объем кубиков в сетке, которая пересекает S, может быть сделан сколь угодно малым, выбирая размер ячеек сетки достаточно малым.) Например, если S лежит в линейном подпространстве размерности < к, то очевидно, что S имеет нулевую меру. Множества нулевой меры не дают никакого вклада в интеграл, т. е. если U = U' U S, где S имеет нулевую меру, то /jy Ω = Jut Ω. Отсюда, например, следует, что если мы разделим многогранник на подмногогранники (рис. 15.5), то можно при вычислении интегралов не беспокоиться о гранях меньшей размерности. Кроме того, если U — единичный куб {0 < χι < 1, г = 1,..., к}, то Ω = А;-кратному интегралу от / = / · · · / / dxi ■ ■ ■ dxk. Ju Jo Jo Доказательство точно такое же, как и для случая двух измерений (см. с. 389 в главе 8). Конечно, так же как и в случае двух измерений, вместо куба можно взять любую область, приводящую к кратному интегралу. 7 Подразумевается определение меры в смысле Жордана, которая отличается от «стандартной» меры Лебега более узким классом измеримых множеств. Ограниченное множество в евклидовом пространстве измеримо по Жордану (или квадрируемо), если существует интеграл Римана (по объемлющей области) от его характеристической функции, при этом мера множества равна значению интеграла. — Прим. ред.
768 Глава 15. Комплексы в пространстве М1 Рис. 15.5 Формула замены переменных. Предположим, что φ : Rfc —► Μ — взаимно однозначное, дифференцируемое, сохраняющее ориентацию отображение, для которого существует дифференцируемое обратное. Тогда для любой fc-формы ω, определенной в пространстве образов, и для любой хорошей области U в пространстве прообразов мы имеем / ω = φ* ω. Jcj>{U) Ju (Как всегда, ф должна быть определена в области, немного большей, чем U, a ω должна быть определена в области немного большей, чем ф(и).) Доказательство формулы замены переменных. (i) Пусть А : Rfe —► Rfe — линейное отображение. Тогда для любой связной хорошей области Vol(.At7)/Vol(i7) = | Det A\. Начнем с доказательства того, что левая часть этого равенства не зависит от U. Это делается так же, как и для двумерного пространства (см. параграф 1.9). Давайте обозначим левую часть равенства Vol(A). Тем самым Vo\(A) показывает, во сколько раз отображение А изменяет объем. Из определения следует, что Vol(AB) = Vol(i4)-Vol(B). Из главы 11 мы знаем, что Det(AB) = Det A Det В.
15.3. Интегрирование fc-форм 769 Мы хотим доказать, что Vol( A) = | Deti4| (*) для всех кхк матриц. Из предыдущих двух равенств можно сделать заключение, что если (*) справедливо для А и В, то оно верно и для АВ. Если А — диагональная матрица, то легко увидеть, что (*) выполняется. Если у матрицы А все элементы под диагональю равны нулю, на диагонали стоят 1 и над диагональю только один элемент не равен нулю, то Vo\(A) = 1 (это по сути двумерное утверждение относительно преобразования сдвига). Из этого следует, что если А = U — верхне-треугольная матрицы с 1 на диагонали (под диагональю стоят только нули), то Vol(i7) = DetiJ = 1. Аналогично для нижне-треугольных матриц. Итак, можно сделать вывод, что (*) верно для всех матриц А, что можно записать как А = LDU, где L — нижне-треугольная, D — диагональная и U — верхнетреугольная. Когда можно разложить матрицу А таким образом? Внимательное изучение процедуры редукции по строкам в параграфе 10.8 показывает, что такое разложение возможно тогда и только тогда, когда в редукции по строкам матрицы А не требуется делать транспонирование. А это происходит тогда и только тогда, когда ни один из главных миноров не обращается в нуль, (главные миноры — это определители квадратных матриц, возникающие на пересечении первых г строк и столбцов матрицы А.) Итак, должны выполняться условия: оц φ 0, (аца22 - α2ιαι2) φ 0, ..., Det А ф 0. Однако, для любой матрицы А все эти неравенства можно обеспечить, делая сколь угодно малые изменения матричных элементов. Поскольку Vol(yl) и Det Л — непрерывные функции А, то равенство (*) выполняется для всех матриц. Теперь приведем другое доказательство формулы (*), основанное на другом способе разложения несингулярных матриц в
770 Глава 15. Комплексы в пространстве Μ произведения. Для любой матрицы А матрица А* А — самосопряженная, поскольку (А* А)* = А* А** = А* А. Более того, если А несингулярна, то все собственные значения матрицы А*А положительны, так как (А*Ах,х) = (Ах, Ах) > 0 для любого ненулевого вектора х. Поэтому А*А имеет положительно определенный квадратный корень, т. е. матрицу S, которая симметрична, положительно определена и удовлетворяет условию S2 = А*А. (Действительно, мы можем написать, что А* А = OLO*, где L — диагональная матрица с положительными диагональными элементами и О — ортогональная матрица. Тогда S = ОМО*, где Μ — диагональная матрица, элементы которой равны квадратным корням из соответствующих элементов матрицы L.) Утверждается, что матрица AS~l ортогональна. Действительно, (AS-lx,AS~ly) = (S'lx, A*AS~ly) = (S'1 χ, S2 S'1 у) = (x,y), поскольку S"1 — самосопряженная матрица. Тогда можно написать A = SK, где К = AS-1 ортогональна. Однако S = ОМО*. Поэтому А = ОМО*К, где О (и О* = О-1) и К ортогональны, а М — диагональная матрица с положительными элементами. Для Μ мы имеем Vol(M) = DetM. Ортогональные матрицы сохраняют длину и поэтому сохраняют объем, т.е. Vol(O) = Yo\(K) — 1. С другой стороны, DetO = ±1 (потому что DetO · Det О* = Det 00* = 1 и Det О = Det О*). В этом и состоит другое доказательство формулы (*). (И) Пусть φ = А : Rfe —► Rfe — линейное отображение. Тогда φ*(άχ1 Л · · · Л dxk) = (Det A)dxl Л · · · Л dxk. (**)
15.3. Интегрирование fc-форм 771 Из определения процедуры переноса и внешнего произведения следует, что ф*х1 = оцж1 + а^ж2 + · · · + а\кхк и т.д. Поскольку Оу постоянны, получаем φ*άχ = a\\dx + · · · + a\kdx , ф*ахк = akidx1 + · · · + Ofefedxfe. Теперь φ*άχι Λ · · · Л ф*ахк будет кратно dxl Л · · · Л dxk. Соответствующий множитель обозначим f(A). Это некоторая числовая функция А, которая удовлетворяет всем аксиомам определителя. В силу единственности такой функции, доказанной в главе 11, мы считаем, что формула (**) справедлива. (Ш) Пункты (i) и (ii) дают формулу замены переменных для случая, когда φ — линейное отображение, т.е. для φ = А при условии, что Det А > 0. Докажем это. Запишем ω = gdx1 Л · · · Л dxk, где д — функция. В силу (И) φ*ω = hOetAdx1 Л ··· Adxk, где h{x) = g{Ax). Покроем область U сеткой с малыми ячейками, как это показано на рис. 15.6. Это значит, что область ф(17) делится на малые параллелепипеды, причем объем каждого параллелепипеда отличается от объема соответствующего кубика множителем Det А. Рис. 15.6
772 Глава 15. Комплексы в пространстве М' Возьмем произвольное значение ε > 0. Мы можем сделать размер ячейки достаточно малым, чтобы в каждом параллелепипеде функция д менялась бы не больше, чем на ε: ls(p)-s(q)l <ε при условии, что ρ и q лежат в одном и том же параллелепипеде. Это значит, что если D обозначает один из внутренних кубиков, а ф(0) обозначает соответствующий параллелепипед, то J44P) ω - д(р)У61(ф(П)) <ε, (***) где ρ - произвольная точка из <^>(П). Однако в силу (i) Vol(0(D)) =Deti4-Vol(G). Поэтому / ω - 5(ρ) Det A · Vol(D) < ε. (****) Пусть U' обозначает объединение всех внутренних кубиков сетки. Суммируя неравенства (****) по всем внутренним кубикам, получаем / ω - Υ" д(Ат) Det A ■ Vol(D) <ε, где г — любая точка в кубике D. Суммирование ведется по всем внутренним кубикам. Когда сетка измельчается, в пределе кубиками вдоль границы можно пренебречь, и тогда / ω -> ω, J<t>{U') J<t>(U) Σ 9(Ar) Det A ■ ν°1(Π) ~+ Ι Φ* ω. (iv) Давайте посмотрим, что надо изменить в предыдущих рассуждениях, если φ уже не предполагается линейным. Прежде
15.3. Интегрирование fc-форм 773 всего, φ*ω = hOet(d<t>fdx)dxl Λ ··· Λ dxk. Поэтому постоянная Det А заменяется функцией ВеЬ(дф/дх), где (дф/дх) обозначает матричную функцию / дф1/дх1 ■■■ дф1/дхк \ (дф/дх) = (^ дфк/дх1 ... дфк/дхк ) ■ В этом случае аппроксимирующая риманова сумма становится равной Σ g{Ar) ВеЬ{дф/дх)Уо\(П). Неравенство (***) все еще выполняется, если сетка достаточно мелкая. Но <^>(П) уже не будет параллелепипедом, и у нас уже не будет точного равенства Vol(0(D)) = Det(d0/0x)(r)Vol(D). Но нам достаточно знать, что это равенство выполняется приблизительно, т. е. что |Vol(0(D)) - Det(50/dx)(r)Vol(D)| < eVol(D). Это неравенство следует из теоремы о среднем значении. Детали доказательства достаточно просты. Их можно найти в книге Loomis and Sternberg, Advanced Calculus, глава 8, с. 343-344. Мы еще раз отсылаем читателя к этой главе для последовательного изучения теории интегрирования в пространстве R . Этим мы завершаем обсуждение формулы замены переменных. Интегрирование А:-форм по А:-цепям комплекса. Предположим, что ω — А;-форма в пространстве Rn. Пусть φ : Rk —* Rn — гладкое отображение, a U обозначает область в пространстве Rfe. Рассмотрим интеграл [ φ*ω. Ju Пусть К — комплекс, а ф — отображение этого комплекса в пространство Rn. Напомним: это значит, что φ отображает каждую ячейку комплекса С в пространство Rn, причем ограничение φ на С — дифференцируемое отображение.
774 Глава 15. Комплексы в пространстве М' Это имеет смысл, потому что каждая ячейка С является выпуклым многогранником в некотором евклидовом пространстве. По существу, мы требуем, чтобы отображение φ удовлетворяло более сильному (с технической точки зрения) условию-, для каждой А;-ячейки С комплекса существует область U (окрестность С) в пространстве Rfe и такое дифференцируемое отображение φ : U —* Rn, что ограничения φ и φ на С совпадают. Каждая А;-ячейка С комплекса ориентирована. Поэтому можно рассмотреть интеграл ί φ*ω JC по ячейке С. Пусть с — некоторая А;-цепь. Тогда с является линейной комбинацией А;-ячеек: где Cj — А;-ячейки, a rj — вещественные числа. Тогда интеграл от φ*ω по цепи с дается формулой Очевидно, что это выражение линейно зависит от с. Таким образом, А;-форма ω вместе с отображением φ определяет А;-коцепь на комплексе К. Например, предположим, что наш комплекс К содержит грани, ребра и вершины тетраэдра. Для простоты пусть все грани ориентированы «согласованно». Под этим подразумевается, что если с = С\ + С2 + Сз + С4,, то дс = 0. Представим себе, что центр тетраэдра находится в начале координат пространства R3. Независимость от деления на ячейки. Рассмотрим проекцию (рис. 15.7) из центра тетраэдра на поверхность единичной сферы S и назовем ее отображением ф. Легко видеть, что φ — гладкое отображение тетраэдра в пространство R3. Каждая грань тетраэдра отображается в часть сферы, а ф будем рассматривать как
15.3. Интегрирование fc-форм 775 Рис. 15.7 отображение цепи с на поверхность сферы (с определенным выбором ориентации). Если ω — 2-форма в R3, то J φ*ω — интеграл от ω по сфере (также с выбором ориентации), что записывается в виде /"■ Js Это обозначение неявно содержит ряд правомерных допущений. Прежде всего, предполагается, что граничные кривые треугольных областей, на которые мы разделили сферу, можно игнорировать. Связано это с тем, что при вычислении двумерного интеграла определение через римановы суммы означает, что гладкие кривые не вносят вклада. Более важное предположение состоит в том, что конкретный выбор разбиения на треугольные области (комплекса К и отображения ф) не имеет значения. Вследствие теоремы о замене переменных нас интересует только поверхность сферы (покрываемая один раз) с определенной ориентацией. Давайте объясним это. Допустим, что мы рассматриваем другой комплекс L, состоящий из граней, ребер и вершин куба, с центром в начале координат. Обозначим μ отображение комплекса L на поверхность сферы, задаваемое проекцией куба из центра (рис. 15.8). Предположим также, что грани комплекса L ориентированы согласованно, так что е = Fi + F2 + F3 + F4 + F5 + Fq удовлетворяет условию де = О,
776 Глава 15. Комплексы в пространстве Ш' Рис. 15.8 Рис. 15.9 где Fi (г = 1,2,... ,6) — грани куба. Утверждается, что ί μ*ω = ± J φ*ω (15.11) со знаком +, если ориентации е и с «совпадают». (В процессе доказательства мы объясним, что это значит.) Действительно, рассмотрим кривые на сфере, являющиеся образами ребер комплекса К (при отображении ф) и комплекса L (при отображении μ). Эти кривые делят поверхность сферы на много подобластей (рис. 15.9). Каждая треугольная область на сфере состоит из нескольких таких подобластей, и точно так же каждая «квадратная область», происходящая от куба. Пусть W обозначает одну из таких подобластей. Тогда мы можем написать W = ф(и), где U — подобласть одной из граней К и W = μ(ν), где V — подобласть одной из граней L. Рассмотрим отображение φ : U —* V, заданное φ = μ~χ оф. Тогда ф = μοφ, откуда φ*ω = φ*(μ*ω) и У = ф{Щ. (Легко проверить, что φ — дифференцируемое отображение.)
15.4. Теорема Стокса 777 Из формулы замены переменных имеем / μ*ω = ± / φ*ω Jv Ju где знак + берется тогда и только тогда, когда φ сохраняет ориентацию. Легко видеть, что отображение ф, которое мы построили для подобласти W, будет сохранять ориентацию тогда и только тогда, когда соответствующие отображения для всех других подобластей тоже сохраняют ориентацию. Если это происходит, то мы говорим, что сие создают одинаковую ориентацию на сфере. Суммирование по всем подобластям доказывает (15.11) и объясняет введенное обозначение. Мы уже кратко набросали доказательство справедливости нашего обозначения для случая сферы. Конечно, оно работает и в гораздо более общем случае. Для любой ориентированной поверхности в трехмерном пространстве (в общем случае для любого ориентированного подмногообразия Μ в пространстве Rn) интеграл JM ω имеет смысл и не зависит от того, как мы «нарезали Μ на куски», чтобы записать его как объединение образов ячеек. (Итак, мы определили интеграл от 2-формы по ориентированной 2-сфере, «разрезав ее на куски» и потом показав, что результат не зависит от способа разрезания. Существует другое (эквивалентное) определение, которое состоит в «покрытии сферы заплатками», а не в разрезании ее на куски. В конце следующего параграфа мы коротко расскажем об этом.) 15.4. Теорема Стокса Теорема Стокса, которую мы докажем в этом параграфе в общем случае, говорит следующее. Пусть К — некоторый комплекс, а ф — гладкое отображение К в пространство Rn. Пусть, далее, ω — (к — 1)-форма в Rn, а с — А;-цепь. Тогда ίφ*άιυ= ! φ*ω. (15.12) Jc Jdc Если фиксированы ф и ω, то обе части этого равенства — линейные функции с. Поскольку любая цепь является линейной комбинацией ячеек, то равенство (15.12) достаточно доказать для
778 Глава 15. Комплексы в пространстве Ш случая, когда с — ячейка. Доказывать будем так же, как это делалось в двумерном случае в главе 8, и только в самом конце будет небольшое отклонение. В качестве первого шага рассмотрим случай, когда ячейка С является кубом. Можно предположить, что это единичный куб в пространстве Rfe. Пусть и1,... ,ик — координаты в Шк. Тогда можно написать φ*ω = οι du2 Л · · · Л duk + о2 du1 Л du3 Л · · · Л duk Η + akdux Л··· Adufe_1, (15.13) так что левая часть равенства (15.12) принимает вид / φ*άω — / άφ*ω Напомним правило выбора знаков для оператора д, действующего на ячейку комплекса. Вспоминаем, что ориентация ячейки С определяет, «правильно» или «неправильно» упорядочены базисные вектора. «Неправильное» множество базисных векторов преобразуется в «правильное» либо перестановкой двух векторов с соседними номерами, либо изменением знака одного вектора. Правильные и неправильные множества для к = 1,2,3 показаны на рис. 15.10. Граница ориентированной А;-ячейки состоит из суммы ориентированных (к—1)-ячеек. Общее правило определения знака каждой ячейки на границе: в точке на границе ячейки С строим множество векторов, в котором первый вектор направлен из ячейки С, а остальные к — 1 векторов образуют правильно ориентированный базис граничной ячейки. Если получившееся множество к векторов является правильно ориентированным множеством для ячейки С, то граничная ячейка входит в дС со знаком плюс; в противномом случае она входит со знаком минус. На рис. 15.11 показано применение этого правила в случае к = 1. Вектор vi направлен наружу, а других векторов нет. В
15.4. Теорема Стокса 779 к = 1 к=-~2 fc = 3 Vl верно ГР vi неверно верно яз. неверно неверно Рис. 15.10 верно (+В) неверно (—А) Рис. 15.11 точке В вектор vi имеет правильную ориентацию относительно ветви а, а в точке А — неправильную. Следовательно, да = В—А. На рис. 15.12 показан случай к = 2 для треугольной ячейки С, ориентированной против часовой стрелки. Вектор V2 выбран так, что он касателен к ветви, а его направление определяет ориентацию ветви. Вектор vi всегда направлен из ячейки С. Для ветвей а и β эта пара векторов правильно
780 Глава 15. Комплексы в пространстве R' -vi верно (+а) верно (+β) Рис. 15.12 да vi неверно ( 7) 1 V2, Αι ι«2 ι —*-Vi k = 2 V-2, ι —»"Vi Ui Рис. 15.13 ориентирована (в соответствии с ориентацией ячейки С против часовой стрелки), а вот для ветви η вектора ориентированы неправильно. Следовательно, дС = α + β — η. Вернемся к рассмотрению случая, когда ячейка С = 1к является кубом, ориентированным посредством стандартного базиса vi, V2, ..., Vfe (его векторы параллельны ребрам куба). Рассмотрим отдельные члены, получающиеся в результате подстановки (15.13) в fdc(f>*Lu. Рассмотрим различные грани дС. Начнем с двух граней, для которых и1 = const. На грани Βχ, где и1 = 1, вектор vi направлен наружу и остальные вектора V2,..., ν^ ориентированы правильно. На грани Αχ, где и1 = 0, вектор vi направлен внутрь и поэтому V2,..., Vfe ориентированы неправильно. Эта ситуация в случаях к = 2 и к = 3 показана на рис. 15.13. Когда мы вычисляем φ*ω на этих двух гранях с уравнениями и1 = const, все члены в г, содержащие множитель du1, дают нуль. Остается только αϊ (и1, и2,..., ик) du2A- ■ -Aduk. Вычисление этого члена на грани Βχ, где V2,..., ν& упорядочены правильно,
15.4. Теорема Стокса 781 дает Jjk-i ai(l,u2,... , ик) du2 ... duk. А вычисление его на грани Αχ, где вектора ν2,...,ν^ упорядочены неправильно, дает — Jjk-i «ι (0, и2,..., ик) du2 ... duk. Все вместе дает интеграл / [ах(1,и2,...,ик) -αχ(0,η2,... ,uk)]du2 ... duk. Из фундаментальной теоремы дифференциального исчисления имеем αχ(1,η2,... ,ик) -ах(0,и2,...,ик) = / -^-j-(V,u2,... ,uk) du1. Jo &и Поэтому общий вклад от двух граней с их = const равен / —4 du1 ... duk, J Ik du1 где теперь интеграл вычисляется по единичному кубу в пространстве Шк. Выполнив такую же процедуру для граней с и2 = const, заметим, что множество векторов V2, vi, V3,..., ν^ упорядочено неправильно. На грани, где и2 = 1, вектор V2 направлен наружу и поэтому остальные вектора vi, V3,... , ν^ упорядочены неправильно. На грани, где и2 = 0, вектор V2 направлен внутрь, а остальные вектора vi, V3,..., ν^ упорядочены правильно. При вычислении г вклад дает только член а,2(и1,и2,... , ик) du1 Adu Л •Л duk. Поэтому мы получаем / [-а2(У,1,... ,ик) +a2(u1,0,...,uk)]du1du3...duk 7/fc-i = - / -^| du1 du2 ... duk. Jjk OUz Аналогичные соображения показывают, что вклад от граней, где u·7 = const, равен ± JIk{daj/du^) du1 ... duk, причем берется знак + для нечетных j, и знак — для четных. Если просуммировать вклады от всех 2к граней в д1к, то получится (15.12). Итак, мы доказали теорему Стокса для куба. Теперь надо рассмотреть ячейки более общего вида. Как мы показали в главе 8, на плоскости любой многоугольник может быть разложен
782 Глава 15. Комплексы в пространстве Ш' на треугольники. Действительно, любой многоугольник можно разложить на выпуклые многоугольники, которые, в свою очередь, разлагаются на треугольники, если выбрать точку внутри и соединить ее со всеми вершинами. Аналогично в трехмерном пространстве любой многогранник может быть разложен на тетраэдры. Действительно, сделаем предварительное разложение и предположим, что С — выпуклый многогранник. Предположим, что все его грани уже разложены на треугольники. Опять выбираем точку ρ внутри С. Тогда этот многогранник разлагается на тетраэдры, основанием каждого из которых является треугольник из разложения грани, а вершина находится в точке р. Таким образом, в случае 2-форм теорему Стокса достаточно доказать для тетраэдра. С помощью индукции мы можем проделать эту процедуру и в пространстве к измерений. Пусть S G Rfe будет множеством, определенным формулой S = < χ \ Xi > О для всех г и У, жг < 1 [ · А;-симплекс — это подмножество пространства Rfe, являющееся образом S при обратимом аффинном отображении. Таким образом 1-симплекс — это отрезок, 2-симплекс — это треугольник и 3-симплекс — это тетраэдр. Предположим, что мы разложили С на симплексы [Δι]. Утверждается, что если мы знаем теорему Стокса для всех симплексов, то мы знаем ее для С. Действительно, рассмотрим комплекс, который разлагается на ячейки — симплексы. Тогда комплекс С можно идентифицировать с цепью в нем, т. е. можно написать Поэтому (в силу теоремы Стокса для Aj) / ω = ζΖ / ω JdC JdAi = / άω. Jc
15.4. Теорема Стокса 783 Итак, теорему Стокса достаточно доказать для симплекса. Воспользуемся инвариантностью интеграла относительно процедуры переноса и сведем доказательство к случаю куба. Здесь мы рассмотрим доказательство для треугольника. Чтобы доказать теорему Стокса для треугольника, достаточно доказать ее для равностороннего треугольника Δ, поскольку для любого треугольника можно найти аффинное преобразование, которое преобразует его в равносторонний. Предположим, что длина стороны треугольника равна 1. Пусть линейная дифференциальная форма г тождественно равна нулю за пределами круга, центр которого находится в одной из вершин и который не достигает противоположной стороны (рис. 15.14). Рис. 15.14 Рис. 15.15 Тогда dr также тождественно равняется нулю за пределами круга. В силу теоремы Стокса в этой ситуации вклад в интеграл возникает только от внутренней части круга, так что мы можем без ущерба нарастить «внешнюю» часть треугольника, достроив его до параллелограмма (рис. 15.15). Таким образом, если D обозначает параллелограмм, а Δ обозначает треугольник, то поскольку г и dr равны нулю за пределами круга, мы имеем τ = τ и dr = dr. да JdA Jd J a Однако, с точностью до замены переменных параллелограмм — это просто квадрат. Следовательно, JqqT = /gdr и поэтому JdA т = Ια dT- Теорема Стокса будет доказана для Δ, если мы установим следующее. Каждая гладкая дифференциальная форма (определенная в окрестности Δ) может быть записана в виде суммы трех
784 Глава 15. Комплексы в пространстве К членов Т = Т1+Т2 + ТЗ, где каждый член η тождественно равен нулю вне круга Ό г. Причем центр круга находится в вершине треугольника, а радиус R изменяется8 в пределах 2/3 < R < 3/4 (так что три круга покрывают весь треугольник, но ни один круг не достигает противоположной стороны треугольника, см. рис 15.16). Рис. 15.16 Чтобы это доказать, потребуется свойство функции одной переменной. Лемма. Функция ., . / е"1/", и > О, /(и) = \о, и<0 бесконечно дифференцируема во всех точках. Доказательство. Очевидно, что для и φ О функция / имеет производные всех порядков и f^k\u) = О для и < 0. Поэтому мы должны доказать, что при и —* 0 для любого к. Мы имеем f^k\u) — Pfc(l/u)e_1/u, где Р& — некоторый полином9, 8 Более последовательный подход — зафиксировать радиус R = 1/ν2. Причина объясняется в сноске на с. 786. — Прим. ред. 9Полезное упражнение — вычислить его в явном виде индукцией по к. — Прим. ред.
15.4. Теорема Стокса 785 и поэтому lim(l/tt) · f(k\u) = lim sPk(s)e-s = О, / Л >0, Φ) J = 0> потому что es стремится к бесконечности быстрее любого полинома. Заметим, что / тождественно равна нулю для и < О и строго положительна для и > 0. Пусть гi обозначает расстояние от г-й вершины. Определим функцию gi формулой „ы-/ f(R-n(x)), n(x)<R, 9i[X)-\0, n(x)>R. Тогда gi бесконечно дифференцируема и ri{x) < R, nix) > 0. Пусть 9 = 91 + 92 + 93- Поскольку каждая точка в Δ — внутренняя для по крайней мере одного из кругов Д, т. е. поскольку г»(ж) < R хотя бы для одного из г — 1,2,3, то 9(х) > 0 для каждого χ G Δ. Поэтому мы можем разделить на д и определить Φι = —, L = 1,2,3. 9 Тогда ^•И | = 0> г.(ж) > о и ф\{х) + ф2(х) + фг(х) = 1 Для всех χ £ Δ·10 Умножая последнее уравнение на г, получаем г = ф\т + ф2Т + фзт. 10Построенный набор функций фг принято называть разбиением единицы, подчиненным данному покрытию многообразия (треугольника) множествами Di (тремя кругами). Это понятие играет важную роль в анализе на многообразиях. Подробнее см. в конце этого раздела на с. 791. — Прим. ред.
786 Глава 15. Комплексы в пространстве Ш' Если мы положим Т{ = φίΤ, то получим желаемое разложение Т = Τι + Т2 + Тз- Очевидно, что это доказательство можно провести и в случае η измерений. Только вместо 3 будет соответственно п+1 (по числу вершин симплекса) шаров Di, функций ^ит.д.,а радиус шаров можно выбрать R = 1/V2.11 Итак, теорема Стокса доказана. На самом деле мы не должны быть настолько педантичными. Надо просто покрыть симплекс конечным числом шаров Di, так чтобы пересечение Di с симплексом имело вид части куба, разбить на куски и свести к случаю куба. Пример В качестве применения теоремы Стокса и вычисления форм на ячейках рассмотрим 2-форму г = (х2+у2 + z2) dxAdy в пространстве R3 и ячейку С, являющуюся сплошным полушарием радиуса R, обладающую правосторонней ориентацией и изображенную на рис. 15.17. В явном виде мы вычислим fdc τ и Jc dr. Сплошное полушарие ограничено двумя ячейками: полусферической поверхностью А и диском В в экваториальной плоскости. Пусть эти ячейки ориентированы против часовой стрелки, если смотреть на них снаружи, тогда дС = А + В. 11 Происхождение данной величины, вероятно, следует пояснить, учитывая небрежность авторов в этом месте оригинала. Если симплекс правильный (как га-мерный многогранник) и длина его ребра равна 1, то его высота а расстояние от вершины до центра симплекса dn = ^ΤΊ hn = V 2(га"+ 1) · То, что шары радиуса R = 1/ν2 с центрами в вершинах симплекса покрывают симплекс и не достигают противолежащих граней, вытекает из очевидных неравенств dn < 1/ν2 < hn, причем обе последовательности сходятся к 1/ν2 при га —> оо. Геометрически это выглядит так: с ростом га прямоугольный треугольник «вершина симплекса-центр противоположной грани - вершина грани» с гипотенузой 1 и катетами hn и dn-i стремится к равнобедренному. — Прим. ред.
15.4. Теорема Стокеа 787 "ζ / А \£ J / <^*L^> / У χ Рис. 15.17 В качестве параметров для описания полусферической поверхности воспользуемся сферическими координатами θ и ф. Двумерное параметрическое пространство изображено на рис. 15.18. В принципе можно ввести параметры и = 2Θ'/π и ν = φ/2π, так что областью интегрирования будет единичный квадрат, но прямоугольник не менее удобен для вычисления. северный полюс нулевой мередиан 7г/2 Рис. 15.18 Перенос х, у ζ при указанной параметризации а имеет вид: а*х = Яз'твсовф, а*у = Квтввтф, a*z = RcosO. Тогда a*dx = Ясоввсозфав — Rsin θ sin φάφ, a*dy = Ясовввтфав + Яв'твсовфаф.
788 Глава 15. Комплексы в пространстве Ш' Следовательно, а*т = а*{х2 + у2 + z2)(a*dx) Л (a*dy) = R2 {R2 sin θ cos θ cos2 φ άθ Λ άφ — R2 sin θ cos θ sin2 φ άφ Λ d#) = R4 sin 0 cos θ άθ Λ <ί0. Чтобы проверить, что α сохраняет ориентацию, посмотрим на образы упорядоченного множества векторов βχ и β2. Образы νι и V2 соответствуют ориентации полусферы А, что показано на рис. 15.18. Для вычисления 2-формы τ на полусфере А мы просто вычислим двойной интеграл J а*т = /J!i0 Г^0 R4 sin θ cos θάθάφ = ttR4. Для диска Б удобно выбрать параметры г2 = х2 + у2 и угол ф. Чтобы диск В имел правильную ориентацию, выбираем порядок ф, г. Соответствующее параметрическое пространство изображено на рис. 15.19. Тогда образы βχ и е? правильно упорядочены для ориентации В против часовой стрелки, если смотреть на диск снизу, и по часовой стрелке, если смотреть на него сверху. 2π ψ Рис. 15.19 Для параметризации β перенос имеет вид: β* χ = г cos φ, β* у = rsin(£, β*ζ = 0, следовательно, β*τ = г2(совфаг — гвтфаф) Л (sin^dr + гсовфаф) = г3 dr Л άφ = —ггаф Л dr. Таким образом, значение τ для ориентированного диска В равно 2тг -гаафаг = --тгД4. r=0 J<t>=0
15.4. Теорема Стокса 789 Собрав вместе результаты для двух ячеек на границе, мы получаем [ = [ т+ ί т = тгД4 - ^тгЯ4 = ^тгД4. Jdc JaJb 2 2 Теперь вычислим Jcdr. Поскольку τ = (χ2 + у2 + ζ2) άχ Л ay, dr = 2zdz Л dx Л dy = 2zdx A dy Л dz. Мы параметризуем ячейку С, используя сферические координаты г, Θ, ф. Перенос, соответствующий данной параметризации: ф*х = rs'm6cos(f>, ф*у = rsm6sm<j), φ*ζ = г cos θ. После вычислений мы получаем φ*(άτ) = 2r3sin# x cos θ dr Λ άθ Λ άφ. Для нахождения значения άτ на С интегрируем по прямоугольному параллелепипеду в параметрическом пространстве: άτ= / / 2r3 sin θ cos θ dr άθ άφ =-π Я4. J с Jr=o Je=Q 7^=0 2 Давайте покажем кратко, как можно использовать доказательство теоремы Стокса, приведенное выше, чтобы дать альтернативное определение интегрирования fc-формы по А;-мерному подмногообразию. Это альтернативное определение будет совпадать с определением интегрирования по А;-цепи, которое мы дали в случае, когда подмножество является образом А;-цепи. Потом более детально покажем, как доказать, что интеграл по А;-цепи не зависит от способа разложения на ячейки. Сделаем это так же, как уже сделали в конце предыдущего параграфа для сферы. При первом чтении материал с этого места и до конца параграфа можно опустить. Заплатки Доказывая теорему Стокса, мы использовали набор функций {φι,...,φη}, причем каждая из этих функций непрерывно дифференцируема, неотрицательна и φι + ■ ■ ■ + фп = 1 в рассматриваемой области (симплексе). Кроме того, каждая функция φι за пределами шара Di обращается в нуль. Шар Di выбран так, чтобы выполнялись желаемые
790 Глава 15. Комплексы в пространстве Ш'1 свойства. (При доказательстве теоремы Стокса мы хотели, чтобы с помощью дифференцируемого отображения пересечение Di с симплексом могло быть преобразовано в подмножество куба.) А теперь вспомним определение подмногообразия Μ в пространстве Шп. Подмножество Μ в пространстве Шп называлось подмногообразием размерности к, если вокруг каждой точки ρ подмногообразия Μ мы можем найти шар D и его диффеоморфизм / на открытое подмножество U в пространстве Шп, так что f(D Π Μ) = U Π Шк, где Шк идентифицируется с А;-мерным подпространством пространства Шп, заданным условием, что последние п — к координат равны нулю. Предположим, что мы можем покрыть подмногообразие Μ конечным числом таких шаров Di, ■ ■ ■ ,Dr. (Это всегда можно сделать в случае, если Μ — компактное, т. е. замкнутое и ограниченное подмножество в пространстве Шп.) На каждом Di определен свой диффеоморфизм /j и fi(Di ПМ) = [/,П Rk. Это подмножество обозначим Wj. Тогда Wi = Ui П Rk будет открытым подмножеством пространства Шк. Для любого перекрытия Di Π Dj мы можем рассмотреть ограничение либо fi, либо fj. Поэтому fi(Di Π Dj) есть открытое подмножество Щ и fj(Di Π Dj) — открытое подмножество Uj. Тогда fi о /г1 отображает /j(£>; Π Dj) в /j(A Π Dj) и переводит Wjnfj(DinDj) в WinfiiDiHDj). Итак, наша ситуация выглядит следующим образом: мы покрыли Μ множествами Oj = DiD M. Пусть gi обозначает ограничение fi на Oi. Тогда gi будет взаимно-однозначным отображением Oi на открытое подмножество Wi в пространстве Rfe.12 12Описанный набор областей Ог С М, покрывающий многообразие М, вместе с диффеоморфизмами gi : Οι —> Wi С Ш принято называть атласом карт данного (гладкого) многообразия. — Прим. ред.
15.4. Теорема Стокса 791 Рис. 15.20 Далее, отображение 9ij = 9i° 9J* из Wj П 9j(OiHOj) в Wi П & (Oj П Oj) дифференцируемо и имеет дифференцируемое обратное, определенное формулой gji = gj о д~ . См. рис. 15.20. Мы можем вообразить, что многообразие Μ покрыто «заплатками». Отображения д7 говорят, как Wi покрывают многообразие, а отображения дц говорят, как Wi и Wj сшиваются вместе. Каждое отображение д^ может либо сохранять ориентацию, либо менять ее на обратную. Допустим, что в нашем случае все отображения gij сохраняют ориентацию13. (Это определяет «ориентацию» на М. Интуитивно ясно, что если Μ связно, то на нем существуют только две ориентации.) Пусть теперь набор функций φι,...,φΓ обладает свойствами: 0 < фг < 1, Фг = 0 вне Di и ф\ + ■ ■ ■ + фг = 1 на М. Теперь для каждой А;-формы ω мы можем написать ω = φ\ω + ■ ■ ■ + фгш. 1 Следовательно, многообразие Μ ориентируемо. Возможность выбора атласа, для которого все отображения склейки д^ сохраняют ориентацию, и ость критерий ориентируемости многообразия. — Прим. ред.
792 Глава 15. Комплексы в пространстве R' Все слагаемые справа обращаются в нуль вне шара Ό{. Тогда можно было бы определить J M JWi Другими словами, вместо разрезания Μ на отдельные куски, мы можем записывать любую форму в виде суммы небольших кусков, каждый из которых помещается внутрь одной-единственной координатной заплатки на М. Эту форму можно интегрировать посредством переноса на подмножество пространства Ш . Повторное применение формулы замены переменных показывает, что это определение интеграла не зависит от выбора функций ф^ или от заплаток (т.е. от выбора Oi и gi), но зависит от выбора ориентации М. Для детального изучения этого определения мы опять отсылаем читателя к книге Loomis and Sternberg, Advanced Calculus, главы 9-12. 15.5. Дифференциальные формы и когомологии* Для произвольного комплекса, расположенного в пространстве Шп, fc-формы, которые мы определили, будут зародышами fc-коцепей, а дифференциальный оператор d совместим с когра- ничным оператором d. Аналогично подпространствам, которые мы определили через образ и ядро кограничного оператора, сейчас мы можем построить подпространства (бесконечномерных) пространств с помощью дифференциального оператора d. Если fc-форма ω удовлетворяет условию άω = О, она называется замкнутой. Такая fc-форма после интегрирования по ячейкам становится А;-коцепью W, удовлетворяющей условию dW = 0, и поэтому она принадлежит пространству А;-коциклов Ζ . Другими словами, замкнутая А;-форма является зародышем А;-коцикла. Если fc-форма ω может быть записана в виде ω = dr, то она называется точной. В этом случае после интегрирования г по "При первом чтении этот параграф можно опустить.
15.5. Дифференциальные формы и когомологии 793 ячейкам комплекса получается (к — 1)-коцепь Т, а ω порождает fc-коцепь W, так что W = dT. Поэтому коцепь W лежит в подпространстве А;-кограниц Вк. Другими словами, любая точная А;-форма является зародышем кограницы. Мы знаем, что для любого комплекса пространство Вк является подпространством Zk. Соответствующее утверждение относительно fc-форм состоит в том, что любая точная А;-форма (зародыш элемента пространства Вк) также замкнута (зародыш элемента пространства Zk). Доказательство очень простое: если ω точная, то ω = dr и поэтому άω = d{dr) = 0. Следовательно, ω замкнута. Для любого комплекса факторпространства (пространства когомологии) Η = Ζ /В зависят лишь от основного пространства и не зависят способа его разрезания в комплекс. Поэтому разумно ожидать, что пространства Нк можно получить, рассматривая дифференциальные формы: от бесконечномерного пространства замкнутых форм {άω = 0) мы переходим к фактор- пространству по пространству точных форм (ω = άτ). Образовавшиеся пространства определяют так называемые когомологии де Рама основного пространства, на котором определены дифференциальные формы. Для построения базиса пространств Нк вспомним, что для любого комплекса пространство Нк дуально гомологическому пространству Η к- Поэтому разумно ожидать, что базисный элемент для пространства Нк будет определяться его значениями на fc-цепях, которые образуют базис Н^ в любом удобном комплексе пространства. Давайте рассмотрим несколько совсем простых примеров для иллюстрации этих абстрактных рассуждений. Пример 1А. Пусть основное пространство — отрезок прямой (рис. 15.21). В этом пространстве построим 0-формы, которые будут дифференцируемыми функциями fit), и 1-формы, имеющие вид ω = g[t) dt. а Ъ t Рис. 15.21
794 Глава 15. Комплексы в пространстве Μ В этом случае замкнутые 0-формы — это постоянные функции, определяющие одномерное подпространство. Точных 0-форм не бывает, поэтому факторпространство Н° замкнутых 0-форм по точным одномерно. Так отражается тот факт, что комплекс, полученный из отрезка, всегда связен и имеет dim Но = 1· При рассмотрении 1-форм мы обнаруживаем, что каждая 1-форма точная: для заданной ω = git) dt мы образуем первообразную функцию G(t) = Jg(t)dt такую, что ω = dG. Следовательно, в этом случае пространство Н1 имеет нулевую размерность. Пример 1В. Пусть основное пространство состоит из двух непересекающихся отрезков прямой (рис. 15.22). В этом случае пространство двумерное: оно состоит из функций, которые имеет одно постоянное значение на отрезке [а,Ь] и другое, может быть отличное от первого, постоянное значение на отрезке [с, d]. Это отражает тот факт, что комплекс, построенный на этом пространстве, будет иметь две связных компоненты. —I 1 1 1— a be d Рис. 15.22 В общем случае при любой размерности основного пространства замкнутые 0-формы будут функциями, принимающими постоянное значение на каждой связной компоненте. Они будут образовывать пространство Н° = Ζ с размерностью, равной числу связных компонент в основном пространстве. С этого момента и дальше мы будем рассматривать только связные пространства, и нам не нужно будет возвращаться к пространству Н°. Пример 2А. Основное пространство — прямоугольник на плоскости (рис. 15.23). Это пространство связно, поэтому Н° одномерно. Изучая 1-формы заметим, что любая 1-форма ω точная. Мы доказали это, рассматривая криволинейные интегралы. Поэтому пространство Н1 имеет нулевую размерность. Рассмотрев теперь 2-формы, замечаем, что каждая 2-форма точная. Общий вид 2-формы — это τ = f(x, у) dx Л dy. Образуем
15.5. Дифференциальные формы и когомологии 795 12/ Рис. 15.23 функцию F(x,y) = I f(t,y)dt такую, что Jo д£ дх = f(x,V)· Тогда d(Fdy) = f(x, у) dxAdy = т. Отсюда следует, что Н2 имеет нулевую размерность. Пример 2В. Пусть опять основное пространство будет прямоугольником на плоскости, но с одной выкинутой точкой — началом координат (рис. 15.24). И на этот раз пространство Н° одномерно, потому что основное пространство связно. А пространство Я2 имеет нулевую размерность, потому что каждая 2-форма точная. Однако, если мы рассмотрим 1-формы, то появится новое явление: теперь существуют замкнутые 1-формы, которые не будут точными. Так что в этом случае пространство Н1 нетривиально. Рис. 15.24 Рис. 15.25 Чтобы получить базис пространства й"1, сначала рассмотрим пространство гомологии Н\ для 2-комплекса, построенного на этом пространстве (см. рис. 15.25). Поскольку начало координат не принадлежит пространству, то в комплексе не может быть
796 Глава 15. Комплексы в пространстве Ж' ячейки, включающей начало. В результате цикл типа а + β + η, окружающий начало координат, не может быть границей. Класс эквивалентности такого цикла (по модулю пространства границ В\) образует базис одномерного пространства Hi. Для того же комплекса пространство когомологий Н1 дуально Hi. Его базисный элемент будет классом эквивалентности 1-коцикла W, который не является кограницей. Поскольку Н1 дуально Hi, мы ожидаем, что W принимает фиксированное ненулевое значение для любого цикла типа а + β + 7, обходящего начало один раз против часовой стрелки. Чтобы получить базис для пространства когомологий де Рама Н1, мы должны найти зародыш коцикла для W: замкнутую 1-форму ωο с фиксированным ненулевым значением для любой кривой, окружающей начало один раз. Такую 1-форму можно получить, рассмотрев функцию θ = arctan(y/x), которая определена везде, кроме начала координат, и которая может быть сделана непрерывной везде, кроме одной прямой, выходящей из начала координат (обычно это ось χ в отрицательном направлении, так что — π < θ < π). Тогда напишем дифференциал xdy -ydx ωο = ασ = ~ о—· χΔ + ψ Эта 1-форма определена и непрерывна везде, кроме начала координат. Кроме того, она замкнутая: άωο = 0, что можно проверить прямым вычислением. С другой стороны, она не точная: нет такой непрерывной функции /(ж, у), чтобы ωο = df. Для любой кривой а, обходящей начало координат η раз против часовой стрелки, мы имеем ωο = 2тт. J a Поэтому базисом пространства Н1 является класс эквивалентности xdy — ydx ωο = —^—,—n h dg, χΔ + yz где д(х, у) — любая дифференцируемая функция. Пример ЗА. Пусть основное пространство — прямоугольный параллелепипед в пространстве R3 (рис. 15.26). Без доказательства
15.5. Дифференциальные формы и когомологии 797 Рис. 15.26 утверждаем, что Η одномерно (связная область); Н1 = {0} (каждая замкнутая 1-форма точна); Η = {0} (каждая замкнутая 2-форма точна); Я3 = {0} (каждая 3-форма точна). Эти результаты для пространств Н1, Н2, Н3 являются следствиями общей теоремы, известной как лемма Пуанкаре. Грубо говоря, лемма утверждает, что на любом пространстве, которое можно непрерывно стянуть в точку, все замкнутые дифференциальные формы точные. Интересные случаи возникают, если пространство имеет «дырки» и поэтому его нельзя стянуть в точку. Конечно, в этих случаях существуют циклы, не являющиеся границами, и поэтому дуальные пространства Ηι,Η2,·-- ненулевые. Пример ЗВ. Пусть основное пространство опять будет прямоугольным параллелепипедом в пространстве R3, но на этот раз выкинуто начало координат. Результаты для Н°, Н1 и Нг не меняются. Однако теперь пространство Н2 одномерно. Дифференциальная форма го χ dy Λ dz + у dz Λ dx + ζ dx Λ dy (χ2 + у2 + ζ2)3/2
798 Глава 15. Комплексы в пространстве Ш' определена везде, кроме начала координат. Она замкнута, что можно проверить, проделав громоздкие вычисления. Однако, Js то = 4π для любой замкнутой поверхности S, окружающей начало координат. Конечно, такая поверхность является циклом, но не границей. Не удивительно, что она принадлежит классу эквивалентности, который дуален Н2. Пример ЗС. Пусть основное пространство будет прямоугольным параллелепипедом в пространстве R3, из которого выкинута ось ζ. В этом случае Н1 одномерно, и его базис χ dy — у dx ω0 χ2 + у2 + dg. При этом пространство Н2 имеет нулевую размерность. Пример 3D. Пусть основное пространство — поверхность тора, расположенного в пространстве R3 (см. рис. 15.27). В этом случае Н1 двумерно. Один из его базисных элементов имеет вид χ dy — у dx ω0 = χ2 + у2 + dg, и определяет, сколько раз замкнутая кривая обходит ось ζ. Другой базисный элемент (R-l)dz-zdR ωι + dg, R= y/(x2 + y2). z2 + (R-l)2 Значение этой формы на любой замкнутой кривой определяет сколько раз кривая пройдет по окружности единичного радиуса в плоскости ху. Таким образом, базисные элементы Uq и йГ[ дуальны двум типам циклов для любого комплекса на торе. Рис. 15.27
15.5. Дифференциальные формы и когомологии 799 А сейчас мы докажем лемму Пуанкаре, чтобы обосновать утверждения, сделанные в этих примерах. Мы получим точный рецепт, как строить (к — 1)-форму ф, обладающую свойством άφ = ω, где ω — заданная замкнутая fc-форма. Лемма будет доказана для случая, когда ω определена на открытом множестве в пространстве Шп, обладающим тем свойством, что каждая точка множества может быть соединена с началом координат отрезком прямой, целиком принадлежащим множеству. Такое множество называется звездным. Позднее мы обобщим доказательство на случай множества, которое с помощью гладкого отображения может быть взаимно-однозначно преобразовано к звездному. На рис. 15.28 показаны примеры таких множеств. Для данной звездной области Q с координатами ж1,..., хп мы можем построить отрезок прямой, соединяющий начало координат с произвольной точкой р. Поскольку Q звездна, то этот отрезок целиком лежит в области Q. Определим функцию β, которая для каждой точки ρ отображает [0,1] в этот отрезок. Таким образом, если точка ρ имеет координаты ж1,..., хп, то прямолинейный отрезок задается параметрически формулой /txls /и1" \unj 0<ί < 1. \txn Если воспользоваться терминологией переноса, то мы имеем β* (и1) = tx1 и т.д. Рис. 15.28. а) Звездность относительно точки О (но не точки р). б) Внутри области дырка, поэтому нет звездности относительно какой-либо точки, в) Область на поверхности сферы не звездна, но это образ звездной области, г) Поверхность всего тора не является образом никакой звездной области
800 Глава 15. Комплексы в пространстве Μ Любая функция д, определенная в области Q, с помощью переноса может быть преобразована к области Q χ [0,1]. Например, функция д{и1,... ,ип) в результате переноса преобразуется в функцию Р*д = g(txl,... ,txn). По существу, это значит, что Р*д является функцией ρ = (ж1,... ,хп) и t; при изменении t от 0 до 1 она пробегает значения д вдоль отрезка, соединяющего ρ с началом координат. Конечно, если ρ меняется, то значения д берутся вдоль другого прямолинейного отрезка. Внимательно посмотрите на рис. 15.29, чтобы осознать смысл Р*д. t = \ \Х 1" ' ι Х" ) /(tx\-·· ,txn) / (χ1,··· ,χη) t = 0* ·η · о t=\ t=i Рис. 15.29 Согласно обычным правилам, мы можем проделать перенос с любой базисной 1-формой любой А;-формы: β*άυ* = d(ix<) = x<di + idxi. Произвольная fc-форма ω, определенная на Q, может быть записана в координатах и1,..., ип: ω= Σ ah,...,ik(ul,...,un)duh/\---f\duik. ii<—<ifc Проделав перенос с такой формой, получим β*ω= Σ ail,...>ik(tx\...,txn) i\<—<ik x (t dxh + xh dt) Λ · · · Λ (ί dxik + xik dt).
15.5. Дифференциальные формы и когомологии 801 Эта fc-форма β* ω является суммой членов вида Π(ΐ) = A(t,x1,...,xn)dxil A--- Adxik или r2(t) = B(t,x1,...,xn)dtAdxh Λ · · · Λ dxik-i. Определим линейный оператор L, действующий на эти формы следующим образом: Ln = 0, Lt2= ( J B{t, χ1,..., χη) dt) dxh Λ · · · Λ dxik~l. Этот оператор обладает замечательными свойствами: dLn + Ldn = п(1) - п(0), dLr2 + Ldr2 = 0. Они доказываются прямым вычислением. Начнем с т\. Конечно, dLr\ = 0. Кроме того, ЗА άτι = -тг dt A dx11 Λ · · · Λ dxlk + члены без dt. at Поэтому Ldn = ί (^dxh A--- Adxik\dt = (A(l,x\ ... ,xn) - Αφ,χ1,... ,xn)) dxh A··· Adxik. Для т2 мы имеем выражение LT2= ( ί B(t,x\...,xn)dtj dxh A--- Adxik~\ которое не зависит от t. Вычисляя dLr2, мы дифференцируем под знаком интеграла и получаем dLr2 = £д / —1dt\dxj Adxix A--- Adxik~K
802 Глава 15. Комплексы в пространстве Ж' С другой стороны, п βμ> dr2 = У^ тг^ dxj A dt A dxh Л · ■ · Л dxik~ или так что dxi .7 = 1 dr2 = - У^ тг^ <Й Л dxj Л cte*1 Л · · · Л dxik~\ *-^ дхэ .7=1 LdT2 = -J2[ Q~idt)dxJ Adxh Λ··· Adxik-\ откуда следует, что dLr-2 + Ldr2 = 0. Итак, если мы рассмотрим άΙ,(β*ω) + Ld(P*u), то можно игнорировать все члены вида тг, содержащие множитель dt. Для всех к > 0 мы имеем τι(0) = 0, поскольку множитель t стоит при каждом dxl. Положив t = 1, мы получаем άΙ,{β*ω) + Ώάβ*ω = J2 ail_ik{x\...,xn)dxil A---Adxik = ω. tl<—<tfc Однако нам известно, что άβ*ω = β*άω, поэтому dLfu + LP*du = ω. Таким образом, оператор S = L/J* удовлетворяет тождеству dSu + Sdu = ω. Если ω замкнута, т. е. άω = 0, то dStJ = ω. Итак, мы доказали, что ω точная. До сих пор мы предполагали, что ω определена в звездной области Q. Сейчас давайте распространим наше доказательство на случай, когда ω определена в области Ф(<2), которая является образом звездной области при гладком взаимно-однозначном
15.5. Дифференциальные формы и когомологии 803 отображении Ф. Если ω замкнута, то Φ*ω тоже замкнута, потому что άΦ*ω = Φ*άω = 0. Поэтому можно написать Φ*ω = <ί(5Φ*ω), Поскольку Φ обратимая, то можно применить обратный перенос (Ф*)-1и получить ω = (Φ*) d(SV*u) или ω = (Φ*)_15Φ*ω. Итак, для формы ω, определенной в области D, мы имеем семейство неопределенных интегралов (Φ*)-15Φ*ω, соответствующих различным способам выражения D в качестве образа звездной области: D = Ф(<2). Есть и другой взгляд на эту ситуацию. В области D мы можем ввести различные системы координат, так чтобы область в координатном пространстве, отображаемая в D, была звездной. Тогда оператор (Ф*)_15Ф* соответствует интегрированию вдоль прямых линий в координатном пространстве. Если, например, D — поверхность Мексиканского залива, то мы получаем S, интегрируя вдоль прямых линий, соединяющих точки области D с центром Земли (или с другим началом координат). Введя сферические координаты, мы построим другой неопределенный интеграл (Ф*)_15Ф*, когда каждая точка залива соединяется с началом координат линией, представляемой прямой на карте с проекцией Меркатора. Давайте сформулируем процедуру получения неопределенного интеграла от дифференциальной формы ω= Ύ^ ah...ikixl, ■ ■ ■ ,xn)dxn Λ ■ ■ ■ Adxlk. ii<---<ik Шаг 1. Построим перенос β*ω, сделав замену хг —> txl в аргументах всех функций так, чтобы а(ж1,... ,хп) -> aitx1, . ■ . ,txn), и заменив dxl —> хг dt + t dxl. Шаг 2. Выбросим все члены, в которые не входит dt. Во всех остающихся членах dt сдвигаем влево, внимательно следя за знаками.
804 Глава 15. Комплексы в пространстве М1 Шаг 3. Обращаемся с dt как в обычном интеграле и интегрируем по t от 0 до 1. Эта процедура в явном виде показана на следующих примерах. Пример 1. ω = у2 dx + 2xydy (замкнутая 1-форма). Шаг 1. β* ω = t2y2(xdt + tdx) + 2t2xy(ydt + tdy). Шаг 2. β*ω = (t2xy2 + 2t2xy2) dt + другие члены. Шаг 3. Slu = xy2 f^ 3t2dt = xy2. Проверка. d(xy2) = y2 dx + 2xy dy. Пример 2. ω = s'mxdx Λ dy. Шаг 1. β*ω = s'm(tx)(xdt + tdx) Λ (ydt + tdy). Шаг 2. β*ω = xt sin tx dt /\dy — yt sin tx dt /\dx + члены, не содержащие dt. Шаг 3. Su> = (xdy — ydx) I isinfcr Jo = {xdy — у dx) dt sin χ — χ cos χ X2 sin χ — χ cos x\ , I sin χ — χ cos χ , dy - у ( 2 I dx или n . ι χ cos χ — sin χ \ , sin χ , οω = — cos χ dy + у \ = dx -\ dy. \ Xz J X Ответ отличается от «очевидной» первообразной — cos x dy на точную 1-форму , / у . \ χ cos χ — sin x , sin x d — sin x = χ у dx H dy. \x / xz χ Пример 3. β*ω = (у2 — x2)z dx Ady + (χ2 — z2)y dz /\dx + [z2 — y2)xdy Λ dz. Шаг 1. β*ω = t3(y2 - x2)z(xdt + tdx) A(ydt + t dy) + t3(x2 - z2)y{z dt + tdz) A{xdt + tdx) + t3(z2 - y2)x(y dt + tdy)A(zdt + tdz).
Резюме 805 Шаг 2. β*ω = t4(-(y2 - x2)zy + (χ2 - z2)yz) dt Λ dx + ((у2 - x2)zx - {ζ2 - y2)xz) dt Λ dy + (-(ж2 - z2)yx + O2 - y2)xy) dt Λ dz + члены, не содержащие dt. Шаг 3. Slo= ΐ4 dt{2x2yz - y3z - yzz) dx Jo + {2y2zx - xzz - xz33) dy + {2z2xy - xy3 - xzy) dz или 5ω = -{x2yzdx + y2zxdy + z2xydz). 5 Мы только что показали, что ядро S : Qk —> fife_1 является подпространством образа 5 : i)fe+1 —> Ω*\ На самом деле это весь образ. Предположим, например, что fc-форма удовлетворяет условию Su> = 0. Тогда, поскольку ω = Saw +dSu, мы знаем, что ω = Saw, т.е. что ω является образом S. Итак, Su = 0 тогда и только тогда, когда ω = Бф для некоторого ф. Резюме A. Внешняя алгебра и дифференциальное исчисление Вы должны уметь определять пространства Ak(V*) для произвольного n-мерного пространства V и записывать базис для каждого из них. Необходимо знать и уметь применять свойства оператора d для дифференциальных форм произвольной степени, включая процедуру переноса. B. Интегрирование дифференциальных форм Вы должны уметь вычислять интеграл от А;-формы по А;-ячейке, представленной в виде образа единичного А;-куба.
806 Глава 15. Комплексы в пространстве Ш' Вы должны знать, уметь доказывать и применять теорему Стокса. С. Дифференциальные формы и когомологии Вы должны знать, как строить коцепи посредством интегрирования дифференциальных форм; должны уметь находить формы, определяющие базисные элементы пространства Нк для 2-комплекса и 3-комплекса. Для данной дифференциальной fc-формы ф, удовлетворяющей условию άφ = 0 и определенной в звездной области, надо уметь строить (к — 1)-формы вф, обладающие свойством άβφ = φ. Задачи 15.1. (а) Пусть τ(νι, v2, V3) — кососимметричная трилинейная функция (т.е. 3-форма). Не обращаясь к свойствам определителей, докажите, что если vi, v2 и V3 линейно зависимы, то τ(νι,ν2,ν3) = 0. (b) Пусть ω1, ω2, ω3 — три элемента пространства V*. Не используя свойства определителей, докажите, что если ω1, ω2, ω3 линейно зависимы, τοω1Λω2Λω3 = 0. 15.2. Пусть в четырехмерном пространстве-времени дана 2-форма Ε = dt А (Ех dx + Eydy + Ez dz). Пусть В = Bz dx A dy - By dx A dz + Bx dy Adz. Вычислите Ε Α Β. 15.3. Предположим, что детерминант линейного преобразования А : W1 -» Мп имеет вид Det A = dx1 A dx2 Λ · · · Λ dxn[Aei, Ae2,..., Aen], где {dx1, dx2,..., dxn} дуальны {ei, e2,.. ■, en}. (a) Докажите, что если А — единичная матрица, то Det A = 1. (b) Докажите, что если А* обозначает матрицу, сопряженную к А, то DetA = A* dx1 A A* dx2 A ■■ ■ A A* dxn(e1,e2,... ,е„). 15.4. Вычислите следующие определители, используя результаты предыдущего упражнения:
Задачи 807 (а) Det = dx Ady Adz (b) Det 15.5. Пусть A3(V) обозначает пространство всех кососимметричных трилинейных функций из F χ Κ χ F в 1. Допустим, что V — четырехмерное пространство и пусть ε1, ε2, ε3, ε4 образуют базис дуального пространства V*. Используя обозначения Л, напишите базис Л3 (V) и напишите формулу, как базисный элемент действует на тройку векторов (vi, v2, V3). 15.6. Пусть ω = f dx + dy и т = gdx + dz, где / и д — дифференцируемые функции х, у и ζ. Вычислите ά(ω Λ τ), записав ответ как множитель при dx Ady Adz. 15.7. Пусть β обозначает дифференцируемое отображение из аффинного пространства А (размерности т) в пространство В (размерности п). Пусть r(q, w) — 1-форма в пространстве В, где q является точкой в этом пространстве, w — вектор, направленный из этой точки. Тогда dr можно определить как dr(q, wi, W2) = наилучшее линейное приближение к τ (Я + wi, w2) - r(q, w2) - r(q + w2, Wi) + r(q, Wi). Перенос 1-формы определяется следующим образом: (/FT)(g,v)=T(/3g,d/3(v)), а для 2-формы σ: (β*σ)(9, νι, ν2) = σ(β4, άβ(νχ), άβ(ν2)). (а) Воспользовавшись этими определениями (и при необходимости цепным правилом), докажите, что άβ*τ = β*{άτ).
808 Глава 15. Комплексы в пространстве Ж' (Ь) В пространстве А введите аффинные координаты и1, ..., ит, а в пространстве В — координаты х1, ..., хп. Тогда β можно задать с помощью дифференцируемых функций переноса ^ν = ^ν,···,θ, Fx2=F2(u1,...,um), P*xn = Fn(u\...,um), 3=1 где G* — дифференцируемые функции. Вычислите явно άβ*τ и β*(άτ) и покажите, что они равны. (с) Пусть τ и А — 1-формы. Покажите, что если Ω = τ Λ А, то β*Ω = (β*τ) A (/FA). 15.8. Сферические координаты г, θ, φ связаны с декартовыми координатами х, у и ζ формулами а*х = г sin#cos</>, а*у = гвтввтф, α* ζ = г cos θ, (Л где а — отображ;ение, переводящее точку Ι θ I в пространстве (Л сферических координат в точку I у I с координатами г, θ и ф. V/ Вычислите переносы следующих дифференциальных форм (т. е. выразите их в сферических координатах): (a) a*(xdy — ydx); χ dx + у dy + ζ dz (b) a (c) а (z2+y2 + z2)3 ' χ dy Λ dz + у dz Л dx + ζ dx Λ dy (x2 + y2 + Z2)3/2 (d) a* dx A dy A dz.
Задачи 809 15.9. (а) Пусть / —дифференцируемая функция в пространстве М3. Пусть А обозначает 2-форму £1 £ ίΐ £ Pi £ А — -^- dy A dz -\- -— dz A dx + -— dx A dy. ox ay oz Покажите, что dA = Δ/ dx A dy A dz, где Δ обозначает лапласиан д2/дх2 + д2/ду2 + d2/dz2. (b) Пусть Fx, Fy, Fz — дифференцируемые функции в пространстве М3, удовлетворяющие условию dF* + dFy + dF1 = Q дх ду dz Определим Покажите, что dB = AFX dy Adz + AFy dz Adx + AFZ dx Ady. 15.10. Тело вращения вокруг оси ζ ограничено: снизу — диском х2 + у2 < 1, ζ = 0; сбоку — поверхностью цилиндра х2 + у2 = 1, 0 < ζ < 2; сверху — параболоидом ζ = 1 + χ2 + у2, задаваемым параметрически в виде β*χ = rcos#, P*y = rsinO, β*ζ = 1 + Γ2. Если смотреть снаружи, то все поверхности ориентированы против часовой стрелки, как это показано на рис. 15.30. (a) Вычислите интеграл от 2-формы T — xdyAdz — ydxAdzno поверхности верхнего параболоида. (b) Вычислите интеграл от τ по поверхности цилиндра. (c) С помощью теоремы Стокса выразите объем этого твердого тела через только что полученные интегралы. 15.11. Пусть Ω = xdy A dz. (a) Вычислите / Ω по диску х2 + у2 < R2, ζ = 0. (b) Рассмотрите полусферу x2+y2+z2 = R2, ζ > 0, которую параметризуем сферическими координатами (см. рис. 15.31): ζ = RcosO, χ = R sin θ cos φ, у = Rs'mes'iiuf). Выразите Ω через R, θ и ф. Потом вычислите /Ω по этой полусфере.
810 Глава 15. Комплексы в пространстве Ш' Рис. 15.30 Рис. 15.31 15.12. 15.13. (с) Воспользуйтесь теоремой Стокса и запишите интеграл от 3-формы, который равняется разности двух поверхностных интегралов, вычисленных в пунктах (Ь) и (а). Выясните геометрический смысл этого интеграла и вычислите его. (a) Рассмотрите твердое тело с однородной плотностью р, которое занимает область Q в пространстве М3. Покажите, что интеграл от 2-формы τ = -{χ3 dy Adz — у3 dx A dz) ό по границе Q дает момент инерции Ιζζ этого твердого тела. (b) Придумайте 2-форму σ, интеграл от которой по dQ дает момент инерции 1ху. Почему ответ в этой задаче не единственный? (c) Используйте результат пункта (а) для вычисления момента инерции сферы радиуса а относительно ее диаметра. Воспользуйтесь сферическими координатами. (а) Пусть W обозначает область в пространстве М3, занятую твердым телом с однородной плотностью р. Покажите, что координата ζ центра масс этого тела ζ может быть определена как частное от двух поверхностных интегралов, вычисленных по границе тела dW, т. е. Jaw Δ pr dx A dy f Jaw ζ dx Λ dy, где r2 = x2 + y2 + z2.
Задачи 811 (b) Переход сферическим координатам дается формулами: а* х = г sin#cos(/>, а* у = г втввтф, α*ζ = г cos θ. Вычислите a*(dx Л dy). (c) Используя результат пункта (Ь), вычислите / -r2dxAdy JdW 2 для случая, когда W является внутренностью полусферы радиуса а с правосторонней ориентацией. 15.14. Пусть С обозначает половину цилиндра, ограниченного плоскостями ζ = 0 «низ», ζ = 1 «верх», плоскостью χ = 0 «плоскость» и боковой поверхностью х2 + у2 = а2 «кривая». С имеет правостороннюю ориентацию, так что вектора ех, е^, ez образуют правильно упорядоченный базис, как это показано на рис. 15.32. Для каждой грани С имеется упорядоченный базис, который определяет ее ориентацию. (a) Напишите выражение для дС, следя за знаками. (b) Имеется 2-форма τ = χ2 dy hdz — 2xz dx A dy. Вычислите перенос т при отображении, заданном следующим образом: β*χ = acosu, p*y = asinu, β*ζ = ν. Вычислите интеграл от τ по боковой поверхности «кривая». (c) Пусть задано отображение: α*χ = г cos θ, а*у = rsmO, α*ζ = 1. Вычислите интеграл от τ по поверхности «верх». (d) Чему равен интеграл от τ по другим двум поверхностям? Объясните. (e) Вычислите dr. Используя теорему Стокса, объясните, с помощью этого результата проверить ответы в пунктах (Ь), (с) и (d). 15.15. Рассмотрите 2-комплекс, изображенный на рис. 15.33. (a) Пусть W — 1-коцепь. Выразите 2-коцепь dW через W, т. е. выразите Js dW и Js dW через Wa и др. (b) Рассмотрите 1-форму ω = ydx + xdy = d(xy). Вычислите l-коцепь W, определенную интегрированием ω по ветвям. Проверьте, что dW = 0.
812 Глава 15. Комплексы в пространстве Μ Рис. 15.32 Рис. 15.33
Задачи 813 (с) Сделайте то же самое для 1-формы ω = (xdy — ydx)/r2. Покажите, что она определяет коцепь W, которая является коциклом, но не кограницей. Будет ли W коциклом, если 5з, внутренний круг, ограниченный α и ε, тоже включить в комплекс? 15.16. Единичный куб, изображенный на рис. 15.34, определяет 3-ком- плекс с шестью гранями: S1: х = 0, 0<y,z<l; S4: у = 1, 0 < у, ζ < 1; S2 : ι = 1, 0 < у, ζ < 1; S5 : ζ = 0, 0 < χ, у < 1; 53: у = 0, 0<ж, z<l; S6: ζ = 1, 0 < χ, у < 1. Каждая грань ориентирована против часовой стрелки, если смотреть на нее снаружи. Внутренняя область куба R имеет границу dR = S1 + S2 + S3 + S4 + S5 + S6. (a) Пусть Τ — произвольная 2-коцепь. Получите выражение для dT. (b) Имеется 2-форма τ = x2dy Adz + xydz Adx + xz dx A dy. Постройте соответствующую 2-коцепь Т, интегрируя т по каждой грани. Вычислите dr и постройте соответствующую 3-коцепь. Проверьте, что она равна dT. (c) Имеется 1-форма ω = x2ydz. Вычислите dw. Получите 1-коцепь W, соответствующую ω на ветвях α, β, у, δ, ε, η. Получите 2-коцепь Τ, соответствующую άω на гранях S2 Рис. 15.34
814 Глава 15. Комплексы в пространстве М.' и S3. Проверьте, что Т, полученная для S2 + 5з, равна W, полученной для границы S2 + S$. 15.17. (а) В пространстве М3 имеется 2-форма τ = adx Ady + bdx A dz + cdy A dz, где a, b, с — дифференцируемые функции χ, у, ζ. Пусть φ будет отображением из IR2 (координаты и, υ) в М3 (координаты х, у, ζ). Оно задано формулами ф*х = F(u,v), ф*у = G(u,v), φ* = Η (и, υ). Проделав вычисления в явном виде, проверьте, что ф* (dr) = ά(φ*τ). Конечно, придется использовать цепное правило. (Ь) Пусть vi и V2 вектора в пространстве М2. Тогда перенос ф*т определяется в виде φ*τ(νι, ν2) = r[d(/)(vi), άφ(ν2)] (имейте ввиду, что в каждой точке άφ представляется матрицей Якоби 3x2). Используя это определение и цепное правило, докажите, что φ*(άτ) = ά(φ*τ). 15.18. Используя оператор S, описанный в параграфе 15.4, сделайте следующее. (a) Найдите такую функцию f(x,y,z), чтобы df = yeyz dx + (χ + xyz)eyz dy + xy2eyz dz. (b) Найдите такую 1-форму ω, чтобы άω = xdy Adz + ydx A dz. (c) Найдите такую 2-форму т, чтобы dr = xy2z3 dx Ady A dz. 15.19. Пусть В = ζ2 dx A dy + yz dx A dz — xz dy A dz. (a) Пусть W — любая область в пространстве М3. Покажите, что / В = 0. Jaw (b) Найдите такую 1-форму А, чтобы dA = В.
Задачи 815 15.20. Рассмотрите 2-комплекс, изображенный на рис. 15.35. Он имеет четыре узла, пять ветвей и одну 2-ячейку S, заштрихованную на рисунке. Пусть xdy-ydx ω = άθ = ъ —. Χζ + jr Определите 1-цепь W, которая соответствует ω. Вычислите Wa, W@, W1, Ws, W£. Покажите, что W является коциклом, но не кограницей. Рис. 15.35 15.21. Пусть М1,3 обозначает четырехмерное пространство-время с упорядоченными аффинными координатами ί, χ, у, ζ. (a) Напишите базис для Л2(М1,3). (b) Рассмотрите 2-форму W = А(х, у, t) dt Л dx + В(х, у, t) dt Ady + С(х, у, t) dx Л dy. Если dW = 0, то какие отношения между частными производными А, В, С должны выполняться?
I I
Глава 16 Электростатика в пространстве R3 Глава 16 посвящена электростатике. Мы считаем, что диэлектрические свойства вакуума дают непрерывный аналог цепей с емкостями и что именно эти диэлектрические свойства определяют евклидову геометрию в трехмерном пространстве. В этой главе представлены основные положения теории потенциалов. 16.1. От дискретности к непрерывности Пусть А0 = Ω°(Μ3) обозначает пространство гладких функций в R3 (мы их считаем формами нулевой степени). Пусть, далее, А1 = ΩΧ(Μ3) обозначает пространство гладких линейных дифференциальных форм, А2 — пространство гладких форм второй степени, а Аг — пространство гладких форм третьей степени. Мы будем рассматривать Аг как зародыш коцепи степени г, т. е. если в пространстве R3 у нас есть комплекс, то каждая форма степени г в результате интегрирования определяет коцепь степени г. Таким образом г-формы определяют правила, приписывающие цепям соответствующие числа. На эту картину можно взглянуть и с другой стороны. Если мы фиксируем определенную цепь с степени г, то считаем, что с определяет линейную функцию на пространстве А1: каждой форме ω степени г мы приписываем
818 Глава 16. Электростатика в пространстве М3 число Jcio. Если есть две формы ω\, ω2 степени i, а а и 6 — вещественные числа, то из свойств операции интегрирования следует, что (αωχ + Ьи>2) = α ωι + b ω2; другими словами, интеграл fcu является линейной функцией формы ω. В качестве простейшей иллюстрации рассмотрим 0-цепь с. Пусть эта 0-цепь состоит из единственной точки Ρ G R3 с ориентацией +. В этом случае интегрирование сводится к простому вычислению: цепь с порождает линейную функцию на пространстве А0, которая каждой функции / G А0 приписывает значение f(P). Можно полагать, что f(P) является энергией, соответствующей такому распределению зарядов, когда в точке Ρ находится единичный заряд и создается потенциал /. Такая «обращенная» точка зрения, когда Ρ считается линейной функцией /, имеет определенные преимущества. Допустим, что мы хотим дискретное распределение зарядов, сконцентрированное в точке Р, заменить на «размазанное», или непрерывное распределение зарядов с плотностью р. Предполагается, что плотность ρ — гладкая функция с компактным носителем. (Последнее означает, что ρ обращается в нуль за пределами некоторого ограниченного множества.) Мы можем поступить следующим образом. Рассмотрим 3-форму (с компактным носителем) pdxAdyAdz. Каждую функцию / G А0 мы умножаем на ρ dx A dy A dz и получаем 3-форму fpdx A dy A dz, которая является 3-формой с компактным носителем в пространстве R3. Имея фиксированную ориентацию в R3, интегрируем эту 3-форму и получаем число. Таким образом, форма pdx A dy A dz определяет линейную функцию в пространстве А0. Эта линейная функция каждой / G А0 приписывает число /r3 fpdx Ady Adz. (Заметим, что если полный интеграл от функции ρ равен 1 и если ρ становится все более сконцентрированной вокруг точки Ρ — другими словами, если мы устремим непрерывное распределение зарядов к точечному вокруг Р, — то значение интеграла будет стремиться к f(P). Пусть А% обозначает пространство 3-форм с компактным носителем в пространстве R3. Мы уже показали, что каждая pdx Ady Adz G A% определяет
16.1. От дискретности к непрерывности 819 линейную функцию на пространстве А0. Тогда элемент пространства А$ оказывается размазанной О-цепью. На самом деле электрические заряды, как известно, дискретны. Но сейчас мы наметим, как можно аппроксимировать дискретное распределение непрерывным. Предположим, что есть плотно упакованное распределение небольших зарядов c(Pj). Тогда получаем линейную функцию _ · · /-Σ<*№) - .* # # Рис. 16.1 от функций. Эта линейная функция может быть хорошо аппроксимирована (для широкого класса функций /) размазанным распределением зарядов pdx /\dy Adz в том смысле, что fpdxAdyAdz \:р.?}*':. Рис. 16.2 близко к Введем непрерывные аппроксимации для 1-цепей, 2-цепей и т. д. Пусть Л 2 обозначает пространство гладких 2-форм с компактным носителем. Утверждается, что элемент Ω пространства А2 можно рассматривать как своего рода размазанную 1-цепь, т. е. что Ω определяет линейную функцию на пространстве А1. Чтобы это увидеть, рассмотрим ω (элемент пространства Л1) и образуем ω Ail. Это 3-форма с компактным носителем, которую можно интегрировать по пространству R3 и получить число. Другими слонами, Ω G ^2 определяет линейную функцию на пространстве А1, которая каждой ω приписывает число /R3 ω Λ Ω. Аналогично, если Αι обозначает пространство гладких 1-форм с компактным носителем, то каждый элемент пространства Αι определяет линейную функцию в пространстве А2 и может рассматриваться как размазанная 2-цепь. Если Aq обозначает пространство 0-форм (т. е. гладких функций) с компактным носителем, то каждый элемент Aq определяет линейную функцию в пространстве Л3 и может
820 Глава 16. Электростатика в пространстве М3 рассматриваться как размазанная 3-цепь. Итак суммируем полученные результаты: А спаривается с Аз, А спаривается с Дг, А спаривается с А\, А спаривается с Aq, в том смысле, что если ω G А1 и Ω £ Az-i, то мы получаем число /кз ω Λ Ω. Для фиксированной Ω это линейная функция ω, а для фиксированной ω это линейная функция Ω. Кроме того, это спаривание инвариантно относительно любого сохраняющего ориентацию взаимно-однозначного отображения φ пространства R3 на себя, имеющего дифференцируемое обратное. Если φ — именно такое отображение, то для любой 3-формы τ с компактным носителем из формулы замены переменных в интеграле получаем /rs Ф*т = /rs τ· С другой стороны, φ*(ωΛΩ) = φ*ω/\φ*Ω. Поэтому / φ*ω Л ф*П = / ω Λ Ω. Другими словами, спаривание инвариантно относительно сохраняющей ориентацию замены координат. 16.2. Граничный оператор Поскольку у нас есть отображение d : А1 —> Аг+1, то мы имеем также сопряженное отображение д, которое каждой линейной функции с на пространстве Аг+1 приписывает линейную функцию дс на пространстве Аг по формуле (дс)(и) = c(du). Это означает, что мы должны уметь найти такое отображение д из Д+1 в Ai, чтобы для любого σ G Α"+ι и любого ω G А1 было справедливо равенство / ω Ада = άω Λ σ. 7rs J-r3 Чтобы найти такой оператор д, заметим, что ά(ω Λ σ) = άω Λ σ + (—1)ιω Λ da
16.2. Граничный оператор 821 и по теореме Стокса (благодаря тому, что ωΑσ имеет компактный носитель, так что интегрирование по R можно заменить интегрированием по некоторой конечной области, на границе которой форма ω Ασ обращается в нуль) интеграл /R3 ά{ω Ι\σ) становится равным нулю. Тогда (-1)ί+1 / ωΑάσ = άω Ασ. Отсюда мы видим, что д= (-l)i+1d. Другими словами, д = — d в пространстве Aq, д = d в пространстве А\, д = — d в пространстве А2, д = d = О в пространстве А%. Таким образом, мы получили последовательность отображений А0 Л А1 Л А2 Л А3, л д ' л д . д . А3 «- А2 «- Αχ «- Aq, где д = (—l)l+ld в пространстве Αι+\. Иногда оператор д называют формальным транспонированием d. Причина для появления слова «формальный» состоит в том, что оператор д может быть выражен через d, и формула ω Ада = άω Ασ справедлива только тогда, когда интегрирование ведется по области, где границы не вносят вклада. Мы обеспечили это, проинтегрировав по всему пространству при условии, что σ имеет компактный носитель. Эта формула выполняется также, если ω имеет компактный носитель, т.е. мы считаем, что d является отображением из Ai в Д-+1, а д — отображением из А1 в Al+l. Таким образом, мы можем рассматривать формы с компактным носителем как фундаментальные объекты и считать, что отображение д определено на пространстве линейных функций Д·.
822 Глава 16. Электростатика в пространстве М3 16.3. Телесный угол В качестве иллюстрации вышеуказанной обращенной точки зрения, давайте проделаем ряд вычислений. Пусть дана точка Ρ в пространстве R3 с координатами хр, ур, ζ р. Пусть тр обозначает телесный угол, наблюдаемый из точки Р, определяемый 2-формой (х — хр) dy A dz — (у — ур) dx A dz + (ζ — zp) dx A dy τρ= . rp Здесь гр обозначает расстояние до точки Р. Форма тр определена не на всем пространстве R3, а только в пространстве R3 — {Р}, т.е. в трехмерном пространстве, из которого удалена точка Р. И тем не менее форма тр определяет линейную функцию в пространстве Αι. Действительно, пусть ω = adx + bdy+cdz обозначает линейную дифференциальную форму с гладкими коэффициентами и компактным носителем. Тогда ω Лтр = Гр [а(х — хр) + Ь(у — ур) + c{z — zp)] dx Ady A dz. Коэффициент dx Ady Adz не определен в точке Р, но особенность в Ρ порядка г ρ (поскольку в точке Ρ выражение в квадратных скобках имеет нуль первого порядка). Следовательно, при вычислении интеграла точка Ρ не создает проблем. Поскольку ω имеет компактный носитель, то интеграл по всему пространству определен корректно. Чтобы вычислить этот интеграл, удобно перейти к сферическим координатам с центром в точке Р. Если гр, θ, φ — такие координаты, то тр = sin θάθ Α άφ. (Таким образом, тр дает нам телесный угол, заметаемый поверхностью, по которой мы интегрируем, рис. 16.3.) Предположим, что в этих сферических координатах ω = F drp + GdQ + Η άφ. Тогда ω Α τρ = F sin θ drp Λ d6 Λ άφ. Итак, / ωΑτΡ= / sin 6^ / Ρ{τΡ,θ,φ)άτρ\άθάφ. Jm.3 Jo Jo {Jo J
16.3. Телесный угол 823 Рис. 16.3 Давайте рассмотрим случай, когда ω = du для некоторой гладкой функции и с компактным носителем. Тогда в предыдущей формуле в сферических координатах F = ди/дгр, и внутренний интеграл в правой части сводится к постоянному значению —и(Р), так что интегрирование по θ и φ сводится к умножению на площадь поверхности единичной сферы 4·7Γ. Таким образом, мы доказали базисную формулу J duArP = -4тга(Р). (16.1) Пусть δ ρ обозначает 0-цепь, которая каждой функции и приписывает значение и(Р), т. е. δ ρ представляет единичный заряд, сосредоточенный в точке Р.1 Тогда правая часть уравнения (16.1) есть значение 0-цепи на функции и, равное — Ίπδρ. А левая часть уравнения есть значение тр, вычисленное для du. Тогда уравнение (16.1) можно записать в виде дтР = -ШР. (16.2) (Заметим, что в предыдущем уравнении д нельзя приравнивать к d. Форма тр не определена в точке р, поэтому drp там тоже не определена. Во всех точках, где тр определена, мы имеем drp = 0. И тем не менее уравнение (16.2) справедливо как равенство 0- цепей, т. е. линейных функции от функций.) Предположим, что у нас есть конечное число точек Pi, P2, Pz и т. д. Заряд ci помещаем в Pi, C2 в Р2 и т. д. Значит, мы 1 Принято называть δ ρ дельта-функцией Дирака, сосредоточенной в точке Р. Она относится к так называемым обобщенным функциям, которые играют фундаментальную роль во многих задачах анализа и математической физики. — Прим. ред.
824 Глава 16. Электростатика в пространстве М3 рассматриваем 0-цепь Q = ci<Spi + С2<5р2 Η . Пусть D = ~{c1tPi + с2тр2 Η ). Тогда D корректно определяет линейную функцию в пространстве А\, и мы имеем формулу 3D = -4?rQ. Если вместо дискретного распределения конечного числа зарядов, нам дано распределение зарядов с гладкой функцией плотности р, имеющей компактный носитель, то предыдущее определение D через сумму заменяется на соответствующий интеграл, т. е. мы теперь пишем D = f р(Р)тр dP и Q = pdx Ady Adz, при этом выполняется предыдущее уравнение. В этом случае непрерывного распределения несложно показать (мы это сделаем очень скоро), что D — гладкая 2-форма, определенная во всем пространстве. 16.4. Напряженность электрического поля и электрическое смещение Сейчас мы уже можем дать определения фундаментальных понятий теории электростатики. Напряженность электрического поля Ε является линейной дифференциальной формой, проинтегрировав которую по любой трактории, мы получаем падение напряжения на ней. Величина Ε имеет физическую размерность напряжение/длину. (Поскольку размерностью напряжения является энергия/заряд, а размерностью силы является энергия/длину, то можно также считать, что Ε измеряет силу/заряд.) Основное уравнение, которому удовлетворяет Е, имеет вид dE = Q. Это уравнение локально эквивалентно существованию потенциала и, т. е. условию Ε = -du. (16.3)
16.4. Напряженность поля и электрическое смещение 825 Мы будем пользоваться этим уравнением для большинства рассматриваемых областей. Будем рассматривать Ε как зародыш 1-цепи, а и — как зародыш 0-цепи. Кроме того нам понадобится объект, представляющий размазанную 1-цепь. Это будет 2-форма D, называемая электрическим смещением. Она должна представлять размазанный вариант 1-цепи, дающей заряды ветвей. Мы также хотим иметь размазанный вариант 0-цепи, представляющей заряды узлов. Это будет 3-форма pdxAdy Adz. В нашей модели емкостной цепи мы имели ^(заряды вервей) = —заряды узлов. Поэтому мы ожидаем, что 3D = —pdx Ady A dz. Стандартное определение единиц измерения D и ρ (в системе СГС) таково, что это соотношение верно с точностью до множителя 47г: 3D = -4πράχ Ady Adz. (16.4) Это называется законом Гаусса. Вследствие теоремы Стокса и того, что для 2-форм выполняется условие д = —d, мы можем написать / D = 4тг pdx Ady Adz, JdW Jw что связывает интеграл от D по поверхности, ограничивающей область W, с полным зарядом внутри нее. Конечно, уравнение 3D = —4πρ dx Ady A dz не определяет D однозначно. Прибавление к D любой замкнутой формы не влияет на уравнение. Частично 2-форма D дает нам информацию об электростатической системе. В принципе она может быть измерена следующим образом. Напишем D = Dx dy A dz + Dy dz A dx + Dz dx A dy. Чтобы измерить Dz, поместим в исследуемую среду две небольшие параллельные плоскости ху металлические пластины
826 Глава 16. Электростатика в пространстве М3 (рис. 16.4). Соединим пластины вместе, а потом вновь разделим их. Пластины приобретут заряды ±Q. Тогда Dz 47Г lim площадь—»0 заряд верхней пластины (со стороны +ζ) площадь пластин (4π появляется за счет системы СГС.) Этот метод работает в любом диэлектрике, даже если мы не знаем его диэлектрическую проницаемость ε, и при этом нигде не упоминается электрическое поле. Δ +Q Ζ -Q ? Рис. 16.4 По существу это определение D можно обобщить и дать определение D, не связанное с системой координат. Для любой пары векторов vi и V2 образуем плоскопараллельный конденсатор (рис. 16.5), пластинами которого являются параллелограммы, построенные на векторах /ivi и /1V2. Тогда D(vi, V2) = 4·7Γ lim h—»0 заряд на верхней пластине ^2 ' Рис. 16.5
16.4. Напряженность поля и электрическое смещение 827 Какую пластину считать верхней, зависит от ориентации , поскольку ориентация изменяется при перестановке νχ и V2: £>(v2,vi) = -Ζ?(νι,ν2). Поскольку заряд аддитивен, то D — билинейная функция νχ и V2. Поэтому, по определению, D является 2-формой. Итак, мы обобщили топологические уравнения для сетей с емкостями на случай электростатики. v = dQ = -άΦ -ρ заменяется заменяется Е = dD = —du; —4πράχ Ady A dz. Если D — гладкая 2-форма, то dD = +Απρ dx Ady Adz. Сейчас мы должны вспомнить, что Ε может рассматриваться (при выборе, например, стандартной ориентации) как линейная функция от D, которая приписывает D число I EAD. Jw3 В этой формуле мы все еще считаем, что либо D, либо Ε имеет компактный носитель. Но по существу этот интеграл может быть определен для другой пары Ε и D, у которой произведение Ε А D достаточно быстро стремится к нулю на оо. Например, если произведение стремится к нулю как г-4 или быстрее, то интеграл сходится. Мы не должны забывать об этой возможности. Теперь у нас есть непрерывные размазанные версии топологической части нашей теории цепей с емкостями. Но нам еще надо иметь вариант матрицы С, удовлетворяющей соотношению Q = CV. Поэтому мы хотим иметь отображение D = C(E), определяющее электрическое смещение по напряженности поля. В следующем параграфе мы будем подробно изучать такое отображение С. Здесь мы получим ряд следствий из описанных ниже предположений относительно С. 2Очевидно, имеется в виду, что векторы vi, V2, w образуют положительно ориентированный базис Ж , если w направлен от нижней пластины к верхней. - Прим. ред.
828 Глава 16. Электростатика в пространстве М3 Вспомним, что в теории цепей отображение С было диагональной матрицей относительно напряжений ветвей. В частности, если на какой-то ветви напряжение равно нулю, то обращается в нуль и заряд этой ветви. В качестве слабой аналогии с этим условием предположим, что (a) отображение С локально в том смысле, что если Ε тождественно равно нулю внутри какой-то области, то D = С(Е) тоже там тождественно равно нулю. По аналогии с теорией цепей предположим, что (b) отображение С симметрично, т. е. если есть два электрических поля Е\ и Е2, то ί Е^С{Е2)= [е2лС(Е1). В следующем параграфе мы опишем отображение С с позиций его реальной физической интерпретации. Мы увидим, что существует тесная связь между отображением С для вакуума и геометрией Евклида. Во всех средах выполняются условия (а) и (Ь). А сейчас мы получим некоторые следствия из них. По определению, проводящий материал не оказывает сопротивления при движении электрического заряда. Другими словами, в проводнике форма Е, которая измеряет работу, выполненную при движении электрического заряда, должна обращаться в нуль. Тогда, используя свойство (а), мы видим, что Внутри любого проводника формы Ε и D должны обращаться в нуль. Следовательно, функция и должна быть постоянна на каждой системе соединенных проводящих тел. Так как внутри проводника D = 0, той р= 0. Поэтому внутри проводников не может быть электрических зарядов (в рамках электростатики). Или, говоря словами Фарадея, все заряды проводника располагаются на его поверхности.
16.4. Напряженность поля и электрическое смещение 829 Конечно, плотность этого поверхностного заряда определяется формой D. Полный заряд pi отдельного проводника получается интегрированием D по его поверхности. Давайте предположим, что заряды есть только на проводниках. Мы считаем, что вне проводников dD = 0. Тогда для двух потенциалов и и й с соответствующими D и D мы имеем d(uD) = duAD + udD = -ead вне проводников, так как там dD = 0. Тогда по теореме Стокса (Е,Ё) I EAD= I uD. /по области вне / по поверхностям проводников всех проводников На поверхности г-го проводника и принимает постоянное значение Фг. Тогда и можно вынести из поверхностного интеграла и получить (Е,Ё) = Σ фР- проводникам Это теорема взаимности Грина, рассмотренная в параграфе 13.8. Третье свойство отображения С состоит в том, что скалярное произведение (·, ·) положительно определено. Таким образом, если в предыдущем уравнении взять Ε = Ε, то получим (Е,Е)= Σ φΡ- проводникам Если заряды всех проводников равны нулю, то правая часть этого уравнения равна нулю. Вследствие положительной определенности это значит, что Ε = 0 и следовательно все потенциалы Φ равны. Если мы рассматриваем один проводник (скажем, воображаемый проводник на бесконечности) как заземленный, то заряды ρ определяют потенциал Φ единственным образом. Аналогично, потенциалы однозначно определяют заряды. Тогда мы имели бы отображение из пространства потенциалов всех проводников Φ на простанство зарядов всех проводников р, и это дало бы нам возможность использовать результаты главы 13.
830 Глава 16. Электростатика в пространстве М3 При этом предполагается, что для любого заданного распределения потенциалов Φ по различным проводникам мы можем получить соответствующие Ε и D (единственным образом). В этом вопросе взгляды математика и физика расходятся. С точки зрения математика поставлена интересная и нетривиальная задача Дирихле. Это вопрос теоремы существования в теории уравнений с частными производными. Решение ее потребовало огромных усилий многих талантливых математиков последней трети девятнадцатого века. В конце концов она была решена положительно с помощью различных методов, каждый из которых вызвал к жизни интересное математическое развитие, часто с важными следствиями в физике. Соответствующая проблема для более общих уравнений с частными производными более общего вида все еще активно исследуется. В следующих параграфах мы еще поговорим об этой математической проблеме, но ее подробное обсуждение не входит в задачу этой книги. С точки зрения физика вопрос о существовании не столь важен и относится к логической последовательности математической идеализации физической модели. Физик знает, что гипотеза о распределении статического заряда является лишь приближением к реальности. Если модель работает, т. е. если идеализация распределения статического заряда на поверхности проводника при постоянных потенциалах и соответствующих электрических полях дает разумное описание ситуации, то, конечно, теорема существования должна выполняться, потому что каждый проводник мы можем снабдить любым зарядом, каким захотим. Если же теорема существования нарушается, то либо потому, что математики придумали немыслимые проводники, которые нельзя построить на практике (или другие «физически бессмысленные» условия), либо потому, что есть фундаментальная ошибка в теории. Гораздо проще вывести логические следствия из предполагаемого существования решения и проверить на опыте, выполняются ли физические предсказания. Если они выполняются, то нарушения теоремы существования, вероятно, представляют что- то экзотическое и не имеет большого физического значения. В дальнейшем этот параграф излагается с физической точки зрения. Мы предполагаем существование решений для данного
16.4. Напряженность поля и электрическое смещение 831 распределения зарядов или напряжений на проводнике. Предположим также, что решения зависят от заданных граничных условий непрерывно. А теперь получим несколько важных заключений. Принцип электрической экранировки. Допустим, что некоторые из проводников, скажем, с первого по седьмой, полностью окружены другим — восьмым — проводником (рис. 16.6). Допустим, что на окруженных проводниках нет зарядов. Рассмотрим произвольное распределение зарядов на остальных проводниках. Тогда возникнет электрическое поле Ε = —du с соответствующим электрическим смещением D и потенциалами, индуцированными на всех проводниках. В результате действия зарядов восьмой проводник приобретет постоянный потенциал Ф&. Рис. 16.6 Априори мы не знаем, каковы индуцированные заряды и потенциалы на внутренних проводниках. Предположим, что мы рассматриваем новую функцию и' = и вне и и' = Ф% внутри полости восьмого проводника. Это является решением нашей задачи, причем внутри полости £ ξ β ξ 0, и на всех внутренних проводниках заряды нулевые. В силу единственности оно совпадает с исходным решением, потому что ни один заряд не попал на внутренние проводники, и то же самое было бы и при изменении потенциалов внешних проводников. Короче, внутренняя полость восьмого проводника экранирована от всей электростатической системы вне этого проводника. Этот принцип используется
832 Глава 16. Электростатика в пространстве М3 при создании электростатических измерительных инструментов, чтобы внешние электрические помехи не влияли на наблюдаемый эффект. (Если мы хотим иметь возможность видеть внутренность полости, то можно оставить маленькое отверстие или заменить часть проводника проволочной сеткой, которая экранирует почти так же хорошо, как и сплошной проводник.) Помимо практической важности, принцип электрического экранирования очень полезен при вычислениях, когда он применяется вместе со следующим принципом. Замена эквипотенциальной поверхности проводящим слоем. Предположим, что для некоторой системы зарядов или потенциалов у нас есть решение Ε = —du, D = СЕ. Пусть S обозначает поверхность, на которой потенциал и постоянен и равен Ф. (Тогда S называется эквипотенциальной поверхностью.) Допустим, что поверхность S заменили тонким проводящим слоем, на котором поддерживается потенциал Ф. Природа отображения С такова, что оно фактически не изменяется вставкой этого проводника. Поэтому вставка проводника практически не производит эффекта. Внутри этого тонкого проводящего слоя Ε и D обращаются в нуль, заряды аккумулируются на его двух поверхностях, но все остальное остается без изменения. Например, рассмотрим среду, инвариантную относительно вращений. Тогда потенциал заряда Q, помещенного в начало координат, должен иметь вид и = A f{r). (В следующем параграфе мы увидим, что если система инвариантна относительно всех евклидовых движений, то Пг) = ~г, где с — некоторая постоянная.) Теперь вставим тонкий проводящий сферический слой радиуса а. Поля внутри и вне этой сферы не изменятся, a D внутри обратится в нуль. Если внутри проводящего слоя сферы нарисовать еще одну сферу, то полный заряд внутри нее должен быть равен нулю. Таким образом, на внутренней поверхности проводящей сферы аккумулируется полный
16.4. Напряженность поля и электрическое смещение 833 заряд — Q (а на внешней — полный заряд Q). Мы можем теперь разрядить внутреннюю поверхность (с помощью провода, соединяющего заряд в начале координат и внутренней поверхности проводящей сферы). В силу принципа электрического экранирования, вне сферы ничего не произойдет, но потенциал внутри сферы станет постоянным. Таким образом, потенциал поля, создаваемого заряженной сферой, имеет вид: Qf(r), r>a, Qf(a), r <a, где /(г) обозначает потенциал единичного заряда, находящегося в начале координат. Этот метод позволяет нам вычислять поле и емкость сферического конденсатора, пластинами которого являются два концентрических заряженных проводника (рис. 16.7). Рис. 16.7 Давайте опять поместим заряд Q в начало координат, а затем окружим его двумя сферическими проводниками. Заряды соберутся на внутренних и внешних поверхностях проводящих сфер. Разрядим внутреннюю поверхность внутренней сферы, соединив ее проводом с началом координат. А внешнюю поверхность внешней сферы разрядим, заземлив ее. Поля внутри и вне обеих сфер обратятся в нуль. Функция и между двумя сферами остается без изменения, при этом остается заряд Q на внешней поверхности инутренней сферы и заряд — Q на внутренней поверхности внешней сферы.
834 Глава 16. Электростатика в пространстве М3 Рассмотрим еще один пример. Предположим, что заряд Q помещен в точку I 0 на оси х, а заряд — Q в точку (01. Тогда V о/ W получится потенциал Q(/(r+)-/(r_)), где г- и г+ обозначают расстояния до этих двух точек. При условии инвариантности относительно евклидовых преобразований /(г) = с/г. Эквипотенциальные поверхности в этой ситуации изображены на рис. 16.8. Рис. 16.8 Вдоль одной из эквипотенциальных поверхностей вставим проводящий слой. Поле с одной стороны этого проводника убираем, соединив его с зарядом —Q. Тогда мы получаем поле, создаваемое точечным зарядом Q и оставшейся заряженной поверхностью вставленного проводника (рис. 16.9). Например, если в качестве проводящей поверхности мы возьмем плоскость χ = 0 с нулевым потенциалом (рис. 16.10), то получим решение для задачи с точечным зарядом в присутствии заземленного плоского проводника. На поверхности проводника, обращенной к заряду Q, индуцируется заряд —Q. Поле с другой стороны проводника обращается в нуль, а поле со стороны заряда будет таким же, как если бы на другой стороне проводника (в симметричной точке)
16.4. Напряженность поля и электрическое смещение 835 Рис. 16.9 Рис. 16.10 Рис. 16.11 находился заряд — Q. Это один из примеров применения метода образов. И наконец, еще один пример, который мы используем позднее. Рассмотрим сферу радиуса R. Заряд Q поместим в точку /х\ 0 I . Пусть х' таково, что хх' = В?. Из подобных треугольников (рис. 16.11) следует, что для любой точки на поверхности сферы х' R 1 — = — или — R Гх> [ γί Jb Ι γ
836 Глава 16. Электростатика в пространстве М3 Поместив заряд —Q(R/x) в точку 0 , мы получаем, что W потенциал на сфере равен нулю. Это позволяет вычислить потенциал для точечного заряда, находящегося в любой точке внутри заземленной проводящей сферы. 16.5. Диэлектрическая проницаемость Рассмотрим задачу нахождения электростатического аналога отображения из С1 в С\, определяемого матрицей емкостей, т. е. отображения Q = CV. Вспоминаем, что матрица С диагоналъна, если в качестве базиса взяты ветви. Другими словами, вклад распределения зарядов в распределение напряжений в любой ветви локализован на этой ветви. Примем аналогичную гипотезу в электростатике: мы хотим получить такое линейное отображение Ε ι—> D, чтобы в любой точке значение D зависело от значения Ε в этой же точке. Другими словами, если Ε = Exdx + Eydy + Ez dz и D = Dx dy A dz + Dy dz A dx + Dz dx A dy (где коэффициенты Ех,..., Dz являются функциями), то соотношение между Ε и D определяется матрицей из функций е = (£ij). Тогда Де = εηΕχ + е\2Еу + ε\$Εζ, Dy = Е2\ЕХ + Е22Еу + E2zEz, Dz = ε$\Εχ + е^Еу + ε^Εζ. Каждый матричный элемент ец является функцией, и матрица ε = (ffjj) определяет диэлектрическую проницаемость среды. Связь между D и Ε можно записать в форме D = eE.
16.5. Звездный оператор в трехмерном пространстве 837 Теперь электростатические уравнения принимают вид Ε = —du, dD = — 4πρ dx A dy A dz и D = eE. Можно собрать эти уравнения вместе, введя оператор Лапласа (Δη) dz Ady Adz = -de du и получить уравнение Пуассона Аи — —4πρ. Чтобы продвинуться дальше, надо иметь больше информации относительно е. Для произвольной среды мы знаем только, что е — симметричная матрица. Причины те же, что и для матрицы С. Больше ничего сказать нельзя. Существуют, например, кристаллы под давлением, для которых е — переменная симметричная матрица. Среда называется однородной, если ε инвариантна относительно трансляций, и в этом случае она постоянна. Среда называется изотропной, если соотношение между Ε и D инвариантно относительно вращений. Далее мы рассмотрим однородные и изотропные среды и посмотрим, как выглядит е в этих случаях. 16.6. Звездный оператор в трехмерном евклидовом пространстве Начнем с линейного отображения • :Λ1(Μ3*)^Λ2(Μ*3), которое инвариантно относительно вращений. По определению *dx = dy Adz, *dy = dz A dx, •kdz = dx A dy.
838 Глава 16. Электростатика в пространстве И3 Далее нужно продолжить оператор по линейности, т. е. определить * : Л^М3*) -> Л2(М*3) правилом *(adx + bdy + cdz) = ady Adz + bdz Adx + cdx Ady. Пусть ω = adx + bdy + cdz и σ = Adx + Bdy + Cdz. Заметим, что *ω Α σ = (а А + ЪВ + cC) dx Ady A dz. Последнее уравнение запишем по-другому. Скалярное произведение в евклидовом пространстве R определяет скалярное произведение в R3* (в пространстве 1-форм) согласно формуле (ω, σ) =аА + ЬВ + сС. Скалярное произведение с учетом ориентации выделяет конкретную форму объема dx Ady A dz. Тогда последнее уравнение принимает вид *ω Ασ = (ω,σ)άχ Ady A dz. (16.5) Если немного подумать, то становится понятным, что это уравнение определяет отображение * единственным образом. Однако, справа в уравнении содержится только скалярное произведение и учитывается ориентация (как функция ω и σ). Любое вращение сохраняет и то, и другое. Следовательно, Оператор • инвариантен относительно вращений. Утверждается, что с точностью до скалярного множителя * является единственным отображением * : AX(R3*) —> Λ2(Μ*3), инвариантным относительно вращений. Таким образом, мы утверждаем, что если г : Л1(М3*) —> Л2(М*3) — другое отображение, инвариантное относительно вращений, то г = о* для некоторого скаляра о. Сначала отметим, что либо г = 0, либо г имеет
16.6. Звездный оператор в трехмерном пространстве 839 нулевое ядро. Действительно, ядро г является подпространством R3. Если г инвариантно относительно вращений, то это подпространство тоже должно быть инвариантно относительно вращений. Но в пространстве R3 нет подпространств, инвариантных относительно вращений, кроме тривиальных подпространств {0} и R3. Таким образом, или г = 0, или г является изоморфизмом. Если г = 0, то доказывать нечего. Если же г — изоморфизм, то рассмотрим отображение / = г-1*, / : R3* -> R3*. Согласно предположению, / инвариантно относительно вращений, т. е. для любого вращения R. Запишем Ιω = αω + Iaj, где Σ,ω перпендикулярно ω. Другими словами, разложим Ιω на компоненты вдоль и перпендикулярно ω. В силу вращательной инвариантности коэффициент о определяется формулой (Ιω, ω) = α\\ω\\ и не зависит от ω. Утверждается, что Llo = 0. Действительно, для любого вращения R мы должны иметь LRlo = RLlu. Выберем поворот R, который оставляет на месте ω, но является нетривиальным вращением в перпендикулярной ω плоскости. Тогда Ru> = ω, но RLlu φ Lu, если Lu φ 0. Значит, Lu = 0. Тогда Ιω = αω, или τω = α*ω, что и требовалось доказать. Таким образом, с точностью до скалярного множителя * — это единственное отображение из AX(R3*) в A2(R3*), инвариантное относительно вращений. (Стоит отметить и обратное утверждение. Оператор * однозначно определяет скалярное произведение (·,·), стоящее в правой части уравнения (16.5), следовательно, оператор * в пространстве R3* определяет скалярное произведение и ориентацию.)
840 Глава 16. Электростатика в пространстве И3 Пусть ω = adx + bdy + cdz — дифференциальная форма, т. е. мы считаем, что о, 6 и с — функции. Как и раньше, определим оператор * формулой •ω = ady Adz + bdz Adx + cdx A dy. Опять *ω Α τ = (ω, τ) dx Ady A dz, где ω и т — дифференциальные формы. Мы предположили, что работаем в однородной и изотропной среде. Это значит, что е = ε*, где ε — константа, называемая диэлектрической постоянной среды. Например, в вакууме е = εο*, где εο — константа. И обратно, поскольку оператор * из Л1(М3) в Л2(М3) детерминирует скалярное произведение, мы можем сказать, что диэлектрические свойства вакуума определяют евклидову геометрию пространства. В дальнейшем мы предполагаем, что единицы измерения Е, D и ε таковы, что ε поглощается оператором *. Тогда уравнения электростатики принимают вид Ε = -du, D = *Е, dD = Απράχ Ady Adz, откуда Au = —4πρ, где непосредственное вычисление показывает, что д2и д2и д2и дх2 ду2 dz2 Важно заметить, что оператор * не инвариантен относительно дифференцируемых отображений. Поэтому, вообще говоря, мы не имеем равенства φ*(*ω) = *φ*(ω).
16.6. Звездный оператор в трехмерном пространстве 841 Равенство будет только в случае, если φ является сохраняющим ориентацию евклидовым преобразованием. Тем не менее, мы можем вычислять оператор * в более общей системе координат, используя его определение. Например, мы хотим вычислить оператор * в сферических координатах, определяемых формулами г = ух2 + у2 + ζ2, θ = arctan(\/x2 + у2 /ζ), φ = arctan(y/x). Вычислим дифференциалы от этих функций и запишем их в базисе ах, dy, dz, а координаты для удобства выразим через г, θ и ф. Тогда получим dr = sin θ cos φ dx + sin θ sin фау + cos θ dz, άθ = - (cos 0 cos (^> dx + совввтфау — sm6 dz), r άφ = -(— βϊηφάχ + cos фау). rsmV Прямое вычисление с использованием ортонормированности dx, dy, dz показывает, что в каждой точке (г, Θ, ф) пространства R3* dr, άθ и άφ являются ортогональными элементами, и что (dr, dr) = 1, {άθ, άθ) = 4, (άφ, άφ) = l 2 Чтобы подвести итоги этих вычислений, заметим, что аг, г άθ, г sin θ άφ образуют ортонормированный базис пространства Л1(М3), следовательно, эти три дифференциала можно вычислять так же, как мы это делали с ах, ау и άζ. В результате получаем *аг = г2 sin θ άθ Λ άφ, • (г άθ) = —г sin θ аг Л άφ, • (r sin θ άφ) — гаг Л άθ. Воспользовавшись линейностью, мы можем затем вычислить *άθ или • άφ.
842 Глава 16. Электростатика в пространстве И3 16.7. Формулы Грина В этом параграфе мы распространим формулы Грина, выведенные в главе 13, на непрерывный случай. Пусть U обозначает ограниченную область в пространстве R3 с границей 0U, и две линейные дифференциальные формы Ε = Exdx + Eydy + Ezdz и F = Fxdx + Fy dy + Fz dz определены в U. Их скалярное произведение (Е, F)u вычисляется по формуле (E,F)u = f EA*F = f (ExFx+EyFy+EzFz)dxdydz = {F,E)V. Ju Ju Соответствующая электростатическая энергия равна -||ϋ7||^, где \\Е\\1 = (Ε, Ε)υ = Ι\ε2χ + ΕΙ + Ε2ζ) dx dy dz. Ju Предположим, что Ε = —du и F = —dv, где и и ν — гладкие функции. Тогда d(u*dv) = du Л * dv + ud*dv = du Л *dv + uAv dx Ady Л dz или du Л *dv = d(u*dv) — (uAv) dx Ady A dz. Соответственно (du, dv)u = du A *dv = / d(u*dv) — / uAv dx Ady A dz Ju Ju Ju и тогда (du,dv)u= / u-kdv — / uAvdxAdyAdz. Jdu Ju (16.6)
16.7. Формулы Грина 843 Это первая формула Грина. Поскольку (E,F)u = (F,E)u, в первой формуле Грина и η ν можно переставить, а потом из одной формулы вычесть другую. Тогда получим / {u-kdv — v*du) = / (uAv — vAu) dx Л dy Л dz. Jdu Ju (16.7) Это вторая формула Грина. Пусть точка Ρ лежит в области U, и дан маленький шарик Βε с радиусом ε и с центром в Р, который целиком находится в области U (рис. 16.12). Применим вторую формулу Грина к области U, из которой вынут шарик Βε. Граница этой области будет состоять из dU и 0Βε, с противоположной ориентацией. Возьмем тогда V = Г -1 Ρ ' dv dv = —, *dv = —τρ Αν = 0 для U - Βε Рис. 16.12 На поверхности дВе функция ν принимает постоянное значение ε-1. Тогда мы получаем *du\ игр Л + / игр + ε ди \ гР / JdBs 1 ' *du дВе &и , dx Ady Л dz. υ-Βε rP
844 Глава 16. Электростатика в пространстве И3 Согласно теореме Стокса, / irdu = / d-kdu, JdBc JdBs так что этот интеграл порядка ε . Следовательно, третий член слева стремится к нулю как О (ε2). Предполагается, что функция и дифференцируема, и поэтому и(х) = и(Р) + Ο(ε) на границе ΘΒε. Тогда мы можем заменить / игр на и(Р) I тр, JdBs JdBs с погрешностью порядка О (ε). Однако тр = 47Г, 'две т. е. равен площади сферы единичного радиуса. Устремив ε —> О, мы получаем и{Р) = — [ (игр + —) - — [ — dxdydz. (16.8) 4тг JQU V гР ) 4тг Ju г ρ 16.8. Гармонические функции Функция и называется гармонической, если Аи = 0. Для гармонических функций последний член в уравнении (16.8) обращается в нуль и мы имеем u{p) = iLiUTp+ *du rp (16.9) Это показывает, что гармоническая функция и внутри области определяется ее значением и значениями ее производных на границе. На самом деле мы докажем, что функция и определяется только своими значениями на границе dU. Давайте применим полученную формулу к шарику W с центром в точке Ρ (лежащим внутри U, см. рис. 16.13): и(Р) = — итР+ . 47Г JdW JdW Гр
16.8. Гармонические функции 845 Рис. 16.13 Величина г ρ постоянна на 0W, и по теореме Стокса / *du = / d-kdu = О, поскольку Аи = 0. Jew Jw Тогда и(Р) = -!- / итР. (16.10) 47Г Jaw Выражение справа — это просто среднее значение и по сфере dW. Итак, мы доказали следующее. Если и — гармоническая функция в некоторой области, то значение и в любой точке равно ее среднему значению по любой сфере с центром в этой точке, внутренняя область которой целиком находится внутри области. Отсюда можно получить несколько интересных следствий. Предположим, что вокруг точки хо имеется окрестность Z, такая, что u(x) < w(xo) во всех точках внутри Z. Пусть Sa — сфера с радиусом о, целиком лежащая в области Ζ и имеющая центр в точке хо. Тогда ^(х) < ti(xo) во всех точках Sa. А среднее значение и по сфере Sa меньше или равно и(хо). Предположим теперь, что есть некоторая точка у из Sa, где и(у) < u(xq). Тогда u(x) < w(xo) во всех точках χ вблизи у, и поэтому среднее от и по сфере Sa будет строго меньше u{xq). Но это невозможно. Тогда и(у) = и(хо) во всех точках сферы Sa.
846 Глава 16. Электростатика в пространстве М3 Рис. 16.14 Теперь предположим, что W — открытое и связное множество, т. е. допустим, что любые две точки области W могут быть соединены непрерывной кривой, целиком лежащей в W. Допустим также, что функция и достигает своего максимума в некоторой точке xq G W. Пусть у — любая другая точка W и пусть С — кривая, соединяющая точки хо и у. Вокруг каждой точки χ на кривой мы можем построить достаточно малый шарик с центром в точке х, целиком лежащий в W. В силу компактности С мы можем выбрать конечное число таких шариков, покрывающих С. Теперь молено утверждать следующее. Имеется конечное число сфер 5αι,..., Sak таких, что внутренняя часть всех сфер лежит целиком в W. Сфера 5αι имеет центр в точке хо, центр щ сферы Sai+1 лежит в Sai, а у G Sak (см. рис. 16.14). Но это значит, что ti(xo) = ti(xi) = ··· = u(xfe) = и(у). Другими словами, мы установили следующее. Пусть и — гармоническая функция в открытом связном множестве W. Предположим, что она достигает максимума в некоторой точке хо G W. Тогда и постоянна на множестве W. Отсюда непосредственно следует вывод3. Зназываемый (в том числе далее в этой главе) принципом максимума для гармонических функций. Вышедоказанная теорема о среднем и соответ> ственно принцип максимума справедливы для гармонических функций не только в Ж3, но и в пространстве Ж" любой размерности η > 2. — Прим. ред.
16.8. Гармонические функции 847 Пусть U — открытое связное множество и пусть U обозначает его замыкание, так что U = U U dU, где dU обозначает границу U. Предположим, что U ограничено. Тогда если и — функция, гармоническая в U и непрерывная на U, то либо •и(х) < max.yeQuu(y) для любого χ G U, либо и постоянна. Доказательство. Поскольку U замкнуто и ограничено, то оно компактно. Функция и непрерывна на U. Теорема из вещественного анализа говорит, что и должна достигать своего максимума в некоторой точке хо множества U. Если одной из таких точек будет хо G U, то из наших предыдущих результатов следует, что и постоянна. Если же и не постоянна, то хо £ dU, и мы доказали наше предположение. Отсюда можно получить еще один результат. Пусть U — открытое связное множество, а его замыкание U компактно. Пусть и η ν — функции, непрерывные на U и гармонические в U. Допустим, что и(у) = v(y) Для всех у е dU. Тогда и(х) = υ(χ) для всех χ G U. Доказательство. Функция и — ν гармоническая и обращается в нуль на границе dU. В силу предыдущего принципа и(х) — г/(х) < 0 для χ G U. Аналогично, υ(χ) — и(х) < 0, что и требовалось доказать. Другая формулировка последнего предложения: в области U гармоническая функция полностью определяется своими значениями на границе. В этом состоит теорема единственности: существует только одна гармоническая функция, определяемая своими граничными значениями. При этом возникает проблема: иерна ли соответствующая теорема существования? Эта проблема известна как задача Дирихле.
848 Глава 16. Электростатика в пространстве И3 16.9. Метод ортогональной проекции Давайте рассмотрим другое доказательство единственности решения задачи Дирихле для ограниченной области U. Воспользуемся первой формулой Грина (16.6) (du,dv)u = / u-kdv — I uAvdx Ady /\dz. JdU Ju Пусть С0 обозначает пространство всех дифференцируемых функций на U, а С® — его подпространство, состоящее из функций, тождественно равных нулю на границе dU. Пусть Η обозначает пространство гармонических функций υ в области U, которые непрерывны на U и удовлетворяют уравнению Αν = 0 в области U. Тогда, если и G Свнутр> то поскольку и = О на границе dU, мы имеем /. u-kdv = О для любой гладкой функции v. ди Если ν G Н, то uAv = 0 для любой функции и. Тогда если и G Свнутр и υ G Я, то (du, dv)u = 0. Другими словами, пространства dCgHyTp и dH ортогональны относительно (·,·)υ· В частности, предположим, что и — гармоническая функция, обращающаяся в нуль на границе. Тогда (du, du)u = 0. Однако {du>du)u=L{{E) +(l) +u) W<^- Это выражение обращается в нуль только при условии, что все частные производные и равны нулю в области U. Но тогда и должна быть постоянной, и поскольку и = 0 на границе dU, то и = 0. Таким образом, гармоническая функция, которая равна нулю на границе dU, должна быть равна нулю везде. Как и раньше, это доказывает единственность решения задачи Дирихле.
16.9. Метод ортогональной проекции 849 Пространства dC°, dH и так далее являются бесконечномерными векторными пространствами. В этой книге мы не занимались такими пространствами или проекционными операторами π в таких пространствах. Эта теория может быть разработана и, следуя Герману Вейлю, может быть доказан следующий принцип. Пространство dH является ортогональным дополнением dC®HyTp к dC°. Или другими словами, если Ε = dv и (Ε, du) = О для всех и G С^кутр, то Αν = 0 в области U. Поэтому, взяв любую функцию ф, мы можем разложить dip в сумму άφ = du + dv, где и е С°нутр и ν е Я. Другими словами, du = π dip, где π обозначает проекцию на компоненту аС^щтр, и dv = (1 — π) άφ. Теперь можно решить задачу Дирихле: для данной гладкой функции ф, определенной на dU, найти такую функцию ν, чтобы выполнялось уравнение Αν = О и ν = φ на границе dU. Решение. Выберем произвольную функцию ф, которая совпадает с φ на границе dU и определена во всей области U. Разложим άφ на слагаемые, как это показано выше. Тогда поскольку и обращается в нуль на границе dU, мы знаем, что ν совпадает с φ на границе dU и, следовательно, является искомым решением. Заметим, что поскольку (du, dv)u = 0, то ¥Φ\\2υ = \\άΑΐ + \\άν\\1, откуда следует, что ¥Ф\\Ъ > \\dv\\b· Таким образом, среди всех функций, значения которых совпадают с φ на границе, решение задачи Дирихле ν может характеризоваться как функция с наименьшим значением ||dv||^. Это так называемый принцип Дирихле. Если считать, что ^ll-Ellir — энергия электрического поля, то принцип Дирихле говорит, что решением задачи Дирихле является такая функция ν, у которой dv дает минимальную энергию, при условии, что на границе dU иыполняется равенство ν = ф.
850 Глава 16. Электростатика в пространстве И3 Мы не доказываем здесь, что решение задачи Дирихле существует для произвольных областей (доказательство можно найти в главе 12 книги Loomis and Sternberg). Тем не менее, мы покажем, как решается эта задача для областей определенного типа. Кроме того, мы выведем некоторые общие принципы электростатики. 16.10. Функции Грина Предположим, что в области U задача Дирихле может быть решена. Здесь мы получим для этой области U аналог той функции Грина, которая обсуждалась в главе 13 в дискретном случае. Для любой точки χ в пространстве R3 положим 47г||х — у|| Рассматривая К как функцию у (при фиксированном х), мы имеем *dK(x, ■) = — тх. 47Г Формулу (16.8) из параграфа 16.7 мы можем переписать через К в виде и(х) = / (u*dK(x,-) + K(x,-)*du)- [ K(x,-)AudV. JdU JU Теперь для заданного χ G U функция К(х, у) является дифференцируемой функцией у, когда у изменяется вдоль границы dU. По предположению мы можем найти такую функцию h(x, ·), гармоническую в области U и непрерывную на U, чтобы выполнялось условие /ι(χ, у) = —К(х,у) для всех у G dU. Далее, для фиксированного значения у функция h(x, у) является непрерывной функцией х. В соответствии с принципом максимума гармоническая функция h(x\,y) — /i(x2,y) достигает своего максимального значения на границе dU. Следовательно, |/i(xby) - h(x2,y)\ < max|K(xi,z) - A"(x2,z)|. ζ€σΐ/
16.10. Функции Грина 851 Также очевидно, что Κ(χ,ζ) равномерно непрерывна по χ для всех ζ G dU, пока χ находится на ограниченном снизу расстоянии от dU. Итак, мы построили такую функцию hu, для которой выполняются следующие условия: (i) функция /ц/(х,у) непрерывна по χ и у для х, у G U и дифференцируема по у в области U; (и) для каждого фиксированного значения χ выполняется уравнение Ay/ijy = 0, т. е. Д/цДх, ·) = 0; (Hi) Gt/(x,y) = #(х,у) + М*,У) = 0 для у G dU. Функция Gu называется функцией Грина области U. Предположим, что Gu существует, и давайте выясним ее свойства. В дальнейшем мы будем писать G вместо Gu, если ясно, о какой области U идет речь. Сначала покажем, что для χ G U и у £ U выполняется условие G(x,y) = G(y,x). Пусть Β^ε и Ву£ обозначают маленькие шарики вокруг точек χ и у. Применим вторую формулу Грина к функциям и = G(x, ·) и ν = G(y, ·), заменив область U на U — -ВХ;£ — Ву£. Поскольку обе функции гармонические в рассматриваемой области и обращаются в нуль на границе dU, мы получаем / G(x,.)*dG(y,-)+ / G(x,-)*dG(y,·) = [ G(y,-)*dG(x,.)+ / G(y,-)*dG(x,·)· Теперь покажем, что при ε —> 0 левая часть равенства стремится к G(x,у), а правая — к G(y, х). В силу симметрии достаточно установить это для левой части. Запишем / G(x,-)*dG(y,-)= / G(x,-)*dtf(y,-)+/ G(x,-)*dh. JdBy,s JdBy,s JdBy,s
852 Глава 16. Электростатика в пространстве И3 Первый член справа стремится к G(x, у), как и в параграфе 16.6, поскольку 4π*άΚ — это телесный угол из точки у. Второй член стремится к нулю, потому что G(x, ·) и h — гладкие функции в области -Ву,£. С другой стороны, / G(x,-)*dG(y,·) JdBx,E = [ tf(x,.)*dG(y,.)+ / fc(x,>dG(y,·). ΛθΒχ,ε JdB^z Так же, как и выше, второй член стремится к нулю. Первый член можно переписать в виде поскольку G(y, ·) — гармоническая функция в области Β^ε. Итак, мы доказали, что G(x,y) = G(y,x). Пусть и обозначает любую гладкую функцию в области U. Применим вторую формулу Грина к и и ν = G(x, ·) в области U — -Βχ,ε. Поскольку G(x, ·) = 0 на границе 0U, мы получим / u*dG(x, ·)— / u*dG(x, ·) + / G(x, -)*du JdU JdBxs JdBx^ = j G(x,-)Andx1A---Adxn. Ju Третий интеграл слева можно записать в виде / K(x,-)*du+ / h(x.,-)*du = Ύ—ί *du+ f h(yi,-Udu=-^-0(e2)+0(e2). Следовательно, он стремится к нулю. Тогда мы получим и(х) = / G(x, ^Audx1 Л··· Adxn+ / u*dG(x, ■). Ju JdU
16.11. Интегральная формула Пуассона 853 Это уравнение показывает, что если мы знаем, что существует решение задачи Пуассона AF = / с условием F = О на границе, то оно имеет вид F(x) = |G(x,y)/(y)dy. (16.11) Аналогично, если мы знаем, что существует гладкое решение задачи Дирихле Аи = О, и(х) = /(х) для χ G dU, то оно имеет вид (х) = / u*dG(x, ·). JdU (16.12) 16.11. Интегральная формула Пуассона Важно отметить, что эти формулы являются следствием существования функции Грина для U, т. е. они справедливы во всех случаях, когда мы можем найти такую функцию h, что (И) и (iii) выполняются. В качестве примера мы можем в явном виде построить функцию Грина для шара Br с радиусом R. Для простоты предположим, что начало координат находится в центре шара. Пусть для х^О точка х' обозначает ее образ при инверсии по отношению к сфере радиуса R, т. е. R2 χ = (см. рис. 16.11). Определим функцию Gr формулой 1 R 47rGR(x,y) = у — хц цх|| цу — х' —, если х^О, если χ = 0.
854 Глава 16. Электростатика в пространстве Ш3 Если χ G Br, to x' G Br и поэтому вторые слагаемые в правой части формулы являются непрерывными и гармоническими в Br. Нам надо просто проверить выполнение свойства (iii). Для ||у|| = R из подобных треугольников (или прямым вычислением) мы имеем R = jjy-x'll llvll v — "χΊΙ II II II·/ II следовательно, GR(x,y)=0 для ||у|| = Л. А это и есть свойство (iii). Итак мы проверили, что Gr является функцией Грина для шара с радиусом R. Чтобы применить нашу формулу к решению задачи Дирихле с помощью функции Грина, мы должны вычислить *cIGr на сфере радиуса R. Имеем 47T*dGR(x, ·) = тх - πν х -Σ£Ξ$,-&£ΞΪ»*«·- Но R Их 12 ||х|| ||у — х'||3 Д2||у — χ Итак, мы видим, что для ||у|| = R если ||у|| = R. 1 / llxll2 R? χ V R χ Л2- χ |2 R2- χ 5Д2 |2 Еу4^ :*rdr. ||у-х||ЗД2 Если мы подставим в наше решение задачи Дирихле (х) = / w(y)*dG(x,y), JdU
16.11. Интегральная формула Пуассона 855 то получим Д2 _ „„„2 isR Г В? - llxll2 4™(х) = L llv-xl|3i?2^y)*rdr· Однако на сфере радиуса R форма *rdr просто равна RuSr, где cISr — элемент площади сферы радиуса R. Подставив это в последнюю формулу, получаем интегральную формулу Пуассона: u(x) = -—=— / τ. rrodbR (16.13) 4тгЛ JSn у - χ 3 При выводе формулы (16.13) мы воспользовались предположением, что функция и дифференцируема в некоторой окрестности шара Br, и что она гармоническая для ||х|| < R. На самом деле нам было достаточно предположить, что и — дифференцируемая и гармоническая при ||х|| < R и что она непрерывна на замкнутом шаре ||х|| < R. По существу, формула (16.13) для любого ||х|| < R останется верной, если заменить R на Ra, где χ < Ra < R. Если затем Ra устремить к R, то формула (16.13) восстанавливается в первоначальном виде в силу предположения о непрерывности функции и. Формула (16.13) дает решение задачи Дирихле для шара при условии, что мы знаем, что такое решение существует, т. е. если и — произвольная гармоническая функция на открытом шаре и непрерывная на замкнутом, то она удовлетворяет уравнению (16.13). А сейчас покажем, что (16.13) действительно является решением задачи Дирихле для заданных граничных значений. Предположим, что нам дана непрерывная функция и, определенная на сфере Sr. Тогда нам дана и(у) для всех у е Sr. Пусть уравнение (16.13) определяет п(х) для ||х|| < R. Мы должны показать, что (a) и гармоническая в области ||х|| < R, (b) u(x) -> и{уо), если χ -> у0 и ||у||0 = R. Чтобы доказать (а), заметим, что Gfi(x,y) — дифференцируемая функция χ и у в области ||х|| < R\ < R, R\ < ||y|| < R?/R\.
856 Глава 16. Электростатика в пространстве И3 Кроме того, по построению она — гармоническая функция от у. Для ||х|| < R и ||у|| < R мы знаем, что <3д(х,у) = GR(y,x). Тогда для фиксированного у, при условии ||у|| < R, функция Gr(-,y) гармоническая в области Br — {у}. Устремив ||у|| —> R, мы видим, что Gr(x, у) — гармоническая функция χ для ||х|| < i?i < R и любого фиксированного у G Sr. Таким образом, dG R{~x.,y) f дуг — гармоническая функция χ для любого у G Sr. Другими словами, все коэффициенты *сЮя(-,у) являются гармоническими функциями χ для каждого у Ε Sr. Это же можно сказать и о всех коэффициентах u(y)*dGR(-,y). Следовательно, функция u(x) = Js u*cIGr(x.,·) является гармонической функцией х, поскольку интеграл сходится равномерно при ||х|| < Ri < R (так же, как и все интегралы от различных производных по х). Это доказывает (а). Для доказательства (Ь) сначала отметим, что тождественная единица является гармонической функцией везде, поэтому к ней применимо уравнение (16.13). Тогда получаем д2-||х||2 [ dsR (ΛαΛΛχ ~— / τι пт — 1 Для любого χ < it. (16.14) 4тгд JSr ||у - х||3 rt y ' Пусть уо обозначает точку на сфере Sr и пусть и — непрерывная функция на этой сфере. Для любого ε > О мы можем найти такое δ > О, что Ку) -и(у0)\ < ε при ||у-уо||<25, у е SR. Пусть Zi = {y eSR: ||у-уо|| >2δ} и Ζ2 = {у eSR: ||у-у0|| < 26}. Тогда в силу (16.13) и (16.14) для ||х|| < R мы имеем / \ / \ #2-ΙΙχΙΙ2 [ и(у)-«(уо) ,0 tt(x) - tt(yo) = —1ГБ— / -^—;л?г^ dSR. Поэтому ^R JSr Ну - χ||3 \и (х)-и(уо)| <h+h,
16.11. Интегральная формула Пуассона 857 гДе h = „_"„ " / L-тг тпг^ dSR J ζ, R2 - Ι|χ||2 f |t*(y)-u(yo)l 4тгД 7Zl ||y - x|| -/2 = ТЪ— / —Π in— dbR- ^R Jz2 \\y - χ||3 Если ||yo — x|| < δ, то для всех у G Z\ мы имеем ||у — х|| > ||У — УОII — ||х — Уо||) так что ||у — х|| > δ. Итак, для всех х, удовлетворяющих условию ||х—уо|| < δ, интеграл в 1\ равномерно ограничен. Поскольку ||х|| —> R при χ —> уо, мы приходим к выводу, что 1\ —> 0 при χ —> уо. Займемся теперь /г- Мы знаем, что \и(у) — и(уо)\ < ε для всех у G /?2, так что Ι < Д2 - ||х||2 Г edSR = <_#-||χ||2 /■ dSR 2 4ттД Jz2 ||y - χ||3 ε 4ттД У5л ||у - х||3 в силу (16.14). Таким образом, мы доказали (Ь). Итак, доказана Теорема. Пусть и — непрерывная функция, определенная на сфере Sr. Существует единственная непрерывная на ограниченном ею шаре ||х|| < R функция, которая совпадает с данной функцией на сфере Sr и является гармонической в области ||х|| < R и. Эта функция определяется для всех ||х|| < R уравнением (16.13). Мы затратили изрядное количество усилий на подробное доказательство существования решения задачи Дирихле в простом случае сферы. Детали доказательств для более сложных областей мы приводить не будем. Дадим только идею одного метода, подробности которого при желании можно восстановить. Давайте аппроксимируем евклидово пространство сетью. В конце каждого вектора ν, координаты которого являются двоичными дробями со знаменателем 2^, поместим узел. Вектора ν имеют вид где k,l,m — целые числа.
858 Глава 16. Электростатика в пространстве М3 Здесь N — фиксированное большое целое число. Каждый узел соединим с шестью ближайшими соседями (рис. 16.15); тогда все пространство разделится на кубические ячейки. Каждой ветви присвоим емкость 2^, а через Ддг обозначим оператор Лапласа для этой сети. Легко видеть, что для любой дважды дифференцируемой функции и Ддги —> Аи при N —> оо. -· · ·■ Рис. 16.15 Если нам дана ограниченная область U с границей dU, то можно рассмотреть конечную подсеть, состоящую из всех узлов в области U и всех ветвей, соединяющих эти узлы. Узлы, расположенные ближе всего к границе, назовем граничными узлами. Используя наши результаты для конечных цепей, мы можем решить задачу Дирихле для такого конечного приближения. Зададим непрерывную функцию φ на границе dU. Можно приписать значения φ ν на граничных узлах нашего конечного приближения, взяв фм(п) = ф(х), где χ — это ближайшая к узлу η точка на границе. (Если таких ближайших точек несколько, то выбираем одну из них.) Таким образом, непрерывную задачу Дирихле мы аппроксимировали дискретной конечной задачей, которую умеем решать. При N —> оо мы ожидаем, что последовательность решений Un будет сходиться к функции и (определенной для всех двоично-рациоанльных векторов и продолженной по непрерывности), которая дает решение исходной задачи Дирихле. Этот метод доказательства работает, если форма границы не слишком «дикая». Само доказательство требует аккуратных оценок, что находится за рамками этой книги.
Резюме 859 Резюме A. Электростатика и дифференциальные формы Вы должны уметь формулировать законы электростатики в терминах дифференциальных форм D и Е. Вы должны знать формулы Грина, уметь их доказывать и применять в задачах электростатики в пространстве R3. B. Звездный оператор в пространстве R3 Для данной дифференциальной формы ω в пространстве R3, записанной в координатах, дифференциалы которых взаимно ортогональны, надо уметь строить ортогональный базис и с его помощью строить *ω. Вы должны уметь понимать связь между электростатикой в пространстве R и теорией цепей с емкостями, а также уметь объяснить, как звездный оператор играет ту же роль, что и матрица емкостей. Задачи 16.1. Пусть D = то = (xdy Adz + ydz A dx + zdx A dy)/r3, где r2 = x2 + y2 + z2. Эта формула дает электрическое смещение в случае единичного положительного заряда, находящегося в начале координат. (a) Вычислите JR D, где i?i — диск ζ = ζο, χ2 + у2 < а2. (b) Вычислите JR , где i?2 — боковая поверхность цилиндра —ζο < ζ < ζο, χ2 + у2 = а2. (c) Используя результаты (а) и (Ь), проверьте, что JR D = 4π, где i?3 — цилиндр с боковой поверхностью i?2 и двумя дисками i?i снизу и сверху. 16.2. Дана 1-форма А = Axdx + Aydy+ Az dz. Величины Ax, Ay и Az являются функциями х, у, ζ. Используя линейный оператор •, удовлетворяющий условиям ■kdx = dy A dz, -kdy = dz A dx, *dz = dx A dy, ■kdy Adz = dx, -k dz A dx = dy, -kdx A dy = dz, •k 1 = dx A dy A dz, -kdx A dy A dz = 1, вычислите следующее:
860 Глава 16. Электростатика в пространстве Ш3 (a) *dA; (b) как А; (c) -kd-kdA; (d) * d-kdf, где f(x, у, ζ) — скалярное поле; (e) * (А А В), где А и В — 1-формы; (f) * (А А -к В), где Л и В — 1-формы. 16.3. Сферические координаты г, θ и φ определены формулами χ = г sin θ cos φ, у = ί sin 0 sinc/i, z = rcos#. (a) Выразите οία;, dy, dz, dy A dz, dz A dx, dx Ady dx A dy A dz в сферических координатах (т. е. используя формулы замены координат, сделайте перенос этих дифференциальных форм). (b) Звездный оператор, определенный в упражнении 16.2, является линейным преобразованием, которое задано его действием в базисе dx, dy, dz, dy A dz, ... Вычислите этот оператор в сферических координатах, т. е. выразите каг, кав и * άφ через άθ Α άφ, άφ Adr и dr Α άθ. Выразите *(άθ Α άφ), *(άφ A dr) и k(dr Α άθ) через dr, άθ, άφ. (c) Выразите через сферические координаты 2-форму та из упражнения 16.1 и покажите, что она равна -ка(1/г). 16.4. Если и обозначает электрический потенциал в пространстве К3, то его лапласиан Аи можно записать в виде Аи ах А ау А ах = акай. (a) Считая, что и является функцией х, у и ζ, проверьте, что д2и д2и д2и дх2 ду2 dz2' (b) Считая, что и является функцией г, θ и ф, получите формулу для Аи через частные производные и по г, θ и ф. 16.5. Рассмотрите 2-форму D, которая в сферических координатах имеет вид D = г3(1 - г) sin θ άθ Α άφ (г < 1), D = 0 (г > 1). (а) Проверьте, что если Ε = г(1 - г)аг для г < 1, то D = -кЕ. (Заметим, что ar A kar = ax A ay A dz.)
Задачи 861 (b) Найдите такую потенциальную функцию и, для которой Ε = —du. Вычислите 3D (которая равна —dD). Проверьте, что JD Ε = — JQD и, как это утверждается теоремой Стокса. (Вспомните, что JDE = JR3 Ε Λ D.) 16.6. Дифференциальная форма, представляющая D для единичного положительного заряда, может быть выражена в сферических координатах в виде τ = sin θάθ Λάφ. (a) Вычислите Js τ, где S — сфера χ2 + у2 + ζ2 = 1. (b) Покажите, что dr = 0. (c) Используя теорему Стокса, объясните, почему не может существовать 1-форма ω, определенная во всем пространстве М3, за исключением, может быть, начала координат, для которой duj = т. (d) Найдите 1-форму ω, определенную первом октанте пространства М3 (где χ > 0, у > 0, ζ > 0), для которой τ = άω. При этом для нахождения соответствующей ω можно пользоваться сферическими координатами, но потом выразите ω в декартовых координатах х, у, ζ. 16.7. Пусть и(г, Θ) — гладкая функция в пространстве М2 с компактным носителем. Вычислите / χ du — ij dx / duAw, где ω = άθ = —%,—?——. Jr? χ + У2 (Поскольку ω не определена в начале координат, сначала надо интегрировать по области вне диска с радиусом ε и центром в начале координат, а потом взять предел при ε —» 0.) 16.8. Пусть φ обозначает поворот в пространстве М3, так что φ представляется матрицей А, для которой ААг = I и Det A = +1. Дана 1-форма ω = Fxdx + Fydy + Fz dz. Докажите, что в этом случае *(φ*ω) = φ*(*ω). 16.9. Рассмотрите пять функций vi = г2, υ2 = г2 cos2 θ(= ζ2), υ3 = r4, v4 = r4 cos2 θ(= r2ζ2), и5 = г4 cos4 θ(= ζ4). Они определяют пятимерное векторное пространство, которое обозначим С0.
862 Глава 16. Электростатика в пространстве М3 (a) Для каждой из этих пяти функций вычислите dv, *dv и Αν. (b) Вычислите все скалярные произведения типа (dvi,dv2)u, считая, что U — единичный шар г < 1. (c) Найдите базис двумерного пространства Η подпространства С0, которое состоит из функций, удовлетворяющих условию Αυ = 0. (d) Постройте матрицу I — π, которая является ортогональной проекцией dC° на dH. Выпишите также матрицу π. (e) Используя матрицу I — π, найдите функцию и, удовлетворяющую условию Аи = 0 и равную cos4 θ + cos2 θ на сфере г = 1. (Задача Дирихле.) (f) С помощью π найдите функцию ф, которая удовлетворяет уравнению Аф = 5г2 — 4r2 cos2 θ + 1 и обращается на единичной сфере в нуль. (Решение уравнения Пуассона.)
Глава 17 Токи, потоки и магнитостатика В этой главе мы продолжаем изучение внешнего дифференциального исчисления. Здесь рассматриваются потоки и векторные поля, внутренние произведения и производные Ли. Все это прилагается к задачам магнитостатики. 17.1. Токи На первый взгляд кажется, что молено сразу же дать непрерывный вариант описания цепей с сопротивлениями. Все, что надо сделать, — это лишь немного изменить то, что уже обсуждалось в предыдущей главе. Мы сохраняем форму Ε и уравнение Ε = —du, но энергию заменяем мощностью. Электростатическую 2-форму D заменяем на 2-форму J, которая должна представлять размазанный вариант токов, текущих по ветвям. У нас есть спаривание между током J и электрическим полем Е: ί EAJ, что измеряется в единицах мощности. Согласно первому закону Кирхгофа, ΘΙ = 0. Поэтому соответствующий размазанный вариант имеет вид dJ = Q или, поскольку д = —d, dJ = 0.
864 Глава 17. Токи, потоки и магнитостатика Вместо соотношения D = ε*Ε для изотропной электростатической среды мы имеем J = σ*Ε, где σ называется проводимостью. Если мы теперь введем величину г = l/σ, называемую удельным электрическим сопротивлением, то предыдущее уравнение принимает вид Ε = г*'1 J, что является размазанным вариантом закона Ома V = Ы. Теперь надо остановиться и понять, что же представляет собой форма J. Рассмотрим некоторую поверхность S. Что означает Js J? Пусть мы имеем конечную цепь, и поверхность пересекает ветви а, /3 и 7, ориентация которых показана на рис. 17.1. Тогда, принимая во внимание эти ориентации, молено считать, что S определяет коцепь, приписывающую каждому току I число 1а — Ιβ + ΙΊ· В общем случае S определяет коцепь, приписывающую каждому току I полный ток, протекающий через поверхность S с учетом соответствующей ориентации. Таким образом, в размазанном варианте молено считать, что fs J представляет собой ток, протекающий через поверхность S. Если мы представляем ток как движущиеся заряды, то Js J оказывается скоростью переноса зарядов через поверхность S. Рис. 17.1
17.2. Потоки и векторные поля 865 Если S — замкнутая поверхность, т. е. S = dU, то мы имеем [ J = [ dJ = 0. Js Ju Это значит, что полная скорость переноса заряда через поверхность S равна нулю, и заряд внутри нее не накапливается, что полностью согласуется с первым законом Кирхгофа, который мы обсуждали раньше. Значит, все прекрасно работает. Существует, однако, геометрическая интерпретация, которая требует дополнительного объяснения. Мы знаем, что на самом деле ток создается движущимися электронами. Каждый электрон, будучи точечной частицей, движется вдоль некоторой кривой. Тогда форма J, проинтегрированная1 по поверхности S, на самом деле считает число электронов, пересекающих поверхность S (в любом направлении) в единицу времени. У нас должен быть геометрический объект, непосредственно связанный с семейством траекторий отдельных электронов, который описывает их движение и из которого мы можем восстановить 2-форму J. В дальнейшем мы увидим, что таким объектом является векторное поле. 17.2. Потоки и векторные поля В этом параграфе, чтобы избежать нагромождения индексов, мы в основном будем работать в пространстве R3. Однако, тот факт, что это пространство имеет три измерения, нам нигде не потребуется. Поэтому все выводы и формулы будут справедливы для пространств любого числа измерений. Пусть U обозначает открытую область в пространстве Rfe и пусть I — некоторый интервал в R, содержащий начало координат. Кроме того, пусть φ : I x U —> Rfe — дифференцируемое отображение. Момент времени будем обозначать t G /. Тогда мы можем рассматривать φ двумя способами. Выберем точку ρ е U. Тогда отображение </>(·, р) : t -> 0(t, p) Здесь имеется в виду абсолютный, или неориентированный, интеграл (первого рода). Его значение неотрицательно. — Прим. ред.
866 Глава 17. Токи, потоки и магнитостатика определяет кривую в R . Конечно, каждой точке ρ соответствует своя кривая. Рассмотрим касательный вектор <^>'(ΐ,ρ) = (ά/άί)φ(ί,ρ). С другой стороны, для каждого момента времени t мы можем рассмотреть отображение φι : U —> R , заданное формулой <Мр) = 0(*,р)· Предположим, что т. е. что Фо = id, 0(0, ρ) для всех точек р. Тогда для каждой точки ρ касательная ф'(0, р) к кривой ф(-,р) является касательным вектором в этой точке р. Итак, мы получили правило, согласно которому каждой точке ρ в области U ставится в соответствие касательный вектор в этой точке. Это правило называется векторным полем в области U (рис. 17.2). Векторное поле будем обозначать ξ. Итак, £(р) является касательным вектором в точке р. Рис. 17.2 Для произвольной точки ρ предположение фо = id означает, что άφο = id, т.е. а(фг)р несингулярна для достаточно малых значений t. По теореме о неявной функции фг оказывается взаимно-однозначной функцией с дифференцируемой обратной в некоторой окрестности точки р. Чтобы избежать нагромождения обозначений, предположим, что φί : U —> R имеет дифференцируемое обратное во всей области U. Выберем момент времени
17.2. Потоки и векторные поля 867 s G I. Тогда определим Фг = <t>t°<t>71- Тогда i/>t обладает всеми свойствами фг и при этом ips = id. Итак, для каждого момента времени s G / мы получаем векторное поле £s. Значит, мы показали, что при данном φ : I x U —> Rfe, получается однопараметрическое семейство векторных полей £s. Для каждой точки ρ G U существует некоторая окрестность W вокруг ρ и некоторая окрестность К вокруг 0, так что £s является векторным полем, определенным в W. Пример, (а) Зададим вектор w. Пусть ф{р, ρ) = ρ + tw. Тогда φ'(0, ρ) = w для всех р. Кроме того, Фг°Ф71(Р) = &(p-sw) = Ρ + (* - s)w = ^i-s(w), следовательно, ξ3(ρ) = w для всех ν и s. (b) Пусть задана матрица А. Определим φ(ί,ρ) = etAp. Тогда ф'(0,р) = Ар. Кроме того, фь°Ф71{р) = еЫ(е-Ар) = е^лр = Фг-в(р) и, следовательно, £«(р) = Ар для всех s.
868 Глава 17. Токи, потоки и магнитостатика В этом случае векторное поле каждой точке ρ ставит в соответствие вектор Ар. Заметим, что в обоих примерах векторное поле £s не зависит от s. Это является следствием тождества Фг ° Ф71 = Фг-s или, заменив s на —s, тождества Φι+s = Фг°Фз- Отображение ф, удовлетворяющее этому тождеству всюду, где определены обе части, называется (стационарным) потоком. В случае Фг(и) = U и / = R мы говорим об однопараметрической группе преобразований области U. Итак, для потоков мы получили фиксированное векторное поле ζ = ζ3 для всех s. Давайте сначала рассмотрим линейное векторное поле *(Р) = АР, где А — заданная матрица. Тогда, опираясь на результаты главы 3, мы знаем, что молено построить etA и потом определить φ по формуле 0(t,p) = eMp. Итак, мы получили теорему существования для обычных дифференциальных уравнений. Начав с ξ, мы получили ф. Соответствующая теорема справедлива и в общем случае. Пусть векторное поле £s зависит гладко от s G / и ρ G U. Тогда для каждой точки ρ существует окрестность W Э ρ в пространстве R и окрестность К нуля в R такие, что отображение φ : К х W —> Rfe, фа = id гладкое, а зависящие от s векторные поля, определяемые ф, точно совпадают с £s. Если же £s = ζ (m. е. не зависит от s), то φ удовлетворяет тождеству Фз+k = Фз°Фг всюду, где определены обе части.
17.2. Потоки и векторные поля 869 Доказать эту теорему несложно. Это делается методом последовательных приближений. Здесь мы не будем приводить это доказательство. Оно стандартно, и его можно найти в любом учебнике по теории обыкновенных дифференциальных уравнений, в частности, в главе б книги Loomis and Sternberg. Предположим, что имеются векторное поле ξ и дифференцируемая функция /. В каждой точке ρ мы можем построить производную по направлению: -Οξ(ρ)/· Тогда получается новая функция, которая каждой точке ρ приписывает значение D^^f. Например, предположим, что в пространстве R3 имеется векторное поле ш\ *(Р) = Ь(Р) . Vc(p)/ где а, Ь и с — функции. Тогда %р)/ = «(р)^(р)+6(рфр) + с(р)|{(р)· Или, в сокращенном виде, df ,df df ox oy oz Поэтому в дальнейшем мы будем писать _9_ J д_ дх ду dz В этих обозначениях, например, символ д/дх обозначает постоянное векторное поле Однако, Dd/dxf-—,
870 Глава 17. Токи, потоки и магнитостатика так что данное векторное поле действует как частная производная. Аналогично, векторное поле молено записать в виде д , д д ох oy oz Оно действует на функции по формуле df df df ox oy oz Можно изложить это по-другому: дифференциал df = -^-dx + — dy + —dz ox oy oz можно рассматривать как функцию, которая каждой точке приписывает вектор-строку df df df. ^(Р)'^(Р)'^(Р) Тогда в каждой точке мы можем вычислить произведение этого вектора-строки на вектор-столбец I b I и получить выражение Итак, Dtf = (&,df). Очень полезно интерпретировать величину D^f еще одним способом. Пусть имеется такое же отображение φ : I x U —> К и
17.3. Внутреннее произведение 871 соответствующие векторные поля £s. В каждый момент времени t мы можем рассмотреть функцию ф$/. Вспомним, что #/(p) = /(&(p)) = /(0(t,p))· Так что \ш-п — по-прежнему хорошая функция. Вычислив ее в некоторой точке ν и устремив t —> 0, мы увидим, что lim±(#/ -/)(p) = limi[/(0(i,p) -/(р))] = %р)/· Откуда получаем Теперь мы видим, что естественным геометрическим объектом, связанным с потоком, является векторное поле. В предыдущем параграфе мы увидели, что электрический ток (который по существу является потоком электронов) определяется 2-формой. Поэтому нам требуется математическая операция, которая позволит перейти от векторного поля, описывающего поток электронов, к 2-форме, определяющей ток. Эта 2-форма будет зависеть от плотности электронов. Очевидно, что более высокая плотность электронов, двигающихся вдоль тех же линий потока, будет создавать больший ток. Поэтому нам нужна такая математическая операция, которая даст возможность переходить от векторных полей ξ и 3-форм pdx Λ dy Л dz к 2-формам. Эту операцию мы опишем в следующем параграфе. 17.3. Внутреннее произведение Пусть V — векторное пространство, а ω обозначает элемент Ak(V*). Вспомним, что ω является функцией (полилинейной и
872 Глава 17. Токи, потоки и магнитостатика кососимметричной) к векторов в пространстве V. Для каждого набора vi,... , ν^ мы получаем число w(vi,v2,...,vfe). Пусть ν обозначает вектор в V. Определим функцию к — 1 векторов в пространстве V, подставляя ν на первую позицию в ω. Таким образом, мы рассматриваем функцию wi,..., Wfe_i, задаваемую u(v,wi,...,wfe_i). Эта функция векторов w также оказывается полилинейной и кососимметричной. Следовательно, она является элементом Ak'\V*). Назовем эту функцию внутренним произведением ν и w и будем обозначать ее ϊ(ν)ω. Итак, i(v)u(wi,..., wfe_i) = ω{ν, wi,..., vrk-i)· Давайте посмотрим, как выглядит внутреннее произведение в различных случаях. Допустим, что в пространстве R3 у нас есть базис д_ дх д_ ду и элемент дуального базиса dx = (1,0,0), и элемент дуального базиса dy = (0,1, 0), д — = I 0 I и элемент дуального базиса dz = (0, 0,1). Тогда если к = 1, т. е. ω является 1-формой, то ϊ(ν)ω равняется ω (ν), т.е. есть число. Таким образом, и так далее.
17.3. Внутреннее произведение 873 Если к = 2, то г ( — j (dxAdy)(w) = dxAdy ί -,w = dx ( fa) <MW) - ^ [fa ) d:r(w) = dy(w), поскольку dy(d/dx) = 0. Значит, Аналогично i[ — }dx Ady = dy. г ( — | dx Adz = dz ox, ( д \ г I — I dy Л dz = 0. Кроме того, i( — ){dxA dy){w) = dx ί — J dy(w) - dx{w)dy ί — = —dx(w). Отсюда г \ — ) dx Ady = —dx, i\ — \ dx Adz = 0, i [ — ) dy Adz = dz. \dy) \dyj \dyj Аналогично i I — 1 dxAdy = 0, г I — j dxAdz = -dx, г I — j dyAdz = —dy.
874 Глава 17. Токи, потоки и магнитостатика Кроме того, г I -д- 1 (dx A dy A dz)(vri, w2) = (dx Ady Adz) I —, wi, w2 /**(&) */(έ) ώ(£)\ = Det I dx(wi) dy(wi) cb(wi) J \dx(w2) dy(w2) dz(w2)J / 1 0 0 = Det I dx(wi) dy(wi) dz(wi) \dx(w2) dy(w2) dz(w2)j = Det^(wi) <fe(wi)N \^y(w2) cb(w2), Следовательно, Аналогично г ( — ) (dx Ady A dz) = dy A dz. г ( — ) (dx Ady A dz) = —dx A dz г ( —- ) (dx Ady A dz) = dx A dy. Теперь ясно, что ί(ν)ω билинейна по ν и ω. Поэтому если _а_ з д_ дх ду dz ω = pdx A dy A dz, то ί(ξ)ω = pady Adz — pbdx Adz + pcdx A dy. Итак, мы определили внутреннее произведение ί(£)ω вектора £ и элемента ω пространства Ak(V*). Однако, используя это
17.3. Внутреннее произведение 875 определение в каждой точке, мы можем также определить внутреннее произведение ί(ζ)ω, где ξ — векторное поле, а ω — дифференциальная форма степени к. И тогда все полученные формулы выполняются в пространстве R3. В частности, если мы рассмотрим векторное поле ξ, представляющее стационарный поток электронов, и 3-форму ω = pdxAdyAdz, дающую плотность электронов (точнее, размазанное приближение к ней), то получим 2-форму J = ί{ξ)ω, определяющую ток. Явный вид формулы в декартовых координатах дается предыдущим выражением. Чтобы понять, почему J представляет ток, молено воспользоваться исходным определением внутреннего произведения. Возьмем точку ρ и построим небольшой параллелограмм на векторах wi и W2, выходящих из точки р. Вектор ν = /ι£(ρ) представляет линейное приближение движения частицы, помещенной в точку р, на протяжении небольшого временного интервала h. Другими словами, параллелепипед, построенный на векторах v, wi и W2 (рис. 17.3), дает (приблизительно) область, проходимую параллелограммом за время h. Полный заряд этого параллелограмма дается выражением ω (v, wi,W2) = [i(v)u](wi,W2) = /i[i(£(p)V](wi,w2) = /iJ(p)(wi,w2). Итак, J(p)(wi, W2) действительно представляет скорость потока заряда через параллелограмм, построенный на векторах wi и W2- Рис. 17.3
876 Глава 17. Токи, потоки и магнитостатика Поэтому, если J проинтегрировать по поверхности, то получится скорость потока заряда через эту поверхность. В заключение этого параграфа давайте докажем очень важную формулу для внутреннего произведения: 1(0[ол Λ ω2] = №)ω1)Λω2 + (-1)άεδωιωι Λ ΐ(ζ)ω2. (17.1) (Проверка показывает, что в пространстве R3 формула (17.1) справедлива для всех случаев, которые мы рассмотрели.) В формуле (17.1) ξ обозначает векторное поле, а ω\ и ω2 дифференциальные формы. Поскольку (17.1) — чисто алгебраическое выражение, то достаточно доказать его для каждой точки, т. е. в случае, когда ξ = ν является вектором в пространстве V, ω\ — элементом Ak(V*), а ω2 — элементом Al(V*). Обе части выражения линейны по ξ, ω\ ишг, когда два других аргумента фиксированы. Мы можем написать ξ = a\V\ + ■ ■ ■ + αηνη, где {νι,..., νη} является базисом. В силу линейности по ξ, достаточно проверить формулу для ξ = Vj, т. е. для базисного элемента. Без потери общности предположим Сначала докажем формулу в случае, когда ω\ является 1-фор- мой. В силу линейности молено считать, что ^ι=ν*, г = 1,...,п, т. е. является элементом дуального базиса. Кроме того, предположим, что ω2 является базисным элементом вида ω2 = ν;1Λ···Λν;£. Рассмотрим теперь разные возможности. (а) Пусть г = 1, л > 1. Тогда v^(vi) = 0 для всех j = ji,...,ji, и в определителе выражения для {шг Λω2){νι,ντι,... ,ντι)
17.3. Внутреннее произведение 877 (ωχ Aw2)(v,wi,w2,w3) = Det = Det VjKvi) v5(vi) v$(wi) v2(w2) v^(w3) 0 vs(wi) vs(wi) vs(w2) v|(w3) 0 vs(wi) v|(vi)\ v|(wi) V4(W2) v|(w3)7 о \ vj(wi) V4(W2) .Wj) все элементы, кроме левого верхнего, обращаются в нуль. Напри мер, если шг = VjAvjAv^, то /vj(vi) vi(wi) v*(w2) \yi(w3) / 1 v*(wi) vl(W2) v£(w2) V^(W2) \v*(w3) v^(w3) v£(w3) v|(w3)/ /v5(wi) v^(wi) vj(wi)\ = Detlv2(w2) v^(w2) v^(w2) \y5(w3) v^(w3) v|(w3)/ = (ν2Λ v3 Λ V4)(wi,w2,w3). Итак, выражения для (ω\ Λ ω2)(ν, wi,..., wj) и ω2(\νι, чрез определители совпадают. Следовательно, ί(ν)(ωι Λω2) = и>2 = [i(v)<jj\]tjJ2 — ω\ Α ί(ν)ω2, поскольку в этом случае ϊ{ν)ωι = 1 и ί(ν)ω2 = 0. (b) Пусть г = 1, j\ = 1. Тогда ωχ Α ω2 = 0. В этом случае ί(νι)ωι = 1 и тогда (ί(νι)ωι) Αω2 В то же время ί(νι)ω2 = ν£ Тогда ωι Λ ί(νι)ω2 = ν* Л v*J2 A ■ ■ ■ Α ν|£ = ω2. Таким образом, ί(νχ)ωι Λ ω2 — ωι Λ ί(νι)ω2 = ω2 — ω2 = 0. (c) Пусть г > 1, ji = 1. В этом случае можно написать ω2 = ν*Λω3. Тогда левая часть формулы (17.1) переписывается в виде г (ν) [ωχ Λ ν* Λ ω3] = —i(v)[v* Л (ω\ Α ω3)] (переставляя νχ с ωχ) = -ω\ Лиз, ω2. ·· λ ν: Л'
878 Глава 17. Токи, потоки и магнитостатика согласно случаю (а). Первый член в правой части формулы (17.1) обращается в нуль, а второй член равен —ωχ Λ ω$ (еще раз применяем случая (а)). (d) Пусть г > 1, л > 1. Тогда *(νι)(ωι Λω2) = 0, ζ(νι)ωι = 0 и i(v{)U2 = 0. Поэтому обе части формулы (17.1) обращаются в нуль. Итак, мы доказали формулу (17.1) для случая, когда deg ωχ = 1. Но тогда ассоциативный закон внешнего умножения дает нам возможность доказать эту формулу в общем случае. Например, предположим, что ω\ = σι Λ σ2, где deg σχ = deg 02 = 1· Тогда г (ν) (σι Λσ2Λω2) = г (ν) σι Λ {σι Λ ^2) — σι Λ ί(ν)(σ2 Λ α^) = ί(ν)σι Λ (σ2 Λ ω-ι) — σι Λ i(y)o2 Λ ω2 + σι Λ σ2 Λ ί(ν)ω2 = [ί(ν)σι Λ σ2 — σι Λ ί(ν)σ2] Λ ω2 + σι Λ σ2 Λ ΐ(ν)ω2 = г (ν) (σι Λ σ2) Λ ω2 + (σι Λ σ2) Λ ί(ν)ω2· Итак, мы доказали формулу, когда ω\ = σχΛσ2, и тем самым, в силу линейности, для всех случаев, когда deg ωχ = 2. Дальше доказательство продолжаем по индукции. Например, если deg σχ = 1 и degσ2 = 2, то г (ν) (σι Λσ2 Л^г) = ί(ν)σι Λ {σι Λ ω2) - σι Λ ί(ν)(σ2 Λ ω2) = ί(ν)σι Λ σ2 Λ ω2 — σχ Λ ί(ν)σ2 Λ ω2 — σι Λ σ2 Λ ϊ(γ)ω2 = ΐ(ν)(σι Λ σ2) Λ 0^2 — σι Λ σ2 Λ ΐ(ν)ω2· Поэтому ί(ν)ωι Λω2 = *(ν)ωι Λ ^2 — ωι Λ ί(ν)ω2, если deg ωχ = 3, и так далее.
17.4. Производные Ли 879 17.4. Производные Ли Так же, как в параграфе 17.2, пусть φ : I x U —> Mfe. Тогда для каждого t G / мы имеем отображение фг-.и^Жк, &(p) = 0(t,p), причем предполагается, что фа = id. Пусть £ = ξ0 обозначает векторное поле, связанное с φι в момент ί = 0. Пусть ω — дифференциальная форма степени к. Рассмотрим форму φ*ω и соответственно форму -(φ\ω-ω) при t φ 0. Утверждается, что это выражение имеет предел при t = 0. Действительно, если ω = f — функция, то такой предел при t = 0 существует и, как мы уже видели, он записывается в виде Bs/ = ;*>>*/-я. Если ω = d/, то φ\ά! = άφ\ί и поэтому -t^*tdf-df) = d \m-n Мы имеем право переставить пределы в частных производных, определяющих d и Ός. Тогда получим YimjWdf-df) = dDtf. Наиболее общий вид линейной дифференциальной формы является суммой выражений вида / dg. Тогда ф* (/ dg) -fdg= (#/) ф*ад - f dg = φ\ί ф\ад - f ф*ад + !{ф*ад) - f dg.
880 Глава 17. Токи, потоки и магнитостатика Следовательно, Jim ±(#/ dg-f dg) = (Dtf) dg + f d(Di9). Итак, Ιΐτιι^ο(1/ί)(φ*ω—ω) существует для любой 1-формы. Более того, этот предел молено выразить через ξ и ω. Этот предел будем обозначать Όζω. Далее, если ω = ωχ Λ ω2, где ωι и Ш2 - 1-формы, то мы имеем φ\(ω\ Λ ω2) - ωι Л Ш2 = Φ1ωι Λ Φ*ω2 — ω\ Λω2 = (φ*ωι - ωι) Λ φ*ω2 + ωι Λ (φ*ω2 - ω2). Разделив это выражение на t и вычисляя предел, получим, что lim - (ф+ (ω\ /\ ω2) — ω\ ί\ ω2) существует и равен Όζω\ Λ ω2 + ω\ Λ Όζω2. Так как любая 2-форма может быть представлена как сумма членов вида ωχ Λ ω2, то lim - (ώ*ω — ω) существует для любой 2-формы ω. Этот предел мы будем обозначать Όζω, потому что он зависит только от ξ и ω. Действуя таким образом, мы убедимся, что этот предел существует для форм ω любой степени и зависит только от ξ и ω. Мы его обозначим Όζω и назовем производной Ли от ω по ξ. Для любых форм ω\ и ω2, как и выше, молено доказать формулу Όζ(ω\ Λ ω2) = Όςωχ Λ ω<ι + ω\ Λ Όζω·}. Определение и равенство άφ* = φ*ά, показывают, что άΌζω = Όζάω.
17.4. Производные Ли 881 Существует формула, связывающая внутреннее произведение г (ξ), внешнюю производную d и производную Ли Ός. Прежде чем получить эту формулу, вспомним, что d отображает i-формы в (I + 1)-формы и удовлетворяет равенству ά(ω\ Λω2) = duj\ Λω2 + (—1) ω\ Λ άω2, если степень ω\ равна к. Кроме того, г(£) отображает i-формы в (I ~ 1)-формы и удовлетворяет равенству ι(0(ωι Λ ω2) = »(^)ωι Λ ω2 + (-1)*ωι Λ ί(ξ)ω2. Поэтому d о г(^) отображает i-формы в i-формы и удовлетворяет равенству [d о t(£)](wi Λ ω2) = d(i(£)wi Αω2 + (-l)V Λ ϊ(ξ)ω2) = di(£)wi Λ ω2 + (-l)fc-1t(£)wi Λ άω2 + {-ifduji Λ %{£)ω2 + (-l)2fe^i Λ ά%(ξ)ω2. Заметим, что (—l)2fe = 1. Кроме того, имеется аналогичная формула [%{£) о d](wi Λω2) = г(£)аш! Αω2 + (-l)fe+1ebi Λϊ{ξ)ω2) + (—l)fcz(^)c^i Λ άω2 + ω\ Λ ι(ξ)άω2. Если мы сложим эти два выражения, то средние члены сократятся, и мы получим правило Лейбница = [i(£)d + άί(ξ)]ωι /\ω2+ωλ/\ [t(£)d + άΐ(ξ)]ω2. А сейчас докажем фундаментальную формулу дифференциального исчисления Dt = H£)d + dH£). (17.2) Доказательство. Обе части этого уравнения являются операторами, которые, действуя на произведения, удовлетворяют тождеству Лейбница. Каждая форма является суммой произведений
882 Глава 17. Токи, потоки и магнитостатика функций / и дифференциалов dg. Поэтому нам достаточно проверить тождество Όζω = ί(ξ)άω + άι(ζ)ω для ω = f и для ω = dg. В случае ω = / по условию мы имеем г(£)/ = 0 (не существует (—1)-форм). Тогда формула упрощается Dtf = mdf = df($), что мы уже получили в параграфе 17.2. В случае ω = dg мы имеем D$dg = dD^g = d№)dg) = (i(Od + di{£))dg, поскольку d2 = 0. Итак, формула верна в общем случае. В приложении к этой главе мы дадим другое доказательство этой формулы в более общем виде. Например, предположим, что ω = ρ dx Л dy Л dz в пространстве R3. Тогда άω = 0, поскольку в трехмерном пространстве не существует ненулевых 4-форм. Тогда Όξω = άί(ζ)ω. Если мы положим J = ί{ξ)ω, то условие dJ = 0 эквивалентно Όζω = 0. Это — инфенитезимальный способ выражения того, что φ*ω = ω для всех t. Тем самым, первый закон Кирхгофа молено переформулировать так: поток фг сохраняет плотность заряда ω, так что Όζω = 0.
17.5. Магнетизм 883 17.5. Магнетизм Электрические и магнитные явления в очень примитивной форме были известны еще с древних времен. Исследования этих загадочных явлений учеными семнадцатого и восемнадцатого веков привели в девятнадцатом веке к пониманию фундаментальной роли электромагнитных сил в природе и к революционным изменениям в обществе, возникшим в результате открытия электрических технологий. В древности было известно, что если потереть янтарь (окаменевшую древесную смолу) тканью, то небольшие кусочки легкого материала поднимутся в воздух и приклеются к нему. Янтарь по- гречески называется «электрон». В книге «О магнетизме», опубликованной в Лондоне в 1600 году, У. Гилберт ввел термин «электричество» для обозначения притяжения, свойственного янтарю. Он посвятил янтарю целую большую главу, «чтобы показать природу притяжения тел к нему и подчеркнуть огромную разницу между этим свойством и магнитными действиями» и отличить «простую симпатию, связывающую железо и магниты, от неразборчивого поведения янтаря». Древние рассматривали притяжения янтаря и магнитов как одинаковые явления, давая им одинаковые объяснения. Кардано (1550) осознал ряд различий между электрическими и магнитными притяжениями. Однако, только Гилберт обнаружил, что электростатическое свойство притяжения янтаря может быть и у многих других твердых веществ. Конечно, электростатическое притяжение заряженного тела к легкому нейтральному телу за счет индуцированной поляризации и более сильное притяжение к телу с зарядом противоположного знака — очень сложные явления как для точного теоретического расчета, так и для эксперимента. Легкие кусочки бумаги летят к янтарю хаотически и приклеиваются к нему. Затем через некоторое время они падают. Поэтому, конечно, поведение янтаря по сравнению с постоянным притяжением железа к магниту или магнита к магниту молено считать «неразборчивым». По существу прошло еще почти два века, пока люди осознали, что фундаментальное притяжение и отталкивание в рамках электростатики действует между заряженными телами, и пока был открыт правильный закон взаимодействия между ними. Это было сделано
884 Глава 17. Токи, потоки и магнитостатика Кулоном в 1789 году в тщательно поставленном эксперименте с помощью изобретенных им крутильных весов. В древнегреческих источниках имеются сведения о камнях, которые могут притягивать железо. Сообщалось, что один такой большой камень в окрестности города Магнезия в Малой Азии вытягивает кусочки железа из амуниции пастухов и гвозди из их ботинок. По имени этого города мы и получили термин «магнит». Было обнаружено, что этот камень может передавать свойство притягивать железной игле, причем у последней оно будет зависеть от направления. В том же эксперименте с крутильными весами Кулон обнаружил и измерил силы притяжения и отталкивания между магнитными полюсами. (Он еще раз открыл закон обратного квадрата.) Однако, современное понимание природы магнитных сил пришло после работ Ампера. Оказалось, что истинным объектом изучения было не притяжение железа к магниту или притяжение между магнитами, а сила, которую магнит оказывает на движущийся заряд (или, еще точнее, сила, с которой один движущийся заряд действует на другой). Весной 1820 года, читая лекцию об электрических токах, Эрстед заметил, что стрелка компаса, случайно оказавшегося рядом, отклоняется током. Объявление об этом результате — что электрический ток действует на магнит — всколыхнуло научный мир. Электричество и магнетизм, разделенные в течение почти двух веков, вновь оказались связанными между собой. Ампер осознал, что если ток отклоняет магнитную стрелку, то магнит должен действовать на ток и два тока должны действовать друг на друга. В течение нескольких недель с 18 сентября по 9 октября 1820 года, Ампер без устали провел серию блестящих экспериментов и геометрических исследований. В некотором смысле понятие дифференциальных форм возникло из математического анализа, проделанного Ампером, который открыл основные законы магнитостатики. Магнитное поле создает силу, действующую на ток, а ток представляется нам как система движущихся зарядов. Значит, магнитное поле действует на заряды. В то же время сила зависит от скорости движения заряда. Магнитная индукция является
17.5. Магнетизм 885 2-формой В в пространстве R3. Предположим, что заряд е движется через точку ρ со скоростью v. Тогда возникает сила ei(v)Bp. В этом выражении В является 2-формой, поэтому Вр равно значению В в точке р, т.е. является элементом Л2(М3). Таким образом i(v)Bp — линейная функция касательных векторов в точке р, т.е. то, что мы называли силовым полем (ср. том 1, с. 348). Итак, если частица с зарядом е движется вдоль кривой 7, то в момент t на нее действует сила ei{i{t))Bl{t). Тогда из определения внутреннего произведения немедленно следует, что ί(ν)ι(\ν)ω = —ί(\ν)ί(ν)ω для любых v, who;. В частности, ϊ(ν)ί(ν)ω = О, или, если ω G Л2(У*), то [i(vH(v)=0. Это значит, что составляющая силы вдоль направления движения отсутствует. Тогда сила, действующая на линейный проводник с током, будет перпендикулярна этому проводнику. (Это было проверено Ампером в остроумном эксперименте, когда ток протекал по подвижному проводу, соединяющему два сосуда со ртутью.) В каждой точке форма В φ О будет определять направление в пространстве — прямую, задаваемую уравнением i(w)B = 0. (Читателю следует убедиться, что это два линейно независимых уравнения для w.) Железные опилки, помещенные в магнитное поле (способные вращаться, но не двигаться поступательно) повернутся вдоль этого направления, создавая магнитные силовые
886 Глава 17. Токи, потоки и магнитостатика линии. (На токи вдоль именно этих направлений не действует сила.) Ампер не только открыл силу, с которой магнитное поле действует на ток. Он также вывел количественную формулу закона (впервые обнаруженного Эрстедом), согласно которому ток создает магнитное поле. Для этого полезно ввести 1-форму Н, которую вслед за Зоммерфельдом будем называть магнитным возбуждением или магнитным полем. Второй закон Ампера говорит, что если произвольная поверхность S ограничена кривой 7 = dS, то // = *// Другими словами, интеграл от магнитного поля по замкнутой кривой, ограничивающей некоторую поверхность, равен потоку тока через эту поверхность. По теореме Стокса это то же самое, что dH = 4тг J. В отличие от электростатики, мы можем сформулировать еще один закон магнитостатики в виде В = О для любой замкнутой поверхности S. (Согласно Герцу, это значит, что «не существует магнитных зарядов».) И, наконец, нам надо получить закон, связывающий В и Н. В неферромагнитных материалах он имеет вид В = μ*Η, где μ называется магнитной восприимчивостью. А сейчас давайте выпишем все законы магнитостатики. (i) Сила, действующая на элемент тока I = ev в точке р, равна г(1)Вр. (ii) fs В = 0 для любой замкнутой поверхности S. Следовательно, dB = 0. .
17.5. Магнетизм 887 (Ш) IdS Н = 47Г Is J' или dH = Απ J (закон Ампера). (iv) В = μ*Η. Предположим, что мы находимся в области U, где H2(U) = 0. Тогда условие dB = 0 означает, что B = dA для некоторой 1-формы А. Конечно, А = Ах dx + Ау dy + Az dz не определяется однозначно уравнением В = dA, поскольку функция А + dip, где φ — произвольная функция, удовлетворяет тому же уравнению. Давайте возьмем такую функцию ф, чтобы д2ф д2ф д^ф__ (дА^ дАу_ ЗАЛ дх2 ду2 dz2 \ дх ду dz J Как только мы выбрали А, задача сводится к решению уравнения Пуассона.2 Тогда, заменив А на А + άφ, мы получим 8АХ | дАу | dAz _ о дх ду dz Теперь Η = -*-гВ = -*~ldA μ μ и dH = J. Предположим, что в рассматриваемой области μ — постоянная. Тогда d*_1cL4 = μ3. Последующие вычисления станут яснее после того, как мы введем общую форму оператора *. См. следующую главу.
888 Глава 17. Токи, потоки и магнитостатика В этом случае поэтому а(Ах ах) = —-— ах А dy + —— dz А ах, -1мл а \ дА* а , дАх а * а(Ахах) = —-—αζ + ——ay ду dz д2А д2А (d*~1d)(Ax dx) = — Q J° dx Adz ^-£- dy A dz дхду д2А ду2 д2А + :w~jr- dx Ady- -—£- dy A dz. Проделав те же вычисления для Ау dy и Az dz и сложив все вместе, получаем (ά*~λά)Α = -(AAxdy Adz + AAydz Adx + AAzdx Ady), Δ-— — — dx2 dy2 dz2 — обычный оператор Лапласа. Тогда если написать J = Jxdy Adz + Jydz Adx + Jz dx A dy, то уравнения где dA = B, В = μ-kH, dH = Απ J сводятся к решению трех уравнений Пуассона: ΔΑΧ = -4ttJx, ААу = —ATiJy, AAZ = -4ttJz. Например, мы хотим получить В и Η вне длинного тонкого прямолинейного провода, по которому течет постоянный ток I.
17.5. Магнетизм 889 Предположим, что радиус провода равен а, и расположен он вдоль оси ζ. В этом случае Jx = Jy = О и (О вне провода, 7 —^ внутри провода. 7Г0Г Тогда Ах = Ау = 0. Решая уравнение для Az, получаем Αζ = -2μΙ log у/χ2 + у2 для точек вне провода. Тогда дА дА В = dA = ——— dx Adz ^ dy Л dz ox ay (X V \ ~2 dx Л dz + -J dy A dz) 2μΙ ■dr Adz r в цилиндрических координатах x = rcos9, y = rsin6, ζ = ζ, г = у/х2 + у2- Силовыми линиями являются круги с центром в середине провода, и Η = 1/μ*~ιΒ пропорционально άθ. Если бы мы заранее знали, что H = fM, то из сообралсений симметрии мы могли бы заключить, что / = /(г). Тогда из соотношения мы получили бы /я= h т = :4тг/ 27 г Поскольку άθ /г = dr A dz, мы бы тогда имели В = μ*Η = 2μΤάτΑάζ.
890 Глава 17. Токи, потоки и магнитостатика В общем случае решение уравнения Пуассона показывает, что А определяется объемным интегралом а*(у) = J |,__w||ia:(w)d3w. Аналогичные формулы получаются для Ау и Az. Приложение: альтернативное доказательство фундаментальной формулы дифференциального исчисления Здесь мы дадим альтернативное доказательство основной формулы (17.2). По существу, мы докажем ее в более общем случае. Пусть W С Шт и Ζ С Шп — открыть^ множества. Предположим, что нам дано дифференцируемое отображение φ : W х / —> Ζ, где I — некоторый интервал в R, содержащий начало координат. Для каждой фиксированной точки w € W мы получим кривую φ(νί, t), зависящую от t. Пусть £t(w) обозначает касательный вектор к кривой φ(\ν,ί). Это касательный вектор в пространстве образов Rn, но зависящий от ί и w £ W. Кроме того, пусть отображение фг'-W —> Ζ определено как <MW) =0(w,i)· Мы считаем, что фг образуют однопараметрическое семейство отображений из W в Z. Пусть σ — дифференциальная (к + 1)-форма в пространстве Ζ. Для каждого t определим А;-форму φ\ί{^σ в W согласно формуле [Φ*Λξ,ι)σ]{ηί, ...,щ)= a(ft(w), афгГ)ъ ..., аф^к), где r7i,. ·., г]к — касательные вектора в точке w. Все к + 1 векторов, возникающие внутри σ в правой части этого соотношения, являются касательными векторами к кривым <^>t(w). Поэтому правая часть имеет смысл. Примем это как определение левой части данной формулы. Для обобщения формулы (17.2) мы хотим доказать следующее.
Приложение 891 Пусть at обозначает гладкое однопараметрическое семейство форм в Z. Тогда 4>*tOt является гладким семейством форм в W, и основная формула дифференциального исчисления форм принимает вид: jfiot = Ф*^+ ФЖ^г) + cUfti{tt)at. (17.3) Сначала докажем формулу для частного случая, когда W = Ζ = Μ χ I, где М является открытым подмножеством пространства Шт, а фг является отображением фг : Μ X I —> Μ χ I, определенным формулой rft(x,s) = (x,s + i). Наиболее общий вид дифференциальной формы в Μ χ 7 молено записать в виде ds Л о + 6, где о и 6 являются формами в М, которые могут зависеть от t и s. (В терминах локальных координат s, χ1,..., хп эти формы оказываются суммами членов вида с dx11 Л· ■ -/\dx4, где с является функцией, зависящей от i, s и χ.) Чтобы показать зависимость от χ и s, мы перепишем наше выражение в виде at = ds Л α(χ, s, t) dx + 6(x, s, t) dx. В этих обозначениях очевидно, что φ*at = ds Λ o(x, s + ΐ, t) dx + 6(x, s + t, t) dx и поэтому άφίσ* да, . , дЬ. . , , = dsA —(■x,s + t,t)dx + -z-(x.,s + t,t)dx dt os os da. db. + ds Λ — (χ, s + t, t) dx + — (x, s +1, t) dx. (Jb (Jv Следовательно, <Wt°t dt -41) = dsA-^(xi,s+t,t)dx+ — (x,s+t,t)dx. (17.4) dt J os os
892 Глава 17. Токи, потоки и магнитостатика В этом случае также очевидно, что вектор, касательный к кривой i/>t(x, s), равен d/ds, вычисленной в точке (х, s +t). Тогда d/ds оказывается векторным полем и — J at = a dx. Следовательно, ^* ( \ ΊΓ)σ*) = а^х's + *' ^ dx и поэтому dip* I г I ^- 1 at I = —(x.,s+t,t)ds/\dx+dxa(x,s+t,t)dx. (17.5) Здесь dx обозначает внешнюю производную формы о(х, s+ΐ, t) dx в Μ при фиксированном значении s. Аналогично da* = — ds Л d^o dx + — ds Л dx + dxb dx. OS Тогда г τ— ασ* = —α^α αχ + — dx \osJ ds и — 1 dat = —da;o(x, s + ί, t) dx + — (χ, s +1, t) dx. (17.6) В результате сложения соотношений (17.4)-(17.6) мы получаем доказательство формулы (17.3) для tpt. Пусть теперь φ : W х / —> Ζ имеет вид (^>(w,s) = φ5(\ν). В результате действия φ прямые, параллельные / и проходящие через w bWxI, переходят в кривые 0s(w) в Z. Другими словами, *(£L-Ww)· Если мы рассмотрим отображение I : W —> W х I, заданное правилом Z(w) = (w,0), то отображение фг молено записать как
Резюме 893 φ о ipt о /. Тогда φ* at = 1*ф*ф*а^ Поскольку / и φ не зависят от t, мы имеем В точке w, t пространства W х I молено написать i (j£) Φ*σί = (άφ)* | (г (άφ^) σ,) } = (аф)*«Ь)аи и тогда 1*Ф; (г (j£) Φ*σ^ = 1*ф*гФ*№г)°г) = <Ш£*К)· Подстановка в формулу для (с1/сИ)[ф*ф*а^ дает (17.3). Резюме А. Дифференциальные формы, векторные поля и магнетизм Для данного векторного поля ξ и дифференциальной формы ω надо знать, как определить и вычислить производную Ли Όςω. Вы должны знать определение внутреннего произведения вектора и дифференциальной формы, уметь вычислять его и использовать для формулировки закона о магнитной силе. Вы должны знать формулировки законов магнитостатики и технику вычисления В для данного тока J с помощью дифференциальных форм. Задачи 17.1. Пусть вектора {ei, ег, ез} образуют базис в пространстве М3, так что dx[ei] = dy[e2] = dz[e3] = 1. Пусть ξ = хв2 — yei. Это векторное поле ξ описывает скорость, связанную с равномерным вращением вокруг оси ζ. Мы можем переписать это выражение в виде ξ = х(д/ду) — у(д/дх).
894 Глава 17. Токи, потоки и магнитостатика (a) Имеется постоянная плотность заряда, описываемая формой ω = ро dx A dy A dz. Используя соотношение J = ϊ(ξ)ω, определите ток, связанный с вращением этого однородного распределения заряда. (b) Пусть ω = ζ dx A dy. В явном виде проверьте выполнение тождеств Οξω = ί(ξ)άω + di(£)ui и άΰςω = ΰςάω, где ξ = χψ/ду) - у(д/дх). 17.2. Пусть / обозначает ток на единицу длины, который распространяется аксиально симметрично относительно оси ζ таким образом, что, проходя через поверхность цилиндра радиуса г, ось которого является осью ζ, не зависит от г. В этом случае скорость носителей заряда определяется формулой t _ xei +уе2 t _ 1 ( Α _μ — х2 +у2 х2 + у2 \ дх ду Вычислите 2-форму J, используя равенство J = i(£)dx Ady Adz и убедитесь, что dJ = 0. 17.3. Предположим, что В = Bodz, где Во — константа. Найдите функцию А, удовлетворяющую условиям „ , л дАх dAv dAz ах ay oz 17.4. Предположим, что по проводу с радиусом а движется аксиально симметричный ток J, величина которого пропорциональна г2. В этом случае очевидно, что Jx = Jy = 0 и 0 вне провода, U = \ 21(х2+у2) 1 2 внутри провода. (a) Найдите функцию Az, зависящую только от г = ^х2 +у2, для которой AAZ = -4πΛ. (b) Вычислите Б и Я в цилиндрических и декартовых координатах. Проверьте, что dH = 4π7. 17.5. Очень длинный цилиндр с радиусом а и осью вдоль ζ имеет однородную плотность заряда ро- Вне цилиндра зарядов нет. Цилиндр вращается вокруг своей оси с угловой скоростью ω, так что J = ωτρο для г < а.
Задачи 895 (a) Выразите J в цилиндрических и декартовых координатах (см. задачу 17.1). (b) В силу симметрии форма В имеет вид В = f(r)dx Л dy и Η = 1/д/(г) dz. Получите такое Н, чтобы выполнялось условие dH = Απ J. (c) Найдите функцию А внутри и вне вращающегося цилиндра. В цилиндрических координатах А будет иметь вид д(г) άθ.
I I
Глава 18 Звездный оператор В этой главе мы даем общее обсуждение звездного оператора. Это позволит нам сформулировать в следующей главе уравнения Максвелла и понять связь между ними и геометрией пространства-времени. Кроме того, мы объясним различные операторы и тождества векторного анализа. 18.1. Скалярные произведения и внешняя алгебра Пусть V обозначает конечномерное векторное пространство с невырожденным скалярным произведением. Мы не предполагаем, что это скалярное произведение (·, ■) положительно определено. Однако, полезно иметь в виду положительно определенный случай, чтобы интуитивно чувствовать, что происходит. В этом параграфе мы хотим объяснить, как (·, ·) индуцирует скалярное произведение в каждом из пространств Ak(V*). Идея состоит в том, что за понятием длины следуют площадь параллелограмма, объем параллелепипеда и так далее. Сначала отметим, что скалярное произведение в пространстве V индуцирует скалярное произведение в пространстве V*. Действительно, любое скалярное произведение в V индуцирует отображение L : V —> V*, задаваемое формулой L(v)(w) = (v,w), v, w G V.
898 Глава 18. Звездный оператор В этом уравнении L(v) является элементом V*, т.е. функцией в пространстве V, и поэтому ее молено вычислить для любого w G V. Отображение L определено так, что вычисление приводит к (v,w). Если (·,·) невырождено, то из того, что (v,w) = О для всех w, следует, что ν = 0. Следовательно, соотношение L(v)(w) = 0 для всех w означает ν = 0, т. е. из L(v) = 0 следует, что ν = 0. Поскольку Dim V* = Dim V, молено сделать вывод, что (·, ·) не сингулярно тогда и только тогда, когда L является изоморфизмом. Мы предположили, что (·, ■) невырождено, но тогда на самом деле L оказывается изоморфизмом. Теперь молено определить скалярное произведение в пространстве V* (α, β)ν* = (ΙΓια, ΙΓιβ)ν, α,β& V*. Например, предположим, что V = Шп состоит из векторов- столбцов. Тогда V* = Ш.п* состоит из векторов-строк. В общем случае скалярное произведение в пространстве Ш.п дается симметричной матрицей S. Допустим, что S диагональна. Тогда (v,w)v = ^SiXiVi, если Н:)и w"G)' В этом случае Lv = (sixi,...,snxn). Итак, если α = (αϊ,... ,αη), β=(β1,...,βη), то /αι/sA /Pi/si\ ψη/Sn/ \Pn/snJ
18.1. Скалярные произведения и внешняя алгебра 899 Следовательно, (<*,β)ν* =Σ,—°4βί- Заметим, что Sj стоит в знаменателе. Поэтому мы должны пред- пол ожить, что все Sj φ 0. А это и есть предположение о невырожденности (·,·). Если (·, ■) положительно определено и {ei,...,en} является ортонормированным базисом в пространстве V, то {е|,...,е£} будет дуальным базисом. Исследование определения L показывает, что L(e,-) = е* и, следовательно, {е^,..., е£} образует ортонормированный базис в пространстве V*. В более общем случае, если не предполагать положительной определенности (·, ■) (но при этом предполагать невырожденность), то молено взять в качестве {ei,...,en} ортогональный базис с условием (ег-,ег-) = ±1. Тогда {е*,...,е^} оказывается ортогональным базисом в V* и (e*,e*)v* = (βί,βί)ν. Теперь молено дать определение (·, ■) для двух любых линейных дифференциальных форм. Например, в евклидовом пространстве Шп базис 1-форм dx1,..., dxn ортонормирован и (άχ\άχ{) = +1. Пусть в пространстве R3 есть две формы ω = Axdx+Ay dy+Az dz и τ = Βχ dx + Βν dy + Bz dz. Тогда (ω, τ) = AXBX + AyBy + AZBZ. Заметим, что (ω, г) является функцией. Давайте рассмотрим пространство Ak(V*). Калсдый элемент этого пространства является суммой вида α = α1Λ···Λα4/31Λ···Λ^Η . Утверлсдается, что существует единственное скалярное произведение, определенное в пространстве Ak(V*) и удовлетворяющее условию (α1 Λ···Λα*:,71 A---A7fe) = Det((a\y')).
900 Глава 18. Звездный оператор Очевидно, что если такое скалярное произведение существует, то этим уравнением оно определено единственным образом, поскольку в силу билинейности (·, ·) молено продолжить на все а и 7, которые представляют собой суммы разложимых элементов, т. е. выражений вида а1 Л · · · Л ак и 71 Л · · · Л jk). Задача состоит в том, чтобы доказать согласованность такого определения, т. е. показать, что если а и/или η записываются в виде сумм разложимых элементов двумя различными способами, то мы получим одно и то же значение (0,7)· Такое доказательство становится простым, если мы воспользуемся более абстрактным определением пространства Ak(V*), чем то, чем пользовались до сих пор. Это определение и доказательство приводятся в приложении к этой главе, поэтому здесь мы не будем отвлекаться. Сейчас получим скалярное произведение (значения которого суть функции) в пространстве А;-форм. Например, для 2-форм (ω1 Λ ω2, τ1 Л г2) = {ω1, τι){ω\ τ2) - (ω\τ2){ω2, τ1). В пространстве R3 для евклидова скалярного произведения (dx Л dy, dx Л dy) = +1. В четырехмерном пространстве-времени для скалярного произведения Лоренца мы имеем (dt Λ dx, dt Λ dx) = —1, но (dx Λ dy, dx A dy) = +1. В качестве иллюстрации, как делать такие вычисления в более общей системе координат, рассмотрим сферические координаты в пространстве R3, которые определяются формулами г = ух2 +у2 + ζ2, θ = arctan(v/(^2 +y2)/z), φ = arctan(y/x).
18.2. Звездный оператор 901 Если мы вычислим дифференциалы этих функций и выразим результаты через базис {ах, ay, dz} с коэффициентами, записанными для удобства в координатах г, θ и ф, то получим dr = sin θ cos φ dx + sin θ sin фау + cos θ dz, άθ = - (cos θ cos φ dx + cos θ sin фау — sin θ dz), r άφ = —;—-(— δΐηφάχ + cos фау). r sin 0 Используя ортонормированность dx, dy и dz, прямое вычисление показывает, что dr, άθ и άφ являются ортогональными элементами пространства V* в каждой точке {τ,θ,φ). При этом (dr,dr) = l, (άθ,άθ) = \, (άφ,άφ) = 1 2 rz ΤΔ Sin Ό Отсюда немедленно следует, что dr Л άθ, dr Α άφ и άθ Α άφ образуют ортогональный базис в пространстве Л2(М3), а скалярные произведения {аг Α άθ, аг Α άθ) = —^ и т.д. Наконец, мы можем вычислить скалярное произведение базисного элемента аг Α άθ Α άφ на себя: {аг Л d0 Л άφ, dr Α άθ Α άφ) = — „-. г4 sin θ Чтобы подвести итог полученным результатам, лучше всего отметить, что аг, г άθ, г sin θ άφ образуют ортонормированный базис Л1(М3*) в каждой точке. Поэтому мы можем работать с этими тремя дифференциалами так же, как с ах, ау и άζ. 18.2. Звездный оператор Рассмотрим конечномерное векторное пространство V. В главе 8 мы обсуждали понятие ориентации векторного пространства V. Вспомним это определение. Любые два базиса {ei,..., еп}
902 Глава 18. Звездный оператор и {fi,...,fn} связаны между собой матрицей замены базиса В. Два базиса называюься эквивалентными или определяют одинаковую ориентацию, если Det В > 0. В противном случае они определяют противоположные ориентации. Множество всех базисов разбивается на два класса эквивалентности, и каждый класс эквивалентности называется ориентацией. С помощью пространства An(V) мы можем сформулировать это иначе. Базис {ei,...,en} определяет ненулевой вектор в одномерном пространстве An(V), а именно ei Л · ■ · Л еп. Второй базис {fi,..., fn} определяет элемент fi Л · · · Л fn. Эти два элемента отличаются скалярным множителем Det В. Таким образом, выбор ориентации пространства V равносилен выбору одного из двух классов эквивалентности ненулевых элементов An(V). Эти два элемента считаются эквивалентными, если они отличаются друг от друга положительным множителем. Предположим, что в пространстве V есть невырожденное скалярное произведение. Пусть {ei,...,en} будет ортогональным базисом в V, с условием {щ,щ) = ±1. Два таких базиса отличаются друг от друга матрицей замены базиса В, для которой Det В = ±1. Таким образом, выбор ориентации V вместе со скалярным произведением определяет единственный элемент ei Л · · · Л еп пространства An(V). Поэтому у нас есть также единственный дуальный элемент из пространства An(V*), который будем обозначать σ. Предположим, что мы рассматриваем дифференциальные формы. Тогда в каждой точке пространства V мы получаем единственный элемент An(V*), другими словами, мы получаем η-форму. Чтобы избежать громоздких обозначений (но рискуя возможной путаницей), эту η-форму тоже будем обозначать σ. Итак, если V = Ш.п — n-мерное евклидово пространство, то σ = dx1 Л dx2 Л · · · Л dxn. Рассматривая пространство-время, договоримся время считать первой координатой. Тогда для четырехмерного пространства σ = dt Л dx Л dy Л dz.
18.2. Звездный оператор 903 (Заметим, что в этом случае (σ, σ) = — 1.) Сейчас мы уже можем определить линейное отображение из Ak(V*) в An~k(V*)) называемое звездным оператором. Для этого будем идентифицировать и Ak(V*) и An~k(V*) с пространством линейных функций на An~k(V*). Потом отождествим элементы Ak(V*) и An~k(V*), которые соответствуют одной и той же линейной функции. Такая идентификация Ak(V*) и An~k(V*) будет называться звездным оператором. Сначала покажем, как внешнее произведение вместе с выбором σ £ An(V*) приписывает каждому элементу A G Ak(V*) линейную функцию на пространстве An~k(V*). Действительно, если ω G An~k(V*), τολΛω является элементом An(V*). Следовательно, эта функция должна быть пропорциональна некоторому множителю σ. Другими словами, мы можем написать \Λω = /(ω)σ. Итак, каждый элемент А определяет линейную функцию ω ι-> /(ω). При этом существует единственный элемент пространства An~k(V*), обозначаемый в дальнейшем *А, который определяет ту же самую функцию /(ω) из An~k(V*) в Ш через скалярное произведение (*λ,ω) = /И- Таким образом, задав любой элемент А е Ak(V*), мы можем определить *А е An~k(V*) условием λ Αω = (*λ,ω)σ для всех ω G An~k(V*). Заметим, что это определение звездного оператора зависит от выбора ориентации. Изменение ориентации меняет знак σ и, следовательно, знак *А. Чтобы вычислить *А, в общем случае мы должны применить это определение, используя в качестве ω по очереди каждый базисный элемент An~k(V*). Однако, если А является базисным элементом Ak{V*) вида dxH Л · · · Л dxlk, то нам достаточно рассмотреть только один базисный элемент An~k(V*)) а именно тот ω,
904 Глава 18. Звездный оператор который содержит η — к множителей, не входящих в А. В этом случае Χ Α ω оказывается внешним произведением всех дифференциалов от dx1 до dxn в каком-то порядке, т. е. оно равно ±σ. Тогда *А = ±ω. Осталась единственная трудность — правильно определить знак. Общее определение Α Αω — (*\,ω)σ следует дополнить соглашениями для случаев к = η и к = 0. Базисный элемент пространства Л°(МП) обозначим 1. При этом скалярное произведение (1,1) = 1 и тривиальное внешнее произведение ΐΛω = ωΛΐ = ω. Тогда если λ = σ, то нам надо рассмотреть только базисный элемент ω = 1 и σ А 1 = (*λ, 1)σ, так что *σ = 1. С другой стороны, если А = 1, то рассматриваем ω = σ и получаем 1 Λσ = (*λ,σ)σ. В этом случае *1 = (σ, σ)σ. Это значит, что если мы работаем с евклидовым скалярным произведением, для которого (σ, σ) = 1, то мы имеем *σ = 1 и *1 = σ. Однако, в важном случае двумерного или четырехмерного пространства-времени, со скалярным произведением Лоренца, (σ, σ) = — 1, следовательно, *σ = +1, но *1 = —σ. Вычисление звездного оператора лучше всего иллюстрируется на примерах. Пример 1. В пространстве R2 имеется евклидово скалярное произведение. Базис пространства Л1(К*) образован dx и dy с условиями (dx, dx) = 1, (dy, dy) = 1 и σ = dx A dy. *(dx A dy) = 1 (верно всегда); dx A dy = (*dx, dy) dx A dy, поэтому *dx = dy; dy A dx = (*dy, dx) dx A dy, поэтому *dy = — dx; • 1 = dx A dy, потому что (σ, σ) = +1.
18.2. Звездный оператор 905 Пример 2. Дано двумерное пространство-время, где определено скалярное произведение Лоренца. В пространстве Л1(К) имеется базис {dt, dx}, удовлетворяющий условиям (dt,dt) = +1, (dx, dx) = — 1 и σ = ώ Λ dx. *dt Л dx = 1; dt A dx = (*dt, dx) dt A dx, поэтому *dt = —dx; dx A dt = (* dx, dt) dt A dx, поэтому *dx = —dt; *l = —dtAdx, потому что (σ,σ) = — 1. Пример 3. В пространстве R3 определено евклидово скалярное произведение. Базисом пространства Л^У) является {dx,dy,dz}. При этом выполняются условия (dx, dx) = {dy, dy) = {dz, dz) = 1 и σ = dx Ady Λ dz. *(dx Ady A dz) = 1 (dx A dy) Adz = (*(dx A dy),dz)a, тогда *(dx A dy) = dz; (dx A dz) Ady = (*(dx A dz),dy)a, тогда *(dx A dz) = —dy; (dy Adz) Adx = (*(dy Adz),dx)a, тогда *(dy A dz) = dx; dx A (dy A dz) = (*dx, dy A dz)a, тогда *dx = dy A dz; dy A (dx A dz) = (*dz, dx A dy)a, тогда *dy = —dx A dz; dz A (dx A dy) = (*dz, dx A dy)a, тогда *dz = dx A dy; • 1 = dx Ady Adz. Пример 4. Рассмотрим четырехмерное пространство-время, где определено скалярное произведение Лоренца. Базисом пространства Л1(К) является {dt,dx,dy,dz} с условиями (dt,dt) = 1, (dx,dx) = (dy,dy) = (dz,dz) = — 1 и σ = dt A dx A dy A dz. Тогда *(dt Adx Ady A dz) = 1. Далее, (dt Adx A dy) Adz = (*(dt Adx A dy), dz)a, поэтому *(dt Adx A dy) = —dz.
906 Глава 18. Звездный оператор Аналогично *(dt A dx A dz) = +dy; *(dt A dy A dz) = —dx. Кроме того, (dx Ady A dz) Adt = (*(dx Ady A dz), dt)a, поэтому *(dx Ady A dz) = —dt. Рассмотрим 2-формы: (dt A dx) A (dy A dz) = (*(dt A dx), (dy A dz))a, тогда *(dt A dx) = dy A dz. Аналогично *(dt A dy) = —dx A dz, *(dt A dz) = dx A dy. Далее, (dx A dy) A (dt A dz) = (*(dx A dy),dt A dz)a. Тогда *(dx A dy) = —dt A dz. Аналогично *(dx A dz) = dt A dy, *(dy A dz) = —dt A dx. Теперь рассмотрим 1-формы: dt A (dx Ady A dz) = (*dt, dx Ady A dz)a.
18.2. Звездный оператор 907 Таким образом, *dt = —dx A dy A dz. Кроме того, dx A (dt Ady A dz) = (*dx, dt A dy Α άζ)σ, так что •dx = — dt Ady А <1г. Аналогично •dy = dt Adx A dz, ■kdz = —dt Adx A dy. И наконец, • 1 = — dt Adx Ady A dz. Очевидно, что в приведенных примерах *(*λ) = ±А. Чтобы сформулировать общее правило, в пространстве V выберем ортогональный базис ei,...,en, при условии, что (ег-,вг) = ±1. Рассмотрим случай, когда A G Ak(V*) является произведением к векторов е*, и ω является произведением оставшихся (п — к) векторов е* с некоторым знаком ±. Допустим, что λ и ω таковы, что Α Αω = σ (например, А = dx, ω = dy A dz в пространстве R3). Тогда *λ = ±ω и *ω = ±λ. Чтобы определить знаки, положим • А = с\и> и *ω = с^Х. Тогда σ = λ Λ ω = (*λ, ω)σ. Откуда (•λ,ω) = βι{ω,ω) = 1. Кроме того, согласно правилу перестановки множителей во внешнем произведении, (-1)*(ηΛ = ωΛλ = (*ω,λ)σ, откуда (*^,A) = c2(A,A) = (-l)fe("-fe).
908 Глава 18. Звездный оператор Поскольку λ и ω являются базисными элементами, мы имеем (Α, λ)(ω, ω) = (А Л ω, Α Λ ω) = (σ, σ). Откуда clC2(a,a) = (-l)fe("-fe). Поскольку (σ, σ) = ±1, мы можем перенести этот множитель в другую часть уравнения. Тогда получим • (•А) = c\*u = ciC2A, где cic2 = (-l)fe("-feV,a). В силу линейности оператора *, если все выписанные уравнения выполняются для каждого базисного элемента Ak(V*), то они должны выполняться и для всех элементов Ak(V*). Итак, мы доказали, что ** = (-l)fe("-fe)(a,a) на Ak{V*). Если η — нечетное число и (σ, σ) = +1, что справедливо для пространства R3 с евклидовым скалярным произведением, то *(*λ) = λ. Однако, в общем случае это не выполняется. Используя только что полученный результат, т. е. что **w = (-l)fe(n-fe)(a,a)w, мы можем вывести полезную формулу для скалярного произведения двух любых А;-форм. Сначала заметим, что поскольку **ω = ±ω, то четыре последовательных применения звездного оператора приводят к тождеству, т. е. ****ω = id. По определению звездного оператора (****λ,ω)σ = **(*λΛω) = (-l)fe(n_fe'(a,a)*A Αω
18.3. Интеграл Дирихле и лапласиан 909 выполняется для двух любых А;-форм λ и ω. Следовательно, (Α,ω)σ = (-1^(σ,σ)*ΑΛω = ω Λ *λ(σ, σ). Однако, ***σ = **(1) = (σ, σ)1. Действуя оператором *** на обе части уравнения, получаем (λ,ω)(σ,σ)1 = ***(ω Λ *λ)(σ,σ)1 или (λ, ω) = ***(ω Λ *λ) = ***(λ Λ *ω). Еще один полезный результат получается из (•Α, *ω)σ = АЛ *ω. Действуем оператором * на это уравнение и получаем (•λ, *ω) = *(λ Λ *ω) = *(ω Λ *λ). С помощью полученных здесь формул скалярные произведения могут быть записаны через звездный оператор. 18.3. Интеграл Дирихле и лапласиан Пусть ω обозначает А;-форму, а А — (к — 1)-форму. Тогда d{\ Л *ω) = d\ Л *ω + (-l)fe-1A Л ά(*ω). Поэтому для любой (ограниченной) области U мы имеем / d\ Л *ω + (-l)fe-1 / λΛά(*ω)= / ά(λΛ*ω). Ju Ju Ju Предпололсим, что А или ω обращаются в нуль на границе dU (в том числе если U неограничена и если А или ω имеет компактный
910 Глава 18. Звездный оператор носитель внутри U или если они стремятся к нулю на бесконечности достаточно быстро). Тогда по теореме Стокса имеем / d\ Л *ω + I (-l)fc_1A Л d(*w) = 0. Ju Ju Действуя * на формулу {ρ, τ) = ***(р Л *т), мы видим, что d\ Л *ω = (<ίλ,ω)*1. С другой стороны, ω является А:-формой, поэтому *ω является (п—А:)-формой и, следовательно, ά*ω является (п—А;+1)-формой. Тогда А Л d*w = (-l)(fc-1)(n-fc+1)d*a; Л А = (-1)(*-1)(»-*+1)(*-1(ί*ω,λ)σ = (-ΐ)^-1)^-^1)^,*-^*^. Далее, *<ί*ω является формой степени η — (п — к + 1) = к — 1. Тогда поскольку **** = id, получаем *_1d*w = **(*<ί*ω) = (-1)(*-1)(η-*+1)(σ,σ)*«ί*ω и σ = (σ,σ)*1. Таким образом, λ Λ <ί*ω = (λ, ***<ί*ω)*1. Итак, мы можем написать d\ Л *ω + (-l)fc_1A Л ά*ω = [(άλ,ω) + (-l)^1'^, *_1d*w)]*l. Значит, если А или ω обращаются в нуль на границе 0U (если область U ограничена) или имеют компактный носитель (или убывают достаточно быстро на бесконечности), то / (άλ,ω) = / (A, (-l)fe***d*o;)a. Ju Ju
18.3. Интеграл Дирихле и лапласиан 911 Определим оператор d* согласно формуле ά*ω = (-l)fe***d*o; = (-l)k*~1d*uj. Таким образом, d* отображает А;-формы в (к — 1)-формы. Для произвольных А;-форм Лиг давайте напишем (Х,т)и = Du(X,r)a = /(Α,τ)σ. В этом случае получим Du(dX,u) = Du{\,d*u;) для А или ω, равных нулю на границе 0U (или достаточно быстро убывающих на бесконечности). Заметим, что d*d* = О, поскольку dd = 0. Давайте определим оператор Лапласа D, отображающий А;-формы в А;-формы, формулой1 D = dd* + ά*Σ Утверждается, что Dd* =d*a, D* = *D. Чтобы установить равенство Dd = dD, заметим, что Dd = (dd* +d*d)d = dd*d и dU = d{dd* +d*d) = dd*d, 1Этот оператор D отличается от лапласиана, определенного в предыдущих главах, знаком минус.
912 Глава 18. Звездный оператор поскольку dd = 0. Аналогичное вычисление показывает, что ad* = d*a. Доказательство равенства D* = *□ чуть сложнее, потому что необходимо следить за знаками. Начнем с равенства ά*ω = (—1) ***ά*ω для А;-формы ω. Заменив А;-форму ω на (п — А;)-форму *ω, мы имеем ά*ω = (-l)n_fe***d**a;. Поскольку ά(**ω) является (к + 1)-формой, **d(**w) = (-1)<к+1Нп-к-1\а,а)а{**ш). А поскольку ω является А:-формой, **ω = {-1)^η^\σ,σ)ω. Собирая вместе эти результаты и учитывая, что (σ, σ)2 = 1, мы получаем <Γ*ω = (-l)"-fc(-l)(fc+1)(n-fc-1)(-l)fc(n-fc)*dw или ά**ω = (_ΐ)(*+1)(»-*-1)(_ΐ)(*+1)(»-*)*(ίω = (-l)*-1*^. С этим результатом и формулой *d*u = (—l)kd*Lu доказательство становится совсем простым: *Du = *d(d*u) + *ά*(άω), Λω = (-l)kd*<L· + (-l)k+1d*<L·. В то же время \3*ω = άά**ω = ά*ά*ω, Π\*ω = {-l)k+1d*diu + (-l)fcd*d*w.
18.3. Интеграл Дирихле и лапласиан 913 Следовательно, *П = D*. Оператор D в пространстве R3. Вычислим явный вид лапласиана в пространстве R3. Для функции / имеем D/ = dd*f + d*df. Однако, */ является 3-формой и dQ = 0 для любой 3-формы в R3. Поэтому D/ = d*df. Далее, dj = — dx + — dy + — dz dx dy dz и df , Of , *— dx = —— dy A dz. ox ox df d2f d*— dx = ^-2 dx Ady A dz d*[^dx\=-^d^dx = -d2f Отсюда dx J dx dx2' Проделав аналогичные вычисления для остальных двух членов, получаем J \dx2 dy2 dz2)' Давайте вычислим лапласиан для 1-форм. В этом случае достаточно вычислить О ω для ω = adx. Оператор D определяется только скалярным произведением и ориентацией. Поэтому он коммутирует со всеми вращениями, и оси молено переставлять. Тогда, если мы получим формулу для D(odx), то аналогичная формула получится для D(bdy) и D(cdz). В силу линейности мы будем иметь формулу и для adx + bdy + cdz. Итак, d(adx) = da A dx = —- dy A dx + — dz A dx. dy dz Поэтому ,,, , „ da , da , *(d(adx)) = -— dz + — dy. dy dz
914 Глава 18. Звездный оператор Итак, 11/14 д2а , , д2а , , д2а , , д2а , a-kdlaax) = — , , dx/\dz—-—-^dy/\dz+n п dx/\dy+-^-^dz/\dy. дхду dyz oxoz ozz Следовательно, используя свойство * = *-1 для 2-форм в пространстве R3, получаем j* ι/ ι \ ../.χ д2а д2а д2а д2а d d(adx) = *d*d(adx) = , η dy — ττ~^ dx + n n dz — -—^dx. дхду dyz oxoz dz1 Далее, d*(adx) = —*d*(adx) = —*d(ady Adz) = —* -— dx Л dy Л dz \ ox _ da dx Итак, ,,,, , λ д2а , д2а , д2а dd (adx) = -—-j dx- ——- dy - Έ-—άζ. οχΔ дхду dxdz Отсюда следует, что 0(adx) = (Oa)dx д2а д2а д2а\ дх2 ду2 dz2J Таким образом, если иг = adx+bdy+cdz,m мы можем вычислить Πω, подействовав оператором D на каждый член. Произвольная 2-форма в пространстве R3 может быть записана как *ω, где ω является 1-формой. Поскольку *□ = D*, мы видим, что для 2-формы Ω = A dx Л dy + В dz Л dx + С dy Л dz получается тот же результат D Ω = (D A) dx Л dy + (D В) dzAdx + (D С) dy Л dz.
18.3. Интеграл Дирихле и лапласиан 915 Аналогично для 3-формы D(pdx Л dy Л dz) = (Dp) dx Ady Л (1г. Итак, в обычных прямоугольных координатах в пространстве Ш. мы можем вычислить D для любой формы, действуя оператором D на каждый коэффициент. А теперь давайте повторим рассуждения из последнего параграфа главы 17 — сведение уравнений магнитостатики к уравнению Пуассона. Предположим, что выбраны такие единицы, для которых μ = 1. Тогда положим 3 = ~*J- Теперь уравнения молено записать в виде dB = 0, d*B = Airj. Выберем такое А', чтобы dA' = В. (Это возможно, так как мы предположили, что Н1 = 0.) Решаем уравнение Пуассона Οφ = ά*Α'. Заменяем А' на А = А' - άφ и получаем dA = B. Поскольку ψ является функцией, то Πφ = ά*άφ = ά*Α'. Следовательно, d*A = d*A' - ά*άφ = 0. Итак наше второе уравнение принимает вид d*dA = 47Tj",
916 Глава 18. Звездный оператор или, поскольку d* A = О, ПА = 47TJ. Кажется, будто в этом доказательстве мы использовали тот факт, что В является 2-формой, А — 1-формой, а ф — функцией. На самом деле это верно в общем случае. Пусть В является к- формой в n-мерном пространстве. Мы хотим решить уравнения сШ = 0, d*B = Airj. Предположим, что рассматриваемая область такова, что В = dA' для некоторой А'. Тогда решаем уравнение Пуассона Πψ = ά*Α'. Напишем А = А' - dip. Тогда d*A = άά*φ. Следовательно, dd*A = 0 и ПА = (dd* +d*d)A = 4Trj. Таким образом, мы опять свели задачу к решению уравнения Пуассона. 18.4. Оператор D в четырехмерном пространстве-времени Рассмотрим четырехмерное пространство-время с координатами t, χ, у, ζ и скалярным произведением, для которого выполняются
18.4. Оператор D в четырехмерном пространстве-времени 917 условия (dt,dt) = 1, (dx,dx) = (dy,dy) = (dz,dz) = —1. Подействуем оператором D на функцию □/ = d*df = -* d*\Ttdt + Txdx + -d-ydv + Tzdz) — — dx A dy A dz — — dt A dy A dz Of df \ + -^-dtAdx Adz- ^-dtAdx Ady) ay oz J -i / d2f d2f d2f d2f\ _, J _, _, =-* 4~^+^+^+^riAdxAdyAd" Откуда _aV d2/ d2/ d2/ ' ~ at2 + ax2 + dy2 + dz2' В качестве 1-формы сначала рассмотрим adt. Получим ι/ ι \ да . , да да , , о( о at) — — dx A dt + — dy A dt + — dz A dt, ox dy dz тогда ., , . да , , да , , да , *ct( α dt) = — — dy A dz + — dx A dz — — dx A dy ox oy oz d2a d-kd(a dt) = -7Γ-Τ- dt A dy A dz otox d2a , , , d2a + n , dt A dx A dz — 7—^ dx Ady A dz oyot oyz d2a , , , d2a , — n n dt Adx Ady — ■—-= dx Ady A dz. ozot ozz Следовательно, d*d{adt) - *~1d*d(adt) id2a d2a d2a\ , d2a , d2a , d2a , dx2 dy2 dz2 J dxdt dydt dzdt
918 Глава 18. Звездный оператор С другой стороны, d*(adt) = — * 1d*(adt) = *-1d(a dx A dy A dz) -1 да , = * — dt Λ dx Λ dy Λ dz dt y да = "dt' Откуда ιι*/ .4 d2fl , д2а . д2а , 52α , dd (adt) = -ша- — ах-ш-ау-шаг. Итак, получаем ,-,/ , ч /,-, ч , / ^2β d2fl 920 92θλ , D(aett) = (Da)ett = ^-_ + _ + _ + — j Л. Аналогичное вычисление (или использование вращательной инвариантности2) показывает, что U{bdx) = (Db)dx, a(cdy) = (pc)dy, и так далее. То же самое выполняется и для 2-форм. Например, рассмотрим adt Adx. Получим d*(adt Adx) = *~1d*(adt A dx) = *~1d(ady Adz) = *-1 I — dt A dy A dz 1 + *-1 I — dx A dy A dz 1 3a , da , = -mdx-dx-dt- 2 Здесь под вращениями следует понимать собственные преобразования Лоренца, сохраняющие лоренцево скалярное произведение и ориентацию пространства-времени. — Прим. ред.
18.4. Оператор D в четырехмерном пространстве-времени 919 Откуда ,,*/ ,ч ( д2а д2а\ , , д2а , , д2а , dd (a at) = - -^тт + тгт \dtAdx- -—— dyAdx- -^-^- dz A dx \ dtz ox1 J dtdy dtdz д2а J J д2а , J dt Ady — αί Λ αζ. дхду dxdz С другой стороны, да да d(a dt A dx) = — dy A dt A dx + — dz A dt A dx, oy dz поэтому ,. , , . да , да , *d(a dt Adx) = — -— dz + — dy dy dz d-kd(adt A dx) = — 7—^ + 7—^ dy Adz — , , ax Л az \дуг dz1 J дудх д2а 7j d2a 7j d2a αϊ Λ dz + dt Ady + a ax A dy. dydt dzdt dxdz Тогда d*d{adt A dx) = — *~ld*d(adt Л dx) rv j j ч /n ч j j / d2a ^2a d2a 32αλ D(adtAds) = (Da)diAar = {--^ + _ + _ + — j diAdx. Мы предоставляем читателю самостоятельно проверить, что D(6 dx A dz) = (D b) dx A dz. Итак, мы получили, что для любой 2-формы, записанной через dt, dx, dy, dz, действие оператора D равносильно действию этого оператора на коэффициенты. Справедливость аналогичного утверждения для 3- и 4-форм вытекает теперь из рассмотренных случаев 0-, 1- и 2-форм и равенства *П — D*.
920 Глава 18. Звездный оператор 18.5. Алгебра Клиффорда Теперь читатель уже, должно быть, догадался, что в пространстве Ш.п мы можем вычислить действие оператора □, записанного в евклидовых координатах, на произвольную А:-форму как действие этого оператора на каждый коэффициент. Кроме того, уже понятно, что если мы попробуем доказать этот результат теми лее методами, которые использовались в последних двух параграфах, то просто запутаемся. Цель этого параграфа — ввести алгебраический формализм, который позволит нам доказать все очень просто. В этой книге нам больше не понадобятся результаты данного параграфа — ведь мы уже доказали результаты в важных случаях трех и четырех измерений. Однако, излагаемые здесь идеи оказались очень важными в современной физике. Наше доказательство будет основано на следующем свойстве Du(doj, τ) = Du{u, d*r) + граничные члены. Это свойство молено перефразировать, говоря, что d* является формальным сопряжением d. Слово «формальный» означает «по модулю граничных членов». У нас есть равенство Όυ(άω,τ) = Όυ(ω,άΤτ), только когда делаются различные предположения, которые гарантируют отсутствие вклада от границы. Давайте рассмотрим эту ситуацию в более общем случае. Пусть Ε и F обозначают векторные пространства, в каждом из которых имеется свое скалярное произведение. Тогда мы можем идентифицировать Ε с Е* и F с F*. В частности, если А : Ε —> F — линейное отображение, то мы можем рассматривать А* : F* —> Е* как линейное отображение А* : F —> Е, определенное условием (e,A*f)E = (Ae,f)F, гДе (ν)β и ("> ")f обозначают скалярные произведения в пространствах Ε и F соответственно. Теперь предположим, что
18.5. Алгебра Клиффорда 921 в векторном пространстве V мы выбрали систему координат χι,... ,хп. Тогда соответствующая форма объема имеет вид σ = dx\ Л ■ ■ ■ Л dxn. Рассмотрим пространство гладких функций из V в Е, обозначаемое Τ(V, Е). Если щ и и2 — такие функции, a U — ограниченная область, то молено определить Du(ui,u2)= / (ui,u2)Ea. JU (Если область U не ограничена, то все равно мы можем определить Du для тех пар функций, которые достаточно быстро убывают на бесконечности.) Молено рассмотреть операторы L из Т(У, Ε) в Т(У, F). Тогда калсдой функции и G Т(У, Е) ставится в соответствие элемент Lu пространства Т{ V, F). Оператор L называется линейным дифференциальным оператором первого порядка, если существуют такие линейные отображения А\ : Ε —> F, А2 : Ε -> F, ..., Ап : Ε -> F и В : Ε -> F, что * ди . ди „ Lu = Ax-— + --- + Ап-— + Ви. ΟΧ ι ОХп В общем случае отображения А\,... ,Ап и В могут зависеть от точки в пространстве V, т. е. Αχ и В — это функции в пространстве V, значения которых являются линейными отображениями. Тогда предыдущее уравнение молено записать в форме ди ди (Lu)(x) = Αι(χ) — {χ) + ■ ■ ■ + Ап(х) — (х) + B(x)u(x). Если Ai и В постоянны, то мы говорим, что L является линейным дифференциальным оператором первого порядка с постоянными коэффициентами. Теперь пусть и G T{V, Ε) и ν G T{V,E). Тогда д ,. . fdAi \ ( . ди \ ( . dv\ -{AiU,v)F= (-к- u,v) + \Ai—-,v\ + [Αίη,ΈΓ) Ε ΟΧ% \ ΟΧί J ρ у ΟΧ% J ρ \ ΟΧί J ρ = (а<- V дхг' )F \ '\dxi/ )Ε \ ' ldxi)
922 Глава 18. Звездный оператор Поэтому £<*„»),-(„,^) _(«,(!£) ,» Г*„ Δ* 9V Δ* 9V Δ* dV j. ( Ft* ST (QA{ Итак, если мы определяем 9χι 29χ2 "пдхп ' V ^^V^xj то (Lu, v)f = О, L*v)E + Σ-γγ: (Aiu, v)F- Последний член справа сводится к умножению граничного члена на σ и интегрированию. Действительно, если мы напишем д τ = -—(А\и, v)f dx2 Λ · ■ ■ Λ dxn σχι то д — -—(A2U, ν)ρ dxi Л dx$ Л ■ ■ ■ Л dxn + дх2 я dr = YJ т.— (Aiu, v)p dx\ Λ ■ ■ ■ Λ dxTi OXi Тогда / (Lu,v)Fa = / (u, L*v)Ea + Ju Ju Jd т. dU Таким образом, оператор L* является формально сопряженным оператора L. Строго говоря, А:-форма ω не является функцией из пространства V в фиксированное векторное пространство. (Потому что ω(χ) является элементом пространства кососимметричных полилинейных А:-функций на касательном пространстве в точке х, а касательное пространство изменяется от точки к точке.) Однако, как только мы выбрали систему координат, А;-форму ω молено рассматривать как функцию из V в Ak(V*). Таким образом, мы
18.5. Алгебра Клиффорда 923 можем считать, что Ε = Ak(V*). Если мы хотим в качестве дифференциального оператора L взять d, то полагаем F = Ak+1(V*). Тогда молено написать д д d = ει"5 Ь · · ■ +εη- дх\ дхп' где ей обозначает линейное отображение Ak{V*) —> Afe+1(V^*), состоящее из внешнего умножения на dxk, т.е. ε&ω = dxfe Л ω. Теперь для вычисления d* нам нужна формула для е*к. Утверждается, что е*к = ±г ί —— 1 , причем знак соответствует (dxk,dxk) = ±1. Чтобы это доказать, предположим, что к = 1 (это просто вопрос обозначений) и исследуем, что происходит с базисными элементами ω — dx^ Λ ■ ■ ■ Λ dxik пространства Ak(V) и базисом Ak+1(V*). Существует две возможности. (a) i\ = 1. Тогда ε\ω = 0. С другой стороны, для г = dxj1 Λ ■ ■ ■ Λ dxjn мы имеем г ( — ) τ = 0 (если ji > 1) и г I —— 1 τ = dxj2 Λ · · · Λ dxjn (если j± = 1). В любом случае мы имеем <ειω'Τ>=(ω'Κέ)Τ)=°·
924 Глава 18. Звездный оператор (Ь) г'х > 1. Тогда ε\ω = dx\ Л dxix Л ■ ■ ■ Л dx{k и д \ _ I О, если j\ > 1, дх\ J \dxj2 Л ■ · ■ Л dxjk+1, если ji = 1. В этом случае (εχω,τ) = 0= (ω, г ί — J r J , если jx > 1. Если же ji = 1, то мы по-прежнему имеем (eiu,,r) = 0=(u,,i(A)r), кроме случаев, когда J2 = ί'ι, Эъ = г2 и так далее. Если J2 = i\, j3 = г2 и т.д., то {εχω,τ) = (ίώι,ώ;ι)(ω,ω), (ω'Κέ)τ) = (ω,ω)" Это доказывает, что ε* = (dxi,dxi)i ί — J . В общем случае доказательство показывает следующее. Пусть L : V —> V* обозначает линейное отображение, определенное скалярным произведением в пространстве V. Пусть θ — произвольная 1-форма и ε(θ) — внешнее умножение на Θ. Тогда (ε(θ))* = i{L~4). Определим
18.5. Алгебра Клиффорда 925 Мы показали, что п я dxf Из антикоммутативности внешнего произведения следует, что eveq + eqev = 0 для всех ρ и q. Следовательно (или непосредственно из свойств внутреннего произведения), LpLq + LqLp = О ДЛЯ ВСвХ ρ И q. Если ρ φ q, то внешнее умножение на dxp и внутреннее умножение на г(д/дхд) удовлетворяют равенству <(^)е(ЛГр)+е(ЛГр)<(^)=0- Действительно, достаточно проверить это равенство для ρ = 1, q = 2. Это простое вычисление мы оставляем читателю. С другой стороны, для базисных элементов ω мы имеем • ( д λ / , \ I О» если ω = dxi Λ · ■ ■ , г -— ε{άχι)ω = < \ox\J \ω, если ω = αχ2 Λ ■ ■ ■ , . , . / д λ ί ω, если ω = dx\ Λ · · · , εΐαχιμ —— } ω = < \οχι) 10, если ω = dx2 Λ ■ ■ ■ . Таким образом, г'(^)е(^1)+£(^1)г'(^)=И· Естественно обобщая со случая χ ι на случай хр, можно сделать вывод, что LpEp +ερίρ = ±id, где ± соответствует знаку (dxp,dxp).
926 Глава 18. Звездный оператор И наконец, поскольку операторы lv и eq постоянны (в нашей системе координат), то мы имеем ^+λ=-(ς<)(ς<) — у j\£pLq + bq£p) p,q г ч ^ dxl Итак, мы доказали формулу для D в евклидовых координатах. В случае положительно определенного скалярного произведения операторы ερ и iq имеют очень важное значение в квантовой физике, где они известны как операторы рождения и уничтожения фермионов. Равенства £p£q ι Sq£p = U, ^p^q ι LqLp = U, £pLq Τ Lq£p — \ [i, v = q называются антикоммутационными соотношениями для этих операторов. Алгебра, порожденная этими операторами, т. е. множество всех сумм и произведений ει и ц, является частным случаем семейства алгебр, построенного Клиффордом в девятнадцатом веке. Эти алгебры, т. е. множества объектов, для которых определены операции сложения и умножения, были разработаны Клиффордом как обобщение систем комплексных чисел и кватернионов Гамильтона. Они играют очень важную роль в современной физике, поэтому мы и расскажем здесь о них. Начнем с переформулировки предыдущего примера антикоммутационных соотношений между операторами рождения и уничтожения фермионов. Пусть V — векторное пространство, а V* — его дуальное пространство. Рассмотрим пространство прямой суммы W = V Θ V*. Тогда вектором пространства W является
18.5. Алгебра Клиффорда 927 w а , где ν G V и α G V*. Определим скалярное произведение в пространстве W формулой (w,w') = -(a(v') + c/(v)), где w = а Пусть vi,.. -, νη образуют базис пространства V, а а1,..., ап дуальный базис пространства V*. Тогда вектора О а- ι > образуют базис пространства W. Обозначим эти вектора ер и i9, т. е. положим _ ί vp iq = В этом случае (ер, е„) = 0, (ip, i„) = 0, /а η J o> если Р = ^ I 0, если ρ φ q Теперь мы можем записать антикоммутационные соотношения для ег- и ц в краткой форме. Будем считать, что ερ соответствует ер, а Lq соответствует iq, т. е. рассмотрим линейное отображение 7, определенное формулами 7(ер) = ερ, 7(i9) = Ч- Тогда для w = v\e.\ -\ h vnen + α1!! Η + αηΊη
928 Глава 18. Звездный оператор получаем, что 7(w) = υιει Η + νηεη + α1^ Η + αηίη является элементом нашей алгебры и 7(w)7(w') + 7(w')7(w) = 2(w, w')id. Это можно обобщить на любое векторное пространство W, имеющее скалярное произведение (-,-) (возможно, вырожденное). Итак, каждому векторному пространству W со скалярным произведением (-, ·) соответствует ассоциативная алгебра3 C(W), называемая алгеброй Клиффорда для W и (-,-). Должно существовать такое линейное отображение η : W —> C(W), что (i) каждый элемент C(W) может быть записан в виде суммы произведений элементов j(W) (и кратных I); (ii) 7(w)7(w') + 7(w')7(w) = 2(w, w')I. (Когда мы говорим «алгебра Клиффорда для ... », то подразумевается теорема — для данного пространства W со скалярным произведением (·, ■) существует алгебра C(W), удовлетворяющая условиям (i) и (ii). При этом C(W) единственна с точностью до изоморфизма. В приложении к этой главе мы дадим краткое доказательство этой теоремы.) Давайте рассмотрим несколько примеров. (а) Пусть одномерное пространство W имеет отрицательно определенное скалярное произведение. Это значит, что существует вектор е, для которого (е,е) = -1 и каждый элемент пространства V кратен е. Согласно (ii), 7(e)2 = -1, Под ассоциативной алгеброй А мы подразумеваем, что А является векторным пространством с билинейным отображением А х А —> А, называемым умножением. Предполагается, что это умножение удовлетворяет ассоциативному закону и что для него существует нейтральный элемент I.
18.5. Алгебра Клиффорда 929 а условие (i) говорит нам, что каждый элемент C(W) можно записать в форме Если положить 7(е) = i> то сразу видно, что C{W) оказывается алгеброй комплексных чисел. (Ь) Пусть V = R2, причем скалярное произведение противоположно обычному. Тем самым (ν, ν) = —χ2 — у2, если ν = Пусть i = 7(J) и j = 7Vi Условие (ii) говорит, что i2 = -I, J2 = -I и ij+ji = 0. Тогда условие (i) означает, что каждый элемент C(W) можно записать в форме ol + bi + cj + dk, где мы положили Тогда так что Кроме того, k = ij. к2 = ijij = -iijj = -I, i2=j2 = k2 = -I. ij = k, jk = jij = -ijj = i, ki = iji = iij =j,
930 Глава 18. Звездный оператор kj = ijj = -i и ik = iij = -j. Подведем итоги: ij = k, jk = i, ki = j, ij = -ji, jk = -kj, ik = -ki. Эта алгебра называется алгеброй кватернионов. Впервые она была найдена Гамильтоном. В общем случае для проверки условия (ii) достаточно показать, что 7(w) = (w, w)I. Действительно, 7(w + w')2 = [7(w) + 7(w')]2 = 7(w)2 + 7(w)7(w') + 7(w')7(w) + 7(w')2 7(w + w')2 = (w + w', w + w')I = (w, w)I + 2(w, w')I + (w', w)I, т. е. условие (ii) доказано. Приняв это во внимание, возьмем W = R1'3, т.е. пусть W будет пространством-временем с лоренцевой метрикой. Положим 't\ /0 0 t + z х + \у\ χ /\|0 0 χ — \у t — ζ у И 7(W)= t-z -x-iy 0 0 ,zj \-x + \y t + z 0 0 W Тогда 7(w)2 = (ΐ2 - χ2 - у2 - ζ") /1 0 0 0\ 0 10 0 0 0 10 \0 0 0 1/
18-6. Звездный оператор и геометрия 931 Итак, если единичную матрицу 4x4 обозначить I, то условие (и) будет выполнено. По существу мы можем рассматривать C(W) как определенную подалгебру алгебры комплексных матриц 4x4. Эта алгебра C{W) называется алгеброй Дирака. Она была разработана Дираком, когда он исследовал электрон. Сейчас она играет важную роль в теории элементарных частиц. (с) Пусть W — произвольное векторное пространство, а скалярное произведение (-, ■) тождественно равно нулю. Тогда условие (И) говорит, что Ί{νί)Ί{ν/) = -7(w')7(w) для любых w и w'. В этом случае C{W) оказывается в точности внешней алгеброй A(W). 18.6. Звездный оператор и геометрия В главе 16 мы видели, что звездный оператор, действующий из Л1(М3) в Л2(М3), определяет евклидово скалярное произведение в пространстве R3. Это не что иное, как математическое выражение того факта, что диэлектрические свойства вакуума определяют евклидову геометрию пространства. Сейчас мы можем поставить следующий вопрос. Пусть V обозначает векторное пространство с заданной ориентацией, и пусть (·,·) и (·,·)' — два невырожденных скалярных произведения в пространстве V. Предположим, что при некотором к, где 1 < к < η = dim V, они дают один и тот же звездный оператор из Ak(V*) в кп~к(у*). Значит ли это, что (-,-) = (-,■)'? Ответ почти утвердительный. Рассмотрим несколько примеров. Возьмем V = Ш2 с обычным скалярным произведением. Тогда мы можем ЛХ(М2*) идентифицировать с R2. Как мы уже видели, звездный оператор * : AX(R2*) —> Л1(М2*) в этом случае является просто поворотом на девяносто градусов. Всякое другое скалярное произведение в пространстве R2 (или в R2*) определяется формулой (u,v)' = (Au,v),
932 Глава 18. Звездный оператор где А — симметричная матрица. Если (·, ■)' определяет тот же самый оператор, то мы должны иметь равенство (*u,*v)' = (и, ν). Откуда R~lAR = А. Однако, если RAR~l = А для некоторого нетривиального вращения R (не на 0 или 180 градусов), то А должна быть пропорциональна единичной матрице.4 Тогда (u,v)' = A(u,v), где А — число, отличное от нуля. Мы сейчас покажем, что (-,-)' при А > 0 определяет тот же самый оператор *. Таким образом, на плоскости оператор * не определяет геометрию Евклида, но определяет конформную геометрию. Этот факт является основой теории функций комплексного переменного. Введение в эту тему мы изложим в главе 20. Давайте посмотрим, как в общем случае масштабное преобразование (замена ν на cv, где число с отлично от нуля) действует на оператор *. При умножении длины на с площадь умножается на с2, объем умножается на с и так далее. Поэтому в пространстве Ak(V*) мы умножаем на ск. Тогда, чтобы масштабный множитель с не оказывал никакого эффекта, должно выполняться равенство (ск\, сп-ки)спа = ск\ Л сп~ки. Чтобы получить ту же линейную функцию ω, мы должны иметь с2к-п = L Итак, при к = п/2 масштабное преобразование не влияет на • : Ak(V*) —> Ak(V*). Несложно доказать, подобно тому как мы делали это в главе 16 для * : Л1(М3*) —> Л2(М3*), что во всех остальных случаях звездный оператор определяет скалярное произведение однозначно. Аналогичное утверждение справедливо в евклидовом пространстве любой размерности; доказательство оставляем в качестве упражнения. — Прим. ред.
18.7. Звездный оператор и векторный анализ 933 Вернемся к очень важному вопросу, который мы здесь только слегка затронем. Вспомним, что обсуждая диэлектрическую постоянную, мы допускали возможность, что е может быть переменной симметричной матрицей /Εχχ Еху Εχζ\ I £yx £уу £yz I , \£zx &zy &zz/ все элементы которой являются функциями в пространстве R3. Но тогда возникает мысль, что само понятие длины должно меняться от точки к точке, т. е. что скалярное произведение двух касательных векторов ξ = (χ, ν) и η = (x,w) в точке х дается формулой где ν% и w3 — координаты векторов ν и w. Идея, что скалярное произведение может меняться от точки к точке, впервые была высказана Риманом и с тех пор является одной из основ геометрии. В частности, именно отсюда пошла теория относительности Эйнштейна. Теория звездного оператора без проблем распространяется на риманову геометрию. 18.7. Звездный оператор и векторный анализ Как обычно, существование скалярного произведения устанавливает соответствие между пространством V и его дуальным пространством V* = Л1 (К), которое можно использовать для идентификации дифференциальной формы с векторным полем. Для удобства обозначений векторное поле, связанное с дифференциальной формой, будем помечать тем же символом со стрелкой над ним, т. е. если А — 1-форма, то А обозначает векторное поле, связанное с ней формулой ш[А] = (Α, ω) для всех 1-форм ω. Итак, если имеется векторное поле А = Aiei + А2е2 + ■■■ ,
934 Глава 18. Звездный оператор то связанная с ним 1-форма А = ±Αχ dxl ±A2dx2-\ , где знак каждого члена выбирается в соответствии со знаком (щ,щ) = ±1. В частности, в пространстве R3 с евклидовым скалярным произведением, если А = Ахвх + АуВу + Л.2е2, то А = Axdx + Aydy + Az dz. Для четырехмерного пространства-времени с лоренцевым скалярным произведением, если А = Atet + Ахех + Ауеу + Azez, то А = At dt — Ах dx — Ay dy — Az dz. Теперь в пространстве R3 мы можем записывать операции векторного анализа через звездный оператор и оператор d. Тогда скалярное произведение5 можно записать в виде А ■ В = *(А А *В) = *(В Λ *Α), а векторное произведение в виде Ах В = *(А Λ В). Дифференциальные векторные операторы принимают вид grad/ = df, - > rot A = *dA, div A = *d*A. Читателю следует отличать скалярное произведение из векторного анализа (dot product), имеющее физико-геометрическую природу, от соответствующего термина линейной алгебры (scalar product) с его формальным определением. Это объясняет различие в английских названиях и в обозначениях. — Прим. ред.
18.7. Звездный оператор и векторный анализ 935 В системах координат, отличных от декартовой, связь между векторным полем А и дифференциальной формой А устанавливается, если сначала построить ортонормированный базис 1-форм в каждой точке. Например, в цилиндрических координатах dr, г άθ и άζ являются ортонормированными 1-формами, дуальными к (единичным) базисным векторам ёг, ё# и ё2. Тогда А = Агёг + Адёд + Azez соответствует 1-форме А = Ar dr + Ад{г άθ) + Az dz. Аналогично в сферических координатах dr, rd6, rsm-θάφ — ор- тонормированные 1-формы, дуальные к базисным векторам ёг, ёв,ёф. Тогда А = Агёг + Авёв + Афёф соответствует А = Ar dr + Адг άθ + АфГ sin θ άφ. Теперь очень просто вычислять div, grad, rot в цилиндрических или сферических координатах. Правило применения оператора ά одинаково во всех системах координат. Звездный оператор действует на ортонормированный базис {аг,г άθ,άζ} или {dr, г άθ, г sin θ άφ} точно так же, как и на базис {ах, ау, άζ}. Например, мы хотим вычислить rot А в цилиндрических координатах, используя rot Л = -каА: А = Агёг + Адёд + Azez, А = Arar + Agr άθ + Αζ άζ, ,. (dAz d{rAe)\ l/jatJb (дАг дАЛ dA=\-W- -^z-J г{Ыв Λ dz) +{-dz--^r-) {dZ Λ dT)
936 Глава 18. Звездный оператор Теперь заменяем dr на ёг, г άθ на ёд и dz на ё2 и получаем .-. (дАя д{гА6)\ 1. , (дАг &42\ djrAp) дАг\ 1. дг дв ) г + I ~Чг^ - -^ I -ё2. Аналогично вычисляется дивергенция радиального вектора в сферических координатах, используя div А = *ά*Α: A = Ar dr, *A = Ar{rd6 f\r sin θ άφ) = r2Ar sin θ άθ Λ άφ, d*A = y n r' sin ваг Αάθ Λάφ or 1 d(r2Ar) , Jn . л,± — dr Л г αθ Λ r sin θ αφ, г2 дг , . 1 d(r2Ar) ,. χ *d*A = -^-4;—- = div A rz or Итак, секрет состоит в том, что сначала надо выразить все дифференциальные формы через ортонормированные 1-формы и только потом действовать звездным оператором. Приложение: тензорные произведения Для того, что мы делаем в этой книге, очень важно понятие тензорного произведения двух или более векторных пространств. Это одно из основополагающих понятий в теории векторных пространств. Мы должны здесь дать его краткое изложение, потому что оно отсутствует во многих учебниках по элементарной линейной алгебре.6 6 Этим недостатком не обладают большинство учебников линейной алгебры на русском языке. С другой стороны, необходимо отметить, что в этой книге авторы так и не приводят явного определения тензора — столь же фундаментального понятия линейной алгебры (и не только), включающего в себя большинство изучаемых ею объектов и давшего название изучаемой в этом приложении операции над векторными пространствами. — Прим. ред.
Приложение: тензорные произведения 937 Пусть у нас есть векторные пространства V, W и U. Отображение / : V х W —> U называется билинейным, если /(νι + v2, w) = /(vi, w) + /(v2, w), /(v, wi + w2) = /(v, wi) + /(v, w2) и /(αν, w) = o/(v, w) = /(v, ow) для скаляра о. Другими словами, отображение / называется билинейным, если оно линейно по ν при фиксированном w и линейно по w при фиксированном v. Известным примером, когда V = W = U, является векторное произведение в обычном трехмерном пространстве. Взяв пространства V и W, мы хотим построить векторное пространство Ζ и билинейное отображение Ъ : V х W —> Ζ, которое будет универсальным в следующем смысле. Предположим, что / : V х W —> U — произвольное билинейное отображение. Тогда существует единственное линейное отображение If : Ζ —> U такое, что f = lfob. На диаграмме это можно изобразить так: V х W *Z и Таким образом, для любого / существует единственное линейное отображение If, для которого If оЬ = /, т. е. диаграмма коммутативна. Заметим, что если Ъ и Ζ существуют, то они единственны с точностью до изоморфизма. Действительно, предположим, что Ъ' и Ζ' — другое универсальное билинейное отображение. Тогда, положив U = Ζ' и / = У а нашей диаграмме, мы получим
938 Глава 18. Звездный оператор Таким образом, имеем отображение 1у : Ζ —> Ζ' с Ъ = /б' о Ъ. Аналогично получаем линейное отображение 1ь : Z' —> Ζ с Ь = 1ь о Ъ'. Но тогда Ь= (lbolb,) ob. В то же время V х W *Z Значит, I = id и I = 1ь о If/ удовлетворяют уравнению Ъ = 1Ъ. В силу единственности мы приходим к выводу, что lb ° h' = id и аналогично If ° 1ь = id- Таким образом, 1у дает изоморфизм Ζ с Ζ' и У = 1у о Ъ. Поэтому с точностью до изоморфизма Ъ и Ζ определены однозначно. Наша задача состоит в том, чтобы показать существование такой пары (Ь, Ζ). Мы здесь приведем два построения, которые на первый взгляд выглядят различными. Однако в силу единственности они должны давать одинаковый результат. Пусть У обозначает пространство всех скалярных билинейных функций, определенных в пространстве V х W. Тогда α G У является билинейным отображением V х W —> Ш. Очевидно, что множество всех билинейных функций α образуют векторное пространство У. Возьмем Ζ = Υ*.
Приложение: тензорные произведения 939 Тогда вектор в пространстве Ζ является линейной функцией на пространстве У. Отображение Ь : V х W —> Ζ определим формулой [6(v,w)](a) = a(v,w). Это значит, что b(v, w) является такой линейной функцией, которая каждой билинейной функции а приписывает значение a(v, w). Очевидно, что fe(v, w) зависит линейно от α и билинейно от ν и w. Утверждается, что Ъ и Ζ дают решение нашей общей задачи. Действительно, пусть / : V х W —> U — билинейное отображение. Здесь U обозначает векторное пространство. Для каждого ν G U* мы получаем билинейную функцию ν о / е У Итак, мы определили линейное отображение I* : U* —> У: 1*{у) = t/o/. Отсюда получаем его сопряженное I** : Ζ = У* —> ί7**. По определению r*(6(v,w))H=b(v,w)(/>)) = (Z»)(v,w) = (^°/)(v,w) = i/(/(v,w)). Другими словами, i**(b(v, w)) оказывается той линейной функцией в пространстве {/*, которая каждому ν приписывает число i/(/(v, w)). А сейчас вспомним, что существует канонический изоморфизм7 где каждый элемент u G 17 идентифицируется с линейной функцией г(и) на пространстве U*, согласно формуле %{и)[у) = t/(u), u G 17, t/ G 17*. 7Напомним, что он называется отображением вычисления. В дальнейшем для значения элемента a g U* на векторе и ε С/ также используется «симметричное» обозначение {а, и) = (и, а) = г(и)(а) = а(и). — Прим. ред.
940 Глава 18. Звездный оператор Тогда мы можем написать r(b(v,w))=i(/(v,w)). Используя эту идентификацию г, можно написать I** = г о /, где / является отображением Ζ —> U. Итак, мы нашли отображение I : Ζ —* U, удовлетворяющее условию / о Ь = /. Предположим, что существует два таких отображения. Тогда для их разности т следует, что (т о b)(v, w) — 0 для всех v, w G V. Значит, m*(i/)(b(v, w)) = 0 для всех ν G U*. Итак, m*(v) G Υ является такой билинейной функцией на пространстве V х W, которая приписывает 0 всем парам (v, w), т.е. т*{и) является нулевой билинейной функцией. Поскольку т* переводит все элементы пространства U* в нуль, это нулевое линейное отображение. Отсюда следует, что т = 0. Таким образом, мы доказали единственность /. Пространство Ζ называется тензорным произведением пространств V и W и обозначается V <8> W. Кроме того, мы будем пользоваться обозначением b(v, w) = ν <g> w. Предположим, что пространства V и W конечномерны. Пусть {βχ,..., ет} — базис пространства V, a {fi ..., fn} — базис пространства W. Тогда билинейная функция β на пространстве V <8> W полностью определена своими значениями /?(ej,fj). Мы можем записать β = ^β{^ί,ΐύ)είί, где Sij — билинейная функция, определенная формулами: Sij(v, w) = ViWj, если ν = υιβι Η h vmem, w = luifi Η h wnfn.
Приложение: тензорные произведения 941 Очевидно, что элементы ε^ линейно независимы и порождают пространство У, являясь его базисом. Дуальным базисом пространства Ζ = Υ* является b(ej, fj) = щ ® fj. Тогда если {ei,...,em} является базисом пространства V, a {fi,.-.,fn} является базисом пространства W, то {ej <S> fj}i=i,...,m;j=i,...,n оказывается базисом пространства V ® W. Кроме того, dim(V ® W) = (dim V) x (dim W). Опишем другой способ построения пространства V <g> W. Он более прямой и абстрактный, но имеет один недостаток — используются бесконечномерные пространства. Для произвольного множества Μ обозначим F(M) векторное пространство всех линейных комбинаций элементов этого множества8. Тогда F(M) будет состоять из конечных сумм вида amimi Η \-атктк, где rrii — элементы М, a ami — скалярные коэффициенты. Такие выражения складываются путем приведения подобных членов. Если Μ — конечное множество, то F(M) будет пространством всех функций на этом множестве, причем функция / соответствует формальной сумме ^2 /Mm. тем Если же Μ бесконечно, то можно считать, что F{M) является пространством всех функций на множестве М, которые равны нулю везде, кроме конечного числа точек. (Здесь мы отождествляем теМс функцией 6т, обладающей свойствами: 6т(п) = О, если η φ m, и 6т(т) = 1. Тогда общий вид элемента F(M) — это конечная линейная комбинация 6т. Отображение Μ —> F(M), переводящее т —> 6т, дает возможность рассматривать Μ как подпространство F(M).) Оно называется свободным векторным пространством над данным множеством. — Прим. ред.
942 Глава 18. Звездный оператор Пространство F(M) универсально по отношению к отображениям Μ на векторные пространства: для данного отображения φ : Μ —> U, где U — векторное пространство, существует единственное линейное отображение Ьф : F(M) —> U такое, что Ьфо6т = ф(т). Действительно, эта формула связывает Σ,ψ с элементами 6т и, следовательно, в силу линейности Ьф распространяется на все элементы F(M). Теперь вернемся к нашей задаче. Возьмем Μ = V χ W. Если φ — отображение множества V χ W —> U, то существует Ьф : F{V x W) —> ί/, которое линейно и удовлетворяет уравнению 1;ф о 6т = ф{т) для всех т & V х W. Если / : V х W —> U билинейно, то Lf должно обращаться в нуль на всех элементах "(V1+V2,W) — "(Vl,w) _ "(V2,W)> "(v,Wl+W2) _ "(v,Wl) _ "(v,W2)> "(rv,w) '"(ν,νν)) "(ν,™) '"(ν,νν)- Итак, Lf должно обращаться в нуль в подпространстве В, порожденном этими элементами. Тогда можно определить V <8> W как факторпространство V ®W = F{V x W)/B и отображение b : V χ W —>V®W формулой 6(V,W) = [5(v,w)], где [·] обозначает класс эквивалентности mod В. Теперь должно быть ясно, что это определение Ъ и V <8> W удовлетворяет сформулированным свойствам универсальности. Давайте получим ряд следствий из этой универсальности. Пусть V и W обозначают два других векторных пространства. Пусть А : V —> V и В : W —> W — линейные преобразования. Рассмотрим отображение, переводящее (v, w) в Αν <8> Bw. Очевидно, что оно билинейно. Следовательно, существует единственное линейное отображение V <8> W —> V <8> W, обозначаемое A <g> В, для которого справедлива формула (А ® B)(v <g> w) = Αν <8) Bw.
Приложение: тензорные произведения 943 Предположим, что А' : V —> V" и В' : W —> W" — еще одна пара векторных пространств и линейных преобразований. Тогда отображение, переводящее (v, w) в A'Av <S> B'Bw, обозначается А'А <g> В'В : V ® W -> V" ® W". Кроме того, у нас есть отображения и Л' ® В' : V" ® W -> V" ® W". Поэтому мы получаем (Л' ® В') о (Л ® Б) : V ® Ж -> 7" ® Ж". По построению (А' ® Β')(^ν ® Bw) = A A'v <g> BB'w. Следовательно, в силу единственности мы имеем (А' ® Б') о (А ® Б) = Л'Л ® Б'Б. Приведем еще одно следствие свойств тензорного произведения. Предположим, что в пространствах V nW имеются скалярные произведения (·,-)ν и (v)w- Рассмотрим скалярную функцию /, определенную на пространстве (V х W) х (V х W) формулой /((v,w),(v',w')) = (v,v')y(w,wV- Для заданных ν' и w' функция / билинейна по ν и w, т. е. определяет линейную функцию Z(v',w') на пространстве V <8> W, удовлетворяющую условию '(v',w')(v®w) = (v,v/)v(w,w')iv· Для заданных ν и w это выражение билинейно по ν' и w'. Поскольку каждый элемент а Е. V ®W является конечной суммой элементов вида ν <g> w, заключаем, что J(v',w')(a)
944 Глава 18. Звездный оператор билинейна по ν' и w' для любого заданного α в пространстве V <8> W. Итак, существует линейная функция 1а в пространстве V <g>W, для которой /Q(v'®w') = Z(v',w')(a). Тогда Ια(β) линейна по α и по β. Легко проверить, что (α,β)ν^ = Ια(β) определяет скалярное произведение в пространстве V ®W. Подведем итоги. Существует и однозначно определено скалярное произведение (·, -)v®w в пространстве V® W, которое обладает свойством (v <g> w, v' ® v/)v®w = (v,v')y(w,w')iv· Тензорные произведения и пространства линейных отображений. Здесь мы приведем еще одно полезное определение, связанное с тензорными произведениями. Пусть есть два векторных пространства V и W. Определим векторное пространство Hom(W, V) как пространство всех линейных преобразований из W в V. Это векторное пространство имеет размерность (dim W) (dim V). Для каждого ν G V и μ е W* рассмотрим линейное преобразование Tj} : W —> V ранга 1, определенное формулой T?(w) = (μ,ν,)ν. Здесь (μ,ντ) — это значение линейной функции μ G W* на векторе w G W. Очевидно, что отображение Т$ линейно зависит от ν для фиксированного μ и линейно зависит от μ для фиксированного v. Таким образом, мы имеем единственное линейное отображение i:V®W* ^Rom(W,V), определенное формулой i(v ® μ)\ν = (μ, w)v.
Приложение: тензорные произведения 945 Легко проверить, что отображение % инъективное. Оно отображает V <8> W* на подпространство Hom(W, V), состоящее из линейных преобразований конечного ранга. Если хотя бы одно из пространств W или V конечомерно, то это подпространство совпадает с Нот(И/, V). Если же оба пространства V и W бесконечномерны, то оно — собственное подпространство. Тензорные произведения более высокого порядка. Существуют несколько обобщений и модификаций понятия тензорного произведения, на которых мы здесь кратко остановимся. Предположим, что вместо двух векторных пространств V и W мы имеем к векторных пространств Vi,...,Vk- Тогда можно определить А;-линейное (или полилинейное) отображение / : V\ х · · · χ Vfe —> U, которое должно быть линейным по каждой из переменных, когда все остальные фиксированы. В этом случае существует универсальное пространство V\®· · -®Vk и полилинейное отображение т : V\ х · · · х Vk —> V\ <8> · · · <8> Vk, которое обладает теми же свойствами, что и в случае двух сомножителей. Из свойства универсальности следует, что существует изоморфизм (Vi <8>·-- <8> Vfc) <8> (Vfe+i ® · · · ® Vk+i) с Vi <8> - - - <8> Vfc+i, поскольку они оба удовлетворяют свойству универсальности для (к + /)-линейных отображений. Как и в случае к = 2, если нам даны линейные отображения Αι : V\ —> Wi, A? : V2 —> W2 и так далее, то мы получаем линейное отображение Αι ® · · · ® Ак : Vi ® · · · ® Vk -> Wi ® · · · ® Wk- Также получается обобщение правила вычисления композиции. Кроме того, при идентификации (Vi <8> · · · <8> 14) ® (14+ι <8> · ■ ■ <8> 14+г) с Vi <8> · · · ® 14+г мы получаем идентификацию (Αι <8> · ■ ■ <8> Α&) ® (-Afc+i ® · · ■ ® Afc+i) с Λι ® · · · ® Afc+i. Предположим, что 14 = 14 = ■ · · = 14 — одно и то же векторное пространство. Мы говорим, что полилинейное отображение /
946 Глава 18. Звездный оператор пространства V х ■ · · х V (к раз) в (другое) векторное пространство W кососимметрично, если /(Vl, ■ ■ ■ , Vj, Vi+i, . . . , Vfc) = -/(Vi, . . . , Vi+i, V< . . . , Vfc) для всех г = 1, 2,..., к. Другими словами, перестановка двух любых соседних индексов изменяет знак /. Отсюда следует, что для любой перестановки π индексов (1,..., к) можно написать /(v,(i),...,v»(fc)) = (sign ττ)/(νι,..., vfe). Теперь можно искать универсальное пространство и кососиммет- ричное полилинейное отображение, т. е. мы ищем векторное пространство Л (V) и такое кососимметричное полилинейное отображение mk : V х · · · х V (к раз) —> Ak(V), чтобы для любого косо- симметричного полилинейного отображения / : V х · · · х V —> U существовало единственное линейное отображение // : Ak(V) —> U, для которого / о тк = /. Изобразим это на диаграмме: к раз V χ · · · χ V kk{V) Таким образом, для данного отображения / должно существовать единственное отображение If. Отсюда немедленно следует, что если т^ и Ak(V) существуют, то они единственны с точностью до изоморфизма. Кроме того, любое из приведенных нами доказательств существования тензорных произведений приводит, с небольшими изменениями, к доказательству существования Ak(V) и т^- В частности, первое доказательство показывает следующее. Пусть V* — дуальное пространство к V. Тогда Ak(V*) можно идентифицировать с пространством всех А;-линейных кососимметричных функций на пространстве V x---xV.
Приложение: тензорные произведения 947 Внешняя алгебра. Рассмотрим отображение πι^+ι пространства V х · · · х V (к + I раз) в пространство Ak+l(V). Оно полилинейно и кососимметрично по первым к переменным, с одной стороны, и по остальным / переменным — с другой. Следовательно, оно определяет отображение Ak(V)®Al{V)^Ak+l{V), известное как внешнее умножение и обозначаемое символом Л. С помощью свойства универсальности легко проверить, что Л ассоциативно, т. е. (ω Λ σ) Л г = ω Λ (σ Λ г), где обе части отображают пространство Ak(V) <g> Al(V) <8> AP(V) на пространство Ak+l+P(V), ω G Ak(V), σ G Al(V) и т G A*(V). Кроме того, вычисляя значения на базисных элементах, можно проверить, что ω/\σ=(-1)Μσί\ω, ω G Ak{V), σ G Al(V). Наконец, предположим, что V имеет скалярное произведение. Тогда функция в пространстве (V х ■ · · х V) х (V х · ■ ■ х V) (каждый множитель входит к раз), заданная формулой /(νι, · · ·, vfe; wb ..., wfc) = Det((vi, Wj)v), полилинейна и кососимметрична по νχ,..., ν& и полилинейна и кососимметрична по wi,...,Wfe. Тогда, как мы уже обсуждали для индуцированного скалярного произведения в пространстве V <8> W, из универсальности следует, что / индуцирует скалярное произведение в пространстве Ak(V). Другими словами, мы получаем единственное скалярное произведение (v)Afc(V)> Для которого справедливо равенство (νι Л ■ ■ ■ Л vfe, wi Л ■ ■ ■ Л Wfe)Afc(v) = Det((vj, w,-)v)· Теперь идею «универсального объекта» можно использовать для построения алгебр, которые мы изучали в этой главе, т. е. для внешней алгебры и для алгебры Клиффорда.
948 Глава 18. Звездный оператор Приведем некоторые детали. Векторное пространство А называется алгеброй, если задано отображение т т: А® А —> А, называемое умножением. Образ т(а <g> b) будем обозначать о · Ъ или просто аЪ. Алгебра называется ассоциативной, если а{Ьс) = [аЪ)с для всех а, Ъ и с. Говорят, что она является алгеброй с единицей, если существует элемент, обозначаемый 1д (или просто 1, если нет риска путаницы), для которого выполняется равенство 1^о = о для всех элементов А. Если это специально не оговаривается, то все алгебры ассоциативны и имеют единицу. Тензорная алгебра. Пусть V обозначает векторное пространство. Рассмотрим следующую универсальную задачу: надо найти такую алгебру U и линейное отображение г : V —> U, чтобы для произвольной алгебры А и любого линейного отображения / : V —> А, существовал единственный гомоморфизм φ : U —> А, для которого справедливо равенство Ф(1и) = U и φ(ίν) = /(ν) для всех ν G V. (Здесь слово гомоморфизм означает, что φ — линейное отображение, удовлетворяющее условию ф{аЬ) = ф(а)ф(Ь).) Если U и г существуют, то пара (U,i) единственна с точностью до взаимнооднозначного гомоморфизма в силу тех же аргументов, которые
Приложение: тензорные произведения 949 применялись для всех универсальных построений. (Они действительно являются аргументами, принадлежащими теории категорий.) Как всегда, наша задача — построить одну такую алгебру. Рассмотрим (бесконечную) прямую сумму T(V) = R®V®(V®V)®(V®V®V)®--- . Превратим ее в алгебру, определив отображение ρ раз q раз p+q раз т = трд :(V®---®V)®(V®---®V)^V®---®V, которое должно быть единственным и удовлетворять формуле m[(vi ® ■ ■ ■ ® vp) ® (wi ® ■ ■ · ® wq)] =vi®---®vp®wi®---®wq (где просто убраны скобки). Полилинейность гарантирует, что это отображение корректно определено. Поэтому мы знаем, как умножать ар на Ьд, где ρ раз ар G Tp(V) d=V®-~--®V и Ьд е Tg(V). (Для г G Ш мы полагаем г ■ а = га.) Поскольку каждый элемент с» T{V) = @TT(V) г=0 является конечной суммой о = оо + αϊ + ■ ■ · + ог, где элемент ар G Тр(У), то дистрибутивный закон (билинейность) определяет умножение в T(V). Возьмем U = T(V) и пусть г : V —> T(V) — отображение, которое идентифицирует V как кусок прямой суммы T(V) для г = 1, обозначаемый T\(V). Возьмем линейное отображение / : V —> А. Тогда /(νι)/(ν2)
950 Глава 18. Звездный оператор (умножение в А) билинейно по νχ и V2- Следовательно, оно определяет отображение ф2 : V ® V -> А. Аналогично фг : Tr{V) -> A однозначно определяется формулой 0r(vi (8) ■ ■ ■ (8) vr) = /(vi) ■ ■ ■ /(vr). Наконец, положим <£(α0 Η + or) = <£ο(αο) Η + фг{аг), где <^>о(«о) = α0 " 1л ■ Легко проверить, что φ является гомоморфизмом, причем единственным, и удовлетворяющим условию φ(ΐν) = /(ν) для всех ν G V- Таким образом, (T(V),i) является «универсальной» алгеброй над пространством V'. Пусть А является алгеброй. Тогда подпространство I a A называется (двусторонним) идеалом, если а £ А, Ъ G I означает, что ab G I и Ъа G I. Теперь мы можем определить умножение в факторпространстве В = А/1 формулой [а/7] ■ [a'/I] = [aa'/I], где мы класс эквивалентности о mod I обозначаем [а/7]. Оказывается, что это умножение корректно определено, т. е. оно не зависит от частного выбора а или a' mod 7. Алгебра Клиффорда. Теперь мы можем воспользоваться этим определением факторалгебры, чтобы решить другие вопросы об
Приложение: тензорные произведения 951 универсальных объектах. Например, давайте рассмотрим алгебры Клиффорда. Пусть V обозначает векторное пространство, где имеется квадратичная форма Q и связанное с ней скалярное произведение (-,-). Пусть А обозначает соответствующую алгебру с единицей 1д. Отображение Клиффорда — это такое линейное отображение / :V -> А, для которого /(v)2 = Q(y)lA для всех ν е V. Это уравнение можно переписать в форме /(u)/(v)+/(v)/(u) = 2(u,v)U. Алгеброй Клиффорда над пространством V называется алгебра C(V, Q) вместе с отображением Клиффорда j : V —> C(V, Q), которая является универсальной в обычном смысле: для любого заданного отображения Клиффорда / : V —> А существует единственный гомоморфизм φ : C(V, Q) —> А, удовлетворяющий условию / = φ о j. j C(V,Q) Как обычно, если алгебра C(V,Q) существует, то она должна быть единственной с точностью до изоморфизма. Наша задача построить такую алгебру. Построение диктуется свойствами тензорной алгебры. Если существует такое отображение j пространства V в алгебру C(V,Q), то мы должны иметь единственный гомоморфизм φ : T(V) —> C(V, Q), для которого
952 Глава 18. Звездный оператор По-прежнему предполагая, что C(V, Q) и j существуют, обозначим через J С T(V) множество всех Ь в T(V), для которых ф(Ъ) = 0. Тогда J является идеалом, и мы должны получить изоморфизм алгебр j>:T(V)/J^C(V,Q), индуцированный ф: ip[a/J] = ф(а) (независимо от выбора о в [a/J]). Тогда элементы ν® ν -Q(v)lT(y) обязаны лежать в J в силу определения отображений Клиффорда. Следовательно, J должно содержать все суммы правых и левых кратных этих элементов. Поэтому давайте начнем сначала. Итак, пусть I является идеалом в T(V), порожденным элементами ν <8> ν — Q(v)Itw), т.е. I состоит из всех (конечных) сумм выражений вида о- (ν® ν -Q(v)lr(V))&, где о и Ъ принадлежат T(V), a v — пространству V. В этом случае I является идеалом. Определим C(V,Q) = T(V)/I и j:V^C(V,Q), i(v) = [i(v)/7] = [ν/7]. По построению j является отображением Клиффорда. Читателю рекомендуется проверить, что все свойства универсальности выполняются. В частном случае, когда Q = 0, условие Клиффорда принимает вид /(u)/(v) = -/(v)/(u). Тогда читателю рекомендуется проверить, что алгебра Клиффорда оказывается внешней алгеброй A(V). Подробный анализ структуры алгебры Клиффорда приводится в этой главе после задач.
Резюме 953 Резюме A. Скалярные произведения и звездный оператор Для данного ортонормированного базиса в пространстве Л1 (К*) надо уметь вычислять скалярные произведения в пространстве Ak(V*). Для данного векторного пространства со скалярным произведением (не обязательно положительно определенным) и ориентацией с помощью определения звездного оператора надо уметь вычислять *А для произвольной базисной А;-формы А. Вы должны уметь определять оператор Лапласа и выражать его через частные производные в декартовых координатах. B. Векторный анализ Вы должны уметь определять div, grad и rot через d и * и использовать эти определения для доказательства тождеств векторного анализа и для записи дифференциальных операторов в ортогональных системах координат. Задачи 18.1. В двумерном пространстве-времени имеются аффинные координаты t, χ и скалярное произведение (et,et) = +1, (ех,ех) = —1, (et, ех) = 0. Базисная 2-форма имеет вид dt Λ dx. (a) Используя определение звездного оператора λΛω = (*λ, ω)σ, вычислите *1, -kdt, -kdx и -k(dt Λ dx). (b) В этом пространстве вводится другая пара аффинных координатных функций и =t — χ, υ = t + x. Вычислите du, dv, * du, • dv. (c) Пусть / — дважды дифференцируемая функция в двумерном пространстве-времени. Вычислите ее лапласиан D/ = -d*df через частные производные / по t и х.
954 Глава 18. Звездный оператор (d) Вычислите D/ через частные производные / по и и v. 18.2. На плоскости вводятся полярные координаты. Вектора ег и щ образуют ортонормированный базис во всех точках плоскости, кроме начала координат, где угол θ не определен. Пусть 1-формы dr и гав дуальны этим базисным векторам. (a) Используя определение звездного оператора ω Λ λ = (*ω, λ)σ, вычислите -kdr и *άθ. (b) Пусть / — дважды дифференцируемая функция на плоскости. Вычислите ее лапласиан D/ = -d*df через частные производные / по г и Θ. 18.3. Перепишите следующие тождества в обозначениях векторного анализа (/ обозначает функцию, А — 1-форму, но ответы должны содержать вектор А). (a) d(df) = 0. (b) d(dA) = 0. (В пространстве Μ3 оператор •• является тождественным.) (c) d(fA) = df A A + fdA. (Примените * к обеим частям.) (d) d(AAB) =dAAB-AAdB. (Посмотрите на (*d*)*(AAB).) (e) d(f*A) = df A *A + fd-kA. (Примените * к обеим частям.) 18.4. Пусть f(t, χ, у, ζ) — дважды дифференцируемая функция в четырехмерном пространстве-времени. Вычислите лапласиан D/ через частные производные /. 18.5. Векторное поле задано в сферических координатах В = Вгег + Вдед + Вфвф. Вычисляя *d*B, где В — соответствующая 1- форма, получите выражение для div В. 18.6. (а) Пусть А = Ахех + Ауеу + Azez. Вычисляя (dd* + d*d)A, где А — соответствующая 1-форма, получите формулу для векторного лапласиана от А через частные производные AAA (b) Проделайте то же самое в цилиндрических координатах, когда А = Агег + Афвф + Azez. Будьте внимательны: коэффициент при άθ будет гАд\
Задачи 955 18.7. Получите выражение для rot А в сферических координатах, т. е. начните с А = Агег + Авев + Афвф, где соответствующая 1-форма имеет вид А = Ardr +AerdO + АфГ sin θ άφ. Вычислите * dA и представьте результат в виде вектора. Цель последующего обсуждения — описать все (конечномерные) алгебры Клиффорда над вещественными числами. Вспомним, что алгебра Клиффорда С(V, W) полностью определена векторным пространством V и квадратичной формой Q. Отсюда и из свойства универсальности алгебры Клиффорда следует вывод. Пусть имеется линейное отображение / : V —> V', которое «сохраняет длину», т. е. удовлетворяет условию Q'(/(v)) = Q(v) для всех ν е V. Тогда / индуцирует единственный гомоморфизм ф$ : C(V, Q) —> C(V',Q'), для которого <£/(v) = /(v) Для v e V, если мы считаем, что V является подпространством C(V, Q). В частности, если / — изометрия, то есть / также является линейным изоморфизмом V с V', то φf является изоморфизмом C(V, Q) с С{у', Q). Таким образом, классификация алгебр Клиффорда совпадает с классификацией векторных пространств, снабженных квадратичными формами. Ответ на эту задачу классификации мы знаем: квадратичная форма полностью классифицирована ее сигнатурой (p,q). Более точно, пусть V1- С V обозначает подпространство V, состоящее из всех векторов и, которые удовлетворяют условию: (u, v)q = 0 для всех ν G V. Тогда Q индуцирует невырожденное скалярное произведение в факторпро- странстве V/V1-. Из процедуры Грама-Шмидта мы знаем, что это индуцированное скалярное произведение определено с точностью до изоморфизма числами ρ и q знаков + или — в своей записи в ортонормированном базисе. Если мы выберем векторное пространство W, дополнительное к V1- в V, так что V = WtBV1-,
956 Глава 18. Звездный оператор то W будет изометрично V/V1-. Если dim V = η, то V изометрич- но Шп, где стандартный базис δι,...,δη ортогонален и выполняются равенства: Q(Si) = l, 1<г<р, Q(6i) = -1, p + l<i<q, Q(5j) =0, ρ + q < г < п. Итак, алгебра Клиффорда полностью задана целыми числами (n,p,q), удовлетворяющими условию ρ + q < п. Нам хотелось бы увидеть, что собой представляет каждая из этих алгебр. Начнем с элементарного, но очень важного свойства. Изометрия / : V —> V индуцирует изоморфизм ф$ соответствующей алгебры Клиффорда. Рассмотрим отображение пространства V в себя, определенное формулой /(ν) = -v. Это, очевидно, изометрия и /2 = id. Поэтому оно индуцирует изоморфизм <j>f алгебры Клиффорда С = C(V, Q) на себя. Этот изоморфизм будем обозначать ω. Тогда ω = φ]. Из общих принципов следует, что если / : V —> V и д : V —> V" — изометрии, то <f>gof =ФдОф}. Возьмем V = V = V" и д = /. Тогда получим фр = ω . Но /2 = id. В силу единственности ф, ф\& должно быть тождественным изоморфизмом С. Тогда ω2 = id. Мы говорим, что ω является инволюцией С. Хг-градуировка. Пусть Со является подпространством С, состоящим из всех с, которые удовлетворяют условию и(с) = с,
Задачи 957 и пусть С\ является подпространством, состоящим из с, которые удовлетворяют условию ω (с) = —с. Тогда любое с можно записать в виде c = cQ + Ci, где со = -(с + и(с)), су = -(с - ω (с)), при этом со g Со и ci e С\. Итак, С = Со Θ d как векторное пространство. Кроме того, если ω (c) = (-l)V и ω(ο') = (-If с', то Поэтому lu(cc') = (-l)i+i'cc'. cqc'q g Co, если со £ Co и с0 G Co, cqc'i G Ci, если со G Co и c[ G Ci, c\c'q G Ci, если ci G C\ и с0 G Co, cic^ G Co, если ci G Ci и c[ G Ci. Мы можем подвести итог: Со · Со С Со, Со · С\ С Ci, Cl · Со С С\ С\ · С\ С Cq.
958 Глава 18. Звездный оператор Мы говорим, что С является ^-градуированной алгеброй. Теперь V С С\ и 1 G Со, а каждый элемент С может быть записан (возможно, несколькими способами) как суммы произведений (единицы и) элементов пространства V. Таким образом, Со состоит из тех элементов, которые можно записать в виде сумм произведений элементов V, имеющих четное число множителей, а С\ состоит из сумм произведений нечетного числа множителей. Скрученные тензорные произведения. Возьмем две Z2-rpa- дуированных алгебры: А = Aq(&А\ и В = Во®В\. Определим их скрученное тензорное произведение, обозначаемое А® В, следующим образом. Как векторное пространство А® В — это обычное тензорное произведение А <g> В для Л и Б, т. е. в данном случае А <§> В = {А0 Θ Αι) ® (Во θ Βι) = А <g> В0 θ Μ <g> В0 θ Α) ® Βι Θ Αχ <g> В\. Умножение определяется правилами: {clq <g> bo) · (a' <g> b') = aa! ® bob, (a <g> 6) · (a'o ® b') = aa0 ® bb', (a <g> bi) · (oi <g> 6') = —aa'i <g> bib', где нижний индекс обозначает, четный или нечетный элемент. Отсутствие нижнего индекса означает, что уравнение выполняется независимо от четности данного элемента. Запишем эти правила в сжатой форме: (о <g> bi)(aj ® У) = (-l)ijaa'j ® Ьф'. Другими словами, при перестановке о' и fej надо умножать на (—I)13. Полезность понятия скрученного тензорного произведения состоит в следующем. Пусть у нас есть два векторных пространства V и W, где имеются квадратичные формы Qy и Qw соответственно. На прямой сумме пространств V Θ W возьмем прямую сумму Qv®w этих форм. Это значит, что квадратичная форма Qv®w совпадает с Qy на пространстве V тл с Qw на пространстве W, а V и W относительно нее ортогональны. Тогда мы имеем изоморфизм С(V Θ W, Qvew) = C(V, Qv) <§> C{W, Qw).
Задачи 959 Опишем это подробнее. Отображения / : V —> КФИ^, где /(ν) = νφΟ, и д :W —> V (В W, где <?(w) = О Θ w, «сохраняют длину» и поэтому индуцируют гомоморфизмы Ф} ■ C{V, Qv) -> C(V Θ W, Qv®w) и 09 : C(W, Qw) - C(V Θ W, Qvw)· Отображение Φ : C(V, Qv) <8> C(W, Qw) -> C(V Θ W, Qvw) определим формулой Ф(о(8)Ь) =ф/(а) -фд(Ь). Мы утверждаем, что <^> является изоморфизмом. Сначала мы должны показать, что φ — гомоморфизм, т.е. что ф((а ® Ъ) ■ (а' ® Ь')) = <£(а ® Ь) · 0(а' ® Ъ'). Это достаточно проверить для Ъ = wi... Wj и θ' = Vi . . . Vj. Далее, для ν £ V и w Ε W мы имеем (v, w) = 0 в пространстве V Θ W. (Мы пишем ν вместо /(ν) = ν Θ 0 и аналогично для w.) Поэтому для алгебры Клиффорда C(V Θ W, Qv®w) мы имеем ν · w + w · ν = О и, следовательно, Ъа! = (-l)ija'b. Это как раз и доказывает, что φ является гомоморфизмом. Чтобы показать, что φ является изоморфизмом, рассмотрим отображение h : V Θ W —> C{V, Qv) <8> C(W, Qw), заданное формулой /ι(ν ©w) = ly(g)w + v<g) 1цг,
960 Глава 18. Звездный оператор где \у — единица из C(V, Qv), a 1^ — единица из C(W, Qw)· Из определения <Й> немедленно следует, что /ι(ν Θ 0)Λ(0 Θ w) + Л(0 Θ w)/i(v Θ 0) = 0, в то время как /ι(ν 0 О)2 = Q(y)lv и /ι(0 Θ w)2 = Q(w)lw- Таким образом, в силу свойства универсальности C(V Θ W, Qv®w) отображение h индуцирует гомоморфизм фн : C(V Θ W, Qvew) -> C(V, Qv) <8> C(W, Qw) и Φ ° <^/ι(ν ® w) = ф(у <8) 1^ + ly <8) w = 0/(v (8) lw) + фдО-w <8> w) = ν + w. Итак, <^ о 0/, = id в пространстве V φ W. Следовательно, в силу единственности φ ο φ}ι = id на К (g) W, т.е. фь является правым обратным к ф. Аналогичные соображения показывают, что ф^ о φ = id, а это значит, что φ — изоморфизм. Например, если U — векторное пространство с квадратичной формой Q = 0, то его алгебра Клиффорда есть просто Λ(ί7) (это следует из определений). Пусть V — произвольное векторное пространство с квадратичной формой Q. Вспомним, что мы можем написать V = V1- Θ W, где ограничение Qw формы Q на подпространство W невырождено. Тогда φ устанавливает изоморфизм между C(V,Q) и A(V^-L) ®C(W,Qw)· Следовательно, с точностью до включения в скрученное тензорное произведение внешней алгебры, мы можем ограничиться только невырожденными квадратичными формами. Введем обозначение C(p,q) = C(Rn,Qp,q),
Задачи 961 где QVlq обозначает стандартную квадратичную форму в пространстве W1 (р + q = η), в которой ρ плюсов и q минусов. Нам хотелось бы понять структуру C(p,q). Расщепленный случай. В качестве примера рассмотрим ρ = q. В этом случае моделью для С(р, q) может быть U + U*, где U — р-мерное векторное пространство, в котором возьмем (и, и') = О, (и*, и'*) = 0 для и, и'е U, и*, и'* eU* и (и*, и) = (и*, и) (отображение вычисления). Как уже обсуждалось ранее в основном тексте, у нас есть описание соответствующей алгебры Клиффорда через операторы рождения и уничтожения в Л({7). Дальнейшее изучение покажет, что алгебра Клиффорда идентифицируется с алгебрами всех линейных преобразований на Л({7). Поскольку размерность Л({7) равна 2Р, то алгебру Клиффорда С(р,р) можно идентифицировать с R(2P), где R(n) обозначает алгебру всех вещественных матриц η χ п. В случае ρ φ q замечаем, что Ш.п можно записать как прямую сумму Шр с положительно определенной формой и!'с отрицательно определенной формой. Следовательно, по теореме о прямой сумме мы имеем С(р,9) = С(р,0)<Й>С(0>9). Если ввести обозначения С(р) = С(р,0) и C(—q) = C(0, q), то это уравнение переписывается в виде C(p,q)=C(p)®C(-q). Теперь надо понять структуру C{jp) и C(—q). Невырожденный случай. Однако сначала мы рассмотрим произвольное векторное пространство V с невырожденной квадратичной формой Q. Положим C = C(V,Q). Пусть {ei,...,en} будет ортонормированным базисом V (при этом Q(ei) = · · · = Q(ep) = 1 и Q(e;) = -1 для г = ρ + 1,..., η). Рассмотрим элемент 7 = ei · · · еп в С
962 Глава 18. Звездный оператор Если η Xj = у ^ Ojj6j, г 1,..., п, — произвольные элементы пространства V, то из ортогональности ej следует, что х\- ■ ■ хп = Det(oy) ei · · · en = Det(oy) 7. В частности, если {fi,..., fn} — другой ортогональный базис, то ΐι··ΐη- ±ei---e„. Итак, с точностью до знака элемент 7 не зависит от выбора базиса. (В алгебре Дирака С(1,3) элемент 7 в физической литературе обычно обозначается 75· Индекс 5 соответствует тому факту, что в четырехмерном случае 7 является произведением четырех элементов.) Заметим, что 72 = [-l)nin'l)/2+4. Число п{п — 1)/2 возникает из-за перестановок ei после в2 · · · еп, в2 после ез · · · еп и так далее. Число q появилось потому, что βρ+ι = · · · = el = -1, где η - ρ = q. Наконец, заметим, что для любого i (1 < г < п) справедливы равенства 1ег = е1 · · · βηβί = (-1)η~*βι · · · βίβίβί+ι · · · βη И 6j7 = βίβι · · · en = (-l)l-1ei · · · e^e^i · · · en. Тогда 7ei = (-1)П-Ч7. Поскольку ej образуют базис пространства V, мы имеем 7V = (—1)η_1ν7 для всех ν G V. Следовательно, 70 = ω(α)η_1ο7 для всех о G С.
Задачи 963 Примеры пространств малой размерности. Рассмотрим два важных примера. Пусть V = Ш2. Мы утверждаем, что С (2) = Μ (2) = алгебре всех матриц 2x2, где символ = обозначает изоморфизм. Чтобы это доказать, возьмем отображение φ : R2 -> М(2), заданное формулой /fx\\ _ (х у у II \у -х Тогда (4;)))Ч2г\^н^>(-)· Откуда получаем <Ku)2=Q(v)(j J) и, таким образом, М{2) обладает всеми свойствами алгебры Клиффорда С(2). Если взять ортогональный базис (п), (1 I, то соответствующие элементы алгебры Клиффорда М(2) имеют вид Ί Ολ /0 1 ei = lo -ι) и e2~Vi о так что 7 = eie2=(; -1 Заметим, что 72 = —1> как и требуется. Четная часть Со алгебры С состоит из всех матриц 2x2, которые коммутируют с 7· Это — множество конформных матриц. Нечетная часть С\ алгебры С в этом частном случае состоит из самого подпространства R2, представленного пространством симметричных матриц, имеющих нулевой след.
964 Глава 18. Звездный оператор Мы уже рассмотрели случай С(—2) и показали, что эта алгебра изоморфна кватернионам. Давайте еще раз посмотрим на эту конструкцию. Пусть элементом i в С(—2) будет вектор Ι η Ι, а элементом j — вектор I I. Тогда i2 = -l, j2 = -l, ij+ji = 0 в силу свойств алгебры Клиффорда. Далее, положим Тогда к2 = -1 и ki + ik = 0 = kj + jk. Таким образом, С(—2) задается 1, г, j и к, а приведенные выше соотношения определяют свойства кватернионов. Такая алгебра часто обозначается Н. Пусть А и В — алгебры. Определим их тензорное произведение A <g> В как алгебру, которая является векторным пространством А ® В, а закон умножения в ней имеет вид (а ® Ъ) ■ (о' ® Ь') = оо' ® ЬЬ'. (Заметим, что в отличие от скрученного тензорного произведения здесь не меняется знак.) Периодичность. Мы хотим доказать следующие основные формулы: C(p,q)®C(2)^C(q + 2,p), C(p,q)®C(l,l)=C(p+l,q + l), C(p,q)®C(-2)^C(q,p + 2), где = обозначает изоморфизм.
Задачи 965 Сначала давайте докажем первую формулу. Пусть V (р + q)- мерное векторное пространство (скажем, Rn), снабженное квадратичной формой типа (p,q). Далее пусть W = Ш2 с положительно определенным скалярным произведением. Обозначим η — βιβ2 для C(W) = С(2). Рассмотрим отображение ip:V®W ^C(p,q)®C{2), заданное формулами φ(ν) = ν ® 7, v G V и i/>(w) = 1 (g> w. Далее, (ν <8) 7)(1 ® w) + (1 <8) w)(v ® 7) = ν ® (7W + W7) = 0, откуда φ(ν)φ(ντ) + φ(\ν)φ(ν) = 0. Кроме того, i/>(w)2 = 1 ® w2 = ||w||2l и ι/>(ν)2 = (ν ® 7)(ν ® 7) = ν2 ® 72 = v2(g)(-l) = -Q(v)l®l. Итак, меняем Q на — Q в пространстве К и берем прямую сумму —Q на V и || · ||2 на W. Для этой квадратичной формы в пространстве V Θ W отображение φ удовлетворяет тождествам Клиффорда. Эта квадратичная форма имеет q + 2 плюсов и ρ минусов. Таким образом, отображение φ продолжается до гомоморфизма φ : C(q + 2,р) = C(V ®W)^ C{p, q) ® C(2). В качестве упражнения читателю рекомендуем построить обратное отображение и проверить, что φ является изоморфизмом. Те
966 Глава 18. Звездный оператор же самые аргументы (только теперь ||w|| отрицательно) дают изоморфизмы С(р, 9) ®С(1,1)^С(р +1,9 + 1) и C(p,q)®C(-2)^C(q,p + 2). Приведем ряд приложений этих изоморфизмов. И®И = С(-2)®С(-2) = С(0,2) ® С(-2) ^С(2,2) ^R(22) = R(4), следовательно, И®И^М(4). Далее, С(1) ^МфМ для изоморфизма, переводящего xl + ye-^ (χ -у,х + у), что можно легко проверить (упражнение). Таким образом, С(-3) ~ С{1) ® С(-2) = (R Θ R) ® Η Мы уже проверили, что С(—1) = С. Следовательно, С(3) ^ С(-1) ® С(2) = С ® R(2). Это алгебра комплексных матриц 2x2, обозначаемая С(2). Аналогично С ® И ^ С(-1) ® С(-2) = С(0,1) ® С(0,2) ~С(1,2) ^С(0,1)®С(1,1) ^C®R(2) =C(2). ОткудаС®Н~С(2).
Задачи 967 Эти изоморфизмы мы можем использовать для заполнения таблицы всех элементов C(p,q): 0 1 2 3 4 0 R R + R R(2) С(2) 1 С R(2) 2 3 4 ... И ΙΦΙ R(4) Например, чтобы найти С(1,2), мы элемент С = С(0,1) тен- зорно умножаем на R(2) = С(1,1) и показываем, что С(1,2) = С(2). Аналогично, чтобы найти С(3,1), мы элемент R(2) = С(2,0) тензорно умножаем на R(2) и находим, что С(3,1) = R(2) <8> R(2). Однако, по определению матричной алгебры R(r) <8>R(/) = R(r/). Поэтому R(2) ® R(2) = R(4). Аналогично C(l,3) ^Н®М(2)=И(2), т.е. алгебра всех матриц 2 χ 2 с кватернионными элементами. (Заметим, что С(1,3) и С(3,1) не изоморфны.) Аналогично, С(4,0) = С(0,2) ® С(2,0) = И ® R(2) = И(2) и С(0,4) ^ С(2,0) ® С(0,2) ^ И(2). Продолжая таким образом, мы получаем следующую таблицу: Ч 0 12 3 4 5 6 7 8_ OR CMHei И(2) С(4) R(8) R(8) + R(8) R(16) 1 ΚΘΚ 2 R(2) 3 C(2) 4 И(2) 5 Η(2)θΗ(2) 6 И(б) 7 С(8) 8 R(16)
968 Глава 18. Звездный оператор Остальные элементы таблицы могут быть получены, двигаясь вдоль диагонали и на каждом шагу тензорно умножая на R(2). Эта таблица 8x8 определяет все алгебры Клиффорда, так как С(п + 8,0) ~ C(n,0) ® R(16) и С(0,п + 8) ^ C(0,n) ® R(16), что следует из четырехкратного применения базисных изоморфизмов. Например, чтобы вычислить С(9), мы начнем с С(1), последовательно проводя тензорное умножение на С(—2), С(2), С(—2), С(2). Это то же самое, что и С(2) ® С(-2) ® С(2) ® С(-2) ~ С(-4) ® С(2) ® С(-2) ^ С(6) <g> С(-2) ^С(8) ^С(-8) ^R(16). Такие же соображения показывают, что С [к + 8) = С [к) ® R(16) и C(-ft-8) ^C(-ife) ®R(16). Таким образом, С(8г + А;) = C(fc) <g> R(16r) (периодичность Ботта) и С(-8г - Л) = С(-Л) ® R(16r). Это полностью определяет структуру всех конечномерных алгебр Клиффорда.
Глава 19 Уравнения Максвелла Главу 19 можно считать кульминацией курса. Результаты предыдущих глав применяются к изучению уравнений Максвелла и соответствующих волновых уравнений. 19.1. Уравнения Электростатика и магнитостатика являются всего лишь приближенными теориями. Для полей, зависящих от времени, их надо заменить теорией Максвелла. Начнем с закона индукции Фара- дея, согласно которому для любой поверхности S, натянутой на кривую 7, производная по времени от поля В связана с Ε равенством dtJsB~~ 1ΊΕ' Перепишем это выражение в форме, удобной для пространства четырех измерений. Рассмотрим временной отрезок [о, Ъ\ и трехмерный цилиндр S х [а, Ь], границей которого является боковая поверхность — двумерный цилиндр -у χ [о, Ъ\ и торцевые поверхности — нижняя S X {а} и верхняя S х {Ь} (см. рис. 19.1). Проинтегрировав закон Фарадея по времени t от о до Ь, получаем уравнение / В- J B+ [ EAdt = 0. JSx{b} JSx{a} A * Μ]
970 Глава 19. Уравнения Максвелла Рис. 19.1 Пусть F = B + EAdt, так что F — это 2-форма в четырехмерном пространстве. И пусть С обозначает трехмерный цилиндр С = S х [о, Ь], у которого дС = S х {Ь} - S х {а} + 7 х [а, Ь]. Здесь В — 2-форма, содержащая только пространственные производные и потому обращающаяся в нуль на боковой поверхности цилиндра -у χ [a,b], a дифференциал dt и, следовательно, Ε Λ dt, обращается в нуль на обоих торцах нашего цилиндра. Таким образом, закон индукции Фарадея можно записать в виде [ F = 0. JdC Кроме того, мы можем рассмотреть трехмерную область С, содержащую только пространственные координаты при фиксированном времени. В этом случае дС будет поверхностью, на которой dt = 0, так что / *=/ в JdC JdC и, в силу отсутствия истинного магнетизма1, поверхностный интеграл должен быть равен нулю. Таким образом, fdc F = 0 для 1т. е. отсутствия «магнитных зарядов». — Прим. ред.
19.1. Уравнения 971 всех трехмерных кубов, ребра которых параллельны любым трем из четырех координатных осей. Этого достаточно, чтобы выполнялось равенство dF = 0, где, конечно, d обозначает внешнюю производную в четырехмерном пространстве. Поскольку F = Вх dy Л dz — By dx Л dz + Bz dx Л dy + Ex dx Л dt + Ey dy /\dt + Ez dz Л dt, уравнение dF = 0 эквивалентно четырем уравнениям дВ* дВу дВ, = о дВу ΘΕΖ | дЕх _ 0 дх ду dz ' dt dx dz дВх_дЕу_ + дЕ±=0 dBz дЕх | дЕу _ Q dt dz dy ' dt dy dx Мы воспользуемся законом Фарадея для определения единицы измерения В напряжение · время энергия · время площадь заряд · (длина)2 Закон Ампера связывает ток с магнетизмом — поток электрического тока через поверхность S, имеющую границу 7, равняется циркуляции магнитного поля по контуру 7· Согласно великому открытию Максвелла, мы должны писать поток электрического тока в виде двух слагаемых dD /dt + Απ J, где D — электрическое смещение, a J — плотность тока движущихся зарядов. (Для медленно меняющихся полей первый член пренебрежимо мал по сравнению со вторым, и поэтому его нет в первоначальной формулировке закона Ампера.) Циркуляция магнитного поля получается интегрированием линейной дифференциальной формы Н, называемой напряженностью магнитного поля, по 7· Тогда модифицированный Максвеллом закон Ампера имеет вид /.(£+"Н* Рассмотрим трехмерный цилиндр С = S х [а, Ь] и положим G = D-H Adt.
972 Глава 19. Уравнения Максвелла Проинтегрируем закон Ампера по t от о до Ъ. Тогда получаем / G = -4тг / JAdt. JdC Jc Если мы рассмотрим трехмерную область R при постоянном времени, то dt обращается в нуль на границе OR и интеграл от G по OR точно такой же, как интеграл от D, что равняется 47ГХ (полный заряд внутри области R) = 4π j pdxAdyAdz. Таким образом, для областей при постоянном времени мы имеем / G = 47г / ρ dx Л dy Л dz. JdR JR Положим j — ρ dx Λ dy Λ dz — J Λ dt, тогда мы видим, что / G = 4тг / j JdC JC для любого трехмерного куба, ребра которого параллельны осям координат. Тогда dG = 4тг j, откуда следует, что dj = 0. Итак, подведем итоги: Положим тогда из уравнений Максвелла имеем F = B + E/\dt, dF = 0, G = D-H Adt dG = 4irj. Заметим, что уравнения Максвелла инвариантны относительно гладкой замены координат. Воспользуемся законом Ампера для определения Н. Электрическое смещение D измеряется в единицах заряд/площадь, так что dD/dt измеряется в единицах заряд/(площадь -время), а плотность тока J — в единицах ток/площадь = заряд/(площадь · время). Таким образом, Η измеряется в единицах зарядДвремя · длина). В вакууме мы имеем конститутивные соотношения D = εο*Ε и В = μο*Η,
19.1. Уравнения 973 где eq измеряется в единицах заряд длина (заряд)ί площадь напряжение энергия · длина а μο — в единицах энергия · время время · длина энергия · (время)2 заряд · (длина)2 заряд (заряд)2 · длина При этом величина Ι/εοΜο имеет размерность (длина)2 /(время)2 = (скорость)2. Таким образом, в теорию электромагнетизма принципиально встроена фундаментальная скорость. Великое открытие Максвелла состоит в том, что эта скорость является не чем иным, как скоростью света с! Поэтому вместо dt введем cdt. Тогда четырехмерный оператор * принимает вид *(dx A dy) = —cdt A dz, *(dx Л dz) =cdt A dy, *(dy A dz) = —cdt A dx, *(dx A cdt) = —dy A dz, *(dy A cdt) = dx A dz, *(dz A cdt) = —dx A dy. В этом случае *F = c(Bz dz Adt + By dy Adt + Bz dx A dt) - (l/c)(Ex dy Adz - Ey dx A dz + Ez dx A dy). Тогда конститутивные соотношения можно записать в виде Наконец, в вакууме, где величина εο/Vo постоянна, можно переопределить j, включив в него все константы, и записать уравнения Максвелла в виде dF = 0 и d*F = 4ttj.
974 Глава 19. Уравнения Максвелла Из последней главы мы знаем процедуру решения такой системы уравнений: предположив соответствующее топологическое условие, мы ищем 1-форму А, удовлетворяющую условиям dA = F, d*A = 0 и —ПА = 4n*j. Таким образом, решения уравнений Максвелла тесно связаны с изучением волнового оператора _П = — - — - — - — dt2 дх2 ду2 dz2' если используется система координат, в которой с = 1. 19.2. Одномерное однородное волновое уравнение В этом параграфе в качестве подготовки к изучению уравнений Максвелла рассмотрим уравнение, представляющее самостоятельный интерес2: д2и д2и _ W~~th2 = Если мы сделаем замену переменных ρ = χ + t, q = χ — t, то уравнение перепишется в виде ■£ϊ.-ο, dpdq решениями которого являются функции и = и\(р) + u2{q) или u(x,t) =ui{x +t) +u2(x -t). (19.1) 2 Оно известно также под названием уравнения колебаний струны и именно в этой интерпретации обычно изучается одним из первых в курсах уравнений с частными производными. — Прим. ред.
19.2. Одномерное однородное волновое уравнение 975 Очевидно, что любая функция такого вида будет решением. Функция U2(x —t) может рассматриваться динамически. В каждый момент времени t график функции щ^х — t) является графиком U2{x)-, смещенным вправо на величину t. Мы говорим, что функция U2(x—t) описывает волну, движущуюся вправо без искажений. Таким образом, общее решение одномерного однородного волнового уравнения является суммой двух волн, распространяющихся вправо и влево без искажений. Как правило, представляет интерес описание волнового движения, соответствующего некоторому начальному возмущению, скажем в момент t — 0. Поскольку мы имеем дело с уравнением второго порядка, то можно задать начальные значения щ и vq, где и0 = и(х,0) и ν0 = —(χ,0). Действительно, пусть A(x,t) обозначает операцию усреднения по интервалу длины 2ΐ (или радиуса ΐ) с центром в точке х. Тогда, по определению, для любой функции w 2 rx+t A(x,t)w = - / w(s)ds. * Jx-t Утверждается, что д и(х, t) = A(x, t)v0 + — [А(х, t)uo] является единственным решением волнового уравнения с заданными начальными условиями. Действительно, записав u(x,t) = и\(х + t) + U2(x — t), мы видим, что и(х, 0) = и\(х) + U2(x) и — (χ,Ο) =υ!1(χ)-υ!2(χ). Подставим vq = ди/dt в последнее уравнение и проинтегрируем. В результате получаем /•х ui(x)—U2(x)= / vo(s)ds + с, Jo
976 Глава 19. Уравнения Максвелла где с — некоторая константа. Складывая и вычитая уравнение ■"о = ui(x) + U2(x), видим, что рх 2и\{х) = ио(х) + / vo(s)ds + c, Jo /•χ 2u2(x) = uq(x) — / vo(s) ds — с Jo Поэтому из формулы (19.1) имеем и{х, t) = - I uq(x +1) + uo(x -t)+ vq(s) ds 1 . Это еще один способ записи решения. Заметим, что мы доказали теорему существования и единственности для нашей задачи с начальными условиями. Из явной формулы также видно, что малые изменения начальных значений приводят к небольшим изменениям в решении. В этом случае мы говорим, что задача корректна. Кроме того, значения функции и в точке (xo,to) зависят не от всех значений и и du/dt при t = 0, а только от значений в интервале [хо-^сь^о+^о] (рис. 19.2). С другой стороны, решение в точке (х,0) влияет только на те точки пространства-времени, которые лежат внутри конуса \\хо\\ = ||*0II (рис. 19.3). Это — известный принцип причинности. ί = 0 Рис. 19.2. Область зависимости t = 0 Рис. 19.3. Область влияния
19.3. Однородное волновое уравнение в пространстве М3 977 19.3. Однородное волновое уравнение в пространстве Ж3 Мы хотим найти решение уравнения д2и д2и д2и д2и _ dt2 дх2 ду2 dz2 с начальными условиями и(х,0) =щ{х), ^(χ,0)=υο(χ). Пусть A(t,x) обозначает усреднение по сфере радиуса |ΐ| с центром в точке х. Тогда A(t,x)f= //(χ + ί·)τ. Js Здесь /(χ, ΐ·) обозначает функцию на сфере S единичного радиуса, значение которой на любом векторе ν с ||ν|| = 1 равно /(χ + ΐν) иг — элемент телесного угла, умноженный на 1/47Г. Утверждается, что функция и, заданная формулой д u(x,t)=tA(t,x)vo + —[tA(t,x)uo], является единственным решением нашей задачи. Прежде всего, покажем, что эта функция является решением. Для этого проверим, что она удовлетворяет начальным условиям. Для малых значений t можно написать и(х, t)=A(t, x)u0 + 0(t). Очевидно, что предел .Α(ΐ, х) при усреднении по сферам с центром в точке х, радиус которых стремится к нулю, равен ио(х). Таким образом, и(х,0) =и0(х). Кроме того, ди, Ж(Х'0)=Ь дА
978 Глава 19. Уравнения Максвелла поскольку все остальные члены суть 0(t). Однако, дА . . f v~> ди , . v-^ ди , . f Ж(о,хЬ = /5£^(хКт = £—(х)^т = о, поскольку среднее значение нечетной функции (такой, как координата Χι) по единичной сфере должно обращаться в нуль. Чтобы доказать, что и удовлетворяет волновому уравнению, достаточно доказать, для любой функции ω, зависящей от х, функция W(x.,t) =tA(t,x)u удовлетворяет волновому уравнению. Действительно, наше выражение для и является суммой двух членов: один вида W, а другой вида dW/dt. Если W является решением волнового уравнения, то и dW/dt также является его решением. Для любой дважды дифференцируемой функции ω мы имеем Г (д2и 02ω θ2ω\ , , , Г У|у-хК|*| \9х2 ду2 dz2J J\y-*\4\t\ = / *άω, где 5X;t обозначает сферу с радиусом |ΐ| и центром в точке х. На поверхности сферы с радиусом г мы можем написать (*άω) Л dr = -— dx f\dy Adz or и dx Л dy Л dz = τ Λ dr. Тогда Таким образом, д_ dt' 4ττΐ У|у_х|^|4|
19.3. Однородное волновое уравнение в пространстве М3 979 Дифференцируя это выражение по t, получаем ζ£ = ~Лз Г dP ί (д^)(у) dS + А / а^(у) dS- dt2 2τγϊ3 Уо У|у-х|=р 4ττΐ2 У|у_х|=р Теперь положим W(x,t) = tA(t,~x)u). В этом случае d2W д д2 А 1 f Но AW = 1T f Δχω(χ + ίν) dS = -ji- / A^(y)dS, 4ΤΓ 7|ν| = 1 47ΓΪ У|у_х|=|(| следовательно, W — решение волнового уравнения. Можно выстроить эти рассуждения по-другому и доказать единственность нашего решения, сведя трехмерное однородное волновое уравнение к одномерному. Мы доказали интегральную формулу / Au(y)dy — r2 / —u(x + vr)<L·. J\y-x\4,r J\v\=l dr Поэтому для функции u(x, ΐ) мы имеем 2 д Au(y,t) = Атгг —А(г,х)и. ί Чу-хКг Если и удовлетворяет уравнению д2и dt2 AU' то это можно подставить в предыдущее уравнение и получить д2и Г ί д2и 7p-(y,i)dy= dp |у-х|^г υι JO J\y- Дифференцирование по г показывает, что функция Z{r,t) = rA(r,x)u(x,v) f д2и Г f д2и 4тгг2А(г,х)п= / яй"(У'*)^= / dP яй"^'*)^· J\y~x\<r ot JO J\y-x\=r at
980 Глава 19. Уравнения Максвелла удовлетворяет одномерному волновому уравнению d2Z d2Z __ дг2 т2 -°- Таким образом, Z(r,t) = rA(r,x.)u(x,v) = w\(r + t) +W2{r — t). Поскольку Z(0,t) = 0, мы имеем wi(t) = -w2(-t). Написав w вместо w\, получаем Z(r, t) = w(r + t) - w(t - r). Дифференцируем это выражение по г и переходим к пределу г —> 0. В результате получаем tt(x,t) = i4(0,x)tt(x,i) = 2w'(t). Кроме того, ΘΖ ΘΖ η „ - + - = 2W\r + t), следовательно, dZ dZ u(x,r) = 2w'(r) = ]im.2w'(r + t) = lim ——h lim —-. Подстановка выражения для Ζ в эту формулу дает и(х, г) -l(s/w.1^+^°>,,s+sjL.t(3i+n,,0),K)· Но и(х + τη, 0) = зд(х + τη) и ди , . . . — (х + г7) = ν0(χ + τη). Если в этом соотношении положить г = t, то получим наше исходное решение, что доказывает его единственность.
19.4. Неоднородное волновое уравнение в пространстве М3 981 19.4. Неоднородное волновое уравнение в пространстве Ж3 Мы можем решать уравнения Максвелла, решая последовательность уравнений вида д2 Du = f, 0=W2-A. Давайте сначала покажем, как решить это уравнение с начальными условиями ди «(χ,Ο)ξΟ, — (χ,Ο)ξΟ. Неоднородное волновое уравнение можно решить, сводя его к решению однородного волнового уравнения с последовательностью начальных условий следующим образом. Пусть υ(χ,ΐ,τ) — решение задачи с начальными условиями dv Dv = 0, υ(χ,τ,τ)=0, —(χ,τ,τ) =/(x,r). Положим u(x,i) = — / υ(χ,ΐ,τ) dr. Jo Тогда очевидно, что u(x,0) = 0 и ι. , . /"* dv, -(χ,ΐ) = -υ(χ,ΐ,ΐ) - / — (x,i,r)dr. Но υ(χ,ΐ,ΐ) = 0 в силу начальных условий для v. Поэтому ди , /"* dv . ^(χ'ί)=="Λ^(χ'ί,τ) и, следовательно, ди . ^(х,0) = 0. Кроме того, дифференцирование уравнения для du/dt дает д2и. ч dv . . /"* d2v. . , ди, Ж
982 Глава 19. Уравнения Максвелла Аи = — I v(x,t,T)dr, Jo так что Теперь функция ν определяется выражением «(χ1ί1τ) = (ί-τμ(χ1ί-Γ)/ = -!-(ί-τ) / /(x+(t-r)7,r)d7, следовательно, «(χ,ί) = --/- ί (t-τ) f /(x + (i-r)7,r)d7dr - J- / r' / /(χ + Г'Т' * - r') d7 dr'· 47Г Уо Jft\=l В этом выражении положим у = χ + τ'-у, тогда последний интеграл принимает вид -jzfhl f(y,t-r')dSdr' 47гУо т У|у-х|=|*| 47Г У|у_х| = |т'| /|у-х|=|т'| Ну - ХН Итак, мы получили формулу для запаздывающих потенциалов: u(x.i) = — — / π π «У· 4π7 ||у-х|| Она похожа на формулу Пуассона для потенциала, но вклад от сферы с радиусом о и центром в точке χ задается величиной 1/о, умноженной на значение / в момент времени, равный о единиц. Раз мы получили решение неоднородного уравнения с нулевыми начальными условиями, то теперь решение неоднородного уравнения с произвольными начальными условиями можно свести к решению однородного уравнения путем вычитания уже полученного решения.
19.4. Лагранжиан и тензор энергии-импульса 983 Воспользуемся последней формулой, чтобы решить неоднородное волновое уравнение для каждой компоненты ^-потенци- ала А в уравнениях Максвелла. Получим ^>=-Г(Т-*Г''и· Это решение называется потенциалом Лъенара-Вихерта для заданного распределения плотности тока j. Общее решение уравнений Максвелла получается прибавлением к А потенциала, компоненты которого удовлетворяют однородному волновому уравнению. 19.5. Лагранжиан электромагнитного поля и тензор энергии-импульса Пусть А — 1-форма и j — 3-форма в пространстве Минковского R1,3. Рассмотрим 4-форму С = C(A,j) = -- dA Λ *dA - 4πΑ Λ *j. Проинтегрируем С по любой ограниченной четырехмерной области N и получим функцию LNJ(A)= [ С. Здесь мы считаем, что Ν η j 'заданы и фиксированы, так что L является только функцией А. Мы говорим, что А является экстремалью L, если — Lnj(As)\s=o = О для любого дифференцируемого семейства 1-форм As, удовлетворяющих условиям Aq = А и As = А на границе ON. Пусть ^|5=0 = Б.Тогда -r(AJ)\s=o = —x(dB Λ *dA + dA Λ *dB) - 4πΒ Λ j. ds 2
984 Глава 19. Уравнения Максвелла Теперь d(B Л *dA) = dB Л *dA + В Л d*dA и dB Л *dA = dA Л *<Ш, следовательно, s^-л = Б Л [d*d^4 - 47rj] = d(B Л *dA). s=0 Интеграл JdN В Л *dA обращается в нуль, потому что на границе В = 0. Таким образом, dLNj(As) ds = I В Л [d *dA — 47rj]. Если это выражение равно нулю для всех В, обращающихся в нуль на границе, то мы должны иметь d*dA = Airj. Однако, в области, где Н2 = 0, это эквивалентно уравнению Максвелла F = dA. Чтобы эти уравнения можно было решить, необходимо выполнение условия dj = 0. Таким образом, мы вывели уравнения Максвелла из вариационного принципа: уравнения Максвелла в точности совпадают с уравнениями для критических 1-форм А лагранжиана L. Формулировка в терминах лагранжиана обладает рядом преимуществ. Одно из них состоит в том, что изменяя лагранжиан L, мы получаем процедуру модификации уравнений для его экстремалей и, таким образом, можем открывать различные законы природы. Другое преимущество в том, что с помощью лагранжева формализма мы получаем процедуру перехода от классической механики к квантовой. Функция L играет ключевую роль в квантовой электродинамике. Третье преимущество — в рамках лагранжева формализма каждая однопараметрическая группа симметрии
19.5. Лагранжиан и тензор энергии-импульса 985 лагранжиана L дает нам закон сохранения с помощью метода, известного как теорема Нётер. Этот метод мы объясним в частном случае электромагнетизма. Пусть ξ — векторное поле в пространстве R1,3, обладающее свойством Ός*ω = *Όξω для всех 2-форм ω. Как мы уже видели, любое конформное преобразование пространства-времени сохраняет действие звездного оператора на 2-формы. Поэтому ξ может быть векторным полем, связанным с любой однопараметрической группой конформных преобразований. В частности, ξ может быть любым постоянным векторным полем, что соответствует трансляциям, или любым инфинитези- мальным преобразованием Лоренца. Итак, Όξ£ = -- άϋζΑ Λ *dA - -dA D^dA - ΌξΑ Λ 4ttj - Α Λ ΊπΌξj. Δι Δι Поскольку Όξ-kdA = *ΌξάΑ = *άϋξΑ и άϋζΑ Λ *dA = άΑΛ *άϋξΑ, первый и второй члены равны, поэтому они складываются в -άϋξΑ Л *dA = -ά(ΏζΑ Λ *dA) + ΏξΑ Λ d*dA. Таким образом, Όξ£ = -ά{ϋζΑ Λ *dA) + ϋζΑ Λ (d*dA - 4ttj) - Α Λ 4πΌ&. В силу уравнений Максвелла d*dA = 4ttj. Поэтому ϋζ£ = -ά{ϋζΑ Λ *dA) -АЛ 4πϋζ1 = -d((i(t)dA + di(£)A) Λ *dA) -Ал AirDij = -d[i($)F Λ *F] - di(£)A Λ d*dA -Ал AnDy = -d[i(£)F Л *F] - di{£)A Л 4ttj - АЛ AttD^j,
986 Глава 19. Уравнения Максвелла где мы использовали dA = F и d*dA = j. С другой стороны ΏξΑ = i{£)dA + dA + di(£)A = i(t)F + di(t)A, a ϋζ£ = ~De{F A *F) = ϋζ{ΑΛ 47rj) = \di£)(F A *F) - (i($F + άί(ζ)Α) A j - Л Λ Ζ>#\ поскольку d(F Λ *F) = 0, потому что F A *F — 4-форма. Приравнивая эти два выражения для D$£, получаем - d[i(£)F A *F] - di(£)A A 4irj - Аа Dy = —-d[i(t)FA*F+FM{t)*F]-i(£)FAj-di(£)AA4nj-AA4irDtJ Li ИЛИ d-[F A i(£)*F - i£)F A *F] = -i(£)F A 4nj. Li Если нет токов, т.е. если j = О, оказывается, что 3-форма C(t) = \[FAi(t)*F-i(t)FA*F] замкнута. Этот факт интерпретируется как закон сохранения: интегралы от С (ξ) по двум трехмерным областям, ограничивающим некую четырехмерную область, равны. Если при стремлении к бесконечности в пространственных направлениях F достаточно быстро убывает, то два интеграла от С (ζ) по любым трехмерным пространственноподобным поверхностям равны. Например, в некоторой системе координат возьмем трехмерные поверхности, заданные уравнениями t = t\ и t = t? (рис. 19.4). Полное значение величины С (ζ) в момент t = t\ равно полному значению С (ζ) в момент t = Ϊ2· Это значит, что полное значение величины С (ζ) сохраняется во времени. Поэтому уравнение dC(£) = 0 называется законом сохранения.
19.5. Лагранжиан и тензор энергии-импульса 987 kt С i = t2 СГ~~~>* = *1 Рис. 19.4 Например, давайте возьмем ξ = d/dt, что соответствует ин- финитезимальной трансляции во времени (в смысле некоторого расщепления на пространство и время). Прямое, но весьма поучительное вычисление, которое мы оставляем читателю, показывает, что 1 С (ξ) = -(||Е||2 + ||В|П dxAdyA dz + P\dy Adz Adt — P2 dx Adz Adt + P3 dx A dy A dt, где или, более кратко, Pi — EyBz — ByEz, P2 = EXBZ — BXEZ, P3 — ExBy — BXE, У1 Ρ = Ε χ Β. (Трехмерный вектор Р называется вектором Пойнтинга.) Таким образом, на поверхности t = const интеграл от С (ζ) дает полную энергию электрического и магнитного полей, т. е. наш закон сохранения становится законом сохранения энергии. Остальные компоненты С (ζ) в этом случае описывают поток (локальной плотности энергии) через любую поверхность.
988 Глава 19. Уравнения Максвелла Точно так же, как энергия связана с временной трансляцией, х-компонента импульса связана с бесконечно малым смещением в направлении х. Это общий принцип механики (см., например, Loomis and Sternberg, глава 13, или более сложное изложение в книге Guillemin and Sternberg, глава 2). Таким образом, С(д/дх) будет замкнутой 3-формой, интеграл от которой по простран- ственноподобной трехмерной поверхности t = const дает полный импульс электромагнитного поля в направлении х. Интегрирование по поверхностям вида [о, b] x S, где S — поверхность в пространстве R3, а [о, Ь] — временной интервал, величины С(д/дх) дает поток х-компоненты импульса через поверхность S в течение времени [а,Ь]. Для любого постоянного вектора ξ величина С (ξ) является 3-формой, а *С(£) — 1-формой. Таким образом, равенство Τ (ζ, ν) = *@(ζ)(η) имеет смысл для некоторого другого постоянного вектора η. Функция Τ = Τ (ζ, η) называется тензором энергии-импульса, потому что в ней закодированы все компоненты плотности и потока энергии и импульса. При наличии тока j формы С(£) уже не будут замкнутыми, но они удовлетворяют условию <Ю£) = i($F Л 4ttj. Это называется силой Лоренца и представляет передачу энергии- импульса от электромагнитного поля току зарядов. 19.6. Волновые фронты и принцип Гюйгенса Решение волнового уравнения вида «(χ,ί) = /(χ)σ(Λ(χ)±ί) называется распространяющейся волной. Выражение /ι(χ±ΐ) называется фазой волны, а поверхности уровня h = const — волновыми фронтами.
19.6. Волновые фронты и принцип Гюйгенса 989 Мы уже видели, что в одномерном пространстве, взяв f = 1, h (χ) = χ и произвольную функцию д, получаем решение, которое в общем случае может быть записано как сумма двух таких выражений, одно со знаком +, а другое со знаком —. В трехмерном пространстве в качестве h возьмем функцию, линейную по χ /ι(χ) = к · χ, / = 1 и произвольную функцию д. Чтобы решить уравнение, накладывается единственное условие ||к|| = 1. (По существу мы свели задачу κ одномерному случаю: с помощью вращений можно сделать так, что к = (1,0,0). Поэтому решение зависит только от χ и t, что равносильно решению волнового уравнения в пространстве одного измерения.) В частности, если мы возьмем д{6) = е , то получим функции ei(k-x-t)j ||k|| = l. Важность этих решений с синусоидальными волнами объясняется следующим: это теорема, согласно которой каждая гладкая функция в пространстве R1,3 (или в общем случае в пространстве Шп), которая на бесконечности достаточно быстро убывает, может быть записана в виде суперпозиции функций вида elkx, т. е. любую такую функцию можно записать в форме где / — подходящая функция. В главе 21 мы дадим очень краткое доказательство этого факта. Оказывается, что эта формула обратного преобразования Фурье верна и в более общем случае. В нашем же случае общее решение волнового уравнения может быть записано как суперпозиция функций е'(к'х~*', где ||к|| = 1. В качестве второго примера рассмотрим сферически симметричные решения волнового уравнения (определенного вне прямой г = 0). Запишем лапласиан в сферических координатах: _ ]_д_ 2^ 1 д . ди 1 д2и г2 дг дг г2 sin θ дв ΘΘ г2 sin2 θ дф2'
990 Глава 19. Уравнения Максвелла так что для сферически симметричной функции и = u(r,t) волновое уравнение принимает вид д2и _ 1 д 2ди _ 1 dt2 г2 дг дг г ди д2и дг дг2 1д2 Таким образом, функция ν = ги удовлетворяет одномерному волновому уравнению (д2 д2\ Общее решение этого уравнения дается формулой v(r,t) = f(r + t)+g(r-t), так что общее решение сферически симметричного волнового уравнения имеет вид г г Здесь первый член представляет падающую волну, а второй — испускаемую. В частности, возьмем / = 0 и g(s) = elks. Тогда Wk(t,r) = eik(r-i) представляет испускаемую (синусоидальную) волну с частотой к. Действительно, легко проверить, что с точностью до нормировочной постоянной Акт Ек(г) = — г является «фундаментальным решением» приведенного волнового оператора Δ + к2, т. е. при г φ 0, и (Δ + к2)Ек = 0 -i ίЕк(А + к2)фах = ф(0)
19.6. Волновые фронты и принцип Гюйгенса 991 для любой гладкой функции ф. В главе 15 мы доказали этот результат в случае к = 0 из формулы Грина. Аналогичное доказательство сработает и здесь. Далее, если D — любая ограниченная область в R3 и и удовлетворяет приведенному волновому уравнению (уравнению Гельмгольца) Аи + к2и = О, то из формулы Грина можно видеть, что верна следующая формула Гельмгольца: 4тг J Jm gifcrp /gifcrp ■■kdu — u-kd 3D I Гр \ Гр _ \u(P), если Р eD ~ | О, если Ρ i D, где гр обозначает расстояние от Р. Во многих приложениях нам интересна ситуация, когда вместо ограниченности области D она является внешней для некоторой поверхности S. Сначала воспользуемся полученной формулой для ограниченной области Dr, содержащей пересечение D с шаром радиуса R и центром в точке Р. Если R выбирается достаточно большим (рис. 19.5), то интеграл становится суммой двух интегралов по поверхностям, и мы получаем формулу 1 ff J_ ff Ыр)> если р е А 4^ JJs +4^ JhR ~ \ 0, если P<£D. Рис. 19.5
992 Глава 19. Уравнения Максвелла Здесь Σ# — сфера радиуса R. Тогда d Акт Jkr Г \к dr и *dr = Β?άω на поверхности Σ^, где άω — элемент телесного угла на этой поверхности. Таким образом, второй интеграл принимает вид //е- г | — \ки } + и or άω. r=R При R —► оо интеграл по сфере стремится к нулю, если // \η\άω = ο(ΐ) и // — \ки J J М К ' JJ \дг άω = о(Д-1) Здесь интегралы вычисляются при г = R. Эти условия называются условиями излучения Зоммерфельда. Их значимость определяется тем, что они представляют ситуацию, когда решение и содержит только испускаемые волны, а падающих волн нет3. Предположим, что это условие выполнено. Тогда значение и вне некоторой поверхности S задается формулой и{Р) _L f \^L 47Г Js [ Г *аи — и*ά Акт (19.2) 3Строгое математическое объяснение условий излучения Зоммерфельда можно найти в книге Lax and Phillips, с. 120-128. Идея доказательства состоит в следующем. Пусть / = {/ι,/г} — данные Коши для волнового уравнения. Мы ищем решение волнового уравнения d2w dt2 -Aw = 0 с начальными условиями w(x,0) = f\ и (du>/dt)(x,G) = /2. Мы говорим, что / описывает расходящуюся волну, если существует некоторая константа с, такая что w = 0 для |ж| < ί — с. Если мы ищем решение с фиксированной частотой, то соответствующие начальные условия Коши имеют вид {w, ikw]. Предположим, что w — решение приведенного волнового уравнения вне некоторой ограниченной области. Тогда условие {w, ikw} обеспечивает расходящееся решение тогда и только тогда, когда выполняются условия излучения Зоммерфельда.
19.6. Волновые фронты и принцип Гюйгенса 993 Таким образом, решение за пределами области S описывается расходящимися сферическими волнами, излученными поверхностью S. Именно Гюйгенсу принадлежит идея, что распространение возмущений в волновой теории представляется суперпозицией вторичных возмущений от промежуточной поверхности, скажем от S. Однако, он не дал адекватного объяснения, почему не существует обратной волны (падающей волны), т. е. почему волны распространяются только от поверхности. Идея, что обратные волны могут уничтожать друг друга в силу разности их фаз, принадлежит Френелю. Френель думал, что если все источники находятся внутри поверхности S, то вторичное излучение (т. е. подинтегральное выражение в формуле Гельмгольца) в силу интерференции для каждого элемента поверхности будет создавать нулевой эффект в каждой внутренней точке. Приведенные соображения, принадлежащие по существу Гельмгольцу, были первым строго математическим подходом к проблеме. Они показывают, что волны уничтожаются внутри области благодаря суммарному эффекту от границы. И тем не менее, как мы увидим в главе 21, Френель был прав с точностью до членов порядка 1/к. Это будет сделано с помощью асимптотической оценки интегралов в формуле Гельмгольца. До сих пор мы работали с монохроматическим излучением и, соответствующим зависящей от времени функции υ(χ, у, z, i) = u(x,y,z)e~lkt. Для фиксированной точки Ρ введем функцию νΡ(χ, у, z, t) = v(x, y,z,t-r), где г — расстояние от Ρ до (х, у,ζ). Подстановка в формулу Гельмгольца дает *№т> - s Is {Vp*d GHI; ** -; ***) ■ Это формула Кирхгофа. Поскольку она линейна по ν не содержит в явном виде частоту, то она верна для любой суперпозиции монохроматических волн с различными частотами, а следовательно, для произвольного решения волнового уравнения. В этой форме связь с принципом Гюйгенса очевидна.
994 Глава 19. Уравнения Максвелла Резюме А. Уравнения Максвелла Вы должны знать законы Фарадея и Ампера в интегральной и дифференциальной форме и уметь доказывать, что 2-формы F = B + EAdt и G = D- H Adt удовлетворяют условию G = *F в вакууме. Вы должны уметь приводить уравнения Максвелла к виду ПА = Airj и описывать решения этого волнового уравнения. Вы должны знать, как формулируется закон сохранения энергии-импульса для электромагнитного поля через дифференциальные формы. Задачи 19.1. В четырехмерном пространстве-времени (используются единицы, когда с = 1) (dt,dt) = 1, (dx,dx) = (dy,dy) = (dz,dz) = —1 и σ = dt A dx A dy A dz. 2-форма F, представляющая электромагнитное поле, может быть выражена через координаты х, у, z, t в виде F — Bz(x,y,t)dx Ady — Ex(x,y,t)dt Adx — Ey(x,y,t)dt Ady. Все другие члены равны нулю. (a) Какое соотношение должно выполняться для частных производных Bz, Ех и Еу, чтобы выполнялось равенство dF = О? (b) Выразите -kd*F через частные производные Bz, Ех и Еу. 19.2. Преобразование Лоренца а, соответствующее скорости ν вдоль оси χ можно записать в терминах переноса (для удобства мы положили с = 1) следующим образом: a*t' = 7(ί — νχ), а*х' = η{χ — vt), a*y' = у, α ζ = ζ, где 7 = 1/vl — ν2. Если х, у, ζ, t — координаты системы отсчета наблюдателя, стоящего на платформе, а х', у', z', t' — координаты системы отсчета наблюдателя, сидящего в поезде, который
Задачи 995 движется со скоростью υ вдоль оси х, то а* преобразует координаты события х', у', z', t', наблюдаемое в поезде, в координаты того же события в системе отсчета наблюдателя на платформе. (a) Покажите явно, что а* сохраняет звездный оператор, т. е. что α**ω = *(α*ω). Используя звездный оператор для координат х, у, z, t, т.е. -kdt = dx Ady Adz и т.д., проверьте следующее: а* * dx' A dy' A dz' = *α* (dx' A dy' A dz'), a**dt' A dy' A dz' = *a*(dt' A dy' A dz'), a**dt' A dx' = *a*(dt' A dx'), a**dx' A dy' = *a*(dx' A dy'). (b) Потенциал А может быть записан через координаты пассажира поезда в форме А = A't dt' + А'х dx' + А'у dy' + A'z dz'. Вычислите а* А и приравняйте полученный результат At dt + Ах dx + Ay dy + Az dz, откуда получите выражения для At, Ax, ... через A't, A'x, 19.3. Выполните упражнение 19.2 для 2-формы F = В' + Е' A dt', F = B'xdy' Adz' + -·· + Ε'ζ dz' A dt'. Вычислите *F и сравните результат с F = Bxdy ΑάζΛ + EzdzAdt. Получите вьфажения для компонент поля Вх, Ву, Bz, Ех, Еу, Ez через В'х, В'у, В'х, Е'х, Е'у, E'z. 19.4. Точечный заряд покоится в начале координат в системе отсчета поезда. Для этого заряда, как известно, ρ _ R' . F' л At' - х'dx'+ У'dy'+ z'dz' , F-B +E Adt - {χ,2+υ,2 + ζ,2)3/2 Λ dt. Вычислите a*F и опишите поля заряда, совершающего равномерное движение вдоль оси х.
996 Глава 19. Уравнения Максвелла 19.5. Из 2-формы F можно построить две различные 0-формы: h = *(FAF), /2 = *(FA*F). Выразите эти величины, инвариантные относительно преобразований Лоренца, через компоненты F, т. е. через Вх, Ву, ..., Εζ.
Глава 20 Комплексный анализ В этой главе приводится достаточно стандартное изложение теории функций комплексного переменного. Введение Настоящая глава посвящена изучению теории функций комплексного переменного. Эта теория, в ее различных модификациях, является главным достижением математики XIX века. Здесь мы кратко рассмотрим только ключевые результаты. Вспомним основные положения теории функций нескольких переменных, в частности, двух переменных (главы 7-8). Пусть χ и у — координаты в пространстве R2. Основные объекты дифференциального исчисления — функции, линейные дифференциальные формы и формы второй степени. Каждый из них может быть определен только на открытом подмножестве пространства R2. Функция / приписывает число f(x,y) точке {х,у)· Если специально не оговорено, то все функции предполагаются дифференцируемыми. Линейная дифференциальная форма имеет вид ω = adx + bdy, где о и Ъ — функции. Если η — ориентированная кривая (кусочно- дифференцируемая и лежащая в области определения ω), то можно вычислить криволинейный интеграл J ω. Если имеется суперпозиция (объединение) 7 = 71 · · · 7п, где 7i — дифференцируемые кривые, параметризованные Xi(t), yiit) при щ ^ t ^ βί,
998 Глава 20. Комплексный анализ то / ω = / ω Л ь/ ω, J"1 -Ό·! J*Yn '71 ·>Ίη где / ω= ί \а(хг(г),у№)х№)+Ъ(х&),Уг(г))Ж(г)]М. J-Ц Joti Заданная функция / имеет дифференциал df, являющийся линейной дифференциальной формой вида df = —dx + — dy. ox oy Теорема Стокса для функций (фундаментальная теорема дифференциального исчисления) говорит, что если η — любая кривая, соединяющая точки ρ и q, то J df = f(q) — f(p). 2-форма имеет вид Ω = cdx Л dy, где с — функция. Если D — ограниченная область на плоскости (содержащаяся в области определения Ω), то можно сформировать интеграл fD Ω. Если при этом D имеет стандартную ориентацию, то fD Ω — двойной интеграл ω = c(x,y)dxdy. Jd Jd (Если D имеет противоположную ориентацию, то необходимо изменить знак.) Предполагается, что все области имеют кусочно- дифференцируемую границу, которая обладает индуцированной ориентацией. Эта граница (с ориентацией) обозначается 3D. Если ω = adx + bdy, то άω является 2-формой вида (да дЬ\ . _, (к}={ду-дх:)ахАау> и теорема Стокса (для 1-форм) гласит άω. /" = /' JdD JD
20.1. Комплекснозначные функции 999 Мы предполагаем, что читатель знаком с основными свойствами комплексных чисел. Каждое комплексное число с можно записать в форме с = г + is, где г и s — вещественные числа, i2 = — 1. При этом г называется вещественной частью и s — мнимой частью комплексного числа с. Число с = г — is называется комплексно-сопряженным от с, и ее = \с\2 = г2 + s2. Для комплексных чисел выполняются все законы алгебры, в частности, коммутативный и ассоциативный законы для операций сложения и умножения и дистрибутивный закон. 20.1. Комплекснозначные функции Теперь мы рассматриваем функции и дифференциальные формы, которые могут иметь комплексные значения, т. е. комплекс- позначная функция / приписывает комплексное число f(x,y) = и(х,у) + iv(x,y) каждой точке на плоскости, где и и ν — веще- ственнозначные функции. Другими словами, задание комплекс- нозначной функции означает задание пары вещественнозначных функций, т. е. то же самое, что задание отображения (открытого подмножества) R2 в R2. Мы говорим, что / дифференцируема, если дифференцируемо это отображение, т. е. дифференцируемы функции uviv. Таким образом, формулы df/dx = ди/дх+idv/dx и df/dy = ди/ду + idv/dy задают частные производные функции /. Можно рассматривать различные линейные комбинации этих частных производных с вещественными или комплексными коэффициентами. Например, рассмотрим выражение Id/ j.a/ 2 дх + 2 ду' Можно считать, что это результат действия дифференциального оператора ^(д/дх + \д/ду) на функцию /. В последующем изложении этот оператор чрезвычайно важен для нас, поэтому введем для него специальное обозначение d/dz. Таким образом, д 1 ( д . д \ ,пп ч
1000 Глава 20. Комплексный анализ Аналогично определим * = 2 {&-%)· (2°-2) Несколько позже станет понятна причина для введения этих обозначений. Заметим, что если / = и + iv, то df _ ди .dv dz dz dz _ 1 ί ди .ди\ i idv .dv\ ~ 2 \£h; + 1шду) + 2 \dx + %) ' так что, собирая вместе вещественную и мнимую части, мы получим dl = \(du_dv\l(dudv\ (2Q 3) dz 2 \дх ду) + 2 \ду + ах; · ι ϋ-ό) Заметим, что для любой пары дифференцируемых функций / и g мы имеем и аналогичное равенство справедливо для d/dz. Рассмотрим комплекснозначную функцию z{x,y) = χ + vy. Запишем это в виде ζ = χ + \у (20.5) и аналогично ζ = χ — iy. Тогда функция ζ2 задается формулой ζ2 = (х2 - у2) + i2xy, а ζ2 = (χ2 - у2) - 2i2xy I |2 2,2 ΖΖ = \Ζ\ = Χ + у .. Аналогично можно сформировать полином от ζ, например, 17ζ3 — bz2 + 2z — 3, полином от ζ, или смешанный полином, например,
20.2. Комплекснозначные дифференциальные формы 1001 3z2z — 2ггг + ζ1 — bz + 1 и т. д. Все это — примеры комплексно- значных функций. Если в формулу (20.3) вместо / подставить ζ, где и(х,у) = χ и v{x,y) = у, то получим | - 0 (20.6) и аналогично dz _ dz Из формулы (20.4) и линейности d/dz мы заключаем, что если Ρ = Ρ(ζ) — произвольный полином только от ζ, то ΟΖ Если Ρ (ζ) = оо + αχζ + · · · + αηζη, то дР —— = αϊ + 2α2ζ Η h nanzn~l. οζ Это полином Ρ'(ζ) — обычная производная полинома Р. Таким образом, £ = ° и £ = "■ ΟΖ ΟΖ 20.2. Комплекснозначные дифференциальные формы Рассмотрим дифференциальные формы, имеющие комплексные значения. Линейная дифференциальная форма имеет вид adx + bdy, где о и Ъ — комплекснозначные функции. Сохраняются определение криволинейного интеграла и одномерный вариант теоремы Стокса, только теперь значениями будут комплексные числа. Определим линейные дифференциальные формы dz и dz dz = dx + i dy, и dz = dx — i dy.
1002 Глава 20. Комплексный анализ Отметим, что эти дифференциальные формы линейно независимы в каждой точке и, кроме того, dx = -(dz + dz), dy = — (dz — dz). Таким образом, произвольная линейная дифференциальная форма может быть записана в виде adx + bdy = Adz + Bdz, где A = -(a-ib) и В = -(α + 'ώ). В частности, для любой дифференцируемой комплекснозначной функции / мы имеем df = —dx + — dy ox ay 1 (df .df\ . 1 (df .df\ , = 2\Yx-%)dz + 2\ix+%)d~Z- Используя определения (20.1) и (20.2), мы можем это переписать в виде df=%dz + % dz. (20.7) ΰζ ΰζ Давайте рассмотрим несколько примеров. Если взять f = ζ, то из (20.5) и (20.6) имеем d(z) = dz. Таким образом, наши обозначения логичны (именно поэтому мы ввели символы d/dz и d/dz). Если f = Ρ — полином от ζ, то dP = Ρ1 dz. В этом выражении отсутствует член с dz. Возьмем / = |z|2 = zz, тогда получим d\z\ = zdz + zdz. Определим комплексную экспоненциальную функцию е2 формулой ez = ex(cosy + isiny).
20.2. Комплекснозначные дифференциальные формы 1003 Тогда dez = ex(cosy + ismy)dx + ех(— sin у + i cos у) dy = ex (cos у + i sin у) (dx + '\dy), и, следовательно, dez = ez dz. Из этого выражения получаем £=0. dz Комплекснозначная 2-форма имеет вид cdx Λ dy, где с — комплекснозначная функция. Из двух линейных ком- плекснозначных дифференциальных форм ωχ и U2 мы можем образовать внешнее произведение ω\ /\ui2- Тогда, например, dz Adz = (dx + \dy) Λ (dx — \dy) = —2\dx Λ dy или dx Ady = -dz A dz. В частности, ΘΑ d(Adz) = 0, если и только если —— = 0. oz Теорема Стокса сохраняется без изменения, только теперь ω — линейная комплекснозначная дифференциальная форма. Например, если Adz = 0 удовлетворяет равенству d(Adz) = 0, то теорема Стокса говорит, что для любой области D, содержащейся в области определения А, мы имеем L Adz = 0. dD Этот важный результат называется теоремой Коши.
1004 Глава 20. Комплексный анализ 20.3. Голоморфные функции Дифференцируемая функция /, определенная в некоторой области D пространства R2, называется голоморфной1, если она удовлетворяет тождеству 1-°· <2ο·8> Так как это определение является основным для всей темы, то этот параграф посвящен обсуждению эквивалентных формулировок и простейшим следствиям понятия голоморфности. Поскольку d/dz — дифференциальный оператор, то мы имеем уравнения д , , ч Of да д . , . df .да l(s) = Mi9_/i)· 9#0· Из этих соотношений мы видим, что сумма, произведение и частное двух голоморфных функций тоже голоморфны (в случае частного знаменатель нигде не должен обращаться в нуль). В предыдущем параграфе мы уже пользовались этим замечанием, чтобы получить тождество (d/dz)P(z) = 0, т. е. что любой полином (только от ζ) — голоморфная функция. Аналогично, любая рациональная функция, т. е. отношение двух полиномов P/Q, — голоморфная функция в области D при условии, что Q нигде не обращается в нуль в этой области. С учетом (20.7), функция / голоморфна, если и только если df = hdz, (20.9) т.е. если и только если df не имеет членов с dz. Здесь, конечно, h = df /dz. Это условие можно записать в эквивалентной форме d{fdz) = 0. (20.10) а также аналитической. При этом предполагается непрерывность частных производных первого порядка, что иногда в дальнейшем не уточняется, но используется. — Прим. ред.
20.3. Голоморфные функции 1005 Пусть / = u + iv, где вещественнозначные функции ииь являются вещественной и мнимой частью /. Теперь, полагая вещественную и мнимую части df/dz равными нулю и используя (20.3), мы видим, что ди _ dv ди _ dv дх ду' ду дх Это система дифференциальных уравнений в частных производных первого порядка, называемых уравнениями Коши-Римана. Таким образом, функция / голоморфна, если и только если выполняются уравнения Коши-Римана. Существует другой способ записи уравнений Коши-Римана. Рассмотрим дифференциальную форму и dx + v dy. Тогда в евклидовой метрике на плоскости • (и dx + v dy) = — ν dx + и dy. Тем самым уравнения Коши-Римана эквивалентны равенствам d(u dx + v dy) = 0 и d*(udx + vdy) = 0. Заметим, что они аналогичны уравнениям Максвелла в пространстве R1,3. В уравнениях Максвелла мы имели дело с 2-формами в четырехмерном пространстве. Уравнения Коши-Римана написаны для 1-формы в двумерном пространстве. Как уже было отмечено в главе 18, звездный оператор * : Лп/2 —> Λη/2 (η — четное число) зависит только от конформной структуры. Будем полагать, что / — отображение (подпространства) R2 в R2, переводящее (х, у) в (u(x,y),v(x,y)). Матрица Якоби этого отбражения равна ди/дх ди/ду\ dv/дх dv/dyj ' Из формул (20.11) следует, что эта матрица имеет вид В пространстве R2 матрица имеет такой вид, где о2 + Ъ2 φ 0, если (20.11) о — Ь Ъ а
1006 Глава 20. Комплексный анализ и только если она конформна (т.е. сохраняет углы) и сохраняет ориентацию. Тогда (20.11) можно переписать так: fdu/dx ди/ду\ или равна нулю, или конформна2 , . \dv/dx dv/dyj и сохраняет ориентацию. ^ ' ' Пусть / = u + iv и g = r + is — комплексные функции. Будем рассматривать /ир как отображения (подпространства) R2 в М2. Если образ g лежит в области определения /, то можно построить композицию / о д. В силу цепного правила, матрица Якоби fog (рассматриваемая как отображение R2 в R2), вычисленная в (х,у), является произведением матрицы Якоби функции /, вычисленной в точке (г(х, у), s(x,y)), на матрицу Якоби функции д, вычисленной в точке (х,у). Произведение двух конформных сохраняющих ориентацию матриц тоже конформно и сохраняет ориентацию. Кроме того, произведение нулевой матрицы на любую матрицу равно нулю. Из (20.12) следует, что композиция двух голоморфных функций тоже голоморфна. Для композиции двух голоморфных функций мы используем стандартное выражение: если, например, f(z) = ez и g(z) = 3z2—2, то fog = e3z ~2. Поскольку d/dz — линейная комбинация операторов d/dx и d/dy (с постоянными коэффициентами), из цепного правила следует Поэтому для примера, приведенного выше, мы имеем 1-е3*2-2 = 6*е3г2-2. oz Другими словами, для голоморфных функций действие оператора d/dz можно вычислять как обычную производную функции одной переменной. Причина вскоре станет ясна. Условие (20.12) не слишком удобно, потому что в нем есть два разных случая: матрица Якоби равна нулю или не равна нулю. Давайте запишем условие (20.12) несколько по-другому. Рассмотрим матрицу J-(° -^ J ~ Ιι ο 2По этой причине голоморфная функция, для которой df/dz φ 0 всюду в рассматриваемой области, задает конформное отображение. — Прим. ред.
20.3. Голоморфные функции 1007 Матрица Л-Че* коммутирует с J, т.е. выполняется равенство A3 = J А, если и только если о = d и с = —Ь, как легко увидеть, перемножая матрицы. Таким образом, AJ = J А, если и только если матрица А имеет вид А~ ■ ι. о о где о и Ъ могут быть равны нулю. Тогда условие (20.12) можно записать в виде (ди/дх ди/ду\ /0 -1\ _ /0 -Л (ди/дх ди/ду\ \dv/dx dv/ду) \l 0 ) ~ \1 0 ) \dv/dx dv/dy) (20.14) Мы можем дать интересную интерпретацию равенству A J = J A и тем самым условию (20.14). Матрица А имеет размер 2x2. Она задает линейное преобразование вещественного двумерного векторного пространства R2 в себя. Пространство R2 можно идентифицировать с одномерным комплексным векторным пространством С, идентифицируя вектор I 1 с комплексным числом x+iy. Умножение этого числа на i переводит его в — y+ix. Но комплексное число —у + ix соответствует вектору I 1 = J I Таким образом, J — матрица умножения на i с вещественной точки зрения3. Произвольное линейное преобразование одномерного комплексного векторного пространства С — это линейное преобразование пространства R2. Но не каждое линейное преобразование А пространства R2 над вещественными числами соответствует линейному преобразованию пространства С над комплексными числами. Комплексное линейное преобразование должно В обычной евклидовой метрике Ж2 это поворот на угол 90е (в направлении от ех к еу). Умножение на число с = а + ib представляет собой композицию гомотетии с коэффициентом г = \с\ = л/а2 + Ъ2 и поворота на угол θ (аргумент с), удовлетворяющий условию с = r(cos #+isin θ), т. е. конформное линейное преобразование. — Прим. ред.
1008 Глава 20. Комплексный анализ коммутировать с умножением на комплексные числа, в частности, на i. Таким образом, чтобы матрица А соответствовала комплексному линейному преобразованию, должно выполняться равенство A J = J А. Если А удовлетворяет этому условию, т. е. А = I , I, то легко проверить, что А соответствует умножению на комплексное число о + ib, т. е. А I 1 соответствует (о + ib)(x + iy). Очевидно, что умножение на комплексное число в пространстве С комплексно линейно. Таким образом, (20.14) можно переписать в форме Преобразование I „ ',„ „ '.„ 1 комплексно линейно. (20.15) Ни одна из приведенных эквивалентных формулировок, за исключением уравнений Коши-Римана (20.11), не была известна математикам XIX века. А теперь дадим классическую формулировку, наиболее близкую к (20.15). Пусть / — дифференцируемая функция, не обязательно голоморфная, а I I — точка из области определения /. Кроме того, пусть II — малый вектор. Тогда из определения дифференцируемости мы имеем / ((;++"))-/((:))^fc+l,+o(*2+i2|i)i/2)' Здесь частные производные вычисляются в точке ( Пусть ζ = x+iy и h = k+'il. Будем писать f(z) вместо / Тогда предыдущее уравнение можно переписать в форме f(z + h)-f(z) = ^k + ^l + o(\h\). Используем (20.7) и перепишем еще раз: f(z + h)-f(z) = ^h + ^h + o(\h\)- OZ OZ
20.3. Голоморфные функции 1009 Это уравнение содержит комплексные числа. Поэтому если h φ Ο, то обе части делим на h и получаем f(z + h)-f(z) df dfh h dz dz h^~ { >' Заметим, что левая часть этого равенства выглядит как обычное разностное отношение, но только здесь комплексные числа. Предположим, что \h\ —> 0. Величина h/h может быть любым комплексным числом, модуль которого равен единице. (Например, если h — вещественное число, то h/h = 1, а если h = is, т.е. чисто мнимое, то h/h = —1.) Поэтому предельное выражение справа может зависеть от угла, при котором h —> 0. Если мы хотим, чтобы этот предел существовал, т. е. не зависел от угла, надо потребовать, чтобы df /dz = 0 в точке I 1. Таким образом, если / — голоморфная функция, то предел левой части равенства существует во всех точках области определения /, и этот предел равен df /dz и является непрерывной функцией. Обратно, предположим, что в каждой точке существует предел /(г+„)-/(г) h—>0 П (независимо от того, как h стремится к нулю) и является непрерывной функцией. Выбирая h вещественным числом, можно показать, что df/dx существует и непрерывна, а выбирая h чисто мнимым, можно показать, что df/dy существует и непрерывна. Тогда / — непрерывно дифференцируемая функция. Предыдущее рассуждение показывает, что df /dz = 0 и f'(z) = df /dz. Итак, мы доказали, что / голоморфна, если и только если существует предел lim f^ + hl~f^ = f{z) (20.16) /ι—>ο h независимо от того, как h стремится к нулю, и этот предел — непрерывная функция. Короче условие (20.16) можно сформулировать так: функция / непрерывно дифференцируема с комплексной точки зрения. Именно так рассуждали математики в
1010 Глава 20. Комплексный анализ XIX веке. Такой подход довольно обманчив, потому что условие комплексной дифференцируемости имеет гораздо больше ограничений, чем обычное условие дифференцируемости. Тем не менее, мы принимаем обозначение f'(z), как более удобное, чем df /dz. Как уже было отмечено, из теоремы Стокса и (20.10) следует ! f(z)dz = 0, (20.17) JdD что является интегральной теоремой Коши для любой области D, лежащей в области определения голоморфной функции /. И обратно, если / — произвольная функция, то / f(z)dz= [ d(fdz). JdD JD Этот интеграл обращается в нуль для всех D, если подынтегральное выражение тождественно равно нулю, т. е. если / — голоморфная функция. Таким образом, мы показали, что все условия (20.8)-(20.17) эквивалентны. Функция, удовлетворяющая любому из них (а тогда и всем им), голоморфна. 20.4. Вычисление вычетов Начнем с вычисления контурного интеграла J zn dz, где η — окружность с центром в начале координат. Если п ^ 0, то функция zn голоморфна на всей плоскости, тогда из теоремы Коши следует, что этот интеграл равен нулю. Для отрицательных значений η функция zn не голоморфна (и не определена) в начале координат, и следовательно, мы должны вычислять интеграл прямым способом. Если окружность 7 имеет радиус г, то в полярных координатах можно написать ζ = re . Тогда вдоль окружности 7 имеем dz = ire10 άθ. Итак, zndz = irn+1e^n+1^de [ zndz = irn+1 Ге*п+1^ав. J~i Jo
20.4. Вычисление вычетов 1011 Этот последний интеграл равен нулю всегда, кроме случая η = — 1, когда он равен 2ж. В этом случае rn+1 = 1 и поэтому J ^ z"dz=\°> еспип^-1· Ι 2·7Π, если η = —1. Пусть D — некоторая область, содержащая начало координат (рис. 20.1), и пусть / — функция, голоморфная в области D — {0}. Далее предположим, что вблизи начала координат можно написать / = α-ηΖ-η + α_η+ιζ-η+1 + ·■■+ α^ιζ"1 + д, где д — голоморфная функция вблизи начала координат. Рис. 20.1 Рис. 20.2 Давайте вычислим fdD f(z)dz. Нарисуем окружность η небольшого радиуса с центром в начале координат, целиком лежащую вйив области, где работает выписанное разложение (рис. 20.2). Тогда / голоморфна в той части D, которая является внешней по отношению к 7· Поэтому, в силу интегральной теоремы Коши, / fdz= I fdz. JdD J^ Если сюда подставить разложение / и проинтегрировать каждый член, то все отрицательные степени дадут нуль, кроме o-iz-1. При этом J gdz = 0, поскольку д — голоморфная функция. Тогда / f(z) dz = 2·7πα_ι. JdD
1012 Глава 20. Комплексный анализ Поскольку начало координат было выбрано произвольно, то его можно заменить любой другой точкой или конечным числом точек в области D. Говорят, что функция / имеет полюс4" в точке а, если она голоморфна в области U — {а}, где U — некоторая окрестность точки а, и если в ее окрестности функция / имеет разложение /(ζ) = a-n(z - α)~η + ... + α_ι(ζ - а)"1 + д, где д — голоморфная функция вблизи а. Число ο_ι называется вычетом функции / в точке а и обозначается resQ(/). Из предыдущих рассуждений следует, что интеграл от f(z) dz по малой окружности вокруг а равен 2·7πα_ι = 27riresQ(/). Функция, голоморфная в области D, за исключением полюсов, называется мероморфной. Рис. 20.3 Рис. 20.4 Предположим, что / мероморфна в области D и имеет в ней конечное число полюсов (рис. 20.3). Тогда вокруг каждого полюса можно нарисовать маленькую окружность (рис. 20.4) и, применив интегральную теорему Коши, написать f(z)dz = 2m ]P resQ(/). по полюсам а Эта формула называется теоремой Коши о вычетах. Она очень полезна при вычислении определенных интегралов. Например, В предположении, что старший коэффициент рэзлолссния а—η ф 0, ЧИСЛО η называется порядком полюса. — Прим. ред.
20.4. Вычисление вычетов 1013 мы хотим вычислить определенный интеграл άθ а + cos θ' где о > 1. Запишем его в форме 1 ί2π άθ 2 /0 a + cos θ Теперь положим ζ = ειθ, тогда на единичной окружности dz/iz = άθ. Кроме того, 2 cos θ = βιθ + β"ιθ = ζ + ζ"1. Тогда наш интеграл принимает вид 1 Г <L· 1 Г dz 2 ]Ί \ζ{α+\{ζ + ζ-1)) ~ Τ Λ {ζ2 + 2αζ + 1)' где 7 — единичная окружность. В то же время ζ2 + 2αζ + 1 = (ζ — αϊ) (ζ — аг), где а\ = —а + у/а2 — 1 и а.2 = —а — у/а2 — 1, откуда мы получаем ζ2 + 2αζ + 1 α,χ — d2 \z — αι ζ — α.2) Поскольку ο > 1, имеем α.2 < — 1, и поэтому α2 лежит вне единичной окружности. А так как αχα2 = 1, то αϊ лежит внутри единичной окружности. Кроме того, Функция 1/(г—аг) голоморфна внутри этой окружности, поэтому наша формула показывает, что вычет равен 1 _ 1 αι-α2 2\Ja2 - 1 Таким образом, согласно теореме Коши о вычетах, получаем ответ L
1014 Глава 20. Комплексный анализ Мы вскоре увидим, что любая рациональная функция вида R(z) = P(z)/Q(z) мероморфна и имеет полюса в точках, где Q обращается в нуль. (Это следует немедленно из разложения рациональной функции на дроби. Но здесь мы это не предполагаем.) Кроме того, мы получим эффективный способ вычисления вычетов. Тогда это позволит нам вычислять, например, интегралы вида JQ π R(cos θ, sin θ) άθ, сделав подстановку ζ = βιθ и учтя, что cos# = (l/2)(z + ζ-1) и sin θ = (l/2i)(z — ζ"1), после чего проделывая процедуру, описанную выше. Начнем с леммы. Предположим, что д голоморфна в области D 5, кроме конечного числа точек а\,..., о^. Предположим, что в каждой из этих точек функция д удовлетворяет условию lim \z — а\ \g(z)\ — 0. ζ—>а Тогда / gdz = 0. JdD Для доказательства этого утверждения нарисуем маленькие окружности 7г вокруг каждой точки Oj. Тогда, как и раньше, JdD9άζ = Σ$Ίί9dz. При этом I/ g{z) dz ζ 27rrMr, где г — радиус окружности л, и Мг — максимум |д| на 7ί· В силу предположения гМг —> 0 при г —> 0. Таким образом, устремляя к нулю радиусы окружностей, мы получим fdD g dz = 0. А теперь пусть / голоморфна в области D и о — точка в области D. Применим доказанную лемму к функции 9(2) = &WM. ζ — а 5D — замыкание области D: она содержит все точки области D плюс точки на границе. [Голоморфность функции на замкнутом множестве подразумевает выполнение соответствующих условий в некоторой открытой окрестности этого множества. — Ред.]
20.4. Вычисление вычетов 1015 Функция д голоморфна в D везде, кроме точки о. Более того, (ζ — a)g(z) = f(z) — /(о) и это выражение стремится к нулю при ζ —> о. Тогда Jdi IdD ζ-α Но /(о) — постоянная и dz L dz = 0. = 2т. dD z-a Откуда получаем Jdi f^dZ = 2mf(a), IdD z-a и теперь можно написать т~ш1 dz. dD z-a Для удобства заменим о на ζ и ζ на ξ и напишем интегральную формулу Коши /(*) = о^/ г^#- (20Л8) ^πι Уао ξ- ζ Эта формула является краеугольным камнем, на котором строится вся теория комплексного анализа. Сформулируем следующую лемму. Пусть φ — комплексно- значная функция, определенная и непрерывная на границе 3D некоторой области D. Тогда функция JdD (ξ ~ ζ)η голоморфна в области D и обладает свойством F^z) = nFn+1(z). Докажем эту лемму по индукции. Прежде всего докажем, что Fi непрерывна в D. Пусть zq — некоторая точка в области D. Выберем о настолько малым, что окрестности \z" — zq\ < 2о и
1016 Глава 20. Комплексный анализ \z' — zo\ < о целиком находятся в области D. Таким образом, расстояние от ζ1 до всех точек границы 3D не меньше о и, следовательно, при ξ G 3D неравенство 1 1 1 < тг^ < -τ \ξ-ζ'\\ξ-ζ0\ 2а? а? выполняется для всех таких ζ. Теперь убираем штрих и применяем равенство _2 ι ι , _ λ ξ-ζ ξ-ζ0 (£-ζ)(ξ-ζο){Ζ ZQh так что |ВД-Я(2й)| = |г-2й||/ {р Ф®* J \JdD {ξ-ζ){ξ- ζο)\ ^\ζ-ζ0\± ί \φ{ξ)\άξ. αζ JdD Это означает, что Fi — непрерывная функция. Более того, Ή(ζ)-Ή(ζΰ)_ Γ Φ(ξ)άξ Jdl z-zq JdD (ξ~ζ)(ξ-ζο)' Если фиксировать значение zq, то функция φ{ξ)/{ξ — zq) непрерывна на границе 3D. Следовательно, правая часть этого равенства — непрерывная функция от ζ, и оно выполняется для всех ζ φ zq. Устремляя ζ —> zq, мы видим, что Fi — дифференцируемая функция в комплексном смысле и Кроме того, {ζ - ζ0) Ι + (ξ-ζ)(ξ-Ζ0) (ξ-ζηξ-Ζ0) (ξ-ζ)2> поэтому F2(z)-F2(z0) Φ(ξ)άξ f φ(ξ)άξ , . Г φ(ξ)άξ [ Φ(ξ)άξ [ φ(ξ)άξ [ te-zm-zoY
20.4. Вычисление вычетов 1017 что показывает (с учетом предыдущих соображений) непрерывность функции F2 и голоморфность функции F\. Далее, F2{z) - F2(z0) _ Rx{z) - ЪЫ + f φ(ξ) άξ J (ί-- ζ - z0 ζ- zQ J (ξ- ζ)2(ξ ~ zq) ' где Ri {^Ιϊγ Φ(ξ)<% ζ){ξ-ζοΥ Поскольку функция φ(ξ)/(ζ — zo) непрерывна на границе dD, благодаря предыдущему результату мы приходим к выводу, что Ri дифференцируема и Ri(zq) = J (Ф(& / (ξ—zq)3) άζ· Переходя к пределу в нашем уравнении, получаем, что F2 — дифференцируемая функция в комплексном смысле и F'2 = 2F3. Теперь процедура индукции уже очевидна. Предположим, что мы доказали свойство F'n_l = (η — l)Fn для всех непрерывных функций ф. Используя тождество 1 ζ — zq l (ξ-ζ)η-4ξ-ζο) (ξ-ζ)η(ξ-ζο) (ξ-χο)"' мы видим, что Fn(z) - Fn{zo) f φ(ξ)άξ f φ(ξ)άξ _ f φ(ξ)άξ J £-г)п-Щ-го) J (ξ-ζο)η+{ Z0)J (ξ-ζΠξ-ζο) = Rn^z) - Rn-M) + {z- z0) J {ξ_Φ^_ζο), где функции связаны с непрерывной функцией φ(ξ)/(ξ — zq). Итак, мы доказали, что Fn непрерывна. В силу предположения индукции R'n_i(zo) = (η — l)Rn(zo) = (η — l)Fn+i(zo), поэтому разделим уравнение для Fn(z) — Fu{zq)
1018 Глава 20. Комплексный анализ на ζ — zq и перейдем к пределу ζ —> zq. В результате получим i^ = nFn+i, что и требовалось доказать. Применим этот результат к интегральной формуле Коши (20.18). Поскольку функция / непрерывна, мы приходим к удивительному заключению: если функция / голоморфна в области D, то она в ней бесконечно дифференцируема, причем каждая производная (комплексная) голоморфна и удовлетворяет условию 1 [) — ldD (ξ ~ Z)U+1 ' -м-я! (20.19) Из формул (20.18) и (20.19) можно получить много важных следствий, что мы и сделаем в следующих параграфах. Начнем с принципа устранимых особенностей. Предположим, что функция / определена и голоморфна в области D — {а}, где о G D, т.е. во всей области D, кроме одной точки о. Необходимым и достаточным условием того, что существует голоморфная функция, определенная в области D, которая совпадает с / в области D — {о}, является limz^a(z — a)f(z) = 0. Такая продолженная функция (если она существует) определена однозначно. Доказательство. Пусть /(о) обозначает значение продолженной функции в точке о. Поскольку продолженная функция голоморфна, она непрерывна в точке а и lim2_>a f(z) = /(a). Поэтому limz^a(z — a)f(z) = limz^a(z — a)/(o) = 0, что доказывает необходимость. Чтобы доказать достаточность, нарисуем небольшую окружность 7 с центром в точке о, целиком лежащую в области D. Рассмотрим функцию 2тг1 У /(0# Это функция голоморфна внутри 7· Нарисуем другую окружность 71 вокруг о, лежащую внутри η. Тогда во всех точках кольца между 71 и 7, согласно интегральной формуле Коши (20.18), имеем 2тп ]Ίξ-ζ 2тп у71 ξ - ζ Согласно нашему предположению, если фиксировать ζ и радиус окружности 71 устремить к нулю, то второй интеграл обратится
20.4. Вычисление вычетов 1019 в нуль. Поэтому 27Г1 У7 ξ - ζ для всех ζ φ а внутри 7· Это означает, что справа стоит голоморфная функция, определенная внутри 7, причем она совпадает с / при ζ φ а. Очевидно, что такая продолженная функция единственна, потому что для нее должна выполняться интегральная формула Коши. В дальнейшем мы будем обозначать эту продолженную функцию также буквой /. Пусть / голоморфна в области D, и пусть о — точка в этой области. Применим принцип устранимых особенностей к выражению ζ — а Очевидно, что функция /ι определена и голоморфна в области D — {о} и обладает свойством \\m.z^a(z — a)fi(z) = 0. Следовательно, ее можно продолжить до голоморфной функции, определенной во всей области D, и написать Λ(Ι) ι /ΛΟζΜ^. 2тп У7 {ξ -α)(ξ- ζ) При этом откуда („_2)/lW ' /ШМ, ι ίΜζΜΜ 27п./7 ξ -α 27π./7 ξ-ζ = f(a)-f(z).6 В этой и следующей формуле учитывается, что (ξ-ζ){ξ-α) = 0, и этот интеграл прибавляется к выражению для /ι (г) с коэффициентом f(a)/2m. — Прим. ред.
1020 Глава 20. Комплексный анализ Таким образом, /М = /(.)+(,-.)ЛМ. где ЛМ = 5./({ _$_„,«· Конечно, Л (а) = /'(а). Ту же процедуру можно применить к /ι и определить /2 из выражения fi(z) = /ι(α) + (ζ — a)f2(z). Таким образом можно проделать η шагов f(z) = f(a) + (z-a)f1(z), f1(z) = f1(a) + (z-a)f2(z), fn-i = /n-i(o) + {z- a)fn(z), так что f{z) = /(α) + (ζ-a)/^) + --- + (z-a)n-Vn-i(a) + (г -a)n/n(z). Дифференцируя это формулу к ζ η раз, получим /&(α) = (l/A;!)/(fe)(o). В результате получается ряд Тейлора с остатком f(z) = /(a) + (ζ - a)f'(a) + i^l!/"(a) + · · · + (ζ - α)η/η(ζ), (20.20) где, как и раньше, '"<*> = 55/«-/$-«)« (2а21) для всех ζ внутри j.7 Из формулы (20.21) можно получить полезную оценку остатка. Предположим, что η — окружность с радиусом R и центром 7Доказательство формулы (20.21) индукцией по η оставляем читателю в качестве упражнения. — Прим. ред.
20.5. Приложения и следствия 1021 в точке а, а М обозначает максимальное значение |/(£)| для ξ на окружности 7· Подстановка в формулу (20.21) дает Μ \1пШ ^ „ ,,„—: [г. (20.22) Поскольку /η(α) = (1/η!)/(η)(α), с помощью формул (20.21) и (20.22) мы получаем +i (20.23) |/(η)(α)| < Mn\R~n. (20.24) (Здесь 7 — окружность с радиусом R, центром в точке α, Μ — максимум функции / на этой окружности.) Обратите внимание на замечательное логическое развитие ситуации. Мы начали с предположения, что функция / имеет непрерывную производную первого порядка, которая удовлетворяет уравнениям Коши-Римана в частных производных. Из этих уравнений следует, что / имеет производные всех порядков, и что n-я производная функции / (в комплексном смысле) существует и определяется простым выражением (20.23) через значения самой функции /. В следующем параграфе мы получим ряд следствий из этого факта. 20.5. Приложения и следствия В качестве первого примера применения формулы (20.24) докажем теорему Лиувилля. Голоморфная и ограниченная на всей плоскости функция должна быть постоянной. Доказательство. Пусть |/(г)| ^ Μ для всех ζ. В формуле (20.24) положим η = 1. Значение R можно выбрать сколь угодно большим, а это значит, что /'(а) = 0 для всех о. Таким образом,
1022 Глава 20. Комплексный анализ обе частные производные / тождественно равны нулю, т. е. / постоянна. Следствием теоремы Лиувилля является основная теорема алгебры, согласно которой любой полином положительной степени имеет по крайней мере один корень. Доказательство. Напишем Ρ(ζ) = αηζη + οη_ιζη_1 Η Ь ось где η > 0 и ап φ 0. Тогда \Ρ{ζ)\ > [К| - (K-il \z\-1 + -.. + |α0| \ζ\~η)]\ζ\η. Для достаточно больших \z\ выражение в квадратных скобках > 2ΐαη|· Таким образом, |-Р(.г)| —> оо при \ζ\ —> оо, и, следовательно, функция \/Р голоморфна и ограничена вне некоторой окружности большого радиуса. Если бы Ρ(ζ) нигде не обращалась в нуль, то функция \/Р была бы голоморфна и ограничена на всей плоскости, т. е. была бы постоянной. Но поскольку Ρ — не постоянная функция, то это невозможно. Таким образом, должен быть, по крайней мере, один нуль функции Р, что и требовалось доказать. Если Ρ (а) = 0, то (ζ — α)[Ρ(ζ)/(ζ — а)] —> 0, и мы можем воспользоваться принципом устранимых особенностей и утверждать, что Ρ(ζ)/(ζ—α) — голоморфная функция. Далее, поскольку г·' —а·7 = (г —а)(г-?'-1 Η ho·'-1), то Ρ (ζ) — Ρ (а) можно разделить на ζ — а. А поскольку Ρ (а) = 0, то Ρ(ζ)/(ζ — о) — полином степени η — 1. Если η > 1, то опять можно применить основную теорему алгебры и утверждать, что полином степени η имеет ровно η корней, считая с кратностями. Следующий пример. Покажем, что голоморфная функция, определенная в некоторой связной области D, не может обращаться в нуль вместе со всеми производными в любой точке а внутри области D, если только она не равна нулю тождественно. Действительно, предположим, что /(о) = 0 и f(n\a) = 0 для всех п. Выберем R так, чтобы диск радиуса R с центром в точке
20.5. Приложения и следствия 1023 Рис. 20.5 о целиком лежал в области D (рис. 20.5). Сначала покажем, что / тождественно равна нулю на этом диске. Из формул (20.20) и (20.22) мы знаем, что (20.22) f(z) = (z-a)n+1fn+1, где |/η+ι(ζ)| < М Rn{R-\z-a\y откуда , ,/ м М \z-a\n+l l/(z)l ^ (R-\z-a\) Π» · Поскольку \z — а\ < R и η может быть сколь угодно большим, это неравенство означает, что f(z) = 0. А теперь возьмем произвольную точку внутри диска в качестве нового центра, увеличив, таким образом, область, где мы знаем, что f(z) = 0 (рис. 20.6). Если Ъ — любая другая точка в области D, то точки о и Ъ можно соединить кривой, которая вся лежит в области D и, следовательно, на конечном расстоянии от границы. Можно нарисовать конечное число дисков (рис. 20.7), начав с диска, имеющего центр в точке о и закончив диском с центром в точке Ь, получив, таким образом, /(b) = 0. Итак, мы доказали следующее. Предположим, что / голоморфна в некоторой связной области D и равна нулю вместе со всеми производными в точке о, лежащей внутри области D. Тогда / тождественно равна нулю.
1024 Глава 20. Комплексный анализ Рис. 20.6 Рис. 20.7 Предположим, что ап — последовательность точек в области D, причем ап —> о, где о тоже лежит внутри D. Предположим, что f(an) = 0 для всех п. Тогда /(о) = lim/(on) = 0 и /'(а) = lim(/(o) — /(оп))/(а — ап) = 0. Утверждается, что в этом случае все производные f(k\a) = 0 и, следовательно, / = 0. Действительно, предположим, что к — первое положительное целое число, для которого f^k\a) φ 0. Тогда, в силу (20.20), f(z) = (ζ - a)kfk(z), где fk(a) φ 0, и, следовательно, fk{z) φ 0 для ζ в окрестности о. Но поскольку ζ — о φ 0 для ζ φ а, можно утверждать, что f(z) φ 0 для всех ζ, достаточно близких, но не равных о. Но это противоречит исходному предположению, что /(оп) = 0, где ап —> о. Только что доказанную теорему формулируют так: нули (нетривиальной) голоморфной функции должны быть изолированными. Если fag — две голоморфные функции, то предыдущий результат можно применить к голоморфной функции J — д. Тогда утверждается следующее. Если / и д — голоморфные функции в связной области D и если /(an) = g(an) для последовательности точек оп, имеющих предел о = limon, лежащий внутри D, то f = g во всей области D. Этот результат показывает, насколько сильно отличается теория голоморфных функций от теории бесконечно дифференци-
20.5. Приложения и следствия 1025 руемых функций (класса С°°) вещественного переменного. Функция /, заданная формулой /(*) = является С°°-функцией в пространстве Ш. Она тождественно равна нулю для всех отрицательных х. Таким образом, поведение С°°-функции в одной части области ее определения не оказывает никакого влияния на ее поведение в другой части, расположенной на конечной расстоянии. Ситуация с голоморфными функциями совсем другая. Если нам задано поведение голоморфной функции в какой-то части области определения, то она полностью определена во всей области.8 Мы уже видели, что голоморфная функция д не может быть равна нулю вместе со всеми производными в любой точке внутри области определения. Поэтому, если д[а) = 0 в некоторой точке а, то существует наименьшее число к, для которого д( '(а) φ 0. Следовательно, g(z) = {ζ — a)kgk{z) φ 0 для ζ вблизи α, ζ φ а, где дк — голоморфная функция. Предположим, что / тоже голоморфна в той же области. Давайте рассмотрим функцию h = f /g, которая определена для ζ вблизи а, но ζ φ а. Напишем разложение (20.20) функции / в окрестности α f{z) = /(α) + (ζ-α)//(α)+· · ^(ζ-α)^1) ^ff +(*-a)fc/fc(*)· Тогда | /(fc-D{g) 1 | Щ^ {z - a)(k - 1)! gk(z) gk{z)' 8Под частью области определения имеется в виду ее открытое подмножество. Процедура восстановления голоморфной функции по ее ростку, определенному на такой части, во всю область называется аналитическим продолжением,. — Прим. ред.
1026 Глава 20. Комплексный анализ Поскольку \jgk голоморфна вблизи а, то ее также можно разложить в окрестности а: У9к(г) = Ьо + bi{z -α) + ··- + (ζ- a)kbk{z), где bo = \/дк{а) = K\/gW(a) и т. д. Если это разложение подставить в формулу для h, то получим h(z) = a^k(z-ayk+a^k+1(z-a)^k+1^> + ■ ■ ■+a^i(z-a)'1 + hQ(z), где а-к = f(a)b0 = f(a)/gk(a), α-fe+i = f(a)h + f'(oi)b0, и т. д., a ho голоморфна вблизи а. Итак, мы доказали следующее. Частное двух голоморфных функций — мероморфная функция. Предыдущие формулы упрощаются, если д имеет простой нуль в точке а, т. е. если к = 1. В этом случае утверждается следующее. Если д(а) = 0 и д'{р) φ 0, то частное f/g имеет простой полюс в точке а. Вычет в этой точке равен Да)/с/(«), т.е. f(z)/g(z) = a^z-a)'1 +h0{z) вблизи (20.25) а, где o_i = f(a)/g'{a) и ho(z) — голоморфная функция вблизи а. Число к, которое мы использовали сейчас, называется порядком нуля. Таким образом, голоморфная функция g имеет нуль первого порядка в точке а, если д(а) = 0 и </(а) φ 0. Она имеет нуль порядка к в точке а, если д(а) = · · · = ^(fe-1)(a) = 0, но при этом Предположим, что функция / голоморфна в ограниченной области D и имеет конечное число нулей в этой области, т. е. мы предполагаем, что есть конечное число различных точек αϊ,..., ar, где функция / равна нулю. И пусть kj — порядок нуля Эквивалентное условие состоит в том, что функция 1/д имеет в точке а полюс порядка к. — Прим. ред.
20.5. Приложения и следствия 1027 функции / в точке оу. Тогда f(z) = (ζ — ai)klg(z), где функция д обращается в нуль только в точках а2,. ·., аг и имеет тот же порядок нулей в этих точках, что и функция /. Далее можно написать g(z) = (z — a2)k2h(z), где функция h обращается в нуль в точках аз,..., аг. Продолжая таким образом, мы получим f(z) = (z- ai)fel (ζ - a2)fe2 ■■■(z- ar)k'F(z), где F — голоморфная функция в области D, которая не равна нулю ни в одной точке этой области. Продифференцировав это выражение и разделив его на /, получаем f(z) ζ-αϊ z-ar F(z) ' где F'/F — голоморфная функция в области D. В частности, если д — другая голоморфная в области D функция, то gf'/f имеет только простые полюса в точках a^·, вычеты в которых равны kjg(oij). Используя формулу Коши, получаем следующий результат. Предположим, что / и д — голоморфные функции в ограниченной области D, причем / имеет в области D конечное число нулей в точках αϊ,..., ar, порядок которых равен к\,... ,кг соответственно. Пусть, кроме того, / φ 0 на границе 3D. ά/*» ^ <% = к19{а1) + ■■■ + krg{ar). (20.26) dD Л?) В частности, если взять д = 1, то имеем 2тпЛ dD Л?) = числу нулей функции / с учетом их кратности. (20.27) Заметим, что если / — голоморфная функция в большей области Е, такой, что D содержится в Е, тогда / может иметь только конечное число нулей в области D. В противном случае / была бы
1028 Глава 20. Комплексный анализ равна нулю в последовательности точек, сходящейся к пределу, расположенному в области Е.10 А это означало бы, что / тождественно равна нулю. Таким образом, можно утверждать, что в этом случае предположения для (20.26) и (20.27) справедливы. Теорема Руше утверждает следующее. Если / и h — голоморфные функции в ограниченной области D и непрерывны bD = DU dD, и если всюду . на D \f(z) — h(z)\ < |/(z)|, то / и h имеют одинаковое ^ ' ' число нулей (с учетом их кратности) в этой области. Из посылок теоремы следует, что / не равна нулю на границе 3D, и, следовательно, не равна нулю в полосе вблизи этой границы. Поэтому / имеет конечное число нулей в области D. То же самое можно сказать и о функции h. На самом деле можно утверждать, что для любого 0 ^ ί ^ 1 функция ht, заданная формулой ht(z) = f(z)+t(h(z)-f(z)), голоморфна в области D, не равна нулю на границе 3D и имеет конечное число нулей в D, которые можно сосчитать по формуле (20.27). Формула (20.26) непрерывно зависит от t и дает в результате целое число. Следовательно, это число является константой. При этом ho = f и hi = h, так что / и h должны иметь одинаковое число нулей, что и требовалось доказать. Предположим, что функция / голоморфна во всех точках ζ φ β в окрестности β, но |/(ζ)| —> оо при ζ —> β. Тогда функция / φ 0 для ζ достаточно близких к/Зи поэтому Iff{z) — голоморфная для ζ достаточно близких к β, кроме ζ = β, и Iff(z) —> 0 при ζ —> β. Это означает, что 1// имеет устранимую особенность в точке β. Таким образом, она становится голоморфной не только вблизи β, но и в самой этой точке, если мы положим ее там равной нулю. Поскольку теперь 1// голоморфна в точке β и в ее окрестности, и она — не тождественный нуль, то она должна иметь в точке β нуль конечного порядка, т.е. Iff {ζ) = (ζ — fi)igj(z), где gj голоморфна вблизи β и <^·(/3) φ 0. Но тогда f(z) = (ζ — β)~*}ι(ζ), где h = 1/gj голоморфна вблизи β. 10Точнее, на границе dD, которая в силу ограниченности D является компактным множеством. — Прим. ред.
20.5. Приложения и следствия 1029 Если для функции h использовать разложение Тейлора в точке β, то увидим, что / имеет полюс порядка j в этой точке. Итак, мы доказали, что если / голоморфна всюду при ζ φ β в окрестности β и |/(.г)| —> оо, когда ζ —> β, то она имеет полюс конечного порядка в точке β. Предположим, что / мероморфна в ограниченной области D, непрерывна на границе 3D и не обращается нигде на ней в нуль. Тогда эта функция может иметь лишь конечное число нулей и полюсов в области D. Проделав вышеописанную процедуру с каждым нулем и с каждым полюсом, получим f(z) - (*-«i)fcl-(*-<*·)*-F(z) f{z}- {ζ-βι)η...{ζ-βν)3^^ где F голоморфна и не имеет нулей в области D. (Здесь щ — нули порядка кг, и βι — полюса порядка ji.) Дальше мы можем рассуждать так же, как и при доказательстве (20.25) и (20.26). В результате получаем следующее. Предположим, что / — голоморфная функция в ограниченной области D, непрерывна в D и вблизи границы 3D. Далее предположим, что д — голоморфная функция в области D и непрерывна на ней. Тогда шЬ® /'(О άξ 2тпЛю у/(0 = fcis(ai) Η + krg(ar) - (jiff(ySi) Η + jPg{fip)). Здесь αχ,..., αΓ — нули функции / порядка к\,..., kr соответственно, и βχ,..., βρ — полюса этой функции / порядка ji,...,jp. Пусть д = 1, тогда 2т L /'(О άξ = числу нулей функции / 9D J \Z) _ число ее полюсов (с учетом их кратности).
1030 Глава 20. Комплексный анализ Предположим, что / голоморфна для ζ φ η в окрестности точки 7· И пусть 7 — не устранимая особенность функции, и не является ее полюсом (так что у нас нет условия |/(.г)| —> оо при ζ —> 7) · В этом случае η называется существенной особенностью /. Некоторое представление о сложном поведении функции вблизи существенной особенности дает следующий результат. Допустим, что / голоморфна вблизи 7, но не в самой точке, где эта функция имеет существенную особенность. Тогда для любого заданного комплексного (20.29) числа с можно найти такую последовательность точек Oj -> 7, ЧТ<Э f(ai) —> С. Докажем от противного. Предположим, что это утверждение не выполняется для некоторого числа с. Это значит, есть такая окрестность U точки η, что f(z) отличается от с на конечное значение при всех ζ внутри области U, ζ φ 7- Скажем, пусть \f(z) — с\ > \/М для некоторого числа М. Определим функцию g(z) = l/(f(z) — с). Она голоморфна в области U везде, кроме точки 7, и \g(z)\ < Μ. Поэтому функция д в точке η имеет устранимую особенность. Но тогда / = 1/д + с мероморфна в точке 7 (в худшем случае имеет там полюс), что противоречит нашему предположению. Примером функции, имеющей существенную особенность в точке 0, является е1^2. Покажем в явном виде, что для этой функции справедливо условие (20.29). Мы должны показать, что значение функции ellz молено сделать сколь угодно близким к любому комплексному числу, если ζ —> 0. Сделаем замену переменной w = 1/ζ. Тогда мы хотим показать, что значение ew молено сделать сколь угодно близким к любому комплексному числу с при условии \w\ > R для произвольного значения R. Напишем с = ге1в и w — и + iv. Тогда условие |ги| > R выполняется, если выбрать ν > R. Теперь ew = еи ■ ew. Поэтому, если г > 0, то молено взять и = log г и ν = θ + 2πη, где п — достаточно большое целое число, чтобы выполнялось условие ν > R. Мы нашли точное решение уравнения ew = с при сколь угодно большом п, так что ζ = 1/w приближается к нулю. Есть только одно значение комплексного числа с, в которое мы не можем попасть — это с = 0. Но молено взять последовательность с^ —> 0, Ck φ 0 п соответствующую последовательность ι%, где \wk\ —> 00
20.6. Локальное отображение 1031 и eWk = Ck- Тогда Zk = Wk — искомая последовательность точек, стремящихся к нулю, когда eZk —> 0. Такое поведение функции е1^2 типично для голоморфных функций вблизи существенной особенности, т. е. мы можем решить точно уравнение f(z) = с в любой окрестности ζ = η для всех комплексных чисел с, кроме одного. (Для функции е 'ζ это было с = 0.) Это факт весьма глубокий, и доказательства его мы здесь не приводим. 20.6. Локальное отображение В этом параграфе мы исследуем более подробно локальные свойства голоморфных функций. Первый результат — это очевидное следствие теоремы Руше: Предположим, что / голоморфна и не постоянна в окрестности точки о, причем /(о) = Ь. Тогда существует такое ε > 0, что для всех w, удовлетворяющих (20.30) условию \w — Ъ\ < ε, найдется такое ζ вблизи о, что f(z) = w. Доказательство. Пусть g(z) = f(z) — b. Тогда д имеет нуль конечного порядка в точке а. Мы можем найти достаточно малое г, для которого g(z) φ 0, если \ζ — а\ ^ г, кроме самой точки о. Пусть область D — это диск радиуса г с центром в точке о. Выберем такое ε > 0, что \g(z)\ > ε для ζ G 3D. Предположим, что \w — Ъ\ < ε, и определим gw условием 9w{z) = f{z) -w = g(z) + (b- w). В силу теоремы Руше (20.28), функция gw имеет такое же число нулей (с учетом их кратности), в области D, что и функция д. Поскольку д имеет, по крайней мере один нуль, то и gw имеет, по крайней мере, один нуль, поэтому молено найти, по крайней мере, одно значение ζ в области D, где f(z) = w. Утверждение (20.30) иногда формулируется по-другому: голоморфная функция определяет открытое отображение, т. е. если точка принадлежит образу, то в нем целиком содержится и некоторая окрестность этой точки.
1032 Глава 20. Комплексный анализ Утверждение (20.30) демонстрирует еще одно поразительное отличие теории голоморфных функций комплексной переменной от теории гладких функций вещественной переменной. Рассмотрим отображение Ш —> R, преобразующее χ в и = х2. Тогда значения и могут быть только неотрицательными (рис. 20.8). Поэтому 0 принадлежит образу этого отображения, но никакая окрестность 0 в нем не лежит. Мы можем легко изменить этот пример, рассмотрев отображение плоскости в плоскость, т.е. пусть (х,у) преобразуется в {и,ν), где и = х2 и ν = у. При таком отображении плоскость складывается вдоль оси у, так что в образе нет точек (и, ν) с отрицательными и (рис. 20.9). Рис. 20.8 Рис. 20.9 Утверждение (20.30) говорит, что такого не бывает в случае отображений, соответствующих голоморфным функциям. Например, если взять f(z) = ζ2, то для w = re φ 0 молено найти два значения ζ, а именно ζ = г112ё®12 и ζ = г1/2е1(7Г+е/2\ для которых z2 = w. Поэтому вместо отсутствия решений уравнения z2 = w в некоторой области w мы имеем два решения. Это также типичное свойство функции f(z) = ζ . Предположим, что / — голоморфная функция в окрестности о, где /(о) = Ь. Вернемся к доказательству (20.30). Функция д, введенная при доказательстве, имеет нуль конечного порядка в точке о. Пусть к — порядок этого нуля. Если к > 1, то д'(а) = 0. Молено выбрать такое г (возможно, меньшее, чем при доказательстве (20.30)), так что не только д, но и д' не имеет нулей в области D.
20.6. Локальное отображение 1033 Таким образом, в обоих случаях к = 1 и к > 1 функция д вообще не имеет нулей в области D, за исключением точки о, а функция д' не имеет нулей в D, кроме, возможно, точки о. Заметим, что функция gw, введенная при доказательстве (20.30), отличается от д на константу. Таким образам, g'w = g' и, следовательно, 9w(z) Φ 0 в области D при ζ φ а. Однако, для w фЪ функция gw не имеет нуля в точке о. Это означает, что каждый из нулей gw должен быть простым и, следовательно, у этой функции должно быть к различных нулей. Итак, мы доказали следующее. Пусть / — голоморфная функция в окрестности точки о и /(о) = Ъ. Предположим, что д, определенная формулой g(z) = f(z) —b, имеет нуль порядка к в точке о. Тогда молено найти г > 0 и ε > 0 такие, что (20.31) для любого w φ Ъ из окрестности \w — Ъ\ < ε существует к различных значений ζ: ζ\,..., Zk, для которых \zi - а\ < г и /(ζ») = w. Утверждение (20.31) демонстрирует истинный смысл нуля порядка к. Это ситуация, при которой к различных корней совпадают. Рассмотрим частный случай к = 1 утверждения (20.31), который весьма важен для нас. Пусть / — голоморфная функция в окрестности точки о, где /(о) = Ъ и /'(α) φ 0. Тогда молено найти такие г > 0 и ε > 0, что для всех w, удовлетворяющих условию \w — Ъ\ < ε, существует единственное значе- , . ние ζ, для которого \ζ — а\ < г и f(z) = w. Другими словами, существует единственная функция д, определенная при \w — Ь| < ε, удовлетворяющая условиям \g(w) - Ь| < г и f(g(w)) = w. При этом мы утверждаем, что функция д, определенная в (20.32), голоморфна и , „ __. g\w) = 1//'(<?И)- { j В утверждении (20.32) мы можем выбрать г так, чтобы f'(z) φ 0 для \ζ — а\ < г. Поэтому, чтобы доказать (20.33), достаточно доказать, что функция д дифференцируема в комплексном смысле в точке Ъ и д'(Ъ) = 1//'(о). Аналогичные аргументы
1034 Глава 20. Комплексный анализ потом приведем для произвольной точки ζ = g(w), и формула для д' покажет, что она непрерывна. Итак, предположим, что /'(о) = с φ 0. Пусть η < ^\с\. Из определения производной функции / молено найти такое δ > 0, что /(*)-/(<*) ζ — а - /» < η для \ζ — а\ < 5. (20.34) Выбирая δ в качестве нового г (если это необходимо) в (20.32), мы видим, что для всех w, достаточно близких к Ь, имеем w — Ъ ζ — а — с 1, , < -|с|, поэтому \w — Ъ\> -\c(z — a) где ζ = g(w) или ζ — о < (w — Ь)с Если теперь умножить обе части равенства (20.34) на соответствующие части предыдущего неравенства, то получим 1 g{w) - a /'(«) w — Ь < ъ\с\ ·η· Мы можем сделать η сколь угодно малым, выбирая δ и, следовательно, ε достаточно малыми. Это и доказывает, что д дифференцируема в комплексном смысле в точке Ъ и д'{Ъ) = 1//'(о), тем самым доказано утверждение (20.33). Утверждения (20.32) и (20.33) составляют теорему о неявной (обратной) функции для случая голоморфных функций. Следует, однако, подчеркнуть, что эта теорема локальная. Давайте еще раз вернемся к функции f(z) = ζ2. Известно, что для любого значения w φ 0 есть два корня уравнения f(z) = w. Предположим, что мы выбрали квадратный корень положительного числа положительным. Например, для /(о) = 1 возьмем о = 1. Утверждение (20.32) означает, что для w в окрестности единицы, мы будем выбирать единственный квадратный корень — тот, который близок к единице, а утверждение (20.33) означает, что функция g(w) = w1/"2 будет голоморфной в окрестности w = 1. Действительно, легко
20.6. Локальное отображение 1035 видеть, что в (20.33) молено взять в качестве ε любое число, меньшее единицы. Конечно, мы молено взять любую точку w внутри диска радиуса ε с центром в w = 1 в качестве нового значения b, a g{w) в качестве нового значения о, и еще раз применить теорему о неявной функции. Предположим, что мы взяли последовательность таких точек с условием \w\ = 1, как это показано на рис. 20.10. Когда, пройдя таким образом по всему кругу, мы вернемся на положительную ось w, то получим отрицательное (противоположное) значение квадратного корня, что не удивительно. Итак, хотя (20.32) гарантирует существование локальной функции, обратной к /, последовательное применение (20.32) может привести к глобальной несогласованности. В случае функции f(z) = ζ2 не существует глобально определенной функции w1/2 на плоскости w. Рис. 20.10 Существует два способа работать с этой проблемой неопределенности, и каждый из них мы продемонстрируем на примере квадратного корня. Один способ — просто жить с этой неопределенностью. Плоскость ζ рассматривается как двулистное накрытие плоскости w с точкой ветвления в нуле, где значению w соответствует только одно значение ζ. Любую заданную функцию типа cos(w3/2 + 1) мы рассматриваем не как функцию, определенную в плоскости w, а как функцию от ζ, τ. е. cos(z3 + l). Плоскость ζ — это риманова поверхность, связанная со всеми функциями
1036 Глава 20. Комплексный анализ w1/2 в том смысле, что все они определены как функции от ζ. Такой точки зрения придерживался сам Риман. Подробное исследование структуры римановых поверхностей различных голоморфных функций способствовало развитию геометрии, топологии и алгебры вплоть до настоящего времени. Однако, здесь мы не будем останавливаться на этом. Другой, более приземленный подход к проблеме определения w1/2 состоит в задании некоторой кривой, выходящей из начала координат и идущей на бесконечность вдоль пути, где мы считаем, что w1'2 не определен, чтобы сделать определение корня единственным везде. Например, предположим, что мы разрезали плоскость w вдоль отрицательной оси го. Таким образом, каждое значение w вне этого разреза может быть записано в виде w = re , где — π < θ < тт. Тогда, выбирая w1!2 = г1/2 для θ = 0 (т. е. положительный квадратный корень для положительных w), и двигаясь далее (через первый и четвертый квадрант) ко всем значениям θ указанного интервала, имеем wl/2 = rl/2ei0/2 ддя _ π < 61 < тт. Поэтому, например, при таком выборе квадратного корня jl/2 = еЬг/4 и (_i)l/2 = е-Ьг/4 (рис 2Q п) Вопрос, где провести разрез, решается каждый раз в зависимости от задачи. Вышеуказанный выбор разреза применяется довольно часто, и иногда его называют главной ветвью квадратного корня. 1ιμ—-\ ρΤί/4 ffi/4 Рис. 20.11
20.6. Локальное отображение 1037 Покажем, как выбор разреза применяется для вычисления некоторых интегралов, которые потом будут очень валены для нас. Рассмотрим интеграл J —( e-Xx2'2dx. Когда Re А > 0, функция е"Хх I2 быстро стремится к нулю на ±оо, и интеграл сходится абсолютно. Когда же Re A < 0, функция е~Хх I2 стремится к бесконечности, и этот интеграл не имеет смысла. Когда Re А = 0, абсолютное значение функции е~Хх I2 равно единице для всех х, поэтому заведомо ясно, что интеграл не сходится абсолютно. И тем не менее, утверждается, что интеграл сходится. По существу, утверждается следующее. Интеграл /^ е~Хх I2 dx сходится равномерно, когда для А выполняются условия Re А > 0, |А| > 1, и поэтому он является непрерывной функцией А в этой области. Чтобы доказать равномерную сходимость, надо показать, что для любого ε > 0 можно найти R£ (зависящее от ε, но не от А) такое, что iS e~Xx2l2dx <ε и I/ Re-Xx2'2dx Jr \J-s < ε для всех S > R > R£. Далее, *е-**/* = -λχβ-Χχ2/2, dx поэтому интегрирование по частям дает ί\-χχ2'2άχ = - Ι* ±±e-Xx2l2dx Jr Jr Axete = -i-e-^/2 _ _Le-W _ 1 Г J-e-^/2 dx. XR \b A JR xz
1038 Глава 20. Комплексный анализ Поскольку |е Хх /2\ ^ 1 для всех χ и рассматриваемых значений А, интеграл справа молено оценить как JR x~2 dx, и, таким образом, (поскольку S > R) получаем оценку I/ \Jr S e-Xx2'2dx € |А|Я' что меньше ε, если R > 4|А| 1ε *. Точно так же оценивается и J_s Поскольку |А| ^ 1, то можно взять R£ = Α/ε. (Заметим, что вместо условия |А| ^ 1 молено взять |А| > с, где стоит любое фиксированное с > 0, и получить равномерную сходимость.) Поскольку функция е~ '2 непрерывно зависит от А и х, равномерная сходимость интеграла обеспечивает то, что интеграл является непрерывной функцией А. Вычислим этот интеграл для Re А > 0, где он сходится абсолютно. При этом поступим весьма хитро. А именно, вычислим квадрат этого интеграла, перейдя к полярным координатам: ■ гсо η 2 λοο poo / e-Xx2'2dx\ = е-х*212-е-ХУ2'2ахау .J— oo J J—oo J — oo /со poo /·2π roc I e^x2+y^2dxdy= / e'Xr2l2rdrdQ -oo J-oo J0 JO poo = 2тг / e~Xr >2rdr = 2тг/А. Jo Таким образом, e~Xx l2dx = {2n/\)ll2. (20.35) L oo Какой корень взять? Когда А — вещественное положительное число, подынтегральная функция е~Хх I2 — тоже положительная, поэтому интеграл должен быть положительным. Следовательно, для вещественных и положительных А мы должны выбрать положительный квадратный корень. Поскольку интеграл — непрерывная функция А, мы должны взять главную ветвь квадратного корня. Это типичная иллюстрация того, как сама задача говорит нам, как определять квадратный корень.
20.6. Локальное отображение 1039 В силу непрерывности, формула (20.35) справедлива для всех Re А ^ 0. В частности, положив А = —it и А = it, получаем важные формулы /оо /·οο eto2/2 dx = e^Tr/t)1/2, / e-'ltx2'2 dx = e^'^/i)1'2, -oo J—oo справедливые для всех вещественных t > 0, где подразумевается положительный квадратный корень. Эти интегралы, чрезвычайно важные для оптики, называются интегралами Френеля. Позднее мы к ним вернемся.11 Все, что здесь говорилось о квадратном корне, справедливо и для корня степени η (с небольшими изменениями), где η — любое положительное число. Это же на самом деле относится к экспоненциальной функции. Функция ez отображает плоскость ζ на плоскость w бесконечное число раз. Каждая полоса ширины 27Г, параллельная оси х, отображается на всю12 плоскость w. Логарифмическая функция log и; не однозначна. Она определена с точностью до произвольного кратного 27П. И на этот раз есть два подхода к неопределенности. Один подход: полагаем, что плоскость ζ является бесконечнолистным накрытием всей плоскости w. Любая функция, содержащая log и;, рассматривается как функция ζ. Другой подход: разрезаем плоскость w, например, вдоль отрицательной вещественной оси. Тогда молено написать w = re , — π < θ < π. Главная ветвь логарифмической функции определяется при этом условием log u; = log r + ΊΘ. В силу (20.32) и (20.33), мы знаем, что log и; — голоморфная функция, производная которой равна Ι/w. Определив логарифм, 11 Не менее важен и случай вещественного λ > 0. Подынтегральное выражение е~ х '2, деленное на значение интеграла ^/2π/λ, представляет собой плотность нормального, или гауссовского распределения случайной величины, которое играет основополагающую роль в теории вероятностей и статистике. — Прим. ред. 12Исключая значение w — 0, см. выше. — Прим. ред.
1040 Глава 20. Комплексный анализ молено определить степень комплексного числа w с произвольным комплексным показателем с, а именно щс = eclogw. Как уже упоминалось выше, есть две возможные интерпретации этого выражения. Согласно первой интерпретации, рассматриваем wc как многозначную функцию w, т. е. рассматриваем ее не как функцию w, а как функцию ζ. Согласно второй интерпретации, надо выбрать ветвь, например, главную ветвь log и;. Тогда wc становится определенной для всех точек, за исключением w, лежащих на отрицательной вещественной оси. 20.7. Контурные интегралы Теорема Коши о вычетах применяется для вычисления определенных интегралов. Типичные применения мы показали в параграфе 20.4. В параграфе 20.5 изложен удобный прием вычисления вычетов, в частности, формула (20.25). В этом параграфе мы дадим еще несколько показательных примеров, причем некоторые их них мы используем позднее. Во всех случаях требуется определенная изобретательность при выборе контура интегрирования. Итак, мы должны вычислить определенный интеграл. Обычно это значит, что надо вычислить интеграл вдоль кривой в комплексной плоскости. К этой кривой добавляются другие, чтобы образовать границу некой области. А затем применяется теорема Коши о вычетах. Куски контура выбираются так, чтобы их вклад в интеграл был известен, пропорционален искомому интегралу, или же бесконечно мал при переходе к соответствующему пределу. (а) Пусть R(x) = P(x)/Q(x) — рациональная функция, т. е. Ρ и Q — полиномы. Предположим, что Q не имеет вещественных нулей. Если степень Q больше степени Ρ по крайней мере на два, то интеграл /_ R(x) dx сходится и равен пределу J^r R(x) dx при г —> оо. Мы считаем, что берется интеграл от комплексной функции R(z) вдоль отрезка прямой от точки —г до точки г, расположенных на вещественной оси. Соединим эти точки
20.7. Контурные интегралы 1041 Рис. 20.12 полуокружностью радиуса г, лежащей в верхней полуплоскости (рис. 20.12). Теперь у нас имеется замкнутая траектория, ограничивающая полукруг в верхней полуплоскости, и молено применить теорему Коши. С другой стороны, для точек ζ на полуокружности \R{z)\ ^ Кг~2, где К — некоторая константа. Поскольку полуокружность имеет длину тгг, то интеграл по ней стремится к нулю, когда г —> оо. Таким образом, получаем /оо R(x)dx = 2ш 2_, resu(z), -°° lmz>0 где сумма берется по всем полюсам в верхней полуплоскости. (Ь) Рассмотрим интеграл f^ elxR(x) dx, где R = P/Q — рациональная функция, не имеющая полюсов на вещественной оси. Если deg Q ^ deg Ρ + 2, то молено действовать, как и в предыдущем случае. Если degQ > deg Ρ + 1, то нам известно только, что R(x) ведет себя на бесконечности как 1/х. Однако в этом случае еще молено доказать, что интеграл сходится. Как и в параграфе 20.6, молено интегрировать по частям. Поскольку eiX = —i(d/dx)eiX, мы имеем eixR(x) dx = -ieisR(s) + ieirR(r) + ί eixR'(x) dx, причем функция R! ведет себя на бесконечности как 1/х2. Чтобы вычислить этот интеграл, мы опять возьмем предел интеграла от —г до г, соединив эти точки полуокруленостью в верхней полуплоскости. Но здесь, оценивая интеграл по полуокрулености, надо быть более осторожными. Если ζ = re = r(cos6 + i sin β), то \z ir cos 0 —r sin 0 /
1042 Глава 20. Комплексный анализ и получается оценка интеграла по полуокружности I I eizR(z)dz = I Г e[rcosee-rsineR(rew)rde ' J по дуге Jo Г e-rsiaer\R(reW)\de. Jo (•π Теперь функция \rR(re )| ограничена константой, скажем, К. Поэтому нам надо оценить интеграл fn /·π/2 /•π № ι Δ \ e-rsinede = 2 / e-rsinede. Jo Jo Здесь мы воспользуемся неравенством sin# ^ 20/7Г для 0 ^ θ ^ 7г/2. (Действительно, обе части равны в конечных точках, и их разность имеет один максимум внутри.) Поэтому (■π/2 /·π/2 / e-rsined6 ζ / β'2Γθ/πάθ = (тг/2г)(1 - e~r) -> 0. Jo Jo Таким образом, интеграл по полуокружности стремится к нулю, и мы получаем /оо eixR(x) dx = 2т J^ res R(z), ■°° lmz>0 где сумма берется по всем полюсам в верхней полуплоскости. Если Q имеет нуль на вещественной оси, то рассмотренный выше интеграл, в принципе, не имеет смысла. Но тем не менее, иногда он может иметь смысл, если рассматривать его как предел особого рода, называемый главным значением Коши. Покажем это на примере. Предположим, что функция R имеет простой полюс при ζ = 0 с вычетом А, так что R(a) = Α/ζ + Ro(z), где функция До голоморфна в окрестности нуля. Рассмотрим тот же интеграл, что и раньше, но теперь в контур вставим полуокружность радиуса ε в нижней полуплоскости, чтобы обойти начало координат (рис. 20.13). Теперь охватываемая область содержит все полюса в верхней полуплоскости плюс полюс в начале координат. Интеграл от Α/ζ по малой полуокружности равен πΊΑ, сокращая
20.7. Контурные интегралы 1043 \у— Рис. 20.13 половину вычета от точки ζ = 0. Тогда Ρ ( Г eixR(x)dx) = lim ί * + ΓΊ elxR(x)dx = mA + 2τπ Σ res(elz R{z)). lmz>0 Здесь Ρ(·) означает главное значение Коши. Например, пусть R(x) = 1/х, тогда аоо егх оо х dx I = 7ri. Возьмем вещественную часть этого равенства и получим, что P{J^° (cos ж/ж) dx) = 0. Результат очевиден, поскольку cos χ/χ — нечетная функция. Если взять мнимую часть равенства, то получаем P(J^X)(smx/x) dx) = тт. Функция sinх/х не имеет особенности в начале координат, поэтому нет нужды брать главное значение этого интеграла. Функция sin х/х четная, поэтому / Jo ПХ 7Г — dx = —. о х 2 Мы еще используем этот интеграл в теории рядов Фурье. (с) Рассмотрим интегралы вида fQ xaR(x) dx, где α — вещественное число, причем 0 < α < 1, R — рациональная функция, которая на бесконечности убывает как 1/х2 и в худшем случае имеет полюс первого порядка в нуле. Трюк состоит в том, что делается замена переменной: χ = ί2, так что теперь интеграл имеет вид 2 /0°° t2a+1R(t2) dt. Для его вычисления удобно выбрать ветвь функции z2a, которая получается, если плоскость ζ разрезать
1044 Глава 20. Комплексный анализ вдоль отрицательной мнимой оси. Тогда молено написать ζ = re , где -тг/2 < θ < Зтг/2, a ζ2α = г2ае'2ав, где -тта < 2αθ < Зтта. Теперь мы должны выбрать контур так, чтобы он не проходил через отрицательную мнимую ось. Пусть контур состоит из двух отрезков прямой вдоль отрицательной и положительной вещественной оси, а также большой и малой полуокружностей, лежащих в верхней полуплоскости (рис. 20.14). Мы считаем, что интегралы по полуокружностям стремятся к нулю, когда радиус большой дуги стремится к бесконечности, а радиус малой — к нулю. Тогда /оо /·οο z2a+1R(z2) dz = / (z2a+1 + (-z)2a+1)R(z2) dz. -оо J0 Мы выбрали ветвь z2a так, что (—z)2a = e2maz2a для положительных значений ζ. Поэтому последний интеграл имеет вид /•оо (1-β2πία)/ t2a+lR(t2)dt. Jo Поскольку 1 — ε2πΙα φ 0, на этот коэффициент можно разделить и получить значение нашего интеграла. Слева мы должны просуммировать вычеты функции z2a+lR{z2) в верхней полуплоскости. Они совпадают с вычетами функции zaR(z) во всей плоскости, разрезанной вдоль положительной вещественной оси. Поэтому другой способ решить нашу задачу состоит в том, что не надо делать замену χ = t2, а просто разрезать плоскость ζ вдоль положительной вещественной оси и использовать ветвь функции ζα, определенную условием ζ = re , где 0 < θ < 2-Л". Заметим, что Рис. 20.14 Рис. 20.15
20.7. Контурные интегралы 1045 мы разрезали плоскость точно вдоль пути исходного интеграла! Поэтому мы не можем получить наш интеграл как часть интеграла по замкнутому контуру. Вместо этого мы интегрируем вдоль пути, параллельного положительной вещественной оси, но слегка сдвинутого в верхнюю полуплоскость, имея в виду переход к пределу для получения нашего интеграла. Итак, рассмотрим замкнутый контур, состоящий из двух прямолинейных отрезков, один чуть выше положительной вещественной оси, а другой — чуть ниже, а также из большой и малой окружностей, взятых почти целиком (рис. 20.15). Вклад обеих окружностей в пределе обращается в нуль. Вклады от двух прямолинейных отрезков не сокращают друг друга, потому что определение функции za выше и ниже вещественной положительной оси отличаются на множитель е2та. Таким образом, именно неопределенность функции za в нуле позволяет нам вычислить интеграл. (d) Интегрирование по контуру молено использовать для вычисления сумм бесконечных рядов. Идея состоит в том, чтобы применять теорему Коши о вычетах ко все увеличивающимся областям, чтобы интегралы по границе области стремились к нулю. Тогда останется (бесконечная) сумма вычетов, которая тоже должна давать нуль. Перенеся одно из слагаемых в другую часть уравнения, получим сумму бесконечного ряда. Проиллюстрируем этот метод на примере сумм, полезных при изучении тригонометрических функций. С этой целью сначала определим тригонометрические функции комплексной переменной: cos ζ = \{elz + e~b), sin ζ = -Uelz - e~iz). Δι Δ Очевидно, что эти функции голоморфны во всей комплексной плоскости и для вещественных ζ совпадают с тригонометрическими функциями вещественной переменной. Заметим, что sin ζ = 0, если и только если e2lz = 1. Это выполняется только для вещественных значений ζ = ηπ. Аналогично, комплексные нули cos z — только в вещественных точках [п + 1/2)7г. Определим sin z cos z tan ζ = , cot ζ = — . cos ζ sin ζ
1046 Глава 20. Комплексный анализ Эти функции мероморфны и имеют полюса, расположенные в нулях их знаменателей. Молено воспользоваться (20.25) и вычислить вычеты в этих полюсах, потому что все нули простые. Например, cot ζ имеет полюса в точках ηπ, и все вычеты в них равны 1. Заметим, что функция .eiz + e~iz cot ζ — ι— — e" — e" будет ограничена по абсолютному значению до тех пор, пока ζ находится на конечном расстоянии от точек ηπ. В частности | cot z\ будет равномерно ограничен на всех окружностях радиуса (η + ^)π с центром в начале координат. Рассмотрим интеграл по этим окружностям cot ξ L άξ, let2-*2 где ζ φ ηπ — фиксированное комплексное число. Если радиус окружности устремить к бесконечности, то интеграл будет стремиться к нулю, потому что | cot ^| ограничен, а в знаменателе стоит полином второй степени по ξ. Полюса подынтегрального выражения находятся в точках ±ζ и ηπ. Вычеты в точках ±ζ равны jc°t z/z, а в точках ηπ они составляют (η2π2 — ζ2)-1. Поэтому . σο — +У>27Г2-*2)-1=0. Ζ ^Г* Первый член перенесем вправо, умножим это равенство на ζ и из суммы выделим член с η = 0. В результате получим формулу 1 °° 1 cotz=-+2zJ2z2_n27r2- (20.36) Ряд справа сходится, причем сходится равномерно при всех ζ, находящихся на конечном расстоянии от всех полюсов. Если f(z) = sin ζ, то f'(z)/f(z) = cot ζ. Молено также написать f'(z)/f(z) = (d/dz)(log f(z)). После этого (20.36) переписываем в форме
20.8. Пределы и ряды 1047 Функция sin ζ/ ζ не равна нулю в пределе при ζ = 0. Проинтегрируем это уравнение по контуру, соединяющему 0 с точкой ζ и проходящему на конечном расстоянии от всех точек пж. Получим уравнение оо log(sin ζ/ζ) - log 1 = ^(logO2 - п27г2) - log(-n27r2)). 1 Это уравнение содержит неоднозначности, потому что значения логарифма, определенные правилом, что log с/ равняется интегралу от д'/д, зависит от выбранного контура интегрирования. Однако если вычислить экспоненту обеих частей, то все неопределенности исчезают, и мы получаем известную формулу °° / ζ2 \ sinz = ,n(^l--^j, представляющую sin z как бесконечное произведение. 20.8. Пределы и ряды Начнем с применения интегральной формулы Коши. Пусть /п — последовательность функций, голоморфных в области D. Предположим, что /п —> f(z) равномерно в D. Тогда / — голоморфная функция в области D, и f'n(z) сходится к f'(z) равномерно на любом подмножестве D, расположенном на конечном расстоянии от границы 3D. Доказательство. Для любой точки ζ е D выберем окружность С, диск которой лежит внутри D (а точка ζ внутри С). Тогда Переход к пределу дает (20.37)
1048 Глава 20. Комплексный анализ Из обсуждения, следующего после (20.18), мы знаем, что это означает голоморфность функции /. Из формулы (20.19) имеем AM-Si/corV· которое, очевидно, равномерно сходится к Часто возникает желание применить утверждение (20.37) в случае, когда область D является ограниченной подобластью некоторой большей области, где последовательность /п определена и сходится, т. е. функции /п определены и голоморфны в большой области Ε и равномерно сходятся на каждой из подобластей Dk С Е, образующих последовательность с (J Dk = Ε. Применяя утверждение (20.37) к каждой области Dk, приходим к выводу, что / голоморфна во всей области Е. Применим утверждение (20.37) к частичным суммам и рядам. Если ряд из голоморфных слагаемых f(z) = f\{z) + h(z) + · · · равномерно сходится в области D, то сумма / — голоморфная функция, и ряд молено дифференцировать почленно. Наиболее важный ряд, связанный с голоморфными функциями, — ряд Тейлора. Предположим, что / голоморфна в области D, и диск радиуса R с центром в точке о целиком лежит в области D. Пусть ζ — точка внутри этого диска, причем \ζ — о| < R. Тогда молено воспользоваться (20.22) и оценить последний член в формуле (20.20). Его абсолютное значение не превышает Μ\ζ - а\ |ζ-ο|η_1 R-\z-a\ Я""1 и равномерно стремится к нулю на любом диске меньшего радиуса. Таким образом, из утверлсдения (20.38) получаем следующее. (20.38)
20.8. Пределы и ряды 1049 Если / голоморфна в области D и о — произвольная точка в D, то ряд f(a)+na)(z-a) + f-^(z-a)4- ■ . + ^Μ(ζ-α)- + · ■ ■ (20.39) сходится к f(z) на самом большом открытом диске с центром в точке о, целиком лежащем в области D. Этот ряд называется рядом Тейлора функции / в окрестности точки о. Многие операции с голоморфными функциями соответствуют простым операциям с их рядом Тейлора. Для упрощения записи положим о = 0. Тогда если f(z) = о0 + αχζ + α2ζ2 Η и g(z) = b0 + b\z + b2z2 + · · · , то получаем f\z) = oi + 2a2z + 3a^z2 Η , f(z) + g(z) = (a0 + b0) + (αϊ + h)z + (a2 + b2)z2 + ■■■ f{z)g(z) = o06o + (αϊbo + aoh)z + {.a2bQ + αφι + aob^z2 Η . Если оо = bo = 0, то f{g{z)) = ai{biz + b2z2 + ···)+ a2(hz + b2z2 + ■ · · )2 + ■ ■ · = aibiz + (oib2 + a2bj)z2 + (aib3 + 2a2b1b2 + o3bf )ζΆ Η . Если мы знаем степенной ряд функции /, то из этого последнего уравнения молено рекурсивно определить степенной ряд функции, обратной к /. Пусть мы знаем значения Oj и хотим найти такие bi, чтобы f(g(z)) = ζ. (Чтобы обратить функцию, необходимо предположить, что /'(0) φ 0.) Тогда o-ih = 1, bi = а^ , a\b2 + a2b\2 = 0, bi = -ai~l(a2bi2), aifo + 2a2b\b2 + оз&13 = 0, fo = -oi-1(2o2bib2 + θ3&ι3)
1050 Глава 20. Комплексный анализ и т.д. Вообще коэффициенты при zn будут выражениями типа aibn+ (члены, содержащие bi порядка, меньше, чем п). Поэтому можно последовательно находить каждое Ъп. Известен элементарный факт, что любой степенной ряд имеет радиус сходимости R (возможно, и 0); при этом ряд сходится для \z\ < R и не сходится для \z\ > R. Из (20.38) следует, что ряд представляет голоморфную функцию внутри радиуса сходимости. И обратно, из (20.39) следует, что ряд Тейлора для голоморфной функции в качестве радиуса сходимости имеет радиус самого большого диска, содержащегося в истинной области определения13 функции /. Ряд вида оо + α-ΐζ~1 +α_2^-2 + · · · можно рассматривать как степенной ряд по переменной 1/ζ. Поэтому он будет сходиться вне окружности радиуса R (возможно, что R = оо). Говорят, что ряд вида Σ^Οη·2™ сходится, если и только если сходятся его положительные и отрицательные части. Положительная часть будет сходиться при \z\ < i?2 Для некоторого i?2, и отрицательная часть будет сходиться при \z\ > Ri для некоторого Ri. Поэтому для двойного ряда будет непустая область сходимости тогда и только тогда, когда Ri < i?2- В этом случае, в силу (20.38), он будет представлять голоморфную функцию в кольце Ri < \z\ < i?2- И обратно, предположим, что / голоморфна в таком кольце. Покажем, что в этом случае функция / представима в виде двойного ряда. Для доказательства мы должны только показать, что молено разложить / в сумму / = /ι + /г, где /ι голоморфна при \z\ < Rz и /2 голоморфна при \z\ > Ri. Причем /2(1/2) должна иметь устранимую особенность в нуле, так что /2(1/2) голоморфна для \l/z\ < \/R\. Чтобы это сделать, определим лп J\i\=r2 ζ _ ζ где интеграл берется по любой окружности радиуса г? с условием \ζ\ < Г2 < &2", И 2πι У|£|=Г1 ξ-ζ 13τ. е. области, за пределы которой функцию невозможно продолжить из-за полюсов или существенных особенностей на границе. — Прим. ред.
20.8. Пределы и ряды 1051 где интеграл берется по любой окружности радиуса п, причем Ri < r\ < \z\. Очевидно, что /ι голоморфна при \z\ < R? и /г голоморфна при \z\ > Ri. Из интегральной формулы Коши следует, что fi(z) + /2(2) = f(z). Если положить ζ' = \/ζ и подставить ξ' = Ι/ξ в интеграл для /2, то получим г(м 'л 1 [ 1Ш1г' м> М1/2 ) = ^ / Т'—Р"ё7"£- 2тг1 У||'|=1/г1 ς ζ ζ Это показывает, что /2(1/^') голоморфна по z' для \z'\ < 1/Ri- Функцию /ι молено разложить в степенной ряд Λ(ζ) = Σαηζη, где αη = — / -^ с^, 0 ^ι./|ξ|=ί.ς /(О L'A« "η = — / а функцию /2(l/z') — в ряд оо /2(l/z')-^bn/n, 1 где Ьп = 1 [ /(I/O ,,, 1 / „л,п-1 ~ 2тг1 7|ξΊ=1/τ. ξ'η+1 2πι./|ξ|=ί. здесь г — любое значение между Ri и i?2· Полагая о_п = Ьп, получаем искомое разложение, называемое рядом Лорана /(z) = f; αηΛ где «η = ^т У _ pl d£. (20.40) В дальнейшем нам понадобится явный вид этой формулы в случае Ri < 1 < i?2- Итак, мы предполагаем, что функция / определена и голоморфна в некоторой окрестности единичного круга, т.е. \z\ = 1. Пусть F(6>) = f(ew) и в формуле (20.40) г = 1. Тогда получаем /(ζ) = £αηζη, где an = ±-J*F{eyn()de. (20.41)
1052 Глава 20. Комплексный анализ В частности, взяв ζ = е (на единичной окружности) и подставив это в ряд Лорана для /, имеем оо F(0)=J>ne^, (20.42) —оо где коэффициенты ап определены формулой (20.41). Ряд (20.42) называется рядом Фурье функции F. Если / голоморфна в области R < \z\ < 1/R, где R — некоторое число, причем R < 1, то, поскольку ап — коэффициенты сходящегося степенного ряда, из критерия сходимости степенных рядов получаем, что \ап\ ^ сг~\п\ для любых г > R и соответствующей константы с = сг. Добавление: связь между голоморфными и гармоническими функциями Пусть / = u+'w — функция, голоморфная в области D. Тогда, как доказано в параграфе 20.4, она бесконечно дифференцируема, т. е. имеет в D производные любого порядка. Для первых частных производных выполняются уравнения Коши-Римана ди _ dv ди _ dv . дх ду' ду дх Продифференцируем первое уравнение по х, второе по у и сложим. В правой части смешанные частные производные второго порядка от ν сокращаются, и мы имеем д2и д2и _ дх2 ду2 Итак, функция и удовлетворяет двумерному уравнению Лапласа л η λ & д2 AU = 0' A = dx~2+di2'
Добавление 1053 и является гармонической. Аналогично, гармонической функцией является мнимая часть ν (чтобы убедиться в этом, молено снова продифференцировать уравнения Коши-Римана или заменить функцию / на — if). Таким образом, вещественная и мнимая часть всякой голоморфной функции, рассматриваемые как функции двух вещественных переменных, являются гармоническими. И обратно, каждая гармоническая функция и в односвязной (не имеющей «дырок») плоской области может быть реализована как вещественная часть голоморфной функции, причем последняя определена однозначно с точностью до аддитивной (чисто мнимой) постоянной. Иначе говоря, существует единственная по модулю константы функция ν, которая связана с и уравнениями Коши-Римана. Функция ν — также гармоническая и называется сопряженной к и. Доказательство. Применим звездный оператор * к дифференциалу функции и(х,у): ди , ди , , ди , ди , йи = — ах + — dy, *аи = — — ах + — dy. ох оу оу ох Полученная 1-форма *du является замкнутой, так как d*du = d^-dx + -dy) = ^ + -^)dxAdy = 0 в силу гармоничности и. Но тогда, как показано в параграфе 7.3, эта форма является точной, если рассматривать ее в звездной области. На самом деле область достаточно предполагать одно- связной. Следовательно, форма *du является дифференциалом некоторой функции ν: , , dv dv •kdu = dv = 77- dx + — dy. ox oy При этом функция ν определена однозначно с точностью до аддитивной константы. Равенства коэффициентов при dx и dy в
1054 Глава 20. Комплексный анализ выражениях для *du суть уравнения Коши-Римана. Тем самым / = и + Ίν является искомой голоморфной функцией. Отсюда легко вывести, что: 1) если и — гармоническая функция в области D, а функция д голоморфно отображает область G в область D, то и о д является гармонической функцией в G; 2) всякая гармоническая функция является бесконечно дифференцируемой. Кстати, последнее утверждение справедливо для функций любого числа переменных. Всякая гармоническая функция имеет внутри области определения частные производные всех порядков, которые, в свою очередь, также являются гармоническими функциями. Отметим, что предположение об односвязности области существенно. Гармоническая функция и = log г = | log(z2 + у2) определена на всей плоскости, за исключением начала координат 0. Она является вещественной частью комплексной логарифмической функции log ζ, которую молено определить однозначно только в односвязной подобласти области определения. Вывод теоремы о среднем. Пусть функция / голоморфна в круге D радиуса R с центром в точке ζ = с и непрерывна на D. Согласно интегральной формуле Коши, имеем m=^L ί(ξ)άξ Замена переменной ξ = с + Re на окружности dD дает = \άθ = — ds, ξ-c R где ds — элемент длины дуги. Таким образом, Итак, значение / в центре круга совпадает со средним значением по окружности. Переходя к вещественной части, имеем двумерную теорему о среднем для гармонических функций.
Резюме 1055 Решение задачи Дирихле для круга. Пусть D — круг радиуса R с центром в точке с, и о = α(ζ) — непрерывная функция на окружности dD. Тогда решение задачи Дирихле Аи = 0 внутри D, и = а на dD существует и дается интегральной формулой Пуассона u{z) = — / 7Ϊ9 ~9~УЧ"г, —h> IT άθ, где ζ = с + re *π Jq dD R2+r2 - 2Rr cos (θ - φ) Мы только кратко опишем идею вывода формулы в предположении существования решения. Чтобы вычислить u(zq), где z0 = с + re1^, r < R, применим дробно-линейное преобразование , R(z - Zq) i?2-(z0-c)(z-c)' которое голоморфно и взаимно-однозначно отображает круг D на единичный круг D\ = {\w\ < 1}, причем точка zq переходит в 0. Далее, пусть ν — решение задачи Дирихле на единичном круге: Δυ(ιυ) = 0 при |ιυ| < 1, v(w) = ο(^_1(ιι;)) при \w\ = 1. Легко видеть, что u(z) = v(g(z)) является решением исходной задачи Дирихле. При этом u(zq) = v(g(zo)) = v(0) вычисляется как среднее значение a(g~1(w)) по окружности dD\ = {\w\ = 1}. Детали доказательства оставляем читателю. Описанный метод решения задачи Дирихле переносится на достаточно широкий класс областей, являющихся конформными образами круга. Резюме А. Голоморфные функции Вы должны знать определение голоморфной функции через 2-формы и уметь показывать, что ее матрица Якоби представляет конформное преобразование. Вы должны уметь выводить интегральную теорему Коши и формулу для вычетов из теоремы Стокса.
1056 Глава 20. Комплексный анализ Вы должны уметь вычислять вычет функции в простом или в кратном полюсе. B. Интегрирование по контуру Вы должны уметь вычислять интегралы с помощью теоремы о вычетах для выбранного контура. Для некоторых типичных интегралов нужно уметь находить соответствующий контур. C. Степенные ряды Вы должны уметь раскладывать голоморфную функцию в ряд Тейлора или Лорана и уметь вычислять радиус сходимости этих рядов. Задачи 20.1. (а) Предположим, что f(z) — голоморфная функция. Пусть ζ = χ + iy, f(z) = и +_iv. Покажите, что семейства кривых и(х, у) = const и v(x, у) = const ортогональны, т. е. что они пересекаются под прямым углом.14 (Ь) Проверьте это свойство для функции /(ζ) = ζ2. Нарисуйте несколько кривых. Сделайте то же самое для функции f(z) = 1/z. Что в этом случае происходит в нуле? 20.2. (а) Предположим, что f(z) — голоморфная функция, вещественная часть которой равна Ъх2у — у3- Получите мнимую часть f(z). (b) Может ли функция быть голоморфной, если ее вещественная часть равна ху21 Если да, то получите ее, а если нет, то объясните, почему. 20.3. Голоморфные функции cos z и sin z можно определить тождествами cos ζ = -(elz + e~lz), sin ζ = — (elz - e~lz), используя определение комплексной экспоненциальной функции. Это означает, что ортогональны векторы касательных (и нормалей) к кривым и = const и υ = const в каждой точке (хо, J/o)· Если об этом помнить, то доказательство данного пункта не составит труда. — Прим. ред.
Задачи 1057 (a) Выразите cos ζ и sin ζ через тригонометрические и гиперболические функции хтл у. Используя эти выражения, вычислите ci(cosz) и ci(sinz). (b) Докажите, что формулы сложения sin(z + w) = sin z cos w + cos ζ sin w и cos(z + w) = cos ζ cos w — sin ζ sin w выполняются для комплексных zvlw. (c) Используя формулы сложения, покажите явно, что функции sin z и cos z непрерывно дифференцируемы в комплексном смысле. Получите производные этих функций, вычисляя соответствующие пределы. 20.4. С помощью метода, изложенного в параграфе 20.7, получите значения определенных интегралов: (а) / sin6 0 сЙ» Jo 5π 16' ίπ cosOdO _ πα 2 ι ( } Λ 1-2асоэв + а2 ' Γ^2' й < 20.5. С помощью метода, изложенного в параграфе 20.7, пункт (а) проверьте формулы для определенных интегралов: /оо /•ОО (ь) /о т^тЪ^ = £з> а>°; (ζ + ί>)2 +α2 _ α' dx π с4 + 4α4) = 8α5' , , f°° x2dx π (c)/0 Ϊ^ΤΪ = 6· 20.6. (а) Предположим, что /(ζ) голоморфна в некоторой области за исключением точки ζ = α, где она имеет полюс второго порядка. Докажите, что вычет в этом полюсе задается формулой res = lim —{{z - a)2f(z)). ζ—>α dz (b) С помощью этой формулы вычислите интеграл Г J —с dx {χ2 + а2)2"
1058 Глава 20. Комплексный анализ (с) Обобщив этот метод, вычислите интеграл dx Г J — ( (χ2 + а2)к для произвольного целого положительного числа к. 20.7. (а) Здесь излагается метод, альтернативный методу, изложенному в параграфе 20.7, пункт (Ь). Пусть R(z) = P(z)/Q(z), где Ρ и Q — полиномы, степени которых связаны условием deg Q ^ deg Ρ + 1, так что 1ВД1 < Α/\ζ\ для некоторой константы А и достаточно больших \ζ\. Предположим, что Q не имеет вещественных нулей. Следуя изложенному ниже плану, докажите, что интеграл /_то R(x)elx dx сходится, т. е. предел lim f 2 R(x)eix dx Χι—*оо существует, и выполняется равенство R{x)eix dx = 2wi^res(i?(z)e^), ί J —с где сумма берется по всем полюсам, лежащим в верхней полуплоскости. Шаг 1. Выберем достаточно большие Χι, Χι и Υ, такие, чтобы прямоугольник, изображенный на рис. 20.16, содержал все полюса в верхней полуплоскости. -Xy+iY IV III X2+iY π Χι Рис. 20.16 Шаг 2. Покажите, что / R(z)eizdz Jll Г е-у А Г А ΤΤ^^ΊΓ / е~У Jo \А Л2 Jo для достаточно больших Х2. dy <
Задачи 1059 Шаг 2'. Покажите, что |/ R(z)Jzdz\^4-· \Jiv Ι χί Шаг 3. Покажите, что R(z)e"dz\ ^ Ae-Y(X1+X2)/Y. J Jm Шаг 4. Пусть Υ —> oo. Докажите, что ГХ2 [ ' R{x)eix dx - 2πί V res{R{z)eiz) < A (-±r + -±Λ J~Xl ZZo \X1 X2/ и завершите доказательство, (b) Вычислите интеграл Г Jo cos a; dx. 20.8. Предположим, что <3(0) = 0, а <5'(0) φ 0, так что функция R(z)elz имеет простой полюс в 0. Пусть В — вычет этой функции в 0. Рассмотрите тот же прямоугольный контур, но с обходом начала координат в нижней полуплоскости по малой полуокружности радиуса δ (рис. 20.17). -Χλ + ΪΥ X2+iY -δ 0 δ -—κϊγ~*- -Χι Χ2 Рис. 20.17 (a) Покажите, что предел интеграла по полуокружности при δ —> 0 равен πϊΒ. (b) Докажите, что главное значение Коши определяется формулой lim 5—0 /—δ ρο + -oo J δ 1 R(x)eixdx \=2т^2 res{R(z)eiz) + -В. 2-Ю
1060 Глава 20. Комплексный анализ (с) Покажите, что Jo sin а; π αχ = —. χ 2 20.9. Пусть f(z) = (fij(z)) — матричная функция. Мы говорим, что / голоморфна в области D, если каждый матричный элемент fij является голоморфной функцией в области D- Пусть η — произвольная кривая. Интеграл / fij{z) dz должен быть матрицей, ij-Ά элемент которой равен J fij{z) dz. Заметим, что если В и С — постоянные матрицы и / — голоморфная матричная функция, то BfC — тоже голоморфная матричная функция, и для произвольной кривой η мы имеем I Bf{z)Cdz = В ( f f(z)dz) С. Рис. 20.18 Ί 0 0^ (а) Пусть А = | 0 2 0 } и f(z) = (zl - A)~l, где ι0 0 3; Покаж;ите, что / голоморфна везде, кроме точек ζ = 1, ζ = 2 и ζ = 3. Пусть ΡΊί = (1/2πί) J f(z)dz (контуры ji показаны на рис. 20.18). Вычислите ΡΊί для г = 0,1, 2,3.
Задачи 1061 (b) Пусть D — матрица 3 χ 3 с собственными значениями 1, 2 и 3. Пусть g(z) = (zl — D)~l. Покажите, что д голоморфна везде, кроме точек ζ = 1, 2, 3. Пусть Ф» = ΤΓΞ / 9^ dz- Опишите Im<37l и Кег<571. Что такое £?71? Опишите Im<372 и Кег<572- Что такое <372? (с) Сформулируйте общую теорему. Пусть А — матрица η χ η с различными собственными значениями λι,..., λη. Пусть f(z) = (zl — А)*1. Где голоморфна функция /? Пусть у — кривая, которая не проходит через какие-либо собственные значения и ограничивает область, содержащую точки λι ..., At и не содержащую ни одно из остальных собственных значений. Положим Что такое Im P7? Что такое Кег Р7? Что такое Р2? 20.10. (а) Пусть f(z) обозначает ветвь функции ζ1/4, определенную везде, кроме положительной вещественной оси, и обладающую свойством lim f(x + ϊε) = l^l1'4 (вещественное число). е—>0 Вычислите f(—x) и предел linie^o f{x — ϊε) для вещественных х. (Ь) Используя контур, изображенный на рис. 20.19, вычислите определенный интеграл -L 00 t^Ut (t + α)2" Обсудите вклад от каждой окружности. 20.11. Используя метод, изложенный в параграфе 20.7, пункт (с), вычислите интегралы по контуру, изображенному на рис. 20.14. соо „,α-1 (а) / dx = , 0 < α < 1, Jo χ + 1 sin απ
1062 Глава 20. Комплексный анализ Рис. 20.19 оо „α-ι (ΐ-α)π η dx = ^ ^-, 0 < а < 2. /■оо а—: sin απ 20.12. (а) Вычислите J f (ζ) log ζ dz по контуру, изображенному на рис. 20.15. Используя ветвь log z, определенную условием logz = logr + ΊΘ, 0 < θ < 2π, докажите формулу / f(x)dx = -]Tres(/(z)logz), которая верна всегда, когда /(ζ) стремится к нулю при \ζ\ —> оо достаточно быстро, чтобы интеграл по большому кругу стремился к нулю. (Ь) Покажите, что dx πα + 26 log(6/a) L Ό (ж + а)(х2 + f>2) 2f>(a2 + Ь2) a, b > 0. (с) Рассмотрев интеграл //(z)(log z)2 ciz, придумайте способ вычисления интеграла Г Jo f(x)\ogxdx. С его помощью докажите формулу ί Jo log а; π log a ■ dx = xJ + az 2a
Задачи 1063 20.13. (а) Получите ряд Лорана для функции 5 № ζ2 - 5z/2 + 1 с помощью интегрирования по единичной окружности. Где сходится этот ряд? (b) Этот же ряд получите с помощью разложения функции f(z) на простые дроби. Затем разложите каждый член по степеням ζ или 1/г так, чтобы ряд сходился при \ζ\ = 1. (c) Получите ряд Фурье для функции F(6') = (5/2 + 2cos6l)-1. 20.14. Получите ряд Фурье для функции F(0) = θ, -π < θ < π. Можно ли это получить как разложение голоморфной функции в ряд Лорана?
I I
Глава 21 Асимптотическое вычисление интегралов Введение Асимптотическое поведение интегралов позволяет понять многие физические законы. В этой главе мы дадим элементарные примеры математических приемов, используемых в настоящее время во многих приложениях физики и математики. Асимптотическая формула Стирлинга — одна из первых и до сих пор важнейших: П\ ~ (2тг)1/2пп+1/2е-п_ Она получена Джеймсом Стирлингом в первой трети XVIII века. Знак ~ следует понимать в том смысле, что отношение обеих частей формулы (они обе стремятся к оо с ростом п) стремится к 1 при η —> оо. Мы приведем и докажем здесь более точную версию этой формулы вместе с оценкой погрешности. Хотя формула Стирлинга должна применяться только при больших значениях п, она дает удивительно точное приближение (в смысле относительной погрешности) далее при малых п. Так, для η = 1 мы имеем п! = 1, а правая часть формулы Стирлинга дает 0.92. Для η = 10 мы имеем п! = 3628800, а правая сторона дает 3 598 600, т. е. ошибка меньше одного процента. Это систематическое явление. В этой главе мы дадим оценки, справедливые для больших значений параметра, но оказывается, что эта формула хорошо работает и при малых значениях.
1066 Глава 21. Асимптотическое вычисление интегралов 21.1. Метод Лапласа Мы применим этот метод для получения более точной версии формулы Стирлинга. Интегрирование по частям показывает, что гамма-функция, определенная формулой /•оо Г(х) = / е~Чх'1 dt, χ > 0, Jo удовлетворяет условию Г(х + 1) = хГ(х), Г(1) = 1, так что Г(п + 1) = п\. Таким образом, молено переписать формулу Стирлинга в виде Г(х) ~ е~ххх ί—λ 1/2 На самом деле мы докажем более точный результат. Покажем, что '27Λ1/2/ 1 1 Г(х) ~ е~ххх — 1 χ 1 + ^г- + + 12х ' 288х2 Асимптотический ряд в этой формуле означает, например, что χ Ι Δητ \ „-1 < Со | е~ххх | — Ι χ Г(х)-е~хх Г(х) - е~ххх (—V ™--*{тТЫ-±) 1/2 и т. д., где Ci — константы. Другими словами, обрывая ряд в любом месте, молено оценить погрешность через следующую, более
21.1. Метод Лапласа 1067 высокую степень χ 1. Начнем с формулы Г(х) = Г (ж + 1)/х и получим (•ОО Г(х) = - / e'Hxdt ι г /оо β-*[«;-1οβ(1+«;)] dw /оо e-xp(w) dw^ -1 где ΐ = (1 + w)x, так что dt = xdw ni = 0^w= —1, ί = οοΟ w = oo, где функция ρ(ιυ) = ΐϋ — log(l + w) = ~w2 — -w3 Η ^ о раскладывается указанным образом в ряд Тейлора в нуле. Заметим, что p'{w) = 0 только при w = 0, и ρ имеет абсолютный минимум в нуле. Множитель е~ххх присутствует в правой части формулы Стирлинга. Поэтому нам надо исследовать асимптотическое поведение интеграла /: '-1 Прежде всего отметим, что для больших χ единственный большой вклад в интеграл получается от ш в окрестности нуля — минимума функции р. Например, если ε — любое фиксированное положительное число, то »—ε г—ε ρ—ε f e-xp(w)dw< I e-x-w2'2dw< I e-xw2'2dw. J-l J-l J-oo Молено получить грубую оценку последнего интеграла, написав -xw2/2 _ -xw2/4 . -xw2/4 ^ -ε2χ/4 —xw2/4 для —oo < w < —ε. Поэтому ί " e~xw2l2 dw <i C{x)e-£2x'A, J —оо /0 e-xw /4 dw _ сходящийся интеграл ■оо где
1068 Глава 21. Асимптотическое вычисление интегралов и, более того, С(х) —► 0 при χ —> оо. Следовательно, интеграл f_1 экспоненциально убывает с ростом х. Аналогично, при w > 0 функция p(w) строго возрастает, так что /ОО /-ОО e-xp(w) dw < е-р(е)*/2 / e-4.W/2 dw Этот второй интеграл сходится абсолютно и равномерно в области χ > 0 (причем все быстрее, когда χ —► оо). Таким образом, мы можем контролировать оба интеграла J^ и J^° и заняться интегралом /f £ е^3^"') <£ш для ε > 0. Теперь р(0) = 0, р'(0) = 0 и р"(0) = 1. Поэтому молено сделать замену переменной w = w(s) в окрестности нуля, так чтобы ρ приняла вид s2/2, т.е. p(w(s)) = s2/2. Напомним читателю, как это делается. Поскольку р(0) = 0, мы имеем p(w) = / ρ'{г) dr = w I p'(wu) du, Jo Jo где мы положили г = wu при переходе от первого интеграла ко второму. Аналогично, p'(w) = w j p"(wu)du Jo p(w) = -w2q(w), q(w) = 2 / / up"(uvw)dudv. Jo Jo Заметим, что q — дифференцируемая функция отши q(0) = 1. Значит, q{w) > 0 для достаточно малых w. Теперь можно сделать замену переменных s = Wyfq(w) и так что где
21.1. Метод Лапласа 1069 Выберем ε > 0 настолько малым, чтобы такая замена переменной была допустима при — ε < w < ε q{w) (т. е. чтобы функция g{w) была положительна в этом интервале). Теперь сделаем замену переменной в интеграле J^e~xP(w) dw и получим /ε /·£2 ■ε J-ει е-*·2'2 (^\ ds \ ds где £2 = £^я(£) и ~~ει = ~~£\/я(~~£) (см- график на рис. 21.1). Рис. 21.1 -ει -2η -η η Рис. 21.2 ε2 При оценке интеграла играет роль только область в окрестности s = 0. Например, предположим, что у нас есть бесконечно дифференцируемая функция ρ такая, что ρ = 1 при \s\ < η и ρ = 0 при s > 2η, где —ει < —2η и 2η < ε (рис. 21.2). Тогда обозначим l/ \ / \d™ ,/ ν dw b{s) = p(s) — , т.е. b{s) = —{s) для \s\ < η. Напишем e_a;s l2w'(s)ds = / e-a;s/2b(s)ds + погрешность, -ει ./—ει
1070 Глава 21. Асимптотическое вычисление интегралов где погрешность экспоненциально стремится к нулю с ростом х, в частности, быстрее по порядку величины, чем е-7) х. (Это является следствием того, что погрешность дается интегралами вида Πει e-xs2l2(b(s) - w'{s)) ds и Ц2 e-xs2l2(b{s) - w'{s)) ds. Тогда подынтегральное выражение стремится к нулю быстрее, чем константа на е"4 х.) Интеграл /** e~xs''l'2b{s) ds молено заменить интегралом /. оо >2b{s) ds поскольку Ъ = 0 для s < ει и s > ε?. Таким образом, мы все свели к оценке этого последнего интеграла. Воспользуемся формулой Тейлора с остатком и напишем b{s) = Ъ0 + blS + b2s2 + ■■■+ bN-is"'1 + bN(s)sN, где b/v(s) — гладкая ограниченная функция. Тогда /ОО РОО РОО е~хв /2b(s) ds = b0 е-**2/2 ds + Ьх / e~xs^2s ds -оо J—oo J—оо /оо e-xs2/2s2ds + --- + RN(s), ■оо где Следовательно, /оо e-xs2/2bN(s)sNds. ■оо /оо e-xs2'2\s\N ds, ■оо где DN = sup|bjv(s)|. В силу симметрии e"xs '2sk ds = 0, если к нечетно. /оо ■оо ,2/ ОО i
21.1. Метод Лапласа 1071 Для четного числа к сделаем замену переменной rV2e = dy х /zs = у, так что ds = —γ. . xLlz Тогда имеем /СО /·00 e-xs2l2skds = x-l'2-k / е-У212укау ■со J—со = ckx-v2-ki2, где /OO е-У212укау ■CO не зависит от х (причем Cq = \/2π). Заметим, что Г е-У2'2ук dy = 2 Г е-и{2ч)*-1У2 du = 2(fe+1)/2r (^±λ откуда ск = *w>r (*±±) . Аналогично, остаточный член молено оценить произведением χ-ι/2-Ν/2 на константу. Возьмем N = 2п, тогда /СО /9·7γ\ ^/2 e-xs2'2b{s) ds = ί — J (ao+aiX-Ч· · ■+αη_1χ-η+1+εη(χ)), где £„(#) = о{х~п). Здесь oo = bo, αχ = £>2, α2 = &4/ν2π и т.д. Функции Ъ и dw/ds имеют одинаковое разложение в ряд Тейлора в 0. Подстановка разложения Тейлора функции p(w) = w—log(l + w) дает более точное приближение Стирлинга. Предположим, что нам дана гладкая положительная функция ρ с единственным абсолютным минимумом в точке ίο внутри области определения этой функции (рис. 21.3), и при этом p"(to) > 0. Предположим, что α(ί) — другая гладкая функция. Рассмотрим интеграл /«).-*«*
1072 Глава 21. Асимптотическое вычисление интегралов to Рис. 21.3 Это молено переписать в виде где функция pit)— p(to) имеет минимальное значение 0 при t = ίο- Изложенный выше метод позволяет доказать принцип Лапласа (открыт в 1820 году): где оо = α(ίο)ι а последующие коэффициенты выражаются через функции о и ρ и их производные в точке ίο· 21.2. Метод стационарной фазы Давайте разберемся, что произойдет с методом Лапласа, если в экспоненте — кр заменить на \кр. Окажется, что справедлива аналогичная формула, но в этом случае в ней учитываются все критические точки функции р, а не только абсолютный минимум. В методе Лапласа множитель е~р^ в подынтегральном выражении экспоненциально убывает по сравнению со значением вблизи минимума р. Поэтому вся информация об асимптотике функции была локализована в этом минимуме. Когда мы рассматриваем интеграл Jeik^a(y)dy, множитель е1кр(у^ уже не стремится к нулю при к —* оо. Вместо этого он быстро осциллирует как функция от у везде, где р\у) φ 0. Быстрые осцилляции приводят ко взаимным сокращениям, поэтому существенный вклад в интеграл вносят области в
21.2. Метод стационарной фазы 1073 окрестности критических точек. Чтобы это увидеть, давайте рассмотрим случай, когда р'(у) не обращается в нуль во всей области, где а(у) φ 0. Точнее, предположим, что функция а{у) имеет производные всех порядков и компактный носитель, т. е. равна нулю вне конечного интервала. Кроме того, предположим, что \р'(у)\ > С > 0 для всех у, где а(у) φ 0. Тогда молено утверждать, что для любого числа N существует постоянная Сдг такая, что Ι ί eikP^ dy ft* " Другими словами, мы утверждаем, что интеграл стремится к нулю быстрее, чем любая отрицательная степень к. Действительно, рассмотрим дифференциальный оператор D ' 8 р'^ду' который (в силу наших допущений) имеет смысл в области, где а(у) φ 0, и DeikP(y) = ikeikP(y) или Тогда ,ikp(y) — _fj}eikp(y)\ J elk^a(y) dy = J ±-(Deik^)a(y) dy = ljelk^c(y)dy, где 1 д (а\ ι dy \P Id fa(y)_ (У)
1074 Глава 21. Асимптотическое вычисление интегралов Здесь мы проинтегрировали по частям и воспользовались тем, что функция о вместе со своими производными равна нулю на границах области интегрирования. Функция с обладает теми же свойствами, что и о, поэтому эту процедуру молено повторить и получить У Ку)е**у) dy=± j cN(y)eik^ dy для соответствующей функции сдг(у). Если теперь обозначить CN = \fcN(y)eik*v)dy , то наше утверждение доказано. Рассмотрим теперь общий случай. По-прежнему считаем, что о — гладкая функция с компактным носителем. Но теперь мы не исключаем, что р'(у) имеет нули. Однако предполагаем, что функция ρ имеет конечное число критических точек у\,...,ут (в которых р'(у) = 0), и что р"{у) φ 0 в каждой из них. Тогда утверждается, что /' ****** ~ (τ) Σ -шж {<*+η?+■■■). где oo,j = o(j/j) = Oj, а остальные коэффициенты выралсаются через о, ρ и их производные в точке у у Знак + в функции е±7Г1/'4 берется в точке минимума, где p"(yj) > 0, а знак — в точке максимума, где p"(j/j) < 0. В этой формуле функция ρ принимает вещественные значения, а функция о может быть комплексной функцией у. Это называется формулой стационарной фазы. Докажем ее. В окрестности каждой критической точки у{ молено найти такую координату s, для которой p(y{s)) = ±*2/2 (знак выбирается в зависимости от знака p"(yj)). Сделаем замену переменной и получим
21.2. Метод стационарной фазы 1075 ψΐ Ψ2 ψ3 ΓΤΐ1 П П П Уз Рис. 21.4 Рис. 21.5 Этим объясняется множитель ]-/y/\p"{yj)\ в формуле стационарной фазы. В окрестности каждой точки yj определим такую функцию Φί, что фу = 1 вблизи yj и ^ ξ 0 вне малой окрестности, где определена процедура замены переменной (рис. 21.4); причем окрестности различных точек не пересекаются (рис. 21.5). Тогда функция Ь = α — {αχφι + агфъ + · ■ ■ + агфг) имеет компактный носитель и р'(у) φ 0 везде, где Ь{у) φ 0. Таким образом, молено применить предыдущий результат к Ь и получить [eikpady = Σ ίeifepMj)dy + 0(k~N) для любого значения N. Каждый член суммы молено рассмотреть отдельно, сделав в нем соответствующую замену переменной. Для j-ro слагаемого получаем /<**■/» (·,♦*)«.. Определим функцию φ равенством / л dy Тогда функция φ имеет компактный носитель, и мы свели задачу к вычислению интеграла /оо e±ifes2/2V(s)dS. -α Чтобы это сделать, сначала рассмотрим гауссовы интегралы. Мы у лее слегка коснулись этого вопроса в предыдущей главе.
1076 Глава 21. Асимптотическое вычисление интегралов 21.3. Гауссовы интегралы Материал, излагаемый в этом параграфе, основывается на равенстве 4= Г e-*2l2dx=l. ν 2π У-оо Его молено доказать, взяв квадрат от левой части 1 Г s/bt J-с -*2'2dx 1 /ΌΟ /ΌΟ = J_A I e^2+y2V2dxdy ^ J-co J -co ι /·2π /·οο = _L / / e-r2'2rdrde 2тг Уо Уо -/ ./о e-r2/2rrfr = 1. Функция 1 Г -χ>/2-ηΧ(Ιχ сходится равномерно для всех комплексных значении η в произвольной компактной области. Следовательно, этот интеграл определяет аналитическую функцию, которую молено вычислить для вещественных η и потом аналитически продолжить. Для вещественного числа η показатель экспоненты дополняем до полного квадрата и делаем замену переменной U Г e-x2'2-^dx = -L· Г e~^?Wl2dx 2π J -со ν2π J-co = e"2/2 — Г >/2π./-< ;-ί^")2/2ώ; = е"2/2. Эта формула верна для всех комплексных η. Если взять η = Ίζ, то получим \/2π J-co Другими словами, преобразованием Фурье функции е~х '2 является е-^ ι2. Теперь положим χ = v\u, где νλ > 0 — положительное вещественное число. Тогда dx = y/Xdu. Положив ξ = y/λζ,
21.3. Гауссовы интегралы 1077 получаем ,Ч2/2 4= !е-Хи2'2е-*иач=^= >/2π J л/2п e 2π Этот интеграл сходится для всех А при условии, что Re A > 0 и λ φ 0. Действительно, для S > R> 0 имеем iS e-x*2'\-**dx = - Ρ ±±(e-Xx2l2)e-*xdx Jr Jr Axdx АД AS + Jr6 dx\ \x В последнем интеграле молено написать е-\х2/2 _ _ }_^Le-\x2/2 Xxdx и еще раз проинтегрировать по частям. Тогда получим IX е-\х*/2е-*хах ~( 1 >R Отсюда видно, что функция = 0 \\\R 1^β~λχ2'2άχ 2тг равномерно (но не абсолютно) сходится по А в произвольной области вида Re А > 0, |λ| > δ, при любом δ > 0. Сделаем аналитическое продолжение. Значения функции задаются той же формулой, что и при вещественных положительных А, но теперь квадратный корень должен быть аналитическим продолжением положительного квадратного корня. В частности, если взять А = —ir, г > 0, то AV2 = |A|V2e-"i/4 и l— I>*2/2e-i^rfx = е«/4г-1/2е-й,'/2г# ^7Г У
1078 Глава 21. Асимптотическое вычисление интегралов Если взять А = \г, то аналогично е-ЬхЧ2е-и-Х(кс = e-,ri/4r-l/2ei„V2r# \/Ък] ' Теперь молено закончить доказательство формулы стационарной фазы. Для этого нам надо получить асимптотическую оценку интеграла вида /•оо e±ifes2/2V(s)rfs j—< где ψ — функция с компактным носителем, которая имеет вид tp(s) = ψ(0) +sx(s). Умножим это равенство на функцию р, которая тождественно равна 1 там, где φ φ 0 и равна нулю для больших значений \s\. Тогда ip{s) = i/>o(s) + sp(s)x(s), где i/>o(s) = /9(s)i/>(0) = ф(0) вблизи s = 0. Таким образом, / i/O(s)e±ifes2/2 ds = — е^/4 + погрешность, где погрешность убывает быстрее любой степени к- Однако, и (rf/rfs)[/9(s)x(s)] равняется нулю для больших |s|. Эту процедуру молено повторять, пока не получим асимптотический ряд, что и завершает доказательство нашей формулы. Давайте получим n-мерную версию гауссова интеграла. Пусть XIs %п/ — векторная переменная и Q = /±п U 0 \ ±гп)
21.3. Гауссовы интегралы 1079 является матрицей η χ η для всех rj > 0 и sgnQ равняется числу плюсов минус число минусов. Тогда |ri| · ■ ■ \rn\ = | Det(Q)|. Умножая формулы для одномерных интегралов, получаем ~—^ J exp (^Qx · χ) exp(-i£ · χ) rfx = \Oet(Q)\~1/2 -expi jSgnQJ xexpi-^Q-^-^J , где теперь ξ — тоже вектор, a Q-1 — обратная матрица. Итак, мы доказали формулу для диагональной матрицы Q. Однако, для любой несингулярной симметричной матрицы Q молено найти ортогональную матрицу О такую, чтобы матрица OQO-1 была диагональной. Это значит, что полученная выше формула верна для всех таких матриц Q. Мы можем использовать n-мерную версию гауссова интеграла, чтобы получить n-мерную версию формулы стационарной фазы. Пусть ρ — функция с конечным числом критических точек. Предположим, что все критические точки функции ρ невырождены. Тогда гессиан д2р ^И^Ь» является невырожденной матрицей во всех критических точках уг Пусть σ = aj обозначает сигнатуру j-й критической точки. Тогда fa(y)eikp(yUy где сумма берется по всем критическим точкам. Здесь величины ai(j/j), a^iyj) и т.д. выражаются через функции о и ρ и их производные различных порядков в точках у у
1080 Глава 21. Асимптотическое вычисление интегралов 21.4. Групповая скорость В качестве применения метода стационарной фазы в одномерном пространстве рассмотрим следующую ситуацию. Пусть у нас есть семейство бегущих волн e-{i/h){E{p)t-px) ^ где h — малое число, так что \/h играет роль нашего большого параметра к. Волновое число для пространственной вариации равно p/h в каждый момент времени t. Мы полагаем, что Ε зависит от р, т. е. каждая волна имеет свою скорость. Предположим, что мы сложили семейство бегущих волн, что выражается интегралом вида f a(p)e-VhHEW-rt dp. Далее, предположим, что функция а(р) сосредоточена вокруг некоторого фиксированного значения ро· Другими словами, мы предполагаем, что функция о отлична от нуля только для значений ρ в небольшой окрестности ро· Согласно методу стационарной фазы, существенный вклад в интеграл возникает только от тех значений р, где производная по ρ показателя экспоненты равняется нулю, т. е. только при условии, что E'{p)t - χ = 0. Поскольку а(р) равняется нулю, если ρ не лежит в малой окрестности ро, то это уравнение дает нам связь между χ и t. Из уравнения следует, что интеграл практически равен нулю везде, кроме тех значений χ и t, для которых равенство χ = E'(p0)t выполняется приближенно. Другими словами, интеграл выглядит как небольшой сгусток, если рассматривать его как функцию х, причем этот сгусток движется со временем со скоростью Е'(р). (Этот сгусток называется волновым пакетом, а его скорость Е'{р) называется групповой скоростью.)
21.4. Групповая скорость 1081 Давайте исследуем, какой должна быть функциональная зависимость Ε от р, если потребовать, чтобы выражение E-t — p-x было инвариантно относительно преобразований Лоренца. Согласно преобразованию Лоренца, точка (ί, χ) может перейти в точку (ί', χ') при условии, что выполняется равенство 2x2 2 2^/2 /2 С t — X = С t — X . Тогда (Е,р) преобразуется в (Ε',ρ'), причем Е2-с2р2 = Е'2-с2р'2. Таким образом, единственная инвариантная связь между Ε и ρ имеет вид Е2 - с2р2 = const. Обозначим эту константу т2с4, так что Е2-с2р2 = т2с4 или Е{р) = {{рс)2 + т2сА)1'2. Тогда *» -Ш = £■ где Я(р) = Мс2 и Μ = (т2 + (рс)2)1/2, так что, если р/с мало по сравнению с т, то Μ = m). Если считать, что Μ — это масса, то связь между групповой скоростью Е'(р) и ρ — это в точности соотношение между скоростью и импульсом. Таким образом, мы связали волновое число к = p/h с импульсом р, а соответствующая длина волны А = — = — (формула де Бройля). к ρ Если считать, что Ε — энергия, то связь между энергией и частотой ν временной вариации дается формулой Ε = hv (формула Эйнштейна).
1082 Глава 21. Асимптотическое вычисление интегралов В этих формулах стоит малый параметр h, который мы устремляли к нулю. Великое открытие квантовой механики состоит в том, что параметр h не должен стремиться к нулю. Это фундаментальная константа природы, известная как постоянная Планка. В формуле Эйнштейна она возникает как множитель, связывающий энергию и обратное время, следовательно, ее размерность энергия х время. Значение постоянной Планка равно /1 = 6.626 х 10"34Дж-с. 21.5. Формула обратного преобразования Фурье Давайте рассмотрим очень важное применение формулы стационарной фазы. Пусть η = 2, координаты обозначим χ и ξ. Возьмем функцию ρ(χ,0 =ρη(χ,ξ) = χ(ξ-η), где η — фиксированное число. Эта функция имеет только одну (невырожденную) критическую точку, а именно х = 0, ξ = η с сигнатурой σ = 0. Тогда λ. J е**«-")а(х, ξ) άχάξ = 1 (α(0, η) + ^ + · · · ) . Эта формула была доказана для α(χ,ξ) с компактным носителем. Дальнейшее обобщение доказательства показывает, что она годится для функций, обращающихся на бесконечности в нуль вместе со своими производными любого порядка. Причем они стремятся к нулю быстрее, чем любая отрицательная степень к. В частности, допустим, что α(χ,ξ) = /(χ)9(ξ),
21.5. Формула обратного преобразования Фурье 1083 где / и д — гладкие функции одной переменной, быстро стремящиеся к нулю на бесконечности вместе со своими производными. Тогда молено написать ^ff f{x)g{i)e-]kx^)dxdi = ±/(рш + о (1) ■ В этом интеграле сделаем замену переменной и = кх. Тогда i/Сош + о (1) - JL J, (H)9Юе-.*-,)*,« Пусть д — Фурье-образ функции д, определенный формулой д(и) =-^= J д(0е-^ άξ. Подставим это выражение в предыдущую формулу и получим Предположим, что функция / удовлетворяет условию /(0) = 1. Тогда '(ϊ)-1+0(ϊ) и ^ J f (H) 9(»)e>-A, = -i= /9(»)e-*. + О (') . Переходя к пределу А; —* оо, получаем 9(??) = Ж Эта формула называется формулой обратного преобразования Фурье. Она показывает, как восстановить функцию по ее Фурье- образу. Аналогично доказывается формула для пространства η измерений 9(η) = \ [ g(u)e-iutl du. I g(u)e~iur> du.
1084 Глава 21. Асимптотическое вычисление интегралов 21.6. Асимптотическая оценка формулы Гельмгольца Пусть и является решением приведенного волнового уравнения (Δ + к2)и = 0 в трехмерном пространстве. В параграфе 19.6 мы показали, что если и удовлетворяет этому уравнению, то для точек Ρ вне некоторой замкнутой поверхности S, работает формула Гельмгольца uiP) = iIL{iT*du'u*d{fT))- (19'2) При этом для точек Ρ внутри S тот же интеграл равен нулю. Там мы упоминали, что Гельмгольц таким образом объяснил принцип Гюйгенса — отсутствие обратных волн. Однако, обращение интеграла в нуль внутри S зависит от вкладов со всей поверхности. Френель полагал, что если бы внутри S были все волны, то интеграл от каждого малого элемента поверхности давал бы нулевой эффект внутри за счет интерференции. Используя метод стационарной фазы, мы сейчас покажем, что Френель был прав с точностью до членов порядка 1/к. Когда мы применяем метод стационарной фазы, функция и в правой части формулы осциллирует. Прежде, чем двигаться дальше, необходимо сделать ряд предположений относительно нее. Предположим, что вблизи поверхности S эта функция имеет вид и = aelk(^, где о и φ — гладкие функции. Кроме того, пусть ||grad<^>|| = 1. Такая функция будет, например, описывать излучение от точки Q, лежащей внутри поверхности S, где ф(у) = у — Q. Далее, предположим, что мы находимся достаточно далеко от поверхности S, так что 1/г2 пренебрежимо мало по сравнению с А;, и что а и da тоже малы по сравнению с к. Подставим все в формулу Гельмгольца и получим, что член самого высокого порядка (относительно степеней к) имеет вид ^ /"/"(a/r)eife^+r)(*#- *dr). Здесь точками стационарной фазы являются точки у на поверхности S, где ф(у) + gradr(y) перпендикулярен S. При этом возникают две возможных ситуации (рис. 21.6).
21.6. Асимптотическая оценка формулы Гельмгольца 1085 grad φ(ν) grad r (у) grad ψ{ν) gradr(y) б) Рис. 21.6. Два типа: a) gradф(y) = — gradr(y), *аф(у) = —*dr(y), Ρ = у +rgrad(f>(y); б) gr&dф(y) = 2(gradф(у),η)η - gradr(y), *аф(у) = *dr(y), Ρ = y-r(2(grad<Ky),n)n-gradr(y)) Сначала предположим, что у — невырожденная критическая точка типа (б). Член самого высокого порядка в формуле стационарной фазы равен нулю, и полный вклад в формулу Гельмгольца от такой точки у будет порядка 1/к. (Заметим, что если бы поверхность S была выпуклой и grad<^> был направлен наружу, то для любой точки Ρ внутри поверхности S все критические точки были бы типа (б). В некотором смысле это оправдывает точку зрения Френеля, что есть локальное сокращение обратных волн.) Для невырожденной критической точки типа (а), поскольку *аф(у) = — *dr(y), при вычислении вклада самого высокого порядка в формулу стационарной фазы мы можем заменить прежний интеграл интегралом вида 27Г JJs Это показывает, что (с точностью до порядка 1/к) индуцированное вторичное излучение от поверхности S обладает следующими свойствами: (i) его амплитуда равна значению А, умноженному на амплитуду первичной волны, где А = 2тг/к — длина волны; (И) его фаза на одну четверть периода опережает фазу первичной волны. (Этим объясняется множитель i.)
1086 Глава 21. Асимптотическое вычисление интегралов Именно эти два свойства Френель постулировал в своей формулировке принципа Гюйгенса, и поэтому многие рассматривали его теорию как случайную. Мы здесь показали, что эти предположения являются следствием метода стационарной фазы и формулы Гельмгольца. Теперь необходимо обсудить ситуацию, когда критические точки не вырождены. Исследуем точки типа (а). (Точки типа (б) рассматриваются аналогично.) Мы воспользуемся здесь теми же аргументами, что и при исследовании излучения. Определим экспоненциальное отображение Ε : S хШ. —* Шг формулой Е{у,г) = у + г&ааф(у). Тогда критические точки на поверхности S, связанные с точкой Р, — это как раз те точки у, для которых Е(у,г) = Р, где г = \\у — Р\\. Если grad^(y) не касателен к поверхности S, то Ε является диффеоморфизмом в окрестности (у,0). Нетрудно показать, что у — вырожденная критическая точка для Ρ = Е(у,г), если и только если (у, г) — точка, в которой отображение Ε сингулярно. В этом случае назовем точку Ρ фокальной точкой отображения Еву- Если же Ρ — не фокальная точка, то индекс гессиана φ + r в точке у — это число фокальных точек (с учетом их кратности) в сегменте от у до Р. Доказать это мы оставляем читателю. Резюме A. Асимптотическое разложение интегралов Для данной функции, определенной интегралом вида Ie~xP^(L·, надо уметь находить область значений ω, дающую основной вклад в интеграл для больших х, и получать первые два члена асимптотического разложения интеграла. B. Стационарная фаза Для интеграла вида I a(y)eikp<-y) dy
Задачи 1087 надо уметь получать формулу для первых двух членов асимптотического разложения при больших к. Методом стационарной фазы надо уметь получать формулу для обратного преобразования Фурье. Задачи 21.1. Модифицированная функция Бесселя третьего рода определяется интегралом 1 [° М*0 = - у e-xcoshtdt. Получите первые два члена асимптотического разложения функции ко(х). 21.2. Функция Бесселя Jo(x) определяется интегралом Jo(x) = ~ J ^ eixsint dt. Методом стационарной фазы получите первые два члена асимптотического разложения Jo(x). 21.3. Бета-функция В(х + 1, х + 1) представляется интегралом 1= [ [ί(1 - t)]x dt = ί е*('°8*+1°8(1-«)]Л. Jo Jo (a) Где набирается основной вклад в интеграл для очень больших х? (b) Получите главные члены асимптотического разложения В(х + 1,х + 1). (c) Опишите возможно подробнее, как получить следующие члены асимптотического разложения. Вычислите еще один член. 21.4. (а) Опишите процедуру получения асимптотического разложения интеграла вида /■»2 1=1 ε-ίχρ^ς(θ)άθ. •/0! Предположите, что ρ(θ) имеет единственную критическую точку θ = а на отрезке [θι, #г].
1088 Глава 21. Асимптотическое вычисление интегралов (Ь) Примените эту процедуру для получения главного члена асимптотического разложения функции Бесселя Jn(x) = ~(Ref eixsin0e-in0άθ\ , где η — целое число.
Глава 22 Термодинамика В этой главе показано, как внешнее дифференциальное исчисление используется в классической термодинамике, следуя идеям Борна и Каратеодори. Тема этой главы — равновесная термодинамика, имеющая несколько ветвей. Первая из них — «классическая термодинамика» — имеет дело с понятиями тепла и работы, из которых следуют понятия энтропии, температуры и знаменитое «второе начало термодинамики». В классической термодинамике обсуждаются общие принципы, но не делается попыток описать поведение вещества или вычислять измеряемые величины в рамках микроскопической модели. Вторая ветвь — «равновесная статистическая механика» в классическом или квантовом варианте — дает явные формулы для всех «макроскопически наблюдаемых величин» равновесного состояния в рамках модели атомных или молекулярных взаимодействий. Эти формулы имеют общую природу, т. е. все они имеют общую форму и связаны с именами Максвелла, Больцмана и особенно Гиббса. Третья ветвь занимается объяснением, почему эти формулы работают, изучает проблемы с точки зрения теории вероятностей или динамики, или того и другого, занимается проблемами установления равновесия. В этой главе мы совсем немного будем говорить об этой третьей ветви. В первых двух параграфах рассматривается классическая термодинамика. Но при этом мы начнем с чисто математической теоремы Каратеодори, которая геометрически вполне наглядна, хотя ее доказательство во всех деталях мы завершим в приложении
1090 Глава 22. Термодинамика к этой главе. Эта теорема является математическим инструментом, согласно которому в рамках подхода Борна и Каратеодори к термодинамике функция энтропии существует. После этого мы получим ряд физических следствий теории, а конец главы посвятим равновесной статистической механике. 22.1. Теорема Каратеодори Пусть а = Aidx1 + · · · + Ап dxn — линейная дифференциальная форма в пространстве W1, где все Д — вещественные функции на этом пространстве. Возьмем некоторую фиксированную точку Ρ и будем рассматривать значение α в точке Ρ как вектор- строку (Αι(Ρ),..., Ап(Р)). Если этот вектор не равен нулю, то его нулевое пространство — это (п — 1)-мерное пространство всех И X = : I таких, что А1(Р)Х1 + --- + Ап(Р)Хп = 0. Пусть η = x{t) — кусочно-дифференцируемая кривая. Тогда Iа = /"μι(χ(ί))χ1(ί) + · · · + An(x{t))xn{t)]dt. В частности, если для каждого t касательный вектор χ(ί) = \ I лежит в нулевом пространстве (Ai(x(t)),... ,An{x(t))), Kxn(t)J то интеграл Г а = 0. Кривая η называется нулевой кривой а, если 7 непрерывна и кусочно-дифференцируема и если при каждом t, для которого определена χ(ί), эта χ(ί) лежит в нулевом пространстве (Ai(x(t)),... ,An(x(t))). Сейчас мы хотим рассмотреть геометрическую задачу. Предположим, что мы начали с некоторой точки Р. Где находятся те точки Q, которые соединяются нулевыми кривыми с Р?
22.1. Теорема Каратеодори 1091 Например, предположим, что для некоторой функции / выполняется равенство α = <f/. Тогда если η — нулевая кривая, соединяющая Ρ и Q, мы имеем 0= /a = /(Q)-/(P). Тогда /(Q) = /(Ρ)- Если df φ 0, то уравнение / = /(Ρ) = const задает (η—1)-мерную поверхность1 (рис. 22.1), проходящую через точку Р, и Q должна быть на этой поверхности. Рис. 22.1 При этом существуют точки, сколь угодно близкие к Р, которые не могут быть соединены с Ρ посредством нулевых кривых. То же самое верно и в случае, когда а = gdf, где д — некоторая ненулевая функция, и df φ 0. В самом деле, η — нулевая кривая для а, если и только если она является нулевой кривой для д~ха = df. И условия, чтобы быть нулевой кривой, те же. Поэтому, чтобы молено было соединить точки Q и Ρ нулевой кривой, Q должна лежать на (п — 1)-мерной поверхности / = /(Р). Заметим, что если a = gdf,Todct = dg/\dfvi поэтому α Л da = д df Л dg Л df = 0. JB приложениях, где форма а = df интерпретируется как силовое поле, а функция / — как его потенциал, такая поверхность называется эквипотенциальной. — Прим. ред.
1092 Глава 22. Термодинамика А теперь рассмотрим форму а = dz + xdy, определенную в пространстве Ш3. В этом случае da = dx Л dy и а Л da = dx Л dy Л dz нигде не обращается в нуль. Покажем, что любые две точки молено соединить нулевой кривой для dz + xdy. Для этого достаточно показать, что молено соединить начало координат 0 с любой другой точкой Q. Напишем Q = Сначала предположим, что Ь φ 0. Теперь видно, что ось χ является нулевой кривой для а, потому что dz и dy равны нулю вдоль прямой ζ = у = 0. В силу этих же причин, любая прямая, параллельная оси х, является нулевой кривой для а. Теперь пусть за время 0 < t ^ 1 мы сдвигаемся вдоль оси χ от начала 0 до точки, х-я координата которой равна — с/Ъ. Далее двигаемся из точки в точку вдоль '-с/Ъ\ ( 0 *(*) =1 0 + (* - 1)4 . 1 < * < 2. 0 ) \{t-l)c) Поскольку χ(ί) = Ш и (Л1(х(*)),Л2(х(*)Мз(х(*))) = (θ,-^,ΐ) , мы видим, что это тоже нулевая кривая. Наконец, перейдем из точки '-с/Ъ\ /а\ Ъ I в точку I Ь
22.1. Теорема Каратеодори 1093 вдоль x(t) = 6 + 0 , 2 ^ ί ^ 3. Поскольку эта прямая параллельна оси х, она тоже является нулевой кривой. Итак, мы перешли из точки 0 в точку Q вдоль непрерывной траектории — ломаной, состоящей из трех прямолинейных отрезков. Эта траектория является кусочно- дифференцируемой нулевой кривой. Если Ь = 0ис^0,то сделаем немного по-другому. Сначала С\ перейдем вдоль нулевой кривой в точку I с I . Сначала идем в W Л (Л с вдоль χ = ζ = 0, а затем в I с вдоль у = с, ζ = 0 ^0/ W (параллельно оси х). Наконец, перейдем из точки в точку V0/ вдоль χ(ί)= I с| + I -(i-3)c| , 2^ί^3. Поскольку вдоль этой кривой dz = cdt, dy = —cdt и х = 1, мы видим, что sz + xdy тождественно равно нулю на этой кривой, поэтому она — нулевая кривая. Теперь молено перейти в точку Q вдоль прямой, параллельной оси х, т. е. координаты у и ζ фиксированы, а координата χ меняется от 1 до а. Конечно, если Ъ = с = 0, молено сразу попасть их 0 в точку Q вдоль оси х. Итак, мы доказали, что любые две точки в пространстве R3 молено соединить нулевой кривой формы dz + xdy.
1094 Глава 22. Термодинамика В пространстве R молено рассмотреть три типа 1-форм. Тип Пример (i) α, где α φ 0, но da = 0 а = dz (ii) α, где (ία ^ 0, но α Л (ία φ 0 а = xdy (iii) α, где α Λ (ία τ^ 0 a = dz + xdy В случае (i) мы знаем, что если (ία = 0, то локально молено найти такую функцию /, что α = df. (Это молено сделать в любой звездной области, содержащейся в области определения а.) Если а не обращается в нуль в некоторой точке Р, то из теоремы о неявной функции следует, что молено сделать такую замену переменной, что функция / станет одной из координат, скажем, ζ. Другими словами, с точностью до замены переменной пример из первой строки представляет ее общий случай. Математическая теорема, которую мы здесь приведем, говорит, что это справедливо и в двух других случаях, т. е. любая форма типа (ii) или (iii) сводится к соответствующему примеру. Позднее в этом параграфе мы дадим формулировку теоремы и наметим вкратце, как ее доказать, а все детали доказательства дадим в приложении. Теорема и ее доказательство верны не только в трехмерном пространстве, но и в пространстве η измерений. Мы уже видели, что в случае (iii) можно соединить любую точку с любой близлежащей с помощью нулевой кривой формы а. Следовательно, если форма α такова, что для любой точки Ρ существуют точки Q, сколь угодно близкие к ней, которые нельзя соединить с Ρ посредством нулевой кривой формы а, то имеет место случай (i) или (ii). Это утверледение, точнее его n-мерное обобщение, и есть содерлеание теоремы Каратеодори. Теорема Каратеодори. Пусть α — линейная дифференциальная форма, обладающая тем свойством, что для любой точки Ρ существуют сколь угодно близкие к ней точки Q, которые не могут быть соединены с Ρ с помощью нулевой кривой формы а. Тогда (локально) существуют такие функции / и д, что а = fdg.
22.1. Теорема Каратеодори 1095 Это выражение для а не единственное. Действительно, если Η — дифференцируемая функция одной переменной, производная которой нигде не равна нулю, и G = Hog, то, согласно цепному правилу, dG = H'(g)dg. Поэтому можно писать a = FdG, где G = Η о д, F = f/H'(g). Прежде чем продолжать чисто математическое обсуждение теоремы Каратеодори, давайте кратко опишем, как она используется в термодинамике. Детальное обсуждение с точными определениями читатель найдет в следующем параграфе. Можно измерять количество тепла, выделенное в химической реакции, которая проводилась в известных условиях, например, при постоянном объеме или при постоянном давлении. (Это можно сделать, например, в умном приборе, называемом ледяным калориметром. Он использует тот факт, что объем льда при таянии сокращается. При этом в обычных условиях, чтобы растаяло данное количество льда, требуется определенное количество тепла.) Количество тепла, необходимое для небольшого изменения какой-нибудь величины (например, повысить температуру одного грамма воды на один градус или увеличить его объем), когда эксперимент выполняется каким-то заданным способом, (приблизительно) линейно связано с этими малыми изменениями. Поэтому «количество тепла, сообщенное» системе в равновесном состоянии, является линейной дифференциальной формой а. В течение довольно долгого времени было принято считать, что эта форма точная, т. е. что существует такая функция С (называемая калорической), представляющая «полное количество тепла в системе», для которой α = dC. Другими словами, мы считаем, что «калорическая функция» в системе изменяется на величину сообщенного тепла. Только постепенно ученые осознали, что форма α не замкнута и поэтому не может описывать бесконечно малое изменение какой-либо функции. С другой стороны, довольно рано стало понятно, что работа, совершенная над системой, тоже задается линейной дифференциальной формой ω, которая не замкнута. Действительно, пусть
1096 Глава 22. Термодинамика в цилиндре находится газ, тогда при сжатии его поршнем совершается работа тем большая, чем больше давление газа и соответственно выше его температура. Вдавим поршень в цилиндр при высокой температуре, сокращая объем, и потом охладим систему в этом положении (поршень неподвижен, и работа не совершается), при низкой температуре вернем поршень в исходное положение и нагреем газ до той же температуры, что и вначале. Таким образом, мы завершили «цикл», т. е. мы прошли вдоль замкнутой кривой, вдоль которой интеграл от ω не равен нулю. (Конечно, эффективный способ проверить, замкнута форма или нет, — это проинтегрировать вдоль замкнутой кривой. Вот почему «циклы» играют такую важную роль при изучении задач термодинамики.) Согласно первому закону термодинамики2, несмотря на то, что формы α и ω не замкнуты, их сумма замкнута, т. е. ά(α+ω) = 0. Другими словами, первый закон термодинамики говорит, что (локально) а + ω = dU, где U — функция системы (определена с точностью до аддитивной постоянной). Эта функция называется внутренней энергией системы. Существование функции U — это один из вариантов закона сохранения энергии. Второй закон термодинамики следует из поведения системы, к которой не подводится тепла извне. Если мы поместим систему в оболочку (называемую адиабатической оболочкой), через которую невозможно обмениваться теплом, то состояние системы сможет изменяться только по нулевым кривым формы а. В природе замечено, что в этих условиях для любого состояния системы существуют близкие состояния, в которые невозможно перейти. Согласно теореме Каратеодори, это значит, что существуют такие функции / и д, для которых а = fdg. 2К двум основным принципам термодинамики в русскоязычной литературе часто применяется название «начало» вместо «закон». — Прим. ред.
22.1. Теорема Каратеодори 1097 Конечно, это условие не определяет / и д полностью, о чем мы уже говорили выше. Однако, анализ обмена между системами, находящимися в тепловом контакте, показывает, что в качестве функции / можно взять универсальную функцию Τ для всех систем, называемую абсолютной температурой, которая определятся с точностью до постоянного коэффициента (масштабного множителя). Это значит, что при фиксированном масштабе абсолютной температуры для каждой системы функция д определяется с точностью до аддитивной постоянной. Обычно эту функцию обозначают буквой S и называют энтропией системы. Итак, согласно второму закону термодинамики, существует универсальная температура Τ (называемая абсолютной температурой и определенная с точностью до постоянного множителя), и для каждой системы существует функция S (называемая энтропией и определенная с точностью до аддитивной постоянной при фиксированном масштабе температур), для которых a = TdS. Температурную функцию выбирают так, чтобы она всегда была положительной. При этом условии изменение энтропии всегда имеет тот же знак, что и количество тепла, сообщенное системе вдоль любого касательного вектора системы (т. е. бесконечно малое изменение). Поскольку изменение S вдоль любой замкнутой траектории должно быть равно нулю, это означает, что для любого цикла, если где-то добавляется тепло, в другом месте оно должно изыматься. Кельвин дал известную формулировку второго закона термодинамики: «не существует циклических процессов, в которых взятое у системы тепло полностью переходит в работу». Работа может производиться только с помощью тепловой машины, переводящей определенное количество тепла в холодный резервуар. В следующем параграфе мы сюда вернемся и дадим точные формулировки всех этих законов. А сейчас обсудим чисто математически теорему Каратеодори. Давайте рассмотрим форму α = dz + χ dy в шестимерном пространстве R6 с координатами х, у, ζ, и, ν, w. Очевидно, что любая кривая, вдоль которой постоянны у и
1098 Глава 22. Термодинамика ζ, является нулевой кривой формы а. Поэтому мы можем двигаться из 0 в любую точку Q пространства R6 вдоль нулевой кривой формы а, сначала двигаясь в трехмерном пространстве и = ь = ю = 0др точки, у которой первые три координаты совпадают с соответствующими координатам точки Q, а затем уже вдоль прямой линии до точки Q. (Вдоль этой прямой х, у и ζ постоянные.) А теперь рассмотрим форму а = dz + χ dy + и dv. Как и раньше, в пространстве, где и = ν = w = 0, мы двигаемся из начала координат до точки, первые три координаты которой совпадают с соответствующими координатами точки Q. Затем, сохраняя значения χ и у, мы можем изменить нужным образом координаты и и υ, потому что вдоль любой кривой у = const форма а принимает те же значения, что и форма dz+u dv, и мы, таким образом, сводим к случаю трехмерного пространства. Наконец, можно изменить координату w, фиксируя остальные пять координат. Далее рассмотрим форму а = w dz + χ dy + и dv. Предположим, что у точки Q координата w не равна нулю, т. е. w(Q) = г φ 0. Сначала двигаемся от точки 0 вдоль прямой x = y = z = u = v = Qpp точки, у которой координата w равна г. Теперь мы остаемся в гиперплоскости w = г. Но для любой кривой в этой гиперплоскости форма а принимает те же значения, что и форма а' = г dz' + χ dy + и dv. Если мы сделаем замену переменной z' = rz, то а' = dz' + χ dy + и dv. Теперь, как и раньше, можно придать нужные значения остальным пяти переменным, используя трехмерный случай. Аналогично, если координата χ или и точки Q не равна нулю, то используются те же соображения, просто изменяется роль различных координат.
22.1. Теорема Каратеодори 1099 С другой стороны, если точка Q находится в трехмерном подпространстве, заданным условием χ = и = w = 0, то любая кривая в этом подпространстве является нулевой кривой. Поэтому можно соединить начало координат с точкой Q. Итак, в пространстве Ш. можно рассмотреть шесть типов 1-форм. (i) (ϋ) (iii) (iv) (ν) (vi) Тип α φ 0, но da = 0 da φ 0, но α Л da = 0 а A da φ 0, но da A da = 0 da A da φ 0, но а A da A da = 0 а A da Л da 7^ 0, но da Л da Л da ξ 0 da Л da Л da 7^ 0 Пример dz xdy dz + xdy xdy + udv dz + xdy + udv wdz + xdy + udv Наши рассуждения показывают, что в случае формы типов (iii)—(vi) можно двигаться между двумя любыми точками вдоль нулевой кривой. Имеется математическая теорема о нормальной форме, согласно которой для любой из форм одного из типов, стоящих слева, можно сделать локальную замену координат, так что в новых координатах форма α принимает соответствующий вид, указанный справа. (Набросок доказательства этой теоремы дается в приложении.) С учетом этого факта мы можем доказать теорему Каратеодори в шестимерном пространстве следующим образом. Сначала покажем, что da Ada Ada = 0. Предположим противное — выражение da A da A da не равно нулю тождественно. Тогда в некоторой точке Ρ (и поэтому в окрестности Р) мы имеем дело со случаем (vi). Следовательно, в окрестности точки Ρ можно сделать замену координат, так чтобы форма α имела вид, стоящий справа. Но тогда точку Ρ можно соединить с любой точкой с помощью нулевой кривой формы а. Но ведь мы предположили, что каждая точка имеет в своей окрестности точки, в которые нельзя попасть с помощью нулевых кривых. Противоречие! Поэтому da A da Ada = 0. Но эти же рассуждения показывают, что a Ada Ada = 0,
1100 Глава 22. Термодинамика поскольку иначе мы будем иметь дело со случаем (ν) вблизи некоторой точки и так далее. Таким образом, мы можем двигаться дальше и доказать, что α Л da ξ 0, а это значит, что теорема Ка- ратеодори доказана. Аналогичные соображения работают в пространстве η измерений. 22.2. Классическая термодинамика по Борну и Каратеодори В этом параграфе мы изложим основные положения термодинамики с точки зрения Борна и Каратеодори. Преимущество этого подхода состоит в том, что можно избежать довольно сложных соображений относительно цикла Карно и невозможности построить вечный двигатель. Этот подход основывается на абстрактных идеях, далеких от повседневного опыта, и ряде физических законов, которые просто формулировать. Здесь тепло — производное понятие. Теория формулируется в стандартных терминах элементарной механики. Однако, несмотря на то, что в теории содержатся понятия механики, ее законы должны быть модифицированы. Именно модификация этих законов приводит к понятиям температуры и тепла. После этого два простых физических закона вместе с теоремой Каратеодори приводят к понятиям абсолютной температуры и энтропии. Основное предположение, общее для почти всех физических теорий, состоит в том, что мы можем выделить интересующую нас часть из остальной Вселенной. Эту часть Вселенной мы называем системой. Система может существовать в различных состо- Описание всех состояний системы может быть невероятно сложной задачей. Например, если наша система — газ в некотором объеме, то этот газ может совершать турбулентное движение. В этом случае для описания состояния газа мы должны будем определять локальную скорость каждой малой порции. Таким образом, следовало бы ожидать, что множество всех состояний газа может быть бесконечномерным в соответствующем смысле. В любом случае в нашей теории мы будем работать с неопределенными терминами — с «системой» и «состоянием». Позднее, когда мы
22.2. Классическая термодинамика 1101 разработаем «модель» термодинамики, будут даны математические определения. Другой термин, также понятный интуитивно, но пока не определенный, — взаимодействие. Предполагается, что можно конкретизировать различные взаимодействия нашей системы с другими системами или со Вселенной. Следующее фундаментальное предположение — среди всех возможных состояний системы существует выделенный класс состояний, называемых равновесными. Если все взаимодействия системы со Вселенной фиксированы, то система будет переходить из одного состояния в другое, стремясь при этом к определенному равновесному состоянию (оно определяется начальным состоянием системы в момент, когда были фиксированы все взаимодействия). Хотя произвольные состояния системы очень сложны, класс равновесных состояний относительно просто описывать, он может быть параметризован конечным числом переменных. Итак, множество равновесных состояний имеет структуру подмногообразия3 конечномерного векторного пространства. Это многообразие равновесных состояний является подмножеством множества всех состояний системы. Следующее предположение выделяет определенные типы взаимодействий. Существует особая форма взаимодействия между двумя системами, называемая диатермальным контактом. При взаимодействии такого типа не происходит наблюдаемого макроскопического движения и обмена веществом. Возникающие изменения можно описать следующим образом. Объединим две системы в одну новую систему (рис. 22.2). Эта составная система является прямым произведением двух первоначальных систем в том смысле, что состояния новой системы — это пара состояний (РьРг)) где р\ — состояния первой системы, ά р2 — состояния второй. При диатермальном контакте равновесные состояния объединенной системы — это подмножество множества пар равновесных состояний исходных систем (рис. 22.3). Другими словами, если р\ — равновесное состояние первой системы, ά Ρ2 — равновесное состояние второй системы, и обе системы находятся в диатермальном контакте, то не обязательно, что объединенная система будет в равновесном состоянии, но она будет стремиться 3См. обсуждение подмногообразия в параграфе 10.9.
1102 Глава 22. Термодинамика Система 1 Система 2 Комбинированная система Рис. 22.2 Множество пар состояний равновесия^ систем 1 и 2 Состояния равновесия комбинированной системы Рис. 22.3 к определенному равновесному состоянию (91,92)5 где 91 — новое равновесное состояние первой системы, а 92 — новое равновесное состояние второй системы. Тогда мы говорим, что первая система в состоянии 91 находится в тепловом равновесии со второй системой в состоянии 92-
22.2. Классическая термодинамика 1103 Этот наблюдаемый закон природы иногда называется нулевым, законом термодинамики. Согласно ему, тепловое равновесие является отношением эквивалентности. Это означает следующее. Пусть мы имеем три системы, причем р\, р2 и рз ~~ равновесные состояния этих систем. Предположим, что первые две системы в этих состояниях (pi и рг), будучи приведены в диатер- мальный контакт, оказываются в тепловом равновесии, и то же самое справедливо для второй и третьей систем (в состояниях Р2 и рз). Тогда первая и третья системы (pi и рз) при диатермальном контакте также будут в тепловом равновесии. Класс эквивалентности всех систем, находящихся в тепловом равновесии, называется абстрактной температурой. Предположим, что мы фиксируем одну определенную систему и некоторую численную функцию равновесных состояний этой системы, которая принимает различные значения в состояниях, принадлежащих различным абстрактным температурам4. Таким образом, у нас есть численная функция Θ, определенная для всех равновесных состояний всех систем, называемая эмпирической температурой. Выбранная система вместе с ее функцией называется термометром. Кроме того, мы полагаем, что для любой системы θ — дифференцируемая функция на множестве равновесных состояний. (Возможность выбрать дифференцируемую θ — тоже часть «нулевого закона термодинамики».) Более того, можно найти некоторую систему и для нее выбрать такую функцию Θ, что άθ φ 0 на всем множестве равновесных состояний этой системы. Только такие функции θ мы будем использовать в качестве эмпирических температур. Конечно, если Θ' — другая эмпирическая температура, то она — строго монотонная дифференцируемая функция Θ. И обратно, взяв любую строго монотонную дифференцируемую функцию и применив ее к Θ, получим новую эмпирическую температуру Θ'. В любом случае два состояния имеют одинаковую абстрактную температуру, если и только если они имеют одинаковое значение функции θ при любом выборе эмпирической температуры. Иначе говоря, множество абстрактных температур превращается в одно- параметрическое семейство. Достаточность одного численного параметра — это еще одно нетривиальное допущение. — Прим. ред.
1104 Глава 22. Термодинамика Существует ряд функций, которые играют важную роль при описании любой системы. Так например, если у нас есть газ, заключенный в некоторый сосуд, то такой функцией будет объем, а также массы различных химических составляющих газа. Эти функции называются конфигурационными переменными. Таким образом, каждая система имеет η функций, определенных на множестве ее состояний и называемых конфигурационными переменными. Число конфигурационных переменных η зависит от системы, но всегда η ^ 1. Если рассматривать только равновесные состояния, то конфигурационные переменные являются дифференцируемыми функциями. Конфигурационные переменные и функция θ образуют систему локальных координат на множестве (п + 1)-мерных равновесных состояний. Конфигурационные переменные обозначим х\, Х2, ..., хп- Тогда Θ, х\, Х2, ..., хп — локальная система координат на множестве равновесных состояний. Во многих случаях одной из конфигурационных переменных является объем V. Обычно берут х\ = V, так что Θ, V, Х2, . ■ ■, хп — локальные координаты, где Х2, ..., хп — остальные конфигурационные переменные. Поскольку άθ нигде не обращается в нуль, то в силу теоремы о неявной функции множества θ = const образуют n-мерные подмногообразия. Подмногообразия θ = const называются изотермами. Конфигурационные переменные можно использовать как локальные координаты для изотерм. Существует другой важный класс взаимодействий системы с остальной Вселенной, которые называются адиабатическими взаимодействиями. Для таких взаимодействий равновесие нарушается только при изменении конфигурационных переменных. Если все взаимодействия системы в наблюдаемый период адиабатические, то такую систему называют адиабатически замкнутой. Примером адиабатически замкнутой системы (приблизительно) является термос. Кривая 7) соединяющая состояния ρ и р' адиабатически замкнутой системы, называется адиабатической кривой, или адиабатой. Обобщение экспериментального опыта — первый закон термодинамики — говорит нам, что адиабатически замкнутая система переходит из одного состояния ρ в другое р' за счет совершения внешней работы, величина которой не зависит от спо-
22.2. Классическая термодинамика 1105 соба ее приложения. Поэтому на пространстве состояний этой системы существует функция U, называемая внутренней энергией. Она обладает тем свойством, что количество работы, совершенной над системой при переходе из состояния ρ в состояние р' вдоль любой адиабатической кривой, равно W = U(p') — U(p). Если система не является адиабатически замкнутой и за счет взаимодействия она переходит из одного состояния ρ в другое р' вдоль некоторой кривой, то количество внешней работы уже не равняется U(p) — U(p'). Разность U(p) — U(p') — W = Q называется теплом, сообщенным системе в данном процессе. В этом случае количество совершенной работы и тепла, сообщенного системе, зависят от процесса, а не только от начального и конечного состояний ρ и р'. Это — формулировка первого закона термодинамики в рамках подхода Борна-Каратеодори. Обратите внимание, что при таком подходе тепло определяется как разность между изменением внутренней энергии и работой, совершенной над системой. Идея рассматривать тепло не как фундаментальную, а как производную величину, является одновременно и сильной, и слабой стороной подхода Борна-Каратеодори. Сила заключается в том, что здесь отражается фундаментальный взгляд в физике, существующий более века, — основным объектом является энергия, которая сохраняется с учетом всех ее форм. А слабость — в том, что этот подход не отражает экспериментальные и исторические реалии. Обычно тепло, подводимое к системе, легче всего измерять. Джоуль провел в 1840 году основополагающие эксперименты с целью получить механический эквивалент тепла. Если система переходит в некоторое другое состояние за счет определенного количества тепла, подведенного к ней, то такое же изменение системы может произойти, если над ней совершить определенную работу. Но полное количество совершенной работы не зависит от того, как эта работа была выполнена. Поэтому в реальных экспериментах измеряется именно подведенное количество тепла и совершается разного рода работа. Из существования единственного механического эквивалента тепла мы делаем вывод, что полная работа для перевода системы из одного состояния в другое не зависит от способа выполнения этой работы, при условии, что она выполняется адиабатически.
1106 Глава 22. Термодинамика Следующее фундаментальное понятие теории — обратимая кривая. Кривая η называется (почти) обратимой, если в каждый момент времени t состояние η it) равновесное (достаточно близко к равновесному). Интуитивно понятие обратимости состоит в том, что все взаимодействия в системе происходят очень медленно по сравнению со «временем релаксации» системы, т. е. со временем, необходимым для восстановления равновесия в системе5. Например, предположим, что в цилиндре с поршнем находится газ. Взаимодействие — это движение поршня, изменяющее объем газа. Если газ находился в равновесии, и мы внезапно сдвинули поршень, то новое состояние газа уже не будет равновесным. В нем будут разного рода ударные волны и вихри. Конечно, если поршень оставить в этом положении, то в цилиндре установится со временем новое равновесие. Можно полагать, что скорость возвращения в равновесное состояние достаточно велика, так что если поршень двигать достаточно медленно, то состояния системы будут все время (приблизительно) равновесными. Такая кривая состояний называется обратимой. В случае изменения объема из опыта известно, что существует функция р, называемая давлением, такая, что работа, совершенная над системой вдоль любой обратимой кривой 7, задается выражением — J pdV. Заметим, что до сих пор мы измеряли работу через изменение, внешнее по отношению к системе. Давление — функция равновесных состояний, позволяющая нам вычислить совершенную работу посредством обратимого изменения объема. Замечено, что существуют аналогичные функции, соответствующие другим конфигурационным переменным, т. е. в пространстве равновесных состояний существуют такие функции v\,..., vn, что работа, совершенная над системой вдоль любой (почти) обратимой кривой 7, равна (приблизительно) интегралу вдоль η от линейной дифференциальной формы ω = v\ dx\ Η + vn dxn, Такой процесс изменения состояния системы называют квазистатиче- ским. — Прим. ред.
22.2. Классическая термодинамика 1107 так что W{n)= Ι ω. J ύ Поэтому тепло, подведенное к системе вдоль пути 7, задается интегралом Q(ri)= /α, где α — линейная дифференциальная форма α = dU — ω. В случае, когда χι = V — объем, принято называть ρ = — νι давлением. Следовательно, ω = —ρ dV + V2 dx2 + ■ ■ ■ + vn dxn и α = dU — ω = dU + ρ dV — 1/2 dx2 — · · · — vn dxn. В частности, по определению, адиабатическая обратимая кривая — это кривая на множестве равновесных состояний, которая является нулевой кривой для линейной дифференциальной формы а. Итак, мы подошли к знаменитому «второму закону термодинамики». Каждодневный опыт говорит, что определенные типы работы, выполняемые над системой, не могут быть возвращены. Точнее, для адиабатически замкнутой системы существуют определенные типы работ, совершаемые над системой, такие как сильное встряхивание или размешивание, когда нельзя получить эту работу обратно вдоль какой-либо адиабатической кривой. Утверждается, что это может происходить вблизи любого равновесного состояния. Итак, формулировка второго закона термодинамики такова. В окрестности любого равновесного состояния ρ системы существуют сколь угодно близкие равновесные состояния, которые нельзя соединить с ρ с помощью обратимых адиабатических кривых. Как мы увидим в дальнейшем, это простое утверждение имеет далеко идущие следствия. Закон говорит, что в окрестности любой точки множества равновесных состояний существуют произвольно близкие точки, в которые нельзя попасть вдоль нулевых
1108 Глава 22. Термодинамика кривых формы а. Из теоремы Каратеодори следует, что для любой системы существуют такие функции А и φ на множестве равновесных состояний, что а = λ άφ. Конечно, для любой заданной системы ни функция А, ни функция φ не определяются полностью равенством α — Χάφ. Однако, если выбрать функцию А, то φ определяется с точностью до аддитивной константы. Мы покажем в следующем параграфе, что из рассмотрения поведения формы а при объединении систем можно сделать вывод, что существует предпочтительный выбор температурной функции Τ (определенной с точностью до постоянного множителя), при этом для всех систем можно положить А = Т. Эта функция Τ называется абсолютной температурой. В терминах некоторой выбранной эмпирической температуры θ утверждается, что существует такая универсальная функция Τ = Τ(θ), что для всех систем можно выбрать А = Τ(θ). Если мы решили использовать для нашей температурной шкалы абсолютную температуру, то для любой системы можно написать a = TdS где функция S определена с точностью до аддитивной константы. Эта функция S называется энтропией. 22.3. Энтропия и абсолютная температура Предположим, что две системы находятся в диатермальном контакте. Можно также считать, что энергия, необходимая для объединения этих систем, пренебрежимо мала. Между системами нет сдвигаемых перегородок и нет прямого обмена веществом. Тогда полная внутренняя энергия U объединенной системы равна сумме энергий состояний отдельных систем U(pl,p2) = Ui(pi) + U2{p2) для любого состояния объединенной системы (рьрг)· Здесь U обозначает функцию внутренней энергии объединенной системы, U\ — внутреннюю энергию первой системы, а Ό2 — внутреннюю энергию второй системы.
22.3. Энтропия и абсолютная температура 1109 Дифференциальная форма, описывающая работу, тоже аддитивна: ω — ω\ + ω2. Здесь ω\ — линейная дифференциальная форма, определенная на множестве равновесных состояний первой системы. Она может рассматриваться как линейная дифференциальная форма, определенная на произведении пространств, состоящем из всех пар равновесных состояний. При этом на ω\ не влияют равновесные состояния второй системы. Аналогично на множестве таких пар равновесных состояний определена форма ω2, которая не зависит от состояния первой системы. Следовательно, форма ω\+ω2 определена на множестве всех пар равновесных состояний. Пространство равновесных состояний объединенной системы, находящейся в тепловом контакте, есть подмногообразие множества всех пар (определяемое условием θ\ — θ2, см. рис. 22.4). Это значит, что ω является ограничением формы и>\ + ω2 на это подмножество. Отсюда следует, что (в том же смысле) α = αϊ + а2. Написав а = Αάφ, ot\ — \\ άφ\, α2 — λ.2 άφ2, получаем Α άφ = Αι άφι + λ2 άφ2. (*) Состояния равновесия комбинированной системы задаваемой уравнением θ\ = 02 Рис. 22.4
1110 Глава 22. Термодинамика Для любой системы температуру можно изменять адиабатически (например, изменяя V при постоянном давлении). Это означает, что для первой системы формы а\ и άθ\ линейно независимы; и аналогично для второй системы. Условие а\ = \\ άφ\ означает, что дифференциальные формы άφ\ и άθ\ линейно независимы. В силу теоремы о неявной функции, это значит, что можно сделать замену переменных, так что θ\ и ф\ станут первыми координатами, т. е. {θ\, ф\,у\, ■ ■.) — локальные координаты на множестве равновесных состояний первой системы. Аналогично для второй системы. Поэтому в качестве локальных координат на множестве пар равновесных состояний можно взять (01, #2, 01, Φ2\ 2/ΐ,···;Ζ2,...)· Равновесные состояния объединенной системы (в тепловом контакте) задаются условием θ\ = 02- Поэтому можно взять переменные (0,01,02; 2/ι,···;ζ2,...) в качестве координат на множестве равновесных состояний объединенной системы. Уравнение (*) показывает, что в этих координатах άφ является линейной комбинацией άφ\ и с?02, т.е. 0 = -F(0i, 02). Другими словами, функция 0 объединенной системы зависит только от значений функций ф\ и 02 и не зависит от остальных координат. К любой системе в любом состоянии можно подвести тепло, поэтому форма α и, следовательно, А нигде не обращается в нуль. Поэтому уравнение (*) можно разделить на А и написать άφ = (λ1/λ)άφ1 + (A2/A)d02. (**) Это значит, что λι/λ = /ι(0ι,02), где /i=&F/d0i, зависит только от 0ι и 02, и аналогично Лг/А = /2(01,02), где /2 = дР/дф2. Первое из этих уравнений можно разделить на второе, поскольку ни одна из функций Αχ, λ2 и А не обращается в нуль. Получаем Al/A2 = /l//2
22.3. Энтропия и абсолютная температура 1111 или log Ai - logA2 = log(/i//2), где правая часть зависит только от φι и ф^. В частности, если вычислить частную производную этого равенства по Θ, то правая часть обратится в нуль, и мы получим д log Αχ _ dlogA2 дв ~ дв Слева стоит функция от переменных, описывающих первую систему, т. е. от {θ, φι, у\,...), а справа стоит функция от переменных (θ,φ2,Ζ2, ■■■ )· Единственная возможность совпадения этих функций — это когда обе части этого равенства зависят только от в, причем являются одной и той же функцией Θ. Другими словами, существует некоторая универсальная функция д, для которой d(]ogX)/de = g(0) для всех систем. Исследование конкретных систем показывает, что функция д нигде не обращается в нуль. Теперь предположим, что делается замена переменной в эмпирической температуре, т. е. заменим в на Т{в). Тогда будем иметь координаты (Т, ф,...) и равенство d(\og\)/dT = [d(\og λ)/ΟΘ](ΟΘ/άΤ) = [d{\og X)/3Θ]{3Τ/3Θ)-1. Если выбрать Т так, что dT/άθ = Тд{в), (***) то d(logA)/dT = l/T = d(logT)/dT. Уравнение (***) определяет Τ с точностью до постоянного множителя. Действительно, Τ(θ) = ceG^\ где G — неопределенный интеграл от д, а с — константа. Такой выбор функции Τ называется абсолютной температурой. Давайте вернемся к началу этого параграфа, но вместо θ будем использовать абсолютную температуру Т. Тогда для каждой системы мы имеем logAi = logT +log Gj,
1112 Глава 22. Термодинамика где Gi не зависит от Т. Тогда Αχ = TG\, A2 — TG2, А = TG, где функции Gi, G2 и G не зависят от Т. Кроме того, мы знаем, что Αι/λ2 зависит только от ^ и (fo. Но Αχ — функция первой системы, следовательно, она не зависит от <р2, и аналогично, \^ не зависит от ф\. Следовательно, для любой системы каждая Gi зависит только от φι. Давайте опустим индексы. Итак, мы показали, что для любой системы выполняется равенство а = TG(<f>) άφ, где функция G нигде не обращается в нуль и зависит только от переменных системы. Но тогда можно решить уравнение dS = Gdtj>, которое определяет S с точностью до аддитивной константы. Другими словами, функция S есть неопределенный интеграл от G. Тогда мы имеем а = Τ dS. Итак, мы доказали следующее. Существует универсальная шкала абсолютной температуры Т, определенная с точностью до постоянного множителя. Фиксируя этот множитель и таким образом выбирая функцию Т, мы определяем функцию S на множестве равновесных состояний любой системы. Эта функция S определена с точностью до аддитивной константы (одной для каждой системы) и называется энтропией. Дифференциальная форма α для тепла имеет вид a = TdS. Как мы уже отмечали, из существования функции S и уравнения а = TdS следует кельвиновская формулировка второго закона термодинамики: для любой замкнутой кривой (циклического процесса) мы должны иметь J dS = 0, функция Τ имеет постоянный знак (который обычно выбирается положительным). Если
22.3. Энтропия и абсолютная температура 1113 вдоль одной части цикла к системе подводится тепло, то в другой части этого цикла тепло должно быть извлечено. Следовательно, невозможен цикл, в котором тепло полностью преобразуется в работу. Таким образом, «вечный двигатель второго рода» существовать не может. Рассмотрим простой цикл С (рис. 22.5). Это кривая, состоящая из четырех частей, две из которых, скажем, С^ и С^ находятся на поверхностях, где функция S постоянна (и поэтому тепло не передается); вдоль одной из них, скажем, С\ система находится в тепловом контакте с большой системой (называемой тепловым резервуаром) при высокой температуре Т\. Вдоль четвертого участка С% система находится в тепловом контакте с холодным резервуаром при низкой температуре Т2. Пусть Q\ = L· а — полное количество тепла, поглощенного системой на участке С\, a Q2 = — f(-, a — полное количество тепла, излученного ею на участке С2. Тогда Q1 = JClTdS = Τλ JCi dS и Q2 = -T2 JCa dS. Ho = f dS= f dS+ I , J С J С ι J С2 dS, поэтому Q2 T2 Рис. 22.5
1114 Глава 22. Термодинамика Тогда можно написать 0= dU = J ω+ I а= I lu + Q1-Q2. Jc Jc Jc Jc Итак, если W — работа, совершенная самой системой, так что W = -Jcu,to W = Ql(l-T2/Tl). Это известная формула, которую можно найти в любом учебнике. Она определяет работу, совершенную в цикле Карно, между резервуарами с температурами Т2 и Т\. На самом деле Карно утверждал, что это наиболее эффективный способ получить работу за счет этих температур, т. е. эта формула дает максимальное значение работы для любой машины, получающей тепло Q\ при температуре Т\ и выделяющей тепло при температуре Т2. В основе этого факта лежит изменение функции S при необратимых адиабатических процессах. Давайте сформулируем общее утверждение, а определение эффективности работы6 оставим читателю (его можно найти в стандартных учебниках). Если два равновесных состояния σχ и σ2 можно соединить обратимой адиабатической кривой, то (как мы уже знаем) они лежат на одной поверхности S = const, т.е. 5(σι) = S(a2). Предположим, что сначала система находится в равновесном состоянии σ\. Рассмотрим адиабатический процесс, не обязательно обратимый, который переводит систему в равновесное состояние σ2. В этом случае кривая, соединяющая состояния σχ и σ2, может и не лежать в подмножестве равновесных состояний, хотя конечные точки находятся именно там (рис. 22.6). Например, у нас имеется жидкость в термосе, и мы размешиваем ее миксером. Когда размешивание заканчивается, жидкость в термосе переходит в равновесное состояние с другим значением энтропии S. Опыт показывает, что мы не можем вернуться в исходное состояние, если не отвести тепло из такой системы. Тогда (если мы выбрали постоянный множитель такой, что температура Τ положительна) для такой необратимой адиабатической кривой мы 6Другое (не менее распространенное) название — коэффициент полезного действия (КПД). — Прим. ред.
22.4. Системы с одной конфигурационной переменной 1115 Кривые показывают поверхности S = const / — S = S2 Множество состояний равновесия S=S! Рис. 22.6 имеем 5(σι) < 5(σ2). Дадим теперь более строгую формулировку второго закона термодинамики. Если равновесные состояния σχ и σ? могут быть соединены адиабатической кривой (т. е. если в данном процессе замкнутая адиабатическая система может перевести систему из состояния σ\ в σ?), то 5(σι) ^ 5(σ2), причем S(o\) = S(u2), если и только если состояния σ\ и θ2 соединяются обратимой адиабатической кривой. 22.4. Системы с одной конфигурационной переменной В этом параграфе мы рассмотрим важный частный случай, когда система имеет только одну конфигурационную переменную и, следовательно, множество равновесных состояний такой системы двумерно. Будем полагать, что такой переменной будет объем. Соответствующая функция, входящая в выражение формы для работы, — это давление, а работа, совершенная над системой, имеет вид ω = —ρ dV. Тем не менее соображения этого параграфа применимы и ко многим другим физическим системам. Надо только заменить объем соответствующей конфигурационной переменной, а давление —
1116 Глава 22. Термодинамика Таблица 22.1. Системы с одной конфигурационной переменной Система Газ Струна Мембрана Электрическая цепь Магнитный материал Конфигурационная переменная Объем V в м3 Длина L в м Площадь А 9 В MZ Заряд Q в Кл Полный магнитный момент Μ в А/м Обобщенная сила Давление ρ вН/м2 Натяжение Τ вН Поверхностное натяжение S в Н/м Напряжение Ε вВ Магнитное поле Η в А/м2 Форма для работы ω в Дж = Η ■ м ω = — ρ dV u = TdL ω = SdA ω = EdZ ω = μ0ΗάΜ соответствующей «обобщенной силой». В таблице 22.1 приводятся некоторые из важных физических систем. В этом параграфе мы не будем больше говорить о них. Прежде чем начать обсуждение, следует сделать несколько замечаний об истории вопроса и соответствующей литературе. Многие из основных математических понятий, которыми мы пользуемся здесь, такие как «множество», «функция», «многообразие», «координаты», «линейная дифференциальная форма», были введены (в их современной форме) или стали общепринятыми уже после фундаментальных открытий в термодинамике. Более того, большинство героев этой истории (за исключением Кельвина и Гельмгольца) не имели математического образования, или (как Карно) предпочитали не пользоваться математическим языком. В результате вплоть до наших дней в большинстве книг материал излагается языком первоначальных представлений, довольно туманным с математической точки зрения, в котором, однако, используются соотношения между частными производными. Приведем пример. Понятие линейной диффе-
22.4. Системы с одной конфигурационной переменной 1117 ренциальной формы, криволинейный интеграл от нее и вариант теоремы Стокса (на плоскости) были введены Ампером в начале 1920-х годов в серии оригинальных статей, где сочетались новый важный математический аппарат и остроумные физические эксперименты. Более общая версия теоремы Стокса для криволинейного интеграла от 1-формы в трехмерном пространстве впервые появилась в письме, которое Кельвин написал Стоксу в 1850 году. (Через несколько лет Стоке опубликовал эту версию в качестве экзаменационного вопроса.) Тем не менее, в своих статьях по термодинамике Кельвин никогда не использовал теорему Стокса, хотя это значительно упростило бы его доказательства. Итак, мы записали тепло, подведенное к системе, в виде линейной дифференциальной формы а, определенной на многообразии равновесных состояний. Функции Τ и V имеют независимые дифференциалы. Поэтому, если указанное многообразие двумерное, можно использовать Τ и V как локальные координаты и написать a = AvdV + CvdT, (22.1) где Ку и Су — функции на многообразии равновесных состояний. Аналогично, независимы функции ρ и Т, и поэтому они тоже могут быть локальными координатами. Тогда а = Apdp + Cp dT (22.2) где Ар и Ср — две другие функции. (Строго говоря, с исторической точки зрения мы должны использовать эмпирическую температуру θ вместо Т, поскольку мы обсуждаем ситуацию, сложившуюся до открытия второго закона термодинамики. Но тогда, вернувшись к современной трактовке, мы должны были бы переписать все формулы через Т. Поэтому мы решили предоставить читателю самому сделать все эти замены.) Конечно, все четыре функции связаны между собой формулой замены переменных, связанной с переходом от координат V, Τ к координатам р, Т. Скоро мы вернемся к этому вопросу. Соответствующие физические законы, выраженные двумя предыдущими утверждениями, были сформулированы как «доктрина скрытого и явного тепла». Функция Ку была известна как «скрытая теплота по отношению к объему», а функция Су — как «теплоемкость при
1118 Глава 22. Термодинамика постоянном объеме». Аналогично, функция Ар была известна как «скрытая теплота по отношению к давлению», а функция Ср — как «теплоемкость при постоянном давлении». Поясним смысл термина «скрытый». На протяжении длительного времени была путаница между понятиями теплоты и температуры. Ученые думали, что температура тела отражает «полное количество тепла, содержащегося в нем». Это, конечно, бессмыслица, поскольку мы знаем, что форма а не замкнута. Если мы подводим тепло, то температура тела повышается. Но, если тепло подводится при увеличении объема или давления, то оно становится «скрытым» или «латентным». Конечно, уравнения (22.1) и (22.2) дают четкую математическую формулировку этой загадочной физической «доктрине». В пространстве двух измерений многие вычисления сильно упрощаются, потому что если Ωχ и Ω2 — 2-форма и Ω2 φ О, то Ωι = /Ω2, где / — некоторая функция. Другими словами, можно взять «отношение» двух 2-форм и получить функцию, при условии, что знаменатель не равен нулю. Тогда мы пишем / = Ωι/Ω2. В качестве примера рассмотрим функцию a A dp _ aAdV = f' Что это такое? Для любой точки χ пусть £ — вектор, касательный к адиабатической кривой, проходящей через точку х, так что а(£) = 0, а η — некоторый вектор, независимый от ξ, так что α(η) φ 0. Тогда, вычислив формы α Λ φ и α Λ dV на параллел- лограмме, построенном на векторах ζ и η, получаем /(х) = ^ Л j dVW Это уравнение можно переписать как / = (dp/dV) адиабат., где правая часть обозначает отношение линейных дифференциальных форм dp и dV, вычисленных на векторах, касательных к
22.4. Системы с одной конфигурационной переменной 1119 адиабатам. Аналогично, напишем dTAdp _(л ОТ Л dV ~ а,/ изотерм.· Если взять внешнее произведение уравнения (22.2) на dp, то получим a A dp = CpdT A dp, а если взять внешнее произведение (22.1) на dV, то получим aAdV = CvdTA dV. Разделим первое уравнение на второе и получим важный результат (dp/dV) адиабат. = 7 (dp/dV) ИЗотерм., где η = Cp/Cv. (22.3) Если ввести плотность ρ = m/V, то уравнение (22.3) молено записать в виде (ф/^адиабат. = 7(Ф/^Р)изотерм., 1 = Ср/Су- (22.4) Приведем физические и исторические причины важности этого результата. Один из известных выводов, сделанных Ньютоном из его законов, определяет скорость звука в газе с формулой с2 = dp/dp, (22.5) где Ньютон предположил, что ρ и ρ связаны соотношением ρ = Νρ, где N = const, (22.6) т. е. что pV = const. (22.7) Давление, плотность и скорость звука (например, в воздухе) могут быть измерены независимо. И утверждение Ньютона, что с2 = р/р, противоречило экспериментам на протяжении почти ста лет. Было обнаружено, что скорость звука превышала предсказанное формулой Ньютона в 1.4 раза. С другой стороны, эксперименты Гей-Люссака и других показывали, что при постоянной
1120 Глава 22. Термодинамика температуре формула (22.7) верна, но константа в правой части зависит от температуры. Итак, если мы пользуемся независимыми функциями ρ и V в качестве координат на многообразии равновесных состояний, уравнения (22.7) для различных значений постоянной справа являются уравнениями изотерм, и формулу Ньютона можно написать в виде С = (Йр/ор^зотерм. ■ В 1816 году Лаплас высказал идею, что формулу Ньютона следует заменить выражением С2 = (ф/ф)адиабат. = 7(Ф /Ф) изотерм.· (22.8) Его аргументы были чисто физическими: скорость распространения возмущения гораздо больше скорости переноса тепла. Процитируем самого Лапласа: «Истинная скорость звука равна произведению скорости, полученной из формулы Ньютона, на квадратный корень из отношения удельной теплоемкости воздуха при постоянном давлении и различных температурах к удельной теплоемкости при постоянном объеме». Кроме того, Лаплас подчеркивает, что мы можем использовать наблюдаемую скорость звука для экспериментального определения 7· Конечно, если мы знаем 7 и уравнения изотерм, то уравнение (22.3) можно рассматривать как дифференциальное уравнение для адиабатических кривых. Например, для многих газов при низком давлении величина η почти постоянна. (Водород является исключением из этого правила.) Кроме того, уравнение (22.7) верно при постоянных температурах. Если предположить, что (22.7) является уравнением изотерм и 7 постоянна, то из уравнения (22.3) следует, что адиабатические кривые задаются формулой pV1 = const. (22.9) Заметим, что в этом параграфе мы до сих пор не пользовались ни первым, ни вторым законами термодинамики. Мы пользовались только предположением, что множество равновесных состояний двумерно, и что тепло определяется линейной дифференциальной формой, — т. е. «доктриной скрытого и явного тепла».
22.4. Системы с одной конфигурационной переменной 1121 Теперь введем оба закона: первый закон — dU = а — ρ dV и второй закон — а = TdS. Соберем их вместе и получим dU = TdS-pdV. (22.10) Возьмем внешнюю производную от этого уравнения и получим dTAdS = dpAdV. (22.11) Как определить функции Т, S и U из эксперимента, скажем в координатах ρ nV? Чтобы проиллюстрировать метод, предположим, что наблюдаемые изотермы и адиабаты задаются уравнениями (22.7) и (22.9) соответственно. Введем функции t(p,V)=pV (22.12) и а(р, V) = ΡνΊ. (22.13) Тогда изотермы — линии уровня t (22.14) и адиабаты — линии уровня о. (22.15) Поскольку t и Τ имеют одни и те же линии уровня и поскольку их дифференциалы нигде не обращаются в нуль, то функция Τ может быть выражена как функция t, т. е. что Τ = Tit) и T'(t) нигде не обращается в нуль. Точно так же заключаем, что S = S(a). Наша задача — определить Τ(ΐ) и S(a). Далее, из уравнения (22.11) имеем dTAdS = T'{t)S'(a) dtAda = dpA dV. Мы должны использовать явные выражения для t и о как функций от ρ и V, чтобы выразить dt A da через dp A dV. Тогда мы получим, что отношение dpAdV dt A da
1122 Глава 22. Термодинамика является произведением функции от ί и функции от о, и таким образом найдем Т" и S'. Итак, dt Л da = (ρ dV + V dp) Λ (jpV^dV + V1 dp) = (7 - 1)ρνΊ dpAdV = (7 - l)adp Λ dV, откуда dpAdV ! ^^ = [(7^1)a] · Это значит, что Τ'(ΐ)5'(α) = [(7-1)α]-1- В этом уравнении умножим Т" на любую константу А;, а 5' умножим на А:-1. Это отражает тот факт, что абсолютная температура определена с точностью до постоянного множителя. Поэтому без потери общности можно предположить, что Т" = 1 и тогда S'(a) = [(7 — l)a]_1- Следовательно, T = t + T0, 5=(7-l)-1loga + 50, где То и So — константы. Вспомним, что функция S определена именно с точностью до аддитивной константы. Но нам еще надо определить Tq и U. С этой целью подставим их значения в (22.10) и после простых вычислений получим dU = (7 - I)"1 [Т0 d log a + dt]. Вспомним еще один эксперимент — Джоуля-Томпсона, — который показывает, что если газ расширяется адиабатически в вакуум, то его температура при этом практически не изменяется. При таком расширении не совершается работа, и система не получает дополнительное тепло, поэтому внутренняя энергия U не изменяется. Но при этом расширение является необратимым процессом и поэтому увеличивается энтропия S. Это может произойти только при условии, что То = 0. Тогда U = (7 - 1)_1ΐ- (22.16) Конечно, количество внутренней энергии пропорционально полному количеству газа. Это значит, что существует константа, связывающая t с выбором универсальной шкалы температур. Поэтому можно написать t = nRT, (22.17)
22.4. Системы с одной конфигурационной переменной 1123 где η — количество молей газа, и Τ — универсальная температура, измеряемая в кельвинах. (При таком выборе шкалы разность между температурой замерзания и кипения воды равна 100°. Точного соглашения относительно этой шкалы мы не приводим.) Тогда R — постоянный множитель, преобразующий единицы температуры в единицы энергии, называемый газовой постоянной7. Из (22.10) следует, что dU Λ dV = α Λ dV = Cv dT Λ dV. Тогда из (22.16) и (22.17) получаем, что Су = (7 - 1)_1пД является константой. Теперь Ср тоже должна быть постоянной и Cp-Cv = nR. Все перечисленные свойства получены на основании трех предположений, которые определяют идеальный газ: (i) законы Гей-Люссака и Бойля (уравнение (22.7)): pV = nRT; (ii) внутренняя энергия U зависит только от Τ (эксперимент Джоуля); (Hi) 7 — постоянная величина. Давайте теперь соберем вместе наши результаты, но писать их будем для одного моля. Итак, считаем, что η = 1, и дальше пишем ν вместо V, ср вместо Ср и т. д. Тогда получаем Законы идеального газа. • Изотермы — ρν — RT; • адиабаты — ρνΊ = const; 7Численное значение R ~ 8.31 Дж/К. — Прим. ред.
1124 Глава 22. Термодинамика • и = (7 - l)~lRT; • с = (7 - ΐ)_1Λ; • °ρ = [7/(7 - 1)]#, откуда Cp-Cv = R; • s = (7 - l)_1.Rlogpt;7 + s0 = .Rlogv + c^logT + SQ. Для реальных газов можно измерять величины ρ, υ, Τ, а„, Ср и 7· Чтобы измерить Си, газ помещают в стальной сосуд с тонкими стенками, вокруг которого намотана нагревательная спираль. Тепло, подводимое к газу, определяется по известному току, протекающему по обмотке, и измеряется изменение температуры газа. Чтобы измерить Ср, газ пропускают через аналогичный нагревательный элемент при постоянном давлении; измеряется температура втекающего и вытекающего газа. Ниже приводятся результаты этих экспериментов при низком давлении, когда газ ведет себя почти как идеальный. Для всех газов Сц и Ср зависят только от Т, и Ср Cv = ΓΙ. Для одноатомных газов, таких как Не, Ne, Ar, и паров большинства металлов а„ постоянна в широкой области температур Τ и очень близка к 3R/2. Поэтому Ср очень близка к 5R/2. Величина 7 постоянна в широкой области температур Τ и близка к 5/3. Для двухатомных газов, таких как Ог, N2, NO, СО и воздух8, при обычных температурах а„ постоянна и примерно равна 5R/2, Поэтому Ср примерно равна 7R/2, а η тоже постоянна при обычных температурах и примерно равна 7/5. Эта константа уменьшается с ростом температуры. Именно это значение η = 7/5 участвует в рассуждениях Лапласа относительно скорости звука в вохдухе. Истинное значение дробей 3/2, 5/2 и т. д. становится очевидным только в рамках статистической механики. 8который на 98% состоит из двухатомных компонент — азота N2 (75%) и кислорода Ог (23%). — Прим. ред.
22.4. Системы с одной конфигурационной переменной 1125 Для реальных газов можно привести такие же рассуждения, начав с уравнения (22.14). Теперь мы уже не предполагаем, что изотермы и адиабаты задаются уравнениями (22.12) и (22.13), или что 7 ~~ постоянная величина. Но экспериментально можно определить изотермы и значение 7, следовательно, решить уравнение (22.3) (возможно, только численно) и получить адиабаты. После этого можно найти T'(t) и S'(a), что даст возможность получить S, а затем U с помощью уравнения (22.10). Эта информация собиралась на протяжении 150 лет для различных веществ, и теперь она собрана в виде специальных диаграмм. Кроме этого, введены новые функции в дополнение к уже рассмотренным, весьма полезные для определенных задач. Например, энтальпия Н, определяемая уравнением H = U+pV. Объясним, почему эта функция важна для нас. Из уравнения (22.10) следует, что тепло, подведенное к системе при постоянном объеме, равно изменению внутренней энергии U. Но в химических лабораториях гораздо удобнее проводить опыты при постоянном давлении (скажем, при атмосферном давлении) и при этом изменять объем. Дифференцируя определение энтальпии, получаем dH = а + V dp. Поэтому изменение Η определяет количество тепла, подведенного к системе при постоянном давлении. Тогда теплота химической реакции задается изменением энтальпии. Среди различных эмпирических диаграмм особенно полезными являются диаграммы Моллье, на которых ρ и Η — координатные оси, и в этой системе координат изображаются линии уровня S, V и Т. На следующей странице в качестве примера приводится диаграмма Моллье для кислорода. Существуют другие комбинации U, р, V и S, из которых получаются функции, полезные при решении определенных задач. Их обозначения меняются, поэтому здесь мы не будем их описывать. Однако, есть функция, очень полезная для практических целей и имеющая важное теоретическое значение. В последующих параграфах мы будем неоднократно обращаться к ней. То, что будет
ΙιΙί .1 'г щщшшшшт шШШштшш штштшж !»Η88Πβ1ΙΐΚΐί*,ι,ΙΙΒΙΙίιι'''!.'ί Ь?1М|||1!!!!!!Г»ммк::»!«!:; 4n4'iwiji4';:""i!'MM KlMlsSlUlllllMUUi!^ Диаграмма Моллье для кислорода. Если заданы значения любых двух из пяти функций р, V, Я, Т, S, то можно найти точку, в которой достигаются эти значения, как пересечение соответствующих линий уровня. Тогда можно определить значения остальных трех функций диаграммы и функции U из равенства U = Я - pV.
22.4. Системы с одной конфигурационной переменной 1127 сделано здесь, на первый взгляд, может показаться весьма странным, но в рамках статистической механики это будет вполне убедительным. Рассмотрим функцию Планка Y, определенную равенством У = S - {RT)~lU - {RT)-lVV. Чтобы записать эту формулу в более удобной форме, введем β = (ΚΓ)~1, υ = βρ. (22.18) Заметим (например, из уравнений (22.16) и (22.17)), что R — множитель, связывающий энергию и температуру, поэтому размерностью β является обратная энергия, скажем, в единицах (Дж)-1, а размерностью ν — обратный объем, так что β dU и ν dV — безразмерные величины. Предположим, что с самого начала мы включили R в определение температуры Т, чтобы измерять температуру в единицах энергии. Тогда газовая постоянная исчезает. Поскольку размерностью а = Т dS является энергия, и мы измеряем температуру Τ тоже в единицах энергии, то в такой температурной шкале энтропия S становится безразмерной. Тогда S и функция Планка Y = S-fiU-vV (22.19) безразмерные. Комбинируя первый и второй законы термодинамики, уравнение (22.10) можно записать в виде άβ = βάυ + υάν. (22.20) Тогда из формулы (22.19) следует, что dY = ~υάβ-νάν. (22.21) Уравнения типа (22.20) и (22.21) будем интерпретировать следующим образом. Рассмотрим четырехмерное пространство R4 с координатами (β, ί/, U, V). В этом пространстве введем внешнюю 2-форму Q = dfiAdU + ch/AdV. (22.22) Во всем пространстве R4 мы имеем Ω = ά{β dU + ν dV) и n = d(-Udfi-Vdi/).
1128 Глава 22. Термодинамика Двумерное подмногообразие С пространства R4 называется ла- гранжевым, если 2-форма Ω, ограниченная на £, тождественно обращается в нуль. Для любого двумерного подмногообразия пространства R4 величины β и ν можно рассматривать как функции. Если их дифференциалы линейно независимы при ограничении на подмногообразие, то функции β и ν можно использовать в качестве локальных координат. Аналогично, функции U и V можно рассматривать в качестве локальных координат, если их дифференциалы линейно независимы. См. рис. 22.7. Рис. 22.7. Подмногообразие С лагранжево. Проекция на плоскость /?, ν взаимно-однозначна, поэтому можно рассматривать β, ν как локальные координаты на С По той же причине можно в качестве локальных координат на С взять U, V Если подмногообразие С является лагранжевым, то при ограничении на это подмногообразие имеем ά{βάυ + υάν) = 0, и, следовательно, (локально) существует функция S, определенная на С так, что выполняется уравнение (22.20). Аналогично, поскольку при ограничении на подмногообразие С мы имеем d{-Udfi-Vdu) =0, то можно сделать вывод, что (локально) существует такая функция У, что выполняется уравнение (22.21). Таким образом, можно дать общую формулировку для первого и второго законов:
22.4. Системы с одной конфигурационной переменной 1129 многообразие равновесных состояний является лагран- жевым подмногообразием в пространстве с координатами (β,ι/,υ,ν). Продолжим наше математическое рассуждение. Предположим, что мы ввели функции U и V в качестве локальных координат (см. рис. 22.7), и предположим, что мы знаем функцию S. Это означает, что нам задана функция S, явно зависящая от U и V. Если сопоставить равенство dS = {dS/dU) dU + {dS/dV) dV с равенством (22.20), то получим выражения для β и ν через U иК,а именно fi = dS/dU и v = dS/dV. (22.23) Это, конечно, определяет подмногообразие С. Другими словами, если у нас есть диаграмма Моллье в координатах U и V с линиями уровней и значениями только функции S, то можно восстановить С и, следовательно, по крайней мере в принципе, все необходимые термодинамические функции. Вся информация относительно С закодирована в S, если S является функцией U и V. Мы называем S производящей функцией лагранжева подмногообразия С. Аналогично, если в качестве локальных координат взять β и ν и задать У как функцию β и и, то из равенства (22.21) можно восстановить функции U и V в зависимости от β и ν с помощью равенств U = -ΟΥ/Θβ и V = -dY/dv. Таким образом, У — производящая функция С (Заметим, что это дает обратное отображение, выражая β и ν как функции от U и V.) Мы можем проделать то же самое, выбрав в качестве локальных координат другие переменные. Например, можно написать, что на всем пространстве R4 Ω = d{-U άβ + ν dV) и соответственно на С dZ = -υάβ + υάΥ,
изо Глава 22. Термодинамика где функция Массъе Ζ определятся выражением Ζ = S - βϋ. (22.24) Таким образом функция Массье — производящая функция для С в координатах β и V. В уравнении (22.24) закодированы первый и второй законы термодинамики вместе с полным описанием равновесных состояний нашей системы! Когда мы перейдем к изучению равновесной статистической механики, то увидим, что функции S и Ζ являются базисными. Будет дана интерпретация функции S на языке теории вероятностей, из чего станет ясно, что ее значение распространяется далеко за пределы термодинамики. Будет показано, что функция Ζ обеспечивает связь между микроскопической теорией и наблюдаемыми макроскопическими явлениями, т. е. из общей конструкции станет понятно, как модель энергии на атомном или молекулярном уровне приводит к определенному выражению для Ζ как функции от β и V. (Многие технические аспекты станут чисто математической задачей — как вычислять или оценивать это выражение.) И, конечно, мы разовьем теорию так, чтобы она работала для систем с несколькими конфигурационными переменными. Прежде чем переходить к статистической механике, следует еще обсудить ряд идей относительно равновесия. Это будет сделано в следующем параграфе. Но в заключение этого параграфа обратимся к замечанию, сделанному в самом начале. Мы говорили, что многие физически измеряемые величины задаются отношением 2-форм на поверхности равновесных состояний, и показали это на примере двух типов «теплоемкостей». Приведем еще два примера. Коэффициент теплового расширения при постоянном давлении Коэффициент сжимаемости при постоянной температуре dV Adp VdTAdp dV AdT VdTAdp Другие примеры величин и способов обращения с ними мы дадим в задачах к этой главе.
22.5. Условия равновесия 1131 22.5. Условия равновесия Рассмотрим системы с произвольным числом конфигурационных переменных. До сих пор мы определяли функцию S только на многообразии равновесных состояний. Важно отметить, что некоторые функции, например, температура или давление, определяются только на многообразии равновесных состояний. Нет смысла говорить о температуре газа (как целого), если он не находится в равновесии. В свое время было сделано великое открытие — энтропия является функцией, определенной на множестве всех состояний, т.е. существует функция Ent такая, что Ent(p) = S(p), если ρ — равновесное состояние. Здесь мы не будем давать определение Ent, поскольку это потребует описания произвольных состояний системы. Такое определение будет дано, когда мы будем заниматься статистической механикой. Тогда мы напишем явную формулу для Ent, фактически полученную Больцманом. Однако, многие идеи, излагаемые в этом параграфе, принадлежат Клау- зиусу и другим, кто работал до открытия статистической интерпретации. Мы воспользуемся свойством аддитивности энтропии для двух систем, находящихся в контакте. (Сейчас это свойство будем рассматривать как аксиому, но потом оно будет доказано в рамках статистической механики.) Итак, под двумя системами, находящимися в контакте, мы подразумеваем большую систему, построенную из двух меньших, так что состояние большой системы ρ является парой состояний ρ = (pi, р2) отдельных компонент системы, и внутренняя энергия U(p) = U1(p1) + U2(p2). Другими словами, «энергия взаимодействия» пренебрежимо мала по сравнению с суммой индивидуальных энергий. Мы не предполагаем, что контакт только тепловой (рис. 22.8). Например, возможно движение поршня между резервуарами, так что возможен «обмен объемами». Или имеется проницаемая перегородка между системами, так что возможен обмен молекулами газа
1132 Глава 22. Термодинамика Рис. 22.8. Две системы, находящиеся в контакте трех видов. Они могут обмениваться теплом (сверху), веществом (в середине) и объемом (внизу) и т.д. Энтропия составной системы является суммой энтропии составляющих систем, т. е. Ent(p) = Ent(pi) + Ent(p2), если ρ = (pi, p2). Далее мы будем использовать это важное свойство. Если мы функция энтропии определена на множестве всех состояний, то разумно дать более сильную формулировку второго закона термодинамики. Если система адиабатически замкнута, то энтропия любого состояния не может убывать со временем. Более того, энтропия всегда возрастает, если только система уже не находится в равновесном состоянии. Поскольку энергия сохраняется, это приводит к важной характеристике равновесных состояний, наиболее важной в статистической механике. Принцип максимальной энтропии: среди всех состояний с данной внутренней энергией равновесное состояние обладает максимальной энтропией. Принцип минимальной энергии Гиббса: если ρ — равновесное состояние, а σ — другое состояние с той же энтропией, что и р, т.е. Εηί(σ) = Ent(p), то J7(p) ^ U(a).
22.5. Условия равновесия 1133 Чтобы получить правило Гиббса из принципа максимальной энтропии, воспользуемся физическим опытом. Мы всегда можем подводить тепло к системе и поэтому непрерывно увеличивать энергию и энтропию системы, причем это можно делать, не изменяя конфигурационных переменных. Предположим, что ρ — равновесное состояние, и предположим, что (вопреки опыту) есть другое состояние σ в окрестности р, причем Εηί(σ) = Ent(p) и ϋ{σ) < U{ρ). Подводя тепло к системе, мы можем непрерывно увеличивать энергию и энтропию, пока не достигнем нового состояния с той же внутренней энергией, что и р, но большей энтропией, что противоречит принципу максимальной энтропии. Это доказывает принцип Гиббса. Прежде чем пользоваться принципом Гиббса, сделаем ряд предварительных замечаний. Предположим, что /ι, ■·.,/& — функции от конфигурационных переменных системы. Фиксируя значения этих функций, можно получить новую систему. Например, предположим, что две системы, изображенные на рис. 22.8, сначала были разделены, и каждая имела свой поршень. До объединения мы имели систему, которая была просто прямым произведением двух подсистем. Поэтому у нас было четыре конфигурационные переменные: объемы подсистем — V\ и V2, полная масса газа в каждой подсистеме — М\ и М2. (Для упрощения обсуждения предположим, что в подсистемах был одинаковый газ.) Приводя подсистемы в контакт, как показано на рис. 22.8, мы имеем фиксированные полный объем и полную массу. Другими словами, мы наложили ограничения на формы / = const и д = const, где f = V1 + V2 и д = М1+М2, сократив число независимых переменных с четырех до двух. Возьмем некоторую систему и перейдем к новой системе, наложив некоторые ограничения на конфигурационные переменные. Такая система будет иметь собственные равновесные состояния, которые характеризуются максимумом энтропии и минимумом внутренней энергии, но, конечно, по отношению к более ограниченному классу состояний, т. е. тех, что удовлетворяют ограничениям. Предположим, что нам задано подмножество М. состояний исходной системы (без ограничений), которое содержит все ее
1134 Глава 22. Термодинамика равновесные состояния, и предположим, что Л4 — многообразие. Кроме того, предположим, что функция Ent и ограничивающие функции /ι,..., /fe дифференцируемы на Л4. Пусть ρ — равновесное состояние системы с ограничениями, в которой функции fs постоянные. Согласно принципу Гиббса, функция U должна иметь локальный минимум в состоянии ρ при условии, что Ent = const, /ι = const, ..., fk = const. Воспользуемся методом множителей Лагранжа. Существуют функции Ао, Αχ,..., Afe, для которых dU = Ао d Ent + Αι d/ι + · · · + Afe dfk. (22.25) Например, в случае системы, изображенной на рис. 22.8, многообразие М. должно быть парой равновесных состояний отдельных систем, когда они не контактируют друг с другом. Каждая подсистема в отдельности имеет конфигурационные переменные V и М. Тогда для двух подсистем имеем dUi = Τι dSi - pi dVi + μι άΜλ и dU2 = Т2 dS2 - р2 dV2 + μ2 dM2. Коэффициент μ при dM называется «химическим потенциалом». Многообразие Л4 шестимерное, поскольку множество равновесных состояний каждой подсистемы трехмерное. Мы предполагаем, что U = J7i + U2. Свойство аддитивности энтропии означает, что Ent = 5i + S2. Тогда dU = Τι dSi + Τ2 dS2 - pi dVx - p2 dV2 + μλ dMx + μ2 dM2. Из условия (22.25) следует, что dU = A0(d5i + dS2) + X^dVi + dV2) + \2{dMi + dM2), поскольку V\ + V2 и M\ + M2 — ограничивающие функции.
22.5. Условия равновесия 1135 Дифференциалы, стоящие в правой части этих двух равенств, независимы на многообразии Л4, поэтому мы имеем Т\ = т2, pi = р2> μι = μ2· Таким образом, давление, температура и химические потенциалы должны быть равны. Очевидно, что это утверждение обобщается на случай нескольких систем, находящихся в контакте, когда каждая подсистема может содержать смесь разного количества разных веществ. Поэтому, если выражение для внутренней энергии на множестве равновесных состояний каждой отдельной системы имеет вид dUi = TidSi - PidVi + μΐ Μ? + μ\ аМъ{ + ■ ■ ■ , то получаем условия равновесия объединенной системы Τι = Т2 = · ■ · , Pi = Р2 = · · · , и т.д. Эти равенства являются общими условиями равновесия. Они дают нам возможность почувствовать, что такое «интенсивные переменные»: Τ, ρ, μ и т.д. В качестве примера рассмотрим газ, состоящий только из одного вещества. Каждый участок такого газа можно рассматривать как подсистему. Если каждая такая подсистема, взятая в отдельности, находится в состоянии равновесия, то мы имеем для нее определенные значения Τ, ρ и μ. Другими словами, мы считаем, что Т,ри μ являются функциями в трехмерном пространстве, которые каждой точке приписывают значения температуры, давления и химического потенциала в небольшой окрестности этой точки. Условие того, что газ как целое находится в состоянии равновесия, состоит в том, что эти функции должны быть постоянными по всему объему газа. Тогда газ как целое, скажем, (22.26)
1136 Глава 22. Термодинамика с постоянной полной массой имеет только одну конфигурационную степень свободы V. Мы можем использовать ρ и Τ в качестве координат двумерного пространства равновесных состояний газа как целого. Это означает, что величина μ выражается как функция координат ρ и Т. Тогда для газа, состоящего из одного вещества, находящегося в состоянии равновесия, химический потенциал μ — это некоторая определенная функция от ρ и Т, т. е. β — 1^газ{р,Т). Предположим, что это вещество может находиться и в жидкой фазе. Для жидкости в состоянии равновесия мы получим другую функцию μ = ^Жидк.(р,7")· А теперь рассмотрим комбинированную систему, состоящую из газа и жидкости одного вещества. По отдельности газ и жидкость находятся в состоянии равновесия. Предположим, что эта система, как целое, тоже находится в равновесии. Тогда из условий (22.26) следует, что Ржидк. = Ргаз: -^жидк. — -'газ) /^жидк. = /^газ· Если риТ обозначают общие значения для первых двух условий, то третье условие принимает вид ^жиДк.(р,Т) = μΓ33(ρ,Τ). Поскольку, как правило, /4ЖиДк. и μΓ£β — независимые функции от ρ и Т, то последнее равенство определяет кривую на плоскости р, Т. Другими словами, жидкая и газообразная фаза одного и того же вещества могут находиться в равновесии только при определенном соотношении между температурой и давлением. Если имеются три фазы одного вещества, скажем, газ, жидкость и твердая фаза, то условия равновесия в такой системе имеют вид ЦтверЯХР,Т) = ^жидк.(Р,Т) = μΓ33(ρ,Τ). Тогда решением этих уравнений будет так называемая тройная точка с определенным значением температуры и давления. И наконец, четыре фазы одного вещества не могут находиться в равновесии. Именно так Гиббс получил свое знаменитое правило фаз. Оно (как и его обобщения) содержится в условиях (22.26), которые являются прямым следствием равенства (22.25) — принципа минимальной энергии Гиббса.
22.6. Системы и состояния в статистической механике 1137 22.6. Системы и состояния в статистической механике В этом параграфе мы займемся микроскопическими теориями, которые могут послужить моделью для термодинамики. Начнем с классической статистической механики, в рамках которой «состояние» определяется как «мера вероятности» определенного рода, и энтропией состояния будет «количеством беспорядка этого состояния». Математические основы теории вероятностей были заложены в первой трети XX века, главным образом, Боре- лем, Лебегом и Колмогоровым. Это произошло гораздо позднее появления фундаментальных идей статистической механики, выдвинутых Больцманом и Гиббсом. Таким образом, и здесь возник коммуникационный барьер. Языком теории вероятностей является теория меры. Мы будем пользоваться этим языком, не вдаваясь глубоко в саму теорию. Для любого серьезного результата теории вероятностей, связанного с бесконечным числом возможностей, существенно использование всего аппарата теории меры. Поскольку мы будем рассматривать наиболее простые факты, то пользоваться будем только самыми простыми понятиями, смысл которых станет ясным на конкретных примерах. Измеримое пространство — это множество Μ вместе с семейством Л подмножеств этого множества. Мера μ задает правило, согласно которому каждому множеству А семейства Л ставится в соответствие неотрицательное число (или +оо) μ(Α). Для семейства Л и меры μ существует ряд аксиом, на которые мы не будем здесь отвлекаться. (Для нас существенно, что Л — замкнутое семейство относительно счетного объединения, пересечения и дополнения9, и что μ([]Αί) = Ύ^μ{Αι) для любого счетного объединения непересекающихся множеств Ai.) Мы не рассматриваем набор всех подмножеств М, чтобы избежать противоречий, возникающих при рассмотрении сильно патологических множеств. В большинстве случаев мы здесь рассматриваем очень простые множества М. Например, пусть Μ — конечное множество, и пусть семейство Л будет семейством всех подмножеств М. Тогда множества, состоящие из одной точки М, тоже будут входить 9Такое семейство множеств принято называть σ-алгеброй. — Прим. ред.
1138 Глава 22. Термодинамика в наше семейство, и каждому такому множеству {т} приписывается неотрицательное число μ({πι}). Зная эти числа, можно восстановить меру μ, поскольку μ(Λ) = Σ MM)- т£А Если / — произвольная (вещественная или векторная) функция на М, то можно определить «интеграл по мере μ» в виде ίίμ= Ε /МММ)· J тем (Это такая же договоренность, которая была сделана в теории электрических цепей.) В качестве Μ можно было бы взять Ъ — множество всех целых чисел, или N — множество всех неотрицательных целых чисел. А в качестве Л можно было бы взять семейство, состоящее из всех подмножеств. Определение меры означает задание неотрицательного числа для каждого целого числа (в случае Ζ) или для каждого неотрицательного целого числа (в случае Ν). Тогда мы получили бы такое же выражение для μ(Α), как и раньше, но сумма справа в этом случае будет бесконечной, которая может сходиться, а может и нет. Если она сходится, то μ(Α) равно пределу суммы; если же она расходится, то μ(Α) = +оо.10 То же самое происходит и для функции /, для которой мы определяем интеграл / j μ в виде суммы. Сумма теперь становится бесконечным рядом. Мы говорим, что функция / интегрируема, если ряд сходится абсолютно, и тогда f j μ определяется как сумма этого ряда. В противном случае J j μ не имеет смысла. В качестве Μ можно взять вещественную прямую R. Тогда семейство Л должно содержать все отрезки [а, Ь] = {χ \ α ^ χ ^ Ь}. Обычная мера (Лебега) каждому отрезку приписывает его длину μ([α, Ь]) = Ъ — а. 10Легко видеть, что если J2n м({™}) ~ сходящийся ряд (для η Ε Ζ или η 6 Ν), то мера всякого множества конечна и не превосходит суммы ряда. — Прим. ред.
22.6. Системы и состояния в статистической механике 1139 Если / — произвольная кусочно-непрерывная функция, достаточно быстро стремящаяся к нулю на бесконечности, то мы знаем, как вычислять интеграл11 / /μ = / f(x) dx. Аппарат теории меры предназначен для построения достаточно богатого класса семейств Л, на которых определена мера μ, и достаточно широкого класса функций, интегралы от которых определены. Мы будем рассматривать достаточно простые множества функций, и поэтому нам не придется вдаваться в детали теории меры. Как мы уже говорили, необходимо задействовать весь аппарат теории меры, если заниматься глубокими проблемами. Вероятностная мера приписывает значение 1 самому множеству М, т.е. μ(Μ) = 1. Это соответствует принятому в теории условию, что «вероятности» принимают значения от 0 до 1. Фундаментальное понятое «системы» в статистической механике — это пространство с мерой. Множество М, семейство Л и мера μ заданы нам физикой или геометрией задачи. В общем случае мера μ не будет вероятностной мерой. Она играет роль «априорного состояния знания» системы. Покажем это на нескольких примерах. А. Пространство конечной выборки с равной априорной вероятностью. Это простейший пример. Μ — конечное множество, Л — семейство всех подмножеств М. В этом случае μ{{τη}) = 1 пв смысле Римана. Интеграл Лебега численно с ним совпадает, но определен для значительно более широкого класса функций (в том числе таких всюду разрывных, как функция Дирихле, равная 1 в рациональных точках и О в иррациональных), и процедура его вычисления существенно отличается от римановых сумм, поскольку разбивается не область определения функции, а область значений. Для вещественной функции / интеграл / /μ по мере Лебега μ = dx (или другой мере μ) равен пределу при h —-> 0 сумм вида Σνιμ{{Χ I Уг < f(x) < Уг+l}), iez где {j/i}tez — такое разбиение области значений /, что 0 < j/i+i — yi < h. — Прим. ред.
1140 Глава 22. Термодинамика для каждого т G М. Так описывается ситуация, когда есть конечное число возможностей, и у нас нет оснований предпочесть одну возможность другой. В. Μ — вещественная прямая Ш со стандартным семейством измеримых множеств и мерой Лебега μ. Тогда μ([α, b\) = b—а для любого отрезка [а, Ь]. Мера μ показывает «априорную вероятность» отрезка, пропорциональную его длине. Конечно, μ не является вероятностной мерой, потому что μ(Κ) = оо. Заметим, что если ρ — произвольная интегрируемая функция, для которой /оо р(х) dx = 1, -оо то р определяет вероятностную меру ρ dx на множестве Ш, где /оо р(х) dx. -оо Таким образом, мера μ(= dx) определяет выделенный класс вероятностных мер на множестве R. (На языке теории меры это класс тех вероятностных мер, которые абсолютно непрерывны по dx. He все вероятностные меры на R обладают этим свойством. Например, рассмотрим вероятностную меру Р, которая приписывает значения Р({0}) = 1/2, Р({1}) = 1/2 и Р(А) = 0, если {0,1} П А = 0. Тогда Ρ обозначает вероятность в случае, когда достигаются точки либо 0, либо 1, причем их шансы одинаковы. При этом очевидно, что Ρ не представляется12 мерой вида pdx.) Для любой меры μ на измеримом пространстве и для любой интегрируемой неотрицательной функции ρ мы получаем новую меру, которую обозначаем ρ μ, положив РКА) = / Ρ/*· J А Здесь следует ввести общее Определение: пусть (Μ, Λ, μ) — пространство с мерой. Состояние (статистическое) (Μ, Λ, μ) — это вероятностная мера в пространстве Μ вида ρμ, где ρ ^ 0 — интегрируемая функция. Другими словами, состояние соответствует такой интегрируемой функции р, для которой J ρμ = 1. 12если не рассматривать обобщенных функций. — Прим. ред.
22.6. Системы и состояния в статистической механике 1141 C. Пусть Μ = Ш и μ = Η(·) dx, где Η (χ) = О при х ^ О и Н(х) = 1 при χ > О.13 Это соответствует ситуации, когда мы уверены, что данное вещественное число положительное, причем все положительные числа равновероятны. Конечно, можно с тем же успехом взять Μ = Ш+ = {χ | χ > 0}, поскольку здесь сконцентрирована мера μ. D. Число заполнения для классических частиц. В этом случае Μ = N = {0,1,2,3,... } и μ({Α:}) = l/k\. Мера μ приписывает вес l/k\ вероятности к частицам находиться в ящике. Объясним, почему это подходящая мера. Предположим, что у нас есть некоторое количество ящиков η и несколько частиц N. Число способов размещения частиц по ящикам, так чтобы &ι частиц попали в первый ящик, &2 — во второй и т. д. равно Ν) Λι!Λ2!..·*η!' (Конечно, здесь частицы предполагаются «различимыми»: обмен парой частиц между разными ящиками изменяет способ размещения частиц. Существует N\ различных перестановок частиц, но мы должны разделить это число на к\\... кп\, потому что перестановка частиц внутри каждого ящика не дает новый способ их размещения.) Если нам не известны числа N и п, то лучшее, что мы можем сказать, — это что число способов размещения частиц так, чтобы в первом ящике было к\ частиц, пропорционально l/ki\.li Это и есть наше априорное знание относительных вероятностей. E. Число заполнения для частиц Ферми-Дирака. В этом случае в каждый ящик можно поместить только одну частицу. Тогда Μ = {0,1} и μ({0}) = μ({1}) = 1. Это, конечно, частный случай примера А. Мы также могли бы взять Μ = N = неотрицательным целым числам, причем μ({0}) = μ({1}) = 1 и 13Указанная функция Η называется функцией Хевисайда. Она является первообразной для обобщенной дельта-функции Дирака (сосредоточенной в нуле). — Прим. ред. 14Данное утверждение справедливо лишь при N < п, в противном случае самым вероятным числом частиц в ящике будет ближайшее целое к Ν/η. — Прим. ред.
1142 Глава 22. Термодинамика μ({&}) = 0 для всех к > 1. В этой схеме заполнения отражен «принцип запрета». В одном ящике не может быть больше одной частицы. Наличие частицы в ящике или ее отсутствие априорно рассматриваются как равновероятные события15. Конечно, в реальной интерпретации ящик может быть достаточно абстрактным. Например, это может быть квантовое состояние одной частицы для частиц, подчиняющихся принципу запрета Паули. F. Число заполнения для частиц Бозе-Эйнштейна. Здесь Μ = N = {0,1, 2,3,... } и μ({Α:}) = 1. Любое число частиц в ящике может быть обнаружено с одинаковой вероятностью. Если, например, частица — это возмущение среды (пятно на экране) и две частицы представляют возмущение двойной интенсивости, то при распределении N «единиц возмущения» по η «ящикам» надо учесть, что «частицы» «не различимы» в том смысле, что все их распределения равновероятны. Таким образом априори мера, приписываемая наличию к\ частиц в первом ящике, равна 1. В квантовой механике все частицы делятся на два класса: частицы Ферми-Дирака и частицы Бозе-Эйнштейна. Частицы Ферми-Дирака (электроны, протоны, нейтроны и т.д.) называются фермионами, а частицы Бозе-Эйнштейна (фотоны, пионы и т.д.) назывются бозонами. G. Биномиальная мера. Предположим, что у нас есть большое число N частиц, каждая из которых может быть в двух положениях — «вверх» или «вниз». Причем состояние их совокупности описывается только полным числом частиц в положении «вверх» минус полное число частиц в положении «вниз». Тогда Μ = {—Ν, —Ν + 2,..., Ν — 2, Ν}. Для простоты предположим, что N — четное число. Тогда число частиц в положении «вверх» минус число частиц в положении «вниз» равняется 2т, когда (Ν/2) + т частиц находятся в положении «вверх», a (N/2) — m частиц — в положении вниз. Число способов сделать это равно \Ν/2 + т) ' (Ν/2 + m)! {N/2 - m)!' при условии, что мы не знаем отношение числа частиц к числу ящиков. То же относится и к следующему примеру. — Прим. ред.
22.6. Системы и состояния в статистической механике 1143 Если нам интересно знать относительную частоту появления 2т, надо разделить на самый большой биномиальный коэффи- (Ν \ циент Ι Νι 1 и тогда и({2т\) =(N )(N )= И* №"4) \N/2 + mJ\N/2j (Ν/2 + т)\ (Ν/2 - m)V Использование формулы Стирлинга Ν\ = λ/2τγΝ ■ NNe~N показывает, что для больших чисел N последнее выражение очень хорошо аппроксимируется функцией e_2m 'N. На этом основан следующий пример. Н. Дискретная гауссова мера. Пусть Μ = Ζ — множество всех целых чисел и ММ) = е-2™2/" Заметим, что когда т = y/N/2, значение μ({πι}) равняется к ε~1μ({0}). Предположим, что мы хотим знать величину m/N, т.е. что каждое состояние «вверх» или «вниз» дает вклад ±1/N в измеряемую величину. Тогда функция m/N имеет очень острый пик в окрестности 0 для больших чисел N. Например, если Ν ~ 1024, то μ({πι}) уменьшается в е раз, когда m/N сдвигается от О на величину Ю-12. Чтобы «увидеть» распределение, мы должны изменить масштаб множителем iV1/2, и не N. Если взять Xk = 2&/./V1/2, то ь 2, M{a^fc^}) = Ee"V2 Сумма справа растет приблизительно как iV1'2. Действительно, если разделить это выражение на (2πΝ)~1'2, то правая часть стремится к *' e-x2'2dx. 1 Г V2^ Jа Тем самым мы подошли к следующему примеру. Ι. Μ = Ш и μ — (нормированная) непрерывная гауссова мера гь ММ]) = 4= / e-x2'2dx. V 2π Jа
1144 Глава 22. Термодинамика J. В качестве последнего примера рассмотрим классическую механику. В этом случае пространство Μ — фазовое пространство механической системы. Фазовое пространство имеет выделенные координаты (канонические координаты) q, ρ и выделенную меру (мера Лиувилля) μ = dp dq. Например, точечная классическая частица движется в пространстве R3. Координаты q\, (72, (73 описывают ее положение, а координаты pi, P2, Рз задают ее импульс. Тогда Μ = К6 и dp dq = dpi dp2 dpz dq\ dq2 dqz, т. е. пространство R6 с обычной мерой. 22.7. Произведения и образы В этом параграфе мы обсудим различные способы построения систем. Сначала обсудим понятие произведения. Предположим, что у нас есть две системы (Μι, Αι, μι) и (Мг, Αι, Ц2)· Можно образовать их произведение {М\ χ Μι, Αι х Αι, μι х μ2)· Например, пусть (М\,Αι,μι) и (Μ2,Α2,μ2) — системы, описанные в примере Ε предыдущего параграфа, т. е. они представляют возможное число частиц в ящике (см. рис. 22.9). Тогда (Μι χ Мг, Αι х Лг, μι х /^) представляет систему, состоящую из двух ящиков, соединенных вместе (см. рис. 22.10). Мера μι χ μ2 характеризуется выражением (μι х μ2)(Αι χ Α2) = μι(Αι)μ2(Α2) для произведений множеств А = Αι χ Аг, где Αι £ Ai, г = 1,2.16 Конечно, состояние р системы-произведения не обязано иметь 16 Семейство измеримых подмножеств Αι Χ Αι произведения измеримых пространств (Μι, Αι) и (Мг,^) состоит из счетных объединений «прямоугольных» множеств вида Αι χ Лг, где Л, € Ai, т.е. является пополнением семейства {Αι Χ Лг} до σ-алгебры. Произведение мер μι χ β2 определяется предыдущим равенством и свойством аддитивности. — Прим. ред.
22.7. Произведения и образы 1145 Мл © Θ м2 Рис. 22.9. μ{{Η}) = i, μ{{1}) = ± Μ ! Χ Λ'/2 Θ Θ Рис. 22.10. (μιχμ2)(Μ) = ^7]Τ вид pi χ ρ2· Если же это состояние типа ρ = pi x ρ2, то соответствующая вероятностная мера (ρι χ Рг)(д1 х μ2) = Ριμι χ Р2Ц2 на множестве Μχ χ Мг тоже является произведением мер. Это означает, что событиям в пространствах М\ и Мг приписываются независимые вероятности. Можно построить произведение любого17 количества систем (Μι,Αϊ,μΐ), где г пробегает произвольное множество индексов I. Другой способ построения системы использует отображение. Пусть (Μ, Α, μ) — одна система, и (Ν, В) — измеримое пространство, т. е. N — множество с выделенным классом подмножеств. Пусть / : Μ —> N — отображение. Предположим, что для каждого В G В подмножество f~1(B) множества Μ принадлежит семейству Л.18 Тогда можно определить правило /*μ, согласно которому каждому В е В приписывается значение ίφ{Β) = μ{ΓλΒ). 17 В принципе число сомножителей может быть бесконечным, но к определению измеримых множеств произведения в этом случае необходим более осторожный подход. — Прим. ред. 18Тогда отображение / называется измеримым. В частности, измеримы относительно обычной меры все кусочно-непрерывные отображения евклидовых пространств. — Прим. ред.
1146 Глава 22. Термодинамика © © А*! х М2 Рис. 22.11 Если функция /*μ на множествах из В является мерой, то она называется переносом19 меры μ при отображении /. Тогда мы имеем новую систему (Ν, В, /*μ), называемую образом системы (Μ,Λ,μ)- Например, начнем с произведения Μ = Μχ χ Мг двух систем из того же примера Е. Пусть N — это большой ящик, из которого удалили перегородку (см. рис. 22.11). Тогда отображение / задается формулой f((k,l)) = k + l. Таким образом, при отображении / игнорируется то, что в ящике слева находится к частиц, а в ящике справа — / частиц. Оно оставляет только информацию, что в большом ящике находятся к + / частиц. Тогда для любого положительного целого числа s можно написать k+l=s k+l=s Откуда (/.**)({*}) = S! Оба способа построения — с помощью произведения или с помощью отображения — в данном случае становятся интуитивно более понятными, если немного изменить пример Е. Давайте определим систему, соответствующую ящику с объемом V, положив 19В оригинале pushforward, т.е. движение вперед. Действительно, в отличие от переноса дифференциальной формы (ptdlback, см. примечание на с. 291 в томе I), при этой операции область определения меры перемещается в том же направлении, что и точки при отображении. — Прим. ред.
22.7. Произведения и образы 1147 Рис. 22.12. μνι({Λ}) = ^, μν2№) = ^ © © V'2 Рис. 22.13. μνι х /*v2({M}) = MVl χ MV2 k\l\ Vx+V2 Λ/vj+Vj Рис. 22.14 Тогда если рассмотреть две системы, соответствующие ящикам с объемами V\ и V2 (см. рис. 22.12), то Μγλ х Му2 соответствует рассмотрению двух ящиков вместе (см. рис. 22.13). Уберем теперь перегородку и рассмотрим ящик с объемом V1+V2 (см· Рис· 22.14). Опять положим N = Μγ1+ν2 и определим отображение / : Мух χ Μγ2 -> N формулой f((k, l)) = k + l. Тогда (M({s})= Σ vfv} k+l=s k\l\ I V —VkVl k+l=s (У1 + V2)s s\
1148 Глава 22. Термодинамика Вернемся к рассмотрению общего случая. Пусть (Μ, Λ, μ) — система, и отображение F : Μ —> N дает нам образ системы (Ν,Β,/*μ). Если σ — произвольное состояние из (Ν,Β,/*μ), то функция /V = σο/ определяет состояние из (Μ,Λ,μ). Действительно, /*σ ^ 0, тогда из определения интеграла следует, что / /*σμ = / σ(/*μ) = 1· Таким образом, состояния, определенные на множестве Ν, задают состояния, определенные на множестве М. Состояние ρ на множестве Μ также определяет состояние /*р на множестве Ν, но это определение лежит значительно глубже. Давайте сначала рассмотрим пример. Рассмотрим пространство М\ = Ш2 со стандартными семейством измеримых множеств Л и мерой μ(= dxdy). Пусть отображение / : R2 —> Ш+ задано формулой f(x,y) = (х2 + у2)1'2. Тогда /*μ = 2irrdr. Пусть р(х,у) — произвольная непрерывная функция на плоскости, удовлетворяющая условию f ρ dxdy = 1. Тогда ρ является состоянием. Определим состояние /*р условием 1 ί2π f*p{r) = —- / p(r cos θ, r sin θ) άθ. Таким образом, f*p(r) — состояние, «усредненное» по окружности с радиусом г, т.е. среднее от ρ по /_1 (г). Тогда /· /·οο / {ί*Ρ)μ= / (/*p)(r)27rrdr ./R+ ./О рос ρ2π = / p{r cos б, r sin θ) dr άθ Jo Jo /oo /·οο / p(x,y)dxdy = 1. -oo J—oo Отсюда следует, что /*р — состояние, определенное на множестве JV. Заметим, что /*/*σ = σ, но, вообще говоря, /*/*р не обязано быть равным р. В общем случае, когда ρ — состояние, определенное на множестве Μ, ρμ является вероятностной мерой на Μ.
22.7. Наблюдаемые, ожидания и внутренняя энергия 1149 Поэтому /*(ρμ) — вероятностная мера на множестве N. Кроме того, если В G В — любое множество, удовлетворяющее условию СМ(В) = 0, то μ(Γ\Β)) = 0, и, следовательно, (Μρμ))(Β) = {ρμΚΓ^Β)) = ί ρμ = 0. Jb Итак, равенство (/*μ)(Β) = 0 означает, что /*(ρμ)(.Β) = 0. Теорема из теории меры, называемая теоремой Радона-Никодима, утверждает, что если ν\ и ν-ι — Две меры такие, что для всех В из v2{B) = 0 следует, что v\(B) = 0, то существует такая функция σ, для которой v\(B) = JB σι*2· Если взять V\ = /*(ρμ) и υ2 — /*μ, то мы приходим к заключению, что существует неотрицательная интегрируемая функция σ, определенная на множестве Ν, для которой справедливо равенство (Μρμ))(Β)= ( ρ{ίφ) Jb для любых В. Из того, что /*(ρμ) — вероятностная мера, следует / σ(Μ = 1- Jb Тогда σ — состояние, определенное на множестве (JV, В, /*μ), и мы получаем Up = σ. 22.8. Наблюдаемые, ожидаемые значения и внутренняя энергия Частным случаем отображений является обычная функция с численными значениями / : Μ —> Ш. Такое отображение называется наблюдаемым для данной системы. Грубо говоря, наблюдаемая величина какой-то системы — это просто численное свойство
1150 Глава 22. Термодинамика системы, которое можно измерить. Обсуждая чисто теоретические вопросы, будем обозначать наблюдаемое буквой J. Конкретные наблюдаемые, когда они будут появляться, обозначаются буквами, отражающими их физический смысл. Конечно, как часть нашего определения наблюдаемого, мы предполагаем, что J~1([a,b]) принадлежит семейству А для каждого отрезка [о, Ь] на вещественной прямой, т. е. предполагается измеримость отображения J. Пусть J — наблюдаемое и ρ — состояние. Для каждого отрезка [а, Ь\ можно рассмотреть подмножество J_1([a, Ь]) множества М, и тогда интеграл / ρμ Jj-1([a,b]) есть как раз размер множества J~l([a,Ь}) по отношению к вероятностной мере ρμ. Другими словами, это есть вероятность того, что точка множества Μ лежит в J_1([a, Ь]), когда мы приписываем вероятности в соответствии с вероятностной мерой ρμ. То же самое можно сказать по-другому: это есть вероятность того, что наблюдаемое J принимает значения на отрезке [а, Ъ], когда мы приписываем вероятности на множестве Μ согласно вероятностной мере ρ μ. Запишем это утверждение в следующем виде. Prob(J G [а,Ь], когда система находится в состоянии P) = Jj-i([a,b])^> или короче Prob(Je [а,Ь];р) = Ι ρμ. (22.27) Λ/-ΐ([α,ί>]) Таким образом, наблюдаемое и состояние вместе приписывают значение вероятности на вещественной прямой. Вероятность, приписанная любому отрезку, есть вероятность измерения наблюдаемой J на этом отрезке, когда система находится в состоянии р; она задается предыдущей формулой. В теории вероятностей существует язык, который мы будем здесь использовать. Интеграл 3ρμ /
22.8. Наблюдаемые, ожидания и внутренняя энергия 1151 называется математическим ожиданием или ожидаемым значением функции J по отношению к вероятностной мере ρμ. Это есть среднее значение J, когда вес подмножеств множества Μ берется в соответствии с вероятностной мерой ρμ. Таким образом, ожидаемое значение J в состоянии ρ определяется интегралом E{J- p)= Ι 3ρμ. (22.28) Jm Приведем пример. Пусть Μ — фазовое пространство классической частицы, так что Μ = R6 с координатами q\, q2, (?з> Pi, р2, Рз и стандартной мерой. Пусть J — это функция энергии, равная сумме кинетической и потенциальной энергий, так что J = Я = К + V, т. е. H(qi,q2,q3,Pl,P2,P3) = ^{р\ + р\ + Рз) + V(?i, £>, Яз), где К — кинетическая энергия К= \(р1+р1+Рз) и V — потенциальная энергия. В этом случае состояние — это неотрицательная функция р, определенная на пространстве R6, интеграл от которой по всему пространству равен 1. По определению Е{Н;р)= Hpdqidq2dq3dpidp2dp3. (22.29) Предположим, что мы хотим рассмотреть энергию «свободной частицы, помещенной в ящик В с объемом V». Это можно сделать, предположив соответствующую форму потенциала V. Пусть V равняется 0, когда точка (gi, q2, <?з) лежит внутри ящика В, и V становится чрезвычайно большим за пределами ящика. Таким образом, предполагается, что частица должна преодолеть очень высокий барьер, чтобы вылететь из ящика. Выбранный потенциал внесем в выражение для Η в формуле (22.29). Предположим теперь, что состояние ρ таково, что оно приписывает пренебрежимо малую вероятность очень большим значениям
1152 Глава 22. Термодинамика энергии, т. е. предположим, что Prob(ii > Ε; ρ) практически равна нулю для очень больших Е. Чтобы быть совсем точными, давайте предположим, что приписываемое значение вероятности настолько мало, что при вычислении интеграла (22.29) можно пренебречь вкладом от точек (<?ъ (?2> 9з)> лежащих за пределами ящика. Внутри ящика V = 0, и интеграл принимает вид / «(Pi +Р2 +Pl)p(Qi,Q2,q3,Pi,P2,P3)dqidq2dq3dpldp2dp3. JBxR3 * (22.30) Чтобы двигаться дальше, необходимо иметь больше информации о состоянии р. Например, предположим, что когда частица находится в ящике, то она с одинаковой вероятностью находится в любой его точке, т. е. ρ не зависит от координат положения (<7ъ<72>9з), а зависит только от (рьР2)Рз)- Тогда интеграл (22.30) принимает вид V [ 1:(р1+р1+р1)р(РиР2,Рг)ар1ар2арз. (22.31) Далее предположим, что в состоянии ρ распределение скоростей частицы задается так называемым распределением Максвелла с параметром β, τ. е. что р(рьР2,Рз) = Ρβ1*Μ-β{ρΙ +р1 + р§)/2]. где Fp — нормировочная константа, зависящая от β. Мы должны теперь выбрать Fp так, чтобы полный интеграл fM ρμ = 1, т.е. мы должны взять Fp = JM ρμ, что составляет Fp = ν(2πβ)~3/2. Тогда формула (22.31) принимает вид (/?/2тг)3/2 1\(р1+Р22+ ΡΪ) ехр[-/?(р? + р\ + р23)/2] dPi dp2 dpz. Это гауссов интеграл, значением которого является (3/2)/?-1. Тогда, с учетом всех сделанных предположений, мы имеем Ε(Η;ρ) = (3/2)β-1.
22.8. Наблюдаемые, ожидания и внутренняя энергия 1153 Как это следует понимать? С точки зрения математики, формулы (22.29)-(22.31) представляют чисто интегральные выражения. Это стандартные процедуры математической теории вероятностей. С точки зрения кинетической теории газов, рассматривается огромное количество молекул газа, заключенных в ящик и не взаимодействующих друг с другом20. Тогда p(gi, 92,93,РьР2,Рз) определяет относительную частоту появления молекул газа в окрестности точки ((?1,(72>93,Р1,Р2,Рз) фазового пространства. В такой интерпретации процедура усреднения, входящая в определение Е(Н; р), есть усреднение по молекулам газа, и тогда можно сказать, что Е(Н; р) — средняя энергия, приходящаяся на одну молекулу газа. Понадобился гений Гиббса, чтобы осознать, что не следует связывать себя такой интерпретацией. Мы вполне можем исследовать систему, состоящую из одной молекулы в ящике. Теория вероятностей применима и в этом случае, вся математика остается без изменения. Выбрав некоторое состояние р, мы рассматриваем вероятность энергии принимать определенные значения в любом интервале или вероятность нахождения частицы в определенной области фазового пространства. Конечно, если мы захотим исследовать более глубокие проблемы, то нам придется изучить общий смысл термина «вероятность» на более высоком уровне. К сожалению, несмотря на то, что математическое обоснование теории вероятностей было сделано более пятидесяти лет назад, нельзя сказать то же самое о ее философской интерпретации. Когда пишется эта книга (1987 год), все еще существуют серьезные разногласия относительно «истинного» смысла вероятности. Сторонники одной крайности — «частотники» — ограничивают область применения вероятности только ситуациями, когда «одно и то же» явление повторяется много раз, так что вероятность имеет смысл частоты. С другой стороны, есть «последователи Байеса», которые рассматривают вероятность как способ мышления — теория вероятностей выражает, как должен думать каждый здравомыслящий «рациональный» гражданин. Экстремисты из каждой школы рассматривают членов другой школы Это одно из постулируемых свойств идеального газа, которое довольно хорошо выполняется в обычных условиях. — Прим. ред.
1154 Глава 22. Термодинамика как людей, у которых в голове «каша» и т. д. Эти философские споры приводят к ощутимым последствиям в реальной статистической практике. Различные взгляды приводят к разным статистическим процедурам, особенно если рассматривается небольшое число объектов. К счастью, эти споры не имеют отношения к статистической механике, поскольку число рассматриваемых в ней объектов чрезвычайно велико. Важна только математическая сторона этой задачи, т. е. вычисления с данными определениями. Однако, Гиббс работал около ста лет назад, когда математическая теория еще не была разработана. Поэтому ему приходилось заниматься и философией тоже. Кажется, что он скорее разделял точку зрения «частотников». Поэтому, описывая вероятностную меру типа ρμ, он говорил об «ансамбле», подтверждая интерпретацию «частотников». К сожалению, эта терминология и слово «ансамбль» как синоним вероятностной меры прочно засели в стандартных учебниках. Но, независимо от интерпретации, мы уже готовы перекинуть первый мостик между понятиями статистической механики и термодинамики. Если в качестве наблюдаемого рассматривать энергию Н, то внутренняя энергия состояния ρ определяется как Е{Н;р). Другими словами, внутренняя энергия есть ожидаемое значение энергии в данном состоянии. Конечно, функция энергии Η — фиксированная функция на множестве М. Существуют различные состояния р, дающие значения энергии Е(Н; р). Запишем это определение в форме U{p) = E{H-p), (22.32) так что внутренняя энергия — это функция на пространстве состояний. Мы уже сказали, что Η — фиксированная функция на множестве М. Но в общем случае мы позволим функции Η зависеть от некоторых дополнительных параметров. Например, еще раз рассмотрим газ, находящийся в ящике. Но теперь пусть в ящике имеются различные поршни (рис. 22.15), так что его форма изменяется соответственно значениям Qi, Q2, .. ·, Qd, определяющим
22.8. Наблюдаемые, ожидания и внутренняя энергия 1155 Qa Q3 V — 0 внутри Q2 Qi V = +ос снаружи Рис. 22.15. Зависимость V от параметров положение поршней. Тогда потенциальная энергия V (предполагается, что она равна 0 внутри ящика и «+оо» за его пределами) зависит от формы ящика и, следовательно, от параметров Qi, Q2, ■ ■ ■, Qd- Таким образом, энергия U также зависит от этих параметров: U = U{p,QuQ2,...,Qd). Итак, у нас имеются понятия состояния и внутренней энергии. Что такое равновесные состояния? Мы можем определить их с помощью принципа максимальной энтропии. В общем случае мы сделаем это в параграфе 22.11. А сейчас вернемся к примеру газа, заключенного в ящик. Для каждого положительного значения β рассмотрим функцию е~Рн в пространстве R6. (Здесь β — параметр, имеющий размерность обратной энергии, так что β Η — безразмерная числовая функция. Очень скоро β станет играть роль, о которой говорилось в параграфе 22.4.) Поскольку V и, следовательно, Η обращается в +оо, когда точка (gi, (72 > Qz) находится за пределами ящика, функция е~Р там равна нулю, и она везде неотрицательна. Поэтому в качестве состояния можно использовать F~le~@H, где постоянная F выбирается так, чтобы интеграл от этой функции по всему пространству был равен 1, т. е. F= I e~PH dqidq2dqzdpldp2dpz. (22.33)
1156 Глава 22. Термодинамика Мы уже вычисляли этот интеграл. Интегрирование по пространственным переменным (q]_,q2,qz) проводится только внутри ящика, где функция Η от них не зависит. Поэтому это интегрирование дает множитель V — объем ящика. А интеграл по импульсам гауссов, что приводит к результату F = ν{2πβ)-ζ'2. (22.34) Здесь F зависит от β, а также от параметров Q\,Q2,... ,Qd только через объем V. В этом частном случае определим равновесные состояния как рт = F-le-?H, (22.35) где F = F(/3, Qi,Q2, ■ ■ ■, Qd) задается формулой (22.33). Давайте определим Z = \ogF. (22.36) Можно вычислить dZ/δβ, дифференцируя (22.33) под знаком интеграла, и получить dZ/Οβ = F^dF/d/? = F'1 ( -Не~Рн <% dq2 dqz dPl dp2 dpz = - / Hp0!Q dqi dq2 dqz φι dp2 dp3 = -E(H; pptQ) (22.37) или ΟΖ/Οβ = -U. (22.38) Вернемся к понятиям работы и обратимой кривой. Предположим, что мы медленно двигаем один из поршней, скажем, Q\. Соответственно изменяется энергия Н, и возникает функция dH/dQi на пространстве М, которая имеет смысл силы. Для любого заданного состояния ρ мы должны вычислить среднее значение и получить обобщенную силу E{dH/dQv,p). Обратимость процесса означает, что мы ограничиваем состояния ρ требованием, что они принадлежат множеству равновесных состояний. Следовательно, форма для работы имеет вид ω = E{dH/dQi; ρ) dQx + E(dH/dQ2;p) dQ2 + ■ ■ ■ + E(dH/dQk;p)dQk.
22.8. Наблюдаемые, ожидания и внутренняя энергия 1157 Дифференцируя Ζ по Qi, получим -βω = {dZ/dQx) dQi + (dZ/dQ2) dQ2 + ■ ■ ■ + (dZ/dQk) dQk (22.39) или в более символической форме dQZ = -βω, (22.39а) где d,Q обозначает правую часть формулы (22.39), т. е. мы вычисляем оператор d в направлениях Q (при фиксированном значении β). Заметим, что при выводе уравнений (22.37)-(22.39) мы нигде не использовали явный вид Н. Если же теперь предположить, что рассматривается «свободный газ в ящике», где функция F и, следовательно, Ζ зависят только от Qi через объем V, то можно написать dZ/dQi = (dZ/dV)(dV/dQi), и формула (22.39) превращается в -βω = (dZ/dV) dV. Конечно, увеличение V вызывает уменьшение Η (поскольку точки, которые раньше были за пределами ящика, где V = +оо, теперь оказываются внутри ящика, где V = 0). Как обычно, давление считается положительным, из чего следует, что ω = —ρ dV. Тогда последнее уравнение принимает вид OZ/dV = βρ = υ, а это показывает, что Ζ обладает всеми свойствами функции Массье. Итак, у нас теперь есть общий рецепт вычисления функции Массье. Для заданной системы (Μ, Λ, μ) и функции Н, определенной на пространстве Μ и называемой «энергией», определим функцию разбиения F выражением F= Ι\~βΗμ. (22.40) Функция Η и, следовательно, F могут зависеть от дополнительных переменных Q\, Q2, ..., Qk- Кроме того, интеграл в формуле (22.40) будет сходиться только в определенной части пространства (β, Qi, Q2, · ·., Qk)· Определим внутреннюю энергию формулой (22.32), равновесные состояния — формулой (22.35) (где F
1158 Глава 22. Термодинамика определяется формулой (22.40)) и функцию Массье — формулой (22.36). Тогда справедлива формула (22.38), и форма для работы ω задается формулой (22.39). Это и есть рецепт для перехода от «микроскопической модели», закодированной функцией Н, к «макроскопическим равновесным явлениям», описываемым функцией Массье. Получен четкий рецепт, но его еще надо обосновать. Это можно будет сделать, когда мы поймем вероятностное определение энтропии, которым займемся в следующем параграфе. Есть еще одно небольшое обобщение наших рассуждения, которое окажется полезным. Предположим, что мы хотим рассмотреть не одно наблюдаемое, а несколько наблюдаемых (Ji,..., Jn) сразу. В этом случае можно ввести J = (Ji,..., Jn) — векторное наблюдаемое, значения которого лежат в пространстве Ш.п, т. е. наблюдаемое, принимающее значения в векторном пространстве W. Наблюдаемое со значениями в W — это просто функция из Μ в W (удовлетворяющая соответствующему условию измеримости, как и в случае R). Понятие интеграла от вектор-функции определено, поэтому определение (22.28) для математического ожидания вектор-наблюдаемого в данном состоянии сохраняется без изменения. Точно так же можно говорить про вероятность (в данном состоянии) наблюдаемого J лежать в некотором подмножестве W. Но нам не придется этим заниматься. 22.9. Энтропия Введем понятие энтропии состояния. Пусть (Μ, Λ, μ) — система. Мы хотим каждому состоянию системы ρ приписать число Ent(p), которое будет измерять меру «беспорядка» состояния ρ по отношению к μ. Таким образом, Ent будет функцией, определенной на пространстве всех состояний. Чтобы оправдать такое определение, сначала рассмотрим пространство конечной выборки, т. е. случай А из параграфа 22.6. Если Μ = {βι,..., е^}, то состояние ρ определяется заданием к вещественных чисел pi = p(ej), г = l,...,fc. Тогда pi есть вероятность события {е^}. В теории информации энтропия состояния ρ = (pi,...,Pfe) определяется
22.9. Энтропия 1159 равенством к Entfe(p) = -£р* log д. (22.41) i=l Эта функция обладает различными свойствами, делающими ее мерой «беспорядка» или недостатка информации. Выпишем некоторые из них. (i) Entfe(pi,... ,pk) симметрична по (pi,...,Pfe). Это соответствует требованию, что мера беспорядка не зависит от способа индексации результата. (ii) Entfc(l,0,... ,0) = 0. (Здесь мы определяем x log χ = 0 для χ = 0 в силу непрерывности.) Это соответствует утверждению, что если в данном состоянии результат предопределен, то оно имеет нулевой беспорядок. (Hi) Entfe+i(pi,...,pfe,0) = Entfc(pi,...,pfe). Это означает, что если нашу систему Μ = {βι,...,β^} заменить на систему Μ' = {βι,... ,efc, efc+i}, но при этом рассматривать только состояния, в которых е/г+ι невозможны, то энтропия не изменяется. Другими словами, добавление фиктивной альтернативы не изменяет недостаток информации. (iv) Entfe(pi, ...,Рк) < Ent ( -, · ■ · , - J, где будет строгое неравенство, если pi φ 1/k для некоторого значения г. Таким образом, недостаток информации достигает максимума, когда все альтернативы равновероятны. Для доказательства этого утверждения заметим, что для всех χ ^ 0 справедливо условие χ log x ^ χ — 1. Равенство будет только для χ = 1, что легко проверяется дифференцированием обеих частей. При χ φ 0 это условие можно переписать в виде — log x ^ х~ — 1.
1160 Глава 22. Термодинамика Тогда -Л 1оей-^-Л log-J =-pilog^r^-pi^—-lj = -^+ft· При вычислении суммы по г справа получается 0, потому что Y2(l/k) = 1 = ΣιΡί- Итак, мы имеем - J2Pi !ogPi < - Σ Pi log £ = - log - = - J] - log -. Заметим, что Ent(pi,... ,ρ&) отражает недостаток знания до выполнения эксперимента, который скажет нам, какие из к возможностей реализуются на самом деле. В этом смысле Ent(pi,... ,pfe) представляет количество информации, полученной при выполнении эксперимента. (ν) Предположим, что Μ = Μι χ М^·, где М\ содержит к элементов {ei,...,efe}, a M2 содержит / элементов, так что Μ состоит из kl элементов {ej,/j}. Предположим, что ρ = Pi х Р2, так что р({(еь /,)}) = рщ. Тогда Entfei(p) = - Σ Pi Яг 1°§ (Р*Яз) = - ΣΜ·? (log Pi + log 9j) = - Σpi logPi ~ Σ *log %· Но поскольку ΣΡί = X^9j = 15 мы имеем Entw(pi x pi) = Entfe(pi) 4- Enti(p2). Другими словами, если мы проведем два независимых эксперимента, то полное количество полученной информации будет равно сумме информации, полученных от каждого эксперимента. Оказывается, что свойства (i)-(iv) вместе с более сильным вариантом утверждения (ν) определяют функцию Ent с точностью
22.10. Равновесие в статистических системах 1161 до постоянного множителя. Таким образом, в пространстве конечной выборки есть только один способ измерения «беспорядка» состояния, если эта мера беспорядка удовлетворяет нескольким разумным аксиомам. Мера беспорядка задается выражением (22.41). Это выражение можно переписать таким образом, что оно будет иметь смысл для любой системы. По определению, для произвольной системы (Μ, Λ, μ) и произвольного состояния ρ имеем Ent(p) = - Ζ" ρ log ρ μ, (22.42) при условии, что этот интеграл сходится. 22.10. Равновесие в статистических системах Итак, у нас есть определение меры «беспорядка» в системе. Предположим, что нам задана система и последовательность вещественных наблюдаемых J\,...,Jn. Мы можем наблюдать ожидаемые значения этих наблюдаемых в любом состоянии. Соберем наблюдаемые в векторную конструкцию J = (Ji,..., Jn). Используя принцип максимальной энтропии, рассмотрим состояние «статистического равновесия», в котором «беспорядок» достигает максимума в соответствии с нашим знанием ожидаемого значения J. Сначала поставим точную математическую задачу. Пусть J : Μ —> V — векторное наблюдаемое системы, и пусть J — произвольное возможное ожидаемое значение J. Рассмотрим следующую проблему. Среди всех состояний р, обладающих свойством Е{3\р) = Ι ρ3μ = 3, найти такое, в котором энтропия достигает своего максимума. Иначе говоря, нужно решить задачу на условный максимум Ent(p) при ограничении / ρ3μ = J.
1162 Глава 22. Термодинамика Оказывается, что если для системы (Μ, Λ, μ) и наблюдаемого J выполняются ряд предположений, то эта задача имеет единственное решение. Итак, начнем. Пусть V* обозначает пространство, дуальное к V. Тогда элемент 7 £ У* — линейная функция на пространстве V. Пусть 7 · ν обозначает значение 7 на векторе v. Тогда для любых 7 £ У* и т£М можно рассмотреть 'у-3{т), что является числом, зависящим от 7 и га. Но тогда -у ■ J — числовая функция на множестве М. Запишем интеграл РЫ = I Jm e-^μ. Ш Отсюда видно, что 0 < F(*y) ^ +°о (интеграл может расходиться к +оо). Предположим, что 7 таково, что интеграл -F(7) конечен. Тогда определяет состояние системы. Действительно, ρΊ — положительная функция, и по определению F{~{) мы имеем f ρΊμ = 1. Для каждого значения 7) когда F(7) < +оо, мы получаем состояние ρ,γ. Итак, мы получили набор состояний, параметризованный подмножеством V*. Заметим, что если -£"(7) < +оо, то Ent(p-y) конечна. Действительно, - / Pi log ΡΊμ = - / ΡΊ(- log F(7) - 7 · 3)μ. Здесь -F(7) постоянна, если рассматривать ее как функцию на множестве М. Поэтому / p^logF(7)/i = logF(7)- Кроме того, / ρΊ3μ = Ε(3·ρΊ) есть просто ожидаемое значение векторного наблюдаемого J в состоянии р. Поэтому можно написать / ΡΊΊ- 2ν = Ύ·Ε(3;ρΊ).
22.10. Равновесие в статистических системах 1163 Но тогда Ent(p^) = log F(ty) +Ί-Ε(3; ρΊ). (22.44) Давайте теперь учтем, что функция J может также зависеть от некоторых «конфигурационных» параметров Q. Если написать S(-y,Q) = Ent(p-y,Q) и Z{j,Q) = \ogF(-y,Q), то равенство (22.44) принимает вид S = Z + 7-J(7,Q)· В частном случае, когда 3 = Н, это равенство совпадает с (22.24). Но формула (22.24) представляет собой комбинацию первого и второго законов термодинамики. Предположим, что для заданного значения J G V мы можем найти такое -у G V*, что / 3ρΊμ = Ε{3;ρΊ) =3. (При этом предполагается, что / 3ρΊμ сходится абсолютно.) Тогда утверждается, что ρ — единственное решение экстремальной задачи. Другими словами, справедлива Теорема. Пусть 7 £ V* таково, что F{^) < +оо и справедливо равенство (22.44), где ρΊ определено формулой (22.43). И пусть ρ — другое состояние, для которого ίρ3μ = 3. (22.45) Тогда Ent(p) ^ Ent(p-y), причем мы имеем строгое неравенство, если ρ и ρΊ отличаются на множестве с положительной мерой μ. Доказательство. Здесь мы повторяем аргументы, которые приводили для доказательства, что {Ijk,..., l/k) дает максимум энтропии в конечной системе. Итак, для любого состояния ρ и любого т е Μ мы имеем -р{т) log р(т) - {-р{т) log ρΊ{τη)) ^ ρΊ{πι) - р{т). (22.46)
1164 Глава 22. Термодинамика В самом деле, если р(т) = О, то левая часть равенства равна нулю, а правая положительна. Если р(т) > 0, то - р(т) log р(т) - (-p(m) log ρΊ{τη)) = р(т) log[p(m)/ρΊ{τη)\ < р(т)(К(т)/р(т)] -!) = р^т) - р(т)> при этом используется неравенство — log χ ^ х-1 — 1. Интегрирование по пространству Μ дает потому что Но а следовательно, - / plogpp, - / plogp-,,μ ^ О, Ι ρμ= ι ρΊμ = ΐ· logp-y = - logF(7) - 7 J, - / plogp^ = logF(7)+ / p(7-J)/i = logF(7)+7· ί / pJp, = logF(7)+7-J = Ent(px), поскольку Ε{3;ρΊ) = J. Таким образом, Ent(p) ^ Ent(py). (Заметим, также, что из неравенства (22.46) следует, что -р log ρ ίζ -p[log F(<y) + 7 · J] + ρΊ - ρ, причем правая часть этого неравенства — абсолютно интегрируемая функция. Итак, если — f p log ρ μ расходится, то это происходит на — оо.) Неравенство (22.46) будет строгим, если р{т)/р-1{т) φ 1. Тогда, если р(т) φ р-у{т) для множества с положительной мерой, то мы имеем Ent(p) < Ent(p-y), что и требовалось доказать. В качестве следствия этой теоремы мы дадим статистическое определение равновесного состояния.
22.10. Равновесие в статистических системах 1165 Определение. Пусть J — наблюдаемое в системе (Μ, Λ, μ). Если 7 таково, что ^(7) = / е г "V < °°) то 1 --V-J называется равновесным состоянием системы (относительно наблюдаемого J). Мы должны показать, что (при соответствующих предположениях) для любого значения J существует состояние ρ,γ, для которого Е(3;ру) = J. Из доказательства теоремы следует, что если такое состояние ρΊ существует, то оно единственно. Мы вернемся к этому вопросу позднее. А сначала дадим несколько примеров равновесных состояний, используя системы, введенные в примерах параграфа 22.6. А1. Пусть Μ = {ei,..., е^} и μ точно такие же, как и в примере А параграфа 22.6. Пусть V = Ш — одномерное пространство и пусть J : Μ —> R задается условием J(ej) = ει, где ε% — вещественные числа (мы будем считать их «энергетическими уровнями»). Без потери общности для элементов множества Μ введем индексы ει ^ £>2 ^ ''' ^ £к- Тогда ^* = Еи для любого β £ V* мы имеем к р=1 так что равновесное состояние ρβ задается формулой e~P£i Оно называется «распределением Максвелла-Больцмана». Вспомним вычисление ожидаемого значения «энергии» Y\F.e-/3£t
1166 Глава 22. Термодинамика или короче (Как мы уже видели, это последнее равенство дает общее правило.) Тогда дЕ{3;рр) = Σφ-βε* _ (Σε*-** Οβ Σε~βεί V Σβ~βεί Ι Ρ\\2Ρβμ - Ι Ι 3ρββ = /(J - 3)2ρβμ ^ 0, причем будет строгое неравенство, если только не все ег- равны между собой. (Если же все ег- равны, то существует только одно возможное значение для J, равное этому общему значению всех ε{. Тогда все ρβ одинаковы и равны Ρβ(βΐ) = 1/k. Таким образом, в этом случае теорема сводится к утверждению (Ш).) Если ε\ φ Sk, то Ε (3; ρ β) — строго убывающая функция от β. Очевидно, что Km E(3;pfl) = ek и lim Ε(3;ρβ) =ει· /3—*-οο /3—>+οο Итак, любое значение J такое, что ει < J < £■&, может быть получено только единственным выбором β. Для любого значения β мы имеем Ent(pp) = -pp(ei)logpp(ei) log(e-^)-log \^2е~^ = Σ^ΐΓ + log Ftf) = β · J + log Ftf). Это, конечно, частный случай формулы (22.24). А2. Рассмотрим случай конечной системы М, элементы которой для удобства обозначим ео,...,е^, так что в ней насчитывается к + 1 элемент. Пусть J = (J\,..., Jfe) отображает М в
22.10. Равновесие в статистических системах 1167 пространство Шк, где 4ej) = 4- Таким образом, J отображает Μ в вершины симплекса в пространстве Rfe, заданного базисными векторами. В этом случае 7 = (ji, ■ ■ ■, Ik) и F(7) = 1 + е~71 + · · · + е-7* сходится для всех значений 7 с 1 е-71 е-7* P^(eo) = F(7T' Р^е1) = 1ЬУ '"' P^ek)=Fb)' Если мы обозначим p-y(ej) через рг-, то понятно, что в любую точку Ρ = (Pi) · · · >Pfe) внутри симплекса можно попасть с помощью соответствующего выбора 7г· В этом случае все состояния, соответствующие внутренней точке р, являются равновесными состояниями. Отображение 7 —> Ε{3\ρΊ) переводит все элементы пространства Шп = V* во внутреннюю область единичного симплекса. Читатель может проверить, что это отображение взаимнооднозначно и имеет дифференцируемое обратное. В. Пусть (R, Л, μ) — вещественная прямая с обычной мерой. Если J — тождественное отображение J(x) = χ, то соответствующая функция Ζ(η) = J_oc^~lx dx расходится для всех значений 7- Однако, если рассмотреть отображение J : R —> R2, заданное равенством J(x) = (χ,χ2), то для всех 7 = (71) 72) с 72 > 0 функция /оо ■ОО сходится. Соответствующее равновесное состояние ρ = ^(7\-le-7i*-72Z2 _ ^(7)-le7?/472e-(z+7l/272)2/2(l/272) имеет нормальную плотность, математическое ожидание т = —71/272 и дисперсию21 σ = (272) "1^2· Очевидно, что для любого 21 Напомним, что дисперсия случайной величины (функции на пространстве с вероятностной мерой) / с математическим ожиданием т определяется как математическое ожидание величины (/ — τη)2. — Прим. ред.
1168 Глава 22. Термодинамика σ > О и любого т можно найти такой вектор 7 = (71) 72) ι что Pf(x) = /0 σν2π 1 ρ-(χ-τη)2/2σ2 Итак, для всех случайных величин с производными, имеющих заданные математическое ожидание и дисперсию, энтропия максимальна при нормальных распределениях. Чтобы вычислить энтропию, заметим, что в силу трансляционной инвариантности можно считать, что т = 0. Тогда σ\/2π J 2 1 χ -log27r + loga + ^2 dx = loga + - log27r + 1. Энтропия стремится к — oo при σ —> 0. Это соответствует тому, что при σ —> 0 состояние ρ становится более сосредоточенным вокруг точки и поэтому требуется «бесконечное количество информации, чтобы выделить эту точку из континуума». С. Давайте рассмотрим наблюдаемые J ι = χ и J2 = log x в пространстве R+. Тогда -у = (71,72)1 J = (Л> «^) и /•оо /·οο F(7)=/ е-^х~^1оёХ dx = e'^x'^dx Jo Jo сходится при 7i > 0 и 72 < —1· Если положить А; = — 72 + 1иу = 71^) то интеграл принимает вид /•ОО /·Ο0 F(7) = / е-т^х*-1 (fa = 7ffe / е-V"1 Φ/ = 7Г*Г(*0- Jo Jo Соответствующие распределения называются гамма-распределениями. В этом случае плотность ρΊ равна η = ^,-71^-72 logs Мы хотим вычислить векторное ожидаемое значение Е(3) = (ЕЩ,ЕШУ
22.10. Равновесие в статистических системах 1169 При этом мы имеем /•ОО E{JX)= Ι χβ-Ίιχ-Ί2Χ°ζχ dx Jo и poo E(J2)= / \ogx-e-^x-^losxdx. Jo Тогда /•oo £(Ji) = / xl-^e'^xdx. Jo Сново оббозначим у = η\χ νι k = 1 — η?, что дает poo ВД) = ΊΪ'1 / е~Уук dy = 7f-1r(A; + 1). Jo Вычисление E^J^) оставляем читателю в качестве упражнения. D. Пусть J — наблюдаемое, заданное формулой J (А;) = к, а /? G R1. Тогда мы видим, что ряд = е к\ сходится для всех значений β. Введем величину е~Р = А; тогда Ρ(β) = е\ (Параметр А часто называют «активностью».) Тогда Поэтому Prob{JP/3 = к} = е~х —. Это распределение вероятностей называется распределением Пуассона. Заметим, что Ε(3;ρβ) = -d\ogF{fi)/dfi = -де-Ρ/θβ = е~? или Ε(3;ρβ) = Χ. Другими словами, параметр А показывает ожидаемое число частиц в ящике. Давайте теперь еще раз перечислим полученные теоретические результаты.
1170 Глава 22. Термодинамика • Система (Μ, Λ, μ) является пространством с мерой. • Состояние — неотрицательная функция ρ на Μ с условием Ιρμ = ι. • Энтропия состояния есть Ent(p) = — f p\ogpμ. • Наблюдаемое есть (векторная) функция на пространстве М. • Ожидаемое значение наблюдаемого К в состоянии ρ есть Ε(Κ;ρ) = ΙΚρμ. Если J — наблюдаемое со значениями в пространстве V, то функция разбиения, связанная с J, есть функция, определенная для 7 £ V* условием F(7) = /e-TV Она определена на подмножестве С пространства V*, где этот интеграл сходится. Функция Массье Ζ определена на С условием Ζ = logF. Равновесные состояния относительно J — это состояния вида ρΊ = Fbr^e-r* для 7 £ С· С помощью функции Массье можно вычислить ожидаемое значение J в состоянии ρΊ при условии, что 7 находится внутри подмножества С, по формуле J; = -dZ/dji, что для краткости можно записать в виде J = -dZ/d-y. Тогда 5(7) = Ent(p^) = Z + 7-J. 8 частности, 7 можно получить из J по формуле 7 = dS/дЗ.
22.11. Квантовые и классические газы 1171 Здесь мы рассматриваем S как функцию от J, поскольку -у можно выразить как функцию от J, обращая заданную функцию J = J (7)· Наблюдаемое J может зависеть от дополнительных координат Qi,- ■ ■ ,Qd, τ·е· J может быть функцией на пространстве Μ χ В, где В — пространство с координатами Qi,--,Qd· Тогда функция F и равновесные состояния ρΊ также зависят от этих дополнительных координат. В случае, когда одной из компонент J является Η — «энергия», внутренняя энергия состояния ρ дается Е(Н\р). Имея все эти определения и после обсуждения работы в параграфе 22.8 (см. (22.39а)), мы подготовились в переходу от «микроскопической» модели к «макроскопически» наблюдаемым явлениям. 22.11. Квантовые и классические газы Начнем со сравнения функций разбиения для трех систем D, Ε и F, рассмотренных в параграфе 22.8. Как и раньше, для каждой из этих систем будем рассматривать двумерное наблюдаемое J = (Ν, Η), где Ν — «число заполнения», Η — «уровень энергии», причем N и Η связаны соотношением Η = Νε, где ε — «энергия одного заполненного состояния». В предыдущем параграфе мы уже проделали вычисления для случая D, а теперь сделаем все сразу в виде таблицы 22.2. Во всех трех случаях мы вычисляем последний столбец по формуле Ε(Ν) = — дlogF/δβ\. Сумма, возникающая при вычислении случая F, является геометрической прогрессией, а в случае Ε — это просто сумма двух слагаемых. Во всех трех случаях Ε(Ν) мала тогда и только тогда, когда велика е~^~е>'Т. Тогда мы пренебрегаем слагаемым ±1, появляющимся в знаменателе выражения для Ζ. Но тогда распределения вероятностей наблюдаемого N очень близки. В таблице 22.3 мы введем обозначение А = е^~^т. Если рассматривать ожидаемое число заполнения как меру «концентрации», то для «разреженных» систем распределения вероятностей Больцмана, Ферми-Дирака и Бозе-Эйнштейна
1172 Глава 22. Термодинамика Таблица 22.2 Система D F ρ м*о 1/fc! μ(0) = μ(ΐ) = 1 μ(Λ) = 0, к > 1 1 Функция разбиения ехр[е-(л+^е)] = ехр[е^-£)/т] 1 +β-(βι+β2ε) = 1 + 6{μ~ε)/Τ 1 1 _β-(/3ι+/32ε) 1 1 _ β(μ-ε)/Τ E(N) β(μ-6)/Τ 1 1+β-(μ-ε)/Τ 1 β-(μ-ε)/Τ_1 Таблица 22.3 Система D Ε F Название Prob(iV = к) Больцмана-Пуассона е~хХк/к\ Ферми-Дирака Prob(iV = 0) = Prob(iV = 1) = Prob(iV > 1) = Бозе-Эйнштейна (1 — A)Afe = 1/(1+λ) = λ/(1+λ) = 0 очень близки, т.е. все члены в правом столбце таблицы 22.3 будут близки друг к другу, когда А очень мало. Но для больших «концентраций» они сильно отличаются. На рис. 22.16 изображены графики трех функций е-*, 1/(е* + 1) и 1/(е* — 1). Заметим, что при t > 2 кривые почти сливаются, но при малых значениях t они сильно расходятся. Давайте рассмотрим ситуацию, когда имеется d экземпляров одной из этих систем, причем каждая имеет различное значение энергии одного заполненного состояния, так что мы имеем d значений ει,..., Ed- Система представляет собой прямое произведение Μ = Μι χ · · · χ Md.
22.11. Квантовые и классические газы 1173 Рис. 22.16. Графики ожидаемых значений числа частиц для распределений Больцмана, Ферми-Дирака и Бозе-Эйнштейна в зависимости от (μ — ε)/Τ = t Мы предполагаем, что «энергия взаимодействия» пренебрежимо мала, т. е. H = H1+-+Hd. Кроме того, определим N = N1 + --- + Nd. Тогда функция разбиения всей системы есть просто произведение функций разбиения всех компонент: F = F1x---xFd, где В таблице 22.2 мы должны в выражениях для функций разбиения вместо ε подставить ε\. Давайте еще раз обсудим, что это означает. У нас есть d систем. Мы собрали их в одну систему. Следовательно, они могут «взаимодействовать». Равновесные состояния г'-й подсистемы определялись бы ее собственными параметрами Рц и /Зг^- Тот факт, что системы находятся в равновесии, означает, что у нас
1174 Глава 22. Термодинамика имеются общие для всех значения βχ и 02- Таким образом, мы еще раз открыли критерий Гиббса (22.26). До сих пор шел весьма абстрактный разговор, и мы не давали физического описания компонент нашей системы. Сейчас рассмотрим следующую модель «газа в ящике» (отличную от прежней модели). В фазовом пространстве рассмотрим подобласть В χ D, где В С R3 — наш ящик и D £ I3 - небольшой кубик с центром в точке ρ в пространстве импульсов. Итак, когда мы говорим, что молекула находится в нашей области, то имеем в виду, что она находится в ящике и ее импульсы близки к р. Подсистемы «взаимодействуют» посредством столкновений, т. е. за счет обмена импульсами. Предположим, что энергия одной частицы в выбранной подобласти есть ее кинетическая энергия, т. е. e(p) = \\\p\\2 = \(pl+P2y+p2z)- Это и есть «энергия заполненного состояния» для подсистемы с центром в точке р. Согласно утверждению Больцмана-Пуассона «ожидаемое число частиц в нашей подсистеме» пропорционально ехр Х|| ||2 Это и есть распределение Максвелла-Больцмана, где дополнительный параметр μ зависит от плотности газа. Конечно, мы перепрыгнули через две техниченских ступени — мы рассмотрели бесконечное число подсистем, заполняющих все фазовое пространство, и устремили размер ячейки в фазовом пространстве к нулю. Но это не представляет большой сложности. Эти же соображения можно было бы применить к статистикам Ферми-Дирака и Бозе-Эйнштейна. Тогда вместо распределения Максвелла-Больцмана мы получили бы распределение Ферми-Дирака /(Р) = ехр[(±||р||2-^/Г] + 1 Аналогичная замена происходит и в случае статистики Бозе- Эйнштейна.
22.12. Определители и следы 1175 22.12. Определители и следы Давайте перепишем формулу Ftfufo) = F1(p1,p2) x F2(fa,fo) x · · · x Wbft) (22.47) (в каждом из трех случаев) на первый взгляд странным образом, но так, чтобы из нее были видны следствия. Пусть V = Rd и X — диагональная матрица, г'-й элемент которой равен εχ. Сначала рассмотрим случай Больцмана-Пуассона. Поскольку произведение экспонент равняется экспоненте от суммы, мы имеем ^(01,02) = ехр[е-№+/32£1) + · · · + e-Vb+fa*)] = exp(tre-№I+^x)) = Det(expe-№I+^x)). Здесь использовано, что для любой матрицы имеет место равенство Det(exp A) = exp(tr A). Давайте рассмотрим случай Ферми-Дирака. Поскольку определитель диагональной матрицы равен произведению ее диагональных элементов, можно написать F{fa,fo) = Oet /iMfr.ft) 0 ··· 0 \ О F2(fa,fo) ■■■ О V 0 0 ■·· Fd(fiufo)J (22.48) Матрица, стоящая справа, — это матрица П + е-ам+АХ), и поэтому F = Det(I + e-W+lhX)). Аналогично, в случае Бозе-Эйнштейна соответствующее равенство имеет вид F = Det[I-e-№I+^x)]-1. Другими словами, мы получили таблицу 22.4.
1176 Глава 22. Термодинамика Таблица 22.4 Система Функция разбиения Больцмана Det^xpe^1^2*)) Ферми-Дирака Det(I + е~(№+&гх)) Бозе-Эйнштейна Det[I - e-(/M+#2X)]-i Если сравнить таблицы 22.2 и 22.4, то увидим, что изменение состоит в том, что скаляр β\ + β2£ заменяется на матрицу β\1 + β%Χ и вычисляется определитель. Опишем несколько по-другому процедуру взятия определителя. Но сначала сделаем ряд замечаний относительно линейной алгебры. Пусть V — векторное пространство, и А — его линейное преобразование. Тогда А индуцирует линейное преобразование А ® А пространства V ® V согласно формуле (А ® А){и ® v) = Аи® Αν. Если А = etY, то, дифференцируя уравнение etY ® etY (и ® v) = etYu ® etYv по t в точке t = 0, получаем (d/dt)[etY ® etY(u ® υ)]|ί=ο = У и θ ν + и ® Υ ν = (У ®I + I®y)[u®v]. Это показывает, что etY ® е*^ = exp(iZ), где Ζ — оператор, определенный равенством У ® I + I ® У Другими словами, etY®etY = et[Y®W®Y]. Аналогично, если рассмотреть индуцированное действие на V ® V ® V, то получим ay ^ ay ^ ay _ i[r®i®i+i®r®i+i®i®r]
22.12. Определители и следы 1177 Далее идут аналогичные выражения для V®V®V®Vvn. д. Введем обозначение Dk(Y) для матрицы, стоящей в экспоненте справа. Тогда D2(Y) = У ® I + I ® У на V® V, D3(Y) = У®1®1 + 1®У®1 + 1®1®У па V®V®V и т. д. Например, если взять t = 1 на V <8> V <8> К, то получим Вычисление следа матрицы, стоящей слева, дает (tre^)3, поскольку tr(A ® В ® С) = (tr A)(trB)(trC), т.е. под знаком тензорного произведения следы умножаются. Итак, (trer)3 = treD^). Давайте положим D0(Y) = 0, D1(Y) = Y, так что для всех к (tvY)k = tveD^Yl Теперь функцию разбиения для больцмановской составной системы можно написать в виде Det(expe-^I+^X)) = exp(tre-№I+^x)) = ^(tr[e-^I+^x)])fe/A;! = ^(l/fc!)tr{exp(Dfc[-091I + )82X)])}, где мы взяли У = e"^ll+^2X>. Запишем эту формулу более компактно. Пусть Tk(V) — А;-кратное тензорное произведение V на себя, так что ЩУ)=Ш, Ά(ν) = V, T2{V) = V®V, T3(V) = V®V®V, и т. д.
1178 Глава 22. Термодинамика Рассмотрим полную тензорную алгебру T(V) = T0(V) Θ Ti(V) Θ T2(V) Θ · · ■ (Это бесконечномерное пространство, но не надо беспокоиться.) Любая матрица на этом пространстве разлагается на блоки А = (Аоо Aqi Ао2 Aqz · ■ Λ Ат Ап А12 Ап А20 А21 А22 ^23 ^4зо Asi ΑΆ2 Аж V ■: : ; ; ·./ где Аоо ~ преобразование Го(V) (т.е. скаляр), Ац — линейное преобразование T]_(V), A22 — линейное преобразование Тг(У") и т. д. Определим \,т®А = ^{\1ЩЪАкк. Конечно, это выражение не обязательно сходится. Мы будем считать, что оно определено только для бесконечных рядов, сходящихся абсолютно. Для любого оператора У в пространстве V можно записать D(Y) = (Do{Y) 0 0 0 0 Di(y) 0 0 0 0 D2(Y) 0 0 0 0 D3(Y) \ \ ш: ; ; Полагаем теперь А)(У) = 0 и D\(Y) = У. Тогда получаем tr®eD(r) = ^(i/A;!)trexp{Dfe(y)}, следовательно,
22.12. Определители и следы 1179 Построим аналогичную конструкцию для случая Ферми- Дирака. Вместо Τ(V) (тензорной алгебры) рассмотрим A(V) (внешнюю алгебру). Например, давайте посмотрим на Л2(V) = V Л V — пространство внешних 2-векторов над V. В этом случае определим D^iy) как линейное преобразование Л2(V) согласно формуле D2(Y)(u Л ν) = Yu Л ν + и Л Yv. Это та же формула, что и раньше, только знак Как и раньше, мы имеем заменен на Л. eYAeY = eD2(Y) на A2{V). Точно так же определяем D3(Y) = ΥΛΙΛΙ + ΙΛΥΛΙ + ΙΛΙΛΚ на A3{V) и т.д. Так же, как и раньше, мы определяем D(Y) как прямую сумму всех Di(Y) — матрицу на A(V), диагональные компоненты которой суть Di(Y). Если V — конечномерное векторное пространство, то теперь это конечная матрица. Предположим, что Ζ — диагонализуемая матрица, собственные значения которой равны zi,...,Zd, а соответствующие собственные векторы — е1,...,е^. Тогда мы знаем, что векторы ej Λ ej, где г < j, образуют базис пространства A2(V) и (Ζ Λ Z)(ei Λ ej) = Zei Λ Zej ZiZjCi Λ 6j, так что ZiZj для г < j — собственные значения Ζ Λ Ζ на A2(V). Аналогично, z^ZjZ^ для г < j < к — собственные векторы Ζ Λ Ζ Α Ζ на Λ3(V) и т.д. Поэтому, если ΖΛ обозначает прямую сумму рассмотренных операторов, т. е. оператор на пространстве A{V) = R φ V Θ {V Λ V) Θ · · ·, где ΖΛ = /Ι 0 0 0 ι : 0 Ζ 0 0 0 0 ΖΝΖ 0 0 0 0 Zt\Zt\Z ···
1180 Глава 22. Термодинамика то tr ΖΛ = 1 + ]Р Zi + ^2 zizj + Σ ZiZ3Zk Η = JJ(l + Zi) = Det(I + Z). Пусть Ζ = eY. Воспользуемся формулой (еу)Л = β°(γ\ которая является прямой суммой всех формул 1=e0=eD0(Y) HaR; eY = eDl{Y) на у- eYAeY = eD2(Y) на Л2(К) ит,д. Тогда получаем trAeD^ = Oet(l + eY), где в левой части уравнения мы использовали оператор trA, чтобы отразить то, что след вычисляется в пространстве A.(V). Если взять У = β-^ιΠ+βζ-Ό^ το получим Det(I + e-W+bV) = trA е-»№+ЬХ), Давайте еще раз обсудим странные математические манипуляции, которыми мы здесь занимались. Начнем с простой системы, которая может находиться в d состояниях с «энергиями» ε\,..., εφ Соответствующая функция разбиения имеет вид Z(P) = e-P£l+---+e~P£d. Если X — диагональная матрица с собственными значениями ει,.-.,εα,το эту формулу можно переписать в виде Ζ (β) = tve~px. (22.49) Пусть V обозначает векторное пространство Rd, и след есть просто след матрицы. Мы хотим рассмотреть более сложную систему, в которой на каждом «энергетическом уровне» может находиться различное число частиц — «оккупантов». У нас есть две
22.12. Определители и следы 1181 равновесных наблюдаемых — полное число оккупантов и полная энергия. Теперь функция разбиения зависит от двух переменных, и переход от простой системы к этой сложной состоит в следующем: Заменяем V на T(V), и тогда Ζ(βι, А>) = tr® е-я^+Я»*) (статистика Больцмана-Пуассона); заменяем V на Λ(V), и тогда Ζ(βι,β2) = trA ε-β(ΑΙ+ΑΧ) (статистика Ферми-Дирака). Таким образом, различие между случаями Больцмана-Пуассона и Ферми-Дирака состоит в том, что используется внешняя алгебра A(V) вместо полной тензорной алгебры T(V). В случае Бозе-Эйнштейна мы заменяем внешнюю алгебру симметрической алгеброй S(V) (алгеброй всех полиномов на пространстве V*)- Используются те же соображения, что и в случае Ферми- Дирака, но теперь у нас будет tr^"1 Ζ = Det(I - Ζ)-1. Все полученные результаты собраны в таблице 22.5. Таблица 22.5 Система Векторное пространство Функция разбиения Простая V Больцмана-Пуассона Τ (V) Ферми-Дирака A(V) Бозе-Эйнштейна S{V) expi-βΧ) tr® e-DWiV+foX) = Detie-^+fr*)) trA β-0(β11+β2Χ) = Det(I + e-(/JlI+^Jf)) trsyme-D(/3in+/32-X) = Det(I - e-(/3ii+/32^))-i
1182 Глава 22. Термодинамика 22.13. Квантовые состояния и квантовая логика Давайте еще раз рассмотрим построения предыдущего параграфа в простейшем случае. Пусть система будет конечным множеством, в котором μ приписывает одинаковые веса всем точкам, т. е. систему А из параграфа 22.6. В такой системе «интегрирование» есть просто суммирование. Наблюдаемое — это функция, определенная на этом конечном множестве, а состояние — неотрицательная функция, сумма значений которой равна 1. Но в этот раз мы будем записывать функции как диагональные матрицы, так что суммирование становится вычислением следов этих матриц. Итак, состояние ρ записывается в виде (р(1) О О О р{2) О О 0 р(3) V ; и наблюдаемое J аналогично J = /J(l) О О О J (2) О О О J(3) V ; : так что •Л Л E(J;p) = trJp. Функция разбиения задается в форме i%3)=tre^x, (22.50) (22.51) где X = (ει 0 0 0 ε2 0 0 0 εΆ
22.13. Квантовые состояния и квантовая логика 1183 Тогда равновесные состояния имеют вид Ρβ = Ρ(β)'1 -βεχ 0 0 0 6~βε2 0 0 0 6-βε3 \ '■■ ■■·/ или pp = F{P)-1e-Px. (22.52) Переход от простой системы к случаю с числами заполнения состоял в замене конечномерного векторного пространства V на одно из более широких пространств T(V), A(V) или S(V), в зависимости от того, какая «статистика» исследуется. При этом все рассматриваемые матрицы были диагональными, поэтому использование матриц казалось весьма искусственным. Здесь же давайте рассмотрим эту роль матриц более серьезно. Пусть V — векторное пространство, где определено скалярное произведение. (В силу важных физических причин мы будем рассматривать комплексное векторное пространство V, где (·, ■) — положительно определенное скалярное произведение, так что V является унитарным пространством. В реальных задачах часто приходится рассматривать бесконечномерное пространство V. Но для понимания ключевых идей нет необходимости включать сюда еще и технические проблемы теории (унитарных) гильбертовых пространств, поэтому все понятия мы продемонстрируем на конечномерном пространстве.) Вспомним, что оператор А в пространстве V называется самосопряженным, если (Ли, ν) = (и, Αν) для всех и, ν G V. Рассуждения, приведенные в параграфе 4.3 (выполненные для комплексного векторного пространства), показывают, что любой самосопряженный оператор можно привести к диагональному виду, т. е. что существует такой ортонормированный базис eb...,ed, что Ащ = Ajej, % = 1,..., α, где Aj — вещественные числа. (В случае бесконечномерного пространства соответствующая теорема, модифицированная определенным образом, называется спектральной теоремой.) Оператор
1184 Глава 22. Термодинамика А называется неотрицательным, или А ^ О, если все Aj ^ 0. Другими словами, А неотрицателен, если и только если (Ли, и) ^ 0 для всех и G V, что можно легко проверить, записав и в виде линейной комбинации всех щ. Теперь можно ввести следующие определения. Квантовая система — унитарное (гильбертово) пространство V- Квантовое (статистическое) состояние — неотрицательный самосопряженный опрератор р, для которого trp= 1. Энтропия состояния ρ задается формулой Ent(p) = — trplogp. Квантовое наблюдаемое — самосопряженный оператор. Ожидаемое значение наблюдаемого А в состоянии ρ задается формулой Е(А;р) =tr Ар. Пусть Ji,...,Jfe — к коммутирующих наблюдаемых, т.е. предположим, что JiJj = JjJi для всех г и j. Пусть β = (βι,..., /?fc), где βι — вещественные числа, и пусть β3 — наблюдаемое β3 = fiiJi + · ■ ■ + fikJk- Тогда соответствующая функция разбиения определяется выражением F(/?)=tre_/U, (22.53) и равновесные состояния ρβ определяются выражением
22.13. Квантовые состояния и квантовая логика 1185 Итак, ожидаемое значение наблюдаемого А в равновесном состоянии, соответствующем β, имеет вид Е(А; Ρβ) = FC3)-1 tr Ae-P*. (22.54) Уравнения (22.53) и (22.54) являются теоретическим базисом квантовой статистической механики. Приведем цитату с первой страницы книги Фейнмана «Статистическая механика»: «Это фундаментальное соотношение является вершиной статистической механики; остальное ее содержание есть либо спуск с вершины, когда основные принципы применяются к частным вопросам, либо восхождение на нее, когда выводятся основные соотношения ...» В случае, когда V — бесконечномерное пространство, след оператора становится бесконечным рядом, который может и не сходиться. Поэтому не все операторы имеют след. Соответственно, функция F(fi) будет сходиться только в ограниченной области β. Сейчас мы оставим эти проблемы в стороне и займемся моделью конечномерного пространства V. Основное различие между квантовой и классической системами состоит в том, что в классической системе наблюдаемая является функцией (на конечном множестве), которую будет диагональной матрицей, а для квантовой системы мы допускаем все (самосопряженные) матрицы. На первый взгляд это может показаться только технической модификацией (которая подтверждается экспериментами на протяжении шестидесяти лет). На самом же деле это наиболее глубокая революция в истории науки, потому что она изменяет элементарные правила логики. Давайте это объясним. Опять начнем с классической системы. Наблюдаемое типа «да или нет» является функцией /, принимающей значения 0 или 1. Это соответствует любому эксперименту, в котором ответ задается неким индикатором (например, выключателем или светом), включен он или нет. Когда мы говорим, что функция / принимает значения 0 или 1, — это то же самое, что /(ш)2 = /(ш) для всех т, или короче /2 = /■ (22.55)
1186 Глава 22. Термодинамика Каждая такая функция соответствует подмножеству В а М множества, где / = 1. Поэтому для любого заданного подмножества В мы имеем функцию22 /в, для которой /в(т) = 1, если т G В, и /β = 0, если т ^ В. Если / и ^ — две такие функции «да или нет», то в классической системе fg —- тоже функция «да или нет». (22.56) Действительно, если С и D — подмножества, то fcfD = fcnD, (22.57) поскольку fc{jn)fD{™) = 1) если и только если для обеих функций мы имеем /с(т) = 1 и /г>(т) = 1. Такое умножение функций соответствует пересечению подмножеств, т. е. логической конъюнкции — точка принадлежит подмножеству CnD, если и только если она принадлежит и С, и D. Например, подмножества С и D не пересекаются, т. е. С Π D = 0, если и только если fcfD = 0. Если СиДне пересекаются, то fc + fD = /cud, (22.58) поскольку обе части равенства равны 1, когда аргумент принадлежит С или D (и не существует точек, принадлежащих обоим подмножествам). Дистрибутивный закон умножения Ы/с + Л?) = Ыс + fBfD- (22.59) — это перевод дистрибутивного закона теории множеств Bn{CUD) = {BnC)U{BnD), (22.60) что, в свою очередь, является записью дистрибутивного закона логики. Пусть В обозначает утверждение т G В и т. д., тогда Π 22называемую характеристической функцией, или индикатором множества β. — Прим. ред.
22.13. Квантовые состояния и квантовая логика 1187 обозначает конъюнкцию: формула В Π С утверждает, что и В, и С верны. Аналогично, U обозначает (неисключающую) дизъюнкцию, т. е. формула CUD означает, что верно либо С, либо D, либо и то, и другое. (Далее мы будем употреблять «или» в неисклю- чающем смысле, не уточняя «или оба».) Итак, дистрибутивный закон просто отражает элементарный логический принцип: Если мы говорим, что верны В и (С или D), то это то же самое, что сказать: верно (В и С) или (В и D). Рассмотрим соответствующую ситуацию в квантовых системе. Наши наблюдаемые уже являются не функциями, а самосопряженными операторами. Мы уже не можем говорить о «значениях» наблюдаемых, а только о их собственных значениях. Поэтому назовем самосопряженный оператор π наблюдаемым типа «да или нет», если его собственные значения равны 0 или 1. Это произойдет, если и только если 7Г2 = 7Г, (22.61) что аналогично (22.55). Условие (22.61) означает, что π является проекцией. Более того, если ei,..., е^ — собственные векторы π, то π — ортогональная проекция на подпространство, натянутое на собственные векторы, соответствующие собственному значению 1. Таким образом, каждое наблюдаемое «да или нет» соответствует подпространству (вместо подмножества), и можно писать π а, обозначая ортогональную проекцию на подпространство А. Заметим, что теперь нулевой оператор соответствует ортогональной проекции на нулевое подпространство {0} и ^C^D = 0, если и только если С Π D = {0}, (22.62) поэтому нулевое подпространство {0} играет роль, аналогичную пустому множеству. Заметим, что если ttc^d = 0, то, перейдя к сопряженным операторам, имеем 0 = (ttc^d)* = ^ЪЖЬ = ^d^Ci откуда получаем, что ttd^C = 0 и (КС + 7Г£>)2 = TTq + 7Гд = ТГС + 7Г£>.
1188 Глава 22. Термодинамика Таким образом, тгс + 7Г£> является наблюдаемым «да или нет». Очевидно, что это ортогональная проекция на прямую сумму С Θ D ортогональных подпространств С и D. Итак, условие 7гс + 7Г£> = 7гсег>, если -kq^d = 0 (22.63) является полной аналогией (22.58), где φ заменяет U. Однако (22.56) полностью нарушается. Вообще говоря, для произвольных подпространств С и D равенство ttc^d = t^d^C не выполняется, и поэтому оператор irc^D не является самосопряженным, и, следовательно, он не является наблюдаемым. Например, если С и D — две неортогональные прямые на плоскости, то ttc^d φ 0. Но образом ttckd является С, а образом ttd^c ~~ D. Поэтому t^C^D Φ κήπο- Проблема возникает из некоммутативности умножения матриц. Заметим, что аналогом дистрибутивного закона теории множеств являлось бы утверждение В П (С Θ D) = {В П С) Θ (Б П D), которое верно далеко не всегда. Действительно, если в качестве С взять ось х, а в качестве D — ось у на плоскости, то С Θ D — вся плоскость, и поэтому В Π [(С Θ D) = В для любой прямой В на этой плоскости. Но если В — любая прямая, отличная от осей χ и у, ToBnC = BnD = {0}, поэтому (В Π С) Θ (Β Π D) = {0} Θ {0} = {0}, и мы уже не имеем равенства двух частей. Итак, в квантовой логике не выполняется дистрибутивный закон. Как уже упоминалось, на протяжении многих лет экспериментально подтверждается справедливость квантовой механики. Поэтому эксперимент показывает, что, работая с квантовыми наблюдаемыми, необходимо отказаться от одного из наиболее драгоценных принципов логики. Резюме А. Формулировка Каратеодори второго закона термодинамики Вы должны уметь объяснить, при каких обстоятельствах существуют точки в окрестности точки Р, которые нельзя соединить с ней нулевой кривой 1-формы а.
Задачи 1189 Вы должны уметь формулировать и объяснять формулу Ка- ратеодори для второго закона термодинамики. Вы должны уметь объяснять понятия абсолютной температуры и энтропии в терминах дифференциальных форм и контурных интегралов, уметь описывать, как эти величины можно вычислять по экспериментальным данным. Задачи 22.1. Пусть а = (у3 + у) dx + {ху2 + х) dy. Дайте характеристику множеству точек в пространстве Ш2, которые можно соединить с точкой ( ι ) с помощью нулевой кривой. 22.2. Пусть а = у dx + xdz. Найдите нулевую кривую формы а, кото- (Л рая соединяет начало координат с точкой I Ь I, где Ь > 0 и с > 0. W Кривая не должна проходить через какие-либо точки, у которых х, у или ζ равны нулю, за исключением начала координат. 22.3. Пусть а = xdy. Покажите, что любые две точки в пространстве Ж3 можно соединить нулевой кривой формы а, несмотря на то, что a A da = 0. Покажите, что для формы β = (1 + χ2) dy две точки с различными координатами у не могут быть соединены нулевой кривой. 22.4. Форму а = 2уех dx запишите в виде а = / dg и в виде а = F dil, где F не пропорционально /. 22.5. Рассмотрите один моль одноатомного газа, для которого pV = 3 RT и U = —pV. Предположим, что начальные параметры газа: ρ = 32, V = 1, но потом он расширяется до параметров: ρ = 1, V = 8. Вычислите работу, совершенную газом, и количество тепла, поглощенного им, в следующих процессах. (a) Сначала газ охлаждается при постоянном объеме, и его давление ρ понижается до 1; затем объем V увеличивается до 8 при постоянном давлении. (b) Сначала газ изотермически расширяется до объема V = 8; потом при фиксированном объеме давление снижается до 1. (c) Происходит процесс, в ходе которого pV5'3 = 32.
1190 Глава 22. Термодинамика 22.6. Для одноатомного идеального газа из упражнения 22.5 напишите форму для тепла в виде а =ТdS. Определите энтропию S (с точностью до аддитивной константы) как функцию ρ viV. Проверьте, что dT Л dS = dp Л dV. 22.7. Сосуд объема V заполнен электромагнитным излучением при температуре Т, давлении ρ = —СТХ (где С — постоянная). Его ό энергия U = 3pV. (a) Записав форму тепла dU + ρ dV в виде а = Τ dS, найдите выражение для S через ρ и V. (b) Предположим, что начальный объем сосуда равен Vo, а температура То. Объем увеличивается адиабатически до величины 64 Vo. Определите конечную температуру и работу, выполненную при расширении. 22.8. (а) В машине Карно тепло поглощается при температуре 4То, а отдается при температуре То- Какова максимальная доля поглощенного тепла, которая может быть преобразована в полезную работу? (Ь) Предположим, что эта же машина работает как холодильник. Если тепло Q поглощается при более низкой температуре То, то какую работу необходимо затратить для этого холодильника? 22.9. Система из N протонов, каждый из которых имеет магнитный дипольный момент μ, помещена во внешнее магнитное поле Н. Разумно полагать, что Η — единственная конфигурационная переменная. Магнитный момент системы протонов Μ и соответствующая энергия U при больших температурах Τ хорошо аппроксимируются формулами м _ Νμ2Η _ Ν(μΗ)2 кТ ' кТ " Работа, совершенная системой, определяется выражением W = J Μ dH. Поглощенное тепло равняется AU + W. Получите выражение для энтропии S через Τ и Н. 22.10. Рассмотрим систему, у которой объем V — единственная конфигурационная переменная. Докажите следующие соотношения. дТ\ = /др\ <uv ) адиабат. Vоа / V=c
Задачи 1191 (Ь) W)„30TepM. My* изотерм. (Указание: используйте равенство dT A dS = dp A dV.) 22.11. «Свободная энергия Гельмгольца» F для системы связана с внутренней энергией U соотношением F = U — TS. (a) Покажите, что если система взаимодействует с окружением изотермически, то свободная энергия F равна работе, совершенной над системой. (b) Предположим, что F записана как функция V и Т. Вычислите ее частные производные по этим переменным. (c) Найдите функцию F(V, T) для идеального одноатомного газа из упражнения 22.5. 22.12. Пусть К = -гг-г- — обозначает изотермическую сжимаемость, V dT A dp dV Adp иа = -—; — обозначает коэффициент теплового расширения V dt A dp при постоянном давлении. Докажите соотношение Cp = Cv+VT^. 22.13. Для одноатомного газа из упражнения 22.5 получите явное выражение для функции Ζ (β, V). Вычислите ее частные производные и покажите, что они равны — U и βρ соответственно. 22.14. Предположим, что энтропия системы S зависит только от ее внутренней энергии U согласно формуле S = NiU/Ua)1/2. Получите выражения для теплоемкостей этой системы в зависимости от температуры. 22.15. Рассмотрим систему трех частиц. Две из них — неразличимые бозоны, а третья — какая-то другая частица. Каждая частица может находиться в одном из трех состояний, причем все они имеют одинаковую энергию. (a) Какова вероятность того, что все три частицы находятся в одном состоянии? (b) Какова вероятность того, все три частицы находятся в разных состояниях?
1192 Глава 22. Термодинамика 22.16. Для классического магнитного диполя с моментом μ в магнитном поле Η энергия равна U = — μίΐοοβθ, где θ — угол между этими векторами. Вычислите функцию разбиения этой системы, интегрируя по всевозможным направлениям. 22.17. Рассмотрим систему, у которой есть три состояния с энергиями —ε, Ο и ε. Предположим, что ожидаемое значение энергии равно ε. Определите вероятности этих трех состояний. 22.18. Предположим, что в системе есть одно состояние с энергией —ε, два состояния с энергией 0 и одно состояние с энергией ε. Если 1 ожидаемое значение энергии равно ——ε, то каковы вероятности о этих состояний? 22.19. Пусть в системе есть только два состояния: одно с энергией —ε, другое с энергией ε. Найдите функцию разбиения этой системы и используйте ее для определения энергии U и энтропии S в зависимости от температуры Т. Приложение: доказательство теоремы о нормальной форме 1. Ранг 1-формы Сначала определим ранг 2-формы. Пусть Ω — 2-форма. Для каждого положительного целого числа к можно рассмотреть 2А:-форму Ω^ΩλΩΛ — ΛΩ (к раз). Для каждой точки χ пусть к будет таким неотрицательным целым числом, что (Qk)x φ 0, но (Qk+1)x = 0. Вообще говоря, целое число к может меняться от точки к точке. Ранг формы Ω в точке χ равен 2к. Нам, главным образом, интересны формы постоянного ранга, когда 2к не зависит от х. Если 2к = 0, то Ω = 0. Тогда форма Ω = dx f\dy имеет ранг 2, поскольку Ω φ 0, в то время как Ω2 = 0. Форма Ω = dx Л dy + du Л dv имеет ранг 4, поскольку Ω2 = 2dx Л dy Л du Л dv φ 0,
Приложение 1193 но Ω3 = 0. (Здесь мы предполагаем, что х, у, и, ν и т.д. — независимые функции.) А теперь определим ранг 1-формы. Это немного сложнее, поэтому воспользуемся индукцией. Если ω = 0 в точке х, то мы говорим, что ранг ω в χ равен 0. Если ωχ φ 0, но άωχ = 0, то мы говорим, что ранг ω в точке χ равен 1. Если ωχ φ 0 и άωχ φ 0, но ωχ Λ άωχ = 0, то ранг ω в точке χ равен 2. В общем случае мы ищем такое положительное целое число к, что ωχ Л (dw)J;-1 φ 0, но ωχ Λ {άωγχ = 0. В этой ситуации существует две возможности. Если (άω)χ φ 0, то ранг ω в точке χ равен 2к. Если (άω)χ = 0, то ранг ω в точке χ равен 2к — 1. Конечно, таким образом ранг ω определен в каждой точке х. Нам интересны только те случаи, когда ранг постоянный. Поэтому на самом деле мы имеем в виду, что: ранг ω равен 2к + 1, если ω Λ (du)k нигде не обращается в нуль, а (άω) +1 тождественно равна нулю; ранг ω равен 2к, если (du;)k нигде не обращается в нуль, но везде выполняется тождество ω Λ (άω) = 0. Если к этому тождеству применить оператор d, то (du)k+1 тождественно равна нулю. Итак, если 1-форма ω имеет ранг 2к или 2к +1, то 2-форма άω имеет ранг 2к. Примеры. Нулевая форма имеет ранг 0; dxQ имеет ранг 1, потому что d(dxo) = 0, откуда следует к = 0; xi dx2 имеет ранг 2 в области χι φ 1, потому что форма ά(χχ dx2) = dx\ Л dx2 имеет к = 1 и xi dx2 Л dxi Л dx2 = 0; dxQ + χι dx2 имеет ранг 3, потому что d(dxo + x\ dx2) = dx\ Л dx2 имеет к = 1, в то время как (dxo + χι dx2) Л dx\ Л dx2 = dxQ Л dx\ Л dx2 φ 0. В общем случае очевидно, что dxQ + х\ dx2 + хг dx4 Η h X2k-i dx2k
1194 Глава 22. Термодинамика имеет ранг 2к + 1, а χι dx2 + хг dx4 Η + X2k-i dx2k имеет ранг 2к в области, где не все X2fe-i равны нулю. В этом приложении мы хотим доказать, что это фактически единственные примеры. А именно, если ω — линейная дифференциальная форма постоянного ранга 2к, то всегда можно найти такие локальные координаты χχ, Х2, ■ ■ ■, £2Ь что ω = х\ dx2 + хг άχ± -\ Ь X2k-i dx2k, а если ранг ω равен 2к + 1, то всегда можно найти такие координаты Х0,Х1,Х2,... ,Х2к, ЧТО ω = dxQ + χι dx2 + хз dx4 Η h %2k-i dx2k- Это и есть тот факт, по модулю которого мы доказали теорему Каратеодори. 2. Сведение к теореме Дарбу Как можно заключить из предыдущей теоремы, всегда можно ввести такие координаты, что άω = dxi Л dx2 + dx^ Л dx± -\ + dx2k-i Л dx2k- Теорема Дарбу (ее мы докажем позднее в этом приложении) утверждает, что если Ω — любая замкнутая 2-форма постоянного ранга 2к, то всегда можно ввести такие координаты, что Ω = dxi Л dx2 + dxs Л dx± + · · · + dx2k-i Л dx2k· Давайте допустим, что эта теорема доказана, и с ее помощью получим теорему о нормальной форме. Если ранг ω нечетный, то это совсем просто. Действительно, άω — замкнутая 2-форма ранга 2к, поэтому можно записать ее в виде άω = άχ\ Λ άχ2 + άχ% Λ άχ± + · · · + ax2k-i Л ах2к = ά(χι άχ2 + хг άχ4 Η + ^2fe-i dx2k, так что ά(ω - (χι άχ2 + хг άχ± Η h X2fe-i dx2k)) = 0.
Приложение 1195 Откуда, в силу леммы Пуанкаре, имеем ω - (χι dx2 + хз dx4 Η h X2k-i dx2k) = dxQ, где xq — некоторая функция. Тогда ω = dxQ + χι dx2 + хз dx± Η + X2k~i dx2k- Но мы предположили, что ω Л (du)k = dxo Л dxi Л dx2 Л · · · Л dx2k-i Л dx2k не равняется нулю. Следовательно, dxQ не зависит от остальных dxi, и можно использовать χο,χχ,Χ2, ■ ■ ■ ,Х2к в качестве координат. Итак, с учетом теоремы Дарбу о замкнутых 2-формах, это доказывает теорему о нормальной форме для линейных дифференциальных форм нечетного ранга. Для форм четного ранга доказательство несколько сложнее. Мы докажем, что если форма ω имеет постоянный ранг 2к, то можно найти такую положительную функцию /, что ω = fa, где форма σ имеет ранг 2к — 1. Если теперь применить теорему о нормальных формах нечетного ранга, то можно написать σ = dxo + wi dx2 Η + w2k-3 dx2k-2, где xo, wi, X2, ws и т.д. — координаты. Тогда ω = f dxQ + fwi dx2-\ = xi dx% + x% dx4 -\ h X2k-i dx2k, если положить XI = fWl, ХЗ = 1^3, ..., X2fe-3 = /W2fc-3, %2k-l = f, X2k = XQ· В силу того, что (du)k φ 0, внешнее произведение всех dxi не равно нулю, так что dxi линейно независимы во всех точках, и Xi
1196 Глава 22. Термодинамика образуют часть системы координат. Следовательно, мы должны доказать, что ω = fa, где σ имеет ранг 2к—1 и / положительна. С этой целью воспользуемся теоремой Дарбу (пока не доказанной) и напишем άϋ - dyi Л dy2 + ώ/з Л dy4 Η Ь dy2fc-i Л dy2k, где yi, ■ ·. ,уп — подходящие локальные координаты. Можно использовать эти координаты и написать ω = οι dyi + θ2 ώ/2 Η h an dyn. Тогда поскольку ω Λ {du)k = 0, все Oj = 0 для г > 2к. Из записи формы άω следует, что все Oj для г ^ 2к не зависят от переменных 2/2/с+ъ · · · > Уп, поскольку иначе в выражении для άω мы получили бы ненулевые коэффициенты при dyi Л dyj, где г ^ 2к и j > 2к. Итак, доказывая теорему о нормальных формах четного ранга 2к, можно предположить, что мы работаем в пространстве Ш2к. (Все остальные переменные роли не играют.) Итак, ω Λ (du)k~1 — ненулевая форма степени 2к — 1 в пространстве R2k. Следовательно, в каждой точке своей области определения она задает прямую, т. е. одномерное пространство всех решений уравнения τ(ξ)[ωΛ(άω)Ιί-1} = 0. Таким образом, ω Λ {άω)^1 определяет «элемент поля направлений», другими словами, систему обыкновенных дифференциальных уравнений. Давайте выберем (2к — 1)-мерную поверхность и будем рассматривать точки этой поверхности как начальные условия. Тогда каждая точка вблизи гиперповерхности лежит на единственной кривой решения, и поэтому соответствует определенному моменту времени t (параметр кривой) и определенной точке (начальное условие) на гиперповерхности. Если на гиперповерхности ввести координаты zi,..., £2fc-i> TO t,zi,...,Z2k-i будут локальными координатами в пространстве Ш2к. В этих координатах ξ = d/dt. Другими словами, формы ω Л (du)k~l и dz\/\dz2/\···/\dz2k-i определяют один и тот же элемент поля направлений. Тогда ω Л (du)k~1 — д dz\ Л dz2 Л · · · Л dz2k-i,
Приложение 1197 где д — функция, нигде не обращающаяся в нуль. Можно при необходимости заменить ζχ на —ζχ и считать, что д — положительная функция. Пусть fk = д. Если определить форму а равенством ω = fa, то άω = df Л а + f άσ, откуда ω Λ άω — f2a Λ da. Далее, находим ω Л (dw)k~l = fka Λ {da)k~x = gάζχ Λ dz2 Λ · · · Λ dz2k-i- Тогда а Л (da)fe_1 = άζχ /\dz2 /\- ■■ /\ dz2k-i- Действуя оператором d на обе части этого уравнения, получаем (da)k = 0. Другими словами, а — форма ранга 2к — 1. Это доказывает теорему о нормальной форме в предположении теоремы Дарбу. 3. Доказательство теоремы Дарбу Для доказательства этой теоремы сделаем ряд редукций. Начнем с замкнутой 2-формы Ω ранга 2к в n-мерном пространстве. Предположим, что η > 2к. Можно выбрать такое векторное поле ξ, что ί(ξ)Ω = 0. Тогда, как и раньше, можно (решая систему обыкновенных дифференциальных уравнений) ввести координаты ух,... ,уп~1, t такие, что ξ = d/dt. Поскольку г(£)Г2 тождественно обращается в нуль, форма Ω не содержит dt, если записать ее в этих локальных координатах, т. е. Ω = 22 aij dyi Л dyj. Но тогда уравнение сШ = 0 означает, что все da^jdt = 0, так как иначе в άΩ, будут несокращаемые члены (ddij/dt)dt Л dyi Л dyj. Таким образом, ац зависят только от у χ,... ,yn-i- Другими словами, на самом деле Ω — 2-форма в (п — 1)-мерном пространстве
1198 Глава 22. Термодинамика координат yi. Если η — 1 > 2к, то можно повторить процедуру и убрать дополнительные координаты, т. е. при доказательстве теоремы Дарбу можно предположить, что 2к — п. Утверждается, что это условие означает, что форма Ω несингулярна в каждой точке в том смысле, что если ΐ(ξρ)Ωρ = О для касательного вектора ξρ в точке р, то ξρ = 0. Действительно, из этого уравнения очевидным образом следует, что ΐ'($η)[ΩΛΩΛ···ΛΩ]ρ = 0. к раз Но [Ω Λ Ω Л · · · Л Ω]ρ — η-форма в n-мерном пространстве, а пространство η-форм одномерно. Поскольку мы предположили, что η-форма [Ω Λ Ω Л · · · Л Ω]ρ φ 0, то ξρ = 0. (Это следует на самом деле из того, что в n-мерном пространстве условие несингулярности Ω эквивалентно условию, что эта форма имеет ранг п.) Сказать, что Ω несингулярна, можно и по-другому: пхп матрица (о^(у)), возникающая в выражении Ω = ^ а^ dyi Л dyj, несингулярна для всех у. Доказательство теоремы Дарбу разобьем на две части. (a) Дифференциально-геометрическая часть, в которой утверждается, что всегда можно провести локальную замену координат так, чтобы в новых координатах матрица {a,ij{y)) была постоянной, т. е. все матричные элементы Ojj не зависели от у. (b) Алгебраическая часть, в которой утверждается, что можно сделать линейную замену координат так, чтобы постоянная матрица (ац) имела вид /о -ι 0 υ ι о \ 0 0 Это — теорема о кососимметричных билинейных формах в векторном пространстве, которую мы докажем по индукции. 0 \ о 0 -ι, 1 0 /
Приложение 1199 Предположим, что V — двумерное векторное пространство и Ω — невырожденная билинейная форма в этом пространстве. Пусть и — произвольный ненулевой вектор в V. Тогда линейная форма ι(ιι)Ω = Ω(ιι,·) является ненулевой линейной формой в силу невырожденности Ω. Следовательно, можно найти такой вектор ν, что Щи, ν) = 1. Если в качестве базиса пространства V взять и и v, a dy\ и dy2 образуют дуальный базис, то Ω = dyi Л dy2, что мы и хотели получить. Пусть теперь V — n-мерное пространство, и η — четное число > 2. Возьмем те же и и ν, что и раньше, и пространство Vi, натянутое на эти вектора. Тогда V = Vi®V1±, где Vi~ обозначает ортогональное дополнение по отношению к Ω. Ограничение Ω до Vj1 невырождено. Поэтому желаемый базис пространства V^- можно найти по предположению индукции. Тогда разложение в прямую сумму вместе с результатом для двумерного случая доказывает теорему для пространства V. Получим теперь геометрический результат (а). Если матричные элементы ац(у) зафиксировать в какой-то точке уо, то получим невырожденную 2-форму Ωο, совпадающую с W в точке уо· Таким образом, достаточно доказать следующее. Пусть Ωι и Ωο — две замкнутые невырожденные 2-формы, которые совпадают, например, в 0. Тогда существует диффеоморфизм /, определенный в окрестности 0, для которого выполняется равенство /*Ωι = Ωο. Докажем это утверждение, снова решая дифференциальные уравнения. Но здесь потребуется некоторая подготовка. Пусть Ω( = (1 — ί)Ωο + ίΩι = Ωο + ta, где σ = Ωι — Ωο·
1200 Глава 22. Термодинамика Тогда da = 0 и σ равно нулю в 0. Поскольку Ωο несингулярна, то и Ω((0) = Ωο несингулярна для всех t. Следовательно, можно найти окрестность начала координат, где Ω( несингулярна для всех 0 ^ t < 1. Переходя к меньшей окрестности (если это необходимо) можно предположить, что наша окрестность является звездной областью. Следовательно, существует определенная в этой окрестности 1-форма β такая, что σ = άβ, β(0) = 0. Следовательно, форма Ωί невырождена, и существует единственное (зависящее от t) векторное поле £t, для которого *(6)Ω* = -β- Поле £t мы рассматриваем как зависящую от времени систему обыкновенных дифференциальных уравнений. Решение этих уравнений дает нам однопараметрическое семейство диффеоморфизмов ft, для которого /о = id и касательный вектор к кривой ft{x) в момент времени t есть £((/((х))· Кроме того, Л(0) = 0 для всех t. А теперь из фундаментальной формулы дифференциального исчисления форм (глава 18) мы имеем jtf№t = ft* (jtnt + t(*t)dnt + di{tt)Qt\ = 0, поскольку dQ,t = 0, — Ω* = σ dt di(tt)ftt = -άβ = -σ. Следовательно, /ίΏι - Ω0 = /ΓΩι - /ο*Ω0 = J ^(№) dt = 0. Итак, мы получили искомый диффеоморфизм /ι, что завершает доказательство теоремы Дарбу и вместе с ней доказательство теоремы о нормальной форме, на которую мы ссылались при доказательстве теоремы Каратеодори.
Рекомендуемая литература Повторим, что приведенный ниже перечень книг следует считать не библиографией, а дополнительной литературой. Книга Loomis and Sternberg еще заметнее, чем в случае тома I, претендует на роль параллельного учебника. Мы ссылаемся на нее, когда нужны точные (или более абстрактные) математические доказательства. Точно так же Фейнмановские лекции можно считать универсальным справочником по физике. Основное алгебраическое содержание тома II составляет переход от линейной алгебры к полилинейной. Книга GREUB является ясным и аккуратным введением в эту область. В частности, в ней дается подробное описание тензорной алгебры, симметрической алгебры и алгебр Клиффорда, которых мы только касаемся. Главы 12 и 13 посвящены теории электрических цепей. Классический учебник по теории цепей — это GuiLLEMlN. В книге LORRAIN AND CORSON обсуждаются теоремы о цепях из главы 8. Мы рекомендуем ознакомиться с вероятностным аспектом теории цепей опять-таки по книге DOYLE AND Snell, а для более серьезного изучения почитать KELLY. По теории графов и ее приложениям мы рекомендуем книгу BONDY AND MURTY. В главе 14 мы даем определения гомологии и когомологий с целью ввести соответствующий язык и не вдаемся в подробности. Для знакомства с этой областью на уровне этой книги см. книгу GlBLlN, а на более высоком математическом уровне находится книга MUNKRES. После ее прочтения можно перейти к книге Вотт AND Tu, которая представляет собой великолепную и элегантную трактовку многих глубоких вопросов алгебраической
1202 Рекомендуемая литература топологии с точки зрения внешнего исчисления. Еще раз рекомендуем книгу Guillemin AND POLLACK как геометрически интуитивное и математически строгое изложение дифференциальной топологии. Приложения внешнего исчисления, изучаемого в главе 15, можно найти в книге Sternberg. Главы 16-19 посвящены электричеству и магнетизму. Есть много замечательных книг по этому предмету. Наиболее доступен на уровне этой книги учебник PURCELL, элегантно и предельно ясно написанный, но в нем изложение ведется по принципу, отличному от нашего. В книге MlSNER ET AL. электромагнетизм обсуждается с использованием дифференциальных форм. Имеется две серии книг, где математическая физика излагается на существенно более высоком уровне, чем у нас. Это Reed and Simon и Thirring. Первая из них математическая, вторая физическая. Обе серии читать нелегко, но они того стоят. В Thirring используется внешнее исчисление. Классическим учебником по комплексному анализу является AHLFORS; его полезно прочитать после нашей главы 20. Еще одна хорошая книга — POLYA AND LATTA. Конечно, есть и многие другие. Про асимптотические методы и их связь с комплексным анализом можно прочитать в книге Olver, имеющейся в большой и маленькой версии. Книга Guillemin and Sternberg берет обсуждение асимптотики излучения из главы 21 в качестве отправной точки для изложения современной теории интегральных операторов Фурье и геометрической теории асимптотик. При этот от читателя требуется весьма серьезная математическая подготовка. Имеются сотни книг по термодинамике и статистической механике. История этой науки в форме иконоборчества имеется в книге TRUESDELL. Кстати, он категорически не разделяет ту точку зрения на термодинамику, которая принятая у нас здесь. Книга BORN является классическим полупопулярным изложением указанных тем. Наша трактовка статистической механики довольно близка к весьма объемной книге TRIBUS. Книга KlTTEL не такая толстая и более элементарна, чем наше изложение. Стандартным учебником является Reif, а в книге Thompson хорошо
Рекомендуемая литература 1203 изложены различные вопросы с более выраженных математических позиций. В этом курсе мы не занимались квантовой механикой, не считая краткого упоминания о квантовой логике в самом конце. Лучшее введение в этот предмет с математической точки зрения — книга MACKEY. Подробное обсуждение квантовой логики на высоком научном уровне содержится в VARADARAJAN. Книга Вонм — это сбалансированное и выверенное изложение, затрагивающее многие приложения. Другое доступное введение в данную область — SUDBERY. Хинчин А. Я. Математические основания теории информации. — Физ- матгиз, 1954. Ahlfors L. V. Complex Analysis. An Introduction to the Theory of Functions of One Complex Variable. — New York: McGraw-Hill, 1978 (3rd ed.). (International Series in Pure and Applied Mathematics.) Вонм A. Quantum Mechanics: Foundations and Applications. — New York: Springer, 1993 (3rd ed.); reprinted 2001. (Texts and Monographs in Physics.) Bondy J. A. and Murty U. S. R. Graph Theory with Applications. — New York: American Elsevier, 1976. Born M. The Natural Philosophy of Cause and Chance. — Oxford Univ. Press, 1964. Вотт R. and Tu L. W. Differential Forms in Algebraic Topology. — New York: Springer, 1982. (Graduate Texts in Mathematics, 82.) Русский перевод: Ботт Р., Ту Л. В. Дифференциальные формы в алгебраической топологии. — М.: Наука, 1989. Doyle P.G. and Snell J.L. Random Walks and Electric Networks. — Washington, DC: Mathematical Association of America, 1985. (Carus Mathematical Monographs, 22.) Feynman R. P., Leighton R. B. and Sands M. The Feynman Lectures on Physics. Vol. 1-3. — Reading, MA: Addison-Wesley, 1963-1965. Русский перевод: Фейнман Р. П., Лейтон Р. Б. и Сэндс М. Фейн- мановские лекции по физике. Вып. 1-9. — М.: Мир, 1965-1967. Feynman R. P. Statistical Mechanics. A Set of Lectures. — Reading, MA: Perseus Books, 1998 (reprint of the 1972 original). Giblin P.J. Graphs, Surfaces and Homology. An Introduction to Algebraic Topology. — London: Chapman & Hall, 1981 (2nd ed.).
1204 Рекомендуемая литература GREUB W. Multilinear Algebra. — New York: Springer, 1978 (2nd ed.). (Universitext.) Guillemin E. A. Introductory Circuit Theory. — Wiley, 1953. Guillemin V. W. and Pollack A. Differential Topology. — Englewood Cliffs, NJ: Prentice-Hall, 1974. Guillemin V. W. and Sternberg S. Geometric Asymptotics. — Providence, RI: Amer. Math. Soc, 1977. (Mathematical Surveys, 14.) Русский перевод: Гийэмэн В. и Стернберг Ш. Геометрические асимптотики. — М.: Мир, 1981. Kelly J. P. Reversibility and Stochastic Networks. — Chichester: Wiley, 1979. (Wiley Series in Probability and Mathematical Statistics.) Kittel C. Thermal Physics. — W. H. Freeman, 1980. Lax P.D. and Phillips R. S. Scattering Theory. — Academic Press, 1967; 1989 (2nd ed.). Русский перевод: ЛакС П. Д. и Филлипс Р. С. Теория рассеяния. — М.: Мир, 1971. Loomis L. Η. and Sternberg S. Advanced Calculus. — Boston, MA: Jones and Bartlett, 1990 (revised ed.). Lorrain P. and Corson D. R. Electromagnetic Fields and Waves. — W.H.Freeman, 1988 (3rd ed.). Mackey G. W. The Mathematical Foundations of Quantum Mechanics. — Mineola, NY: Dover, 2004 (reprint of the 1963 original). Marion J. B. and Heald M. A. Classical Electromagnetic Radiation. — New York: Academic Press, 1980 (2nd ed.). Misner С W., Thorne K. S. and Wheeler J. A. Gravitation. — San Francisco, CA: W.H.Freeman, 1973. Русский перевод: Мизнер Ч., Торн К. и Уилер Дж. Гравитация. Т. 1-3. - М.: Мир, 1977. Munkres J. R. Elements of Algebraic Topology. — Menlo Park, CA: Addison-Wesley, 1984. Olver F.W.J. Asymptotics and Special Functions. — Wellesley, MA: AKPeters, 1997 (reprint of the 1974 original). Русский перевод: ОлВЕР Ф. Асимптотика и специальные функции. — М.: Наука, 1990. Polya G. and Latta G. Complex Variables. — New York: Wiley, 1974. Purcell E. Electricity and Magnetism. — McGraw-Hill, 1965. Reed M. and Simon B. Methods of Modern Mathematical Physics. Vol. I-IV. — New York: Academic Press, 1972-79.
Рекомендуемая литература 1205 Русский перевод: Рид М. и Саймон Б. Методы современной математической физики. Т. 1-4. — М.: Мир, 1977-82. Reif F. Fundamentals of Statistical and Thermal Physics. — McGraw-Hill, 1965. Ross S. M. Introduction to Probability and Statistics for Engineers and Scientists. — Burlington, MA: Academic Press, 2000 (2nd ed.). Scott W. Physics of Electricity and Magnetism. — Wiley, 1977. Sommerfeld A. Electrodynamics. Lectures on Theoretical Physics, Vol. III. — New York: Academic Press, 1952. Sternberg S. Lectures on Differential Geometry. — New York: Chelsea, 1983 (2nd ed.). Русский перевод: СтЕРНБЕРГ Ш. Лекции по дифференциальной геометрии. — М.: Мир, 1970. Sudbery A. Quantum Mechanics and and the Particles of Nature. — Cambridge University Press, 1986. Thirring W. A Course in Mathematical Physics. Vol. 1-4. — New York- Vienna: Springer, 1978-83. Thompson C. J. Mathematical Statistical Mechanics. — Princeton Univ. Press, 1972; reprinted 1979. Tribus M. Thermostatics and Thermodynamics. — Van Nostrand, 1961. Truesdell C. A. The Tragicomical History of Thermodynamics, 1822- 1854. — New York - Berlin: Springer, 1980. (Studies in the History of Mathematical and Physical Sciences, 4.) Varadarajan V. S. Geometry of Quantum Theory. — New York: Springer, 1985 (2nd ed.).
I I
Предметный указатель σ-алгебра, 1137 /с-форма, см. дифференциальная форма степени к 0-коцепь, 604 0-цепь, 591 1-коцепь, 604 1-форма, см. дифференциальная форма линейная — критическая, см. экстремаль 1-цепь, 591 2-форма, 386, 412 4-импульс, 228 —, закон сохранения, 229 4-потенциал, 983 А аберрация, 436 — сферическая, 437 абсолютная константа, см. скорость света абсолютная температура, 1097, 1111 абстрактная температура, 1103 адиабатическая кривая (адиабата), 1104 адиабатически замкнутая система, 1104 алгебра, 948 — йг-градуированная, 958 — ассоциативная, 928, 948 — внешняя (A(V)), 947, 952 — Дирака, 931 — измеримых множеств, 1137 — кватернионов, 930 — Клиффорда, 928, 951 — матриц (и линейных преобразований), 34 — с единицей, 948 — тензорная (T(V)), 949 алгебраическое дополнение элемента матрицы, 560 ампер, 576 Ампера закон (второй), 886 — в форме Максвелла, 971 аналитическая функция, 1004 аналитическое продолжение, 1025 аннулирующее пространство (аннулятор), 492, 606 ансамбль статистический, 1154 антикоммутативность, 756 антикоммутационные соотношения, 926 аппроксимация дискретного распределения непрерывным, 819 атлас карт многообразия, 790 аффинная плоскость, 2 аффинное преобразование, 23 аффинное пространство (ассоциированное с векторным пространством), 12 Б базис, 14, 55, 488 — дуальный, 491 — ортонормированный, 177
1208 Предметный указатель базисы — подобные, 398 — противоположные, 398 Бесселя функция, 1087, 1088 биения, 194 билинейная функция, 379, 750 билинейное отображение, 937 близнецов парадокс, 217 Бозе-Эйнштейна распределение, 1172 бозоны, 1142 Больцмана-Пуассона распределение, 1172 борновское разложение, 270 Ботта периодичность, 968 бутылка Клейна, 723 В вакуум —, диэлектрические свойства, 840 —, конститутивные соотношения, 972 вариационный принцип,984 вариация постоянных, 149 ведущий элемент строки матрицы, 507 Вейля метод ортогональных проекций, 645, 848 вектор — касательный, 286 — Пойнтинга, 987 — энергии-импульса, см. 4-импульс векторное поле, 866 векторное произведение, 934, 937 векторное пространство, 6, 10, 476 —, базис, 488 — двумерное, 55 — дуальное, 479 — касательное, 290 — линейных преобразований, 944 —, натянутое на множество векторов, 484 — одномерное, 13 —, подпространство, 480 —, размерность, 486 — свободное над множеством, 941 — симплектическое, 461 — универсальное, 942 вероятность (мера), 1139 вечный двигатель второго рода, 1113 взаимодействие, 1101 — адиабатическое, 1104 вихрь (rot), 934 внешнее произведение, 383, 756 внешняя алгебра (A(V)), 947, 952 внешняя производная, 379 внешняя степень, 749, 754, 946 внутреннее произведение, 872 внутренняя энергия, 1096, 1105, 1171 — состояния, 1154 волна — обратная (падающая), 990, 993 — прямая (испускаемая), 990 — распространяющаяся, 988 — расходящаяся, 992 волновой оператор, 974 волновой пакет, 1080 волновой фронт, 988 вольт, 576 вольт-амперная характеристика, 577 время — истинное (по Ньютону), 15 — собственное, 372 вторичное излучение, 993, 1085 второй закон термодинамики, 1097, 1107 вынужденные колебания, 148 —, резонанс, 154 вырожденная матрица, см. линейное преобразование сингулярное вычет функции, 1012 Г газовая постоянная, 1123 Галилея преобразование, 221 Гамильтона теорема, 452 Гамильтона уравнения, 452 Гамильтона-Кэли теорема, 86
Предметный указатель 1209 гамма-распределение, 1168 гамма-функция, 1066 гармоническая функция, 844 — сопряженная, 1053 Гаусса закон (о потоке поля), 663, 731, 825 гауссово разложение, 448 гауссово распределение, 1039 Гельмгольца формула, 991, 1084 генри, 577 геометрия — конформная, 932 — риманова, 933 гессиан, 313 Гиббса принцип минимальной энергии, 1132 гиперболические синус и косинус, 213 главная ветвь, 1036, 1039 главное значение Коши, 1042 главные плоскости, 448 голоморфная функция, 1004 гомеоморфные пространства, 715 гомологии, 709 градиент (grad), 934 Грама-Шмидта процесс, 176 граница, 708 граница области, 415 граничное отображение, 591 граничный оператор, 707, 820 Грина оператор, 678 Грина теорема взаимности, 657 Грина формула, 415 — вторая, 843 — дискретная, 679 — дискретная вторая, 682 — первая, 842 Грина функция, 851 — дискретная, 678 групповая скорость, 1080 Гюйгенса принцип, 993 — в формулировке Френеля, 1086 д давление, 1106 Дарбу теорема (о 2-формах), 1194 движение евклидово, 213 двухступенчатый фильтр, 634 дельта-функция Дирака, 823 дерево, 597 — максимальное, 599 детерминант, см. определитель дефект линейного преобразования, 503 диаграмма Мол лье, 1126 диатермальный контакт, 1101 дивергенция (div), 758, 934 Дирака алгебра, 931 Дирака дельта-функция, 823 Дирихле задача, 830, 849 — дискретная (для цепи), 668 дискриминант квадратичной формы, 184 дисперсия, 1167 дифракция, 434 дифференциал, 250, 254 дифференциальная форма — замкнутая, 367, 385, 792 — комплекснозначная, 1003 — линейная (1-форма), 277 — степени к, 749, 757 — степени 2 (2-форма), 386, 412 — точная, 363, 792 дифференциальное уравнение —, интегральная кривая, 135 — Лапласа, 317 — линейное неоднородное, 148 , установившееся решение, 152 — линейное однородное, 125 , начальные условия, 128 , общее решение, 127 —, фазовый портрет, 135 дифференцируемое отображение, 250 —, регулярная точка, 524 —, сохраняющее ориентацию, 401 диэлектрическая постоянная, 840 диэлектрическая проницаемость, 579, 836 длина — вектора, 166, 371 лоренцева, 372
1210 Предметный указатель — кривой, 372 — оптическая, 452 доктрина скрытого и явного тепла, 1117 дуальное пространство, 479 дуальный базис, 491 Ε евклидова плоскость, 165 евклидово преобразование, 23, 166 единичная матрица, 35 емкость, 577 3 задача — Дирихле, 830, 849 дискретная (для цепи), 668 — Пуассона дискретная (для цепи), 669 закон — Ампера (второй), 886 в форме Максвелла, 971 — Гаусса (о потоке поля), 663, 731, 825 — Кеплера второй, 274 — об отсутствии «магнитных зарядов», 886 — сложения скоростей, 214 — Снеллиуса, 436 линеаризованный, 442 — сохранения,986 4-импульса, 229 углового момента, 273 энергии, 987 — термодинамики второй, 1097, 1107 нулевой (о равновесии), 1103 первый, 1096, 1104 — умножения определителей, 559 — Фарадея, 731, 969 законы — идеального газа, 1123 — Кирхгофа, 580, 592, 612, 882 запаздывающие потенциалы, 982 заплатки, см. атлас карт многообразия зародыш коцепи, 746, 817 заряд, 576 — «магнитный», 886 —, распределение (плотность), 818 —, скорость потока, 875 затухание — апериодическое, 146 — критическое, 145 звездное множество, 799 звездный оператор (*), 837, 903 Зоммерфельда условия излучения, 992 И идеал, 950 идеальный газ, 1123 идемпотентный оператор, 650 излучение — вторичное, 993, 1085 —, Зоммерфельда условия, 992 — монохроматическое, 993 измеримое пространство, 1137 —, произведение, 1144 изоморфизм векторных пространств, 14, 56 изотерма, 1104 изотропная среда, 837 импеданс, 590 инволюция, 956 индекс строки матрицы, 507 индикатор (функция), 1186 индуктивность, 577 индуктор, 576 интеграл —, главное значение Коши, 1042 — двойной абсолютный (первого рода), 391 от 2-формы (второго рода), 389 — криволинейный абсолютный (первого рода), 371
Предметный указатель 1211 от 1-формы (второго рода), 355 — Лебега, 1139 — несобственный, 428 — от /с-формы, 765, 774 — по мере, 1138 — Френеля, 1039 интерференция, 435 источник питания, 612 К калориметр, 1095 «калорическая» функция, 1095 каноническое преобразование, см. симплектическое отображение Каратеодори теорема, 1094 Карно цикл, 1114 касательное пространство, 290 касательный вектор, 286 квадратичная форма, 184 квадратичная функция, 191 квазистатический процесс, 1106 квантовая логика, 1187 квантовая система, 1184 кватернионы, 930 кельвин (градус), 1123 Кеплера закон второй, 274 Кирхгофа законы, 580, 592, 612, 882 Кирхгофа теорема, 603, 626 Клейна бутылка, 723 Клиффорда алгебра, 928, 951 коаксиальный луч, 438 когомологии, 731 — де Рама, 793 кограница, 793 кограничное отображение ограниченное, 608 кограничный оператор, 729 количество информации, 1160 коммутатор пары матриц, 271 комплекс — двумерный, 705 — одномерный, 590 — размерности п, 706 — связный, 595 композиция отображений, 20 конденсатор, 577 конститутивные соотношения (для вакуума), 972 контакт, 1131 — диатермальный, 1101 конфигурационные переменные, 1104 конформная геометрия, 932 конформная матрица, 80 кососимметричность, 750, 752 коцепь, 604, 728 коцикл, 792 Коши теорема интегральная, 1003 Коши теорема о вычетах, 1012 Коши формула интегральная, 1015 Коши-Римана уравнения, 1005 Коши-Шварца неравенство, 233 коэффициент — полезного действия (КПД), 1114 — преломления, 436 — сжимаемости, ИЗО — теплового расширения, ИЗО кривая — адиабатическая, 1104 — нулевая, 1090 — обратимая, 1106 кривизна, 441, 443 круговой ток, 601 кулон, 576 Л Лагранжа множитель, 318 лагранжево подмногообразие, 1128 лагранжиан, 983 Лапласа принцип, 1072 Лапласа уравнение, 317 лапласиан, 317 — G, 911 — дискретный (для цепи), 664 — ограниченный, 666 Лебега мера и интеграл, 1139 Лежандра полиномы, 180 Лейбница правило, 881 Лейбница формула (производная произведения функций), 263
1212 Предметный указатель лемма — Морса, 339 — Пуанкаре, 797 линейная зависимость векторов, 9, 47, 483 линейное преобразование, 28, 57 —, изменяющее ориентацию, 401 — конформное, 77, 1007 — Лоренца, 210 собственное, 209 —, матрица, 29 —, норма, 308 — ортогональное, 166 — регулярное (несингулярное), 28 — симплектическое, 231, 460 — сингулярное, 28 — скорости, 221 — сопряженное, 526 —, сохраняющее ориентацию, 400 — транспонированное, 183 линза — тонкая, 443 —, фокальные плоскости, 445 —, фокусное расстояние, 444 лист Мёбиуса, 723, 737 Лиувилля теорема, 1021 логики дистрибутивный закон, 1186, 1187 Лорана ряд, 1051 Лоренца преобразование, 210 — собственное, 209 Лоренца сила, 988 Μ магнитная восприимчивость, 886 магнитная индукция, 885 магнитное поле (возбуждение, напряженность), 886, 971 магнитные силовые линии, 885 Максвелла методы анализа цепей, 580 Максвелла распределение, 1152 Максвелла уравнения, 972, 984 Максвелла-Больцмана распределение, 1165, 1174 Маркова процесс, 93 —, матрица вероятностей перехода, 95 масса покоя, 228 Массье функция, ИЗО, 1157, 1170 масштабное преобразование, 932 математическое ожидание, 1151 матрица —, ведущий элемент строки, 507 — вероятностей перехода, 95, 684 — вращения, 564 — Гессе, 313 — единичная, 35 — емкостных коэффициентов, 688 — замены базиса, 58, 490 —, индекс строки, 507 — конформная, 80 — линейного преобразования, 29 , зависимость от базиса, 29 — обратная, 45 —, определитель, 549 — оптическая , гауссово разложение, 448 общего вида, 448 преломления, 442 распространения, 441 — ортогональная, см. линейное преобразование ортогональное — потенциальных коэффициентов, 688 — присоединенная, 562 —, редукция по строкам, 506 — симплектическая, см. линейное преобразование симплектическое — сингулярная (вырожденная), см. линейное преобразование сингулярное — транспонированная, 183 —, функция от, 115 — Якоби, 303, 407 Мёбиуса лист, 723, 737 мера, 1137 — «беспорядка», 1159 — вероятностная, 1139
Предметный указатель 1213 — гауссова (дискретная и непрерывная), 1143 — Жордана, 767 — Лиувилля,1143 —, перенос (pushforward), 1146 мероморфная функция, 1012 метод — вариации постоянных, 149 — Гаусса, см. редукция по строкам — Кирхгофа расчета цепи, 650 — круговых токов (Максвелла), 587, 613, 622 — множителей Лагранжа, 317 — Ньютона, 323 — ортогональных проекций Вей ля, 645, 848 — Пикара, 325 — узловых потенциалов (Максвелла), 588, 614, 624 — эквивалентных сопротивлений, 584 механический эквивалент тепла, 1105 Минковского расстояние, 216 многообразие, см. подмногообразие — равновесных состояний, 1101 Моллье диаграмма, 1126 Морса лемма, 339 Муавра теорема, 81 Η наблюдаемое, 1149, 1170 — «да или нет», 1185, 1187 — квантовое, 1184 накрытие, 1035, 1039 напряжение, 576 — холостого хода, 612 напряженность — магнитного поля, 971 — электрического поля, 824 неравенство — Коши-Шварца, 233 — треугольника, 216 обратное, 217 Нётер теорема, 985 низкочастотный фильтр, 632 нильпотент, 54 норма линейного преобразования, 308 нормальная мода, 628 нормальное распределение, 1039 нормальные колебания, 192 нулевая кривая, 1090 нулевой вектор, 9 нулевой конус, см. световой конус Ньютона метод, 323 Ньютона уравнение (оптическое), 450 Ньютона-Лейбница формула, 362, 415 О область — абсолютного будущего, 208 — влияния, 976 — зависимости, 976 — звездная, 366, 799 — односвязная, 1053 обобщенные функции, 823 образ — линейного преобразования, 51, 502 — отображения, 18 обратимая кривая, 1106 обратная матрица, 45 обратное отображение, 19 обратное преобразование Фурье, 989, 1083 однородная среда, 837 ожидаемое значение, 1151, 1170, 1184 оккупанты, см. число заполнения ом, 577 оператор — волновой, 974 приведенный, 990 — граничный, 707, 820 — Грина, 678 — звездный (*), 837, 903 — идемпотентный, 650 — кограничный, 729 — Лапласа, см. лапласиан
1214 Предметный указатель — линейный дифференциальный первого порядка, 921 — рождения фермионов, 926 — самосопряженный, 1183 — уничтожения фермионов, 926 — формально сопряженный, 920 определитель (детерминант), 42, 549 оптика — волновая (теория Френеля), 434 — гауссова, 437 — геометрическая, 436 — линейная, 436 оптическая ось, 438 оптическая сила, 443 ориентация — векторного пространства, 399, 902 — комплекса, 726, 778 — многообразия, 791 — области (на плоскости), 389, 416 — параллелограмма, 387 — поверхности (в пространстве), 391 — траектории, 351 ориентированная площадь (параллелограмма), 387 ориентированный граф, 590 ориентированный объем (тг-мерного параллелепипеда), 547 ортогональная проекция, 179, 235 ортогональное преобразование, 166 ортогональность векторов, 166 ортонормированный базис, 177 ортонормировочная процедура, см. Грама-Шмидта процесс основная теорема алгебры, 1022 особая точка — полюс, 1012 — существенная, 1030 — устранимая, 1018 осциллятор — без затухания, 144 — с затуханием, 145 отображение, также функция, оператор, преобразование, 18 — аффинное, см. аффинное преобразование — биективное, 19 — билинейное, 937 — вычисления, 939 — граничное, 591 — дифференцируемое, 250 , регулярная точка, 524 , сохраняющее ориентацию, 401 — евклидово, см. евклидово преобразование — измеримое, 1145 — инъективное, 19 — Клиффорда, 951 — кограничное ограниченное, 608 — конформное, 1006 — кососимметричное, 945 — линейное, см. линейное преобразование — обратное, 19 — ограниченное, 250 — открытое, 1031 — полилинейное (к-линейное), 945 — симплектическое, 467 — сюръективное, 19 — универсальное, 937 — экспоненциальное, 1086 Π пакет волновой, 1080 параллельное соединение, 580 параметризация траектории, 352 первый закон термодинамики, 1096, 1104 перенос — меры (pushforward), 1146 — формы (pullback), 402, 761, 763 — функции (pullback), 291 периодичность Ботта, 968 перпендикулярность, см. ортогональность векторов Пикара метод, 325 Планка постоянная, 1082 Планка функция, 1127
Предметный указатель 1215 плоскость — аффинная, 2 — проективная, 72 плотность, 393 — заряда, 818 — тока (скорость потока заряда), 875 поверхность — риманова, 1035 — эквипотенциальная, 832, 1091 подкомплекс, 596 подмногообразие — векторного пространства, 523 — лагранжево, 1128 — ориентируемое, 791 подпространство векторного пространства, 480 Пойнтинга вектор, 987 показатель преломления, 438 полюс функции, 1012 поляризация света, 436 полярные координаты, 291, 370 порядок — нуля,1026 — полюса, 1012 последовательное соединение, 582 постянная Планка, 1082 потенциал — запаздывающий, 982 — Льенара-Вихерта, 983 — химический, 1134 — электростатический, 686 поток, 868 — энергии, 987 правило — Лейбница, 881 — фаз, 1136 преобразование — масштабное, 932 — Фурье, 1076 обратное, 989, 1083 приближение Борна (первое), 270 принцип — вариационный, 984 — Гюйгенса, 993 в формулировке Френеля, 1086 — Дирихле (минимума энергии), 849 — Лапласа, 1072 — максимальной энтропии, 1132 — максимума (для гармонических функций), 846 — минимальной энергии Гиббса, 1132 — причинности, 976 — устранимых особенностей, 1018 — Ферма (наименьшего времени), 457 — электрической экранировки, 831 присоединенная матрица, 562 проводимость, 580, 864 проективная плоскость, 72 проекция, 52 — ортогональная, 179, 235 произведение матриц, 31 производная — внешняя, 379, 881 — Ли (по направлению), 288, 880 — многомерная (отображения векторных пространств), см. также дифференциал, 247 — произведения функций, см. Лейбница формула — смешанная (вторая), 282 — частная, 275 производящая функция, 1129 простой (порядка 1) нуль или полюс, 1026 пространство — А;-форм, 754, 946 — аннулирующее, 606 — билинейных функций, 750 — гомологии, 709 — границ, 593, 708 — когомологий, 731 — циклов, 708 пространство-время, 205 противоположный вектор, 10 процесс — Грама-Шмидта, 176 — квазистатический, 1106
1216 Предметный указатель — Маркова, 93 , матрица вероятностей перехода, 95 прямая сумма векторных пространств, 596 Пуанкаре лемма, 797 Пуанкаре преобразование, 213 Пуассона распределение, 1169 Пуассона уравнение, 837, 915 — дискретное (для цепи), 664 — ограниченное, 664 Пуассона формула интегральная, 855, 1055 Пуассона ядро, 680 Ρ работа, 1095, 1156 — силового поля, 349 равновесие тепловое, 1102 равномерная дифференцируемость, 326 равномерная сходимость последовательности голоморфных функций, 1047 радиус сходимости, 1050 разбиение единицы, 785 разложение — борновское, 270 — гауссово, 448 размерность векторного пространства, 486 ранг — дифференциальной (1- или 2-) формы, 1192 — линейного преобразования, 503 распределение — Бозе-Эйнштейна, 1172 — Больцмана-Пуассона, 1172 — гамма-, 1168 — гауссово (нормальное), 1039 — Максвелла, 1152 — Максвелла-Больцмана, 1165, 1174 — Пуассона, 1169 — Ферми-Дирака, 1172 распространяющаяся волна, 988 расстояние Минковского, 216 регулярная точка (дифференцируемого отображения), 524 редукция по строкам, 506 резистор, 577 резисторный порт, 659 резонанс, 154, 194 резонансная частота, 628, 633 риманова геометрия, 933 риманова поверхность, 1035 род поверхности, 722 росток голоморфной функции, 1025 ротор (rot), 934 Руше теорема, 1028 ряд — Лорана, 1051 — степенной, 116 абсолютно сходящийся, 119 сходящийся, 118 — Тейлора, 1020, 1049 — Фурье, 1052 С световой конус, 210 свободное векторное пространство, 941 связное множество, 846 сила — Лоренца, 988 — обобщенная, 1156 силовое поле, 348 —, работа, 349 силовые линии магнитные, 885 сименс, 580 симплектическая группа, 232, 461 симплектическая форма, 461 симплектическое векторное пространство, 461 симплектическое отображение, 467 сингулярная (вырожденная) матрица, см. линейное преобразование сингулярное система, 1100, 1170 — адиабатически замкнутая, 1104 — квантовая, 1184
Предметный указатель 1217 скалярное произведение, 167 — в пространстве /с-форм, 900 — дуальное (1-форм), 899 — евклидово, 175 — из векторного анализа (dot product), 934 —, свойства, 169 — симплектическое, 231 скорости преобразование, 221 скорость — групповая, 1080 — звука, 1119 — потока заряда, 875 — света, 206, 973 сложения скоростей закон, 214 случайное блуждание (по графу), 684 смещение, см. трансляция аффинная Снеллиуса закон, 436 — линеаризованный, 442 собственное время, 372 собственное значение, 82 собственный вектор, 82 сопротивление, 577 — комплексное, см. импеданс — нелинейное, 578 — удельное, 864 сопряженное отображение, 526 сопряженные плоскости, 443 состояние, 1100, 1140, 1170 — квантовое, 1184 — равновесное, 1101, 1165, 1170, 1184 специальная теория относительности, 206 статистика (Бозе-Эйнштейна, Ферми-Дирака), см. распределение Стирлинга формула, 1065 Стокса теорема, 757, 777 суперкоммутативность, 756 существенная особенность, 1030 Τ Тейлора ряд, 1020, 1049 Тейлора формула (многомерная), 311 телескоп астрономический, 447 телесный угол, 822 Теллегена теорема, 605 температура — абсолютная, 1097, 1111 — абстрактная, 1103 — эмпирическая, 1103 тензор — типа (к,0), 754 — энергии-импульса, 988 тензорная алгебра (T(V)), 949 тензорное произведение, 940, 945 — скрученное, 958 теорема — алгебры основная, 1022 — взаимности Грина, 657, 687 — Гамильтона, 452 — Гамильтона-Кэли, 86 — Грина, см. Грина формула — Дарбу (о 2-формах), 1194 — Каратеодори, 1094 — Кирхгофа, 603, 626 — Коши интегральная, 1003 — Коши о вычетах, 1012 — коэффициентов Морзе, 457 — Лиувилля, 1021 — Муавра, 81 — Нётер, 985 — о кососимметрических билинейных формах, 1198 — о неявной функции, 334 — о нормальной 1-форме, 1099, 1194 — о постоянном ранге, 517 — о ранге и дефекте, 503 — о среднем значении, 305 гармонической функции, 845 многомерная (неравенство), 309 — об обратной функции, 332 — Радона-Никодима, 1149 — Руше, 1028 — спектральная (для операторов), 1183
1218 Предметный указатель — Стокса, 757, 777 — Теллегена, 605 — Эйлера для комплекса, 714 тепло, 1095 — механический эквивалент, 1105 — скрытое (латентное), 1118 тепловое равновесие, 1102 теплоемкость, 1117 термометр, 1103 ток, 576 — короткого замыкания, 612 — круговой, 601 — через поверхность, 864 тонкая линза, 443 тор, 718 точечная характеристика (оптической системы), 452 точка ветвления, 1035 траектория — кусочно-дифференцируемая, 352 — ориентированная, 351 —, параметризация,352 — простая (в цепи), 585 трансляция аффинная, 6, 25 транспонирование, 183 — формальное (оператора), 821 трилинейная функция, 752 У увеличение — линзы,446 — телескопа угловое, 447 угловой момент, 272 —, закон сохранения, 272 угол между векторами, 167 удельное сопротивление, 864 умножение матриц, 31 универсальное отображение, 937 универсальное пространство, 942 уравнение — волновое неоднородное, 981 одномерное (колебаний струны), 974 приведенное (Гельмгольца), 991 трехмерное, 977 — дифференциальное, см. дифференциальное уравнение — Лапласа, 317 двумерное, 317, 665 дискретное (для цепи), 664 — Ньютона (оптическое), 450 — Пуассона, 837, 915 дискретное (для цепи), 664 ограниченное, 664 — характеристическое, 83 уравнения — Гамильтона, 452 — Коши-Римана, 1005 — Максвелла, 972, 984 условия излучения Зоммерфельда, 992 условный экстремум, 317 устранимая особенность, 1018 Φ фаз правило, 1136 фаза волны, 988 факторалгебра, 950 факторпространство, 497 фарад, 577 Фарадея закон, 731, 969 Ферма принцип (наименьшего времени), 457 Ферми-Дирака распределение, 1172 фермионы, 1142 фильтр — двухступенчатый, 634 — низкочастотный, 632 фокальные плоскости, 445 фокусное расстояние, 444 формальное сопряжение, 920 формальное транспонирование (оператора), 821 формула — Гельмгольца, 991, 1084 — Грина, 415 вторая, 843 дискретная, 679 дискретная вторая, 682 первая, 842
Предметный указатель 1219 — де Бройля, 1081 — дифференциального исчисления фундаментальная, 881 — замены переменных в /с-мерном интеграле, 768 — Кирхгофа, 993 — Коши интегральная, 1015 — Лейбница (производная произведения функций), 263 — Ньютона-Лейбница, 362, 415 — обратного преобразования Фурье, 1083 — Пуассона интегральная, 855, 1055 — стационарной фазы, 1074 — Стирлинга, 1065 — Тейлора (многомерная), 311 — Эйнштейна, 1081 Френеля интеграл, 1039 фронт волновой, 988 функция — аналитическая, 1004 — Бесселя, 1087, 1088 — билинейная, 379, 750 — гамма-, 1066 — гармоническая, 844 сопряженная, 1053 — голоморфная, 1004 — Грина, 851 дискретная, 678 — Дирака (дельта-), 823 — Дирихле (разрывная интегрируемая), 1139 — «калорическая», 1095 — квадратичная, 191 — комплекснозначная дифференцируемая, 999 — Массье, ИЗО, 1157, 1170 — мероморфная, 1012 — обобщенная, 823 — от матрицы, 115 — Планка, 1127 — производящая, 1129 — разбиения, 1157, 1170, 1184 — с компактным носителем, 818 — трилинейная, 752 — характеристическая, 1186 — Хевисайда, 1141 Фурье преобразование, 1076 — обратное, 989, 1083 Фурье ряд, 1052 Фурье-образ, 1083 X характеристический полином, 83 характеристическое уравнение, 83 химический потенциал, 1134 ц цепное правило, 256 цепь комплекса, 591 цикл, 593, 708 — Карно, 1114 циркуляция магнитного поля, 971 Ч частная производная, 275 число заполнения, 1141 Э эйконал, см. точечная характеристика Эйлера теорема для комплекса, 714 эйлерова характеристика, 714 эквипотенциальная поверхность, 832, 1091 экспоненциальное отображение, 1086 экстремаль (лагранжиана), 983 электрическое смещение, 825 электродвижущая сила (ЭДС), 578 электростатическая энергия, 842, 849 электростатический потенциал, 686 эмпирическая температура, 1103 энергии-импульса тензор, 988 энергия — взаимодействия, 1131 — внутренняя, см. внутренняя энергия
1220 Предметный указатель — кинетическая, 1151 — свободная Гельмгольца, 1191 — электростатическая, 843, 849 энтальпия, 1125 энтропия, 343, 1097, 1108, 1159, 1170, 1184 эффективность (КПД), 1114 Я ядро — линейного преобразования, 52, 502 — Пуассона, 680 якобиан, см. матрица Якоби ячейка — комплекса, 706 — электрической цепи, 585, 592