Текст
                    АКАДЕМИЯ НАУК СССР
ИНСТИТУТ ИСТОРИИ ЕСТЕСТВОЗНАНИЯ И ТЕХНИКИ
Б. Г. КУЗНЕЦОВ
ОСНОВЫ
ТЕОРИИ
ОТНОСИТЕЛЬНОСТИ
И КВАНТОВОЙ
МЕХАНИКИ
В ИХ ИСТОРИЧЕСКОМ
РАЗВИТИИ
ИЗДАТЕЛЬСТВО
АКАДЕМИИ НАУК СССР
МОСКВА • Н57


АННОТАЦИЯ В книге излагаются в исторической связи основы современной научной картины мира — наиболее общие идеи теории относительности и квантовой механики — в форме, доступной широкому кругу читателей — инженеров, преподавателей и студентов, интересующихся современной теоретической физикой и ее развитием. Книга требует от читателя знания основ дифференциального и интегрального исчислений; сведения из других областей математики, необходимые для понимания рассматриваемых физических идей, вводятся, в элементарном и нестрогом изложении, в самой книге. ♦ Ответственный редактор А. Т. Григорьян
Часть первая, ОТНОСИТЕЛЬНОСТЬ 1. Электродинамика, электронная теория и электромагнитная картина мира Естествознание XX столетия нарисовало новую картину мира, которая в большей мере отличается от классических представлений XIX в., чем эти последние отличались от механического естествознания XVII—XVIII вв. Первоначально казалось, что дело сводится к переходу от механической картины мира к электромагнитной. Впоследствии выяснилось, что новая картина мира имеет более сложный характер. Какие научные законы играют сейчас роль, аналогичную роли ньютоновых законов в классической картине мира? В свое время макроскопические законы ньютоновой механики были применены к микромиру; таким образом было создано единое атомистическое представление о природе, причем естествознание XIX столетия раскрыло специфические формы движения, характерные для каждой ступени иерархии дискретных частей вещества. Сейчас наиболее общими основами картины мироздания служат законы, сформулированные в теории относительности и квантовой механике. Развитие исходных принципов этих теорий ведет к построению новой картины мира, охватывающей структуру, движение и историю галактик, звезд, молекул, атомов и элементарных частиц. Общим исторически исходным пунктом теории относительности и квантовых представлений была электронная теория Лоренца. Она появилась в девяностые годы. Корни электронной теории уходят в классическую физику и прежде всего в классическую электродинамику. Но чтобы понять, почему новая теория выросла из старой в 3
определенное время, нужно принять во внимание и собственно исторические условия: ускорившееся в конце века расширение экспериментальной и теоретической исследовательской работы в физике и особенно в электрофизике, создание очень крупных специальных университетских и промышленных лабораторий и исследовательских центров, новые возможности экспериментальной техники, увеличение объема научной литературы и т. д. В последнем счете здесь сказались сдвиги в производстве и в особенности в электротехнике. Во всех основных отраслях производства происходили важные технические изменения, ставившие новые задачи перед исследовательскими центрами. Однако электротехника была особенно характерным источником адресовавшихся науке запросов и новых возможностей экспериментальной техники. В восьмидесятые-девяностые годы электротехника оказала существенное воздействие на теорию электричества и на развитие понятия электромагнитного поля. Вместе с тем в физике развивались представления о дискретных зарядах, и эта линия научного развития также опиралась на определенные технические тенденции в промышленности, транспорте и связи. В этот период в технике и в науке усиленно применяются и изучаются процессы прохождения электричества через электролиты. Далее все большую роль начинают играть как в технике, так и в науке процессы прохождения электричества через разреженные газы. Если радиотехника первоначально опиралась на высокочастотные машины переменного тока и трансформаторы, то впоследствии радиотехника перешла к широкому использованию вакуумных приборов в качестве генераторов колебаний. Но это только часть широкой технической тенденции, свойственной современному производству. Вакуумные приборы нашли применение в промышленности. Электрохимия и электрифицированный транспорт в свое время привели к изобретению ртутного преобразователя — ровесника нашего века. Значительно позже вакуумные приборы начали применяться и для автоматики. В период широкого распространения вакуумных приборов, ионных преобразователей, радиотехники и рентгенотехники значительно расширяется тюле применения электричества вообще: развивается электронная автоматика, дефектоско- 4
пия, новые направления светотехники, применение электричества в медицинской диагностике и терапии. В настоящее время некоторые отрасли производственной техники почти слились с техникой физического эксперимента. В области физики ядра, электроники, радиотехники, рентгенотехники различие между физиком-экспериментатором и инженером-конструктором стало малоуловимым. Производственные корни электрофизики стали чрезвычайно явными. Но в (некоторой, разумеется меньшей, степени это имело место и шестьдесят лет назад, когда возникла электронная теория и электродинамика движущихся сред. Историческая связь между электротехникой (особенно электровакуумной техникой) и сдвигами в электродинамике несомненна. В восьмидесятые годы электродинамика Максвелла получила экспериментальное подтверждение и широкое распространение. Основные идеи и математическая форма электродинамики Максвелла известны большинству читателей этой книга; поэтому мы лишь напомним здесь, что уравнения электродинамики Максвелла остаются справедливыми, если электрические заряды и проводники с током движутся в пространстве. Движение тел .не влияет на их электрические и магнитные взаимодействия, электродинамика может обнаружить лишь относительные смещения проводников и магнитных полюсов. Иной характер имеет электродинамика Лоренца. Ее исторической основой было исследование электродинамических явлений в движущихся средах и развитие представлений об электронах. Это развитие таким коренным образом повлияло на физику в целом, что именно с открытия электронов и появления электронной теории начинается новая эпоха в науке. В самом начале восьмидесятых годов Гельмгольц в речи, посвященной Фарадею, объяснил фарадеевы законы электролиза с помощью представления о неделимых частицах отрицательного электричества. Если каждый атом вещества, участвующий в электролитическом процессе, иесет неделимый далее электрический заряд, то отсюда легко можно получить пропорциональность количества электричества и количества выделяющегося при электролизе вещества. Затем Дж. Стоней писал об электронах — элементарных зарядах, В конце века широкие и система- 5
тические исследования прохождения электричества через разреженные газы создали предпосылки для великих открытий, преобразовавших учение об электричестве и поставивших в центр его представление об электроне. В результате работ Дж. Дж. Томсона и Ф. Ленарда выяснилось, что открытые еще в пятидесятые годы катодные лучи отклоняются магнитом и электрическим полем, перпендикулярным к направлению лучей, так же, как отрицательно заряженные тела. Было высказано предположение, что катодные лучи представляют собой поток дискретных частиц электричества. В дальнейшем удалось не только доказать это предположение, но и определить массу и заряд этих частиц. Масса каждой частицы примерно в 2000 раз меньше массы атома водорода, а заряд оказался равным 4,77 • 10"10 эл.-ст. ед. В девяностые годы представления об атомах и электронах сводились к следующему. Положительное электричество распределено равномерно по объему атома (Дж. Дж. Томсон). Вместе с тем атом включает некоторое число электронов, уравновешивающих положительный заряд. В диэлектриках электроны не отделяются от атомов и лишь немного смещаются, когда атом оказывается в электрическом поле. Напротив, в электролитах и проводящих газах атомы теряют или приобретают некоторое число электронов, становясь ионами — заряженными атомами, и движутся в электрическом поле. В металлах электроны движутся независимо от атомов. Когда электроны вращаются в атомах по замкнутым орбитам, они играют роль элементарных молекулярных токов, о которых говорил Ампер, и это вращение служит причиной магнитных явлений. Такое представление о дискретных электрических зарядах и их связи со структурой вещества было исходным пунктом создания и развития атомной физики. Для генезиса теории относительности преимущественное значение имела другая сторона вопроса — проблема взаимоотношений электронов с эфиром. Лоренц предположил, что эфир представляет собой абсолютно неподвижную среду. В ней движутся электроны. Электрический ток целиком сводится к движению электронов. Электрические и магнитные силы действуют только на заряды; эфир не подвергается никаким воздействиям, остается неподвижным, и всякий электрический ток — это, в сущности, кон- 6
векционный ток — движение электронов. Поэтому величины диэлектрической постоянной s и магнитной проницаемости t* теряют тот смысл, который они имели в электродинамике Максвелла. Ведь среда, в которой действуют электрические и магнитные силы, среда, для которой диэлектрическая постоянная и магнитная проницаемость были исходными, первичными понятиями, йыне оказалась собранием плавающих в эфире отдельных зарядов. Для эфира в и [а равны единице, для отдельных электронов эти величины не имеют смысла, а для больших собраний электронов они сохраняют смысл в качестве статистических усреднений по большому числу дипольных электрических и магнитных моментов. В зависимости от этчх первичных явлений, от сдвига или вращения электронов, тела, состоящие из элементарных зарядов, обладают той или иной диэлектрической постоянной и магнитной проницаемостью. Тела обладают также определенной проводимостью о. Проводимость также не исходное, а вторичное понятие: она связана с макроскопическим усреднением длин свободных пробегов электронов. Представление о неподвижном эфире, в котором плавают дискретные частицы материи — элементарные электрические заряды, позволило объяснить множество электродинамических и оптических явлений. Лоренц пошел значительно дальше Френеля в утверждении неподвижности эфира: он полностью отказался от какого бы то ни было увлечения эфира движущимися телами и при этом не только получил все результаты Френеля, но и преодолел затруднения теории частичного увлечения. Из теории Лоренца вытекает, что движение тел в эфире не изменяет электродинамических и оптических процессов в сколько- нибудь заметной степени, так как изменения этих процессов пропорциональны не скорости движения тел, деленной на скорость света, v/cy а квадрату этой величины v2/c2. Следовательно, эфирный ветер можно было бы обнаружить лишь очень тонкими экспериментами. Если не говорить об электродинамических и оптических процессах, зависящих от v2/c2, то теория Лоренца не допускала возможности обнаружить движение зарядов относительно эфира. Ход явлений, согласно этой теории, определялся относительными сдвигами зарядов, изменением расстояний между телами, погруженными Б эфир. 7
Таким образом, представление об эфире как абсолютном теле отсчета, поставившее эфир на место ньютонова пустого абсолютного пространства, могло уживаться с некоторым условным (для явлений, зависящих от первой степени v/c) электродинамическим релятивизмом, с признанием, что движение относительно эфира не может повлиять на результаты оптических или вообще электромагнитных измерений величин первого порядка, не может быть обнаружено такими измерениями. Разумеется, теория Лоренца исключала электродинамический релятивизм второго порядка: измерения электромагнитных величин, зависящих от v2/c2, должны были обнаружить абсолютное движение — движение тел относительно неподвижного эфира. Забегая впе1ред, отметим, что такие измерения дали отрицательный результат, и благодаря этому в электродинамике утвердилось представление об относительности, уже не ограниченной первым порядком величин. Но при этом пришлось перестроить и учение об относительности механических движений — принцип относительности Галилея — Ньютона и связанные с ним основы классической механики. Почва для такого переворота была подготовлена развитием электромагнитной картины мира и в особенности попытками электродинамической интерпретации основных понятий механики, в частности понятия массы. Сейчас, ретроспективно, эта попытка представляется только подготовкой теории относительности. Последняя несколько заслонила интересную полосу в истории физики. Но на рубеже девяностых и девятисотых годов попытка электродинамического понимания инерции и основ ньютоновой механики вообще казалась предельно смелой. Эта попытка сыграла важную историческую роль, она подвела науку вплотную к принципу относительности. Еще в 1881 г. Дж. Дж. Томсон предположил, что инерция электромагнитного поля прибавляется к инерции тела и поэтому заряженное тело обладает большей массой, чем незаряженное. Разность между массой заряженного и незаряженного тела Томсон назвал «кажущимся приростом массы», а впоследствии она получила наименование электромагнитной массы. Вообще говоря, она зависит от скорости движения заряда; но если эта скорость незначительна по сравнению со скоростью света, то в этом 8
случае электромагнитная масса приближается к предельному значению: где U—электростатическая энергия заряда. Электронная теория положила начало новой полосе в развитии представлений об электромагнитной массе. Появилась крайне радикальная мысль о возможности свести всю массу элементарных частиц вещества — электронов к электромагнитной массе. Эта мысль в общем соответствовала имевшимся тогда сведениям о заряде, размерах и массе электрона. Впоследствии она стала еще более правдоподобной. Экспериментальные данные об отношении заряда электрона к его массе были получены при изучении отклонения катодных лучей в электрических и магнитных полях. Подобным же образом изучали поведение бета-лучей радия, т. е. электронов, движущихся с громадной скоростью, приближающейся к скорости света. Оказалось, что отношение заряда электрона к массе зависит от скорости. Заряд не меняется; значит, меняется масса электрона. Это легко понять, если масса электрона имеет электромагнитную природу. Чтобы получить количественные представления о зависимости электромагнитной массы от скорости, мужно знать распределение заряда в электроне. Абрагам в 1903 г. высказал предположение о твердом шарообразном электроне и равномерном распределении заряда по его объему либо по поверхности. Он вычислил вытекающую из такого предположения зависимость массы электрона от скорости, и результаты оказались близкими к экспериментальным данным. Вскоре появились гипотезы об электромагнитной природе -всей массы не только электронов, «о и атомов и вообще всех тел природы. Успехи представления об электромагнитной («полевой») массе внушили надежду на полное физическое объяснение основных проблем классической механики. Почему тело, предоставленное самому себе, продолжает двигаться равномерно и прямолинейно в абсолютном пространстве? Каков физический смысл абсолютного пространства? В .новой, электромагнитной картине мира эти «проклятые» вопросы уже не оставались без ответа. Инерция объясняется существованием эфира и происходящими в нем процессами, в результате которых ускорение тела требует 9
затраты энергии. Нет «ужды относить инерцию, как и ускорение, к абсолютному пространству в том смысле, какой ему придавал Ньютон. Абсолютное пространство приобретает вполне наглядный, физически конкретный вид неподвижного эфира. Электронная теория была исходным пунктом двух революционных тенденций в физике XX столетия. Первая тенденция — разработка атомной физики, включавшая подготовку ядерной физики и физики элементарных частиц. Вторая тенденция, уже с самого начала угрожавшая классической картине мира,— пересмотр и новая интерпретация основных понятий макроскопической механики. Философские выводы из начавшейся революции в физике были сделаны В. И. Лениным. В «Материализме и эмпириокритицизме» большое внимание уделено «проблемам движения электронов в эфире и электромагнитной массе ]. Ленин видел, что классическая механика остается справедливой при изучении сравнительно медленных реальных движений, а новая физика представляет собой снимок с гораздо более быстрых реальных движений2, что законы механики оказываются частным случаем более общих электродинамических законов3. Ленин говорил о действительном философском смысле этих идей, разбивая попытки использовать в интересах фидеизма новые физические открытия и теории. Построение электромагнитной картины мира послужило поводом для таких попыток. Чем решительнее и смелее наука переходит на новую ступень в своем отображении объективной действительности, чем непривычнее выглядят новые представления по сравнению со старыми, тем с большей энергией идеалисты используют такой переход для позитивистской трактовки научных законов, тем плодотворнее для научного прогресса философские идеи марксизма. Они опираются на развивающуюся науку, они не дают априорных, догматических указаний и окончательных ответов на вопрос, какими должны быть конкретные физические представления о материи, они утверждают ее объективную реальность и познаваемость, отмежевывают тем самым науку от идеализма и агностицизма и предоставляют науке на основе экспе- 1 См. В. И. Л е н и н. Сочинения, т. 14, стр. 239—252. 2 См. там же, стр. 252. 3 См. там же, стр. 248, 10
риментальных данных, в живом переплетении сменяющих друг друга, дополняющих друг друга, конкретизирующих и обобщающих друг друга физических концепций все точнее отражать объективную реальность. Разумеется, такая антидогматическая позиция не может быть поколеблена научным прогрессом, углублением физических знаний, выяснением относительности и ограниченности понятий, которые раньше казались абсолютными и неизменными. «Ибо единственное „свойство* материи, с признанием которого связан философский материализм, есть свойство быть объективной реальностью, существовать вне нашего сознания» *. Этот теэис, направленный против махизма, вместе с тем противостоит всякому догматическому отождествлению материализма с определенными исторически преходящими, подлежащими дальнейшему уточнению, конкретизации и обобщению, физическими представлениями о материи. Такая антидогматическая позиция не может устареть; напротив, она укрепляется развитием физических идей и сама стимулирует такое развитие. С этой позиции Ленин видел не только генезис электромагнитной картины мира, но и дальнейший переход к более сложным представлениям. Ленин писал, что материализм отнюдь не утверждает «обязательно „механическую", а не электромагнитную, не какую-нибудь еще неизмеримо более сложную картину мира, как движущейся материи» 2. Дальнейшее развитие физики показало, что естественнонаучная революция ведет к построению такой неизмеримо более сложной, по сравнению с электромагнитной, картины мира. Философское обобщение науки, исходящее из ее развития, рассматривающее науку в ее развитии, принципиально отбрасывающее априорные схемы, отказывающееся от метафизического абсолютизирования тех или иных физических теорий и вместе с тем видящее в науке процесс последовательного приближения к абсолютной истине,— такое обобщение раскрывает перспективы науки и становится активной движущей силой научного прогресса. Ньютонова механика с ее абсолютным пустым пространством, лореицова картина неподвижного эфира, теория относительности Эйнштейна рисовали — с различной 1 В. И. Л е н и н Сочинения, т. 14, стр. 247. 2 Там же, стр. 267, 11
и возрастающей полнотой и точностью — объективный, материальный мир. Переход от одной научной картины мира к другой происходил потому, что ньютонова механика, а затем и лоренцова электродинамическая картина материи и ее движения переставали соответствовать сумме экспериментально установленных фактов. 2. Постоянство скорости света Первые опыты, доказавшие отсутствие эфирного ветра, были сделаны почти за 25 лет до создания теории относительности. Они оказались в центре внимания после многократных повторений и в тот момент, когда абсолютное пространство приобрело физическую конкретность в картине неподвижного эфира и существование абсолютного пространства и абсолютного движения могло стать вопросом, подлежащим экспериментальной проверке. В 1881 г. Майкельсон произвел наблюдения, отличающиеся чрезвычайно высокой точностью, позволяющей обнаружить эффекты, зависящие от второй степени отношения механической скорости движения системы к скорости света: В интерферометре Майкельсона световой луч разделяется на два луча: один проходит определенный путь туда и обратно в продольном направлении к движению Земли, другой — такой же по длине путь в поперечном направлении. Движение света в продольном направлении продлится несколько больше времени, чем в поперечном направлении,— на небольшую величину, пропорциональную квадрату отношения скорости Земли к скорости света в эфире. Существование такой разности и должен был обнаружить опыт Майкельсона, повторенный в 1887 г. Май- кельсоном и Морлеем ] и впоследствии неоднократно повторявшийся при последовательном усовершенствовании прибора. Прибор включал множество сложных устройств, обеспечивающих его точность и надежность. Можно было рассчитывать на обнаружение ничтожных различий во 1 American Journal of Science (3), 34, 333 (1887); Phil, Mag. (5), 24, 449 (1887). 12
времени распространения света в двух взаимно перпендикулярных направлениях, если такие различия существуют. В интерферометре световой луч (красной линии кадмия с длиной волны 5,9 • 10~5 см) попадает на слегка посеребренную пластинку Р (фиг. 1). Частично он отражается от серебра, а частично проходит дальше, разделяясь таким образом на два луча. Один доходит до зеркала Su отражается, проходит через Р и попадает в зрительную трубу F. Второй луч отражается от зеркала $2, затем, отра- =1= |* Фиг. 1 жаясь от Р, также попадает в F. Если один запаздывает по отношению к другому, в F имеет место интерференция и можно видеть интерференционные полосы. Прибор ориентируют так, чтобы один луч был направлен «по параллели, т. е. по движению Земли, а другой по меридиану. Если затем повернуть прибор на 90°, то смещение интерференционных полос должно было бы свидетельствовать о наличии эфирного ветра, проявляющегося в явлениях, зависящих от |32. Длина пути, проходимого лучами в опыте Майкельсона и Морлея, равнялась 22 м. Смещение интерференционных полос при длине волны^=5,9 • 10~5 см должно было составить 0,37 ширины интерференционной полосы, причем даже сотая доля такого смещения могла 13
быть обнаружена. Результаты всех опытов оказались отрицательными. Наряду с применением интерферометра были проделаны и другие эксперименты, в частности эксперименты с электрическими конденсаторами и проводниками. Тро- утон и Нобл в 1903 г. -подвешивали плоский конденсатор под углом к движению Земли *. Если эфир не увлекается Землей, то движение конденсатора вызывает силы, стремящиеся повернуть плоскость конденсатора параллельно направлению движения. Троутон и Нобл проверяли: не скажется ли поворот проводника из поперечного положения относительно движения Земли в продольное на вызванных таким образом силах. Опыты дали отрицательный результат и, следовательно, подтвердили, что движение Земли не сказывается на ходе электродинамических явлений. Эксперименты, показавшие отсутствие эфирного ветра, представляют собой experimentum cruris для учения о неподвижности эфира. Неподвижный эфир был осужден. Но вернуться к гипотезе увлечения тоже нельзя было. Чтобы еще раз представить себе с максимальной наглядностью значение оптических, или, что то же самое, электродинамических экспериментов для учения о движении в эфире, приведем следующий пример, в котором не будет речи об экспериментальной технике и количественных расчетах и внимание сосредоточится на основном принципиальном вопросе. Сравним две гипотезы: 1) тела увлекают эфир с собой и 2) тела не увлекают эфир. Представим себе прямолинейно движущуюся систему с источником света, движущимся вместе с ней, и двумя экранами, расположенными один впереди источника света, а другой,— на том же расстоянии, сзади. Экраны, так же как и источники света, движутся вперед вместе с системой. Если эфир принимает участие в движении системы, то скорость света в этой системе одинакова во всех направлениях и не зависит от движения системы. Световой сигнал достигает обоих экранов одновременно. Однако во внешней системе, относительно которой движется данная, скорость света представится неодинаковой. Если данная система — плывущий вдоль берега корабль, то луч подвешенного в центре фонаря долетит до экрана на корме так 1 Trans. Roy. Soc. (London), A202, 165 (1903). 14
Же быстро, как и До экрана на носу корабля, подобно пассажиру, .идущему от центра корабля к носу и к корме. Но по отношению к берегу свет будет быстрее двигаться в направлении движения -корабля, как и пассажир, идущий по палубе в этом направлении. Соответственно правилу сложения скоростей свет, идущий по движению корабля, будет двигаться по отношению к берегу со скоростью 300 тыс. км/сек плюс скорость корабля, а в обратном направлении — 300 тыс км/сек минус скорость корабля. Таким образом, если при движении материальная система увлекает эфир, заключенный между источником света и экранами, то скорость света будет одной и той же в данной системе и различной по отношению к внешней системе. В свое время Физо (1851) исследовал, увлекают ли тела эфир при своем движении. Он направлял луч света по трубе с текущей водой. Оказалось, что вода лишь частично увлекает эфир. Опыт Физо, в котором вода была внутренней, а труба внешней системой, показал, что нельзя говорить о полном увлечении эфира. Теперь предположим, что эфир не увлекается материальными телами, и наша система со своим источником света и двумя экранами проходит через неподвижный эфир. Тогда для внешней системы скорость света будет постоянной и независимой от движения источника света и экранов. В самой движущейся системе свет дойдет до переднего экрана позже, ему придется догонять экран, и по правилу сложения скоростей скорость света в движущейся системе окажется неодинаковой: в сторону переднего экрана она будет равна 300 тыс. км/сек минус скорость системы, а в обратном направлении — 300 тыс. км/сек плюс скорость системы. Таким образом, независимо от того, увлекают тела эфир или не увлекают, скорость света должна была оказаться различной: в первом случае относительно внешней системы, во втором — относительно системы, движущейся вместе с источником света. Экспериментальной основой специального принципа относительности явился тот факт, что ни то ни другое предположение не подтвердилось. Свет распространяется с одинаковой скоростью как по отношению к движущейся, координатной системе, так и по отношение к внешней, относительно которой движется данная система. 15
Эксперименты, тщательно поставленные и многократно проверенные, заставили физиков отказаться от гипотезы увлечения, а затем и от гипотезы неподвижного эфира. Наиболее важная в историческом отношении попытка объяснить результаты Майкельсона и других, сохранив при этом неподвижный эфир и различную скорость света в движущихся относительно друг друга системах, принадлежала Лоренцу. В девяностые годы Лоренц разработал гипотезу, которую еще раньше высказывал в своих лекциях Фитцджеральд. Согласно этой гипотезе скорость света различна в системах, движущихся относительно друг друга. Это обстоятельство можно было бы зарегистрировать с помощью оптических -наблюдений, если бы время продольного и поперечного движения света в интерферометре не выравнивалось сокращением продольных масштабов в системах, движущихся относительно эфира. В статье «Электромагнитные явления в системе, движущейся с любой скоростью, меньшей скорости света» х дана наиболее полная и строгая формулировка гипотезы сокращения. Лоренц исходит из основных уравнений электронной теории и вводит дополнительную гипотезу: электроны, которые в состоянии покоя можно считать шарами, при поступательном движении относительно эфира деформируются, их продольные размеры уменьшаются, причем уменьшение пропорционально отношению скорости движения электронов к скорости света. Иными словами, электроны-шарики преобразуются в эллипсоиды, малые оси которых лежат в направлении движения. Далее Лоренц принимает, что силы, действующие между незаряженными частицами и между незаряженными частицами и электронами, изменяются при движении относительно эфира таким же образом, как и электрические силы. Следовательно, все тела испытывают такую же деформацию, как и электроны. Лоренцова формула преобразования продольных размеров показывает, в какой мере эти размеры сокращаются в зависимости от скорости движения тел в эфире. Эти формулы приводят к заключению, что сокращение размеров тел компенсирует изменение скорости света. Формулы преобразования продольных линейных масштабов и времени, 1 Lorentz. Ргос. Acad. Sc. Amsterdam, 6, 809 (1904). Русск. пер. см. «Принцип относительности». Сборник работ классиков релятивизма. Л., 1935, стр. 16—48. 16
введенные Лоренцом, были уточнены Эйнштейном и Пуанкаре и легли в основу теории относительности. Но в самой работе Лоренца еще не был высказан принцип относительности, противопоставленный идее неподвижного эфира. Лоренц утверждал, что продольные размеры тела, движущегося относительно неподвижного эфира, сокращаются по сравнению с размерами того же тела, покоящегося в неподвижном эфире. Таким образом, движение в неподвижном эфире осталось; оно вызывало определенные электродинамические эффекты, но проявлялось оно одновременно и в сокращении масштабов и в изменении скорости света, так что эти результаты движения в эфире компенсировали друг друга. Движение деформированных тел оставалось абсолютным движением, движением в абсолютном пространстве, в той электродинамической форме, какую Лоренц придал абсолютному пространству. Местное время, введенное Лоренцом, означало время, которое течет быстрее в движущихся системах по сравнению с временем, измеряемым в системах, покоящихся относительно эфира. В 1912 г. Лоренц в примечании к своей статье 1904 г. писал: «Заслуга Эйнштейна состоит в том, что он первый высказал принцип относительности в виде всеобщего, строго и точно действующего закона» 1. Это соответствует действительности. Но следует заметить, что Пуанкаре независимо от Эйнштейна в статье, опубликованной в начале 1906 г., высказал принцип относительности в качестве универсального принципа. Анри Пуанкаре (1854—1912), этот необыкновенный по разносторонности и силе мысли математик и выдающийся физик, отличался от таких мыслителей, как Максвелл и Лоренц и — если забежать немного вперед — как Эйнштейн, характером физического мышления. Если для перечисленных физиков каждая аналитическая формула интерпретировалась, воплощаясь в геометрические образы и далее в физическую модель, то для Пуанкаре, напротив, в каждой физической модели скрывается отвлеченное аналитическое соотношение. Вообще говоря, это две стороны одного и того же метода; физическая интерпретация математических символов и аналитическое представление физических величин неразрывные стороны метода современной теоретической физики. 1 «Принцип относительности», стр. 23. 17
может быть, из всех творцов теории относительности только в работах Эйнштейна по общей теории относительности и пожалуй еще у Минковского эти стороны полностью синтезируются. Максвелл и Лоренц с большой силой обобщения оперировали аналитическими представлениями физических величин, но наиболее эффективной и характерной стороной их творчества была физическая интерпретация аналитических понятий. Пуанкаре был крупнейшим мастером физической интерпретации, но его гений достигал своих вершин не в физике, а в более отвлеченных областях — в качественной теории дифференциальных уравнений, автоморфных функций, топологии и т. д. Но дело этим не ограничивается. Де Бройль в своей статье, посвященной столетию со дня рождения Пуанкаре, ставит вопрос: почему Пуанкаре подошел к теории относительности, но не сделал последнего шага, предоставив его гораздо менее искушенному в математических абстракциях Эйнштейну? Он отвечает ссылкой на «ультраскептицизм», т. е. махист: скую философию Пуанкаре, на его представление об условности и отсутствии реального физического эквивалента математических символов. Летом 1905 г. Пуанкаре написал статью «О динамике электрона», которая в начале следующего года появилась на страницах итальянского журнала 1. Статья начинается констатацией, что оптические и электродинамические явления не могут обнаружить абсолютное движение систем, в которых они происходят. Пуанкаре делает отсюда следующий вывод: «Эта невозможность показать опытным путем абсолютное движение Земли представляет, по-видимому, общий закон природы; мы естественно приходим к тому, чтобы принять этот закон, который мы назовем постулатом относительности, и принять без оговорок. Все равно, будет ли позднее этот постулат, до сих пор согласующийся с опытом, подтвержден или опровергнут более точными измерениями, сейчас, во всяком случае, представляется интересным посмотреть, какие следствия могут быть из него выведены». В части математической формулировки теории Пуанкаре приходит не только к основным результатам теории Эйнштейна, но даже предвосхищает в некоторой мере Минков- 1 Rendic. d. Circ. Pal., XXI, 129 (1906). Русск. пер. см. сПринцип относительности», стр. 51—129. 18
ского. Что касается физической интерпретации постулата, то гипотеза Пуанкаре сохранила лишь историческое значение. Пуанкаре вкратце излагает историю вопроса. Далее он вводит термины «лоренцово сокращение» и «преобразования Лоренца». Под этими преобразованиями Пуанкаре понимает переход от неподвижных в эфире координатных систем к движущимся и количественные изменения продольных и поперечных пространственных масштабов и временных интервалов при таком переходе. Развивая теорию лоренцова сокращения, Пуанкаре вводит дополнительную гипотезу. Эта гипотеза предполагает наличие внешнего давления на электрон, объясняю*- щего его деформацию. Разбирая электродинамические теории, обходившиеся без продольного сокращения электрона, Пуанкаре считает их неудовлетворительными. Недели за три до того, как Пуанкаре послал в итальянский журнал свою статью, 26-летний инженер, служивший в Бернском патентном бюро и уже известный написанными незадолго до того классическими работами о броуновском движении и созданной в том же 1905 г. теорией световых квантов — фотонов, положил начало новому этапу в развитии физической теории статьей «К электродинамике движущихся тел». В сентябре вышел номер журнала с этой статьей Эйнштейна 1. В статье изложен новый, дополняющий принцип относительности, фундаментальный физический принцип. Принцип этот утверждает, что'скорость света в каждой равномерно и прямолинейно движущейся системе не зависит от этого движения, что существует бесконечное число систем, движущихся друг относительно друга равномерно и прямолинейно, в которых скорость света одинакова. При переходе от одной из этих систем к другой она остается постоянной, но зато меняются временные и продольные линейные масштабы. Никакие приборы не могут зарегистрировать изменение скорости света, потому что такого изменения нет. Принцип постоянства скорости света коренным образом меняет принцип относительности. У Лоренца движение систем было абсолютным (не в каком-либо метафизическом, иррациональном смысле, а просто движением относительно заполняющего все прост- 1 Ann. d. Phys., 17, 891 (1905). Русск. пер. см. «Принцип относительности», стр. 133—174. 19
patfcffeo йейодвижного эфира). В теопии Лоренца относительность зависела от некоторых эффектов, компенсирующих друг друга и, таким образом, скрывающих изменения скорости света при переходе от системы, покоящейся в эфире, к системе, движущейся в нем равномерно и прямолинейно. В теории Лоренца постоянство скорости света — феноменологический результат двух компенсирующих друг друга явлений: 1) замедления скорости света в продольном плече майкельсоновского прибора и 2) сокращения длины этого плеча. Оба процесса имеют абсолютный характер в указанном выше смысле, т. е. скорость света меняется по сравнению с его скоростью в покоящейся относительно эфира системе и продольные размеры уменьшаются по сравнению с его размерами в той же системе. В теории Эйнштейна постоянство скорости света имеет субстанциальный характер, и относительность характерна не для результатов эксперимента, а для независимого от эксперимента существа дела. Указанное обстоятельство затушевывают столь частым, впервые встречающимся у самого Эйнштейна привлечением «наблюдателей», которые сверяют свои часы и не могут обнаружить никакого процесса, позволяющего удостоверить одновременность событий, происходящих в различных движущихся системах. Эта картина может создать иллюзию, будто принцип относительности вытекает из характера экспериментов, но сущность открытия Эйнштейна состоит как раз в обратном утверждении. Откуда такая тенденция субъективной интерпретации теории при ее изложении, противоречащая очень отчетливой тенденции объективной трактовки при ее построении? В среде, отгороженной от марксизма тысячами предрассудков, мировоззрение естествоиспытателя включает, как правило, наряду со стихийным убеждением в реальности и познаваемости внешнего мира позитивистские представления. Эйнштейн далек от систематического отстаивания таких представлений, далек от позиции того же Пуанкаре, но в его высказываниях можно встретить немало позитивистских тезисов, а равно и противоположных им. А. Мош- ковский, подводя итог многочисленным записям высказываний своего гениального собеседника, пишет: «Если Эйнштейн, как мы знаем, провозглашает истину единственной целью науки, то он, фактически, имеет в виду 20
строго объективную истину, как она раскрывается в явлениях природы, действительную связь явлений и событий, не смущаясь тем, что рефлектирующая философия ставит и над этой последней объективностью знак вопроса. Великий естествоиспытатель и не может вовсе думать иначе, для него за покровом Майи таится не исчезающий фантом, а некоторое познаваемое ядро, которое выступает все явственнее и реальнее по мере того, как он постепенно снимает один покров за другим» 1. На одном заседании французского философского общества Эйнштейн заявил, что Мах был «жалким философом» и что «близорук тот взгляд на науку, который приводит к отрицанию существования атомов» 2. Разумеется, гораздо существеннее подобных заявлений стихийное стремление Эйнштейна раскрыть объективный, независимый от эксперимента и измерения, инвариантный при переходе от одной системы измерения к другой характер физических процессов, стремление, заставившее ученого дополнить принцип относительности принципом постоянства скорости света. Статья «К электродинамике движущихся тел» начинается констатацией экспериментально установленного факта: в системах, движущихся друг относительно друга равномерно и прямолинейно, электродинамические процессы происходят единообразно, и это относится не только к величинам первого порядка, но и к величинам второго порядка. К этому экспериментально полученному принципу относительности Эйнштейн присоединяет тезис о постоянстве скорости света, тезис, противоречащий классическому принципу относительности механических движений. Присоединив тезис о постоянстве скорости света к электродинамическому принципу относительности, можно прийти к непротиворечивой электродинамике, но понятие эфира становится при этом излишним, так как исчезает абсолютное покоящееся пространство, физическим эквивалентом которого и был эфир. «Введение „светоносного эфираи окажется при этом излишним, поскольку в предлагаемой теории не вводится „абсолютно покоящееся пространство", наде- 1 А. Мошковский. Альберт Эйнштейн. Беседы с Эйнштейном о теории относительности и общей системе мира. М., 1922, 2 Е. Meyers on. La deduction relativiste. Paris, 1925, p. 62. 21
ленное особыми свойствами, и ни одной точке пустого пространства, в которой протекают электромагнитные процессы, не приписывается какой-нибудь вектор скорости» !. Здесь речь идет о физической бессодержательности скорости тела относительно эфира, иначе говоря — скорости эфира. В классической физике скорость света относительно тел делилась на две компоненты: скорость света в пространстве и скорость тела относительно этого пространства. Теперь мы уже не можем делить скорость света на эти компоненты, складывавшиеся по правилу сложения скоростей классической механики. Скорость света, распространяющегося в пустоте, всегда имеет одно и то же значение. Когда мы измеряем эту скорость относительно различных тел, движущихся друг относительно друга прямолинейно и равномерно, мы всегда получаем один и тот же результат. Значит, скорость тела относительно пустого пространства не имеет физического смысла. Поэтому нельзя говорить о скорости какой-либо точки пространства относительно тела; как говорит Эйнштейн, «ни одной точке пустого пространства, в которой протекают электромагнитные процессы, не приписывается какой-нибудь вектор скорости». Пустое пространство перестает фигурировать в качестве эфира: именно в этом реальном, физическом характере движения тела относительно пустоты и движения точки пустого пространства относительно тела и заключалось основание для отождествления пустого неподвижного пространства с эфиром в теории Лоренца. Неподвижный эфир Френеля—Лоренца, так же как увлекаемый эфир Стокса, обладал одним свойством: его точки могли иметь определенную скорость, или, если угодно, абсолютное пространство могло фигурировать в качестве физической среды — эфира, потому что точкам этого пространства можно было приписать вектор скорости. Если пространство перестает быть средой, точки которой обладают скоростью относительно тела, то теряет смысл старое представление об одновременности. Абсолютно твердое тело, или абсолютно жесткая система материальных точек, связанных вневременным, происходящим с бесконечной скоростью взаимодействием, дает непосредственное представление об одновременности. Па- 1 «Принцип относительности», стр. 134-
раллельный перенос жесткого стержня — это физический образ одновременности двух событий — начала (или прекращения) движения кондов стержня. Как решается вопрос об одновременности в теории Эйнштейна? Эйнштейн рассматривает две точки А и В. В них расположены одинаковым образом устроенные часы. Они показывают «Л-время» и «В-время» и соответственно отмечают моменты tA и tB. Введем еще понятие просто «времени», которое является общим для А и В. Мы определяем это просто «время» как время, необходимое, чтобы луч света попал из А в В, которое равно просто «времени», требующемуся, чтобы свет попал из В в Л. Как установить синхронность часов? Представим себе, говорит Эйнштейн, что из точки А выходит луч света, причем «Л-время», когда он вышел, определяется часами в точке А и равно tA. Затем этот луч отражается в В в момент^ по «В-времени» и возвращается назад в А. Здесь момент его возвращения зарегистрирован находящимися в А часами, которые показывают в этот момент t\.Определением синхронности часов в Л и В является равенство: tB-tA = fA-tB. (1) Такое определение синхронности может быть распространено на бесконечное число точек и оставаться непротиворечивым при следующих предположениях: 1) если часы в В идут синхронно с часами в А, то часы в А идут синхронно с часами в В; 2) если часы в А идут синхронно с часами в В и в С, часы в В и в С также синхронны. Таким образом, просто «время», когда произошло событие, указывается одновременным с событием показанием часов, находящихся в той же точке, где произошло событие, и синхронных с другими часами. Такое время, отсчитываемое по покоящимся часам в покоящейся системе, Эйнштейн называет «временем покоящейся системы» (теперь его называют обычно «временем в лабораторной системе»). С помощью этого понятия Эйнштейн переходит далее к тезису об относительности пространственных и временных масштабов. Если длина покоящегося стержня /, то длина того же стержня, движущегося вдоль своей оси прямолинейно и равномерно со скоростью v, будет иной. Эйнштейн рассматривает две операции измерения стержня. Первая 23
состоит в прикладывании движущегося масштаба к движущемуся с той же скоростью стержню. Эйнштейн описывает такую операцию в условной форме (ставшей впоследствии обычной): «наблюдатель» движется вместе с масштабом и с измеряемым стержнем и прикладывает масштаб к стержню, так, как если бы все они были неподвижны. Эйнштейн называет результат такого измерения «длиной стержня в движущейся системе» (теперь эту величину именуют «собственной длиной стержня»). Согласно принципу относительности она не отличается от длины покоящегося стержня в покоящейся системе. Вторая операция иная. Измеряется длина стержня, движущегося относительно неподвижной системы, при помощи покоящихся в ней масштабов и часов. «Наблюдатель» при помощи покоящихся синхронных (в вышеуказанном смысле) часов определяет момент времени, когда один конец движущегося стержня находится в некоторой точке покоящейся системы. Далее он отмечает, в какой точке той же покоящейся системы находится в этот момент другой конец стержня. Остается измерить покоящимся масштабом расстояние между этими двумя точками. Дело, таким образом, сводится к определению пространственных расстояний между .двумя одновременными событиями: пребыванием начала стержня в одной точке и конца стержня — в другой точке. Результат такого измерения Эйнштейн называет «длиною движущегося стержня в покоящейся системе». Несмотря на субъективную форму, речь явно идет об объективных соотношениях между длиной движущегося стержня в движущейся системе (равной длине покоящегося стержня в покоящейся системе) и длиной движущегося стержня в покоящейся системе. Классическая механика считает эти величины равными; иначе говоря, классическая механика считает возможным заменить в геометрическом- отношении движущееся тело, взятое в определенный момент времени, покоящимся телом. Эйнштейн излагает и развивает противоположный тезис. Он рисует следующую картину. К обоим концам — А и В — стержня прикреплены часы, синхронные с покоящимися часами. Иными словами, показания часов на концах стержня совпадают с «временем покоящейся системы» в точках Л и Б, в которых в данный момент находятся концы стержня. Возле каждых часов помещается «наблюдатель», который описанным 24
выше способом проверяет синхронность хода этих часов. В некоторый момент времени fл из А посылается световой сигнал, и луч света приходит в В в момент /^возвращаясь затем назад в Л в момент, когда показание расположенных здесь, в точке А, часов равно t'A. Каковы промежутки времени, необходимые, чтобы свет прошел из точки А в точку В и обратно? Первый промежуток времени равен разнице в показаниях часов: / / Гав где гАВ представляет собой длину движущегося стержня, измеренного в покоящейся системе, a v — скорость движения стержня относительно неподвижной системы. Промежуток времени, необходимый для возвращения светового сигнала, т. е. для движения луча после отражения в точке В, измеряется разницей между показаниями часов в точке А, когда луч вернулся, и показаниями часов в В в момент, когда свет отразился в этой точке и повернул обратно. Этот промежуток равен: Буквой с мы обозначаем в обоих случаях универсальную константу — скорость света в пустоте. Наблюдатель, движущийся с движущимся стержнем, убедится, таким образом, что часы, расположенные в Л и В, т. е. на концах стержня, идут несинхронно. Указанное выше условие синхронности явно не соблюдается: промежуток, необходимый для движения луча в одном направлении, не равен промежутку времени, необходимому для обратного движения; а равенство указанных промежутков времени и было определением синхронности часов. Синхронность же часов означает, что события, которым соответствуют одинаковые положения стрелок, одновременны. То, что было одновременным для наблюдателя, находящегося в покоящейся системе, стало неодновременным для движущегося наблюдателя: часы, синхронные для покоящегося наблюдателя, перестают быть синхронными, когда он принимает участие в движении стержня. 25
Следующий параграф статьи Эйнштейна посвящен преобразованиям пространственных координат и времени от покоящейся системы к системе, находящейся в равномерном поступательном движении относительно первой. Мы изложим этот параграф, несколько изменив буквенные обозначения. Перед нами две системы XYZ и X'Y'Z', причем оси X и X' совпадают, a Y и Y' и Z и Z', соответственно, параллельны. В каждой системе применяются одинаковые часы и масштабы. Система со штрихами движется со скоростью v по оси X, т. е. координата ее начала движется в сторону возрастающих х нештрихованной системы. Время покоящейся системы обозначим через t. Измерим в покоящейся системе XYZ покоящимся масштабом координаты некоторой точки и обозначим их через х, у, г\ в движущейся системе X'Y'Z' — с помощью движущегося масштаба получим координаты х', у', z'. Теперь покоящимися часами измерим время t для точки покоящейся системы XYZf a другими часами, движущимися вместе с X'Y'Z't иначе говоря, часами, покоящимися в штрихованной системе, определяем время в этой системе /'. Если в точке х, у, z в момент t произошло какое-то событие, то оно определяется в движущейся системе величинами х', у', z/ и /'. Как перейти от нештрихованных величин к штрихованным? Какими уравнениями они связаны? Из постоянства скорости света и свойств пространства и времени при переходе от XYZ к X'Y'Z' выводятся преобразования Лоренца: х'. V Эйнштейн устанавливает физическое значение этих уравнений для движущихся твердых тел и движущихся часов. Он берет тело, которое в состоянии покоя имеет • vt у' = у. z' = z, 4 V /«-■?■ 25
форму шара с радиусом /?, с центром в начале координатной системы X'Y'Z'. Уравнение поверхности этого шара в этой системе будет: х>г + у>2 + Zi% ^ ^2# Уравнение той же поверхности, выраженной через координаты х, у, z, в момент *=0 будет: ,-^—г +y2 + z2 = R\ Таким образом, в неподвижной системе XYZ движущийся с системой X'Y'Z' шар уже не шар, а эллипсоид вращения с осями ЯУ\— v2/c* f Rf R. Иными словами, расстояние вдоль направления движения—по оси X сокращается (множительYl—v2/c2 меньше единицы). Если v = с, этот множитель становится нулем, т. е. шар становится плоской фигурой. Это и есть лоренцо- во сокращение линейных масштабов. Вспомним теперь, что часы, движущиеся с системой X'Y'Z'\ показывают в неподвижной системе XYZ время f, т. е. меньшее, чем tt число секунд: V = t У 1 — v* I с2. Относительно преобразований Лоренца и одновременность, и пространственные и временные интервалы оказались неинвариантными, они изменяются при переходе от одной инерциальной системы к другой. Из постоянства скорости света вытекает существование другого инварианта. Таким инвариантом служит интервал собственного времени 5. Он связан с временным интервалом и пространственным интервалом простым соотношением. В одной из инерциальных систем измерим расстояние между точками А\ и Л2, где произошли два события. Координаты первой точки Х\, уи гх\ координаты второй — х2, у% *>ъ Пространственное расстояние между точками обозначим через г. Квадрат этого расстояния равен сумме квадратов разностей координат: f = (^ -Xl)* + (у2 - у•,)• + (z, - гх)\ 27
Возведем в квадрат интервал времени между теми же событиями и вычтем из него квадрат пространственного интервала, деленный на квадрат скорости света с. Разность и будет квадратом интервала собственного времени - ^Г К*2 - *l)2 + (У* ~ У1)2 + (*» - 2l)2J- Вычислим теперь интервал собственного времени между теми же событиями в другой инерциальной системе. Соответствующие величины обозначим теми же буквами, но со штрихами: - ^t К*2 - *1)2 + (ft ~ У\? + (Z% - Zi)2]. Из преобразований Лоренца следует, что s'2 = s2. Инвариантность s относительно преобразований Лоренца равнозначна постоянству скорости света в инерциаль- ных системах. Представим себе систему отсчета, в которой рассматриваемые события происходят в одной и той же точке пространства. Например, первое событие — это гудок в полдень на вокзале города Ль а второе событие — гудок в полночь на вокзале той же дороги в городе Л2. В координатной системе поезда, вышедшего в полдень из города А\ и пришедшего в полночь в город А2, гудки произошли в одном и том же месте. Время нахождения поезда в Пути, измеренное часами, находящимися в поезде, равно интервалу собственного времени. Всегда ли можно найти систему координат, в которой два события произошли в одном месте? Всегда ли можно найти такой быстрый поезд, который после гудка на вокзале в А\ поспевает к гудку в Л2? Всегда ли, иными словами, величина s2 будет положительной и, соответственно 5 — вещественной? Представим себе, что t2—t\ стремится к нулю, т. е. промежуток времени между двумя рассматриваемыми событиями неограниченно сокращается, гудок в Л2 раздается через миллиардную долю секунды после гудка в Ль а за- 29
тем этот промежуток становится еще меньше. Чтобы s оставалось вещественным, чтобы, следовательно, t2 — г2/с2 оставалось положительным, необходим неограниченный рост скорости системы, в которой события находятся в одном месте, необходимо, чтобы поезд двигался из Л! в А2 с неограниченно растущей скоростью. В классической механике всегда можно было представить себе систему координат, движущуюся с большей скоростью, чем любая заранее назначенная скорость. Классическая механика допускала бесконечное увеличение скорости. В механике теории относительности такая система невозможна. Поезд из А\ в А2 не может идти быстрее света. Поэтому при очень небольших временных интервалах, меньших, чем время, за которое свет доходит из А\ в Л2, гудки не могут произойти в одной системе, не может быть часов, покоящихся в такой системе, и интервал собственного времени становится мнимой величиной. В этом случае второе событие, во второй точке, происходит раньше, чем сюда попадает луч, вышедший во время первого события из первой точки. Такие события с точки зрения теории относительности не могут быть соединены причинной связью, второе событие не может быть следствием первого. В этом случае мы можем вместо мнимого 5 ввести другой инвариант о, связанный с 5 соотношением: а2 e _ C2S2 e {X2 _ Xi)2 + {у2 _ у])% + + (г2-г})2-с2(12-^)2. Для любых двух событий либо s вещественно (тогда о — мнимо), либо о вещественно (тогда s — мнимо). В первом случае, когда интервал собственного времени — вещественная величина, события могут быть соединены причинной связью. Тогда интервал между ними называется в р е- менноподобным. Во втором случае нельзя ввести координатной системы, в которой события происходят в одном месте, но зато можно свести t2 — W к нулю, т. е. представить себе систему отсчета, где рассматриваемые события одновременны. Интервал между ними называется в этом случае пространственноподобным, и вещественна при этом величина о — пространственное расстояние между точками, в которых произошли два события. Возвращаясь к старому примеру, можно сказать: 29
&сли гудок в А2 произошел раньше, чем мог дойти луч света, посланный в момент гудка в Аи то можно ввести систему отсчета, где эти гудки одновременны. Каков будет интервал собственного времени в поезде, движущемся со скоростью света? Это особый случай. Между любыми событиями, между любыми точками, мимо которых прошел такой поезд, интервал собственного времени равен нулю. Таким образом, преобразования Лоренца определены только для тех случаев, когда скорость системы XYZ относительно X'Y'Z' не превышает скорости света. Релятивистская механика отвергает возможность движения одной системы относительно другой со скоростью света. Из преобразований Лоренца вытекает правило сложения скоростей V\ и v2: 0== fr'l + V2 1+ с2 которое при малых скоростях превращается в классическое правило v = v{ + v2. Очевидно, результирующая скорость v согласно релятивистскому правилу сложения при V\ < с и v2 < с не может быть больше и даже равна с. Сама скорость с, если к ней прибавить новую скорость, не изменится. Это — предельная скорость. В ньютоновой динамике скорость могла возрастать неограниченно при последовательном приложении силы к движущемуся телу. При постоянстве массы (а это — основа ньютоновской механики) каждый дополнительный толчок вызывал соответствующее ускорение. В динамике Эйнштейна последовательное приложение силы к движущемуся телу вызывает каждый раз некоторое ускорение, но скорость при этом не может перейти некоторые границы. Чем выше скорость, тем меньше становится ускорение под действием тех же сил. Говоря языком механики, со скоростью растет и эффективная масса тела. По мере того как скорость движущегося тела приближается к скорости света, масса стремится к бесконечности и, соответственно, ускорение становится исчезающе малым. Таким образом, масса тела теряет абсолютное значение; она имеет определенное значение только в данной системе координат и зависит от скорости тела в этой системе. 30
1еория Эйнштейна релятивирует не только йрострайсГ- венную и временную протяженность, но и массу; вернее, она показывает относительность значений массы, как и протяженности, в координатных системах, с тем чтобы перейти к инвариантному выражению указанных физических величин. Если масса зависит от движения системы, то нужно в качестве исходного понятия рассматривать массу то тела, покоящегося в данной системе, а затем перейти к определению массы m этого тела в системе, относительно которой тело движется. Величины пц и т связаны преобразованием: т, — г . В сентябре 1905 г. Эйнштейн написал небольшую статью—дополнение к первой работе о специальной теории относительности, где на двух страницах вывел знаменитое релятивистское соотношение между массой и энергией 1: Е = тс2. Энергия тела, движущегося со скоростью а, равна £= т0с2 Отсюда следует, что при v = 0 энергия равна: Е0 = т0с2. Только что указанное соотношение между энергией и массой является одним из самых важных следствий теории относительности, проверенным с огромной точностью в современной физике атомного ядра и элементарных частиц. На связь энергии и массы опираются, в частности, расчеты ядерной энергетики, использующей процессы с выходами энергии, сопоставимыми по величине с собственной энергией. На заре релятивистской физики ее считали чрезвычайно абстрактной и далекой от практики теорией. Характер- 1 Ann. d. Phys., 18, 639, (1905). Русск. пер. см. «Принцип относительности», стр. 175—178. 31
ный коэффициент v2lc2 был мерой малости релятивистских эффектов, считавшихся поправками. Абстрактность теории оказалась на самом деле признаком ее применимости к отдаленным тогда экспериментальным и производственным проблемам. Теория относительности первоначально была лишь фактом истории науки, теперь она стала также фактом истории техники. Это происходит с каждой научной теорией, появившейся и развивающейся на столбовой дороге научного прогреоса, подготовленной работой ученых в прошлом и открывающей широкие перспективы на будущее. 3. Преобразования и инварианты После классических работ Эйнштейна для дальнейшего развития специальной теории относительности особенно большое значение приобрели труды Германа Минковского (1864—1908): «Принцип относительности» (1907), «Основные уравнения электромагнитных явлений в движущихся телах» (1908) и «Пространство и время» (1908) К Согласно Минковскому для понимания теории относительности -нужно учесть связь пространства и времени и ввести четырехмерное пространство-время. Без этого шага специальная теория относительности не могла бы так быстро стать ступенькой к более широкой и общей теории. Новый математический формализм четырехмерной геометрии дал огромный толчок развитию новых представлений. Чтобы изложить специальную теорию относительности в той форме, какую она приняла после Минковского, понадобятся некоторые математические понятия. Мы их введем в этом параграфе, который имеет подсобный характер (развитие математического аппарата не входит в содержание этой книги) и построен совсем не исторически. Вводя математические понятия и одновременно пытаясь выяснить их физический смысл, мы неизбежно должны подниматься к самым общим абстракциям и говорить об относительном и абсолютном в общем смысле, включающем и классический принцип относительности, установленный в XVII в., и современную теорию относительности. Такое, 1 Доклад, сделанный на съезде естествоиспытателей и врачей в Кельне 21 сентября 1908 г. Phys. Zeitschr., 10, 105, (1909). Русск, rep см. «Принцип относительности», стр. 181—203. 32
наиболее абстрактное, понятие относительности ни в коем случае нельзя рассматривать как априорное требование познания. Напротив, лишь физическое исследование и в частности эксперимент решает вопрос, применима ли и в какой конкретной форме применима абстрактная теория относительности к данному ряду явлений — гравитационных, электродинамических и т. д. Минковский изложил теорию относительности в форме теории инвариантов так называемой псевдоэвклидовой четырехмерной геометрии. Инвариантами, или скалярами, называются, как известно, величины, заданные каждая только одним числом, не меняющимся при переходе к другим координатам, т. е. при координатном преобразовании. Это понятие тесно связано с понятием относительности. Различие между классическим принципом относительности Галилея — Ньютона (независимость механических процессов от инерционных движений), специальным принципом относительности Эйнштейна и общим принципом относительности можно представить как различие в физических величинах, остающихся инвариантными при некоторых координатных преобразованиях, и как различие в преобразованиях, оставляющих инвариантными некоторые физические величины и соотношения. В классической физике инвариантными, независимыми от выбора системы координат, считали пространственные и временные интервалы. Изучая движения твердых тел и жестких систем, пришли к убеждению, что расстояние между двумя точками, например, двумя концами твердого стержня, не меняется при движении стержня, не зависит от положения стрежня, от его координат в какой-то системе, от выбора координатной системы. Если положение каждой точки относительно, если координаты точки зависят от того, к какой системе они отнесены, то расстояния между точками, входящими в систему, представляют внутреннее свойство системы, не зависящее от положения точек. Движение системы не меняет взаимных расстояний между материальными точками системы, не меняет ее структуры; система при таких движениях остается жесткой. Эти свойства материальных тел отображаются геометрическими законами. Конечно, не всякая геометрия описывает свойства твердых тел и жестких систем. Применяемую в каждом случае геометрию можно охарактеризовать ее 33
инвариантами. В эвклидовой reoMefpHH расстояние между точками — инвариант при преобразовании координат. В эвклидовой геометрии на плоскости квадрат расстояния г между двумя точками {хь ух) и (х2, у2) равен: Если речь идет не о прямых отрезках, а о кривых на плоскости, то вместо г мы можем взять интеграл по бесконечно малым расстояниям dr. Так пришли к дифференциальной квадратичной форме: dr2 = dx2 + dy2. В геометрии Эвклида в пространстве инвариантом является квадрат бесконечно малого расстояния между двумя точками трехмерного пространства: dr2 = dx2 + dy2 + dz2. Совокупность инвариантов — расстояний между материальными точками системы — образует ее пространственную структуру. Написанные только что выражения для dr2 представляют собой формулы перехода от величин, меняющихся при смене системы отсчета (имеющих поэтому смысл только при указании системы отсчета) и выражающих пространственную ориентировку системы, состоящей из точек (х, у, z) и (x+dx,y+dy,z+ + dz), к величине, независимой от системы отсчета (инвариантной при смене системы отсчета, выражающей структуру системы). Речь идет о трехмерном пространстве. Но не лишним будет хотя бы намекнуть здесь на более общую трактовку понятия координат и перехода от координат к инвариантным величинам. Рассмотрим однозначное соответствие между физическим многообразием F и множеством чисел М. Представим себе множество физических объектов (или, что в данном случае безразлично, множество состояний одного и того же объекта в различные моменты времени) и будем сравнивать свойства этих объектов, относящиеся к одному и тому же классу — плотности, температуре, цвету, пространственному положению и т. д. Свойства, относящиеся к одному и тому же классу, образуют физическое многообразие: плотность, температуру, цвет и т. д. В зависимости от характера физического многообразия, от свойств, которые мы изучаем, ему сопоставляется множество целых чисел, 34
алгебраических чисел, всех чисел. Сопоставление числового множества физическому многообразию назовем параметризацией многообразия. Иногда изучаемые свойства могут быть представлены не множеством чисел, а множеством систем, состоящих из п чисел каждая. Тогда говорят об n-мерном многообразии. Такие многообразия, как количество молекул газа в некотором объеме, пара- метризируются множеством целых чисел. Такие многообразия, как объем, вес, температура, могут быть представлены более мощными множествами вплоть до множества всех чисел. Положение на поверхности — это другое свойство; многообразие таких положений параметризируется множеством двоек чисел, например широт и долгот. Положению в пространстве соответствуют три числа; кроме только что указанных,— высота (например, над уровнем моря). Событие — прообраз четырех чисел (три упомянутых и время, прошедшее с начала суток, месяца, года, начала летоисчисления). Иногда сопоставление физического многообразия с множеством чисел позволяет только отличить один его элемент от другого. Но если мы изучаем свойства, допускающие сравнительную оценку, если к ним применимы понятия интенсивности — «больше» и «меньше», то большей интенсивности соответствует большее число, а меньшей — меньшее. Здесь мы сталкиваемся с относительными понятиями: «больше» и «меньше» имеют смысл, если только указать больше или меньше чего данная интенсивность. То же самое — оценки: «справа — слева», «сверху — снизу», «впереди — сзади», «раньше — позже». Каждая из них характеризует место и время событий относительно другого. Можно перенести эти соотношения в мир числовых множеств и параметризировать многообразия интенсивностей, сопоставляя их множествам чисел или систем чисел. Дальнейший шаг позволяет параметризировать физические многообразия с помощью множеств равноотстоящих чисел. Если каждые три элемента многообразия — это три равноотстоящие интенсивности /ь /г и /з, т. е. /з настолько больше/г, насколько/г больше fi, то мы можем сопоставить ряду равноотстоящих интенсивностей f\, f2, /з,... ...,f п ряд чисел ти т2, т3,..., т„, которые отличаются тем свойством, что п%г — т2 = т2 — ти /я*— та = п%г — Ш2,...; вообще тп — тп_х = тПттХ — тп_г 35
Разумеется, такое свойство, как «пространственное положение» тела, нельзя ни измерить, ни оценить выражениями «больше» или «меньше», если не разделить каждое такое свойство на три измеримые интенсивности — расстояния от трех внешних тел. Каждая материальная точка имеет пространственное положение, заданное тремя числами, а многообразие пространственных положений па- раметризируется многообразием систем из трех чисел каждая. Поэтому мы будем считать, что при параметризации физического многообразия F: F-+M, каждому прообразу, т. е. элементу / физического многообразия F (записывается / 6F), соответствует элемент т числового множества М (тб М), причем т может быть и одним числом -и системой, состоящей из двух, трех, вообще — многих чисел. Следуя Веблену и Уайтхеду 1 и немного изменяя их схему, изобразим параметризацию следующим образом (фиг. 2); фигура слева обозначает физическое многообразие, справа — множество чисел или числовых систем. Разумеется, измерение ин- тенсивностей оставляет в силе относительность понятий «больше — меньше» и «слева — справа». Вводя положительные и отрицательные отсчеты, мы сводим их к вдвое меньшему числу оценок. Далее можно соединить эти относительные количественные оценки (например, соединить оценки «настолько-то направо», «настолько-то вверх», «настолько-то вперед») и получить также относительное понятие места в какой-то системе координат. Параметризация позволяет количественно выразить и другие понятия, не требующие тела отсчета, относящиеся к двум и более материальным точкам и выражающие структуру такого многообразия. Структура может быть представлена в виде ряда измеримых интенсивностей — собственных свойств геометрических фигур и, соответственно, после параметризации, в виде чисел. Пространст- 1 О. Веблен и Дж. Уайтхед. Основания дифференциальной геометрии. М., ИЛ, 1949, стр. 40. сч 36
венные расстояния («отрезок прямой между точками содержит 10 см»), временные интервалы («между этими событиями прошло 10 лет»), объемы и площади представляют собой измеримые интенсивности, не требующие указаний на опорные тела отсчета. Двум точкам принадлежит внутреннее свойство — расстояние, многим точкам — объем, форма, плотность, средняя скорость взаимных смещений и т. д. Параметризация этих свойств может дать математические величины, не зависящие от выбора параметризации положений. Правда, и здесь требуются указания на величину масштаба, но на это обстоятельство пока не I будем обращать внимания; i позже мы о нем вспомним. /fV—) Теперь нам понадобится ч/^^| другое понятие, с которым { мы, впрочем, уже встреча- | лись,— понятие преобразования. Схематически его можно изобразить так (фиг. 3). Под преобразованием будем понимать переход от параметризации F-^M к параметризации F-^AT. Сначала остановимся на частных примерах преобразований, потом на понятиях, позволяющих классифицировать бесчисленное множество различных преобразований. Представим себе параметризацию измеримого и фактически измеренного физического многообразия F->M и вторую параметризацию F-*M'. Многообразие F не меняется от выбора параметризации, поэтому каждому /6 F соответствует одно и только одно тбМ и одно и только одно т'€М'. Следовательно, однозначное соответствие существует и между М и М'. В таких случаях говорят, что т'€М' является функцией т€М. Если при переходе т^т' мы меняем только начальное значение измеряемой интенсивности (т. е. интенсивность, соответствующую нулю) и масштаб (т. е. разность интенсивностей, соответствующую единице в числовом ряду, то мы можем выразить т' через т линейной функцией: т' = f(m) = h + рт, где постоянная h зависит от выбора нового начального значения, а постоянная [i — от выбора масштаба. Если it 37
начальное значение при преобразовании не меняется, то т' выражается через т линейной однородной функцией: т' = f(m) =p т. Если меняется только начальное значение, то mr = f{m) = h + т. Ниже будет сказано, как называется это преобразование. Теперь для наглядности и вместе с тем без ущерба для общности представим себе, что мы все время параме- тризируем геометрические свойства физических объектов (причем ограничиваемся тремя измерениями), т. е. описываем пространственные положения материальных точек, их расстояния, углы, линии, поверхности и объемы, соответствующие форме и движениям материальных тел. Пространственное положение каждой точки задано тремя числами х, у, z, или Х\, х2, х$, — координатами. При координатном преобразовании новые координаты выражаются через старые уравнениями: Х\ = fi (#1, Х2, *з)» Х2 == /2 (*1> ХЪ *з)» Х9 = /3 \Х1> Х2> Х3/' Вид этих уравнений зависит от характера преобразований. Остановимся на самой простой системе параметризации и на самом простом переходе от одной параметризации к другой. Возьмем декартовы координаты, т. е. числа х, у, z, или Х\у Хъ *з/ выражающие длины перпендикуляров, опущенных из точки на три взаимно перпендикулярные оси. Если вместо первоначальных осей мы выберем другие оси, то координаты х\9 х2, хг переходят в другие координаты х\\ х2, х/. Поворот осей без переноса начала координат представляет собой однородное преобразование. Оси Хи Х2, Х3 переходят в X/, X2t ЛУ тремя поворотами: сначала в плоскости Х\ХЪ вокруг ХЪ) затем в плоскости ХхХг вокруг Х2 и, наконец, в плоскости Х2Х3 вокруг Хх. Косинусы углов между старыми осями и новыми обозначим буквами а с индексами, соответствующими номерам координатных осей, так что косинус угла между Х\ и Х\' будет 011, косинус угла между Хх и Х2 будет аХ2 и т. д. Тогда каждая новая координата будет линейной функцией трех старых: х\ = аххх1 + Q\<tx2 + a\sxz> 38
I X2 = #21*1 + #22*2 + #23*3» XZ = Д3Л + #32*2 + #83*3 • Написанные здесь уравнения изображают однородное линейное преобразование. Если преобразуется прямоугольная система координат в другую прямоугольную систему, то коэффициенты ахи а12, а13, а2\ и т. д. обладают особым свойством. Расположим их в таблицу так, чтобы каждой новой оси соответствовала горизонтальная строка коэффициентов — косинусов углов, образуемых новой осью со старыми осями: Xi Х2 Х$ х'х \ап ап а13 i I Х% #21 #22 #23 i Х$ |#31 #32 #33 Сумма квадратов коэффициентов, входящих в одну и ту же строку или в один и тот же столбец, равна единице. Сумма произведений коэффициентов, входящих в разные столбцы или строки, равна нулю. В этом состоят условия ортогональности. Если они соблюдаются, перед нами ортогональное преобразование, при котором фигуры и тела движутся без деформации, не меняют внутренних свойств, и прямоугольные системы координат переходят в другие, также прямоугольные системы. Ортогональные преобразования включают не только движения, но и зеркальные отражения, т. е. изменение направления одной из осей на противоположное. Таким образом фигура преобразуется при отражении в зеркале. Здесь также одни прямоугольные координатные системы переходят в другие. Этот случай мы не будем рассматривать; ограничимся преобразованиями-движениями, из которых мы пока сравнительно подробно остановились на поворотах. Преобразования, сводящиеся к повороту ортогональных координатных осей, образуют группу преобразований. С этим понятием мы сталкиваемся впервые. Множество преобразований образует группу, если два последовательных преобразования дают преобразование такого же класса и если каждому преобразованию соответствует обрат- 39
иое преобразование того же класса так, что последовательно примененные прямое и обратное преобразования дают тождественное преобразование, т. е. не меняют параметризации. Тождественное преобразование также входит в группу. Например, все однородные преобразования образуют группу, так как два однородных преобразования представляют собой также однородное преобразование и каждому однородному преобразованию соответствует обратное, тоже однородное преобразование. Ограничимся группами, с которыми придется сталкиваться и дальше. Преобразования, состоящие в повороте пространства с находящимися в нем телами вокруг некоторой точки или в переходе к новой системе координат, оси которой повернуты вокруг старых осей, образуют группу вращения. Выше приводились уравнения, которыми заданы преобразования вращения. Существует группа преобразований, которые можно физически представить как перенос тела на другое место без вращения, так что все точки описывают параллельные пути. Эта группа называется группой параллельного переноса. При таком переносе к координатам точки прибавляются некоторые постоянные величины. Эта группа задается неоднородными уравнениями: х[ = *i + К #2 = %2 Г "2> #3 = *3 "Г "3« В частном случае, когда направление переноса совпадает с одной из осей, например тело переносится по оси xh эти формулы приобретают вид: x'i = *i + К, %2 ^ -^2» i %3 == •*$• Группа вращения и группа параллельного переноса образуют группу линейных ортогональных преобразований, при которых геометрическая фигура движется как жесткое целое; например, листок с изображением фигуры передвигается произвольным образом по плоскому столу. Уравнения таких преобразований можно получить, приба- 40
вив в написанных выше уравнениях вращения осей к правым частям координаты hi нового начала координат в старой системе: *1 *= #11*1 + 012*2 + #13*3 + Л1' %2 = #21*1 "Г #22*2 ~Ь #23*3 4" "2> Х$ = #31*1 4" #32*2 ~Ь #33*3 ~Ь "3- Эти преобразования можно назвать группой движения без деформации. Поворотами и смещениями ограничивается движение недеформируемой фигуры или тела. Далее идет более общая аффинная группа, где геометрическая фигура может не только переноситься на другое место и поворачиваться, но и сжиматься, так что круг, например, превращается в эллипс. Общая аффинная группа уже не требует, чтобы прямоугольные координаты переходили в другие прямоугольные, как это было в ортогональной аффинной группе. Здесь мы имеем дело, вообще говоря с косоугольными координатами. Соответственно отменяются условия ортогональности. Ортогональная аффинная группа входит в общую аффинную группу. Наиболее общий характер имеет группа топологических преобразований, при которых геометрические фигуры произвольно растягиваются, сжимаются, деформируются, но не могут испытать разрыва, так что преобразования ограничены лишь требованием непрерывности. Характеризуя группы преобразований, мы незаметно перешли от указания «что изменяется» к указаниям «что сохраняется». При координатных преобразованиях, как уже было сказано, некоторые геометрические величины и соотношения остаются неизменными. Некоторые пространственные свойства физических объектов независимы от параметризации, они сохраняются при переходе к .другой параметризации. Эти свойства называются собственными, а свойства, зависящие от параметризации — несобственными. Переход от несобственных свойств к собственным, переход от координат к инвариантам означает приближение к объективному, независимому от методов исследования содержанию научных законов. По мере возрастания «силы», «глубины», «радикальности», а лучше всего сказать,— общности преобразо- 41
ваний, сохраняется все меньшее количество инвариантных величин и соотношений. Из всех инвариантов для нас сейчас важно рассмотреть один — расстояние между точками. Это — инвариант группы ортогональных преобразований трехмерного эвклидова пространства. В эвклидовой геометрии существует всем известная теорема Пифагора: квадрат гипотенузы равен сумме квадратов катетов. Если взять две точки на плоскости, то квадрат расстояния между ними будет равен сумме квадратов разностей их координат. Как бы ни менялись координаты точек при переходе к другим координатным системам (или при движении двух точек), расстояние между ними оказывается неизменным. В трехмерном пространстве квадрат расстояния, равный сумме квадратов трех координатных разностей, также не меняется при движении координатных осей или при движении обеих точек относительно осей, если преобразование ограничено группой движения, т. е параллельными сдвигами и поворотами. Это характерный признак эвклидовой геометрии. Является ли расстояние или квадрат расстояния (сумма квадратов координатных разностей) инвариантным в случае лоренцовых преобразований? Может быть, здесь инвариантной оказывается другая величина? Ответ на этот вопрос был дан Эйнштейном, Пуанкаре и Минковским в 1905—1908 гг. Перенесемся из мира геометрических свойств физических многообразий в мир, где эти свойства параметри- зированы, в мир числовых множеств. Здесь требуется не наглядно-геометрическое, а абстрактно-арифметическое представление о расстояниях. Расстоянием здесь называется особое число, приписываемое двум упорядоченным системам чисел — арифметическим точкам. Это число определяется указанными системами, является их функцией. Если одна точка задана системой трех чисел (координат) хь х2, *з, а другая точка числами (координатами) Х\'> х{у Xz\ то расстояние г будет функцией названных шести чисел: Т — / (#!, #2> Х^\ #i, #2» ^ЗУ* Вид этой функции зависит от избранной системы параметризации. Если при параметризации указан вид функции, связывающей расстояние с координатами, то го- 42
ворят, что этим определена метрика пространства В случае прямоугольных координат, как мы видели: з г2=(*; - *i)2+(*; - *г?+(*; - *8)2 = 2 (* - *о2. Возьмем бесконечно малое расстояние и обозначим его через dr, а дифференциалы координат через dxu dx2, dxz. Тогда, как уже было написано выше, 8 dr* = d4 + dxl + d4=2idx'?, /-1 т. е. квадрат линейного элемента — это дифференциальная квадратичная форма. Она не зависит от перехода к другим координатам, от изменения параметризации: dr2 = d*2 + dx\ + dx\ = dxl + dx'\ + dx'l Квадратичная форма включает не только квадраты dx2y. (т. е. dxydx^)% но и dx^dxv—попарные произведения различных дифференциалов координат. Эти квадраты и произведения входят в многочлен с различными коэффициентами. Обозначим коэффициенты буквами g с двумя индексами, соответствующими индексам перемножаемых дифференциалов координат: коэффициент при произведении dxxdx{ (т. е. dx{2) обозначим через £ц. Коэффициенты произведений дифференциалов различных координат, например dx\dx2 или dx\dxz, обозначим через gn или, соответственно, g\Z и т. д. Иначе говоря, коэффициенты произведений dx^dxv обозначим через g^v. Тогда: dr2 = gndx\ + g12dx1dx2 + giZdxxdxz + gndx2dxx + g22dx*2 + + g2*dx2dxz + gzldxzdxx + gz2dxzdx2 + gzzdx2z. Поскольку gndxxdx2 = g2idx2dxL, giZdxxdxz = gzxdxzdxlt g2^ix2dxz = gZ2dxzdx29 43
мы можем привести подобные члены: dr2 = gndxl + g22dx\ + gzzdx\ + + 2g12dxxdx2 + 2g13dx1dxs + 2g2Zdx2dxz. В сокращенной записи эта дифференциальная квадратичная форма будет иметь вид: з dr2 = ^g^dx^dxy. В случае прямоугольных координат получается гораздо более простое и короткое выражение, чем написанные выше многочлены с девятью или шестью членами, и коэффициенты gVvB нем не фигурируют. В этом случае gll = g22 = #33 = 1 И gi2 = gl3 = #21 = #23 = #31 = £з2 = О, Иначе говоря, g^ = 1, если (x = v, и g^v = 0, если fi=£ v. Подставив эти значения g^v в общую формулу, мы и получаем для ортогональных координат краткую и простую формулу, определяющую квадрат линейного элемента (иначе говоря, бесконечно малое расстояние) как функцию дифференциалов координат: dr2 = dx\ + dx\ + dx\. Для специальной теории относительности этой формулы (несколько обобщенной) достаточно; для изучения общей теории относительности нам понадобится общая формула. Если координатная система не прямоугольная, а косоугольная, то g^ имеют иные, не нулевые или единичные значения. Чтобы разгрузить от математических подробностей и без того трудное изложение общей теории относительности, мы уже сейчас остановимся на некоторых понятиях, имеющих значение для косоугольных и еще более сложных координатных систем. Расположим коэффициенты g в таблицу: gll gl2 gl3 &21 &22 &23 gsi g$2 gdS' Написанные девять (если g^ = g^,TO шесть) коэффициентов дают возможность в каждой точке трехмерного 44
пространства определить расстояние между двумя бесконечно близкими точками, т. е. определить инвариантные, не зависящие от параметризации, от выбора координатной системы, свойства, по внешним, изменяющимся при координатных преобразованиях свойствам. Эти коэффициенты определяют метр и к у пространства. Их называют фундаментальным метрическим тензором. Значения компонент метрического тензора показывают, какой системой координат параметризировано изучаемое многообразие. Можно параметризировать каждое многообразие свойств или объектов различными системами координат, например, для двухмерного пространства применяются прямоугольные, косоугольные, полярные координаты, а при изучении земной поверхности (тоже двухмерного пространства) применяется система координат, состоящая из широт и долгот. Квадрат бесконечно малого расстояния на поверхности через дифференциалы прямогугольных координат дается выражением: dr2 = dx\ + dxj. ЗдеСЬ g[X = g22 = 1 И gi2 = #21 = 0. Это — известная теорема Пифагора. В полярных координатах, если обозначить радиус-вектор р через х\ и угол & через х2: dr2 = dp2 + РШ2 = dxl + x\d& Здесь коэффициенты g^v равны: gu = 1, g22 = л2, gl2 = #21 = 0. В косоугольных координатах dr2 =dx% — 2kdx^x2 + dx\, где k — косинус угла между направлениями осей. Здесь gu = #22 = 1; gn = £21 = — k. В системе широт и долгот на сферической поверхности: dr2 = dx\-\- cos2 Xidxli где Х\ — широта, а х2 — долгота. Эту формулу мы получим, подставив в общую формулу: 2 li.v-i 45
Значения g^: gu = i, £22 = cos**,, gn = £21 = 0. Таким образом, с помощью коэффициентов gfJLV можно узнавать, какой координатной сетью параметризировано пространство, и получить независимые от координатной сети инвариантные геометрические отношения — расстояния между точками. Такое выключение относительных, внешних определений и переход к внутренним геометрическим понятиям представляет собой основной математический смысл тензоров вообще и фундаментального метрического тензора g^> в частности. Если обобщить на четырехмерное многообразие метрические формулы, т. е. формулы, выражающие линейный элемент dr через дифференциалы координат, то мы будем иметь десять коэффициентов g^, так как из шестнадцати компонент четырехмерного тензора второго ранга в данном случае (так называемого симметричного тензора) шесть компонент равны другим: gn — £21, ffl3 = gz\> g\A = g4b #23 = ^32, g24 = #42, gZA = #43- Расположим различные значения в таблицу и зачеркнем те значения, которые уже встречались. Мы получим десять коэффициентов: ?n £t2 gu tfu /21 £22 #25 *24 4ъ\ 4& £зз *Гз4 4ь\ 4кг 4аъ Z* По аналогии с плоской двухмерной поверхностью, в которой возможны плоские двухмерные декартовы координаты и где g равны нулю или единице, мы вводим понятие плоского четырехмерного многообразия и вставляем в предыдущую таблицу значения: 10 0 0 0 10 0 0 0 10 0 0 0 1. Мы перешли от трехмерного пространства к четырехмерному многообразию. Можно пойти дальше и предста- 46
вить фундаментальный метрический тензор в еще боЛее общей форме в л-мерном многообразии. Когда мы рассматриваем множество точек в чисто арифметическом смысле, т. е. множество упорядоченных систем, включающих п чисел каждая, то каждым двум точкам Х\, л:2,..., хп и Х\\ л^',..., хп соответствует число г, которое можно по аналогии назвать «расстоянием» в n-мерном «пространстве». Квадрат такого числа будет равен: r2 = gu(xl — x1)2 + gl2(x1 — xl)(x2 — x2)-\ + + gin (x[ — ХХ) (Хп — Хп) + #21 {Х% — Х2) (х[ — Xt) + + §22 (*'г — Х2)2 Ч + gin {Хг — Х2) (Хп — Хп) + + gsi (*з — *з) (*i — *i) Ч- gn (*з ~ *s) (х2 — х2) Ч Ч- +8яп{х'г — х3) (х'п — хп) + • • • + gnl (Хп — Хп) (х[ — ХХ) + + gni (Хп + Хп) (Х2 — Х2) Ч 1" gnn {Хп - Хп)2. Квадрат бесконечно малого линейного элемента dr запишется в виде: dr2 = gndxl Ч- gy£xxdx2 Ч- • • • Ч- gindxxdxn + + g2idx2dx1 Ч- ^22^ Ч V g2ndx2dxn + + Ч- + gmdxndx1 + gn2dxndx2 + f- gnndxn . Коэффициенты g^ являются функциями координат xL, где i = 1, 2,..., л. Весь этот многочлен, который будет включать п2 слагаемых, можно представить краткой записью: л dr2= 2 g^dx^dxv. p., v—1 Коэффициенты gn gi2-- gin #21 g*2 ' " g2n gnl gn2 * ' * gnn образуют фундаментальный метрический тензор в n-мерном пространстве. 47
Мы столкнулись с понятием тензора в трехмерном, четырехмерном и вообще n-мерном пространствах. Понятие тензора было введено Риччи еще в 1887—1889 гг., а свое название и новое поле применения оно получило в 1914— 1916 гг. в работах Эйнштейна по общей теории относительности. Можно ли, не претендуя на строгость, дать некоторое наглядное представление об этом понятии? Когда речь идет о векторе, у нас сразу возникает вполне наглядное представление об отрезке определенной длины, определенным образом ориентированном относительно координатных осей. Упорядоченная система трех чисел геометрически интерпретируется как геометрический объект, обладающий скалярной величиной и направлением и изображаемый тремя ортогональными проекциями. Мы сравнительно легко улавливаем связь между числовой характеристикой вектора (три числа), его геометрическим представлением и физическим смыслом; легко приходим к мысли о векторном характере скорости, ускорения, силы и т. д. Попробуем, обобщая понятие вектора, дать более наглядное представление о тензоре. Напряженность электростатического поля Е— вектор. Вектором является также электростатическая индукция D—произведение Е на диэлектрическую постоянную: D=e Е. В пустоте, где е = 1, электростатическая индукция равна напряженности электрического поля: D = £, а в телах, обладающих диэлектрической постоянной, не равной единице, в каждой точке индукция по сравнению с напряженностью поля представляет собой вектор того же направления, но иной скалярной величины. Индукция и напряженность не отличаются по направлению в аморфных телах. В кристаллах создается иное, более сложное положение. Здесь поляризация вещества кристалла не только изменяет величину электрических сил, но делает это в разной степени в зависимости от того, как, под каким углом к оси кристалла направлены электрические силы. Диэлектрическая постоянная в кристалле зависит от ориентировки напряженности поля относительно оси кристалла. Поэтому, когда речь идет о кристалле и нам нужно определить электростатическую индукцию, приходится дважды ориентировать физические величины, дважды параметризировать их: первый раз мы выясняем, как ориентирована в пространстве ось кристалла (и получаем 48
три скаляра — проекции), второй раз мы ориентируем напряженность поля относительно оси кристалла и получаем другой вектор — индукцию. Различие между индукцией и напряженностью определяется значением диэлектрической постоянной в данной точке кристалла. Таким образом, диэлектрическая постоянная должна быть задана системой коэффициентов, превращающих один вектор — напряженность поля в другой вектор — индукцию, причем значение этих коэффициентов зависит от ориентировки поля относительно оси кристалла. Каждую ориентировку оси кристалла в пространстве можно выразить тремя числами. Каждую ориентировку поля относительно фиксированного кристалла можно выразить также тремя числами. Очевидно, диэлектрическая постоянная в кристалле выражается девятью коэффициентами. Диэлектрическая постоянная в данной точке — это физическая величина, не зависящая от параметризации. Прежде всего, она независима от выбора координатной системы для ориентировки самого кристалла. Мы можем для этого выбрать любую координатную систему, переходить к бесчисленному числу других координатных систем и каждый раз будем получать другую тройку проекций. После того как в данной координатной системе ориентирована ось кристалла, мы можем опять выбирать бесчисленное количество координатных систем для ориентировки электрического поля и получим снова бесконечное множество троек чисел. Попробуем сразу, одним взглядом, охватить все значения диэлектрической постоянной, соответствующие всем взаимным положениям оси кристалла и вектора напряженности поля. Для этого нам достаточно девяти чисел (так же, как можно охватить все скалярные значения вектора, все его проекции на бесчисленные направления с помощью трех проекций на опорные направления). Каждой из бесконечного количества девяток чисел будет соответствовать определенное взаимное положение оси кристалла и электрического поля. Обозначим каждое значение е, соответствующее'взаимному положению оси кристалла и вектора £, через е.^, т. е. е с двумя индексами. Первый индекс / соответствует трем опорным направлениям, относительно которых параметризирована ось кристалла. Второй индекс k соответствует трем опорным направле- 49
ниям, параметризирующим направление £. Получаем таблицу: е11 е12 £13 Sfcl e22 е23 esi 6зз езз Эти девять чисел eik представляют собой тензор. В кристалле диэлектрическая постоянная оказывается тензором. Компоненты тензора е[к превращают компоненты вектора Е, т. е. Еи Еъ Еъ (сокращенная запись £,), в компоненты электростатической индукции Д т. е. Du D2i Dz (сокращенная запись D ). Число компонент тензора равно девяти, потому что каждая из трех компонент вектора £ имеет три проекции на оси кристалла (32 = 9). Приведенный пример —это пример тензора второго ранга. Тензор третьего ранга имеет З3 = 27 компонент. Тензор четвертого ранга — З4 = 81 компоненту. Соответственно вектор мы считаем тензором первого ранга, а скаляр — нулевого. Все это относится к трехмерному пространству, и нам пока не требуется обобщать понятие тензора на пространство большего числа измерений; это понадобится позже. Здесь же следует попытаться еще конкретнее и «физичнее» определить смысл тензорного исчисления. Все дело в параметризации физического объекта. Он не зависит от тех способов, с помощью которых мы его изучаем. Между объективными, происходящими в природе процессами существуют объективные соотношения, независимые от параметризации. Возьмем простейший случай, когда объективное соотношение выражается одной величиной. Пусть это будет длина световой волны X, в сантиметрах, причем мы определяем ее, зная скорость света и период Т электромагнитных колебаний: Х = 3.1010Т. Перейдя к другой параметризации, скажем, сопоставляя натуральный ряд чисел не сантиметрам, а метрам и не секундам, а часам, мы уже не можем писать в этом уравнении число 3- 1010. Различных параметризаций может быть бесконечное множество. Можем ли мы охватить 50
их единой формулой, как бы видеть сразу все возможные параметризации? Разумеется, можем; достаточно написать формулу для X, указав, как изменяется X при переходе к новым единицам длины и времени. Мы пишем: причем изменение коэффициента с при изменении единиц длины или времени будет определяться по его размерности (длина/время). Теперь представим себе, что у нас более сложный физический объект. Его величина выражается в трехмерном пространстве тремя числами. Такими объектами могут быть силы, ускорения, скорости, смещения. Представим себе самую простую параметризацию с помощью декартовых ортогональных координат. Нам удастся вместо одной векторной получить три скалярные величины. Пусть физическая величина (сила, ускорение, смещение и т. д.) имеет определенное направление в пространстве. Мы хотим определить проекции этой величины на все возможные направления. Мало того, мы хотим сразу представить все (их бесконечное множество!) проекции этого вектора. Чтобы сделать это, достаточно трех скаляров — проекций вектора на три ортогональные оси. Значит, три числа — компоненты вектора — дают нам возможность представить бесконечное множество скаляров — проекций вектора на все возможные направления. Представим себе проекцию ап вектора а, заданного тремя компонентами, ах, ау, az, на произвольно выбранное направление п, образующее с этими опорными осями углы (/*,*)> (#.*/)> (n,z). Таких проекций (скалярных величин) а п может быть бесконечно много. Каждая из них равна: Яд = a*-cos (я, x)+ay-cos(n, у) + аг• cos (я, г). Как преобразуется эта величина при переходе к другой системе координат ?, % С ? В каждой новой системе она будет определяться новым выражением: Дд = Ч• cos (л, £) + а,,• cos (л, т)) + av cos(n, С). Таким образом, скаляр ап связан написанным только Ы
что линейным соотношением с каждой системой прямоугольных координат. Подобных скаляров бесконечное множество. Можно считать вектор совокупностью этого бесконечного числа скаляров — значений вектора, его проекций на бесчисленные возможные направления. Возьмем конкретный пример вектора — смещение из пункта А в определенную сторону в двухмерном пространстве, параметризированном градусной сетью. Насколько точка продвинулась по линиям, образующим с меридианом углы в 45°, 10°, 15°16', 17°1Г32" и т. д.? Какова скалярная величина смещения на каждом из этих произвольно названных и на всех остальных бесконечно разнообразных направлениях? С помощью написанной выше формулы можно определить скалярное значение вектора смещения для каждого направления и, не определяя каждое направление, оперировать в вычислениях с их совокупностью. Теперь вспомним диэлектрическую постоянную в кристалле. Значение диэлектрической постоянной вдоль определенной прямой в кристалле является вектором. Тензор (второго ранга) — это и есть величина, значения которой на определенных направлениях суть векторы. Каждое такое значение tn связано со значениями на трех опорных направлениях х, у, z соотношением: tn = tx-cos (/i, x) + ty- cos (n, у) + tz• cos (я, z). Как бы мы ни меняли опорные направления, как бы мы ни преобразовывали (пока речь идет только об ортогональных преобразованиях) систему координат, написанное уравнение остается справедливым. Основной смысл и значение тензорного исчисления мы увидим при знакомстве с общей теорией относительности. Пока заметим следующее. Если в физике фигурирует уравнение, обе части которого — тензоры, то как бы ни менялись системы координат, как бы ни менялась параметризация, каким бы преобразованиям мы ни подвергали входящие в уравнение величины (пока мы ограничиваемся ортогональными преобразованиями), уравнение остается справедливым, или, как говорят, оно ковариантно относительно указанных преобразований. Законы природы, выраженные в тензор- 52
ных уравнениях, остаются неизменными при координат- ных преобразованиях. Пока речь идет об ортогональных преобразованиях; но впоследствии, при изложении общей теории относительности, все введенные понятия будут обобщены для более широкой группы преобразований. В 1905—1908 гг. тензорное исчисление еще не получило такого применения, и мы уже забежали вперед. Но такое нарушение исторической последовательности поможет вскрыть логическое единство принципа относительности классической механики, специальной и общей теории относительности. 4. Четырехмерный мир Классическая механика имеет дело с инвариантами преобразований Галилея. Основной образ классической механики — движущееся твердое тело — характеризуется неизменными расстояниями между точками. Расстояниям соответствует трехмерная квадратичная форма: э dr2 = dx* + dy2 ±dz2= 2 g^dx»dx\ где glx = £22 = #83 = 1 и g^ = 0, если р ф v. Преобразования Лоренца не сохраняют эту форму неизменной. В трехмерном пространстве группа Лоренца не будет ортогональной группой, если мы придерживаемся требований эвклидовой геометрии. Трехмерная эвклидова геометрия описывает пространственные свойства движущихся абсолютно жестких систем, физических тел, неизменных по размерам и взаимодействующих друг с другом мгновенно. Когда электродинамика нанесла ряд последовательных ударов физическому представлению о таких телах и взаимодействиях, мы в определенной области потеряли возможность физически интерпретировать эвклидову геометрию. В математических рассуждениях предыдущей главы все время можно было находить реальные физические прообразы вводимых понятий. И теперь такая возможность сохранилась, но физические прообразы эвклидовой геометрии оказываются частным случаем, приближением, допустимым лишь в определенных границах. В рамках математики, в рамках геометрии как 53
таковой спор о реальности эвклидовой и любой другой римановой (в широком смысле) геометрии, например, геометрии Лобачевского или геометрии Римана (в узком смысле), не имеет смысла: они одинаково непротиворечивы. Но в трехмерной физической геометрии этот вопрос является основным, и физика XX в. ответила на него в о б щ е м в пользу неэвклидовой геометрии. В теории относительности, т. е. в той области, где существенен конечный характер и постоянство скорости распространения взаимодействий, трехмерная геометрия Эвклида, основанная на инвариантности расстояния — квадратичной формы трех пространственных координат, не могла получить физической интерпретации. Неожиданно, благодаря открытию Минковского только что созданная физическая теория была представлена как интерпретация эвклидовой геометрии. Но речь шла о не совсем эвклидовой и совсем не трехмерной геометрии. Оговорку насчет «не совсем эвклидовой» пока не будем раскрывать — об этом речь впереди. Что касается второй оговорки, то речь идет о четырехмерной геометрии. Разумеется, физическая интерпретация четырехмерной геометрии не может оперировать чисто пространственными свойствами физических объектов; пространственные свойства не являются физическими прообразами четырехмерных геометрических образов. Это настолько тривиально, что не следовало и упоминать о непространственном характере четвертого измерения, если бы здесь не существовало довольно распространенных фантастических представлений. В теории Минковского в качестве четвертой координаты фигурирует некоторая функция времени, или, чтобы сказать яснее, само время, измеряемое некоторыми искусственно введенными единицами. Пространство измеряется тремя координатами, время можно рассматривать в качестве четвертой координаты. В этом смысле четырехмерность мира — истина старая, давно ставшая привычной, само собой разумеющейся. Аналитическая геометрия позволяет представить геометрические объекты в виде входящих в уравнения числовых величин, но она же, с другой стороны, позволяет геометрически представить любые числовые величины. Такой величиной является и время. Откладывая на одной оси 54
пройденный путь, а на другой — время, мы получаем графическое изображение движения в виде кривой, каждая точка которой характеризуется значениями времени и пройденного пути. При движении в трехмерном пространстве координата времени оказывается четвертой по счету, и механика может быть изложена как четырехмерная геометрия. Таким образом, аналитическая геометрия принимает обобщенный вид и позволяет применить свои теоремы к механическим задачам. Реальный смысл трактовки времени в качестве четвертой координаты заключается в том, что реальные события не могут протекать вне времени и всегда обладают четвертым измерением — длительностью по времени. В «Энциклопедии» в статье «Измерение», написанной д'Аламбером, говорится: «Я сказал выше, что невозможно представить себе более трех измерений. Между тем, один мой остроумный знакомый полагает, что длительность можно рассматривать как четвертое измерение и что произведение объема на время составило бы, некоторым образом, произведение, имеющее четыре измерения. Можно оспаривать эту идею, но я нахожу, что она имеет некоторые достоинства, хотя бы новизны» 1. Такие мысли высказывались неоднократно. Минков- ский придал представлению о времени, как о четвертом измерении, иной, более глубокий смысл. Минковский сравнивает между собой два способа изображения движения. Если точка движется по прямой,— ее движение можно изобразить • отрезком, который она проходит, но это еще не даст полной картины движения. Нужно отметить скорость и указать время, в течение которого точка достигает каждого пункта данного отрезка. Это можно сделать, обозначив на каждом таком пункте параметр — время, отсчитываемое от начала движения. Но можно также отметить время перпендикулярами, восставленными из каждого пункта отрезка, причем длина перпендикуляра равна времени, прошедшему от начала движения точки до момента, когда она достигала пункта, откуда восставлен перпендикуляр. Соединив вершины этих перпендикуляров, мы получаем геометрическое изображение всего процесса движения и в пространстве 1 «Encyclopedic ou Dictionaire raisone...», v. II, p. 1010. 55
и во времени — пространственно-временную кривую, изображающую прямолинейное движение точки. Если точка движется не по прямой, а в плоскости, то первый способ даст нам плоскую кривую с распределенными по ней параметрами времени, а второй способ — трехмерную кривую. Очевидно, если точка движется в пространстве трех измерений, то ее движение можно представить трехмерной пространственной кривой с параметром времени в каждом пункте, либо четырехмерной пространственно- временной кривой, которая, разумеется, не может быть представлена наглядной пространственной моделью. | О часов Л 1 о Л 2ч. Зч. х X О * i О И V- >- \^гч х 0 - Фиг. 4 Представим это соотношение графически (фиг. 4), в виде трех схем, состоящих каждая из двух рисунков: сверху изображена пространственная кривая, а снизу пространственно-временная. На первой схеме изображено только одно пространственное измерение х— точка движется по прямой. На второй — два измерения. Здесь точка движется в плоскости ху (по кругу). На третьей схеме точка движется в трехмерном пространстве. Время изображается осью t. Третья схема не имеет нижнего рисунка, так как четвертая координата пространственно не представима, нам негде поместить четвертую координатную ось. Верхние рисунки изображают проекции двухмерной пространственно-временной кривой на одномерное пробе
отранство, трехмерной кривой на двухмерное, четырехмерной на трехмерное. Когда мы проектируем четырехмерную кривую на трехмерное пространство (вообще при проектировании л-мерного объекта на (п—1)-мерное пространство), вид проекции и распределение параметров на ней зависят от выбора системы отсчета в (п—1)-мерном пространстве. Ведь и при проектировании трехмерной пространственной кривой на двухмерную поверхность или двухмерной кривой на прямую проекция зависит от избранной поверхности или прямой. Если же мы не пользуемся проекциями, вид кривой независим ни от каких внешних поверхностей или линий. Аналогичным образом четырехмерная пространственно-временная кривая дает инвариантное, независимое от систем отсчета представление движения, в то время как пространственная трехмерная проекция этой четырехмерной кривой зависит от пространственных систем отсчета. Идея Минковского — переход от трехмерного, пространственного (с параметром, показывающим время) представления движения к четырехмерному пространственно-временному—совпадает с идеей Эйнштейна, заключающейся в инвариантном представлении физических закономерностей. В той форме, какую придал теории относительности Минковский, время теряет свое изолированное от пространства представление, которое было одним из основных принципов дорелятивистской физики. Это новое представление о соотношении между пространством и временем кажется Минковскому настолько фундаментальным признаком новой теории, что «постулат относительности» представляется ему недостаточно ярким названием для комплекса новых идей. «Так как смысл постулата сводится к тому, что в явлениях нам дается только четырехмерный в пространстве и времени мир, но что проекции этого мира на пространство и на время могут быть взяты с некоторым произволом, мне хотелось бы этому утверждению скорее дать название: постулат абсолютного мира (или, коротко, «мировой постулат»)»1. Реальным, происходящим в пространстве и времени событиям соответствуют точки, характеризуемые опреде- 1 «Принцип относительности», стр. 192. 67
леннЬши значениями четырех координат. Пространственную точку, рассматриваемую в определенный момент времени, Минковский называет мировой точкой, а совокупность всех мыслимых мировых точек, т. е. всех мыслимых значений четырех координат он называет миром. События параметризируются мировыми точками, точками четырехмерного континуума. В качестве события Минковский рассматривает пребывание материальной точки в определенном месте в определенное время. «Чтобы не говорить о материи или электричестве,— пишет Минковский,— я буду пользоваться словом субстанция для обозначения этого объекта» х. Пусть некоторая субстанциальная точка находится в мировой точке, т. е. имеет определенные значения пространственных и временной координат. Предположим, что мы ее сможем узнать во всякое другое время. Дадим некоторое приращение значению времени. Этому будут соответствовать изменения пространственных координат. Тогда мы получим изображение жизненного пути субстанциальной точки — некоторую кривую в «мире», мировую линию. «Весь мир,— пишет Минковский, представляется разложенным на такие мировые линии, и мне хотелось бы сразу отметить, что, по моему мнению, физические законы могли бы найти свое наисовершеннейшее выражение как взаимоотношения между этими мировыми линиями». «Наисовершеннейшее выражение» физических законов означает в данном случае инвариантное выражение. При переходе от одной инерциальной системы к другой изменяется не скорость света, а течение времени. При этом переходе инвариантным оказывается не время, а «собственное время». Это значит, что формулы преобразования классической механики: *1 = /1 (*1> *2» *3» Of *2=/2(#1> *2> *8> О» *3 = /8 \%Ъ %2> *8> *п 1 «Принцип относительности», стр. 183. 58
неточны и их следует заменить формулами: *i = / (хх> хъ х3, <), х2 = /(*!, х2, xz, t), xs = / (xi> x2l x3, t), t' = /(*!. *Ъ *3> 0- Иными словами, время меняется при переходе к другим инерциальным системам подобно пространству. Минковский исходил из этого сходства и создал с помощью некоторых чисто математических приемов чрезвычайно мощный аппарат физической теории, без которого специальная теория относительности не могла бы так быстро стать ступенью к более широкой и общей теории. Нельзя понимать открытие Минковского таким образом, будто он вывел теорию относительности из каких-то общих геометрических соображений о пространстве и времени. Теория относительности вытекает из экспериментальных данных о неизменной скорости света в системах, движущихся относительно друг друга прямолинейно и равномерно. Другое дело, что существование и появление определенных геометрических понятий и обобщений позволило с большой быстротой сделать надлежащие выводы из экспериментальных данных, Минковский, а до него Пуанкаре исходили из основного метрического соотношения трехмерной эвклидовой геометрии для квадрата расстояния между двумя бесконечно близкими точками: dr2 = dx2 + dy2 + dz2. Они видели сходство между этой инвариантной формой и инвариантом преобразований Лоренца: ds2 = dx2 + dy2 + dz2 — c2dt2. Пуанкаре заменил переменную t, т. е. время, переменной т = ict\ иными словами, помножил t на скорость света с и на V—1 (Минковский пользовался вещественной формой т = ct и ставил множитель i перед т). Тогда инвариант преобразования Лоренца принимает вид: ds2 = dx2+ dy2 + dz2 + dz2, 59
или» если обозначить х, у, z и т соответственно через хь х2, хъ и х4: |X, V —1 где g^ = Ь e(yiH(i=v , и g^v = 0, если \l Ф v. Иными словами, в четырехмерном пространственно-временном мире метрика соответствует той метрике, которая характерна для эвклидова трехмерного пространства, и преобразования Лоренца соответствуют ортогональному преобразованию в трехмерном эвклидовом пространстве. Мы бы могли назвать пространственно-временной мир Минковского четырехмерным эвклидовым миром, если бы не то обстоятельство' что вещественная координата t заменена мнимой т. Учитывая это обстоятельство, пространственно- временное многообразие с метрикой, аналогичной трехмерной эвклидовой, назвали псевдоэвклидовым многообразием. В псевдоэвклидовом мире инвариантом группы Лоренца является квадратичная форма четырехмерных координат; поэтому теория инвариантов группы Лоренца (это — математический псевдоним специальной теории относительности) принимает форму четырехмерного тензорного и векторного исчисления. Преобразования Лоренца приобретают изящную геометрическую форму поворотов в четырехмерном пространстве-времени. В классической физике была известна изотропность трехмерного пространства — отсутствие избранных направлений в пространстве и инвариантность расстояний и вообще пространственных структур по отношению к трехмерным пространственным вращениям. Теперь изотропность приобретает менее наглядный, но более общий вид. Четырехмерный пространственно-временной мир оказывается изотропным. Физические законы не меняются, уравнения сохраняют свой вид, пространственно- временной интервал инвариантен при четырехмерных вращениях, включающих * пространственные вращения в плоскостях Х1Х2, Х\Х$, ХчХъ и преобразования Лоренца в более узком смысле — вращения координатной системы в плоскостях XJiu XiX2l Л4Х3, означающие переход от 60
одной инерциальной системы к другой, движущейся относительно первой, соответственно, вдоль осей Х\у Х2> Х3. Можно придать геометрический вид разделению интервалов ds на пространственноподобные и временноподоб- ные. Это разделение приобретает особенно отчетливый вид, если ограничиться одной плоскостью Х\Х4 (фиг. 5). Фиг. 5 Начало координат — это «здесь» и «сейчас». Вертикальная (параллельная оси Х4) прямая на этом чертеже изображала бы мировую линию пространственно неподвижной точки. Горизонтальная прямая — мировая линия точки, движущейся с бесконечной скоростью вдоль оси х, или проекция на плоскость Х4ХХ мировой линии точки, движущейся с бесконечной скоростью по произвольному пути. Теория относительности отвергает возможность такой скорости. Пределом скорости движущейся точки является скорость света. Движение светового сигнала изобразится прямой ds = 0. Это — мировая линия точки, движущейся со скоростью света, или, что то же самое, точки пересечения сферической световой волны, исходящей из начала координат, с осью Х\. Угол, образуемый прямой ds = 0 с осью Х4, соответствует скорости света. Он является наибольшим углом для прямой, изображающей равномерное и прямолинейное движение материальной точки, проходящей х = 0 в t = 0, или распространение взаимодействия из одного пункта в другой, иначе говоря — причинную связь между событием 61
Ь начале четырехмерных координат и другим событием. В секторе, ограниченном прямыми ds = 0 и прилегающем к оси XAi находятся все прямые ds > 0, т. е. все точки плоскости Х\ Х4 связанные с началом координат вре- менноподобными интервалами. Этому бесконечному сектору соответствует такой же сектор ниже оси Х\, так как мировые линии связывают событие в начале координат с событиями, происшедшими на оси Х\ по другую сторону от «здесь» и в прошлом, т. е. раньше, чем «сейчас». Если дополнить схему осями Х2 и Яз> т. е. иметь в виду все оси пространства-времени (что уже нельзя представить не только чертежом, но и трехмерной моделью), то совокупность всех прямых ds = О вырежет из четырехмерного мира наглядно непредставимый четырехмерный «конус» — световой конус, ограниченный также непредставимой трехмерной «поверхностью». Мысль о неразрывности пространства и времени лежит в основе релятивистской механики и электродинамики. Динамические переменные, характеризующие движение тел,— импульс, момент импульса, энергию — можно представить в виде компонент тензоров в четырехмерном многообразии. То же относится к переменным электромагнитного поля — потенциалу, напряженности электрического и магнитного полей и т. д. Все это можно представить в качестве тензоров, считая скаляры тензорами нулевого ранга, а векторы — первого. Соответственно, уравнения классической механики и электродинамики выявляют свою ковариантность в отношении преобразований Лоренца. Такое тензорное четырехмерное представление и лоренц-инвариантность уравнений требуют собственно физических допущений, которые в большом числе случаев могли быть экспериментально проверены и получили подтверждение. Механика специальной теории относительности объединяет три составляющие импульса и энергию в один четырехмерный вектор. В электродинамике аналогичным образом объединяются в один тензор компоненты напряженности электрического поля Е и магнитного поля Н. В электродинамике лоренц-инвариантность уравнений означает относительность самого различия между электрическими и магнитными полями: электрический заряд в одной системе рассматривается как неподвижный и, следовательно, образующий лишь электри- 62
ческое поЛе, а в другой — он представляется движуЩиМбй и образующим также и магнитное поле. Эти понятия имели существенное значение для последующей разработки общей теории относительности. Последняя связана со специальной теорией не только логически, но и исторически. В 1906—1916 гг. происходило не только быстрое усвоение новых физических идей, но и развитие математических методов и представлений. Сейчас трудно охватить научные результаты усвоения новых математических принципов, содержавшихся в работах Пуанкаре, Эйнштейна и Минковского. Математические обобщения, созданные под воздействием импульсов, полученных из физики, обладают «свободным пробегом», имманентными силами развития. Специальная теория относительности стала исходным пунктом широкого пересмотра методов и принципов геометрии, не меньшего, чем пересмотр, вызванный в свое время теорией Максвелла, а впоследствии — общей теорией относительности, квантовой механикой и квантовой электродинамикой. Уже в идеях Минковского содержалась не только мысль о физической интерпретации эвклидовой геометрии (четырехмерной!), но и не менее революционная мысль об ограниченности эвклидовой геометрии (трехмерной!) определенным кругом физических явлений и, может быть, самая плодотворная и для математики и для физики мысль о физической геометрии, о физическом критерии для выбора той или иной геометрии. В новом свете выступили не только геометрические идеи Лобачевского и Римана, но также их физические идеи — зависимости геометрических свойств пространства от материальных процессов. Даже историография математики должна была пересмотреть традиционные оценки. Развитие геометрических идей в результате появления специальной теории относительности имело первостепенное значение для творческого пути Эйнштейна и генезиса общей теории относительности. Математический аппарат последней был найден готовым в работах Римана, Кри- стоффеля, Риччи и Леви-Чивита. Общая теория относительности опиралась на развитие теории неэвклидовых геометрий, теории многомерных пространств, теории групп преобразований, развитие, вызванное в значительной мере специальной теорией отно- 63
сительности. Такое развитие толкало мысль исследователя к более общим понятиям об инвариантах и преобразованиях координат. Принцип относительности, принцип ковариантности уравнений должен был быть обобщен на более широкую группу преобразований. Но при этом требовались новые собственно физические идеи. 5. Принцип эквивалентности С появлением специальной теории относительности, естественно, возник вопрос об установлении уравнений, кова- риантных относительно групп преобразований, более общих, чем лоренцовы, иначе говоря,— вопрос об универсальном принципе относительности, справедливом для движений не только равномерных, но и ускоренных. Такую задачу и решил Эйнштейн после десяти лет напряженных поисков. В 1916 г. он пришел к общей теории относительности. Важным этапом создания общей теории относительности, являющейся вместе с тем теорией тяготения, был сформулированный Эйнштейном в 1911 г. принцип эквивалентности, согласно которому в бесконечно малых областях действие тяготения можно заменить ускорением. Тогда же Эйнштейн указал на искривление лучей света в поле тяготения. Задолго до строгой математической формулировки принципа эквивалентности в мыслях Эйнштейна витала картина движущегося ящика или лифта, в котором нельзя отличить ускорения от действия тяжести. По свидетельству Инфельда \ Эйнштейн думал об этом с 15— 16 лет. Позже Эйнштейн делился подобными мыслями с Марией Склодовской-Кюри. Ева Кюри в известной книге «Мадам Кюри» вспоминает о беседах своей матери с Эйнштейном во время совместных экскурсий в горы. «Мне нужно знать,— говорил Эйнштейн,— что происходит в падающем лифте»2. Представим себе лифт, движущийся вверх с ускорением, равным ускорению силы тяжести, в то время как гравитационное поле исчезло. Какие явления будут про- 1 Успехи физических наук, 57, 197 (1955). 2 Цит. по англ. пеп.: Madame Curie. A biography by Eve Curie. N. Y. 1946, p. 321. 64
исходить в лифте? Уронив какой-нибудь предмет, мы увидим, что он падает на пол. Все будет происходить так, как будто лифт висит, подвешенный на тросе, удерживающем его в поле тяготения. Как же доказать, что в данном случае причиной явлений, происходящих в лифте, служит не тяжесть, а ускорение движения лифта? В случае тяготения поведение предметов определялось бы их тяжелыми массами, в случае ускоренного движения эту роль играют инертные массы. Если ускорение и тяготение эквивалентны и вызывают одни и те же физические явления, то инертная масса должна быть равна тяжелой, и, таким образом, старая загадка ньютоновой механики получает, наконец, объяснение. По словам Эйнштейна, опытный факт одинакового ускорения всех падающих тел, который «ранее не находил еще места в основах нашей физической картины мира», становится очевидным с точки зрения принципа эквивалентности 1. Принцип эквивалентности позволяет в некоторой степени (ниже будет сказано, в какой именно степени) приравнять друг другу: 1) движение тела в гравитационном поле в неподвижной или инерциальной системе и 2) свободное движение тела, не испытывающего тяготения,— в неинерциальной системе, т. е. в системе, движущейся с ускорением. В неподвижной системе отсчета свободное движение всех тел — равномерное и прямолинейное. Таким же оно остается в инерциальной системе. В неинерциальной системе, т. е. в системе, движущейся с ускорением, все свободно движущиеся тела будут двигаться с одинаковым ускорением, их скорости будут в каждый момент равными, если они были равными в начальный момент. В случае равномерно ускоренной системы отсчета, все находящиеся в ней свободно движущиеся тела будут обладать относительно этой системы одним и тем же ускорением. Таким же ускорением относительно инерциальной системы будут обладать тела, находящиеся в однородном и постоянном гравитационном поле. Мы рассматриваем поле тяготения Земли в лифте в качестве примера такого однородного и постоянного поля. Движение системы с неравномерным ускорением 1 См. «Принцип относительности», стр. 218. 65
эквивалентно движению в переменном гравитационном поле. Эйнштейн говорит, что принцип эквивалентности очевиден для чисто механических явлений, а его более глубокий смысл состоит в равноценности тяготения и ускорения относительно всех физических явлений. В сущности, основные наблюдения, на которых покоится механический принцип эквивалентности, были сделаны Галилеем. Из одинаковой скорости падения тел следует равенство тяжелой и инертной массы и объясняющий ее принцип эквивалентности, но общая теория относительности отнюдь не сводится к этому механическому принципу. Здесь наблюдается примерно то же, что мы встретили в специальной теории относительности, где обобщение старого принципа относительности и его распространение на новый ряд явлений (электродинамику) потребовали коренного пересмотра основных понятий физики и механики. Представим себе одну систему, движущуюся равномерно, причем находящиеся в ней тела испытывают тяготение, и другую, движущуюся с ускорением, но не испытывающую действия тяготения. Описания явлений в них эквивалентны, так как физический эффект ускорения и тяготения один и тот же. Представим себе теперь, что световой луч входит в эту систему, пересекая ее перпендикулярно направлению движения. На первый взгляд, свет будет вести себя по-разному при двух ситуациях, казавшихся нам эквивалентными. Если система движется ускоренно, то свет выйдет из нее в точке, несколько смещенной. Если же система покоится и испытывает не ускорение, а тяготение, то луч, по-видимому, выйдет из системы в точке, которая лежит как раз против той, где он вошел. Но последнее будет иметь место лишь в том случае, если свет не испытывает влияния тяготения и не смещается в гравитационном поле. На самом же деле свет обладает инертной массой, которая эквивалентна тяжелой массе. Поэтому луч света сместится под влиянием тяготения так же, как он сместился бы благодаря ускорению. Этот вывод вызвал оживленную дискуссию. Абрагам 1 выступил в 1912 г. со статьей, 1 Phys. Zeitschr., 13, 1, 311 (1912). 66
в которой счел ограничение принципа постоянства скорости света отказом от теории относительности. Отвечая Абрагаму, Эйнштейн дал отчетливое изложение вопроса о границах специального принципа относительности *. Эйнштейн прежде всего указывает, что принцип относительности сам по себе еще недостаточен для теории преобразований пространства и времени. Специальная теория относительности основана как на принципе относительности, так и на постулате постоянства скорости света. Она сохраняется в тех пределах, в которых остаются справедливыми оба эти принципа. Первый из них, по мнению Эйнштейна, имеет универсальный характер. Напротив, постоянство скорости света ограничено областями с постоянным потенциалом тяготения. Поэтому ограничение специальной теории относительности областями с постоянным потенциалом тяготения не обозначает какого-нибудь ограничения принципа относительности. «Здесь, по моему мнению,— пишет Эйнштейн,— лежит граница применения не для принципа относительности, но для принципа постоянства скорости света и вместе с этим для нашей современной теории относительности» 2. Говоря о том, что тяготение не укладывается в схему специальной теории относительности, Эйнштейн продолжает: «Это положение вещей, по- моему, вовсе не означает ошибочности основанного на принципе относительности метода, точно так же как открытие и правильное понимание броуновского движения не приводит к заключению, что термодинамика и гидродинамика являются ошибочными. Современная теория относительности, по моему мнению, всегда сохранит свое значение как простейшая теория явлений в пространстве-времени для весьма важного предельного случая постоянного потенциала тяготения. Задачей ближайшего будущего является создание такой теоретической релятивистской схемы, в которой эквивалентность между инертной и тяжелой массами сможет найти свое выражение. В своей работе о статическом поле тяжести я пытался сделать первые весьма скромные шаги к достижению этой цели. При этом я исходил из представ- 1 См. «Принцип относительности», стр. 371—372. 2 Там же, стр. 373. 67
ления, что эквивалентность инертной и тяжелой масс может быть сведена к тождественности по существу этих двух элементарных качеств материи или энергии тел, что статическое поле тяготения рассматривается как физически тождественное с ускорением системы отсчета. Я должен сознаться, что мне удалось разработать это представление без противоречия только для бесконечно малых областей и что я не могу дать этому обстоятельству никакого удовлетворительного объяснения. Но я не вижу в этом оснований отказаться от принципа эквивалентности и для бесконечно малых областей; никто не сможет отрицать, что этот принцип представляет собой естественную экстраполяцию одного из наиболее общих экспериментальных законов физики. С другой стороны, принцип эквивалентности открывает перед нами возможность интереснейшего требования, что уравнения некоторой новой, охватывающей также гравитацию теории относительности должны оказаться инвариантными и по отношению к преобразованиям с ускорением (и вращением). Конечно, путь к этой цели представляется весьма трудным». В 1913—1914 гг. Эйнштейн овладевает необходимым для создания общей теории относительности новым математическим аппаратом — тензорным анализом и публикует вместе с Марселем Гроссманом две работы. В этих работах общая теория относительности уже начинает приобретать современный вид. Удачно выбранный математический аппарат позволяет все конкретнее и глубже проводить идею ковариантности физических уравнений в отношении все более общих преобразований. Эйнштейну и Гроссману сперва не удалось вывести общековариантные дифференциальные уравнения для компонент g^. В 1914 г. Эйнштейн даже решил, что уравнения, схпределяющие компоненты тензора, не должны быть общековариантными. Затем Эйнштейн вернулся к требованию общей ковариантности уравнения поля. В 1915—1916 гг. Эйнштейн публикует ряд важных работ, разъясняющих отдельные проблемы и основы общей теории относительности. Наконец, в 1916 г. выходят в свет «Основы общей теории относительности» 1. 1 Ann. Phys., 49, 760 (1916); см. «Принцип относительности», стр. 231-305. 68
В 1911 г. в уже упоминавшейся статье Эйнштейн говорил, что принцип эквивалентности справедлив только для однородного гравитационного поля. «Конечно, нельзя любое поле тяготения заменить состоянием движения системы, без гравитационного поля, точно так же как нельзя преобразовать все точки произвольно движущейся среды к покою посредством релятивистского преобразования» К Позднее, в 1916 г., отвечая на критическую статью Кот- тлера, Эйнштейн2 возвращается к вопросу об ограниченности принципа эквивалентности. «Если нам дана система /С, в которой имеется гравитационное поле, то мы можем говорить о другой системе К\ которая движется с ускорением относительно К, в которой отдельные движущиеся массы не испытывают тяготения... Но нельзя идти дальше и утверждать: если К представляет собою систему отсчета с любым гравитационным полем, то всегда найдется такая система отсчета, по отношению к которой отдельные м^ссы движутся прямолинейно и равномерно, т. е. по отношению к которой поля тяготения не существует. Абсурдность последнего предположения непосредственно очевидна. Если, например, гравитационное поле по отношению к К является полем покоящейся материальной точки, то никаким преобразованием, как бы оно ни было хитро придумано, нельзя уничтожить это поле для всей окрестности материальной точки» 3. Таким образом, нельзя в больших областях, где гравитационные поля неоднородны, свести их к ускорениям систем отчета. Подойдем теперь к принципу эквивалентности с другой стороны. Возьмем классический пример — вращающееся ведро, фигурирующее в ньютоновых «Началах натуральной философии». Ньютон считал центробежную силу, поднимающую уровень воды у стенок вращающегося ведра, доказательством абсолютного вращения. Принцип эквивалентности позволяет рассматривать вращающееся ведро как систему, не испытывающую вращения, объяснить центробежную силу тяготением, действующим в этой инерциальной системе и поднимающим к 1 «Принцип относительности», стр. 219. 2 Ann. Phys., 50, 955 (1916); см. «Принцип относительности», стр. 381. * «Принцип относительности», стр. 383. 69
краям воду в ведре, тяготением, эквивалентным неинер- циальной вращающейся системе. Но такие гравитационные поля, эквивалентные неинерциальным системам, отличаются от «истинных» гравитационных полей в инер- циальных системах в следующем весьма существенном отношении. Представим себе «истинное» гравитационное поле, созданное материальным телом и бесконечно распространяющееся во все стороны. Оно уменьшается по мере удаления от центра и стремится к нулю на бесконечном расстоянии. Теперь представим себе ньютоново вращающееся ведро. Центробежные силы, поднимающие воду к краям ведра, растут по мере удаления от центра и соответственно растет эквивалентное вращению системы поле тяготения. На бесконечном расстоянии оно стремится к бесконечному значению. Подобное же различие между «истинными» гравитационными полями и гравитационными полями, эквивалентными неинерциальным системам, можно обнаружить в случае прямолинейного равноускоренного движения системы. Эквивалентное такому ускорению гравитационное поле не растет, оно остается одинаковым при удалении на бесконечное расстояние. Невозможность распространения принципа эквивалентности на области с неоднородными гравитационными полями — одна из основных посылок Эйнштейна. Эйнштейн в течение нескольких лет разрабатывал теорию однородного гравитационного поля, где принцип эквивалентности полностью осуществляется и где тяготение может быть полностью заменено ускорением. Но переход к общей теории относительности как теории произвольных гравитационных полей основан на ограничении принципа эквивалентности малыми, вообще говоря, бесконечно малыми масштабами. Из такого ограничения вытекали дальнейшие идеи Эйнштейна, приведшие к обобщению принципа относительности, т. е. к построению теории инвариантов групп преобразований более общих, чем группа Лоренца. Относительность преобразований означает существование некоторых инвариантов. Может ли четырехмерное расстояние сохранить такую роль для группы преобразований более общей, чем лоренцова? 7р
В метрической квадратичной форме специальной теории относительности ds2 = Yig^dxHx* коэффициенты g^ были равны единице или нулю. Теперь в общей теории относительности рассматриваются не только инерционные движения, следовательно, не только ортогональные преобразования; коэффициенты g v теперь уже не всегда равны нулю либо единице. Требование общей теории относительности состоит в том, чтобы и для более общей группы преобразований (соответствующих не только инерционным, но и ускоренным движениям) сохранилась бы инвариантность пространственно- временного интервала, чтобы величина ds или ds2 не зависела от выбора координатной системы, не менялась бы при переходе от одной системы к любой другой, произвольно движущейся относительно первой. Задача приобретает форму вопроса: как, по каким законам, должны изменяться компоненты метрического тензора g , чтобы ds2 был инвариантом общих групп преобразований? Если бы ускорения были эквивалентны тяготению, задача была бы легкой, можно было бы выбрать такую систему /С0, в которой нет ускорений и где, следовательно, специальная теория относительности может гарантировать инвариантность ds. .Но принцип эквивалентности, допускающий подобный переход к инерциальной системе, сам по себе имеет, как уже сказано, лишь локальное значение; в конечных областях Вселенной тяготение вообще говоря не эквивалентно ускорению. Идеальный мир «выпрямленного», однородного гравитационного поля и реальный мир со сходящимися линиями гравитационных полей совпадают друг с другом только в бесконечно малых областях, как прямая и кривая линия, или как плоскость и кривая поверхность, или — переходя уже к менее наглядным образам — как «плоское» пространство трех, четырех, вообще п измерений и пространство того же числа измерений, но искривленное. Такая аналогия (она недолго оставалась простой аналогией) указывала путь к общековариантному выражению Законов природы. Нужно было дополнить локальный 71
принцип эквивалентности представлением о кривизне пространственно-временного континуума. в. Тензор кривизны Кривизна пространственно-временного континуума выражается в изменении фундаментального метрического тензора. Поэтому Эйнштейну понадобились математические приемы, позволяющие зарегистрировать и выразить непрерывные изменения тензора g^ при переходе от одной мировой точки к другой. Для этого недостаточно тензорной алгебры, и Эйнштейн в «Основах общей теории относительности» ввел некоторые основные понятия тензорного анализа. С их помощью Эйнштейн в законченной и строгой форме изложил математические приемы вывода обще- ковариантных уравнений — теоремы тензорной алгебры и тензорного анализа, необходимые для систематического построения общей теории относительности. Как говорилось в третьем параграфе, тензорное исчисление уже существовало. Название «тензор» еще не появлялось, но введенное Риччи * и впоследствии Леви-Чивита «абсолютное дифференциальное исчисление» и было теорией объектов, определенных в каждой координатной системе трехмерного пространства не тремя функциями, как векторы, а большим числом пространственных функций. Существовали уже представления о подобных объектах для многомерного пространства. Такие объекты нам знакомы; это и есть тензоры, а пространственные функции, определяющие тензор в каждой координатной системе,— это компоненты тензора. Сама идея объектов, определяемых трансформационными свойствами, была крупнейшей победой математической мысли. Когда Риччи и Леви-Чивита создали свое «абсолютное дифференциальное исчисление», математики чувствовали, что обобщенные понятия, выросшие из векторного анализа позволяют представить в математической форме физические закономерности, более глубокие и общие, чем закономерности, представимые в векторных понятиях. И действительно, в 1914—1916 гг. Эйнштейн сделал тензорное исчисление и тензорный анализ мощным аппаратом физического исследования. Мысль Эйнштейна 1 G. Ricci. Atti della R. Ace. dei Ljncei, Rendiconti, (4), т. 3. ч. 1, 15 (1887). * ' W •■
о тензорной форме общековариантных законов опирается на фундаментальное свойство тензора: уравнения преобразования его компонент линейны и однородны, поэтому, если в одной координатной системе компоненты тензора равны нулю, то они остаются равными нулю и в каждой другой системе. «В соответствии с этим,— писал Эйнштейн в 1916 г.,— если какой-нибудь закон природы формулируется посредством приравнивания нулю всех компонент некоторого тензора, то он общековариантен; исследуя законы образования тензоров, мы тем самым получаем средства для установления общековариантных законов» 1. Чтобы применять это средство, Эйнштейн развивает применительно к четырехмерному миру введенное в 1889 г. Риччи деление компонент векторов и тензоров на контра- вариантные и ковариантные. Чтобы ввести понятия контравариантных и ковариант- ных тензоров и векторов следует сначала рассмотреть четыре дифференциала координат dxu dx2, dxz, dx± Если перейти от системы X\X2XZX4 к системе Х^Х^Х^Х^ то новые дифференциалы выразятся через старые четырьмя уравнениями: , Ьх\ , дх. дх[ дх[ dXl = -^dXl + ^dx, + -^dx3 + -^-dx» , дх' дх' дх' дх' dx2 = -^dXl + -^dx2 + -^ dx3 + -^dxt, дх' 4 дх' . дх' ш дх' ш , дх' дх' дх' дх. dx^-^-dx, + -^dx2 + -^dx3 + ^dxt, записываемыми общей формулой: dxa = 2j -q2-dxv. v=l Закон преобразования dxv^dxa дифференциалов координат выражается в умножении старых дифференциалов dxvHa коэффициенты г-? . Подобным же образом преоб- «Принцип относительности», стр. 245—246. 73
разуются и некоторые другие векторы: скорость, ускорение. Такие векторы (контравариантные) Риччи отличал тем, что значки обозначающие номера координат, ставил сверху. Поэтому правильная запись преобразования четырехмерного контравариантного вектора будет: Вспомним теперь о выражениях, не меняющихся при переходе от системы X[X2XzXA к Х\Х2Х^ХА\ о скалярах или инвариантах, к которым, в частности, относятся скалярные произведения векторов. Чтобы сумма произведений компонент двух векторов была инвариантной величиной, нужно, чтобы при преобразовании одна компонента преобразовалась по одному закону, а вторая — по обратному, одна умножалась на коэффициент _?, а вторая на —г . Вектор, компоненты которого преобразуются по обратному закону А'-У^А A°-Z> дх' ^v, v^l а называется ковариантным вектором. Он обозначается буквой с индексом внизу. В случае прямоугольных координат, преобразующихся в прямоугольные, т. е. в случае ортогональных преобразований, нет различия между конт- равариантными и ковариантными векторами. Если же речь идет о более широкой группе преобразований, когда Х\Х2ХзХА и Xi'X2'X3'X4' могут быть и различными косоугольными координатными системами, то здесь различие между контравариантными и ковариантными векторами существует. Далее в статье «Основы общей теории относительности» имеется одно замечание, на первый взгляд техническое, но тем не менее весьма существенное. Оно вводит сокращенное обозначение суммы. Эйнштейн предложил отбросить знак суммы £ и производить суммирование по тем значкам, которые встречаются дважды. Это нужно пояснить примером. Как нам известно, квадрат интервала между двумя соседними событиями ерть квадратичная 74
функция дифференциалов пространственных координат dx\, dx2l dx$ и временной координаты dxA: ds2 = gndx\ + gl2dx1dx2 + gisdx^ + g^dx^x^ + + g2idx2dxl + g22dx\ + g2Zdx2dxs + g2^dx2dx^ + + gzidx3dxx + gZ2dxsdx2 + gzzdx\ + gzidxzdxA + + gadXidxx + g^2dxidx2 + giZdxxdxz + gudxl В сокращенной записи эта формула имеет вид: 4 Отбрасывая знак £ , мы можем получить ту же большую формулу, руководствуясь следующим правилом: нужно выписать произведения g^dx^dx*, ставя вместо индекса [л цифры 1, 2, 3 и 4 и независимо от этого ставя такие же четыре цифры вместо индекса v, так как оба эти индекса повторяются по два раза. Разумеется, мы можем заменить [L и v любыми другими буквами, лишь бы каждая •повторялась дважды; большая, развернутая формула суммирования (с цифровыми индексами) от этого не изменится. Приведем еще один пример — формулу преобразования компонент контравариантного вектора. Возьмем четыре уравнения преобразования 4 д ' dxa= 2 ^-^dxv* которые в развернутом виде были приведены выше (стр. 73). В каждой строке (т. е. в каждом уравнении) меняется значение индекса v, повторяющегося в формуле дважды. Мы подставляем взамен v цифры 1, 2, 3 и 4 и складываем четыре члена. Другой индекс — а не меняется в пределах правой части каждого уравнения, в первом уравнении это 1 (во всех членах), во втором уравнении это 2, в третьем — 3, в четвертом — 4. По этому индексу суммирование не производится (он входит в произведение один раз). Индекс v, по которому происходит суммирование в каждом уравнении, называется немым индексом. 75
Эйнштейновская сокращенная запись суммы позволяет очень простым способом указать, какие компоненты или произведения компонент нужно просуммировать. Особенно ярко преимущества такой сокращенной записи видны, когда мы переходим от векторов к контравариантным и ко- вариантным тензорам второго и высших рангов. Эйнштейн вводит понятие контравариантного тензора, перемножая компоненты А*и В" двух контравариантных четырехмерных векторов: Л^ = А* В". Число компонент такого произведения, очевидно, 42=16. Преобразуем их от Х\Х2ХгХА к ХхХъ'ХъХ*. Каждое из шестнадцати произведений преобразуется по следующему закону: Системе, состоящей из шестнадцати величин, преобразующихся по такому закону, Эйнштейн присваивает название контравариантного тензора второго ранга. Далее вводится понятие четырехмерного контравариантного тензора третьего и высших рангов с 43 = 64 и вообще с 4я компонентами. Соответственно четырехмерный вектор рассматривается как тензор первого ранга с 41=4 компонентами, а скаляр — как тензор нулевого ранга с 4°=1 компонентой. Ковариантный тензор второго ранга вводится с помощью шестнадцати произведений А^ компонент двух ковариантных четырехмерных векторов Л^ и Д,: Для А^ закон преобразования от Х\Х2ХгХА к Х\Х2ХъХ* будет таким: У - *** дх" А дха дхх Смешанный тензор соответственно вводится в виде совокупности произведений A lt5v компонент двух векторов: ковариантного А^. и контравариантного Bv. Полученный таким образом смешанный тензор с шестнадцатью компонентами А1 = АрВ\ 75
контравариантен в отношении индекса v и ковариайтей fi отношении индекса |х. Он преобразуется по закону: ,т д^ дха з После этого Эйнштейн определяет симметричный и антисимметричный тензоры. Представим компоненты тензора с помощью таблицы: Лп Л12 Л18 Л14 А21 А22 A2Z A24 Л 31 Л 32 Л зз А 34 Л41 Л42 Л43 Л44- Если Л12=Л21, Л1з=Лз1, ..., вообще A^=AV[L, иначе говоря компоненты тензора, расположенные в таблице вверх и вправо от диагональной линии Л^ равны соответствующим компонентам, расположенным влево и вниз, то тензор называется симметричным. Если же А{2=— Лгь Л13 = =—Л31, Л14=—Л41, Л2з=—Л32, вообще Л^ =— А^9 то тензор называется антисимметричным. В антисимметричном тензоре четыре диагональные компоненты А^ равны нулю (если Л^ =—Лщь то эта величина может быть только нулем). Значит, остается только двенадцать компонент, из которых шесть попарно равны другим шести с обратными знаками. Четырехмерный антисимметричный тензор второго ранга имеет только шесть численно различных компонент. Эйнштейн излагает основы тензорной алгебры. Если каждую из шестнадцати (42) компонент четырехмерного тензора А*$ (т. е. тензора второго ранга) в отдельности перемножить с каждой компонентой другого тензора 5Y, то получится тензор четвертого ранга с 44=256 компонентами: Т*^8 = A*W*. Такое умножение называется внешним. Эйнштейновское правило сокращенной записи суммирования отчетливо показывает свои преимущества в случае композиции и сокращения смешанного тензора. Возьмем два четырехмерных вектора: ковариантный Л^ и контравариантный Bv. Перемножив компоненты этих векторов, получим шестнадцать компонент AxBlt A\B2 77
и т. д. смешанного четырехмерного тензора второго ранга: г;= а^в\ Представим их таблицей АХВ1 А,В2 А^3 А54 А2В* А2В2 А2В* А2В* А^В1 А3В* А3В* АВВ* AiB1 A<B* AJB3 Л4В4. В произведениях А^В* индекс повторяется два раза. Поэтому диагональные члены согласно условию о суммировании мы должны сложить. Сумма А»В* « 2 А^В* = АХВ1 + А2В2 + ASB* + А^В* — инвариант. Мы видим здесь главную идею тензорного исчисления, проходящую через все пункты тензорной алгебры и тензорного анализа. Тензорное исчисление позволяет математически представить независимые от выбора координат, от параметризации, не изменяющиеся при переходе от одной параметризации к другой величины и закономерности. В данном случае приравнивание двух индексов означает (если здесь допустимы столь неточные выражения и в столь переносном смысле), что мы отбираем какой-то участок из области внешней геометрии варьирующихся при преобразованиях величин, относительных, требующих тела отсчета измерений, и передаем этот участок в область внутренней, структурной, абсолютной, инвариантной геометрии (четырехмерной!). Превращение двух векторов с компонентами Лц и 5V в инвариант 7> состоит из двух операций: внешнего умножения и сокращения (композиции): Важнейшим элементом математического аппарата теории относительности явилось положение тензорной алгебры, согласно которому А^ — тензор, если А цу В^ (В** — 78
любой тензор) — инвариант. Доказательство опирается на теорему о композиции. Композиция, т. е. приравнивание верхних и нижних значков, означает (согласно правилу Эйнштейна о сокращенной записи суммы) необходимость просуммировать компоненты и получить тензор меньшего ранга. В случае тензора второго ранга получается тензор нулевого ранга—инвариант. Умножая А^ на Вот и затем производя композицию по индексам у. и а, а также по индексам v и т, мы получаем инвариант. Таким образом доказывается теорема: если А^В^ при любом тензоре B*v —инвариант, то А^—тензор. Эйнштейн показывает это на примере, для которого собственно и были введены перечисленные положения тензорной алгебры, на примере метрического тензора g^v- Однако тензорная алгебра недостаточна для решения вопроса о законах изменений тензора g^, изменений, при которых интервал между событиями инвариантен в отношении общих (более общих, чем лоренцовы) преобразований. Понадобился тензорный анализ — получение новых тензоров путем дифференцирования старых. Чтобы представить изменение векторов и тензоров более высокого ранга пои переходе в соседние точки пространства-времени нужно исходить из понятия параллельного переноса вектора. На первый взгляд это понятие очень просто: вектор переносится параллельно самому себе, если при этом не меняется его направление. Но понятие направления требует пояснений. В 1917 г. Леви-Чивита высказал крайне важные соображения о параллельном переносе вектора К Он рассматривал кривизну многомерного пространства по аналогии с двухмерной искривленной поверхностью в трехмерном пространстве и выяснил, каким образом в таком пространстве следует понимать параллельность векторов. В 1918 г. Вейль2 непосредственно ввел понятие параллельного переноса вектора, и впоследствии Эйнштейн, излагая общую теорию относительности, пользовался этим понятием. В эвклидовом пространстве параллельность векторов установить нетрудно, если ввести прямолинейную систему координат. В такой системе можно перенести вектор с од- 1 Rend. Pal., 42, 173 (1917). 2 «Raum — Zeit — Materie», Berlin, 1918, стр. 97—101. 79
йогб места на Другое, и вектор будет расположен на новом месте параллельно своему направлению на старом месте, т. е. перенос окажется параллельным, если не изменятся компоненты вектора. В криволинейных координатах перенос вектора изменит его компоненты, поэтому вопрос может быть решен введением именно прямолинейных координат. Если мы переносим вектор на плоскости, это всегда достижимо; если же вектор движется по кривой поверхности, например по поверхности сферы, прямолинейная двухмерная система координат уже не может быть введена и мы перейдем в этом случае к трехмерной задаче, будем рассматривать движение вектора в трехмерной прямолинейной координатной системе. Если же мы хотим остаться в двухмерном пространстве, то невозможность ввести прямолинейные координаты покажет, что эвклидовы теоремы перестали здесь служить. Подобным же образом в трехмерном пространстве, если в нем действуют неэвклидовы геометрические законы, нельзя ввести прямолинейную систему координат и определить параллельный перенос вектора через неизменность его компонент. Поэтому требуется более общее определение параллельного переноса, пригодное для неэвклидовой геометрии. Ограничимся пока двухмерным пространством и представим себе, что на некоторой поверхности через точку Р с координатами хи х2 проведены различные кривыех. Каждая из них отличается от других направлением в точке Р. На одной из кривых выбрана точка Р' с координатами X\+dxh x2+dx2, бесконечно близкая к Р. Направление кривой между Р и Р' определяется изменениями, испытываемыми координатами точки при переходе из Р в Р\ Приращение одной координаты равно dxu приращение другой равно dx2. Направление кривой в точке Р определяется отношением dx2 к dxx\ dxt Таким образом, если заданы координаты соседних точек Р и Р\ тем самым определено направление соединяющей их кривой. Дифференциалы dxx и dx2 будем рассмат- 1 См. изложение вопроса о параллельном переносе вектора и кривизне пространства в одном из лучших в мировой литературе очерков теории относительности — книге А. А. Фридмана «Мир, как пространство и время», Пг., 1923, стр. 36—56. 80
ривать как компоненты бесконечно малого вектора в точке Р. В декартовых координатах эти дифференциалы являются проекциями вектора dx на оси Х\ и X2l а сам этот вектор изображается отрезком прямой, соединяющей Р и Р'. Мы можем заменить направление кривой в точке Р направлением указанного бесконечно малого вектора. Соответственно можно говорить об угле, образуемом направлениями двух кривых РР'и РР"у как об угле между двумя бесконечно малыми векторами в точке Р. Этот угол мы вычислим, зная компоненты двух бесконечно малых векторов и значение фундаментального метрического тензора в точке Р. На плоскости, в декартовых координатах, иными словами,— в случае, когда квадрат расстояния между любыми бесконечно близкими точками равен dr2 = dx\ + dx\ и где, следовательно, gn=g22=l и gi2=g2\ = 0, угол *> между бесконечно малыми отрезками РР' и РР", изображающими векторы dx и олг, вычисляется по формуле: cos со = ' |л/. =. Vdx\ + dx\ • У*х* + Ьх\ Теперь вычислим угол со между теми же векторами, не ограничивая себя требованием, чтобы геометрические соотношения подчинялись эвклидовой геометрии. Тогда мы не можем пользоваться декартовыми координатами, не можем пользоваться указанными выше значениями фундаментального метрического тензора, в данном случае — двухмерного тензора g^. Угол о> в этом случае вычисляется по формуле: cosco== gii^S*! 4- gi2 (dxrfxt + dXjbxj) 4- pndx2lx2 ^ V giidx\-\-2glidxldx2^ g22dx\y gllbx\ +2£iI*x1ta, + g22bx\ В эту формулу входят значения фундаментального метрического тензора g^v, зависящие от положения в пространстве и в общем случае меняющиеся от точки к точке. Если пространство неэвклидово, то угол,'имеющий определенное значение в точке Р, имеет в другой точке уже другое значение. Изменение угла характеризует изменение метрического тензора и, следовательно, вид пространства. Как известно, к понятию о различных видах пространства пришли на путях обобщения понятия параллельных. 81
Для неэвклидовых, искривленных пространств параллельность двух бесконечно малых векторов означает только одно: зная направление одного вектора, мы можем найти направление другого по определенному закону. Иными словами, направлению бесконечно малого вектора в одной точке взаимно однозначно соответствует его направление в другой точке. Закон, по которому меняется вектор при параллельном переносе из одной точки в другую, характеризует вид пространства. Но для всех видов пространств существует общее определение параллельности: векторы параллельны, если их связывает определенный закон изменения. Ограничим рассматриваемые виды пространства требованием, чтобы при параллельном переносе двух векторов угол между ними не менялся. Станем передвигать точку с выходящими из нее двумя бесконечно малыми векторами по кривой. Если угол со между этими бесконечно малыми векторами не меняется, будем считать, что они передвигаются параллельно. Из написанного выше общего выражения для со видно, что для этого необходима неизменность компонент фундаментального метрического тензора. В неэвклидовых пространствах они, вообще говоря, меняются от точки к точке. Если компоненты фундаментального метрического тензора g^ и не равны нулю или единице, как в эвклидовом пространстве, но сохраняют одни и те же значения во всех точках, то такое неэвклидово пространство называется римановым пространством, или пространством постоянной кривизны. Для двухмерного риманова пространства легко найти наглядный образ — это поверхность обычной сферы. На такой поверхности параллельный перенос вектора не означает того неизменного направления, с которым мы встречаемся при параллельном переносе на плоскости, но угол между двумя совместно переносимыми векторами сохраняется неизменным. Представим такой параллельный перенос в римановом пространстве следующей схемой (фиг. 6). Эвклидово пространство — частный случай риманова пространства, случай, когда постоянная кривизна равна нулю. В этом случае каждый из двух параллельно переносимых векторов передвигается так, что его компоненты не изменяются по величине (фиг. 7). Угол между векторами, разумеется, также не меняет- 82
ся, и это не удивительно, так как эвклидово пространство — частный случай риманова пространства. Из понятия параллельного переноса вектора можно получить общее, пригодное не только для эвклидова, но и для риманова пространства понятие геодезической линии. Это обобщение понятия прямой линии. В эвклидовом пространстве прямая — это кратчайшая линия Фиг. 6 Фиг. 7 между двумя точками, обладающая тем свойством, что ее направление ни в одной точке не меняется. Можно ли считать эту неизменность направления определением прямой? Именно таково определение прямой в эвклидовой геометрии. Но в неэвклидовой геометрии неизменное направление (т. е. параллельный перенос вектора направления) вовсе не означает неизменных компонент. Прямая — это линия, вектор направления которой параллельно переносится, и для неэвклидовой геометрии можно сохранить это определение, не прибавляя к нему эвклидового требования неизменности компонент бесконечно малого вектора. Итак «прямой» в неэвклидовом пространстве соответствует кривая, обладающая свойством, выделяющим ее из числа других кривых: направление бесконечно малого вектора, совпадающее с направлением кривой в одной точке, совпадает с ее направлением и в другой точке при параллельном переносе. Каким образом меняется параллельно переносимый вектор, каким образом меняются компоненты бесконечно малого отрезка «прямой» от точки к точке,— это зависит от вида пространства. В римановом пространстве, т. е. в пространстве постоянной кривизны, «прямые» являются кратчайшими расстояниями между точками. Если вернуться к наглядному образу двухмерного риманова пространства, к сферической поверхности, то такими «прямыми» будут геодезические линии — дуги больших кругов; например, на поверхности Земли «прямыми» будут дуги меридианов, соединяющие кратчайшим путем точки разной широты. 83
Теперь оставим на время знакомые образы сферической геометрии — римановой двухмерной геометрии — и перейдем к проблеме параллельного переноса вектора в л-мерном неэвклидовом (именно, римановом) пространстве. Тем самым мы еще дальше отходим or «картины мира» в обычном смысле. Напомним только, что даже в истории живописи в описаниях картин сообщают не только о сюжете, содержании, композиции, колорите и т. д., но и о средствах, которыми пользовались художники. В таких описаниях встречаются выражения типа «масло, холст». Мы постараемся дать некоторое представление о математическом аппарате, позволившем Эйнштейну в 1916 г. прийти к новой теории тяготения. Таким аппаратом и была дифференциальная геометрия искривленных пространств, рисующая в общем виде их свойства. Вернемся к точкам Р и Р\ но теперь будем рассматривать их в n-мерном пространстве. Соответственно обозначим их координаты индексом а, пробегающим значения 1, 2, , п. Поскольку теперь приходится иметь дело не только с декартовыми координатами и принимать во внимание различие между контравариантными и коварпант- ными компонентами, будем ставить индексы у дифференциалов координат сверху — это контравариангиые векторы. Итак, координаты точки Р обозначим через х\ х2...хп} или через х° , а координаты другой — через ха + dx°. В точке Р с координатами ха находится вектор с компонентами А\ Л2,... и т. д., обозначаемыми А0 (это же обозначение сохраним для самого вектора). В точке Р' с координатами xa+dxa находится вектор, который мы соответственно обозначим Aa+dAa. Подчеркиваем, что это не тот же вектор Ап, перенесенный в другую точку, а иной вектор, изображающий иное значение физической величины. Как определить разность между указанными бесконечно близкими векторами? Для этого нужно один из них, скажем А а, перенести в точку, где находится другой вектор, и там сравнить с ним. Перенести его нужно без изменения направления, параллельно самому себе, так чтобы компоненты вектора не менялись. В декартовых координатах это достижимо. В криволинейных координатных системах это невозможно: при параллельном переносе вектора, как он был определен выше, его компоненты меняются. Мы знаем те- 84
перь, как обобщить понятие параллельного переноса таким образом, чтобы оно оказалось применимым к криволинейным координатам. Определим его несколько косвенным образом: «такой перенос, при котором в декартовых координатах компоненты не меняются (а в криволинейных меняются)». В случае криволинейных координат при переносе вектора Л° в точку ха f dxc он изменится вследствие кривизны пространства и приобретет значение Аа -j- 8 Л°. Это значение и нужно сравнить с значением второго вектора А* + dAa. Разность DA° между двумя векторами, оказавшимися теперь в одной точке, равна DA°=dA<' — 8Л°. Посмотрим внимательнее на изменение компонент вектора при его параллельном переносе в криволинейных координатах, зависящее от криволинейности координат, т. е. на величину 8Л°. Она зависит от величины самих компонент, причем зависит линейным образом. Иначе говоря, чтобы получить 8.4°, т. е. изменение каждой компоненты Л1, Л2,..., Лп, вообще Л° (индекс ,а означает данную компоненту и не пробегает разных значений), нужно взять каждую из компонент А* переносимого вектора (индекс ji пробегает значения 1, 2,..., л), помножить ее на расстояние dxv переноса вдоль каждой из координатных осей (где индекс v также пробегает значения 1, 2,..., п) и просуммировать эти произведения по индексу v, а затем по индексу р. Каждое из этих произведений A^dx" нужно еще умножить на коэффициент T£v . Его верхний индекс указывает на то, что он взят для данной компоненты Л°, а нижние индексы, пробегающие независимо друг от друга значения 1, ..., я, указывают суммирование членов в получившейся таким образом формуле: ЬА° = Т^АНх\ Коэффициенты Г£у носят название символов Крис- тоффеля. Иногда их изображают в виде трехзначковых скобок |^v|. Они зависят от системы координат. В декартовых координатах все T£v равны нулю и 8Л*, соответственно, равны нулю. В эвклидовом пространстве мож-. но всегда ввести декартовы координаты — в этом состоит 85
характерный признак эвклидова пространства — и обратить во всем пространстве r*v в нули. В неэвклидовом пространстве декартовы координаты могут быть введены лишь в бесконечно малых областях, и здесь никак нельзя найти систему координат, в которой все F£v обратятся в нули во всем пространстве. Коэффициенты Кристоффе- ля r£v представляют собой меру «неэвклидовости» пространства. Познакомимся теперь с новым понятием, введенным в 1918 г. Вейлем,— понятием ковариантной производной. Выше была определена разность DA° между векторами А° и Aa + dAa, находившимися в разных точках и затем оказавшимися в одной точке "благодаря параллельному переносу, приведшему в криволинейных координатах к изменению 8Л°. Разность равна: DA° = dA* — ЪА°. Подставим в эту формулу выражения ЬАа через произведения компонент А* на сдвиги dxv с коэффициентами Г°у, т. е. величину F°v4^xv. Кроме того, вместо dA° напишем выражение этой величины через частную производную Аа по х° и смещение dx*: dA° = —у■ dx\ Получаем: DA'-^ + F^A^dx*. Выражение в скобках называется ковариантной производной вектора А°. Чтобы получить разность между двумя бесконечно близкими векторами в криволинейных координатах, нужно помножить бесконечно малое расстояние между точками, в которых находятся векторы, на указанную величину. В декартовых координатах для решения аналогичной задачи достаточно было помножить дифференциалы dxv на обычные производные —— дх* от компонент вектора по координатам. Все эти производные (в случае /г-мерного вектора их получается п2) об- разуют тензор второго ранга. В криволинейных коорди- 86
натах простые производные —^ не образуют тензор и дх^ мы должны заменить их более общими выражениями, дАа чтобы получить тензор, аналогичный —- . Таким тензором и является совокупность ковариантных производных вектора А°. Процесс получения этих производных называется ковариантным дифференцированием и символически изображается точкой с запятой перед индексом, по которому производится дифференцирование. Ковариантная производная контравариантного вектора А° обозначается: да _ дАа pq - ;v— dxv * Соответственно ковариантная производная ковариантного вектора Аа обозначается: А -^ — Т»А дх* В декартовых координатах, где символы КристоффеЛя равны нулю, эти выражения переходят в обычные производные. Что представляет собой ковариантное дифференцирование с точки зрения независимости физических объектов от их математической параметризации? Именно эта точка зрения (попыткой систематического приложения которой является настоящая книга) и превращает историю математических приемов в историю физической картины мира. В данном случае речь идет о получении обще- ковариантных уравнений, т. е. уравнений, независимых о г произвольного движения координатных систем. Обычная производная вектора не является инвариантом столь общих преобразований. Она совпадает с ковариантной производной в случае декартовых координат, которые могут быть всегда введены в эвклидовом пространстве. Ковариантная производная в этом частном.случае переходит в обычную производную, так как член с коэффициентом Кристоффеля обращается в нуль. Поэтому можно пред- положить, что ковариантная производная, в общем, случае не обращающаяся в обычную, соответствует неэвклидовой геометрии и более общим, криволинейным координатам. Следовательно, ковариантное дифсЬерендирова- 87
ние позволяет найти еще более устойчивые, независимые от преобразований фундаментальные соотношения, сделать еще один шаг в последовательном развитии инвариантного представления физических объектов. Ковариантное дифференцирование позволяет отделить друг от друга изменение геометрического образа, объясняющееся изменением физического прообраза, и изменение геометрического образа, связанное с изменением координатной системы от точки к точке. При изменении физической величины в ее координатном отображении «скорость» изменения во времени (скорость без кавычек) или в пространстве (градиент) дополняется «поправочным изменением»— следствием криволинейности координатной системы. Поэтому абсолютная мера «скорости» изменения физической величины, изображенной вектором А^.у отличается от простой производной 1 д\ *** ' Если физически величина не изменяется, то изменение ее в криволинейных координатах целиком зависит от криволинейности координат. Разделив в этом случае общее изменение на две части —«абсолютное» («физическое») и «координатное», мы получим нулевое значение первой части. Геодезическая линия и есть линия, направление которой целиком определяется кривизной пространства и не испытывает никакого «абсолютного» изменения. До сих пор речь шла о ковариантном дифференцировании векторов. Но можно определить и ковариантные производные тензоров. Делается это аналогично определению ковариантной производной вектора. Достаточно взять тензор, являющийся произведением двух векторов. Определяя изменение тензора при бесконечно-малом параллельном переносе, нужно учитывать изменения обоих векторов, зависящие от кривизны координат, т. е. прибавлять два выражения, включающие символ Кристоффеля. Затем, вынося за скобки dxv, т. е. представляя изменение тензора как произведение перемещения по оси xv на производную тензора по этой оси, мы получаем ковариант- ную производную. Повторим это в несколько иной форме, 1 См. А. Эддингтон. Теория относительности. М.—Л., 1934, стр. 1?3—129.
чтобы несколько закрепить представление о ковариантной производной. Контравариантный тензор — произведение А°В* двух контравариантных векторов Аа и В11—переносится в другую бесконечно близкую точку. Благодаря криволинейности координат Л°ВЦ изменяется при переносе. Изменение его выражается величиной ЦАаВ»)=А°ЪВ» + ВПАа = - A°T^Bvdxa - В»ГааАЧх". Если заменить произведение АаВ* любым тензором Т0|\ то в силу линейности написанного только что преобразования, оно остается справедливым. Вынося за скобки смещение, получаем в скобках величину, зависящую от криволинейности координат. Изменение оТа* тензора равно этой величине, помноженной на смещение dx": ЪТ9» = - (ТааГ^ + Г^) dx\ Разность между двумя бесконечно близкими тензорами DTaiL = dT°^ 8T,op' и есть ковариантная производная тензора Та|х, помноженная на смещение dxv, т. е. T°^dx*. Таким образом, ковариантная производная тензора Г0|Л равна обычной производной плюс два члена, стоящие в скобках в выражении для ЪТ°*: ггоа L \ v = ~ГТ" "Г l ccvi i~Aav..7 . У читателя может создаться представление, будто ковариантная производная — чисто математическое понятие, что мы присоединяем к обычному дифференциалу dAa дополнительное изменение 8Л°, а к обычной производной — дополнительный член Г^Л11, чтобы учесть произволь- дх? ную, включающую криволинейные координаты, параметризацию физического объекта. Пока мы только готовимся к переходу в область общей теории относительности, с таким представлением можно мириться. Но самый переход к общей теории относительности как раз и состоит в. физической интерпретации символов Кристоф- 89
феля, в установлении физических явлений, требующих введения дополнительных членов в выражения дифференциалов и производных, одним словом —в физическом истолковании криволинейности координат. Чтсбы выяснить физический смысл символов Кристоффеля, нужно предварительно показать их связь с метрическим тензором g^. Изменчивость g v свидетельствует о кривизне прсст- ранства. Изменения g v совпадают с теми изменениями, которые вызываются кривизной пространства. Поэтому, если вычесть из разности двух бесконечно близких тензоров g v различие, образующееся при параллельном переносе благодаря криволинейности координат, то никакой разности не окажется. При ковариантном дифференцировании g ведут себя как постоянные, их ковариант- ные производные равны нулю: £Vv;P=0. Из этого уравнения можно определить символы Кристоффеля через метрический тензор. Не приводя доказательств, прямо напишем результат — значения T°v, которые в выражении ковариантной производной g^ обращают ее в нуль: Таким образом, r£v — это выражения, составленные из обычных производных тензора g^v. В этом нет ничего неожиданного: изменение метрического тензора — мера кривизны пространства, производные g выражают меру искривления; с другой стороны, T°v непосредственно выражают искривление координат в различных направлениях. Написанное выше выражение Г°у через производные g придает этим интуитивным и неопределенным ассоциациям точную и строгую форму. Следующий шаг состоял в использовании аналитического понятия, соответствующего кривизне пространства в каждой точке. Символы Кристоффеля соответствуют искривлению 90'
пространства в различных направлениях. Нужно найти выражение, измеряющее всевозможные искривления во всевозможных направлениях и соответствующие (зависящие от кривизны пространства в данной точке) изменения метрического тензора g в данной точке. Это выражение должно быть тензором. Тензор ранга г позволяет охватить единым взглядом изменения тензора ранга г — 1; вектор (тензор первого ранга) позволяет охватить одним выражением изменения скаляра (тензора нулевого ранга) во всевозможных направлениях пространства системой п чисел (п — число измерений пространства). Тензор второго ранга (г = 2) позволяет выразить п2 числами всевозможные изменения вектора, тензор третьего ранга описывает своими nz компонентами всевозможные проекции тензора второго ранга и т. д. В этом случае выражение для кривизны в данной точке должно описывать не только первые производные g , т. е. изменения тензора второго ранга, но и вторые производные g . Такое выражение — результат двукратного дифференцирования g v. Это — тензор четвертого ранга. Он обозначается R%- и называется тензором кривизны, или тензором Римана — Кристофф^ля* Это понятие появилось у Римана в 1854 г. в работе «О гипотезах, лежащих в основании геометрии» (опубликованной в 1868 г), а у Кристоффеля в 1869 г. Уже в 1914 г. в статье, написанной вместе с Фоккером1, Эйнштейн оценил значение этого тензора. В 1916 г. в «Основах общей теории относительности» он пишет о тензоре кривизны ££от: «Математическое значение этого тензора заключается в следующем. Если континуум обладает тем свойством, что существует такая координатная система, в которой g^ постоянные величины, то все В*ат обращаются в нуль. Если вместо первоначальной системы выбрать любую другую новую координатную систему, то g^, отнесенные к последней, не будут больше постоянны. Однако тензорный характер величин В^от влечет за собой то, что эти компоненты в произвольно выбранной системе координат тоже обращаются в нуль. Исчезновение тензора Римана * Ann. d. Phys. 44, 321, (191 i). ai
является, следовательно, необходимым условием для того, чтобы можно было посредством надлежащего выбора координатной системы сделать g^ постоянными» *. Попытаемся дать наглядное геометрическое представление о тензоре Римана-Кристоффеля (фиг. 8). В некотором пространстве — для простоты возьмем двухмерное пространство — движется параллельно себе вектор а. Он обходит замкнутый контур и возвращается в исходную точку. Если такой обход совершен на эвклидовой плоскости, то вектор, пройдя по любому контуру, совпадает по направлению и по величине со своими первоначальными величиной и направлением. На нашем рисунке а — первоначальный вектор до обхода контура; а,\ — вектор, в который он превратился в результате обхода. В эвклидовом пространстве любого числа измерений а равен а\ и по величине и по направлению. В более общем классе пространств, в римановых пространствах, он меняется по направлению: а и ах образуют некоторый угол. Наконец, в еще более общем классе пространств, в так называемых пространствах Вейля, а не равен «1 не только по направлению, но и по величине. Изменение направле- а at ^^ ния вектора в результате "Ч V Г ~^\ обхода контура показыва- \\ / \ ет, что пространство в об- ^у ) ласти, где произошел об- / J ход, характеризуется не- / / которым отступлением от / У «эвклидовости», что оно V ^^ приобретает здесь более общие черты, отсутствующий. 8 щие в частном случае эвклидова пространства. Что же это за черты? Если на каком-то участке плоскости вектор после параллельного перемещения по замкнутому контуру меняет направление и образует ненулевой угол с первоначальным направлением, то это свидетельствует, что в пределах данного участка геометрия отступает от эвклидовых законо- 1 «Принцип относительности», стр. 275. 92
мерностей и пространственные соотношения начинают подчиняться законам римановой геометрии. Отступление от эвклидовой геомертии может получить простое наглядное истолкование; плоскость в пределах аномального участка перешла в кривую поверхность, искривилась. Для трехмерного пространства уже нельзя столь наглядно объяснить отступление от эвклидовой геометрии. Но мы можем по аналогии, как это уже не раз делали, говорить о кривизне трехмерного, четырехмерного и т. д. континуума, причем угол da между а и ах считать мерой кривизны. Нужно, разумеется, исключить зависимость угла между а и а\ от вида замкнутого контура. Мы будем проводить через точку Р на двухмерной поверхности все меньшие замкнутые линии и в пределе получим прямую пропорциональность между отклонением вектора от первоначального положения и площадью S, ограниченной контуром обхода. Множитель пропорциональности и будет мерой кривизны поверхности в точке Р. Обозначив его через К, получим: Представим еще конкретное образование «сферического избытка», т. е. различия в направлении аи^.На поверхности шара начерчен замкнутый контур — прямоугольный сферический треугольник, образованный тремя перпендикулярными геодезическими линиями, пересекающимися в точках Ри Р2 и Р3 (фиг. 9). Выше было сказано, что угол между параллельно переносимыми векторами в римановом пространстве не меняется. Вектор направления геодезической линии переносится параллельно себе — в этом состоит определение геодезической линии. Вектор, параллельно переносимый вдоль геодезической линии, сохраняет с геодезической линией один и тот же угол. Это можно считать определением параллельного переноса вдоль геодезической линии. В данном случае вектор А переносится по контуру параллельно себе, иначе говоря — сохраняя один и тот же угол с геодезической линией. Первоначальное направление вектора А\ совпадает с направлением Р\р2 в точке Pi. Сохраняя то же направление, вектор в точке Рг займет положение А2у перепендикулярное к линии РгРз- Сохраняя пря- 93
мой угол с этой линией, он в точке Рз займет положение Л3, совпадающее с направлением меридиана Р3Рь Двигаясь вдоль последнего, вектор вернется в точку Рь сохранив направление, совпадающее с направлением Р3Р1, т.е заняв положение Л4, образующее угол а = 90° с первоначальным направлением А\. Таким образом, он в результате обхода контура повернулся на 90°, что и свидетельствует об определенной кривизне поверхности, охваченной контуром PiP2Ps. Передвигаясь по плоскости, он не изменил бы направления. Из сферической тригонометрии известно, что угол а (сферический избыток) равен отношению площади S треугольника Р1Р2Р3 к квадрату радиуса R сферы: Фиг. 9 5 Откуда: а ~S 1 По определению кривизны К'. R2 ^ = "БГ- Все это построение можно повторить для трехмерного и вообще для n-мерпого пространства, правда, без наглядности, присущей понятию кривизны двухмерного пространства. В поисках аналитического выражения для избытка, получающегося при обходе участка в неэвклидовом пространстве, мы снова встречаемся с коэффициентами Г°у. Это нас не должно удивлять, ведь изменение вектора при таком обходе вызывается кривизной пространства, и мерой такого изменения должно служить выражение, составленное из производных r°v. Действительно, такое выражение включает тензор кривизны /?£vp, составленный 94
кз указанных величин. Разность значений вектора б одной и той же точке до и после обхода контура равна половине произведения тензора кривизны на величину вектора и на площадь участка кривой поверхности, огибаемого контуром. Самый же тензор /?evp равен выражению: Da ™ up "Г I Г° Vе Va Ге A ^tvp — —- J— -f- * ev x up А ер1 uv дх* дх? Мы не приводим вывода этой формулы, она интересна сейчас только с одной стороны — со стороны отношения тензора кривизны к виду пространства. В эвклидовом пространстве можно выбрать также системы отсчета, в которых во всем пространстве коэффициенты Г °v обращаются в нуль. Тогда обращается в нуль и всё написанное только что выражение. Но всякий тензор, если он равен нулю в одной системе координат, равен нулю и в любой другой системе — в этом основное интересующее физика свойство тензоров. Тензор /?£vp, . таким образом, в эвклидовом пространстве равен нулю. В свою очередь, если этот тензор равен нулю, то пространство подчиняется эвклидовой геометрии. Это легко доказать. В любом пространстве можно в бесконечно малой области ввести декартову систему координат, вернее можно ввести систему координат, не отличающуюся от декартовой в бесконечно малой области. Выполним эту операцию, а затем начнем параллельно переносить декартовы оси из данного бесконечно малого участка в другие. Если кривизна равна нулю, то параллельный перенос сохранит декартов характер переносимых осей, и мы сможем ввести декартовы координаты во всем пространстве..Но такая возможность и есть признак «эвклидовости» пространства. Если же, введя в бесконечно малой области декартовы координаты и обратив в этой области в нуль все Га 9 мы убеждаемся, что при этом производные от r°v не обратились в нули и, следовательно, тензор кривизны (состоящий не только из Г° но и из производных от них) не равен нулю, то результат параллельного переноса будет иным. В таком пространстве параллельный перенос уже не однозначная операция, переносимые декартовы оси перестанут быть декартовыми, и мы убедимся в «неэвклидовости» пространства. 95
Вернемся к наглядному представлению кривизны — изменению направления вектора при обходе контура. Когда-то Гельмгольц, чтобы пояснить понятие многомерного пространства, говорил о двухмерных существах, обитающих на поверхности сферы. С тех пор эти существа так часто появлялись на страницах различных книг, что выросли в народ со своей собственной географией, астрономией и, во всяком случае, геометрией. Они могли бы провести все указанные выше операции с переносом вектора А по контуру Р\Р<1?ъ и определить кривизну своего двухмерного мира. Они могли бы поступить и проще. Ведь в описанных построениях все дело заключается в сумме углов треугольника Р\Р2Р$. На плоскости она была бы равна 180°, на сфере она больше. Двухмерные существа могли бы установить «неэвклидовость» своего мира и определить меру «неэвклидовости» — кривизну, измеряя сумму углов треугольника. Можем ли мы произвести аналогичные измерения кривизны трехмерного мира? Само по себе трехмерное пространство не допускает такого измерения, но его допускает четырехмерный пространственно-временной континуум. Четырхмерный континуум отступает от законов эвклидовой геометрии, и такое отступление мы наблюдаем в явлениях тяжести тел. Теория тяготения позволяет поэтому физическими методами решить вопрос, какие геометрические законы, законы Эвклида или законы Римана, дают более точное описание действительности. Поэтому теория тяготения Эйнштейна — общая теория относительности — является физической геометрией. 7. Тяготение Объяснение трехвековой загадки тождества инертной и тяжелой массы картиной эквивалентности тяготения и ускорения было выдающимся достижением. Создание стройной теории кривизны мира и выявление в ней возможности общековариантного представления физических законов в тензорных уравнениях — это, может быть, еще более значительное открытие. Но решающим звеном общей теории относительности было отождествление искривления мира с тяготением. Первая идея — идея эквивалентности — имеет собственно физический характер и служит 96
обобщением старой галилеево-ньютоновой констатации тождества тяжелой и инертной массы и новых, выросших из электродинамики представлений о распространении света. Вторая идея — ковариантности уравнений— опиралась на некоторую систематизацию и развитие собственно математических понятий и методов, имевшихся у основателей тензорной алгебры, тензорного анализа, теории кривизны и многомерной геометрии. Третья идея — тождество гравитационных и метрических полей, связь между метрикой и сосредоточиями масс — уже не физическая идея в старом смысле и не собственно математическая. Это — идея физической геометрии. Эйнштейн нашел в тяготении физическое явление, показывающее, какова метрика пространства, т. е. создал возможность физического исследования геометрии мира, которая тем самым стала физической наукой, обладающей экспериментальными критериями. Физическая интерпретация «неэвклидовости», или кривизны четырехмерного пространства и связанных с ней понятий (неравных единице или нулю компонент g^ , неравных нулю коэффициентов Кристоффеля T°v, тензора Римана-Кристоффеля /?j[vp ) основана на следующих соображениях. Свободная частица движется таким образом, что ее мировая линия между двумя мировыми точками, состоящая из бесконечно малых четырехмерных интервалов ds, оказывается кратчайшей. Пространство специальной теории относительности — эвклидово пространство, поэтому кратчайшая линия является здесь прямой. Если взять трехмерную пространственную гиперповерхность четырехмерного мира Х\Х2Х^ то мы увидим пространственную трехмерную проекцию мировой линии свободной частицы, она будет прямой. Это и означает известную со времен Декарта прямолинейность инерционного движения. В двухмерных гиперповерхностях Х\Х4у Х2,Х4у ХгХ4у т. е. в пространственно-временных графиках движения частицы по направлениям пространственных осей, проекции мировой линии свободной точки также будут прямыми. Это означает известную уже Галилею равномерность инерционного движения. Теперь обратимся к частице, движущейся в гравитационном поле. Самая суть современного учения об инер- 97
ции и тяготении — общей теории относительности — состоит в утверждении, что движение частицы в гравитационном поле, так же как и движение свободной частицы, определяется кратчайшей мировой линией. Тяготение же означает лишь иное выражение для элементов ds этой линии. Точнее, частица в гравитационном поле движется так, что ее мировая точка описывает геодезическую линию в неэвклидовом пространственно-временном мире. Неэвкли- довость мира проявляется в изменении выражения ds, в переходе от выражения ds* = g^dx»dx\ где £44=1, gn = e22^=g33 = — 1 и £^ = 0, если [x=£v, к выражению ds* = g^dx*dx\ где g^v — функция координат. Изменение метрики мира означает, что геодезические линии вообще уже не прямые. Их проекции на гиперповерхность Х1Х2Х3 также могут быть кривыми; это пространственное искривление соответствует нормальному (в простейшем случае — центростремительному) ускорению. Проекции мировой линии на поверхности Х\Х4, Х2Х4 и Х$ХА также могут быть кривыми (тангенциальное ускорение). В механике специальной теорией относительности пользуются далеко идущей аналогией между трехмерным пространством Х\Х2ХЪ и четырехмерным псевдоэвклидовым миром Х\Х2ХгХ4. Роль, которую в классической механике в отношении Х\Х2Х$ играло время, в отношении Х\Х2Х$ХА играет мировой интервал. Четыре производные мировых координат по интервалу называются компонентами ч е- тырехмерной скорости. Производные от четырехмерной скорости по мировому интервалу, т. е. вторые производные координат, называются четырехмерными ускорениями. Уравнение движения свободной частицы получается приравниванием четырехмерных ускорений нулю ds2 ~ ds " U> где u° = dx°/ds — четырехмерная скорость. Суть общей 98
теории относительности состоит в том, что в случае гравитационного поля это уравнение не отменяется, а обобщается на криволинейные координаты. Заметим в скобках, что уже не раз о несовпадающих формулировках говорилось, что в них «суть общей теории относительности». Во всех этих случаях приводятся разные аспекты одной и той же мысли. В криволинейных координатах приравнивается нулю выражение, включающее не только вторую обычную производную от хаУ но также изменения, зависящие от символов Кристоффеля. Уравнение движения частицы в гравитационном поле имеет вид: А0 , т,о dx* d? _ п Это обобщенное уравнение превращается в написанное выше уравнение движения свободной точки в том случае, когда Г% = 0. Если в уравнении движения частицы в гравитационном поле перенести член с коэффициентом T£v в правую сторону, то этот член (со знаком минус) будет равен четы- d2xa рехмерному «ускорению» —^ . Если же его еще умножить на массу т, то член ро dx^dx* ml^dVTs будет равен четырехмерной «силе». Сами же Г* играют роль напряженностей силового поля. Если вспомнить, что Г£у составлены из производных тензора g, то компоненты последнего играют, очевидно, роль потенциалов поля тяготения. Мы могли бы поставить здесь слова «сила», и, соответственно, «напряженность» и «потенциал» в кавычки, потому что в классической механике, начиная с Ньютона (у Галилея этого не было), сила рассматривается как нечто постороннее по отношению к геодезическим линиям пространства, по которым движется частица. Здесь же движение свободной частицы и движение частицы в гравитационном поле в равной мере происходят по геодезическим линиям, только линии эти различные, в 99
Первом случае — прямые, во втором, общем случае — кривые. Кавычки означали бы и другое отличие от классической силы. В общей теории относительности эти коэффициенты играют роль четырехмерных «сил», отличающихся от «трехмерных» сил классической механики, соответствующих трехмерным ускорениям и скоростям. Напомним, что в ньютоновой, классической теории Аяготения напряженности поля определяются производными от потенциалов. В новой теории тяготения — общей теории относительности—роль потенциалов играют компоненты фундаментального метрического тензора ^v.ero производные определяют напряженности, т. е. коэффициенты Га . Такая физическая интерпретация при всей своей неожиданности очень естественна. Если тензор кривизны равен нулю, коэффициенты Кристоффеля равны нулю, компоненты ^ — постоянные величины (надлежащим выбором системы координат их можно сделать равными единице и нулю, т. е. прийти к специальной теории относительности), тогда четырехмерная геометрия мира соответствует однородному гравитационному полю, которое может быть устранено. Если же тензор кривизны не равен нулю и ё м-v— переменные величины, тогда геометрия мира соответствует неустранимому гравитационному полю. Естественно предположить, что компоненты реальных гравитационных полей служат физическим прообразом коэффициентов Кристоффеля, а потенциалы гравитационных полей — прообразом компоненту р^. Тогда общекова- риантная форма уравнения свободного движения материальной точки остается справедливой и для того случая, когда в гравитационном поле нельзя выбрать координатную систему, в которой коэффициенты g^ приобретают значения специальной теории относительности. В этом состоит программа, намеченная в первых параграфах и выполненная в последующем содержании «Основ общей теории относительности», где излагается новая теория тяготения. 100
Значения g^ в различных точках четырехмерного пространственно-временного континуума составляют g-поле, которое характеризует и движение тяжелых тел, и скорость распространения света, и метрику пространства и времени. В этом основное содержание общей теории относительности. Она принадлежит к числу великих обобщений, которые всегда будут поражать людей своей смелостью и широтой. Такова мысль Галилея об инерционном движении, мысль Ньютона о тяготении, объясняющем мироздание, мысль Лобачевского о зависимости геометрических свойств пространства от физических процессов, мысль Эйнштейна о постоянстве скорости света и изменчивости пространственных и временных масштабов. К ним принадлежит и идея тождества гравитационных и метрических полей. g-поле определяется в каждой точке пространственно- временного континуума общековариантными законами. Формулируя эти законы, Эйнштейн не ограничивается принципом общей ковариантности, который не говорит еще о физическом содержании закона, подобно тому как в 1905 г. принцип относительности сам по себе был недостаточен для построения специальной теории относительности. При построении общей теории Эйнштейн формулирует общий принцип, обеспечивающий выражение физического закона понятиями и величинами, независимыми от параметризации, и сразу же переходит к содержанию этого закона. Искривления пространственно-временного континуума, или, что то же самое, гравитационные поля, зависят от наличия тяжелых масс. Тяжелые массы равны инертным массам и, следовательно, пропорциональны полным энергиям. Отсюда можно принять, что метрическое поле зависит от полной энергии, создающей это поле материальной системы, состоящей из вещества в обычном смысле и электромагнитных полей. Но плотность энергии является компонентой тензора энергии-импульса Т^. Уравнения гравитационного поля связывают с этим тензором первые и вторые производные компонент g^. Теперь напомним некоторые формулы классической теории поля. Эта теория описывает потенциальное силовое поле посредством скалярной функции координат <р (х, у, z). 101
Сила представляет собой градиент, т. е. изменение потенциала: F=grad<p = — V<p. Проекции Vcp на координатные оси х, у, z — это произ- дф д(р дф водные ср по х, {/, г\ ^, -а—, ^--. Дифференцируя по х, у и z составляющие grad ср , т. е. получая вторые производные ср по х, у, z, мы выполняем операцию, которую можно считать двукратным применением оператора Гамильтона V (набла): Оператор V2 (иначе обозначается символом А) называется оператором Лапласа. Силовое поле в каждой точке пространства мы выразили через скалярное поле потенциала ср {х, у, z). Теперь нужно связать ср с какими-то другими физическими свойствами пространства и материи, со скалярным полем р {х, у, z)} источником поля ср. Если ср потенциал электростатического поля, в качестве источника фигурируют электрические заряды, а уравнение, связывающее ср с р, будет уравнением электростатического поля. В случае сил тяготения в качестве источника поля фигурируют тяжелые массы, создающие вокруг себя гравитационные поля. В обоих случаях потенциал ср поля связан с плотностью источников р (х, у, z) поля уравнением: V2cp = — 4ттр. Это уравнение называется уравнением Пуассона. Оно описывает поле в каждой точке пространства, где имеется некоторая неравная пулю плотность источников поля. Если в какой-то области пространства нет источников поля (электрических зарядов — в одном случае, тяжелых масс — в другом), т. е. плотность источников поля становится равной нулю, то уравнение Пуассона переходит в уравнение V2? = О, которое называется уравнением Лапласа. Оно означает, что сила в данной точке существует (Vcp ф 0), но не нарастает (вторые производные ср равны нулю). Нетрудно видеть, что уравнение Лапласа является частным случаем уравнения Пуассона. 102
Чтобы применить уравнение Пуассона к какому-либо физическому полю, нужно сделать определенные допущения о распределении источников поля, о непрерывном изменении плотности этих источников р (х, у, z) от точки к точке. Такое представление будем называть классической континуализацией. Классическая физика стремится преодолеть коллизию непрерывного поля и дискретного вещества. Она рассматривает плотность вещества как ненулевую непрерывную величину, вводя понятие среднего значения плотности в каждой точке. Если не рассматривать нарушающие статистическую апроксимацию флюктуации числа молекул в некотором объеме, то можно, стягивая объем в точку, получить предельное отношение числа молекул к объему — среднюю плотность в точке. Аналогичным образом можно рассматривать температуру или среднюю скорость молекул, как физическую величину, непрерывно распределенную в пространстве, как непрерывную функцию пространственных координат. Электродинамика Фарадея — Максвелла ввела иное представление о непрерывных источниках поля. В ней речь шла не о средних значениях, не об статистической апроксимации, а о действительно непрерывном распределении источников поля. Теория Лоренца внесла в электродинамику идею дискретности и рассматривает континуальные величины, фигурирующие в уравнениях Максвелла, как статистические средние. Тем не менее в классической электродинамике утвердилось представление о непрерывной реальной среде, состояние которой описывается в каждой точке переменными электромагнитного поля. Исходным пунктом в теории гравитационного поля является существование дискретных масс — небесных тел, разделенных пространствами, которые рассматриваются как лишенные источников поля. Поэтому гравитационное поле можно связать с наличием и распределением масс при помощи уравнения Пуассона, если рассматривать большие области пространства, где к космическому газу небесных тел может быть применено понятие средней плотности материи в каждой точке. Но можно прийти и к другому представлению тяжелых масс, создающих гравитационное поле. Вместо того чтобы статистически континуализировать, «размазывать» массу 103
по всему пространству и применять уравнение Пуассона, можно «собрать» массу в точки, оставив пустым все пространство за вычетом этих точек. Здесь также пользуются аналогией с электромагнитным полем. В теории Лоренца дискретные заряды заменили максвелловское непрерывное распределение зарядов по объему диэлектрика. Они плавают в эфире в качестве особых, сингулярных точек. В этих точках уравнения Максвелла для свободного от зарядов пространства (однородные уравнения) теряют смысл. Аналогичным образом можно представить тяжелые массы, создающие гравитационное поле, как совокупность сингулярных точек и областей, окруженных пустым, лишенным источников поля пространством. В этом случае гравитационное поле в областях пространства, где отсутствуют источники, описывается уравнением Лапласа: V2? =0. Континуальное же представление тяжелых масс основывается на статистической апроксимации большого числа точечных масс и их движений. В астрономии континуальным представлением масс пользуются, когда речь идет о внутренних напряжениях в звезде или когда характеризуют состояние всей галактики. Если же в задаче фигурирует небольшое число небесных тел, их представляют точечными сосредоточиями массы, а все пространство — лишенным источников гравитационного поля. И континуальное представление и дискретное являются законными приближениями только в макроскопической области. Общая теория относительности до настоящего времени остается макроскопической теорией. Она пользуется и континуальным и дискретным представлением тяжелых масс (в их число входит теперь и свет), и уравнения поля тяготения в общей теории относительности являются аналогами уравнений Пуассона и Лапласа. Теория тяготения, выдвинутая в 1916 г. Эйнштейном, связывает кривизну пространства-времени с распределением материи, включая электромагнитное поле, также обладающее массой. Эйнштейн обозначает словом «материя» вещество в обычном смысле плюс электромагнитное поле. В 1916 г. не знали о мезонных полях, поэтому Эйнштейн имел право назвать эту сумму: «все, кроме поля тяготения». i04
Первая задача — найти уравнения гравитационного поля, действующего в области, где нет «материи», иначе говоря,— найти релятивистское уравнение, соответствующее уравнению Лапласа старой гравитационной теории. В специальной теории относительности мы рассматриваем пространство, в котором нет поля тяготения. Это значит, что пространство не искривлено, что все компоненты тензора Римана — Кристоффеля равны нулю: #£vp= 0. Очевидно, для пространства, где существует поле тяготения, мы должны перейти к другим уравнениям. Для этого нужно получить иной вид тензора кривизны. Внешний вид тензора /?°vp указывает нам на его свойства. Индексы не повторяются, поэтому мы не должны складывать различные значения тензора, соответствующие различным сочетаниям индексов. Можно думать, что число таких сочетаний не уменьшится, как это произошло бы при суммировании. Но все же число самостоятельных компонент /?° меньше, чем 44 = 256 (сочетаний, получаемых независимой подстановкой чисел 1, 2, 3 и 4 на место каждого индекса). Независимых компонент всего двадцать. Если все они равны нулю, т. е. мы имеем двадцать уравнений: то, как было только что сказано, никакой кривизны в пространственно-временном мире нет и перед нами плоский пространственно-временной мир, гравитационные поля отсутствуют. Общий случай — наличие гравитационных полей — должен описываться меньшим числом уравнений. Если из двадцати независимых компонент /?° vp только некоторые равны нулю, то в пространственно-временном мире, описываемом таким, меньшим числом уравнений, очевидно, имеется кривизна, действуют гравитационные поля. Как получить систему уравнений, приравнивая нулю компоненты тензора кривизны и вместе с тем не накладывая на пространство-время слишком большие ограничения, исключающие вовсе кривизну мира? Математически задача сводится к уменьшению ранга тензора /?avp. Она решается при помощи свободного «жонглирования» индексами, которое так характерно для тензорного исчисления и так облегчается и становится таким 105
эффективным благодаря эйнштейновской сокращенной записи суммирования. Достаточно приравнять верхний индекс тензора Ra одному из нижних, иными словами,— сложить все компоненты с повторяющимися два раза индексами, чтобы получить новые компоненты — компоненты тензора второго ранга. Приравняем верхний индекс R* последнему нижнему, т. е. обозначим р через а. Тогда, поскольку удвоение индексов заставит нас суммировать члены с повторяющимися индексами, мы получим выражение: Ap.va = Ajxvl 4" Ap.v2 "Г A|av3 i aVv4 = Д^. Таких различных R^ всего десять: А*И = Rin 4 A\i2 4- Ацз + A\l4> Ai2 — Am + A122 4" А12З 4" Ai24» Rl3 = A* 131 + Ai32 4" Л133 + A134, A14 = A141 + A142 4 A143 4" А*ш> A22 = A22I 4 R222 4 А22З 4" A224i A 23 = A231 4 A232 4" A233 4" A234» A24 = A*2U 4" A*212 4" A*213 4" A2U1 A33 = A331 4" R332 4" A333 4 A334> A*34 = Rsil + A*3i2 4" A*343 + A*344> A44 = A441 4 A442 4 А44З 4" A444, Превращение i?°vP в R^ представляет собой, таким образом, уже знакомую нам операцию свертывания тензора четвертого ранга. Мы здесь написали ее подробно. Такие повторения, неуместные в специальной книге, здесь полезны, они способствуют выработке того, почти автоматического восприятия тензорных символов, которое облегчает усвоение физической стороны дела, самой по себе достаточно сложной. Десять уравнений R^ = 0 описывают более общую и широкую область явлений, чем двадцать уравнений a*£vp = 0. Последние описывают частный случай, когда гравитационное поле отсутствует или может не прини- 106
маться в расчет. Реально такие условия могут встретиться лишь на бесконечном расстоянии от скоплений вещества. Напротив, уравнения R^ = 0 описывают положение дел в областях пространства, расположенных невдалеке от масс, создающих гравитационные поля. Здесь уже есть некоторое искривление, так как некоторые компоненты Rpve> не равны нулю. Эйнштейн подчеркивает физическое отличие условий, описываемых уравнениями R^ = 0, от условий, описываемых уравнениями R%p = 0. Если нет полей тяготения, то последние выполняются, но они требуют слишком много. «Ибо ясно, что гравитационное поле, созданное, например, материальной точкой вокруг себя, наверное никаким выбором координатной системы не может быть «оттранс- формировано», т. е. не может быть преобразовано к случаю постоянных g v»1. Значит, все дело в локальности принципа эквивалентности, в том, что гравитационное поле не может быть сведено к ускорению, если рассматриваются конечные области, что только в частном случае можно с помощью принципа эквивалентности «оттрансформировать» тяготение, выбрав такую систему координат (с ускорением, обратным тяготению), в которых тяготение исчезает. Мы опять видим, что принцип эквивалентности позволяет перейти к общей ковариантности только при учете кривизны пространства, что локальность эквивалентности не ограничивает общую теорию относительности, а является в общем случае ее основой. Речь шла о кривизне мира в областях, где нет «материи». Можно представить себе кривизну более высокого ранга. В областях, где нет обычного вещества, т. е. частиц с массой покоя (электронов, протонов, нейтронов и т. д.), но есть кванты поля, например, потоки света, пересекающие пространство, в таких областях мира существует кривизна настолько высокого ранга, что только одна компонента тензора Римана — Кристоффеля равна нулю: # = 0. Наконец, в пространстве, заполненном обычным веществом, кривизна так велика, что ни одна компонента 1 «Принцип относительности», стр.^_279. 107
R° не равна нулю: Уравнения, описывающие кривизну мира в областях, лишенных материи, R^ = 0 соответствуют уравнению Лапласа V2cp = 0. Какие же уравнения для тензора кривизны соответствуют уравнению Пуассона? Напишем уравнение Пуассона для гравитационного потенциала ср, включив в него гравитационную постоянную *: V2cp = 4 т.х.р. Теперь начинает действовать требование ковариантности. Уравнение должно быть тензорным, а не скалярным. Мы видим характерный пример «свободного пробега» теории: избранная на основе физических соображений математическая (в данном случае тензорная) форма подсказывает дальнейшее развитие физических идей, раскрывает собственно физические соотношения. Вместо скаляра с? появляются компоненты тензора g^. Они играют роль потенциалов тяготения. В уравнении Пуассона <? подвергался операции двукратного дифференцирования по координатным осям. Соответственно в новое, релятивистское, тензорное уравнение входят выражения, составленные из первых и вторых производных g^ — знакомый нам тензор кривизны. Чтобы уравнения были ковариантными, нужно, чтобы и в правую часть уравнений входили компоненты тензора, описывающего распределение массы. Таков тензор энергии-импульса 7\iv Вывод уравнений потребовал бы сложных разъяснений и введения многих неизвестных еще понятий. Опустим его и напишем уравнение Эйнштейна без дополнительных пояснений и доказательств: #h.v — -у g^R = — 8к*Т^ Эти уравнения описывают характер кривизны, иначе говоря тяготения, в зависимости от наличия и распределения вещества в пространстве. Следует заметить, что эти уравнения нелинейны по отношению к переменным. Это значит, что гравитационное поле порождает само себя, оно эквивалентно в этом отношении «материи». Если гравитационное поле слабое, десять гравитационных уравнений Эйнштейна переходят в уравнения ньк>тсщорой теории. 108
Остановимся на числе уравнений, написанных выше в общем виде. Тензор g^y симметричный, он имеет десять компонент. Значит, вместо скалярного потенциала ср у нас теперь десять потенциалов тяготения. Справа стоят десять компонент тензора 7^v, также симметричного. Следовательно, тяготение в каждой точке описывается десятью уравнениями. Это относится и к уравнениям тяготения для пространства, лишенного «материн», где /?*v = 0. Такое уравнение полностью определяет потенциалы тяготения. Эти «лишние» для инвариантного представления, ориентирующие сведения также заключены в десяти уравнениях R^ = 0. Чтобы представить в десяти уравнениях гравитационного поля лишь инвариантные свойства потенциалов тяготения, нужно связять десять компонент тензора /?цУ четырьмя тождественными соотношениями, вытекающими только из способа, которым эти компоненты получены из g v и их производных. Мы представили коэффициенты g у, т. е. метрику пространства и времени, как его кривизну, составив из g и их производных сначала коэффициенты Гау, а затем — компоненты тензора кривизны R^v. При этом не могли не сказаться общие, независимые от кривизны свойства пространства и времени — их однородность, позволяющая переходить от одной системы пространственно-временных координат к другой. Компоненты тензора кривизны не зависят от такого перехода, они тождественны, в каких бы системах их ни ориентировали. Поэтому речь и идет о математических тождествах, вытекающих из самого способа, которым были составлены компоненты R^. Общая теория относительности не ограничивается таким аспектом и показывает далее, что указанным тождествам соответствуют уравнения, имеющие определенный физический смысл. Перейдем к континуальному представлению кривизны, с одной стороны, и «материи», с другой, и будем рассматривать средние значения 7?^ в больших областях. Они уже не равны нулю. Справа в уравнениях стоит не нуль, а тензор энергии-импульса, изображающий распределение 109
«материи». Тождественным соотношениям между компонентами R^ соответствуют нетождественные соотношения, выражающие физические законы. Если приравнять усредненное непрерывное поле значений R ,xv усредненному непрерывному полю значений Г^ (а в этом и состоит континуальная форма теории тяготения Эйнштейна), то четырем тождественным соотношениям /?p.v соответствуют четыре закона сохранения, относящихся к энергии и импульсу. Почему геометрические отображения этих физических законов оказываются простыми тождествами? Пространство-время обладает двумя разрядами свойств. Первый разряд включает инвариантные свойства, измеряемые математическими величинами, не требующими указания на тело отсчета и в этом смысле абсолютными. Для них характерно слияние четырех измерений пространственно-временного мира, их неотделимость. Примером таких свойств служит метрика. Переходя от дифференциалов ctx* четырех координат к четырехмерному интервалу ds, мы как бы сплавляем относительные, требующие указания на тело отсчета величины в единую четырехмерную абсолютную величину. Второй разряд свойств — свойства, имеющие смысл только при указании тела отсчета, свойства, параметризи- руемые величинами, меняющимися по тому или другому закону. Характерная особенность этих свойств — их связь с свойствами пространства и времени, взятых порознь. Пространству и времени, взятым порознь, соответствуют импульсы и энергия. Энергия представляет собой временной, а импульсы — пространственный разрез некоторого общего четырехмерного свойства. Кривизна — инвариантное, «слитно-четырехмерное» свойство пространственно-временного мира. Уже говорилось, что, выражая кривизну тензором второго ранга /?p.v, мы включаем в это выражение «лишние» сведения, соответствующие «раздельным» координатным, относительным свойствам пространства и времени. Их устраняют при помощи четырех тождеств, указывающих на тождественность кривизны в разных системах координат. Для кривизны — инвариантного свойства — эти тождества остаются простыми тождествами, чисто математическими соотношениями. «Раздельный» пространственный и временной 110
характер указанных четырех соотношений делает их чисто математическими, когда речь идет о «слитных» четырехмерных инвариантах — в данном случае о кривизне. Иное дело тензор энергии-импульса. Здесь «раздельные» свойства пространства и времени (однородность того и другого), выражающиеся в четырех соотношениях, имеют физический смысл, являются физическими законами. Однородность пространства выражается тремя скалярными уравнениями сохранения компонент импульса. Однородность времени выражается уравнением сохранения энергии. Четыре уравнения сохранения вытекают, таким образом, из теории тяготения. Почему основные законы, объединяющие не только явления тяжести, но все физические явления — механические, электромагнитные и внутриядерные, выводятся из тяготения? Напомним здесь, что тяготение в общей теории относительности — это очень широкое понятие, включающее и инерцию. Закон тяготения, связывающий R^cT^, представляет собой общую характеристику связи между всеми сосредоточиями вещества и полями (как бы ни относились друг к другу те и другие), с одной стороны, и свойствами окружающего пространства и времени — с другой. Из этого закона выводятся законы поведения сосредоточий масс во времени и в пространстве, в первую очередь закон сохранения импульса, связанный с однородностью пространства, и закон сохранения энергии, связанный с однородностью времени. Общая теория относительности рассматривает законы сохранения как четыре (по числу измерений пространства-времени) аспекта единой, абсолютной, инвариантной, четырехмерной кривизны мира. Если сохранение компонент импульса и сохранение энергии — физический эквивалент соотношений между компонентами тензора кривизны, то каков же физический эквивалент самой кривизны как инвариантною свойства четырехмерного мира? Кривизна — основное геометрическое свойство пространственно-временного континуума, делающее его физическим континуумом, лежащее в основе физической геометрии. Физический эквивалент кривизны—основное физическое свойство вещества, выражающее искривляющую пространство-время функцию вещества. Это — действие, энергия, помноженная на время. Действие — мера основного четырехмерного ill
свойства вещества. Оно так же относится к четырехмерному миру, как энергия — к трехмерному пространству К Если нарисовать картину усредненного непрерывного распределения «материи» в пространстве, то основной локальной величиной будет плотность массы, а основной величиной, характеризующей конечные области,— масса или энергия, представляющая собой плотность энергии, умноженную на пространственный трехмерный объем. Если же характеризовать распределение и поведение вещества в четырехмерном мире, то основной величиной будет произведение плотности энергии на четырехмерный объем — действие. Когда теорию относительности рассматривают как четырехмерную физическую картину мира, то на первый план выступает действие — физический эквивалент кривизны пространства-времени. Этот аспект имеет первостепенное значение и для истории теории относительности. Генезис и развитие понятия действия и вариационных принципов в классической физике и их роль в теории относительности показывают корни последней, соединяющие ее с физикой XIX в. Эддингтон прав, когда говорит, что действие и энтропия — единственные классические понятия, сохранившиеся в релятивистской физике 2. Теперь вернемся к уравнениям гравитационного поля, к уравнениям, соответствующим уравнению Лапласа старой теории тяготения. Иными словами, перед нами лишенное «материи» пространство, где /?^ = 0. Отказавшись от статистической континуализации, мы видим отдельные центры кривизны-тяготения. При любом распределении «материи» такое уравнение позволяет определить «рельеф» мира. Будем для упрощения рассматривать мир с двумя 1 См. А. Эддингтон. Пространство, время и тяготение. Одесса, 1923, стр. 148—149. 2 «Теория относительности бросала свою тень вперед уже при своем приближении, и физические знания уже тогда имели тенденцию объединяться около двух великих обобщений,— принципа наименьшего действия и второго закона термодинамики, или принципа максимума энтропии» (А. Эддингтон. Пространство, время и тяготение, стр. 149). Дело, однако, не в «тени», т. е. влиянии еще не сформулированной, но уже подготавливаемой теории на старые знания —такая тень нависла над классической физикой только во второй половине XIX в. — а в логических и исторических классических корнях самой теории относительности. 112
пространственными измерениями. Предположим, что речь идет о картине, примером которой служат плоские планетные орбиты, т. е. о гравитационном поле центрального тела, вокруг которого движутся планеты по круговым орбитам, расположенным в одной плоскости. В этой же плоскости проходят лучи света звезд. Центральное тело мы рассматриваем как одну частицу, создающую гравитационное поле. Массу такой частицы обозначим через т. В рассматриваемой плоскости введем полярные координаты ги*. Время обозначим третьей координатой f. Введем еще величину. г Тогда квадрат интервала ds будет задан выражением: ds2 = — 4 dr* — r*d^2 + * dt\ Эта формула относится к пустому пространству в окрестностях материальной частицы, создающей гравитационное поле, т. е. искривляющей мир. Напомним, что в этом пустом пространстве /?^=0; но оно обладает кривизной, так как /?£vp ф 0. Какие события произойдут по мере приближения к началу координат? Будем брать значения dr на одном и том же радиусе в одно и то же время. Значит db =0, и время не меняется, т. е. dt=0. Поэтому два последних члена в выражении для ds2 исчезают и интервал ds удовлетворяет уравнению: откуда dr2 = \ds2. Когда расстояние до начала координат становится равным 2т и>ч =0, dr также обращается в нуль, т. е. координата г не может дальше уменьшиться; к началу координат нельзя приблизиться на расстояние, меньшее, чем 2т. Можно представить себе, что 2т — радиус частицы, что здесь кончается пустое пространство, где g = 0, и начинается область, заполненная веществом, область более высокой кривизны. Таким образом; «пригорок» четырехмерного мира включает особую область кривизны еще более высокого ранга. 113
Теперь мы можем дать некоторое физическое истолкование величине X. Она отличается от единицы на 2m/r. Массу т мы выражаем в единицах длины. Если гравитационная постоянная принимается за единицу и орбита — круговая, то где v — скорость движения по орбите. Зная v иг, мы можем вычислить т, например, т Солнца по v и г Земли 1. Земля движется по орбите со скоростью 0,0001 (в единицах скорости света с=1). Радиус земной орбиты г около 1,5- 108 км. Подставляя эти значения, мы получаем для Солнца: т = (0,0001)2 * 1,5- 108 = 1,5 км (точнее 1,47 км). Соответствующий расчет для Земли дает 5 мм. Значит, гравитационному полю Солнца соответствует такой «пригорок» четырехмерного мира, в центре которого расположена область кривизны более высокой степени. Диаметр этой области — 3 км (2т = 2-1,5 км). Гравитационному полю Земли соответствует искривление первой степени с центральной областью искривления второй степени, диаметром в 10 мм. При помощи подобных величин т и X можно перейти к представлению о полях тяготения как 1) об областях кривизны второй степени (R^^O) и соответствующих по величине массам, создающим гравитационные поля, и 2) окружающих их пустых пространствах с кривизной первой степени R^ = 0. В плоском пространстве X = 1, в искривленном т=£0 Х=£1. Отклонения X от единицы очень малы, так же как малы по сравнению с г величины т тел, встречающиеся в известной нам части Вселенной. Мы видели их значения: 1,5 км для Солнца и 5 мм лля Земли. Эти отклонения обусловливают кривизну орбит небесных тел и вообще все гравитационные ускорения во Вселенной. В формулу ds2 = — -~ dr2 — г2 db2 + \dt2 коэффициент X, отличающийся в общем случае от единицы, входит два раза. Основное значение он имеет в качестве коэффициента при Л2, так как здесь он умножается на очень большую величину. Если интервал ds лежит 1 См. А. Эддингтон. Пространство, время и тяготение, стр. 204. 114
между событиями, отстоящими друг от друга во времени на одну секунду, то dt равно секунде, а при умножении на с — 300 000 км. Квадрат этой величины равен 9 • 1010 км2. В качестве коэффициента при dr2 X имеет меньшее значение, так как при обычных скоростях планет в эту секунду планета пройдет не больше 50 км1, т. е. dr2 = 502 км2 = = 2500 км2. Очевидно, количественное различие между dt2 и dr2 зависит от огромной величины скорости света, выраженной в обычных для нас единицах. Может быть, правильнее было бы сказать, что огромная величина скорости света в обычных единицах зависит от того, что обычные средства наблюдения легко регистрируют влияние кривизны мира на dt2 и гораздо труднее заметить влияние коэффициента X на dr2. Если не учитывать это последнее, т. е. пренебречь коэффициентом X (его отклонением от единицы) при dr2, то получим формулу: ds2 = — dr2 — r2d&2 + \dt2. В пространственно-временном мире, определенном этой формулой, частицы движутся так, как будто на них действует сила притяжения, направленная к началу координат. Можно показать, что при сделанном только что небольшом упрощении формулы для ds2, из нее можно получить закон тяготения Ньютона. Это имеет первостепенное значение. Ведь формула для ds2 вытекает из предположения, что кривизна пространства вблизи материальных масс определяется уравнениями R^v = 0. Изменив выражение для ds2 на незначительную величину, мы приходим к закону Ньютона, оправдывающемуся с такой точностью, как никакой другой закон, подтвержденному подавляющим количеством астрономических наблюдений, экспериментов и практических применений. Если выражение для ds2, а следовательно, уравнения /?p.v=0, дают нам приближенно (игнорируя отклонение А от единицы при умножении на малую величину dr2) закон тяготения Ньютона, значит уравнения /?^=0 приближенно описывают .положение вещей в областях, близких 1 См. А. Эддингтон. Пространство, время и тяготение, стр. 100. 115
к массам, как Оно рисуется ньютоновой теорией тяготения. Остается решить, какая же формула дает точное описание и какая — приближенное. Если уравнения R^ = О дают точное описание, а ньютонова теория — приближенное, то можно найти при помощи астрономических наблюдений некоторые незначительные отклонения от ньютоновой теории и объяснить их той небольшой величиной, которой мы пренебрегли, упрощая выражение для ds2. Сосредоточим внимание на этой величине. Ньютонов закон тяготения объясняется искривлением мира, выражающемся отступлением X от единицы, когда X служит коэффициентом при dt2. Оставим в стороне такое искривление и будем рассматривать искривление только пространства. Изменим знак ds2 в той же формуле и отбросим член Xd/2, содержащий время. Получаем: ds2 = ydr2 + r2d£2. В полярных координатах в эвклидовой геометрии: rfs2 = dr* + rW. Наличие коэффициента Х-1, в общем случае .не равного единице, показывает, что пространство (не только пространство-время, но и само пространство) подчиняется неэвклидовой геометрии. Иными словами, к «ньютонову» искривлению (искривлению, выражающемуся коэффициентом X при dt и объясняющему ньютонов закон тяготения) присоединяется гораздо меньшее по величине чисто пространственное искривление, выраженное коэффициентом X"1 при dr2. Можно ли обнаружить это дополнительное искривление? Из сказанного ясно, что если это и может быть сделано, то только очень тонкими наблюдениями и экспериментами, улавливающими явления, зависящие от величин, в знаменатель которых входит квадрат скорости света. Доказательством точности новой теории тяготения и приближенного характера ньютонова закона было наблюдение отклонения света в гравитационном поле Солнца. Теоретическое доказательство и обнаружение гравитаци- одной массы у света — необходимая предпосылка общей теории относительности. Гравитационное поле может быть представлено как искривление пространства и времени 116
только потому, что оно одинаковым образом влияет на все физические объекты независимо от констант, характеризующих эти объекты. Все физические прообразы прямой — все прямые мировые линии, соответствующие движению частицы по инерции (независимо от массы частицы) и распространению каждой точки фронта световой волны,— испытывают одно и то же воздействие, и именно поэтому такое воздействие можно представить как искривление пространства-времени. Если бы тяготение не действовало на свет, оно бы не могло быть представлено как изменение геометрических свойств пространства- времени; тогда и принцип эквивалентности потерял бы силу: в ящике, испытывающем ускорение, свет менял бы направление, а в покоящемся ящике, в котором действует поле тяготения, направление света не менялось бы, и это доказало бы абсолютный характер его покоя. Количественную характеристику искривления световых лучей в поле тяготения легко вывести из выражения для ds2, в свою очередь вытекающего из формулы R^ v= Напомним, что мировые линии точек фронта световой волны — это линии, отделяющие временноподобные интервалы (ds2 — положительная, т. е. ds — вещественная величина) от пространственноподобных (^ — отрицательная, т. е. ds— мнимая величина). Вдоль мировых линий света ds2 равен нулю, и мы можем определить величины, характеризующие искривление световых лучей, приравняв нулю выражение для ds2: ds2 = - 4"^2 - r2d*2 + id? = °- л В случае, если световой луч направлен к началу координат (к сосредоточенной вокруг центра гравитационной массе т), изменение угла $ равно нулю, d&=0, и тогда из написанного уравнения мы можем получить: Если же свет движется в поперечном направлении, то не меняется расстояние г, т. е. dr = 0, и тогда мы получим: Значит, скорость света в примененной здесь полярной системе координат равна . X— в радиальном и |А — в попе- 117
речном направлении. Иначе говоря, она уже не постоянна, как это первоначально принималось, а меньше единицы в той мере, в какой X отличается от единицы, т. е. в зависимости от гравитационной массы т, вблизи которой проходит луч, и расстояния г, на котором он проходит мимо этой массы. Замедление распространения света вблизи гравитационной массы вызывает искривление светового луча, так как конец волны, проходящий ближе к гравитационной массе, задерживается, и волна изменяет направление, волновой фронт несколько поворачивается. Отклонение это было вычислено, и для луча, проходящего возле поверхности Солнца, составило 1,75", если принимать во внимание искривление не только времени, но и пространства, т. е. закон тяготения Эйнштейна. Если же принимать во внимание только основную часть искривления— закон Ньютона, то получается вдвое меньшее отклонение — 0,87 ". Таким образом были найдены величины, допускавшие проверку, которая означает проверку общей теории относительности в целом. Такая проверка соответствует измерению суммы углов сферического треугольника, предпринятому плоскими обитателями поверхности сферы. Отклонение света в поле тяготения Солнца свидетельствует о неэвклидовом характере мира, т. е. о правильности общей теории относительности. Если величина отклонения луча у самой поверхности Солнца достигает величины, близкой к 1,75", то можно сказать: закон тяготения Эйнштейна дает более точное описание действительности, а закон Ньютона — приближенное (достаточное для подавляющего большинства явлений). Такая проверка была произведена 29 мая 1919 г. Руководил ею Эддингтон. Живой, рассчитанный на широкие круги читателей, рассказ об астрономических экспедициях 1919 г. дан Эддингтоном в книге «Пространство время и тяготение» в главе «Взвешивание света». По существу, речь шла именно о взвешивании светового луча. Точка фронта световой волны, проходя вдоль поверхности Земли, падает на 5 м (закон Ньютона) или на 10 м (закон Эйнштейна) в секунду, подобно тому как горизонтально выпущенный снаряд благодаря своей тяжести через секунду окажется несколько ниже горизонтальной линии. Но свет проходит 300 000 км в секунду, поэтому на
искривление его пути на Землю не может быть обнаружено самыми точными измерениями. Вблизи поверхности Солнца тяготение в 27 раз больше и искривление луча достигает, как мы видели, величины порядка секунды, улавливаемой астрономическими наблюдениями. Схема (фиг. 10), заимствованная из книги Эддингто- на, показывает, что астроном на Земле (точка Е) увидит звезду Р смещенной в точку Р', так как луч этой звезды £ F р' ' ^^Zrzz:^p Фиг. 10 PQFE заметным образом изменил направление вблизи поверхности Солнца S — на участке QF — и дошел до астронома, имея направление FE. В этом направлении и будет видна звезда. Звезды, видимые близ солнечного диска, т. е. звезды, лучи которых проходят вблизи Солнца, можно наблюдать лишь во время солнечного затмения. Как раз во время затмения 29 мая 1919 г. солнечный диск должен был пройти через группу очень ярких звезд, и Эддингтон еще в начале 1917 г. обратил внимание английских астрономов на это обстоятельство. Сам он два года спустя, после длительной подготовки экспедиций, отправился на остров Принца в Гвинейском заливе, а другая экспедиция выехала в Собраль в Северную Бразилию, где также проходила линия полного солнечного затмения. На острове Принца, несмотря на облачную погоду, удалось сделать с помощью телескопа 16 снимков с экспозицией от 2 до 20 сек. На одном из снимков были отчетливо видны изображения пяти звезд вблизи Солнца. Пластинка была положена на другую, на которой был сфотографирован тот же участок неба, но в отсутствие Солнца. Сдвиги изображений измерили микрометрической машиной. Экспедиция в Собрале, фотографировавшая затмение с помощью двух телескопов под безоблачным небом Бразилии, получила большое число снимков. Результаты, полученные на одном из телескопов, отличались от результатов наблюдений на острове Принца, но 11&
они были взяты под сомнение по ряду обстоятельств, сопровождавших наблюдение (например, нагревание аппаратуры солнечными лучами). Вторая серия бразильских фотографий (с помощью второго телескопа) отличалась большой точностью, и их ожидали с нетерпением, как решающих. Они действительно дали окончательный ответ на один из коренных вопросов науки. Наблюдавшиеся отклонения (з Собрале 1,98" ±0,12", на острове Принца 1,61"±0,30) подтвердили величину, вытекающую из закона Эйнштейна (1,74"), и исключили вдвое меньшую величину, соответствующую закону Ньютона. Результаты астрономических экспедиций 1919 г. вызвали значительный перелом в развитии общей теории относительности. Новый период характеризуется более широким фронтом исследований. Физики в своей основной части примкнули к новой идее, и началась ее быстрая, коллективная разработка. Подтверждением общей теории относительности было не только наблюдавшееся отклонение лучей звезд в поле тяготения Солнца. Новая теория объяснила результаты астрономических наблюдений, производившихся гораздо раньше и ставивших в тупик астрономов в течение многих десятилетий. Речь идет о противоречащих ньютонову закону тяготения особенностях движения Меркурия. Такого рода отклонения крайне незначительны. При исследовании поведения световых лучей трудность зависит от большой скорости света по сравнению с «обычными» скоростями. Угол отклонения лучей в поле тяготения Солнца мал потому, что падение света на Солнце в течение секунды на несколько метров мало по сравнению с пройденным в течение секунды расстоянием в 300 000 км. Наоборот, отклонения планет от движения, предуказанного законом Ньютона, малы потому, что малы их скорости по сравнению со скоростью света. И в том и в другом случае наблюдения должны как-то перешагнуть порог, отделяющий мир медленных движений от мира быстрых движений. В части планетных движений отсутствие современных точных приборов компенсировалось в XVIII— XIX вв. накоплением отклонений при их повторении в течение десятилетий. Так были открыты отклонения движения Меркурия от эллиптической орбиты» 120
Ньютонов закон тяготения обязывает планету двигаться строго по эллипсу. Закон Эйнштейна предопределяет небольшое отклонение: эллипс не смыкается, или, что то же самое, он ежегодно поворачивается в направлении движения планеты. Величина ежегодного поворота, если принять полный поворот перигелия орбиты за единицу, измеряется дробью Ъь21с2, где v — скорость движения планеты, ас — скорость света. Для Меркурия, планеты с выраженным эксцентриситетом орбиты, позволяющим точно определить положение перигелия, и со сравнительно большой скоростью движения, указанная дробь соответствует повороту перигелия на 43" в течение ста лет. Наблюдавшийся поворот орбиты Меркурия составляет 574" в столетие, из них 532" объясняются возмущающим действием других планет. Остаток — поворот на 42" с большой точностью объясняет теория Эйнштейна. Есть еще один путь исследования неэвклидовых свойств пространства и проверки законов тяготения Ньютона и Эйнштейна — прямой путь измерения интервала ds. Этот путь состоит в сравнении периодов колебаний, дающих определенную линию спектра, в различных гравитационных полях. В четырехмерном мире начало и конец колебания (т. е. два последовательных состояния атома, характеризующихся одинаковой фазой) представляют собой две мировые точки. Их разделяет интервал ds, квадрат которого, как мы знаем, в полярных координатах имеет вид: ds2 = --~dr2 — r2db2+\dt2. Пусть в течение одного колебания атом покоился в избранной нами системе координат. Тогда dr—изменение расстояния от начала координат и rd&—движение по окружности — равны нулю. Следовательно: ds* = \dt2. Представим себе теперь два атома, испускающие свет одной и той же частоты, соответствующей одной и той же спектральной линии, т. е. испытывающих одни и те же колебания. Один атом находится на Солнце, другой на Земле. Интервал ds, соответствующий колебаниям атомов, очевидно, один и тот же. Время колебания dt разное в зависимости от значения ^ ъ е» от гравитационного по- 121
ля, в одном случае (на Солнце) несколько больше, чем во втором (на Земле): «*-•£. или dt = US 77=^ • К X Напомним, что х— 1—2=-. г Откуда приближенно: Написанная величина (т. е. множитель, которым dt отличается от ds) на Солнце равна 1,00 000 212, а на Земле ее можно практически считать равной единице. Таким образом, по сравнению с лабораторией на Земле гравитационное поле на поверхности Солнца увеличит период колебаний атома. Соответственно удлинится волна испускаемого света. Спектральные линии солнечного света по сравнению с земными источниками будут сдвинуты в сторону более длинных волн, т. е. к красному концу спектра. Спектроскопические наблюдения, в общем, подтвердили предположение о таком гравитационном «красном смещении». Для звезд с более высокой плотностью вещества, чем Солнце, еще легче заметить гравитационное смещение спектральных линий. Например, для спутника Сириуса, принадлежащего к числу так называемых «белых карликов», смещение в тридцать раз больше, чем для Солнца. В этом случае наблюдения также подтвердили расчеты общей теории относительности. 8. Мир как целое Через год после появления «Основ общей теории относительности» Эйнштейн выступил со статьей «Вопросы космологии и общая теория относительности» *. В ней рассматривается Вселенная в целом. Это выражение нельзя понимать буквально. Речь идет о пространстве, в котором 1 Русск. пер. см. сПриндип относительности», стр. 316—330. 122
пренебрежимо малы расстояния между галактиками. В теории поля иногда рассматривают условия в точках, настолько удаленных от рассматриваемой системы, что ее поле можно считать равным нулю. Условия эти называются «условиями на бесконечности». Если изучать «условия на бесконечности» при удалении- от известных нам галактик, то область, на границах которой существуют эти условия, может быть названа «Вселенной в целом». В классической физике попытки описать условия на бесконечности, т. е. рассматривать мир как целое, приводили к противоречиям. Если применить ньютонову теорию тяготения к бесконечному миру как целому, то силы, действующие на каждое тело, представятся бесконечными. В самом деле, гравитационный потенциал <? зависит от плотности (х масс: где х— гравитационная постоянная, dV— элемент объема, в котором сосредоточена масса с плотностью ц, а г — расстояние от этого объема до данной точки. Пусть масса распределена во всем бесконечном мировом пространстве. Для определения средней плотности масс в этом пространстве, рассматриваемом в целом, нужно взять такие области, по сравнению с которыми межгалактические расстояния малы. Если такая средняя плотность нцгде не обращается в нуль, то выражение гравитационного потенциала равно бесконечности. Если же гравитационный потенциал и соответственно силы, действующие на материю, бесконечны, то известные нам конечные силы не будут действовать на тела. В бесконечной Вселенной, заполненной материей со средней ненулевой плотностью, действуют бесконечные сиды. Ньютонов гравитационный потенциал будет иметь конечное значение, если материя мира представляет собой составленный из галактик остров в бесконечном пустом пространстве, или если плотность масс убывает и стремится к нулю быстрее, чем 1/г2. В этом последнем случае общая масса материи мира может быть бесконечной. Потенциал тогда будет конечным и в бесконечности обратится в нуль. Но такое предположение, законное с точки зрения классической теории тяготения, противоречит классической статистической теории. Бесконечное число небесных тел в мировом пространстве следует 123
рассматривать как космический газ. Из кинетической теории газов следует, что остров космического газа, окруженный бесконечной пустотой, давно бы «испарился». Излучаемая материя и даже целые небесные тела ушли бы из заполненного материей острова в окружающий океан пустого пространства. Нейман 1 устраняет эту трудность гравитационной теории Ньютона, добавив в уравнение Пуассона для потенциала тяготения некоторый дополнительный космологический член. Тогда можно представить себе, что бесконечное мировое пространство равномерно заполнено материей и вместе с тем потенциалы тяготения не принимают бесконечных значений. Соответственно и Эйнштейн в 1917 г. в своей первой космологической работе ввел в уравнения гравитационного поля дополнительный космологический член. Статья «Вопросы космологии и общая теория относительности» начинается анализом указанных трудностей теории Ньютона. Она не приводит к противоречию, если средняя плотность стремится к нулю быстрее, чем 1/г2. Тогда гравитационные потенциалы не становятся бесконечными. «Хорошо известно,— пишет Эйнштейн,— что граничное условие Ньютона о существовании постоянного предела для ср в пространственной бесконечности ведет к представлению, что плотность материи в бесконечности делается равной нулю. В самом деле, представим себе, что во Вселенной можно найти место, вокруг которого поле тяготения материи, рассматриваемое в целом, обладает шаровой симметрией (центр). Тогда из уравнения Пуассона следует, что средняя плотность р с увеличением расстояния г от центра должна стремиться к нулю быстрее, чем 1/г2, для того чтобы ср в бесконечности стремилось к некоторому пределу. В этом смысле мир по Ньютону конечен, хотя и может обладать бесконечно большой общей массой» 2. Далее идут указанные выше статистические соображения о невозможности устойчивой «островной» Вселенной. Эйнштейн рассматривает некоторые предположения, позволяющие на первый взгляд спасти картину ньютонова конечного мира. Они не могут изменить фатального вы- 1 С. Neumann. Uber das Newtonische Prinzip der Fernwir- kunpr. Leipzig, 1896. a «Принцип относительности», стр.. 316.. 124
вода: если потенциал на бесконечности равен конечному числу и конечна разность потенциалов между рассматриваемым центром тяготения и бесконечно удаленной периферией, то и плотность материи на периферии не может бесконечно отличаться от плотности материи в центре. Если плотность материи на бесконечности равна нулю, то она равна нулю и в пределах «острова». «Если применить больцманов закон распределения газовых молекул к звездам, сравнивая звездную систему с газом, находящимся в стационарном тепловом движении, то придется заключить, что ньютонова звездная система вообще не может существовать. Ибо конечной разности потенциалов между центром и пространственной бесконечностью соответствует конечное соотношение плотностей. Следовательно, нулевая плотность в бесконечности влечет за собой нулевую плотность в центре» *. Нейман нашел выход в изменении теории Ньютона, выход, который, по словам Эйнштейна «сам по себе не требует, чтобы его рассматривали всерьез, но служит только для того, чтобы лучше уяснить изложенное в дальнейшем» 2. По Нейману, потенциал тяготения всегда меньше величины, определяемой уравнением Пуассона. Вместо уравнения Пуассона Нейман пишет: у2? — Хср = 4тгхр, где X —универсальная константа — «космологический член». Это уравнение при р = Ро — плотности равномерно распределенной в пространстве материи неподвижных звезд — имеет решение: Если Ро—средняя плотность материи, равномерно распределенной в бесконечном пространстве, то это решение не дает бесконечных значений <р, не заставляет ограничивать Вселенную, допускает постоянство среднего потенциала и средней плотности в бесконечной Вселенной и не приводит к конфликту между теорией тяготения и статистической физикой. Аналогичным образом Эйнштейн модифицирует уравнения гравитационного поля общей теории относитель- 1 «Принцип относительности», стр. 317. 2 Там же, стр. 318. 125
нести. Он вводит в эти уравнения космологический член XgiiV> и они приобретают вид: где X — «космологическая постоянная». Казалось бы, введение космологического члена позволяет говорить о бесконечном мире и не вводить островную материальную Вселенную, окруженную бесконечным пустым океаном. Это так и есть, но теперь ограниченность размеров Вселенной входит в картину мира в ином смысле. Само пространство представляется конечным. Не «остров» ограничен «береговой линией» от безбрежного океана, а сам океан имеет конечные размеры, несмотря на отсутствие ограничивающих его берегов. Можно ли это представить себе наглядно? Если речь идет о двухмерном пространстве, то ограниченность размеров при отсутствии границ может быть представлена очень просто. Поверхность сферы нигде не имеет «берегов», границ, и тем не менее ее площадь ограничена. Мы можем представить себе (разумеется не столь наглядно) кривизну трехмерного пространства, некоторую трехмерную сферическую поверхность, ограниченную по своей трехмерной «площади», т. е. по своему объему. Речь идет не о кривизне четырехмерного мира в окрестностях тяжелых масс, а об исконной кривизне трехмерного пространства в целом. В статье 1917 г. Эйнштейн пришел именно к такому представлению. Если рассматривать ограниченное по размерам пространство Эйнштейна в четырехмерном пространственно-временном мире, то получаются три измерения с постоянной кривизной и одно измерение (время) не- искривленное. Это напоминает поверхность цилиндра: одно измерение искривлено и в этом смысле конечно, другое измерение неискривлено и бесконечно. Отправившись в путешествие по поверхности цилиндра вокруг его оси, мы вернемся к исходному пункту пути. Путешествие по поверхности цилиндра по образующей, т. е. параллельно оси, не ограничено и может продолжаться бесконечно без возвращения. Мир Эйнштейна, искривленный и ограниченный в пространстве и неискривленный во времени, называется поэтому цилиндрическим миром. Статья Эйнштейна «Вопросы космологии и общая теория относительности» сейчас, в исторической перспективе, 126
Представляется началом сравнительно длительной и крайне напряженной деятельности ряда ученых, получившей некоторое завершение лишь в 1922—1923 гг. Космологический член в уравнениях гравитационного поля представляется произвольным усложнением теории. Он был введен ad hoc, без каких-либо эмпирических оснований, выросших из астрономических наблюдений, не вытекая при этом из убедительных и общих теоретических соображений. Без него нельзя было ввести конечную среднюю плотность вещества во Вселенной. В 1922 г. А. А. Фридман * высказал мысль, выведшую релятивистскую космологию из пятилетнего кризиса. Эйнштейн сначала не согласился с идеей Фридмана, но вскоре присоединился к ней, отказавшись от идеи замкнутой статической Вселенной2. Идея Фридмана состоит в следующем. В статье «Вопросы космологии и общая теория относительности» Эйнштейн рассматривал плотность материи Р как постоянную повсюду ине зависящую от времени. Соответственно метрика не зависит от времени, она однородна и изотропна в отношении пространственных координат при надлежащем их выборе. Нужно выбрать систему координат, в которой в среднем скорости звезд равны нулю. Тогда мы получаем большое облако звездного газа, частицы которого — звезды — можно считать неподвижными. В такой системе координат средняя плотность звездного вещества постоянна, метрика изотропна и однородна и не зависит от времени. Время в этой системе как бы остановилось, оно не влияет на свойства пространства, движение в этой системе можно не принимать во внимание. Фридман предположил, что метрика Вселенной зависит от времени, т. е. геометрическая структура пространства в целом меняется с течением времени. При таком изменении метрики мира, зависящем от времени, можно получить из уравнений гравитационного поля конечное значение плотности во всем пространстве, не изменяя этих уравнений, т. е. без дополнительного космологического члена. * Zeitschr. f. Phys., 10, 377 (1922). 2 Zeitschr. f. Phys., 11, 326 (1923), 16, 228 (1923), а также «Сущность теории относительности», М., ИЛ, 1955, стр. 98—117. 127
Работа Фридмана вызвала многочисленные отклики. Появились новые концепции, развивавшие его идеи. Характерной чертой начавшегося в 1922 г. нового периода релятивистской космогонии — периода нестатических моделей Вселенной — были астрономические открытия, по- видимому подтвердившие идею нестационарности мира в целом 1. В 1925—1929 гг. Слайфер и Хэббл обнаружили смещение к красному концу спектральных линий внегалактических туманностей. Такое смещение тем больше, чем дальше от нас туманность. Очевидно, такое фундаментальное и общее свойство спектров выявляет фундаментальную и общую закономерность в состоянии Вселенной. Смещение спектральных линий можно объяснить как явление Допплера. Напомним об элементарном акустическом эффекте, хорошо известном машинистам: свисток паровоза кажется выше по тону, когда паровоз приближается, и ниже — когда он удаляется. Это объясняется тем, что в первом случае большее число воздушных волн пройдет в секунду через ухо, а во втором случае — меньшее. Аналогичным образом волны света оказываются короче в точке, движущейся к источнику света, и длиннее, когда расстояние между точкой и источником возрастает. Этот эффект, найденный Допплером, имеет место и в отношении света внегалактических туманностей. Если линии сдвигаются к красному концу, т. е. волны становятся длиннее, значит внегалактические туманности удаляются от нас, чем дальше, тем быстрее, Вселенная «разбегается». Хэббл вывел формулу скорости удаления внегалактических туманностей. Оказалось, что на каждые 3,259 млн. световых лет скорость увеличивается на 560 км/сек. Затем были получены количественные соотношения, позволяющие определить кривизну пространства в зависимости от скорости разбегания и плотности вещества. Обозначив через R радиус кривизны, через у константу скорости удаления туманностей, через *• гравитационную постоян- 1 Обзор теоретических работ и астрономических открытий в области релятивистской космологии, а также библиографические сведения см. в работе Эври Шацмана «Критический обзор космогонических теории, распространенных в Западной Европе и в Америке», ч. 2 («Вопросы космогонии», ч. IV, М., 1955, стр. 197—274). 128
ную, через р плотность вещества, получаем уравнение: 1 « . 8тгх Ж^-^ + игР- Из этого уравнения следует, что при р > 6 • 10-28 г/см3 обе части уравнения больше нуля; следовательно, пространство обладает положительной кривизной. При меньших значениях р получается отрицательная кривизна. Таким образом, от точности спектроскопических наблюдений зависит ответ на вопрос об основном свойстве мира как целого. Что же означает та или иная гипотеза д^я картины мира? Какие выводы следуют из наделения пространства той или иной кривизной? Мы исходим из мысли об однородности и изотропности пространства. Совокупность известных нам фактов вовсе не предопределяет такую точку зрения. Проследить, куда может привести мысль об изотропности и однородности пространства,— это значит только проиллюстрировать характер проблемы мира как целого. В современной науке проблема эта далека не только от решения, но и от каких- либо бесспорных исходных положений. Уже можно не сомневаться в близости нового берега, уже можно догадываться о его очертаниях и наиболее рациональных направлениях подхода, но сам берег еще не виден. Пока нет возможности на основе наблюдений и экспериментов произвести выбор между различными гипотезами о структуре мира, остается проследить выводы хотя бы одной из них. Наиболее простой представляется мысль об однородности и изотропности пространства в целом. Однородность и изотропность пространства означает, что можно выбрать единое для Вселенной время, в каждый момент которого метрика пространства повсюду и во всех направлениях одна и та же, что соответствует постоянной положительной, отрицательной или нулевой кривизне. Переводя все эти предположения на язык геометрии, можно сказать: если пространство в целом обладает постоянной кривизной, т. е. является пространством Римана в широком смысле, то оно может быть либо пространством Римана в узком смысле (постоянная положительная кривизна), либо пространством Лобачевского (постоянная 129
отрицательная кривизна), либо пространством Эвклида (нулевая кривизна). Пространство положительной постоянной кривизны на* зьгвают сферическим. Обычная сфера в обычном трехмерном пространстве дает основу для наглядного представления двухмерного риманова пространства, так как поверхность сферы — это риманова двухмерная поверхность. Чтобы воспользоваться подобной аналогией для риманова трехмерного пространства, нужно ввести фиктивное четырехмерное пространство и в нем трехмерную сферу — изотропную гиперповерхность. Геометрия на этой гиперповерхности будет соответствовать метрическим соотношениям изотропного пространства постоянной положительной кривизны. Уделим несколько строк этой геометрии. В четырехмерном пространстве уравнение гиперсферы таково: х\ + х\ + х\ + х\ = д2; а — радиус гиперсферы, который соответствует радиусу кривизны рассматриваемого нами изотропного пространства. Изучая метрические соотношения на поверхности сферы, мы убедимся, что отношение длины окружности, проведенной на этой поверхности, к радиусу окружности меньше 2^. На очень маленькой площадке разница неощутима, а при увеличении окружности ее отношение к радиусу все больше будет отличаться от 2*. Возьмем любую точку поверхности нашей сферы и будем описывать окружности, все увеличивая радиус. Длина окружности будет расти, но не пропорционально радиусу; отношение окружности к радиусу будет все время уменьшаться; окружность будет расти все медленнее и, когда радиус станет равным тга/2, окружность достигнет наивысшего значения 2ка и при дальнейшем увеличении радиуса начнет уменьшаться. Когда же радиус дойдет до противоположного полюса, т. е. станет равным ка, окружность сожмется в точку. Разумеется, ка — наибольшее расстояние, вообще возможное на сфере. Теперь перейдем к непредставимой столь наглядно трехмерной сферической гиперповерхности радиуса а в фиктивном четырехмерном пространстве. В таком трехмерном пространстве (римановом пространстве в узком 130
смысле) пространственная метрика будет аналогична только что рассмотренному случаю. Геометрия на двухмерной сферической поверхности с увеличивающимися окружностями уступает место геометрии трехмерного ри- манова пространства со все большими сферами. Поверхности этих сфер, аналогично ранее рассмотренным длинам окружностей, не пропорциональны радиусам: сначала они растут, при радиусе ка/2 достигают максимального значения 4ка2 и при наибольшем радиусе (наибольшем расстоянии в таком пространстве) ъа обращаются в точку. Объем такого пространства постоянной положительной кривизны конечен. Он равен: Конечность трехмерного пространства при отсутствии границ также допускает аналогию с двухмерной сферической поверхностью. Можно было бы и здесь апеллировать к гельмгольцевым плоским обитателям сферической поверхности. Но аналогия с обычной сферой, которая помогла уяснить формальные геометрические соотношения, может только повредить, когда речь идет о физическом смысле этих соотношений. Радиус трехмерной римановой сферы соответствует радиусу окружности на двухмерной сферической поверхности, поверхность римановой сферы соответствует длине окружности, конечный объем римановой сферы аналогичен конечной площади обычной сферической поверхности. Но мы рассматривали поверхность обычной сферы в трехмерном пространстве, имеющем несомненный физический смысл. Что же касается риманова (в узком смысле) пространства с постоянным радиусом кривизны а, то его можно представить в виде сферы в фиктивном четырехмерном пространстве, заведомо не имеющем никакого физического смысла, подлежащем устранению при физической интерпретации геометрических соотношений. В общей теории относительности, как и в специальной теории, физическим эквивалентом четырехмерной геометрии является пространственно-временной мир событий. Он находит свое выражение в четырехмерной псевдоэвклидовой геометрии в случае специальной теории относительности и в четырехмерной неэвклидовой геометрии в 131
случае общей теории относительности. Здесь же речь идет о пространственных соотношениях. Им может соответствовать и, следовательно, иметь физический смысл лишь трехмерная геометрия — риманова в широком смысле. Фиктивность четырехмерной сферы (или другой фигуры), о которой шла речь, нужно подчеркнуть, чтобы предостеречь от возможных недоразумений. Когда речь идет о положительном радиусе кривизны мира и мы иллюстрируем это понятие образом сферы в фиктивном четырехмерном пространстве, может возникнуть мысль о действительно конечной по объему Вселенной и конечной длине прямой линии в этой Вселенной. Эта мысль действительно высказывалась и, нужно сказать, не только в популярных, но и в специальных работах по общей теории относительности. На самом деле такой вывод произволен. Фридман разъяснил, что из общей теории относительности никоим образом не следует действительная конечность Вселенной К Приведенные выше построения, относящиеся к кривизне мира в целом, говорят о кривизне как образе неэвклидовости мира, выражающейся в его метрике и только в метрике. Но метрика не может решить вопроса о конечности пространства, и Фридман иллюстрирует это следующим простым примером. Возьмем плоскость и поверхность цилиндра. Метрика их одна и та же: развернув лист бумаги, обернутый вокруг цилиндра, мы получим чертеж на плоскости с теми же метрическими соотношениями. Между тем на плоскости нет конечных прямых, а на поверхности цилиндра прямая, начерченная на листе бумаги, может охватить поверхность цилиндра, замкнуться, превратиться в круг и обрести конечные размеры без какого-либо изменения метрических соотношений. Перейдем теперь ко второй гипотезе: пространство обладает постоянной отрицательной кривизной. Такое пространство соответствует геометрии Лобачевского и называется гиперболическим. В 1868 г. Бельтрами показал, чго двухмерная геометрия Лобачевского осуществляется на поверхности фигуры типа грамофонной трубы, подобно тому как двухмерная геометрия Римана имеет место на 1 См. А. А. Фридман. Мир как пространство и время. Пг., 1923, стр. 122—124. 132
поверхности сферы. Фигура, изображенная ниже (фиг. 11), называется псевдосферой. Если геодезические линии на поверхности псевдосферы сопоставить с прямыми линиями, то соотношения между этими линиями соответствуют геометрии Лобачевского на плоскости. Возьмем поверхность псевдосферы и, не обращая внимания на ее ориентировку в пространстве, на то, что она изогнута, будем рассматривать независимые от этих изгибов свойства фигур. Изгибание не меняет расстояний на поверхности; эти расстояния мы, следовательно, и будем рассматривать. Независимые от внешней ориентировки геометрические свойства, как нам уже известно, образуют внутреннюю геометрию. Внутренняя геометрия псевдосферы — это геометрия Лобачевского. Теперь представим себе, что метрические свойства трехмерного пространства подчиняются геометрии Лобачевского. Иными словами, в трехмерном пространстве существуют соотношения между размерами, аналогичные соотношениям двухмерных фигур на псевдосфере (например, соотношение между радиусом и поверхностью шара так же отступает от эвклидова соотношения, как в двухмерной геометрии на псевдосфере соотношение между радиусом и длиной окружности). В этом случае (и только в этом смысле!) пространство можно назвать псевдосферическим. По аналогичным соображениям пространство, подчиняющееся геометрии Римана, называется сферическим. Поверхность сферы и поверхность псевдосферы отличаются кривизной: в одном случае она положительна, в другом — отрицательна. Кривизна проявляется в отступлениях метрики от эвклидовых соотношений: только в этом смысле можно говорить о кривизне пространства. Метрику пространства постоянной отрицательной кривизны можно получить, если величина а2, входившая в уравнения, когда кривизна предполагалась положительной, станет отрицательной. Для этого нужно заменить а мнимой величиной ia. Тогда можно представить геометрию пространства Лобачевского аналогичной геометрии на поверхности псевдосферы с мнимым радиусом. А 133
Поверхность псевдосферы в отличие от поверхности сферы растет неограниченно. Аналогичным образом трехмерное пространство отрицательной кривизны бесконечно по объему. Третья гипотеза изотропного пространства — пространство с нулевой кривизной. В нем действуют соотношения, соответствующие эвклидовой геометрии на плоскости. Эвклидова геометрия на плоскости означает, например, что длина окружности равна 2ъг; соответственно в эвклидовом пространстве поверхность шара равна 4кг2. Наличие подобных соотношений и позволяет назвать эвклидов мир плоским. Из трех гипотез, изотропного пространства ни одна не имеет решающих аргументов в свою пользу, аргументов, исключающих две другие гипотезы. Есть соображения, дающие некоторое преимущество идее постоянной отрицательной кривизны. В заключение сделаем одно замечание об эволюционном принципе применительно ко Вселенной в целом. В классической физике идея эволюции энергии — необратимого перехода ее от одного распределения к другому,— примененная к миру как целому, приводила к очень сложным противоречиям и затруднениям. Отвергая идею «тепловой смерти», классическая наука не могла все же наметить для энергии мира как целого перспективу направленной, необратимой и вместе с тем бесконечной эволюции. В развитии современной научной картины мира наметилась тенденция именно к такому представлению. Релятивистская термодинамика сохраняет тезис о монотонном возрастании энтропии замкнутых систем. В замкнутых системах такое возрастание приводит к некоторому наибольшему при данных энергии и импульсе значению. Но применительно к миру в целом представление о состоянии равновесия с наивысшей энтропией не имеет смысла. Энтропия мира возрастает неограниченно Перейдем к поставленному в этой и предыдущей книге 2 общему вопросу о развитии научной картины мира. 1 См. Т о I m a n. Relativity, Thermodynamics and Cosmology. Oxford Univers. Press., 1934. Л Ландау и Е. Лифшиц. Теория поля. М.—Л., 1941, стр. 280—281. 2 «Развитие научной картины мира в физике XVII—XVIII вв.», М.—Л., Изд-во АН СССР, 1955. 134
Физика Галилея (космическая инерция, понятие ускорения и теория падения, представления о строении вещества), картезианская физика, классическая механика и атомистика XVII—XVIII вв. рассматривались как развитие картины бесконечного мира. Речь шла не о космогонических и космологических гипотезах, а об их ф и- зическихосновах, о развитии основ картины мира в физике. Допустимо ли такое толкование термина «картина мира», не является ли оно произвольным, не правильнее ли ограничить понятие «картины мира» космогоническими и космологическими наглядными построениями? Система Коперника как собственно астрономическая теория не была теорией бесконечного мира. Но она включала — или подразумевала — некоторые физические утверждения, она разбивала традиционную противоположность Земли и неба, и уже Джордано Бруно, Кеплер и Галилей, отстаивая и развивая гелиоцентрическую систему, говорили об универсальных физических законах, действующих на любых расстояниях от Солнца. В этом смысле и следует говорить о единой физической картине бесконечного мира. Наглядная кинематика гелиоцентризма рисует солнечную систему; ее физические предпосылки относятся к бесконечной Вселенной. Ньютонова система мира также выходила за рамки конечной Вселенной в своих физических основах. Но здесь она наталкивалась на противоречия: ньютоновы гравитационные потенциалы приобретали на бесконечности бесконечные значения. Вместе с тем к противоречию приходила и вся классическая система мира. Ньютонова теория тяготения еще в одном отношении требовала дополнения. Она, как известно, не давала ответа на вопрос, почему планетные орбиты таковы, какие они есть, а не какие-либо другие. Ответ давали космогонические теории, опиравшиеся на понятие взаимодействия молекул газовой туманности. В переходе от макроскопической физики к физике частиц и состояло превращение феноменологической картины мира в каузальную, физическую. Дело не в кинематической наглядности в смысле возможности представить систему мира рисунком на бумаге. Дело в каузальном истолковании, в объяснении, дочему система мира имеет именно данное, а не иное 135
строение. На этот вопрос и отвечают теории, складывающиеся в единую физическую картину мира. С этим связан вопрос о бесконечности. Бесконечность не может быть представлена наглядным рисунком. Но она входит в картину мира в том смысле, что физическое объяснение включает не приводящие к противоречиям граничные условия на бесконечности. Из исторического анализа развития физики следует, что к физической картине мира нужно предъявить два требования. Теория может быть названа физической картиной мира, если она, во-первых, допускает непротиворечивое представление бесконечной Вселенной и, во-вторых, связывает макромир и микромир единым объяснением. Последнее вовсе не предполагает тождественных закономерностей макро- и микромира, речь идет не о тождестве, а о единстве, непротиворечивости макроскопических законов при переходе к микромиру. Таким образом, единая картина мира — это теория, не приводящая к противоречиям при экстенсивной (условия на бесконечности) и интенсивной инфинизации. Релятивистская космология при неопределенности положительных построений дает принципиальное доказательство непротиворечивости экстенсивной инфинизации теории относительности. Что касается интенсивной инфинизации теории относительности, то здесь построение единой картины мира состоит в развитии релятивистской теории микромира — релятивистской квантовой теории. Исторически теория относительности не сразу нашла дорогу в этом направлении. Эйнштейн и ряд других крупнейших теоретиков хотели обобщить теорию относительности как макроскопическую теорию. Они строили единую теорию, объединяющую поле тяготения с электромагнитным полем. Первой из подобных попыток была теория Германа Вейля К О ней вскользь упоминалось в главе, посвященной кривизне пространства. Там было сказано о геометрии Вейля — более общей, чем геометрия Римана. В об- 1 Она дана в известной книге Вейля «Raum — Zeit — Materie», вышедшей в 1918 г. и содержащей, помимо новой, обобщенной теории, множество собственно математических понятий, при помощи которых излагается теперь теория относительности. 136
щей геометрии Римана вектор, обойдя замкнутый контур, не будет совпадать по направлению с первоначальным; его направление в общем случае изменится, но длина останется без изменения. В геометрии Вейля изменяются и направление и длина вектора. Представим это двумя схемами: верхняя изображает изменение вектора а (превращение его в а') в римановой геометрии, нижняя— в геометрии Вейля (фиг. 12). Изменение длины вектора, изображенное на нижней схеме, зависит от первоначальной длины, от вида замкнутого контура и от свойств пространства. Выделим эту, последнюю, зависимость. Обозначим длину вектора а через а, изменение длины вектора а при параллельном переносе по замкнутой кривой С через Дай относительное изменение длины через Аа а = —. а Если обход контура происходит в двухмерном пространстве, то величина пропорциональна площади S, ограниченной контуром С. Множитель пропорциональности зависит от местонахождения вектора а, меняется в пространстве, и при стягивании контура С в точку его предельное значение характеризует каждую точку пространства. Вейль назвал этот множитель пропорциональности метрической кривизной L двухмерного пространства в точке Р, в начале вектора а L = lim 4-. Аналогичным образом определяется метрическая кривизна трехмерного и четырехмерного пространств. Метрическая кривизна риманова пространства равна нулю, а векторная кривизна (о ней мы уже знаем: предел отношения изменения направления вектора к площади, ограниченной замкнутым контуром) постоянна. В принципе возможно нериманово пространство (с переменной векторной кривизной) с нулевой метрической кривизной. Геометрия Вейля — еще более общая: в ней и метрическая кривизна, вообще говоря, не равна нулю. 137
В геометрии Вейля, кроме метрического тензора g^, определяющего через свои производные векторную кривизну (тензор Римана — Кристоффеля ^^vp), свойства пространства определяются также масштабным вектором. В четырехмерном многообразии для характеристики геометрических свойств точки требуется десять компонент симметричного тензора g^ и четыре компоненты масштабного вектора. Теория относительности Эйнштейна требует, чтобы законы природы выражались уравнениями, кова- риантными при преобразованиях движения. Теория Вейля требует от этих уравнений дополнительной ковариантности — ковариантности относительно масштабных преобразо- / ^*^\с ваний. Существуют собственные С ) свойства мира, независимые от из- менения масштабного вектора,— Фиг. 12 масштабно-инвариантные. Чтобы представить эти свойства уравнениями, в последние нужно наряду с компонентами g^ и их производными ввести дополнительные четыре компоненты масштабного вектора. Вейль предположил, что эти дополнительные компоненты означают электромагнитные потенциалы, подобно тому как guv интерпретируются как гравитационные потенциалы. Тогда картина мира рисуется в виде изменения от точки к точке векторной кривизны (тяготение) и метрической кривизны (означающей электромагнитные поля). Векторная кривизна увеличивается, например, вблизи Солнца — здесь она обнаружится изменением направления вектора при обходе контура. Метрическая кривизна возрастает, например, в луче прожектора или возле мощного генератора и обнаруживается изменением дли- н ы вектора при параллельном переносе по замкнутой кривой *. Чтобы сделать более явственной трудность геометризации электромагнитного поля, следует повторить неко- 1 См. А. А. Фридман. Мир как пространство и время, стр. 115—116. ,<ь 138
торые констатации, относящиеся к геометризации гравитационного поля. Мы рассматриваем закономерности движения материальной частицы. Если эти закономерности можно полностью определить, не ссылаясь на константы, характеризующие саму частицу, и апеллировать только к геометрически представимым свойствам среды, то этим самым закономерности движения частицы принимают вид геометрических закономерностей. На такую возможность геометризации указывает основное свойство гравитационного поля, о котором подробно говорилось в параграфе, посвященном принципу эквивалентности. Основное свойство гравитационного поля — независимость ускорения материальной частицы от массы— выражается уравнением движения частицы в гравитационном поле: В это уравнение входит величина «р— потенциал гравитационного поля, характеризующая это поле и являющаяся функцией пространственных координат и времени, и не входит ни масса, ни какая-либо другая постоянная, характеризующая частицу. Именно поэтому тяготение могло быть представлено в качестве геометрического свойства пространственно-временного мира. От массы частицы не зависит (в линейном приближении) уравнение движения в гравитационном поле. В этом отличие гравитационного поля от электромагнитного. Чтобы дать геометрическое представление тяготения, достаточно было ввести понятие кривизны четырехмерного мира, перейти от эвклидовой или псевдоэвклидовой геометрии мира к более общей, римановой. Но геометризация электромагнитного поля гораздо сложнее, может быть, вовсе невозможна и, во всяком случае, требует более радикального обобщения геометрии. В электрическом поле заряженная частица движется соответственно своему заряду, в уравнение ее движения входит электрический заряд. Гравитационный заряд (гравитационная масса) не меняет скорости падения тела, потому что гравитационной массе противостоит равная ей инертная 139
масса. В формуле гравитационного ускорения в числитель входит тяжелая масса, а в знаменатель инертная, и они сокращаются. Этим гравитационное поле отличается от других полей. Отсюда следует, что движение по инерции и движение под действием силы тяжести отличаются одно от другого только в некоторой определенной системе отсчета. В ньютоновой механике отличие движения по инерции от движения под действием силы представлялось абсолютным, так как предполагалось, что пространство и время подчиняются эвклидовой геометрии. Инерционное движение — это движение, изображаемое прямой линией на пространственно-временном графике. Если взять для наглядности двухмерное пространство — плоскость и перпендикулярными к ней отрезками представить время, т. е. изобразить пространство-время трехмерным эвклидовым многообразием, то линейные зависимости между пространственными координатами х и у, с одной стороны, и временем /, с другой, x=axt+blt y=aJ+b2i где a\t a2i Ь\ и Ь2 — постоянные, геометрически выразятся прямой мировой линией. Как будет при этих условиях выглядеть движение под действием силы? Оно изобразится кривой мировой линией в эвклидовом пространственно-временном многообразии. Поэтому разделение движений на движения по инерции и движения под действием сил можно представить как различие между прямыми и кривыми мировыми линиями. Принцип инерции, т. е. первый закон Ньютона, соответственно можно изложить так: существуют прямые мировые линии в эвклидовом мире, они изображают движения тел не испытывающих действия сил; все остальные движения происходят под действием сил. Второй закон Ньютона позволяет параметризировать силы (не непосредственно, а через ускорения). Общая теория относительности исключает из такого определения инерционных движений только одно требование— «в эвклидовом мире» и заменяет его более ши- 140
роким «в римановом мире». Тогда прямые превращаются в геодезические линии, и инерционное движение объединяется с движением под действием силы (только силы тяжести!) одним определением: существуют геодезические линии в римановом мире, по которым движутся все тела. Вейль снимает еще одно требование — «в римановом мире» и присоединяет к инерционным и гравитационным движениям движения под действием электромагнитного поля. Риманов мир характеризуется отсутствием масштабного вектора, нулевой метрической кривизной. Эти ограничения отпадают в более общей геометрии Вейля. Поэтому в теории Вейля все известные в то время силовые поля объединялись с инерцией: тело, предоставленное самому себе, тело под действием силы тяжести, тело под действием электромагнитного поля — все они движутся «по инерции». Исторически теория относительности выросла из электродинамики; электродинамика Максвелла, электронная теория, специальная теория относительности, общая теория относительности — это непрерывный исторический ряд. Но теория относительности именно выросла из электродинамики. Подобно сказочному духу, она вышла из бутылки и, распространившись в пространстве, упорно не желала войти обратно. Более того, именно отрыв электродинамики от общей теории относительности — теории тяготения считался в течение долгого срока препятствием, мешающим превращению теории относительности в единую картину мира. После того как было доказано наличие массы (не только инертной, но и гравитационной) у электромагнитных волн, физика достигла глубокого синтеза понятий обычного вещества и электромагнитного поля. И частица вещества и каждая точка фронта электромагнитной волны движутся по геодезическим линиям пространства, кривизна которого в свою очередь зависит от распределения обычного вещества и электромагнитных полей. В этом взаимодействии частиц вещества и электромагнитных полей всё осуществляется через искривление пространства. Но наряду с тяготением, допускающим такое геометрическое представление благодаря тождеству инертной и тяжелой массы, существуют ускорения, зависящие от констант самого тела, 141
к которому они приложены. Ускорение тела в электрическом поле зависит от его электрического заряда и именно поэтому не может быть представлено как геометрическое свойство пространства-времени, по крайней мере без дальнейшего обобщения самого понятия геометрических свойств. Вейль поэтому пришел к единой теории, вводя более общую геометрию. В предыдущей главе говорилось о четырех дифференциальных тождествах, соответствующих четырем законам сохранения, связанным с однородностью пространства и времени. Эти законы выражают инвариантность действия при смещениях во времени и пространстве. В теории Вейля к этим четырем геометрически выраженным закономерностям присоединяется пятая. В геометрии Вейля могут быть представлены не только четыре перехода: «вперед — назад», «вправо — влево», «вверх — вниз» и «позже — раньше», но и пятый переход: «больше — меньше» для единиц измерения, переход, также не влияющий на инвариантный объект. Это «невлияние» выражается теперь уже не четырьмя, а пятью тождествами, которым соответствуют пять законов с о х р а н е- н и я,— кроме четырех, известных нам, еще закон сохранения электрического заряда. Что же касается действия, то оно и в теории Вейля остается основным четырехмерным физическим инвариантом. Но ему в этой теории соответствует уже не кривизна четырехмерного мира, а более сложное выражение, обладающее инвариантностью при масштабном преобразовании. Это выражение не изменяется в своем числовом значении при переходе от одних единиц к другим, так же как в теории Эйнштейна кривизна мира не изменяется при координатных преобразованиях. Хочется упомянуть об одном интересном истолковании понятия действия, высказанном в связи с обсуждением теории Вейля. Оно принадлежит Эддингтону 1. Если действие измеряется инвариантным числом, числом, независимым от единиц измерения, то ни длина, ни площадь, ни объем не могут выражаться таким числом. Абсолютное, не зависящее от единицы измерения число — это, например, число людей в комнате, но никак не пло- 1 См. «Пространство, время и тяготение», стр. 177. 142
щадь комнаты. Но действие — $то не число каких-то индивидуумов (например, элементарных частиц), так как оно может быть дробным числом. Есть, однако, и другой пример числа, независимого от единицы измерения, причем могущего быть и дробным числом. Это — вероятность, или функция вероятности. Вероятности комбинируются умножением, а действия — сложением. Отсюда представление о действии как о логарифме вероятности. Но так как логарифм вероятности — отрицательное число, то действие представляется логарифмом вероятности данного состояния со знаком минус. Тогда принцип наименьшего действия становится принципом наибольшей вероятности. Эта мысль Эддингтона могла получить развитие только в связи с развитием квантовой механики. Теория Вейля дала толчок другим попыткам построения единой теории поля, но не получила какого-либо подтверждения и была впоследствии оставлена. Такая же судьба постигла и другие единые теории поля К Эйнштейн потратил более тридцати лет на разработку единой теории поля2. Он пошел по пути обобщения уравнений гравитационного поля. Эйнштейн рассматривает общий вид этих уравнений — формального выражения общей теории относительности: #nv — -у 8^# = —8 **7Vv. Справа находится тензор, описывающий все источники поля, средоточия вещества и электромагнитные поля, т. е. всё, кроме гравитационных полей. Тензор Т^, по словам Эйнштейна, «представляет энергию, которая создает гравитационное поле, но сама не имеет гравитационного характера, как, например, энергия электромагнитного поля, энергия плотности вещества и т. д.»3. При составлении этого тензора исходили из классических пред- 1 См. П. Бергман. Введение в теорию относительности, ч. III (теории Вейля и Калуза), М.—Л., ИЛ, 1947, стр. 325—371; А. Эддингтон. Теория относительности. Гл. VII (теории Вейля и Эддингтона). М.—Л., 1934, стр. 370—447. 2 А. Эйнштейн. Сущность теории относительности. Приложение II. М.—Л., ИЛ, 1955, стр. 118—157. 8 «Сущность теории относительности^ стр. 118. 143
ставлений и затем согласовали их с общим принципом относительности, внося «классический» тензор в общековариантное уравнение. Поэтому Эйнштейн называет общую теорию относительности, созданную в 1916 г., дуалистической трактовкой единого поля и считает ее лишь предварительным подходом к монистической теории. Принцип эквивалентности позволил однозначным образом выбрать математический аппарат теории тяготения: поле тяготения описывается симметричным тензором gp.v. Но какой математический аппарат позволит описать единое поле? «В этом случае,— пишет Эйнштейн,— наши познания в области физики не позволяют сделать однозначный выбор, подобный тому, который следовал из эквивалентности инерции и тяготения для частного случая чисто гравитационного поля. Единственным указанием, которое можно извлечь из опыта, является смутное ощущение, что единое поле должно включать в себя нечто подобное электромагнитному полю Максвелла» ]. Проблема (Эйнштейн называет ее «крайне туманной»- состоит в естественном обобщении симметрич ного тензора g . При таком обобщении мы получим некоторую структуру поля, более общую, чем структура поля в областях, где нет ничего, кроме тяготения, т. е. где применимо уравнение: R^ = 0. Что же является естественным обобщением симметричного тензора? Несимметричный тензор, отвечает Эйнштейн и систематически переходит в уравнениях поля от симметричного тензора g к несимметричному. Определения таких тензоров даны в начале книги (глава 3), но здесь их можно напомнить. Четырехмерный тензор b|XV gll Sn #13 gu\ #21 g22 g2B £24 gsi §S2 §33 gst gil #42 #43 #44 1 «Сущность теории относительности^ стр 118-119 144
называется симметричным, если компоненты, написанные справа от диагонали gi&zgzzgu* равны компонентам, расположенным слева от этой линии: gi2 = &2i. g13 = g3i> gli = #41» #23 = #32, #24 = #42» #34= #43> Т. е. g^ = g^. ТаКИМ образом, четырехмерный симметричный тензор имеет только десять различных компонент. Если же g12 = — g21, gi3 = — gsi» вообще g^ = — gVM.» то тензор называется антисимметричным. В общем случае, когда g =^=gv , мы имеем несимметричный четырехмерный тензор с 42 = 16 компонентами. Несимметричный тензор g v можно представить в виде суммы симметричного g^ и антисимметричного g^ тензоров. gjiv = 2^ + g^. Переход от симметричного тензора g^, фигурирующего в теории тяготения Эйнштейна, к несимметричному тензору g^ и получение новых уравнений включает сложные и тонкие построения, которые здесь нельзя изложить без очень громоздких пояснений. Ограничимся лишь замечанием, что общие уравнения включают шестнадцать компонент несимметричного тензора и описывают структуру единого поля. Такое число компоненту v позволяет описать и гравитационные потенциалы и переменные электромагнитного поля. Соответствующие уравнения — нелинейны, так как поле порождает само себя. В линейном приближении система уравнений единого поля распадается на две системы уравнений: одну — для симметричных и другую — для антисимметричных компонент. Уравнения, в которые входят антисимметричные компоненты, представляют собой обобщенные максвелловские уравнения электромагнитного поля. «Расщепление уравнений в линейном приближении делает понятным, почему электромагнитное и гравитационное поля казались независимыми на начальной стадии развития наших теоретических идей. Дело в том, что эти идеи основывались исключительно на известных нам данных о поведении слабых полей»1. Единая теория поля, выдвинутая Эйнштейном, как и другие единые теории поля, в течение тридцати лет не дала никаких результатов, которые допускали, хотя бы 1 А. Эйнштейн. Сущность теории относительности, стр. 132. 145
принципиально, экспериментальную проверку. Их следует рассматривать как некоторые математические построения, навеянные физическими идеями общей теории относительности, обобщающие некоторые понятия тензорной алгебры и тензорного анализа, но пока не имеющие физического эквивалента, физической интерпретации. Может быть, в будущем интерпретация несимметричного тензора станет возможна. Но для этого необходимы собственно физические представления о единстве различных полей. Такими собственно физическими представлениями являются идеи трансмутации элементарных частиц, включающие взаимные превращения частиц, из которых состоят гравитационные поля, с одной стороны, и электромагнитные поля,— с другой. С такой точки зрения существующие единые теории поля выходят за рамки физической картины мира. Основной фарватер развития теории относительности как физической картины мира — ее применение в физике микромира, ее объединение с теорией квант. Быть может, этапом на указанном пути было получение уравнений движения из уравнений гравитационного поля. Классическая электродинамика включает независимые друг от друга уравнения: во-первых, уравнения, описывающие закономерное возникновение и распространение поля; во-вторых, уравнения движения частицы в силовом поле. В электродинамике Максвелла известные уравнения, связывающие заряды и токи с напряженно- стями магнитных и электрических полей, существуют независимо от уравнений движения, в которых, с одной стороны, фигурирует лоренцова суммарная сила, действующая на электрон, а с другой — скорость и ускорение электрона. Уравнения поля и уравнения движения независимы, и это выражается в их линейности. Электромагнитное поле мы считаем независимым от движущейся под его воздействием частицы, от движения этой частицы. Мы делим поле на две части: поле рассматриваемой частицы и поле всех остальных частиц. Первую часть мы исключаем и принимаем во внимание лишь поле, которое существовало бы в данной точке в отсутствие рассматриваемой частицы, т. с. поле, создаваемое остальными за- 146
ряженными точками, неподвижными и движущимися. Поэтому электромагнитное поле, действующее на рассматриваемую частицу, линейным образом зависит от токов и зарядов. В свою оче дь, движение частицы, описываемое уравнениями дви.хения, не изменяет поля, и поэтому здесь уравнения т кже линейны. Но в теории тяготения Эйнштейна фигурируют нелинейные уравнения поля; иначе говоря, гравитационные поля действуют друг на друга. Поэтому представляется возможным отказаться от независимости уравнений поля и уравнений движения и вывести уравнения движения из уравнений поля. Эйнштейн и Громер поставили такую задачу в 1927 г. \ а в 1937—1939 гг. Эйнштейн, Инфельд и Гоффман решили ее2. Одновременно к этому открытию пришел и В. А. Фок3. Он шел более простым путем, причем получил уравнения движения не для материальных точек, а для тел конечного объема. Прямые попытки релятивистского обоснования дискретности вещества и энергии начались еще до создания общей теории относительности. В 1912 г. Ми4 хотел обобщить электродинамику таким образом, чтобы объяснить существование дискретной элементарной частицы конечных размеров. В то время наиболее трудным вопросом, относящимся к существованию протяженной элементарной частицы, был вопрос об электростатическом отталкивании одноименно заряженных частей протяженной частицы. Ми предположил, что кулоновские силы внутри элементарной частицы уравновешиваются другими силами, также электрическими, которые незаметны в пространстве вне частиц. Гильберт5 и Вейль 6 связали эту теорию с общей теорией относительности. Эйнштейн в 1919 г. написал статью «Играют ли гравитационные поля существенную роль в построении элементарных материальных частиц» 7. В ней доказывается, что куло- 1 Sitzungsber. d. Preuss. Akad. d. Wiss., 235, 1927. 2 A. Einstein, L. I n f e 1 d, B. Hoffman. Ann. of Math., 39, 65 (1938); A. Einstein, L. Inf eld. Ann. of Math., 41, 655 (1940). 8 Ж. Э. Т. Ф., 9. 375 (1939). 4 Ann. d. Phys., 37, 511 (1912); 39, 1, (1912); 40, 1 (1913). 6 Grundlagen der Physik, 2 Mitt., Gott. Nachr., 1917. e «Raum — Zeit — Matherie», 1918, стр. 184. 7 Sitzungsber. d. Preuss. Akad. d. Wiss., 1919. «Принцип относите/ чости», стр. 332. 147
новскому отталкиванию в элементарных частицах противостоит тяготение. Мы отошлем читателя к специальной литературе, где изложены подобные теории 1, представляющие собой предисторию действительного развития релятивистского учения о микромире. Оно началось во второй половине двадцатых годов, после создания квантовой механики. 1 В. Паули. Теория относительности. М— Л., 1947, стр. 266— 298. Там же, см. библиографические сведения. ^~tQ*~^
Часть вторая КВАНТЫ 1. Кванты действия 14 декабря 1900 г. Планк на заседании Германского физического общества сообщил о выдвинутой им новой теории лучеиспускания, теории, положившей начало развитию современной физики микромира. Новая физика исходит из идеи прерывности процесса излучения и поглощения и существования наименьших количеств энергии. Эти наименьшие количества, кванты энергии, пропорциональны частоте излучения. Коэффициент пропорциональности 6,57 • 10"27 имеет размерность энергии, умноженной на время,— действия. Открытие квантов действия было результатом развития теории так называемого теплового излучения. По существу речь шла не только о тепловых лучах, т. е. об электромагнитных волнах большей длины, чем видимый свет, но о всяких электромагнитных лучах — тепловых, видимых и ультрафиолетовых. Однако первоначальные эксперименты, давшие толчок теории, производились с тепловыми лучами. Упомянем о некоторых понятиях, фигурирующих в теории излучения. Представим себе для этого некоторую полость с нагретыми стенками, излучающими и поглощающими тепловые (или, при более высокой температуре, видимые) лучи. Опыт показывает, что в такой полости рано или поздно наступает равновесие между излучением энергии стенками и ее поглощением. Тогда при постоянной температуре плотность лучистой энергии в полости приобретает некоторое постоянное значение. Для определенной частоты, вернее для бесконечно малого ин- 149
тервала частот между частотами v и v + dv, плотность энергии можно считать функцией частоты v. Она называется спектральной плотностью излучения и обозначается через pv. Тогда плотность энергии излучения dU в интервале частот dv будет: d£/ = Pvdv. Интегральная плотность лучистой энергии равна: 00 О Основной вопрос теории излучения — это выяснение зависимости спектральной плотности излучения от частоты, т. е. выяснение вида функции pv- Основной линией развития теории излучения в конце XIX в. были теоретические и экспериментальные поиски кривой, показывающей распределение плотности энергии по участкам спектра. Кирхгоф доказал, что спектральная плотность излучения pv при постоянной температуре не зависит от природы тел, излучающих в полости с идеально отражающими стенками. Он нашел соотношение между испускатель- ной и поглощательной способностью тела и спектральной плотностью р«э. Кирхгоф ввел понятие абсолютно черного тела как тела, поглощающего всю падающую на него энергию. Законы излучения такого абсолютного черного тела и нужно было найти. В 1893 г. Вин сделал в этой области большой шаг вперед. Из термодинамических и электродинамических соображений он вывел закон, согласно которому выражение для pvrfv содержит куб частоты и некоторую функцию одной переменной — отношения частоты к температуре: Но каков вид функции F, стоящей в правой части формулы? Макроскопическая термодинамика не давала ответа на этот вопрос. Необходимо было представить некоторой моделью отдельные микроскопические явления, из которых складызается излучение макроскопических тел. При помощи подобных моделей была найдена кри- 150
вая распределения энергии, соответствующая экспериментальным данным для некоторого участка спектра. Формула, о которой идет речь, была впервые вычислена Релеем, а затем получила более строгое обоснование в работе Джинса. Для длинных волн эта формула Ре- лея-Джинса дает хорошее согласие с наблюдениями. Но с переходом к более коротким волнам, т. е. с увеличением частоты v интегральная плотность излучения в формуле Релея-Джинса стремится к бесконечности. Получается так, как будто излучение неограниченно растет и равновесие между излучением и поглощением энергии не наступает. Впрочем, такое заключение совпадает с выводом из классической картины излучения, даже если не пользоваться понятиями и формулами, найденными в конце столетия. Воспользуемся механической аналогией. В воде плавают колеблющиеся легкие тела, соединенные друг с другом пружинами *. Благодаря колебаниям они отдают энергию воде, энергия переходит постепенно в тепло, но никак нельзя представить себе, чтобы в какой-то момент было достигнуто равновесие между энергией, сообщаемой воде, и энергией, получаемой телами от волн на воде, поддерживающих колебания этих тел. Между тем опыт показывает, что в случае электромагнитного излучения и поглощения равновесие всегда наступает. Точные эксперименты с излучением абсолютно черного тела показали, что с увеличением частоты функция р v не стремится к бесконечности, а проходит через максимум и затем снижается. Для коротких волн (ультрафиолетовых) справедлива не формула Релея-Джинса, а другая формула, предложенная в 1896 г. Вином и независимо Голицыным. Она, однако, противоречит наблюдениям в случае длинных волн. Заметим, что аналогия с плавающими в воде телами не совсем корректна, так как она оперирует колебаниями молекул, вязкостью и другими понятиями, не обязательными в случае электромагнитных колебаний. Действительно, несовместимость экспериментальных данных о 1 См. Э. Шпольский. Атомная физика, ч. I. М,—Лм 1949, стр. 247—246. 151
равновесии излучения и поглощения энергии с классической механикой и классической электродинамикой была доказана более тонкими построениями. Но приведенная аналогия указывает ла важное с исторической точки зрения обстоятельство. Уже в пределах классической физики существовали «темные пятна» в теории излучения. Совершенствование экспериментальной техники и успехи теоретического анализа поставили резко выявившееся противоречие между результатами эксперимента и классическими идеями в центр теоретической мысли. Подобным же образом противоречие между классической электродинамикой и оптическими экспериментами, с одной стороны, и классической механикой,— с другой, выявившееся в конце XIX столетия, только в девятисотые годы было осознано, отчетливо представлено и послужило началом новой универсальной теории — теории относительности. В данном случае, в теории излучения, противоречие привело к концепции Планка. Она была сформулирована с помощью представления о гармонических колебаниях элементов излучающего тела. Планк рассматривает каждый излучающий элемент -как линейный гармонический осциллятор. Так называется колебательная система, в которой масса движется по прямой под действием силы, пропорциональной отклонению массы от положения равновесия и направленной к такому положению. Планк рассматривает излучающие электромагнитные волны стенки полости как множество линейных гармонических осцилляторов. Последние излучают и поглощают волны и таким образом обмениваются энергией с находящимся внутри полости излучением. Планк предполагает, что энергия, излучаемая осциллятором, всегда является кратной некоторой наименьшей величине — наименьшему количеству энергии е0. Иначе говоря, осциллятор может находиться лишь в таких состояниях, когда его энергия принимает значения: ео> ^8о» ^ео» • • •» ^£о* Промежуточные состояния невозможны, и осциллятор, излучая или поглощая электромагнитные волны, скачком переходит из одного возможного состояния в другое. Поэтому и поглощение и излучение света (не только 1*52
тепловых, но и единых с ними по своей природе видимых и ультрафиолетовых лучей) происходит таким образом, что излучаемая или поглощаемая энергия кратна наименьшему количеству энергии е0- Конечно, идея дискретности энергии противоречила основным идеям классической физики, и с этой стороны смелость гипотезы Планка находит мало аналогий даже в физике девяностых- девятисотых годов, переживавшей коренную ломку исходных представлений. Наряду со специальным принципом относительности, появившаяся на пять лет раньше идея дискретности энергии была исходным пунктом переворота. Из гипотезы дискретности поглощаемой и излучаемой энергии прежде всего следовало, что средняя энергия должна вычисляться при помощи статистической формулы, суммирующей вероятности дискретно изменяющихся состояний. Это понятие требует пояснений. Представим себе некоторую Егеличину а, которая принимает дискретный ряд значений: Дь 02, Дз> -., я*, причем вероятности этих значений соответственно пропорциональны числам /ii, п2у /1з, .«, п>к и нормированы к единице. Смысл этих терминов можно разъяснить при помощи классического примера теории вероятностей, игравшего большую роль в ее генезисе,— примера вероятности выигрыша в лотерее. Вероятности доь w2 ...» w событий — выигрышей размером аи а2> ..., а& пропорциональны числам п[у п2, ..., rik выигрышей и равны этим числам, деленным на общее число билетов: N = пх + п2 + .. . + пк: т. е. дробями, дающими в сумме единицу. Эти дроби называются вероятностями, нормированными на единицу. Среднее значение величины а, обозначаемое а, равно сумме произведений значений at на вероятности соответствующих значений: к а = axwx + сщи* + ... + <W* = 2 a№i~ 158
В отличие от лотерейных выигрышей физические величины, с которыми оперировали классические теории, принимают непрерывный ряд значений, изменяются непрерывно. Поэтому суммирование вероятностей заменяется интегрированием. Представим себе, что значения величины а отложены на горизонтальной оси, причем каждому значению а соответствует функция w(a) — плотность вероятности. Будем откладывать эту функцию по вертикали. Тогда вероятность каждого значения, лежащего в интервале между а и а + da равна ширине интервала, помноженной на плотность вероятности w = w(a)da, а- вероятность, что а будет иметь значение в промежутке между а\ и а2 будет равна площади фигуры, образованной осью значений а (осью абсцисс), кривой w(a) и ординатами в точках й\ и а2у т. е. равна интегралу: w (a) da. ах Если функция w(a) выбрана так, что этот интеграл равен единице, то вероятность нормирована на единицу в этом интервале. Заменив в формуле для среднего значения а а = ^aiWi i знак суммы знаком интеграла ъ промежутке между ах и #2, мы получим формулу для а в случае непрерывного изменения а: a =\aw (a) da. ах При помощи аналогичной формулы и было найдено распределение энергии в спектре абсолютно черного тела по формулам Релея-Джинса и Вина-Голицына. Плотность излучения pv пропорциональна средней энергии осциллятора. Эта последняя равна интегралу, взятому в промежутке между нулем и бесконечностью,— 154
в таких пределах классическая физика представляет изменение энергии: оо £ = \ Ew(E)dE. о В этом пункте Планк отошел от классического пути. Интегрирование законно, пока энергии приписывается непрерывное изменение. Если же она меняется скачками от одного дискретного значения к другому, интегрирование заменяется суммированием конечных разностей: 00 Е = 2ПеоИЛ8о)- В поисках формулы для pv Планк в отличие от своих предшественников исходил из этого выражения для среднего значения энергии. Он пришел к формуле, которую здесь иет надобности выписывать. Новая формула удовлетворяет закону Вина, если е0 пропорционально частоте v: е0 = Av. Коэффициент пропорциональности h — постоянная Планка — оказался одной из самых важных констант новой физики. Как уже сказано выше, h имеет размерность действия и равна 6.57.10~27 эрг. сек. Формула, выведенная для плотности излучения в предположении дискретности энергии, во всех случаях подтверждена экспериментом. Она оправдывается для низких частот или высоких температур (когда справедлива формула Релея-Джинса), для высоких частот или низких температур (когда справедлива формула Вина) и для прочих случаев, когда формулы Релея-Джинса и Вина расходились с экспериментом. 2. Фотоны Наиболее характерной особенностью современной физики микромира является корпускулярно-волновая коллизия, необходимость приписывать элементарным частицам одновременно корпускулярные и континуально-вол- 155
новые свойства. Оказалось, поля обладают корпускулярными свойствами. Особенно отчетливо этот вывод обнаружился в результате работ Эйнштейна, выполненных в 1905—1909 гг. и создавших представление о фотонах. Эйнштейн исследовал флюктуации плотности излучения в замкнутом объеме. Он воспользовался аналогией с плотностью газа. В резервуаре объема V заключен газ, находящийся в состоянии термодинамического равновесия. Это значит, что средняя плотность газа во всех точках внутри резервуара одинакова и, взяв два объема в разных точках, мы всегда найдем в обоих одну и ту же плотность газа. Но если брать все меньшие объемы, то будут обнаруживаться случайные колебания числа молекул в этих объемах. При хаотическом движении молекул внутри очень небольшого объема могут оказаться две молекулы, одна молекула, на мгновение вообще не встретится ни одной молекулы. Такие случайные колебания, или флюктуации, связаны с дискретностью вещества. Если бы газ был непрерывным и состоял из бесконечно малых элементов, плотность газа была бы неизменной, какой бы малый объем мы ни брали. Подсчитаем теперь вероятность wn пребывания п молекул в некотором объеме v газа, заключенного в резервуаре объема V. Молекула с достоверностью (вероятностью, равной единице) заключена в объеме V всего резервуара. Вероятность найти эту молекулу в меньшем объеме v, соответственно, меньше: v Вероятность wn найти в объеме v одновременно п отдельных молекул равна произведению п таких вероятностей: —w- Эйнштейн по аналогии рассматривает вероятность найти всю энергию излучения, содержащегося в некотором резервуаре с идеально отражающими стенками объема V, в одной его части объема v. Вся энергия излучения с частотой равна произведению спектральной плотности Pv в интервале частот cfv на этот интервал и на объем V 156
резервуара, в котором происходит излучение: Е = yPvdv. Эйнштейн вычислил вероятность сосредоточения всей этой энергии в объеме v. Она оказалась равной в где h — постоянная Планка. Аналогия с вероятностью встретить п молекул газа в объеме v будет полной, если представить излучение состоящим из п частиц, энергия каждой из которых равна А* Тогда число молекул п соответствует числу частиц излучения, стоящему в качестве показателя степени в формуле вероятности: Е hv Теперь рассмотрим флюктуации — мгновенные отклонения е энергии излучения в малых объемах от ее среднего значения: е = Е — Е,; В среднем е уничтожаются, так как принимают то положительные, то отрицательные значения. Если взять среднее аначение квадратов е, то оно уже не равно нулю (квадраты всегда положительны) и оказывается равным: 7а = ЬЁ. Но такая квадратичная флюктуация, как показал Эйнштейн, может иметь место лишь при дискретности излучения. Если же оно представляет собой непрерывную среду, заполняющую объем V, получается иная формула флюктуации. В этом случае флюктуации имеют совсем иную природу; это уже не случайные колебания числа частиц в объеме, а интерференция волн, распространяющихся во всех направлениях. Интерференционные максимумы и минимумы энергии не обладают устойчивостью. Такой картине соответствует определенное математиче- 157
ское выражение, описывающее среднюю квадратичную флюктуацию энергии. Эйнштейн вывел первое выражение флюктуации, исходя из формулы Вина-Голицына, т. е. формулы, экспериментально подтвержденной для сравнительно больших частот. В этом случае картина оказалась соответствующей дискретной природе излучения. Второе выражение для флюктуации, соответствующее непрерывности излучения, было получено Эйнштейном из формулы Релея- Джинса, справедливой при сравнительно небольших частотах. Значит, при коротких волнах существенна дискретность излучения, а при длинных — его непрерывность. Если же в основу вычисления флюктуации положить формулу Планка, справедливую во всех случаях, то выражение для флюктуации состоит из двух членов, один из которых описывает флюктуации дискретных частиц излучения, а второй — случайные флюктуации волн в непрерывной среде. В этой теории речь, по существу, идет не только о дискретности излучения, но и о существовании дискретных частиц света. При помощи этих частиц, квантов света, или фотонов, Эйнштейн объяснил закономерности фотоэлектрического эффекта, явления, при котором свет вырывает электроны с поверхности металла и энергия света, т. е. электромагнитных колебаний, переходит в кинетическую энергию электронов. С точки зрения волновой теории объяснение фотоэффекта могло быть следующим. Свет вызывает вынужденные колебания электронов и при резонансе между периодом собственных колебаний электрона и периодом световой волны электрон в конце концов может покинуть поверхность металла. С такой точки зрения энергия движущегося, покинувшего металл электрона пропорциональна интенсивности света. Но в действительности энергия электронов, сорванных светом с поверхности металла, вовсе не зависит от интенсивности света. От последней зависит лишь число электронов, вылетевших из металла. Скорость же их и, следовательно, энергия находятся в линейной зависимости от частоты света. Эйнштейн показал, что такие экспериментально обнаруженные зависимости могут быть объяснены, если 1S8
оставить классическую волновую теорию света и предположить, что свет — это поток отдельных частиц — фотонов. Каждый фотон, поглощаемый металлом, отдает свою энергию электрону. При достаточно большой энергии электрон преодолевает удерживающие его связи и покидает поверхность металла. Поэтому энергия электрона зависит от энергии фотона (равной произведению частоты на постоянную Планка) и, следовательно, находится в линейной зависимости от частоты света. Число же фотоэлектронов пропорционально числу поглощаемых фотонов, т. е. интенсивности освещения, хотя и не равно ему, так как не каждый фотон срывает электрон с поверхности металла. Энергия фотона Av равна энергии Pi отрыва электрона от атома плюс работа Р2, затрачиваемая на выход за пределы освещаемого тела, плюс кинетическая энергия фотоэлектрона eV: hi = Рх + Р2 + eV. В металлах имеется большое число электронов, не связанных с атомами, и для получения фотоэлектронов необходима лишь энергия для преодоления поля, запирающего электроны. Поэтому предыдущая формула приобретает вид: Ь = eV + Р2. Идея дискретности проникла, таким образом, в учение о свете, в электродинамику и оптику. Речь шла уже не только о квантовании процессов излучения и поглощения света, но также о квантовании световой энергии в пространстве. Казалось, континуальная физика отступила под натиском атомистических идей. На самом деле развитие науки пошло совсем иным путем — к синтезу атомистических и континуальных представлений, к новым взглядам на частицы и волны, не находящим в классической физике сколько-нибудь полных аналогий. В сущности, уже теория световых квантов Эйнштейна содержала коллизию «волны — частицы», столь характерную для физики XX столетия. Корпускулярное представление о свете объясняло явления фотоэффекта, но для других оптических явлений сохранялось волновое объяснение. 159
Таким образом, физика в целом на вопрос, «что такое свет» отвечала—не «волны» и не «корпускулы», а «и волны и корпускулы», причем смысл этих понятий уже неполностью совпадал со смыслом, содержавшимся в вопросе. Только что было сказано об этой коллизии как о характерной особенности физики XX столетия. Наше столетие началось в физике, собственно говоря, в девяностые годы прошлого, приблизительно в 1895 г. Открытие электрона возвестило начало нового периода не только потому, что электронная теория, развиваясь, привела к релятивистской механике. Электрон был первой, ставшей известной людям элементарной частицей. Элементарные частицы как раз и отличаются неотделимостью волновых и корпускулярных свойств. Вторая, ставшая известной элементарная частица — фотон — обладает корпускулярными свойствами в явлениях фотоэффекта и волновыми — в явлениях диффракции и интерференции. Что же касается электрона, то первоначально были известны его корпускулярные свойства, а волновые были обнаружены только на исходе первой четверти нашего столетия. Однако уже в 1913 г. Нильс Бор описал некоторые парадоксальные с точки зрения классической физики особенности поведения электронов в атомах. Десять лет спустя указанные особенности были объяснены волновыми свойствами электрона. 3. Модель атома Специальная теория относительности включила оптические (электродинамические) константы и понятия в механику макромира. Теория Бора включила их в механику атома. В чем заключалась основная проблема атомной механики? Она состояла в поисках закона, которому подчиняется движение электронов вокруг положительного ядра. Это движение непосредственно следовало из представления о положительном центральном заряде и окружающих его электронах. Притяжение, неизбежно возникающее между протоном и электроном, могло быть уравновешено лишь центробежной силой электрона, обращающегося вокруг ядра, подобно планете в солнечной системе. Такую картину атомного строения создал Резер- 160
форд. С другой стороны, классическая теория излучения объясняла возникновение электромагнитных колебаний движением электронов в атоме. Колебания электронов как электрических зарядов должны были неизбежно вызывать электромагнитные волны той же частоты. Поэтому излучение атома можно было представить как результат обращения электронов по орбитам вокруг ядра. Именно такое представление вытекало из классической электродинамики Максвелла — Лоренца. Однако, оно не могло быть согласовано с выводами из спектроскопических наблюдений. С течением времени экспериментальные работы и обсуждение их результатов подготовили отказ от посылок классической электродинамики в картине излучения атома. Вместе с тем подготовлялось коренное изменение принципов механики атома и совершенно новое представление о движении электронов в атоме. Развитие первоначальных представлений о строении атома и движении электронов, изучение спектров и, с другой стороны, представление о квантах легли в основу теории Нильса Бора. Бор ввел квантовые понятия в картину атома и пришел к эмпирически найденным спектральным формулам. Он применил идею квантования к механической системе — атому, состоящему из ядра и планетарных электронов. Постулаты теории Бора прежде всего объясняют устойчивость атомов. Классическая механика и электродинамика не могли объяснить устойчивость атома, каким он представлялся физикам после Резерфорда. Электроны движутся по круговым или эллиптическим орбитам, т. е. с ускорением. Такое движение, согласно классическим законам Максвелла и Лоренца, приводит к излучению электромагнитных волн; электрон в результате излучения должен терять энергию, двигаясь по все более близким к ядру орбитам, и в конце концов упасть на ядро. Далее, классическая электродинамика не могла объяснить дискретность спектра излучения атомов. Если бы непрерывное излучение уменьшало энергию электрона и сокращало его орбиту, соответственно менялась бы частота. Тогда атомы, в различной степени потерявшие энергию вследствие излучения, испускали бы спектральные линии, соответствующие всевозможным частотам, и давали бы непрерывный спектр, а не дискретные резкие линии. 161
Мысль Бора о дискретных стационарных значениях энергии атома была сформулирована в виде двух постулатов: 1) существуют стационарные состояния атома, энергия которых может принимать лишь дискретные значения Е = Еи Е2, Яз,..-; переходы из одного стационарного состояния в другое происходят скачками и 2) при этом излучаются определенные частоты, связанные не с частотами периодических движений электрона, а с разностью энергий уровней Ет и Еп: Ь = Ет — Еп. Это соотношение называется условием частот. Для развития квантовой теории атома особенно важными были наблюдения спектра водорода в лабораторных условиях и линий водорода в спектрах звезд. Было установлено, что длины волн, соответствующих различным линиям спектра, подчиняются некоторой закономерности. Если взять волновые числа, т. е. числа, показывающие, сколько волн укладывается в одном сантиметре, то каждое волновое число k, соответствующее спектральной линии, всегда может быть представлено как разность двух функций целых чисел тип: k = T(m) —T(n). Величины Т(т) и Т(п) называются спектральными термами. Указанная закономерность была установлена Ритцом в 1908 г. эмпирически (комбинационный принцип) и принадлежала к числу совпадений, казавшихся случайными. Почему волновое число всегда равно разности функций целых чисел, почему аргументами обеих функций оказываются ряды целых чисел, в чем причина указанной числовой закономерности? В квантовой теории атома указанный факт играет фундаментальную роль, подобно тому как в общей теории относительности фундаментальная роль принадлежит необъяснимому с классической точки зрения, случайному в классической механике совпадению тяжелой и инертной массы. Теория Бора объясняет равенство волнового числа и разности термов. Подобно планковскому осциллятору электрон находится в стационарных состояниях с энер- 162
Гиями, образующими дискретный ряд значений. Каждая частота, каждое волновое число, каждая спектральная линия связана с двумя стационарными состояниями, с двумя уровнями энергии. Термам Т(т) и Т{п) отвечают два состояния, два уровня энергии. Из боровского условия частот легко получить правило термов (комбинационный принцип Ритца). Формулируя это правило, мы обозначали через k волновое число, т. е. число волн в сантиметре, так что величина k имела размерность — см-1. Чтобы перейти к частоте, т. е. числу колебаний в секунду (величине с размерностью сек-1), нужно помножить k на скорость света. Тогда условие частот примет вид: hck = Em — £n. Из него мы получаем выражение для волнового числа: к~ he he ' т. е. волновое число — разность двух функций целых чисел шип. Теория Бора объяснила эту закономерность. Но в основе объяснения правила термов — комбинационного принципа, — как и в основе объяснения дискретности спектров, лежало допущение, само по себе не находившее объяснения, — квантование электронных орбит. Это квантование не вытекало из более общих положений, оно было введено ad hoc: из всех возможных с точки зрения классической теории отбираются те орбиты, на которых момент количества движения р электрона кратен кванту действия, деленному на 2 тс: h Бор применил это условие к «водородоподобному атому», т. е. к системе, состоящей из одного электрона и ядра с положительным зарядом, кратным заряду электрона Ze, где Z— целое число. Если Z = 1, это атом водорода; если Z = 2, это ионизированный, потерявший один электрон атом гелия; если Z = 3, это дважды ионизированный, потерявший два электрона атом лития и т. д. Движение электрона вокруг ядра в поле кулонова притяже- 163
ния аналогично движению планеты в гравитационном поле Солнца и подчиняется соотношениям, установленным Кеплером. Радиус ап п-й орбиты (в общем случае эллиптической орбиты — большая полуось) связан с периодом обращения Т определенным уравнением. Можно получить уравнение, связывающее радиус орбиты ап с полной энергией всей системы. Решая это уравнение совместно с уравнением квантования h Бор получает из всех возможных уровней энергии системы квантованный дискретный ряд, которому соответствуют радиусы орбит _ пЧ* где h — квант действия, m — масса электрона, е — его заряд, Ze — заряд ядра, а п — целое число. Для атома водорода, где Z = 1 и п = 1 (первая электронная орбита), подставив эти значения Z и п в формулу, Бор получает: Вычислив радиус n-й орбиты, Бор определил энергию Еп водородоподобного атома при движении электрона по л-й орбите и энергию Ek при движении по k-й орбите, а затем из условия частот A v = Еп —Еь. — частоты спектральных линий водорода. Они совпали с результатами наблюдений с очень большой точностью. Теория Бора достигла крупных успехов; она позволила объединить результаты спектроскопических наблюдений в стройную систему. Но она потерпела поражение при попытке перейти от водородоподобного атома к нейтральному атому гелия, т. е. к системе с д в у м я электронами, обращающимися вокруг ядра. И тогда вспомнили о компромиссной природе боровской теории. История эта поучительна для современной теоретической физики, именно для квантовой электродинамики, достигшей существенных успехов в объяснении новых экс- 164
периментальных данных при помощи допущений, не выводимых пока из более общих принципов. Можно думать, что наметившиеся затруднения приведут современную квантовую теорию к еще более радикальным неклассическим идеям, так же как затруднения теории Бора привели физику первой четверти века к переходу от компромиссной теории атома к гораздо более радикальной квантовой механике двадцатых годов. Прежде чем перейти к квантовой механике этих лет, нужно указать на одну важную для последней сторону теории Бора. Речь идет о принципе соответствия. Этот принцип был высказан Бором в связи с конкретной проблемой описания злектоонов на наиболее отдаленных от ядра орбитах, т. е. описания состояний атома, характеризующихся большими квантовыми числами п. Чем больше квантовое число л, тем ближе друг к другу соседние стационарные состояйия и тем ближе квантовое условие частот к классическому представлению о зависимости частоты излучения от частоты обращения электрона в атоме. Из классической электродинамики следует, что частота излучаемого света кратна частоте обращения электрона. Обозначая через со частоту обращения электрона, можно представить спектр излучаемых частот v, каким его рисует классическая электродинамика, уравнением v = лсо, где п — целые числа. Напротив, в теории Бора частота v определяется двумя стационарными состояниями пит. Если числа пит велики по сравнению с п—т (также целое число), то при переходе из м-состояния в т-состояние излучаемая частота будет приближенно равна v ж (п — т) со, т. е. будет кратной со. Следовательно, при больших квантовых числах квантовое условие частот приближается к классическому соотношению между частотой излучения и частотой обращения электрона. Обобщая этот результат, Бор рассматривает классические закономерности как предельный случай квантовых закономерностей. 165
4. Волны де Бройля Летом 1923 г. Луи де Бройль, готовясь к защите докторской диссертации, посвященной обоснованию квантовых условий Бора, решил изложить свои исходные идеи в «небольшой статье. Статья эта появилась в докладах парижской Академии каук в начале осени. В ней было высказано в самой предварительной форме новое представление о связи между волновыми процессами в непрерывной среде, с одной стороны, и движением дискретных частиц — с другой. В ноябре следующего, 1924 года де Бройль защитил диссертацию. Она положила начало новому периоду в развитии квантовой физики К Согласно де Бройлю, частица обладает волновыми свойствами, ее движению со скоростью v соответствует распространение волны со скоростью: Нам известно, что механическая скорость v всегда меньше скорости света с. Поэтому и — всегда больше скорости света, что не противоречит принципу относительности: принцип относительности ограничивает скорости переноса энергии и массы, которые только и могут служить сигналами. О порядке величины скорости волн де Бройля — «волн материи» — можно составить представление из простых примеров. Если пешеход передвигается со скоростью 3—5 км в час, то- волны де Бройля несутся с колоссальной скоростью, примерно равной 4 • 1016 км/сек. Движению поезда (его скорость в десять раз больше скорости пешехода) соответствует сравнительно медленное распространение волн де Бройля, которые движутся все же в несколько сот биллионов раз быстрее, чем поезд. Каким же образом эти гигантские волновые скорости, во много раз превышающие скорости света, могут быть связаны с гораздо меньшими механическими скоростями? Де Бройль объяснил это при помощи понятия групповой скорости волн. Если в одной и той же среде одновременно происходят колебания различной частоты, иными словами через 1 Ami. de Phys., (10), 3, 22 (1925), 1*6
каждую точку проходят волны различной длины, то результирующие колебания в некоторых точках могут быть очень велики. Там, где колебания будут совпадать или почти совпадать по фазе, расположатся центры групп волн. Можно доказать, что такие центры будут двигаться с сравнительно небольшой скоростью. Де Бройль отождествил скорость движения частицы v со скоростью движения центра группы волн. Частица в этой теории рассматривается как «волновой пакет» — нечто вроде пункта, где интерференция волн создает особенно энергичное колебание. Такой волновой пакет движется со скоростью v. Чтобы подробнее и точнее изложить теорию де Брой- ля, нужно напомнить читателю некоторые понятия и формулы, относящиеся к распространению волн. Как известно, волновой процесс, когда отклонение колеблющейся величины 5 (координата, напряженность поля, вероятность какого-либо события и т. п.), от положения, около которого она колеблется, является простой периодической функцией времени, описывается выражением: 5 = A sin (2Ы + <р0). Здесь А — амплитуда, v — частота колебания, а <р0 — начальная фаза. Все выражение в скобках называется фазой колебания. Периодом колебания Т называется время, через которое повторяются значения S, так что Т «—. Фаза колебания в некоторой точке, находящейся на расстоянии х от источника' колебаний, может быть представлена формулой: где и — скорость, с которой поверхность постоянной фазы удаляется от источника, т. е. фазовая скорость. Здесь мы предположили, что начало отсчета времени выбрано так, что / = О, когда S ■= 0. В противном случае приходится ввести в формулу начальную фазу колебания Тогда фаза <р выразится формулой: <р = 2w[(t — £) + <Ро. 167
Учитывая связь тригонометрических и показательной функций по формуле Эйлера, колебательный процесс можно описывать также выражением: § = а.еъ*м9 где а — амплитуда (вообще комплексная) колебания, i — мнимая единица. Кроме понятий амплитуды, фазы, фазовой скорости, частоты, периода и длины волны, нам понадобится впоследствии еще одно понятие. Это волновой вектор к. По направлению он совпадает с положительной нормалью к поверхности равной фазы. Абсолютная величина волнового вектора — обратная величина длины волны — число волн на единицу длины, т. е. волновое число, о котором уже говорилось: До сих пор речь шла о правильных синусоидальных колебаниях. Однако реальные периодические колебания не носят столь правильного характера. Более того, периодические колебания, строго говоря, вообще не осуществляются в природе. Периодичность в строгом смысле означает, что как бы ни увеличивалось время t, периодическая функция f(t) через равные промежутки времени — периоды Г— принимает одни и те же значения № = f(t + nT), и это остается справедливым при всяких значениях п: — оо > я > + оо. Но реальные периодические колебания не бесконечны, они в то или иное время возникают и прекращаются. Они ограничены и в пространстве: волновые процессы где-то начинаются и где-то заканчиваются. С этим затруднением математика справляется просто— она изображает волновой процесс бесконечной синусоидой. В случае отступлений от синусоидальной формы функция, описывающая периодический процесс, может быть разложена в спектр, т. е. на синусоидальные составляющие. Если некоторая периодическая функция изменяется негармонически, то ее согласно теореме Фурье можно представить в виде разложения по гармоническим функ- 168
циям — ряда Фурье — с различными частотами, кратными частоте разлагаемого негармонического колебания: v, 2v, 3v,.... Когда речь идет об электромагнитных колебаниях, то составляющие колебания с кратными частотами дадут дискретный спектр с идеально тонкими линиями, каждая из которых соответствует только одной частоте (если бы частоты, соответствующие линии, несколько отличались друг от друга, линия была бы размазанной, она охватывала бы конечный участок спектра). Оптические наименования можно применить в отношении и других функций и во всех случаях называть разложение функции в ряд Фурье — разложением в спектр или спектральным разложением. Можно применить и акустические наименования и назвать гармоническое колебание с наинизшей частотой основным тоном, а составляющие — обертонами. Коэффициенты, фигурирующие в разложении,— так называемые коэффициенты Фурье — представляют собой амплитуды обертонов. Амплитуды могут быть и положительными и отрицательными. Интенсивности, напротив, могут быть только положительными: они измеряются квадратами амплитуд. Все эти понятия можно обобщить и таким образом сохранить для случая непериодических колебаний. Ряд Фурье заменяется при этом интегралом Фурье — интегралом по частоте. Здесь уже нельзя говорить о разложении в дискретный спектр. Частоты изменяются непрерывно, и функция здесь разлагается в непрерывный спектр. Этих сведений об изображении волновых процессов нам достаточно, чтобы в дальнейшем меньше загружать отступлениями изложение работ де Бройля, Шредингера и Гейземберга. Де Бройль, решая проблему, поставленную на десять лет. раньше Бором, опирался на специальную теорию относительности, появившуюся за двадцать лет до этого, и широко применял и развивал мысли Гамильтона, имевшие уже столетнюю давность. Но де Бройль шел и дальше в ретроспективном анализе и обобщении старых физических теорий, он восходил к основным идеям оптики и механики XVII—XVIH вв. 169
В истории физики новейшего времени, да и предыдущего периода, анализ старых теорий, их интерпретация и обобщение подчас настолько тесно связаны с новыми идеями, что глубина исторических экскурсов, интерес к прошлому науки, величина исторического интервала, анализируемого мыслителем, иногда становятся признаком и мерой оригинальности и широты новых идей. Неслучайно Эйнштейн повесил в своем рабочем кабинете портреты Фарадея и Максвелла. Де Бройль имел основания сделать то же самое в отношении Ферма, Мопертюи и Гамильтона. В своей диссертации де Бройль исходил из аналогии между двумя широкими обобщениями классической физики, принципом кратчайшего времени распространения света и принципом наименьшего интеграла механической скорости при движении материальной точки. Этот ход мысли представляет первостепенный исторический интерес. Оба принципа — вариационные. Тот факт, что де Бройль исходил из этих принципов, показывает не только историческую связь между классической физикой й новой, но и особую роль экстремальных законов и вариационных принципов в переходе старой физики в новую и их особое место в классической физике, рассматриваемой ретроспективно. Напомним содержание принципа кратчайшего времени распространения света. В древности (в эллинистический период) знали, что законы отражения света могут быть выведены из требования, чтобы длина пути света была кратчайшей. Об этом писал Герон Александрийский. Здесь речь шла о кратчайшем расстоянии. Определенный таким требованием путь совпадает с путем, требующим кратчайшего времени, так как при отражении скорость света остается одной и той же. В более общем случае, когда скорость света меняется, законы оптики вытекают из требования наименьшего времени. Этот принцип был высказан в XVII в. Ферма. Поясним его примером — преломлением света при переходе из одной среды, где скорость света — щ, в другую, где скорость света — и2. Световой луч направлен из точки А в первой среде к точке В во второй среде. Путь света в первой среде равен $ь во второй — s2. Время, необходимое для прохождения света по отрезку s\ + 52, равно: 170
При действительном распространении света от Л и В эта сумма имеет наименьшее значение. Если перед нами не две среды с постоянной для каждой из них скоростью света, а среда, где скорость света меняется непрерывно, мы берем интеграл обратного значения фазовой скорости, т. е. от — по пути АВ в г ds А который при действительном распространении света будет наименьшим. В символах вариационного исчисления это требование записывается так: А Через сто лет был найден общий принцип, которому подчиняются движения частиц вещества. Мопертюи и затем Эйлер показали, что при движении частицы от точки А в точку В интеграл от механической скорости v, взятый по пути АВ, должен быть наименьшим: в b\vds = Q. А В принципе Мопертюи — руководящем принципе механики — механическая скорость v играет ту же роль, что обратная величина волновой скорости в руководящем принципе оптики — принципе Ферма. Принцип Мопертюи можно получить из принципа Ферма, если предположить, 1 что v пропорционально — , что механическая скорость есть проявление какого-то волнового процесса с фазовой скоростью и, и эти величины v и и связаны постоянным коэффициентом пропорциональности. На аналогию между принципами Ферма и Мопертюи впервые обратил внимание Гамильтон. Вместе с тем Гамильтон вслед за Эйлером и Лагранжем придал рациональную форму принципу Мопертюи. Механики 171
XVIII—XIX вв. показали, что все соотношения классической механики могут быть получены из принципа, получившего название принципа наименьшего действия. Согласно этому принципу при движении частицы из точки А в точку В интеграл от импульса частицы mvno пути будет наименьшим: в 8 \ tnvds = 0. А Этот интеграл имеет размерность действия, т. е. импульса, помноженного на пространственное расстояние, либо, что то же самое, энергии, помноженной на время. Теперь можно продолжить аналогию между распространением света и движением частицы. До сих пор речь шла о луче, с одной стороны, и траектории частицы — с другой. Но луч — это нормаль к сферической поверхности равной фазы волны. Соответственно в механике можно рассматривать вектор количества движения р как нормаль кповерхности равного действия №. Можно выразить принцип наименьшего действия в волновой форме. Представим себе волнообразное распространение действия, иначе говоря представим действие как фазу некоторой волны, распространяющейся из источника во все стороны. Но фаза — безразмерная величина. Поэтому в механике фазе соответствует отношение действия W к некоторой константе Л, имеющей размерность действия. Скорость распространения «волн действия», т. е. скорость движения поверхности равного действия (аналогичной поверхности равной фазы в оптике), равна = — = — р mv ' где Е — энергия движущейся частицы, г р — импульс. Эта скорость, очевидно, обратно пропорциональна скорости частицы v. Напомним, что фазовую скорость и волны можно выразить через волновой вектор к и частоту м: 172
В механике этой скорости соответствует фазовая скорость «волн действия»: Е . \Р\ Теперь сопоставим групповую скоростьв оптике и скорость частицы в механике. Обе эти величины получаются дифференцированием только что написанных. Групповая скорость световых волн равна а скорость частицы получается дифференцированием фазовой скорости «волны действия»: dE dp' Таким образом, можно перейти от оптики к механике, заменив частоту v энергией £, а волновой вектор к — импульсом р. Энергия и импульс принадлежат частице, частота и волновой вектор — волне. Их связывает друг с другом коэффициент А, имеющий размерность действия: Е р Высшим взлетом обобщающей мысли де Бройля было предположение, что этот коэффициент совпадает с постоянной Планка — квантом действия. Тогда энергия частицы выражается через частоту, а импульс — через волновой вектор: Е = ftv, р = 1гк. Отсюда выводится выражение для длины X де-брой- левых волн. Абсолютная величина волнового вектора об- ратна длине волны, поэтому, подставляя в выражении для импульса вместо k = 1/Х , получаем р=й/Х, откуда: Х = —= — р ~~ mv 173
Для вычисления частоты v нужно воспользоваться релятивистским выражением энергии Е = тс2: тс2 v==—• Применение релятивистского соотношения между энергией и массой — одна из самых важных с исторической точки зрения идей де Бройля. Его теория оказывается в известном смысле обобщением релятивизма и квантовой теории. В самом деле, де Бройль связывает два основных определения энергии: релятивистское Е = тс2 и квантовое £ = /iv. Таковы основные утверждения теории де Бройля. Они позволили преодолеть наиболее серьезную в то время трудность в развитии квантовой физики — вывести квантование орбит электрона из более общего принципа и тем самым освободиться от произвольного выбора «разрешенных» орбит. В двадцатые годы квантовая теория в своем развитии подошла к такому этапу, когда физическое истолкование квантовых условий Бора для электронных орбит стало очередным требованием физики, и отсутствие такого истолкования перестало перекрываться успехами модели Бора. Можно назвать немало аналогичных исторических моментов, в которые затруднения теории при объяснении более широкого круга явлений заставляет вспомнить о ее общих основах. По-видимому, к такому моменту подходит современная квантовая электродинамика. В начале двадцатых годов тенденция к объединению оптики (т. е. электродинамики) с механикой имела в своем активе ряд крупнейших открытий — теорию относительности, теорию квантов действия, теорию фотонов, боровскую модель атома. Затруднения последней, казалось, могли быть решены еще более радикальным включением оптических (электродинамических) констант и понятий в механику, именно в механику атома. Де Бройль рассматривает механику электронов (а тем самым и механику вообще) с точки зрения оптико-механической аналогии. Геометрическая оптика справедлива, пока мы не должны принимать во внимание конечную 174
длину световых волн; строгой она является лишь для бесконечно малых длин волк. Может быть, и классическая механика строго справедлива лишь при бесконечно малых длинах «волн материи»? Может быть, отступления от классических законов, открытые Бором внутри атома, можно объяснить, приняв во внимание волновые поправки к классическому представлению движения? Де Бройль рассматривает периодическое движение по замкнутой орбите, т. е. именно тот случай, который встречается в боровской модели атома. Посмотрим, как выглядит такое движение в волновом представлении. На каждом элементарном отрезке dr круговой орбиты разность фаз d<f равна: где и = Ь — фазовая скорость волн де Бройля, соответствующих движению частицы. Если в точке А фаза равна <рл» то в точке В она равна: в ?в = Тл — 2* jV* А Будем двигать точку В по круговой орбите, сначала удаляя ее от Л в одном направлении, а затем приближая к А с другой стороны, пока она не подойдет к Л и не совпадет с ней. Будет ли срв, вычисленная по предыдущей формуле, совпадать с фазой срл ? Для этого необходимо, чтобы фаза <рв, пройдя по круговой орбите, изменилась на 2тс, где п — целое число: ?в — ?л = ±2/г*. Подставляя это условие в выражение для <?в и интегрируя по замкнутому пути—именно таков теперь путь of Л к В — находим:
Импульс частицы i . h \Р\=х можно ввести в это выражение и получить: ф pdr = nh. Если частица движется по круговой орбите с постоянной скоростью, общее уравнение принимает еще более простую форму: dr «= лХ, т. е. ©озможмы лишь такие орбиты, на которых длина волны укладывается целое число раз. В этом случае момент количества движения L (т. е. количество движения частицы, умноженное на радиус орбиты) подчиняется условию: 2тХ = nh. Это и есть условие квантования водородного атома. Если указанное условие выражает волновую природу движения частицы, то, быть может, классическая механика в целом, подобно геометрической оптике, есть лишь предельный случай волновой механики, строго справедливый только для бесконечно малых длин де-бройлевых волн. Что касается геометрической оптики, то ее границы демонстрируются интерференцией и диффракцией света. Может быть, и движение частиц обнаруживает аналогичные свойства, когда длина де-бройлевых волн становится существенной? Эксперимент ответил утвеодительно на этот вопрос, и это было важнейшим событием в истории квантовой механики. Как бы много ни давала науке каждая новая ступень теоретического исследования, какие бы новые стороны и соотношения фактов ни раскрывали все более совершенные, мощные и изящные методы математической разработки физических проблем, все же действительно новый период в развитии физики всегда связан с новыми экспериментальными наблюдениями, измерениями, ставшими § 176
возможными благодаря прогрессу производственной и экспериментальной техники. Более того, каждая новая физическая теория, преобразующая картину мира, доказывает свою нетривиальность и силу, когда она предвидит явления, которые можно обнаружить решающими экспериментами. Возможность experimentum cruris — важнейший критерий исторической подготовленности теории. Экспериментально разрешимые задачи складываются в непрерывный исторический путь научного прогресса. Теория тяготения Ньютона без астрономических открытий XVIII в., периодический закон без открытия галлия, скандия и германия, теория относительности без результатов экспедиций 1919 г. не проиграли бы в своей логической стройности, но историческая роль их была бы иной. Для истории волновой и квантовой механики первостепенное значение имеют эксперименты 1925—1927 гг., показавшие наличие диффракционных явлений при движении электронов. Вскоре после опубликования работы де Бройля Эйнштейн высказал мысль о неизбежности диффракционных явлений при движениях электронов, явлений, которые можно обнаружить в случае медленных движений К Теория де Бройля связывает длину волн материи со скоростью механического движения частиц. Длина волны равна постоянной Планка, деленной на импульс частицы: mv Если речь идет об электроне, то при достаточно малой скорости v длина волны X принимает значения, допускающие экспериментальное обнаружение диффракции. То же относится к протонам. Поэтому, указывал Эйнштейн, при очень низких температурах, когда длина де- бройлевых волн становится одного порядка с диаметром молекулы, можно ожидать аномалий диффракционной природы. Такие аномалии уже наблюдались не раз. Всего за год до работы Эйнштейна Гюнтер наблюдал неожиданное ускоряющееся падение вязкости водорода при достижении определенной области низких температур 2. Эйнштейн предложил объяснить подобные отклонения, характерные для низких температур, диффракцией де-бройле- » Sitzungber. Berl. Akad. d. Wiss., 9, (1925)\ 2 Zeitschr. f. Phys. Chemie, 110, 626 (1924). 177
вых волн. Вскоре Эльзассер 1 отметил, что диффракцион- ные явления должны наблюдаться и при столкновениях свободных электронов с атомами. И здесь уже имелись наблюдения, ожидавшие объяснения, в частности значительное увеличение путей свободного пробега медленных электронов при прохождении через благородные газы. Специальные опыты были поставлены в 1927 г. Дэвис- соном и Джермером2. Дэвиссон и Джермер направляли узкий пучок электронов на монокристалл никеля. При помощи гальванометра измерялось число электронов, рассеянных под разными углами. Число это давало в некоторых направлениях резко выраженные максимумы. Картина напоминала рассеяние кристаллом рентгеновских лучей. Если бы на кристалл падали лучи определенной длины, картина оказалась той же, какую наблюдали Дэвиссон и Джермер (если учесть также эффект преломления волн де Бройля). По распределению максимумов рассеянных электронов можно было определить длину волн, которые вызвали бы благодаря диффракции аналогичную картину. Такая длина волны в согласии с теорией де Бройля оказалась равной h\mv. В 1928 г. Г. П. Томсон3 произвел опыты с прохождением электронов через тонкие металлические фольги. Он пользовался сравнительно быстрыми электронами (20— 30 тыс. электрон-вольт), которым соответствовала длина де-бррйлевых волн порядка 10 " см. Пройдя сквозь фольгу, электроны попадали на фотографическую пластинку. На ней появились диффракционные круги, как при прохождении через фольги рентгеновых лучей. По размерам кругов была вычислена длина де-бройлевых волн, оказавшаяся в согласии с теорией. Такие же опыты производил П. С. Тартаковский 4. В 1927—1928 гг. и позже было сделано не мало аналогичных опытов. Все они подтвердили теорию де Бройля. 5. Уравнение Шредингера Теория де Бройля открыла серию широких и смелых обобщений в области физики, следовавших друг за дру- 1 Naturwiss., 13, 711 (1925). 2 Phys. Rev., 30, 705 (1927). 8 Proc. Roy. Soc, 117, 600 (1928). 4 П. С. Тартаковский. Экспериментальные основания волновой теории материи, ГТТИ, 1932. 178
гом с частотой, которая раньше представлялась бы немыслимой. Каждый год, вернее каждые несколько месяцев, появлялась новая идея, казавшаяся рубежом двух эпох в истории науки: старой, охватывающей всю предшествующую физику, и новой, начатой предлагавшейся теорией. Вскоре эта идея оказывалась подходом к еще более радикальной идее. Темп прогресса становился все более стремительным, а самый характер новых теорий — все более радикальным в смысле отказа от классических идей. Даже генезис теории относительности не был таким концентрированным во времени: после специальной теории относительности прошло десять лет до более радикального ее обобщения. В тридцатые годы последовали гигантские по своему значению экспериментальные открытия в области атомного ядра и элементарных частиц и широкая разработка квантовой и релятивистской квантовой механики. Но в общих принципах физической теории таких радикальных переворотов, как в 1925—1927 гг. уже не происходило. Сравнительно органическое развитие теории в тридцатые—сороковые годы и в первой половине пятидесятых, по-видимому, сменится новым критическим периодом — об этом говорит ряд симптомов, о которых речь впереди. Наиболее быстрое развитие теории началось почти через год после опубликования диссертации де Бройля, когда Гейзенберг и Шредингер выступили с новыми концепциями. Статья Гейзенберга была опубликована в конце 1925 г. *, а статьи Шредингера — в начале 1926 г.2 Но теория Шредингера ближе к идеям де Бройля, она служит непосредственным логическим продолжением этих идей. Только что было сказано о характерной черте развития теоретической физики в 1924—1927 гг. Каждая из последовательно появлявшихся концепций была настолько революционной, что и сейчас может претендовать на роль начального звена квантовой механики. Теория де Бройля ввела в науку коллизию волнового и корпускулярного представления материи как универсальную идею физиче- 1 Zeitschr. f. Phys. 33, 879 (1925). 2 Ann. d. Phys., 79, 361 и 489 (1926); 80, 437 (1926); 81, 109 (1926). 179
ской картины мира. Гейзенберг, Борн и Иордан открыли такую фундаментальную особенность квантовой механики как применение матриц, с которыми квантовая механика получила специфический математический аппарат. Операторное исчисление, теория преобразований Иордана — Дирака и принцип неопределенности могут оспаривать друг у друга титул начального открытия, от которого ведет свое летоисчисление квантовая механика. С известной точки зрения и теория Шредингера может считаться началом новой механики микромира. Она содержит основное уравнение такой механики. Историческая роль этого уравнения станет яснее, если вспомнить об основных уравнениях движения, найденных классической физикой. При помощи этих уравнений можно получить координаты системы, т. е. положение в пространстве всех входящих в систему частиц, и импульсы, одним словом — состояние системы в любой момент времени /, если мы знаем состояние системы для / = 0. В этом и состоит классическое механическое понимание детерминизма: состояние механической системы п один момент полностью определяет ее состояние в каждый последующий момент. Если считать природу в целом большой механической системой, а именно так думали в XVII—XVIII вв., то на сцену появляется знаменитое высшее существо Лапласа, знающее координаты и скорости всех частиц Вселенной и способное предсказать любые события, в том числе историю людей. В XIX в., если иметь в виду передовых мыслителей того времени, природу уже не считали механической системой, и образ, витавший в сознании Лапласа, уже не соответствовал научной картине мира, включавшей сложные формы движения, не сводимые к изменению пространственных координат частиц вещества. Но никто в XIX в. и в первой четверти XX в. не сомневался, что для механических систем состояние системы в момент t = 0 с абсолютной точностью предопределяет состояние системы в любой другой момент t. Никто не сомневался при этом, что состояние системы представляется вполне определенным в каждый момент по всем характеризующим его величинам. Основной образ классической механики — это частица, движущаяся в пространстве некоторого тела отсчета, т. е. 180
изменяющая свои координаты в системе, связанной с телом отсчета, в той или иной, линейной (инерционное движение) или нелинейной (ускорение, движение в силовом поле) зависимости от времени. Этот образ — явный или неявный — логический исток кинетических, динамических и атомистических идей XVII—XIX вв. и всей классической картины мира. Наука XVII—XVIII вв. стремилась свести картину мира к одноцветному, механическому представлению движущихся частиц; в XIX в. картина мира стала многокрасочной, наука узнала о несводимости сложных форм движения к более простым. Но если спросить, к какому именно механическому представлению не сводилась классическая картина мира (а вопрос этот, несмотря на внешнюю парадоксальность и близость к анекдотическому «без какого варенья хотите Вы чаю?», вполне законен), то таким представлением будет изменение координат частицы в зависимости от времени. Классическая картина мира не сводилась к нему, но была неотделима от него. В новой картине мира представление о координатах материальной точки, изменяющихся во времени, уже не является наиболее общим представлением. В квантовой механике состояние системы описывается волновой функцией, с помощью которой определяется вероятность того или иного состояния системы. Уравнение, найденное Шредингером в 1925 г., имело прообраз — волновое уравнение классической физики. В классическом волновом уравнении величина ф —функция координат и времени. Но волновое уравнение никогда раньше не рассматривали в качестве основного по отношению к уравнениям движения частицы и никогда не думали состояние системы частиц описывать заданием волновой функции. Это сделал Шредингер. Теория Шредингера и теория де Бройля близки друг к другу по логической структуре. В обоих случаях имел место синтез самых широких обобщений классической механики (принцип наименьшего действия), с одной стороны, и волновой оптики — с другой. В теории де Бройля классическая оптика фигурировала в виде геометрической оптики, подчиняющейся принципу Ферма. В теории Шредингера ее заменила более общая волновая оптика, подчиняющаяся принципу Гюйгенса. Этот принцип состоит в утверждении, что каждая точка, которой достигает волна, 181
сама становится центром волн, распространяющихся во все стороны. Принцип Гюйгенса объясняет и прямолинейное распространение света в оптически однородных средах (таковым оно представляется в областях, больших по сравнению с длиной волны) и явления диффракции. Переходя от принципа Ферма к принципу Гюйгенса, мы тем самым изменяем метод изучения волновых явлений. Нам даны локальные характеристики — поведение или состояние величины ty в бесконечно малых областях, вернее нам даны производные этой величины, и мы находим ее интегральные значения. Математически этому соответствует решение дифференциальных уравнений. Волновой процесс описывается дифференциальным уравнением, в котором, с одной стороны, стоит вторая производная волновой функции ф по времени, а с другой,— сумма вторых производных ф по координатам с множителем, равным квадрату фазовой скорости и: £!* - „2 (?Имд1*1 *!*\ dt* ~~ и \дх* ^ ду* "*" dz*J ' Операция, состоящая в получении вторых производных некоторой функции по координатам и суммировании этих производных, обозначается символом у2 — оператором Лапласа. Если применить этот символ к написанному выше уравнению, то оно примет вид: Это уравнение описывает распространение колебаний величины ф (волн) с фазовой скоростью и. Предположим, что колебание чисто синусоидальное, т. е.: ф = A sin ср. При этом фаза равна: «p = 2*v (<--£) +е. Дифференцируя <|> два раза по t, будем иметь: gT_ A qgiil - -4ЛМ sin? = -4Л'4>. 182
Отсюда можно дифференциальное волновое уравнение написать в виде: 0, , 4rc2v2 . Л Далее Шредингер переходит к обобщению этого уравнения для синусоидальной волны на случай движения частицы. Количество движения одной частицы связано с оптическими величинами — частотой v и фазовой скоростью и соотношением: V* и* Л2 * Это соотношение позволяет перейти к механическим величинам — массе т и механической скорости v в волновом уравнении. Массу т и скорость v можно выразить через полную энергию Е и потенциальную энергию V, так как кинетическая энергия равна их разности: После указанных подстановок волновое уравнение принимает вид: Это и есть уравнение Шредингера. Оно было связано с определенной физической гипотезой. Для Шредингера реальны лишь волны; они лежат в основе корпускулярных явлений. Ученый писал, что возможно «усмотреть в принципе Гамильтона также результат игры волн, который собственно и лежит в основе движения материальных точек, точно так же, как мы уже давно привыкли видеть волны в явлениях света с их принципом Ферма» 1. Физическая интерпретация уравнения Шредингера могла быть найдена отнюдь не сразу. К ней шел долгий и сложный, поныне незавершенный путь. Непосредствен- 1 «Современная квантовая механика». Сб. статей, М.— Л., 1934, стр. 48. 183
ным эффектом теории Шредингера была возможность квантования энергии, получения дискретных значений энергии. Здесь необходимы некоторые пояснения, относящиеся к теории дифференциальных уравнений. Поиски и создание математического аппарата квантовой механики отражали общий характер картины мира, развитие которой прослеживается в этой книге. Физическое представление о дискретности энергии искало адекватного математического представления. Пока сама идея дискретности выступала как частная идея, объясняющая некоторые особенности спектров, некоторые свойства излучения и структуры атома, пока можно было удовлетвориться произвольным выбором квантованных орбит в модели Бора, требование общего математического аппарата, автоматически дающего дискретные решения, не было слишком настоятельным. Но когда квантование электронных орбит начали объяснять общими, охватывающими всю природу физическими соотношениями, дело изменилось. Первоначально в континуальной по своим исходным принципам системе анализа бесконечно малых искали разделы, откуда можно было взять математические методы квантования. Теория Шредингера, взятая со стороны ее математического аппарата, была первой крупной находкой. Шредингер обратил внимание на один факт, давно установленный в теории дифференциальных уравнений. Представим себе дифференциальное уравнение, в которое входят, во-первых, некоторые постоянные параметры и, во-вторых, функции пространственных координат, т. е. величины, меняющиеся от точки к точке. При некоторых значениях постоянных параметров дифференциальное уравнение имеет однозначное конечное и непрерывное решение, т. е. мы получаем непрерывную однозначную функцию координат во всем пространстве с определенным значением в каждой точке пространства. Такая функция, иными словами такое решение дифференциального уравнения, называется фундаментальной функцией, а дискретные значения параметров, при которых такие решения возможны,— характеристическими числами уравнения. В уравнении Шредингера для частицы v24> + ^(£-m = o 184
полная энергия частицы Е — постоянный параметр, а потенциальная энергия V — функция координат, меняющаяся в пространстве от точки к точке. Непрерывные, конечные и однозначные решения уравнения Шредингера получаются в том случае, когда параметр — полная энергия (отрицательная) принимает дискретные значения. Одной из первых задач квантовой механики было вычисление дискретного ряда значений энергии линейного осциллятора, которому Планк уподобил каждый элемент излучающего черного тела. В теории Планка энергия линейного осциллятора принимала значения, кратные элементарному кванту энергии. Совпадают ли с этим выводом результаты квантования путем вычисления характеристичных чисел? Такое вычисление приводит к иному выводу: энергия линейного осциллятора оказывается равной нечетному кратному половины кванта энергии E=b(n + у). Она может принимать значения: to « to г to 7 to Как мы видим, результат отличается от теории Планка. Планк в 1900 г. предположил, что энергия может принимать значения, кратные целому кванту энергии: 0, Av, 2/iv, 3/iv, 4ftv ... и т. д. Согласно теории Шредингера положение иное: энергия осциллятора содержит нечетное число у. Есть и другое отличие теории Шредингера от теории Планка. В последней энергия осциллятора могла быть нулевой. При температуре абсолютного нуля частицы, играющие роль осцилляторов, не движутся. Соответственно тепловая энергия твердого тела, сводящаяся к энергии таких колебаний, обращается в нуль. В теории Шредингера такое положение признается недостижимым: энергия и при абсолютном нуле не исчезает, каждый осциллятор сохраняет энер- гию, равную -j. В дальнейшем Шредингер применил тот же метод характеристических чисел к другому случаю движения 185
частицы, случаю, играющему первостепенную роль в теории атома. Речь идет о ротаторе — системе, представляющей частицу, находящуюся на одном и том же расстоянии от неподвижного центра и движущуюся вокруг него либо в одной плоскости (неподвижная ось), либо в разных плоскостях, т. е. на поверхности шара (свободная ось). И в этом случае энергия оказалась кратной yAv. Такой результат позволил объяснить некоторые детали спектроскопических наблюдений. Пока речь шла об одной частице, волновая функция ф сохраняла непосредственный физический смысл. Можно было представить себе, что в пространстве распространяются волны, которые и определяют некоторые эффекты в движении частицы со скоростью, связанной соотношением де Бройля с фазовой скоростью волн. Теория Шре- дингера не теряла наглядного характера, приданного волновой механике де Бройлем. Но с переходом к задачам, где фигурировало несколько частиц, положение изменилось. Потребовалось обобщенное уравнение. Оно имеет следующий вид: где ть т2>... и т. д.— массы движущихся частиц, a vJ'V*»-- и т. д.— соответствующие операторы Лапласа. Здесь уже волновая фракция ф — это функция не трех пространственных координат и времени, а большего числа переменных. Каждая частица независимо движется в трех измерениях, т. е. ее положение в пространстве характеризуется тремя переменными. В случае п частиц таких переменных Ъп. Разумеется, к множеству упорядоченных систем, состоящих каждая из Ъп чисел, можно применить геометрические соотношения. Но это будут соотношения многомерной геометрии, именно — Зя-мерной, изучающей «пространство», каждая точка которого задана Ъп координатами. С таким, так называемым конфигурационным пространством мы еще встретимся. Сейчас отметим только, что при переходе к пространству конфигураций волновое уравнение теряет непосредственно наглядный характер. Волновая механика делает тем самым значительный шаг в сторону представлений, лишенных непосредственной 186
наглядности. Впрочем, физические представления никогда не бывают непосредственно наглядными; история науки показывает, какие усилия абстрактной мысли понадобились, чтобы понятия классической физики (начиная с изотропности пространства и не падающих «вниз» антиподов) обрели наглядность. С другой стороны, принципиальная наглядность присуща каждой физической теории, отличающей действительный четырехмерный пространственно-временной континуум от условных «пространств». Принципиальная наглядность — псевдоним физической интерпретируемости. Существуют заведомо неинтерпре- тируемые, фиктивные построения: они не обладают принципиальной наглядностью. Но относительно не наглядные символические построения с течением времени получают физическую, пространственно-временную интерпретацию и становятся элементами картины мира. В этом существенная сторона научного прогресса. Более того, широкое использование заведомо условных «лространств» позволяет скорее, полнее и конкретнее интерпретировать символы, и в этом смысле история так называемых «формализмов», физической интерпретации относительных символов, выключения из окончательных, подлежащих физической интерпретации уравнений условных фикций-входит в историю физической картины мира. Теория Шредингера сделала большой шаг к использованию условных символов. Но еще больший шаг сделала в этом направлении появившаяся за несколько месяцев до статьи Шредингера, статья Гейзенберга, положившая начало квантовой механике в собственном смысле. 6. Матрицы Упомянутая выше статья Гейзенберга1 начинается декларацией, направленной против ненаблюдаемых величин. В теорию микромира, по его мнению, должны входить только наблюдаемые величины. Теория Бора вычисляет энергию водородного атома и другие наблюдаемые величины при помощи ненаблюдаемых величин, в частности положения и периода обращения электрона. Однако правила теории Бора пригодны лишь в самом простом случае, они не годятся для многоэлектронных систем и 1 Zeitschr. I. Phys., 33, 879 (1925). 187
других более сложных условий. Может быть, недостаточность правил квантования зависит от их недостаточной «классичности» и вызвана отклонением от классической механики? «Это объяснение навряд ли разумно,— пишет Гейзенберг,— ведь универсальное по своему значению условие частот, введенное Бором, является таким радикальным отказом от классической механики, или — это будет лучше сказано с точки зрения волновой теории — от классической кинематики, что даже для простейших квантовых задач нельзя говорить о справедливости классической механики». По мнению Гейзенберга, недостаточность квантовой теории, напротив, вызвана применением ненаблюдаемых классических образов положения и периода обращения электрона в атоме. Вместо имеющихся правил нужна квантовая механика, аналогичная классической и использующая соотношения только между наблюдаемыми величинами. Итак, в физическую теорию должны входить лишь принципиально наблюдаемые величины. Редкие утверждения в физике подвергались такому далеко идущему метафизическому абсолютизированию, как этот тезис Гейзенберга. Принцип трактовался в позитивистском духе: физическая реальность существует, поскольку она является предметом наблюдения. Но научные идеи имеют свою собственную судьбу и свой смысл, часто отличающийся от замысла и понимания творца теории. Научные теории складываются в объективную, развивающуюся, все более конкретную физическую картину мира не механически, не так, как кирпичи складываются в здание. Они при этом меняют объекты и границы применения, расширяют и сужают эти границы, меняют форму, приобретают новую интерпретацию и все в большей степени становятся элементами картины мироздания. Действительный смысл теории часто устанавливается после значительного изменения первоначальной интерпретации. На первый взгляд методологическое требование Гейзенберга противоположно тенденции де Бройля и Шре- дингера. Создатели волновой механики стремились вывести законы микромира из классических по духу моделей волнового пакета, волн материи и т. д. Создатели квантовой механики и в первую очередь Гейзенберг, стремились радикально отказаться от классических представлений, 188
связанных с картиной электрона, движущегося в атоме по определенной орбите, с определенным импульсом. Они пришли к эквивалентным представлениям. Это выяснилось уже в 1926 г. Но сейчас для нас ясно, что эквивалентность результатов Шредингера и Гейзенберга уже содержалась в их замыслах, внешне противоречащих друг другу. Де Бройль и Шредингер хотели вывести парадоксальные условия Бора — Зоммерфельда из классических идей. Они увидели в классической теории волн аналогии и модели, с помощью которых можно получить дискретные физические величины. Теория дифференциальных уравнений дала математические приемы для их вычисления. Гейзенберг вопреки многочисленным заявлениям об априорной «принципиальной наблюдаемости», по существу, ставил перед собой аналогичную цель, он искал пути перехода от континуально-классических понятий атомной механики к дискретно-квантовым. Уже в первом, «доматричном», варианте квантовой механики Гейзенберг хотел заменить непрерывные по своей природе положения электронов дискретными, квантовыми величинами. Его статья так и называлась: «О квантовом истолковании кинематических и механических соотношений». Дело не в наблюдаемости или ненаблюдаемости величин, дело в их природе, в неклассическом, несводимом к перемещению дискретных частиц в зависимости от времени характере явлений, обнаруженных атомной физикой. Классическая (хотя и с изъяном — парадоксальными квантовыми условиями) картина электронов, движущихся по орбитам вокруг ядра и обладающих классическими свойствами пространственной локализации и индивидуальности, многое объяснив, оказалась все же недостаточной. Де Бройль и впоследствии Шредингер заменили электрон волновым пакетом; Гейзенберг пошел иным путем. Он рассматривает колебания координат электрона. Их нужно заменить иным представлением, из которого вытекали бы квантовые условия. Колебания координат электрона, т. е. одиозный «принципиально ненаблюдаемый» процесс можно было разложить в ряд гармонических колебаний согласно теореме Фурье. Задача Гейзенберга состояла в том, чтобы перейти от координат движущегося электрона, от электронных орбит к энергетическим уровням атома и к частотам и интенсивностям спектраль- 189
ных линий. Такой переход существует и ь классической теории. Классическая теория сопоставляет электронную орбиту наблюдаемым частотам и амплитудам электромагнитных волн, излучаемых электроном при движении по этой орбите. Зная амплитуду и фазу каждой волны, мы можем найти коэффициент в разложении Фурье. Каждый коэффициент Фурье соответствует в классической теории определенной энергии атома. Если заданы все амплитуды и частоты излученных волн и, следовательно, заданы коэффициенты Фурье, мы можем однозначно определить орбиту электрона. В квантовой теории — положение несколько иное. И здесь совокупность амплитуд и частот излучения можно считать полной характеристикой атомной системы. Но нельзя рассматривать амплитуды и частоты излучения как результат движения электрона по орбите, результат колебаний координат электрона при данном состоянии атома. Гейзенберг предлагает вместо коэффициентов Фурье в разложении классического колебания электрона ввести величины, соответствующие этим классическим коэффициентам, но существенно иные. Главное отличие этих величин, заменяющих коэффициенты разложения классического орбитального движения, состоит в двойственности, в соответствии каждой величины двум стационарным состояниям. Коэффициенты Фурье в разложении периодического движения электрона по орбите соответствуют каждый определенной энергии состояния. В новом квантовом разложении каждый коэффициент q соответствует переходу атома из состояния п в состояние т. В теории Бора из представления об энергетических уровнях, разность которых соответствует спектральной линии, т. е. определенной частоте, следовала рациональность горизонтально-вертикальной записи уровней энергии. Гейзенберг реализовал эту идею, содержавшуюся implicite в теории Бора. Он представил состояния и переходы в виде таблицы, где диагональные члены обозначали стационарные состояния, а остальные члены — переходы из одного стационарного состояния в другое. Замена рядов квадратными таблицами, представление физических соотношений двойными множествами — характерная особенность теории Гейзенберга, 190
Когда Гейзеиберг пришел к этим представлениям, он не знал, что пользуется понятиями, имеющими весьма точный эквивалент в созданной математиками в середине XIX в. теории матриц. Борн и Иордан очень быстро обнаружили, что матрицы являются действительным аппаратом теории Гейзенберга. Таблицы двойственных коэффициентов получили каноническое название, и квантовая механика смогла воспользоваться разработанной и строго обоснованной системой понятий и теорий. Здесь языком, имевшим старое название, были рассказаны весьма новые вещи. Борн в своем нобелевском докладе «Статистическая интерпретация квантовой механики» рассказывает, как летом 1925 г. Гейзенберг, заболевший и отправившийся лечиться на берег моря, передал ему свою статью для опубликования, если статья понравится Борну. Прочитав статью, Борн отправил ее в «Zeitschrift fur Physik». Думая над ее содержанием, он вспомнил об алгебраической теории, с которой познакомился много ранее, в годы учения в Бреславле. Борн увидел, что квадратные таблицы Гейзенберга соответствуют матрицам. Оставались, однако, некоторые неясные моменты. Борн привлек к сотрудничеству своего ученика Паскуаля Иордана, и их совместная статья вскоре появилась в том же журнале 1. Затем в течение некоторого времени Борн, Иордан и Гейзенберг, обмениваясь письмами, придали теории сравнительно законченный вид и изложили ее в виде статьи трех авторов 2. Статья эта еще не успела увидеть свет, когда Дирак опубликовал свою работу3, в которой таблицы Гейзенберга трактовались как математические символы со свойствами, аналогичными свойствам матриц. Дирак познакомился с первоначальными идеями Гейзенберга благодаря П. Л. Капице, который предложил Геизенбергу летом 1925 г. выступить в кембриджской лаборатории Капицы. Гейзенберг впоследствии вспоминал об инициативе Капицы, о своем кембриджском докладе и о работе 23-летнего студента Дирака, применившего по сравнению с построениями геттингенских теоретиков более изящные методы, 1 Zeitschr. f. Phys, 34, 858 (1925). 2 Zeitschr. f. Phys., 35, 557 (1926). 8 Proc. Roy. Soc, 109, 642 (1925). 191
как о характерном примере международного научного сотрудничества *. Гейзенберг, Борн и Иордан изложили квантовую механику в виде алгебры матриц. Здесь достаточно указать иа определения суммы и произведения матриц. Сумма и разность определяются просто. Матрица q" будет суммой или разностью матриц q и q\ если ее элементы — это суммы или разности соответственных элементов q и q'. Определение произведения матриц более сложно. Чтобы получить такое произведение нужно взять первую строку матрицы q и каждый ее элемент помножить на соответственный элемент первого столбца матрицы q'. Все эти произведения нужно сложить, и сумма будет равна первому элементу первой строки таблицы q" — произведения q' и q". Эту операцию следует продолжать по отношению ко всем строкам первой и всем столбцам второй матрицы. Операция умножения выражается формулой: q"(n, т) = 2 Я (п> k) Я' (*. т)> к т. е. мы получаем элемент, стоящий на пересечении /г-строки и m-столбца, если умножаем первый элемент /г-строки q на первый элемент m-столбца q\ затем второй элемент /г-строки q на второй элемент m-столбца qr и т. д. до /г-й строки и &-го столба (k — число строк и столбцов) и затем складываем произведения. Пожалуй, лучше проиллюстрировать примером эту операцию, по существу элементарную, но при отсутствии привычки кажущуюся сложной. Примером будет служить перемножение двух простейших матриц с двумя строками и двумя столбцами каждая (к = 2): А = I"» "») и В = (*и Ч V*21 Д22/ \&21 ^22/ Первую строку матрицы С = АВ получаем по формулам: сп = flu6n + al2b21 Cl2 = Д11&12 + #12^22- 1 В. Гейзенберг. Философские проблемы атомной физики. М., 1953, стр. 125—126. 192
Элементы первой строки матрицы-произведения с другой последовательностью перемножаемых матриц D = ВА будут равны: du = anbn + a2lb12 На этом примере мы видим, что умножение матриц не коммутативно. Можно найти разности / между произведениями с = аЬ и d = ba: f\\ = Сц — dU = Д12&21 — ^21^12 И Т. Д. Такие разности между произведениями qq' и q'q играют первостепенную роль в матричном исчислении. Если взять матрицу q, соответствующую координате электрона, и матрицу р, соответствующую его импульсу, то произведение матриц будет либо qp, либо pq. Разность этих произведений d = pq — qp также матрица, но особая. В ней все коэффициенты, соответствующие переходу в н о в о е состояние, т. е. когда пф/n, равны нулю. Такая матрица называется диагональной. Она имеет вид: dn, 0, 0, ...\ О, d22i О, ... 1 О, 0, dZB, ... причем все диагональные элементы dnn кратны элементарному кванту действия, постоянной Л, и являются произведениями h на числовые множители г. Иными словами, rfnm = гй, если т = п, и^Лт=0, если т ф п. Положим: Тогда выражение для матрицы d примет вид: 103
Эта величина — мера некоммутативности произведение составляющей импульса и соответствующей координаты электрона — представляет собой дробь порядка 10-27. Написанное выше уравнение названо перестановочным соотношением. Если применить это соотношение к проблеме линейного осциллятора, то наименьшее значение энергии осциллятора будет а вообще возможные значения энергии £-*»(* + !). Таким образом, результаты применения перестановочного соотношения совпадают с результатами, к которым, как мы видели, пришел Шредингер. Энергия осциллятора — нечетное кратное половины /zv, и наименьшее значение ее отлично от нуля. Гейзенберг, Борн и Иордан пришли также к условию частот, сформулированному в свое время Бором: частота кванта, излучаемого при переходе от одного уровня энергии к другому, равна изменению энергии, деленному на постоянную Планка Л. Квантовая механика Гсйзенберга, Борна и Иордана выводит условие частот из дискретности динамических характеристик атома. В теориях де Бройля и Шредингера путь был обратный: оптическая дискретность, существование постоянной h как оптической константы, было исходным обстоятельством, и из него выводилось боровское квантование электронных орбит '. Переходная по своему характеру боровская модель 1913 г., по существу, не объясняла включения оптической константы в механику атома. Квант действия существовал как оптическая константа в теории спектров и как механическая в теории атома. С 1925 г. эти области объединяются не только в смысле совпадения основной оптической и основной атом- но-дииамической константы. Две роли А выводятся одна из другой: в волновой механике динамическая из спек- 1 См. А. Гааз. Волны материи и квантовая механика. М.— Л., 1931, стр. 128. 194
тральной, в квантовой механике Гейзенберга, Борна rf Иордана — наоборот. 7. Операторы В конце 1925 г. Борн, находившийся в то время в США по приглашению Массачузетского технологического института и работавший там вместе с Норбертом Винером, пришел к мысли о представлении физических величин в виде операторов. В статье, напечатанной в 1926 г. *, Борн и Винер показали, что каждой динамической переменной можно сопоставить оператор, подобно тому как это было сделано немного раньше с матрицами. При помощи матриц были описаны периодические процессы — движения электронов в атоме. Операторы позволяют описать и апериодические процессы. Теория линейных операторов — математическая теория,—служит характерной иллюстрацией закономерностей развития физики. Историческая связь между физическими теориями не всегда бывает непосредственной. Иногда физическая теория толкает математику к созданию системы новых понятий, до поры до времени не получающих физической интерпретации, а затем другая физическая теория пользуется этими понятиями и придает им физический смысл. К началу XX в. под влиянием значительного развития классической физики, механики и астрономии математика подошла к обобщению основного понятия анализа — понятия функции. Если под функцией у = f(x) понимать соответствие между множеством чисел х и множеством чисел у, то можно говорить о более общих соответствиях — уже не между числами, а между функциями, об операторах. Оператор задан, если известен закон, по которому функции f(x) ставится в соответствие другая функция <р (х). Операторы будут обозначаться в дальнейшем буквами со значком л над ними, например L. Мы можем взять в качестве второй функции (х) функцию f(x), умноженную на переменную х, либо функцию f(x), умноженную на любую постоянную величину a j ибо производную от f(x) по а: и т. д. В каждом случае переход от f(x) к<?(х) обозначается соответствующим символом, стоящим перед f(x). В первом случае L\f(x) — ср (х) = » Zeitschr. f. Phys., 36, 174 (1926). 195
= xf(x); во втором случае Lrf(x) =<?(х) = af (x)\ fi третьем случае l,f<*)««p(*)-^. Рассмотрим эти простейшие операторы. Умножение функции f(x) на независимую переменную х можно рассматривать как действие оператора, превращающее эту функцию в функцию xf(x): if(x) = xf(x). Второй пример оператора — умножение на постоянную величину а. Аналогично предыдущему примеру, *f(x) будет означать умножение на а: Третий пример — оператор дифференцирования -j. Он означает дифференцирование функции, перед которой стоит данный оператор. Перечисленные примеры — это примеры линейных операторов. Линейный оператор L удовлетворяет следующим требованиям. Результат применения оператора L к сумме двух функций fug должен совпадать с суммой результатов от действия L на каждую функцию в отдельности: L(f + g) = Lf + Lg. Второе требование, определяющее линейность оператора, состоит в том, что постоянный множитель, содержащийся в функции, может быть вынесен за знак оператора: L(cf) = cLf. В дальнейшем под операторами будут подразумеваться только линейные операторы. Таковыми и являются независимая переменная как оператор, постоянная как оператор и оператор дифференцирования; их можно применить порознь к слагаемым функциям и постоянную вынести за знак оператора. Операторы, применяющиеся в большом числе задач квантовой механики, представляют собой комбинации 196
трех указанных простейших случаев. Эти комбинации подчиняются правилам, образующим в своей совокупности алгебру операторов. Ее существенное отличие от обычной, известной нам алгебры — некоммутативность умножения. Если над функцией / производятся последовательно две операции, обозначаемые операторами L и К, то результирующая операция обозначается «произведением» М = L/C: Mf = lkf = L(kf). Операторы, приведенные в качестве первого и второго примера, коммутативны, т. е. обладают коммутативностью умножения: помножить функцию на переменную и на постоянную можно в любом порядке. Но произведение оператора дифференцирования и оператора, означающего умножение на переменную х, некоммутативно: помножив функцию и затем дифференцируя, мы получим иной результат, чем при дифференцировании и последующем умножении на х. Введем особенно важные для квантовой механики понятия собственной функции и собственного значения оператора. Действие оператора L на свою собственную функцию сводится к умножению на число X. В этом случае X называется собственным значением оператора L. Оператор в отношении своих собственных функций как бы десимволизируется: символ ь, означающий некоторую операцию, заменяется обычным множителем. Все это можно представить формулой и пояснить примером. Если f = f(x) = cos 2x, a L=d*> тоХ = -4, так как j-j (сор 2х) = —4 cos 2x. 197
Собственные значения оператора образуют его спектр: непрерывный (все числа, либо все положительные, либо все отрицательные числа являются собственными значениями оператора) или дискретный (некоторые числа, составляющие дискретный ряд). Вернемся к физическим проблемам. В квантовой механике операторы применяются для изображения динамических переменных: координат, составляющих импульса, энергии и т. д. Непосредственный смысл такого перехода от обычных величин к операторам состоит прежде всего в возможности компромисса между новыми, неклассическими понятиями и классической механикой, в возможности применить схемы классической механики к микромиру, в возможности использовать в новой области понятия координат частицы, составляющих ее импульса и других динамических переменных. Если каждой из переменных сопоставить линейный оператор и подчинить эти операторы классическим соотношениям между соответствующими величинами, то -мы придем к соотношениям квантовой механики. Следовательно, сам переход к операторам соответствует специфике квантовых соотношений и, в последнем счете, специфическим закономерностям микромира. Но этот переход позволяет перевести квантовые соотношения на язык классических соотношений. Динамические переменные представлены операторами. Это — первое допущение квантовой механики. Второе допущение, физически интерпретирующее операторы, относится к собственным значениям ^ и собственным функциям f оператора L. Если переменная L изображается оператором Z, то собственное значение оператора означает определенное число, которое мы получаем, измеряя переменную L в состоянии системы, изображенном собственной функцией /. Собственная функция / описывает состояние системы, в котором L имеет определенное значение. Это — исходный тезис квантовой механики. Какие именно операторы соответствуют различным классическим динамическим переменным? Приведем без доказательств выражения операторов, соответствующих следующим динамическим переменным: 1) координатам, 2) составляющим количества движения, 3) потенциальной энергии, 4) кинетической энергии, Ь) полной энергии. *98>
При вычислении волновой функции ф, т. е. при решении основной задачи квантовой механики, независимыми •переменными служат время и пространственные координаты х. В классической механике определяется, каковы будут координаты частицы в заданные моменты времени. В волновой механике мы пользуемся волновым уравнением и определяем волновую функцию ф в заданное время ргв заданных точках пространства. В волновом уравнении координаты — независимые переменные. Оператор координат — это умножение функции на независимую переменную х. Следовательно, символическое умножение на оператор х означает несимволическое умножение на х. Любая функция координат х имеет аналогичное операторное представление. Символическое произведение F (х) ф оператора функции координат та функцию ф означает несимволическое умножение функции координат F(x) на функцию ф. Обратимся к переменным, не являющимся функциями от х. Это прежде всего импульсы р~ Импульс представлен дифференциальным оператором. Каждой компоненте импульса сопоставляется оператор, означающий дифференцирование функции ф по соответствующей координате: __h_d_ __ h д_ _ h д Рх ~ 2гЛдх ' Ру ~~ 2*1 ду' Pz ~~ Inidz ' Поэтому в векторной форме импульсу сопоставляется оператор: В скобках стоит оператор градиента у который уже встречался в этой книге. Таким образом, оператор импульса в векторной форме—это оператор, означающий вычисление градиента функции и умножение его на A/2rci: A /l Теперь можно указать операторы функций не только координат, но и импульсов. Кинетическая энергия частицы с массой т, движущейся со скоростью v, согласно классической механике может быть выражена через 19»
составляющие импульса частицы: Из основной посылки операторного представления динамических переменных следует, что мы можем получить квантово-механическое соотношение между операторами энергии и импульса частицы, если заменим в только что написанном классическом соотношении энергию и составляющие импульса их операторами: f = er=-k(pZ+% + %)■ Выражения для операторов составляющих импульса нам известны, и их можно подставить в написанную формулу. Квадрат оператора означает двукратную операцию — двукратное дифференцирование функции, на которую действует оператор. Поэтому мы получаем: 1 №т\дх* ^ ду* ^ дг*)' Выражение, стоящее в скобках, т. е. сумма вторых производных по координатам,— также уже встречавшийся в этой книге оператор Лапласа v2« Потенциальная энергия U есть функция координат. Поэтому оператор потенциальной энергии U означает умножение функции на U = U(x, у, z). Как связана потенциальная энергия с координатами, каков вид функции U(х, у, z),— это зависит от силового поля, в котором движется частица. Сложнее обстоит дело с операторным представлением полной энергии Н, т. е. суммы кинетической и потенциальной энергий. Из классического соотношения Н = Т + U мы получаем операторное уравнение: Й = Т + 0. Но Г —функция импульсов, a U — функция координат. Если мы захотим определить полную энергию движущейся В Силовом поле микрочастицы, намеряя ее кинетиче* Я»
скую и потенциальную энергию и складывая их, мы не получим определенного результата: нельзя с неограниченной точностью одновременно определить и координаты и импульс частицы. Необходимо напомнить, что в классической механике состояние системы в каждый момент определяется функцией Гамильтона — Я — полной энергией системы, выраженной через импульсы и координаты. По виду функции Н(х,у, г, рх, ру> р2) можно судить о характере системы, о взаимодействии в системе и действии внешнего поля на нее. Эта функция определяет уравнения движения частиц. Она совпадает с полной энергией в консервативных системах, но мы можем говорить о функции Гамильтона и применительно к неконсервативным системам. В операторном выражении оператор Н = Т + U оказывается функцией импульсов и координат. Поэтому его можно сопоставить с классической функцией Гамильтона и назвать оператором этой функции — гамильтонианом. Остановимся на этом подробнее. Символом ф мы обозначаем волновую функцию, описывающую состояние системы. Если функция ф задана, значит, нам известно состояние системы в настоящий момент и его изменение в будущем. Изменение состояния во рремени определяется производной от ф по времени. Мы переходим от функции ф к функции dty/dt и можем записать эту операцию в виде символического умножения ф на оператор L: дф f . Этот дифференциальный оператор L назовем оператором смещения во времени. В случае одной свободно движущейся частицы он равен гамильтониану. В самом деле, можно показать, что волна де Бройля, сопоставленная свободно движущейся частице, удовлетворяет уравнению дф ih 2, где va — оператор Лапласа» 201
Оператор, стоящий в правой части уравнения, может быть представлен как гамильтониан свободно движущейся частицы. В этом случае потенциальная энергия отсутствует, полная энергия совпадает с кинетической энергией и, соответственно, гамильтониан — с оператором кинетической энергии: 8к2т h = t = ^-v\ Поэтому уравнение, которому удовлетворяет волновая функция ф свободно движущейся частицы— dt 4тгт V т» можно переписать в виде: Таким образом, состояние ф свободно движущейся частицы изменяется во времени соответственно уравнению, в котором роль оператора смещения во времени L играет гамильтониан с коэффициентом 2^/гА. Предположим, что всегда, каким бы ни было состояние ф квантовой системы, оператором смещения во времени служит гамильтониан. Разумеется, он будет другим, более сложным, функция импульсов и координат, равная полной энергии, будет принимать различный вид в зависимости от числа частиц, их взаимодействия и силового поля, воздействующего на частицы. Но каким бы ни был вид гамильтониана Н, именно он играет роль оператора смещения во времени: iti Можно написать это уравнение в раскрытом, не символическом виде для случая, когда частица движется в силовом поле, не зависящем от времени. Тогда частица обладает и кинетической и потенциальной энергией и гамильтониан равен сумме операторов кинетической и потенциальной энергии: Й = Т + 0(х.у,2). 202
тавляя известные нам выражения этих операторов Т = ~~ Sfik V2 и I)? = U (х, у, г), мы получаем уравнение Шредингера в виде: Если силовое поле зависит от времени, в выражение гамильтониана входит уже не потенциальная энергия U(x, у, z) частицы, а функция U(x, у, z, t) и соответственным образом усложняется вид уравнения Шредингера. Но во всех случаях оператором L сдвига во времени ф служит гамильтониан Н, помноженный на^-. Оправдывается ли это обобщение? Весь колоссальный объем экспериментальных данных, относящихся к явлениям, изучаемым квантовой -механикой, подтверждает вычисления, сделанные на основе уравнения Шредингера, и соответственно оправдывает роль, отводимую гамильтониану в операторном представлении квантовой механики. Из уравнения Шредингера следует дискретный характер энергии системы (квантование энергии). То, что делал Шредингер — нахождение характеристических чисел,— совпадает с нахождением собственных значений оператора Гамильтона. Мы видим характерную особенность операторного представления динамических переменных. Они позволяют использовать классические понятия координат, импульса и т. д. в неклассической, квантовой механике. «Антиклассическая» установка Гейзенберга (координаты электрона не должны входить в рациональную теорию микромира) и «классическая» установка де Бройля — Шредингера привели к одному и тому же — системе математических прие-. мов и физических построений, показывающих, как должны модифицироваться классические понятия, чтобы войти в новую область. Этот аспект эквивалентности.волновой и квантовой механики нас и интересует в первую очередь. 203
8. Волны вероятности Модификация классических понятий при переходе в новую область состоит прежде всего в том, что они теряют, вообще говоря (в частном случае собственных состояний — сохраняют), свою определенность. Волновая функция ф — вернее ее квадрат — указывает вероятность определенных значений классических динамических переменных. Такую интерпретацию волновой функции выдвинул в 1926 г. Борн К Бор'Н рассматривает пространство конфигураций 3/г измерений. Координаты в этом пространстве — упорядоченные системы Зл чисел — определяют точки пространства конфигураций. От точки к точке меняется значение волновой функции ф. Физический смысл этой функции — вероятность определенной конфигурации частиц, вероятность того, что она осуществляется. Все это построение выглядит значительно проще в случае одной частицы, когда волновая функция определяется простым, необобщенным уравнением Шредиигера. Тогда вместо пространства конфигураций мы имеем обычное трехмерное пространство. В каждой точке трехмерного пространства волновая функция имеет определенное значение, и бесконечно малому приращению координат соответствует бесконечно малое приращение волновой функции. Она, таким образом, непрерывна. Квадрат ее означает вероятность встретить частицу в данной точке. Все это можно пояснить следующим примером. Пучок электронов, летящих параллельно и с одинаковой скоростью, проходит через две узкие щели в непрозрачном экране и затем попадает на флуоресцирующий экран. Если электроны — это частицы в классическом смысле, то на флуоресцирующем экране должны появиться две светлые полоски — в местах, куда попадают параллельно летящие электроны. В действительности на флуоресцирующем экране появляются интерференционные полосы. Их можно объяснить по аналогии с интерференционным опытом Юнга — классическим доказательством волновой природы света. Щели в непрозрачном экране — источники двух 1 Ztffcchr. f. PhysM 37> 863 (1926); 38, 803 (1926). 204
сферических волн. Эти две волны попадают на каждую точку флуоресцирующего экрана. Там, где разность хода волн равна целому четному числу полуволн, фазы обеих волн совпадают и суммарная амплитуда максимальна; там же, где указанная разность равна нечетному числу полуволн, фазы противоположны, суммарная амплитуда равна нулю и видны темные интерференционные полосы. При корпускулярном представлении электронов этот опыт может быть объяснен так: светлые полосы получаются там, куда попадает максимальное число электронов, темные полосы — куда электроны вовсе не попадают. Значит, максимальная амплитуда соответствует максимальной плотности электронов, попадающих на экран. Если взять квадрат амплитуды, т. е. величину всегда положительную, ее можно считать волновым выражением плотности электронов. При большом числе электронов >в пучке их плотность в данной точке экрана соответствует вероятности встретить здесь каждый электрон. Представим себе, что через описанную установку проходит один электрон, затем другой и т. д. Отмечая каждый раз место, куда попадает электрон, мы при большом числе опытов обнаружим, что максимальное число попаданий окажется в тех местах экрана, где расположены точки максимальных суммарных амплитуд в результате наложения волн, исходящих из двух щелей, что число попаданий соответствует везде квадрату амплитуды. Что же распространяется волнообразно в случае одного электрона, что распределяется в этом случае на всем экране? Ответ Борна таков: волнообразно распространяется, суперпонирует, интерферирует, образует максимумы и минимумы вероятность попадания электрона на то или иное место флуоресцирующего экрана. Такой взгляд вытекает из операторного представления физических величин. В предыдущем параграфе была изложена физическая интерпретация собственных значений X оператора I, входящих в уравнение Цл = К%. Здесь Хп—однозначный и определенный результат измерения переменной L, сделанного в тот момент, когда система находится в состоянии фЛ. И, наоборот, если мы отметили 205
Хл и фп индексом я, чтобы отличи!ъ их от остальных значений X оператора L и остальных функций ф, изображающих состояние системы, то оператор L, изображающий переменную, и ф„, изображающая состояние системы, связаны уравнением: Но это не дает полной и общей физической интерпретации значений оператора, и мы не можем говорить о физической интерпретации оператора и сравнивать результаты вычислений, сделанные при помощи операторов, с результатами фактических измерений, если мы не придаем определенного физического смысла другим значениям X и другим состояниям ф. Умножим уравнение, связывающее оператор с его собственными значениями и собственными функциями Ъьп = Хпфп, на величину <Ь* — функцию, сопряженную с фп. Затем проинтегрируем обе части уравнения по всему пространству и определим из этого уравнения Хп: } №№ Можно ли придать некоторый физический смысл величине X, отличный от того, о котором шла речь до сих пор? Эта величина равна собственному значению оператора L, т. е. определенному результату измерения динамической переменной L, когда система находится в состоянии tyn. Никакого другого физического смысла это выражение пока не имеет. Но, может быть, величина, стоящая в правой части уравнения, равна не только собственному значению оператора. При иных значениях X и соответствующих функциях ty измерения переменной L дают вообще различные значения. Но каждому несобственному значению X соответствует вполне определенный р е з у л ь- 206
T&f болыНбГб числа измерений — среднее по многочисленным измерениям. Примем, что частное от деления интегралов в правой части уравнения равно собственному значению \п опера- тора L, если система находится в состоянии, описываемом собственной функцией <1>п, а в других случаях, т. е. если система находится в ином состоянии ф, она равна среднему значению х ряда различных в данном случае результатов измерения: Это уравнение позволяет по волновой функции ф най- ти среднее значение х большого числа измерений, сделанных в «момент, когда система находилась в состоянии, описываемом волновой функцией ty- Иначе говоря, написанное уравнение определяет математическое ожидание ^ — величину, к которой действительное нее значение измерений будет приближаться по мере увеличения числа измерений. Примером может служить определение среднего значения координаты х. Это значит, что в качестве оператора L фигурирует оператор координаты х. Квадрат волновой функции — это плотность вероятности местонахождения, вероятности найти частицу в определенном интервале. Чем больше значение <V*4> в данном интервале dx, тем больше вероятность, что частица окажется в указанном интервале. В приведенном опыте с прохождением пучка электронов через две узкие щели и появлением интерференционных полос на флуоресцирующем экране все это было видно весьма наглядно. Там, где волновая функция была максимальной, плотность электронов достигала максимума. Если же пучок состоял из одного электрона, то точкам, где фазы двух волн совпадали и ф имели максимальное значение, соответствовала наибольшая вероятность попадания этого электрона. При многократном повторении опыта в эти пункты попадало наибольшее число электронов. Для бесконечно малого интервала между х и х + dx вероятность найти частицу в этом интервале, т. е. вероятность, что частица будет иметь координату, лежащую внутри этого интервала, равна ty*(x)ty (x) dx. 207
Чтобы получить среднее значение х координаты частицы, нужно, как нам уже известно, сумму всех возможных значений х, помноженных на их вероятности, разделить на сумму всех вероятностей. Так как здесь взяты бесконечно малые интервалы dx вместо суммирования, указанные величины интегрируются: Х ~~ $ф*фА? В числителе этого выражения вместо множителя х поставим оператор х. Тогда: — ^ф*хфс?г Таким образом, мы пришли к написанному выше выражению для X в случае, когда L—Jc, X = ху исходя из законов вероятности. Поэтому нам не покажется беспочвенным предположение, что написанное выше частное от деления интегралов равно собственным значениям Хп оператора £ или средним значениям X не только в случае х и х, но и в случае других операторов L. Разумеется, такое предположение должно быть экспериментально проверено. Если многократные измерения любой динамической переменной L (результаты их различны, если ф — не собственная функция, а X—не собственное значение L) дают в среднем - $ф*£ф*г ]'ф*ф<*т ' то сделанное обобщение на любой оператор можно считать справедливым. Вычисление средней величины, как уже говорилось, может быть сделано таким образом, если сумма вероятностей (или интеграл — при бесконечном числе рассматриваемых вероятных событий) равна единице. Функцию ф также можно нормировать на единицу. В формуле для X эта функция входит и в числитель и в знаменатель. Поэтому можно помножить ф на любое число с. Если выбрать с так, чтобы $<№ = !, 208
то формула среднего значения Я принимает более простой вид: X = \ <fm£/Jfdz. Повторим два допущения, придающих физический смысл операторам, волновым функциям и их соотношениям. Первое можно кратко сформулировать так: «собственные значения оператора — это определенные значения переменной». Второе: «все значения оператора — это средние значения переменной». Из второго допущения можно вывести первое допущение. Из первого нельзя вывести второе, второе оказывается более общим. Напрашивается предположение, что этому соотношению между двумя основными пунктами операторного представления соответствует определенное соотношение между физическими процессами, что реальные «состояния неопределенности» являются общим случаем, а «состояния определенности» — частным. В квантовой механике соотношения между средними значениями, вообще говоря неопределенными в каждом отдельном состоянии системы, совпадают с классическими соотношениями между определенными, классическими переменными. Эренфест показал, что средние значения динамических переменных в микроскопических системах подчиняются уравнениям классической механики. Микросистемы — это системы, где результаты отдельных измерений отступают от классической однозначности, где индивидуальные значения физических величин определяются не классическими, а квантовыми уравнениями. Эренфест, пользуясь операторным представлением динамических переменных, доказал, что в отличие от индивидуальных средние значения физических величин в задачах квантовой механики подчиняются классическим соотношениям. Теорема Эренфеста — одна из теорем квантовой механики, отчетливо показывающих ее отношение к классической механике, ее логическую (и, можно думать, историческую) дислокацию между классической картиной мира и некоторой новой картиной, радикально преодолевающей и классическую дискретность (тождественная себе частица, движущаяся в пространстве с координатами — функциями времени) и классическую непрерывность. 209
9. Преобразования Иордана — Дираки Квантовая механика, созданная в 1925—1926 гг., как уже подчеркивалось, имеет особое, не находящее аналогий отношение к классической физике. Волновая функция позволяет описывать существенно дискретные процессы дифференциальным уравнением, иными словами при помощи непрерывных переменных. Статистическая интерпретация рисует непрерывную функцию как вероятность дискретных состояний. Некоммутативная алгебра матриц и операторов, представляя соотношения классических переменных, приводит к квантовым соотношениям, т. е. опять-таки служит для особ<?й (несводимой к принципу соответствия) связи между классической и квантовой механикой. Анализ каждой специфической черты квантовой механики — применения матриц, применения операторов, некоммутативности, статистического характера закономерностей, невозможности одновременного точного определения некоммутирующих переменных — приводит к констатации основной особенности теорий, созданных в 1925— 1927 гг.: они указывают пути классического представления неклассических квантовых объектов, условия и пределы точности такого представления. Разумеется, указанная особенность становится более явной при систематическом изложении квантовой механики. Такое систематическое изложение, соподчиняющее различные черты новой теории (дискретность действия, корпускулярно-волновую коллизию, перестановочные соотношения, некоммутативную алгебру математических величин, входящих в квантовые соотношения, особенности эксперимента в микромире и т. д.), появилось после того, как Иордан * и Дирак2 построили очень изящную теорию преобразований, переходов от одного представления состояний квантово-механи- ческой системы к другому. Эта теория дала значительный толчок применениям квантовой механики и вместе с тем вызвала дальнейшие собственно физические размышления о ее сущности. Гейзенберг и Бор в 1927 г. и отчасти в последующие годы разрабатывали вопрос о возможности одновременного точного измерения сопряженных величин: составляющих импульса и координат элементарной части- 1 Zeitschr. f. Phys., 40, 661 (1926); 40, 809 (1926). 2 Ргос. Roy. Soc, 113, 621 (1926). 210
цы. Гейзенберг сформулировал известное соотношение Неточностей, согласно которому произведение неточности определения координаты на неточность определения соответствующей составляющей импульса, имеющее размерность действия, будет одного порядка с постоянной Планка. Аналогичное соотношение существует между неточностями измерения времени и энергии. С 1927 г. начались оживленные дискуссии о смысле и значении соотношений неточности. Одновременно появились систематические изложения квантовой механики на основе теории преобразований Иордана — Дирака, выдвинутой Борном вероятностной интерпретации волновой функции и соотношения неопределенностей, сформулированного Гейзенбергом. Особенно большое значение имели «Основы квантовой механики» Дирака (1930) К Развитие теоретической физики за последнюю четверть века показало, что действительный смысл идей Дирака, высказанных в 1926—1930 гг.,— это независимость физических процессов от методов наблюдения, выражающаяся в инвариантности некоторых физических величин при переходе от одной координатной параметризации к другой. В основе подхода к нерелятивистской квантовой механике у Дирака, таким образом, лежит принцип, который был в свое время положен в основу теории относительности. Релятивистская квантовая механика в положивших ей начало работах Дирака 1927—1928 гг. была системой поправок к нерелятивистской теории. Но еще раньше Дирак исходил из некоторой общей идеи, имеющей отношение к самым основам и релятивизма и квантовой теории. Это идея, которую можно назвать, в соответствии с исторически выявившимся действительным ее смыслом, идеей инвариантной п а р а метр из а ци и, выражающей независимость объекта познания от методов познания. Нужно сказать, что указанная идея не была высказана в собственно физической форме. Дирак высказал идею инвариантного представления физических величин в математической форме, в виде теории групп преобразований и инвариантов векторного пространства, сопоставленных 1 P. A. M. D i г а с. The Principles of Quantum Mechanics. Oxford, 1930. Русск. пер.: П. А. М. Дирак. Основы квантовой механики. Изд. 2, Л.—М., 1937. 211
Квантово-механическим состояниям. Перефразируя известное замечание Энгельса о естествоиспытателях, позволяющих себе теоретическое мышление только в форме математических вычислений 1, можно сказать, что современные теоретики, еще не порвавшие с позитивистской философией, разрешают себе говорить о независимости физических объектов от познания только в форме теории инвариантов тех или иных групп преобразований. В предисловии к первому английскому изданию «Основ квантовой механики» (май 1930 г.) Дирак говорит о возрастающем применении теории преобразований как о существенной особенности новой физики. Действительно, в таком применении состоит характерная черта и теории относительности и квантовой теории. Дирак говорит, что непосредственно воспринимаемыми являются координатные соотношения физических объектов, т. е. отношения их к некоторым системам отсчета. Напротив, инвариантные соотношения физических объектов Дирак считает воспринимаемыми лишь в символической форме. По мнению Дирака, физическая картина мира изменилась в XX столетии прежде всего в том смысле, что в ней фигурируют уже не традиционные классические наглядные вещи, а символы ненаблюдаемых объектов. «Ее основные законы,— пишет Дирак о природе, как ее рисует современная физика,— не управляют непосредственно тем миром, о котором мы составили себе наглядное представление: но в их ведении находится закулисная сторона этого мира, которую мы не можем представить наглядно, не впадая при этом в логические противоречия. Формулировка этих законов требует применения математической теории преобразований. Все важные свойства мира являются инвариантами этих преобразований или по крайней мере «квазиинвариантами», т. е. величинами, преобразующимися по очень простым правилам. Мы непосредственно воспринимаем лишь отношения этих «квазиинвариантов» к некоторой системе отсчета (системе координат), которая обыкновенно избирается с тем расчетом, чтобы добиться некоторых специальных упрощений, не имеющих, впрочем, никакого значения с точки зрения общей теории» 2. 1 См. Ф. Энгельс. Диалектика природы. М., Госполитиздат, 1955, стр. 104. 2 «бсновы квантовой механики», стр 6. 212
Мы уже познакомились с понятием инвариантов преобразований. Поэтому сейчас можно высказать некоторые замечания, относящиеся к изложенным только что взглядам. Прежде всего классическая наука вовсе не абсолютизировала координатное представление физических объектов. Одно из преимуществ исторического рассмотрения классической физики состоит в отчетливом представлении о последовательном релятивировании координатных систем в сменявших друг друга классических теориях XVI — XIX вв. Исторический исток классической картины мира — система Коперника — показала относительность координатного представления, связанного с Землей как телом отсчета. Уже в галилеевом «Диалоге» содержится доказательство инвариантности механических соотношений при переходе от одной инерциальной системы к другой. Инвариантность расстояний — важнейшая основа классической картины мира. Выражение свойств мира в виде инвариантов или «квазиинвариантов» ничуть не менее наглядно, чем координатное выражение. Не будем повторять здесь все сказанное выше об историческом характере критерия «наглядности», напомним только, что каждый переход к инвариантному представлению, каждое релятивирование координатного представления со времен Коперника противопоставляли -наглядной «очевидности», причем нередко объявляли новые научные идеи принципиальным крушением наглядных понятий в науке. Поэтому все большее применение инвариантного представления физических объектов и закономерностей — это вовсе не переход от наглядных понятий к символическим. Напротив, это последовательная десимволизация ряда физических понятий. И уж, разумеется, инварианты не делают картину мира более субъективной, как полагает Дирак, а напротив, в растущей степени демонстрируют ее объективный характер. Несомненно, прогресс современной физики показывает инвариантность физических уравнений в отношении ко все более общим группам преобразований. Но это приводит к более точному и не зависимому от методов познания отображению объективной действительности. Вопреки философским замечаниям Дирака о «роли самого наблюдателя в привнесении закономерностей в результаты наблюдения» *, его физические построения дока- «Основы квантовой механики», стр. 7.
зывают объективный характер законов квантовой механики. Такое доказательство особенно рельефно потому, что Дирак в основу анализа и изложения квантовой механики кладет непосредственное оперирование инвариантами. Математический аппарат, в котором физические соотношения выражаются инвариантными величинами, Дирак противопоставляет методу координат, сопоставляющему физическим соотношениям упорядоченные системы чисел. Координатный метод приводит к тому, что квантовая механика приобретает вид либо волновой, либо матричной механики. В этих формах она исторически и возникла. Волновая механика, говорит Дирак, выдвигает на первый план состояние системы, матричная — динамические переменные. Дирак противопоставляет волновой механике Шредин- гера и матричной механике Гейзенберга символически й метод. Термин этот отражает 'изложенную выше общую характеристику смысла квантовой механики. По существу же речь идет о построении теории преобразований, инвариантами которых служат квантовомеханические соотношения. Началом такого построения были упомянутые выше работы, показавшие эквивалентность волновой и матричной механики и в особенности статьи Иордана и Дирака, написанные в 1926 г. После этого Вейль (в книге «Теория групп и квантовая механика», вышедшей в 1928 г.1) продвинул дальше собственно математическую сторону проблемы, и в 1930 г. Дирак мог изложить систематически всю систему квантовой механики в новой форме. Эта форма поныне сохранила свое значение для теоретической физики. Нас, однако, интересует и историческая сторона дела. Математический аппарат, которым пользуется Дирак, сближает квантовую механику с теорией относительности. Само по себе широкое использование теории групп преобразований ничего не говорит о логической связи теорий: общность аппарата может наблюдаться даже у физически несовместимых теорий. Но у Дирака теория преобразований, фигурирующая в качестве математического аппарата квантовой механики, связана с очень характерным стремлением к единству современной физики. 1 «Gruppentheorie und Quantenmechanik», Leipzig, 1928. 214
единству физической картины мира и в особенности к синтезу теории квант и теории относительности. Исходный принцип, который Дирак кладет в основу квантовой механики,— это принцип суперпозиции состояний. Прежде чем изложить этот принцип в общем виде, Дирак приводит несколько примеров, популярно объясняющих суть дела. Один из примеров — поляризация фотонов. Кристалл турмалина, как известно, пропускает свет, поляризованный перпендикулярно к оптической оси кристалла. Если пучок световых лучей поляризован в такой, перпендикулярной к оси кристалла, плоскости, свет пройдет через кристалл. Если свет поляризован параллельно оси, он не пройдет. Если же свет поляризован в плоскости, составляющей с осью угол а, то пройдет его часть, равная sin2 а. Свет представляет собой поток фотонов. Если рассматривать поляризацию в таком корпускулярном аспекте, поляризация в двух взаимно перпендикулярных плоскостях, поперечной к оси и параллельной ей, не дает повода для беспокойства. В первом случае каждый фотон пройдет через кристалл, во втором случае каждый фотон не пройдет. Но что произойдет с фотоном, если свет поляризован под углом а к оси? Пройдет ли он через кристалл? Если сохранить корпускулярное представление о свете, т. е. индивидуальность фотона, то при большом числе фотонов пройдет через кристалл доля общего числа, равная sin2 а. Если регистрировать прохождение каждого фотона, то отношение прошедших фотонов ко всем при достаточно большом числе повторений приблизится к sin2 а. Если же речь идет об единственном фотоне, то можно говорить об определенной вероятности его прохождения. От этого примера, не отличающегося по существу от нескольких, приведенных выше, Дирак приходит к вопросу о состояниях фотона. Поляризация в определенной плоскости — это одно состояние световой волны; поляризация в перпендикулярной плоскости — второе состояние. В случае поляризации под углом фотон находится отчасти в одном состоянии, отчасти в другом. Его состояние представляет собой суперпозицию (наложение) двух состояний. В случае волны поляризованной в некоторой плоскости, составляющей угол а с оптической осью кристалла, можно 215
разложить на две взаимно перпендикулярные поляризации, представить ее как результат суперпозиции двух перпендикулярных поляризаций, т. е. поляризаций в двух взаимно перпендикулярных плоскостях. То же относится к фотону. Но в этом случае суперпозиция приобретает особый характер. Фотон при прохождении через кристалл окажется либо в одном, либо в другом из состояний с перпендикулярными поляризациями. Чтобы несколько расширить понятие состояния, приводится второй пример — интерференция фотонов. Если мы знаем направление монохроматического луча и частоту колебаний, мы тем самым знаем состояние движения фотонов — импульс каждого фотона и тот факт, что он находится в ^некоторой части пространства, через которую проходит луч. Луч попал в интерферометр и разделился на две компоненты, на два луча, движущихся раздельно, а затем интерферирующих. Рассмотрим поведение фотонов. В каком состоянии движения они находятся? Обе компоненты света имеют разные волновые функции, которым соответствуют два состояния движения фотонов, отвечающих принадлежности к определенной компоненте. Представим себе, что весь луч состоит из одного фотона. В интерферометре луч должен разделиться на две компоненты: иначе не было бы интерференции. Если измерить энергию одной из его компонент, то мы должны получить либо энергию целого фотона, либо нуль, т. е. фотон оказывается в одном или другом луче (компоненте). Волновая функция позволяет определить лишь вероятность того или иного состояния движения, того или иного результата измерения. При этом, если речь идет о положении в пространстве, волновая функция определяет не вероятное число фотонов в некотором пункте, а вероятность пребывания в нем одного фотона. Таким образом, мы приходим к возможности состояний фотона (или другой частицы), являющихся наложением двух (или более) других возможных состояний. При этом промежуточный характер состояния, возникшего как наложение суперпонирующих состояний, не означает, что значения динамических переменных будут промежуточными между значениями их для суперпонирующих состояний. Это означает лишь, что вероятность значений в состоянии суперпозиции будет промежуточной между ве- 216
роятностями значений в суперпонирующих состояниях. Это и есть принцип суперпозиции квантовой механики. Представим себе некий физический объект, к которому непосредственно неприменимы понятия классических динамических переменных, в частности понятия импульса и координат. В известных пределах, с известной точностью этот неклассический объект можно описать классическими понятиями, включающими, в частности, импульс и координаты, и таким образом применить к неклассическому объекту классическое понятие состояния. В общем случае состояние такого объекта можно разложить на ряд собственных состояний, представить его как суперпозицию собственных состояний, причем коэффициенты разложения будут связаны с вероятностями значений переменной, соответствующими каждому собственному состоянию. Набор собственных состояний зависит от выбора динамической переменной. Оператор, соответствующий координате, и оператор, соответствующий (канонически сопряженной) компоненте импульса, имеют различные собственные значения и различные собственные функции. Этим двум наборам собственных функций соответствуют два ряда изображенных ими состояний. Ряд собственных состояний ф;, ф;, ф- ... и т. д., в которых определенное значение имеют координаты, не совпадает с рядом собственных состояний фр typ, bp ,... и т. д., в которых определенное значение имеют составляющие импульса. Оба эти ряда представляют собой ряды «состояний определенности», в которых свойства неклассического объекта совпадают со свойствами его классического аналога. Поэтому характер разложения какого-либо состояния системы (его ф функции) зависит от избранного классического представления неклассического объекта. Следующая основная идея Дирака заключается в независимости неклассического объекта от выбора путей классического (условно-классического) описания. Эта независимость выражается в существовании определенного трансформационного закона, определенных преобразований, переводящих одно классическое представление не- клзесического объекта в другое. Разложим «состояние 217
неопределенности» по отношению к q (общий случай!) в ряд «состояний определенности», где определенной является переменная q, т. е. в ряд %, ф'^... и т. д. Затем разложим это состояние в ряд по «состояниям определенности», в которых определенной является переменная р, т. е. в ряд: фр, фр, ... И Т. Д. Независимость неклассического объекта выражается в существовании определенных преобразований: Теория преобразований могла опереться на разработанную математическую теорию инвариантов благодаря векторному представлению состояний. Из принципа суперпозиции Дирак выводит векторное представление состояний. Существует настолько глубокая аналогия между суперпозицией состояний и сложением векторов, что свойства сложения векторов можно считать геометрическим выражением физических особенностей суперпозиции, а суперпозицию — физической интерпретацией сложения векторов. Если какие-либо состояния изображаются векторами (или волновыми функциями) фа, фь> фс и состояние фа можно получить суперпозицией фь и фС1 т. е.: Фа = *ьфь + Ясфс, где Хь и х с — числа, то из самого смысла суперпозиции вытекает, что состояние фь можно получить суперпозицией фа и фс, а фс — суперпозицией фа и фь. Между такими состояниями будет существовать симметрическое соотношение Яафа + Яьфь + ^сфс = О, где коэффициенты х не все равны нулю. Такие векторы фа» фь и фс назы-ваются з а в и си м ы-м и. Соответственно, указанные суперпонирующие состояния фа, фь, фс назовем зависимыми состояниями. Максимальное число линейно независимых векторов соответствует числу измерений векторного пространства. При дальнейшей физической интерпретации векторного пространства мы ищем аналог умножения вектора на число кфО, и здесь вскрывается коренное различие между классической и квантовой суперпозицией. 218
Если к вектору прибавить тождественный вектор, т. е. умножить вектор на к = 2, то получается новый вектор того же направления, но вдвое больший по скалярной величине. Этому соответствует классическая суперпозиция: при наложении состояния самого на себя получается новое состояние. Например, сложение двух одинаковых волновых процессов дает иной (по амплитуде) волновой процесс. В квантовой теории суперпозиция состояний фиф, т. е. умножение ф на к = 2 (и вообще умножение на любое к Ф 0), не изменяет состояния. Таким образом, состояние изображается не длиной (скалярной величиной) вектора, но только его направлением. Множество состояний параметризируется множеством направлений вектора, так что каждое состояние находится во взаимно однозначном соответствии с некоторым направлением. Нужно ввести еще одно существенное дополнение, необходимое для векторного представления состояний и их суперпозиции в квантовой механике. В уравнении Xatya + Xb^b + Хс^с = 0 или в более общем уравнении Ха^а + ХЬ*}ь + • • • + Хп% = 0, выражающем симметричность суперпозиции, т. е. существование зависимых состояний, а также в эквивалентности £ф и ф, выражающей представление состояния направлением вектора ф, числа х и к могут быть комплексными числами. Поэтому каждая суперпозиция состояний изображается не простой бесконечностью векторов одного и того же направления, а двойной бесконечностью. Теперь нужно несколько уточнить понятие «состояния» и, следуя Дираку, разграничить два смысла, которые можно придавать этому понятию 1. Это разграничение соответствует двум аспектам квантовой механики. Один ее аспект изучает закономерности, определяющие положение системы в данный момент. Если вспомнить о четырехмерном мире событий, то эта часть квантовой механики рассматривает трехмерную пространственную гиперповерхность мира. Все, что было и будет сказано о точности одновременного определения компоненты импульса и координаты, См. «Основы квантовой механики», стр. 24—26. 219
а следовательно, о переостановочных соотношениях и т. д.,— все это относится к трехмерной гиперповерхности мира. Эта часть квантовой механики была сформулирована главным образом Гейзенбергом в 1925—1927 гг. В 1926 г. появилось и второе представление квантовой механики: Шредингер написал общее волновое уравнение — квантовый аналог классических уравнений движения. Оно описывает соотношения между состоянием системы в данный момент и ее состоянием в следующий момент, иными словами закономерности изменения системы в четырехмерном мире событий. Двум представлениям квантовой механики можно сопоставить два смысла понятия «состояние». Четырехмерному рассмотрению систем соответствует четырехмерный смысл: состояние характеризует условия движения системы. В этом смысле система, изменяясь во времени, остается в одном и том же состоянии, соответствующем системе функций от времени, удовлетворяющих уравнениям движения. Трехмерному аспекту квантовой механики соответствует трехмерное состояние, характеризующее условия в определенный момент времени. В этом случае состояние соответствует не функциям в уравнениях движения, а мгновенным числовым значениям динамических переменных. Уравнения движения тогда дадут нам закон изменения состояния, которое предполагается иным в каждый момент времени. Суперпозиция «состояний» в четырехмерном смысле означает сохранение во времени суперпозиции состояний в трехмерном смысле. Если состояния в данный момент связаны суперпозицией *а% + X$b + . . . + Xrfi>n = О, и это уравнение с течением времени остается справедливым, значит оно выражает не только суперпозицию состояний в трехмерном смысле, но и суперпозицию состояний в четырехмерном смысле. Современная квантовая механика изображает состояния векторами в бесконечномерном пространстве. Еще в сороковые годы прошлого века Грассман и Кэли ввели понятие четырехмерного пространства. Это понятие, как мы видели, было широко использовано при построении теории относительности. В первой части этой книги упо- 220
Миналось и о дальнейшем обобщении геометрического понятия пространства, об л-мерном пространстве с любым числом измерений. Оказалось, что ряд важнейших геометрических соотношений остается справедливым при любом числе измерений. Поэтому представилось возможным построить теорию я-мерного пространства, в котором совокупность п чисел <1ч, ф21 • • -, Фп называется точкой или вектором. Аналогично трехмерным и четырехмерным геометрическим соотношениям в л-мерном пространстве сумма векторов Щи Фь...,<М и <?(у1У ср2,...,?п) определяется как вектор с компонентами ^ 4- срх, Ф2 + <?2,..., фп+?п, скалярное произведение <рф — как сумма произведений соответствующих компонент п 2 ¥ А = ?Л + Т,% + • • • + ?„Ъ 1=1 а длина вектора ф вычисляется по формуле, аналогичной формуле Пифагора: л f = 2 ^ = ^+^ + • • • + ^*- При переходе к п измерениям сохраняются и другие важнейшие геометрические соотношения. Они сохраняются и при п =оо. Эта идея была простым и естественным логическим выводов из я-мерной геометрии. Однако исторически интерес к безконечномерной геометрии создавался и поддерживался развитием механики и в особенности теории малых колебаний. Примером такой задачи может служить определение положения упругой невесомой струны, натянутой вдоль оси ху с расположенными на ней п небольшими грузами. В каждый момент положение системы определяется п числами у\, у?,...уп—отклонениями грузов от положения равновесия. Можно изобразить положение струны и изменение положения (например, колебания грузов вокруг положения равновесия) вектором в гс-мерном пространстве и его колебанием. Для этого достаточно считать вектором совокупность чисел у и #2»... >Уя- Колебания системы будут тогда изображаться колебаниями длины и направления вектора у. Теперь представим себе, что число грузов, расположенных на струне, неогра- 221
ниченно растет. В пределе Мы получим уже не невесомую струну, а струну с конечной массой, распределенной непрерывно вдоль струны. Теперь положение струны уже нельзя задать п числами, как это делалось раньше. Масса распределена вдоль струны непрерывно. Необходимо задать отклонение у в каждой точке х струны как функцию y = f(x). Раньше положение системы изображалось п числами, которые мы объявили вектором или точкой я-мер- ного пространства. Теперь по аналогии мы можем объявить функцию f(x), которой задано положение системы также вектором или точкой функционального, бесконечномерного пространства, получающегося при переходе от дискретного к непрерывному распределению массы струны, т. е. при п-*оо. Разумеется, не только положение механической системы в пространстве может быть задано функцией и соответственно вектором или точкой бесконечномерного пространства. Если испытывает колебание не струна, а, например, электрическое напряжение в линии передачи, то состояние электрической системы будет задаваться функцией v = f(x), где v — напряжение, а х — координаты точек линии в интервале между А и В, в котором задано напряжение. Эта функция может рассматриваться как вектор или точка бесконечномерного пространства. Вообще, если переменная х (независимо от ее физической природы) в интервале между Х\ и х2 изменяется непрерывно и проходит бесконечное число значений и если состояние системы задано некоторой функцией <Ь (х), определенной в этом интервале, то функция ф может считаться вектором бесконечномерного пространства. Мы будем обозначать его буквой ф. Гильберт ввел понятие бесконечномерного пространства, получившее широкое применение для векторного представления состояний квантовых систем. Чтобы определить пространство Гильберта, необходимо ввести еще некоторые допущения. Пусть в бесконечномерном пространстве длина вектора ф (функция ф (х), где х непрерывно меняется в интервале между А и В) определяется по аналогии с длиной n-мерного вектора. Вместо выражения £=1 222
нужно (поскольку теперь речь идет о функции и суммирование заменяется интегрированием) взять другое: в ф= J b*(x)dx. А Бесконечномерное пространство с определенной таким образом метрикой и называется пространством Гильберта. Представив состояния векторами в пространстве Гильберта, мы можем дать следующее истолкование сопряженности этих состояний. Возьмем л-мерный вектор фа с координатами аи а2,—, а*.. Вообще говоря, эти координаты могут быть комплексными числами; ведь мы имеем право умножить вектор <1> на любое число, в том числе и комплексное, не меняя при этом физического состояния системы, представленного вектором ty. Вектор фа, как и всякий вектор, имеет определенные компоненты в некоторой системе координат: в отличие от самого вектора, его компоненты относительны. Если перейти к другой системе координат векторного пространства, координаты приобретут другие значения. Мы их обозначим теми же буквами, но со штрихом: a'l9 *4,...,a^. Уравнения преобразования координат а—>Ь нам известны: каждая новая координата^', а^,..., cU вообще аг равна сумме всех старых координат aSj где s = 1,2...п, помноженных на коэффициенты \rs. Применив эйнштейнову сокращенную запись суммирования, т. е. отбросив знак суммирования, напишем: ar = \r$Q>s- Коэффициенты \rs зависят только от системы координат. Они, вообще говоря, являются комплексными числами. Тогда вещественные а могут превратиться в комплексные а'. Значит, вещественный характер координат вектора tyfl не инвариантен относительно координатных преобразований. Приняв, что координаты а могут быть комплексными числами, заметим, что каждому числу а соответствует комплексно-сопряженное с ним число а. Когда мы преобразовывали а к другой координатной системе, превращая их в а', вместе с а преобразовывались и сопряженные с ними а; преобразование а^-а! сопровождалось преобра- 223
Зованием а-+а'. Уравнения этого второго преобразования а'г = hsCis отличаются, вообще говоря, от преобразований а -* а'у так как коэффициенты Ks здесь могут быть другими. Чтобы отличить вектор с координатами а от вектора с координатами а, обозначим его другой буквой <р; а чтобы показать связь между ними, будем ставить один и тот же индекс. Тогда уа обозначает вектор, координаты которого представляют собой комплексно-сопряженные числа по отношению к координатам вектора фа- Такие векторы Дирак назвал «мнимо-сопряженными». Векторы <|> и <р однозначно определяют друг друга, и поэтому состояние системы может быть изображено каждым из них. В преобразованиях а-^а' и а-^а' фигурируют коэффициенты >чГ5. Чтобы получить теорию преобразований, адекватную квантово-механическим соотношениям между состояниями системы, вводится некоторое ограничение, накладываемое на lrs. Оно связано с соотношениями между двумя состояниями и соответственно двумя векторами % (с координатами av а2,..., вп)и<Мс координатами^,62»-..| &л). При координатных преобразованиях а->а' и b—>b' коэффициенты lrs должны быть таковы, чтобы инвариантным оставалось выражение, составленное из произведений координат bi вектора $ь на числа, сопряженные с координатами а-ь вектора Фа: atbi = ахЬг + а2Ь2 + . .. + апЬп. Числа aiy комплексно-сопряженные а{ — координатам^, представляют собой координаты вектора уа — мнимо-сопряженного '1>0. Поэтому написанное только что инвариантное выражение представляет собой скалярное произведение векторов <рв и <ЬА. Это произведение сра^ — обобщение обычного скалярного произведения а1Ь1 + а2Ь2 + ... + апЬп векторов с вещественными координатами. У таких обычных векторов скалярное произведение вектора на самого себя ciidi = ахах + а2а2 + ... + алап равно квадрату длины вектора. Соответственно, для векторов с комплексными координатами квадратом вектора фа или <?а является вещественное и положительное выражение 224
*A = afli = arai + a2a%+ • • ■ + w Если считать ф вектором, то можно дать геометрически наглядное представление ортогональности состояний. Ортогональными векторами, как известно, называются векторы, скалярное произведение которых равно нулю. В случае векторов с комплексными координатами, а именно такие здесь рассматриваются, ортогональными нужно назвать векторы сра и фь, если ^Jfd = 0 или ср^фа = 0. Ортогональны в этом случае и векторы <ра и ф^, и векторы фа и ^. Таким образом, два вектора ортогональны, если скалярное произведение одного на вектор, мнимо-сопряженный другому, равно нулю. Теперь посмотрим, как связывается векторное представление состояний с операторным представлением динамических переменных. Если считать функцию ф вектором, то линейный оператор — это оператор, превращающий вектор фа с координатами аха2ав... ап в другой вектор 'Ьь с координатами Ьф2 •••&*> причем координаты Ьг второго вектора связаны с координатами as линейными соотношениями (здесь, как и в других случаях, используется сокращенное обозначение суммирования выражений с повторяющимися индексами): br = ocrsa5. Коэффициенты ocrs, связывающие координаты as с координатами Ьг, зависят только от оператора, превращающего фа в ф*,. Эти коэффициенты можно считать составляющими оператора, и тогда оператор становится тензором; он характеризуется набором определенных чисел в каждой системе координат. Операторам сопоставляются динамические переменные. Впрочем, Дирак говорит не о динамических переменных, а о «наблюдаемых». В результате измерений мы получаем вещественные числа; поэтому Дирак называет «наблюдаемой» вещественную функцию динамических переменных и сопоставляет операторы — «наблюдаемым». Дирак вводит символику и указывает физический смысл координатного представления векторов. Прежде всего нужно определить систему координат. Каждая система отличается от других фундаментальными 225
единичными векторами. Среди бесчисленного множества ф- векторов, изображающих физические состояния и образующих /г-мерное векторное пространство, выбирают п ортогональных друг к другу, единичных векторов, которые и служат фундаментальными векторами выбранной таким образом координатной системы. Если любой ф- вектор разложить по этим фундаментальным векторам, то коэффициенты разложения и будут координатами вектора ф. Каждую систему координат Дирак называет «представлением», а самые координаты — «представителями». Через «представителей» можно выразить не только векторы (а, значит, и состояния), но и операторы (динамические переменные). Дирак показывает, что можно разложить переменную q, изображаемую оператором q7 по собственным значениям, которым соответствуют собственные состояния, изображаемые векторами ф'^, ф'^.-.ф?1*- Если рассматривать эти п векторов как фундаментальные векторы, мы получаем разложение каждого вектора по собственным состояниям переменной q—«^-представление». В качестве q можно рассматривать не только одну переменную, но и группу переменных, изображаемых коммутирующими операторами q\ q\ ... и т. д. Такие переменные будут обладать общими собственными состояниями; иначе говоря, изображающие их операторы имеют общие собственные значения. Можно взять другую переменную или другую группу коммутирующих переменных р и разложить любое состояние (любой вектор ф) по собственным состояниям ф', Фр> • • •» Ф/?л) (собственные функции оператора р). Тогда мы получим «р - представление» вектора ф. Дирак и Иордан разработали теорию преобразований—переходов от «^/-представления» к «^-представлению» вектора ф. Она систематически изложена в «Основах квантовой механики» Дирака. Мы попытаемся рассказать о смысле теории преобразований от одного «представления» к другому «представлению», не вводя символики, которой пользуется Дирак, и не повторяя большинства теорем и рассуждений. При этом можно дать лишь самое общее представление о смысле теории. Возьмем «представление», в котором фундаментальные векторы ф^ соответствуют собственным состояниям 226
переменной q} т. е. «^-представление». Разложим по этим фундаментальным состояниям <J^, ф£ и т. д. самую переменную q, т. е. ее оператор q (здесь можно не различать переменную и ее оператор). Координаты («представители») q в «^-представлении» — это «посредники» между двумя координатами — координатой а и координатой а', связанными друг с другом линейным преобразованием а->а', заданным уравнением а = а а *■> 4rs a (с эйнштейновым сокращением записи суммирования). В «^-представлении» координаты —«представители» — qrs переменной q обладают важным свойством. Все они равны нулю, если гфв. Иначе говоря, «^-представители» самой переменной (оператора) q образуют диагональную матрицу: qrs = 01 если r=^s, и <7rs = Xi> если r = s Xi 0 0 ... о х2 о ... О О Х8 .. . Здесь числа X/ — собственные значения оператора q. Этот вывод распространяется и на случай непрерывного ряда собственных значений переменной q. Всегда можно найти «представление», в котором «представители» динамической переменной образуют диагональную матрицу. Тут уже сама собой напрашивается физическая интерпретация: вообще диагональные элементы х* матрицы qrs— собственные значения оператора q— представляют собой значения динамической переменной q в фундаментальных состояниях. В случае, когда фундаментальные векторы — собственные векторы оператора q, значения изображенной динамической переменной в фундаментальных состояниях будут принципиально однозначными результатами однократных измерений. В общем же случае разложение вектора <|> по фундаментальным ортогональным осям позволяет найти вероятности значений #', %\ /", ...,х(п) динамической переменной q- Вероятности w равны квадратамф', ф" и т. д.: »(хОЧФ'!*=♦'*♦'. w (х") = |ФТ = <F"Y и т. д. 227
Аналогичные результаты можно получить для «р-пред- ставления» (где состояние ф представлено разложением по ортогональным состояниям, в которых оператор р имеет координаты, образующие диагональную матрицу) и для любого другого «представления». Центральное место в теории преобразований Иордана—Дирака занимают уравнения, переводящие «^-представление» в любое другое «представление». Существование таких преобразований и означает независимость неклассического, квантового объекта от выбора классических (условно классических1) представлений. В общем случае некоммутирующих переменных эти преобразования связывают вероятности определенных значений различных (некоммутирующих) динамических переменных. Дирак вывел так называемую «теорему взаимности», относящуюся к переменным q и р (или к двум группам переменных коммутативных в пределах каждой группы). Обозначив через х значения переменных группы q и через те значения переменных группы р, теорему эту можно сформулировать так. Вероятность того, что переменные q при одновременном измерении в состоянии, в котором р достоверно имеют значения * будут иметь значения х, равна вероятности того, что р будут иметь значения те в состоянии, когда q достоверно имеют значения х- 10. Неопределенность и дополнительность Классическая формулировка принципа неопределенности дана в статье Гейзенберга. Однако, прежде чем передавать содержание этой статьи, изложим идею неопределенности в виде некоторых общих соображений и мысленных экспериментов. Операторное представление позволяет получить общее решение вопроса о возможности одновременного точного измерения двух динамических переменных. Переменные L и М могут быть одновременно измерены с любой точностью, если их операторы turn обладают общими собственными функциями %. Если и 228
то как L, как и М. при повторных измерениях будут давать одни и те же значения. Здесь, конечно, не принимаются во внимание несущественные для теории, экспериментальные погрешности — колебания соответствующих факторов, ошибки наблюдения и другие обстоятельства. Принципиально, при сформулированном условии, измерения L и М дадут вполне определенные числа X и р.. Коммутативность операторов оказывается выражением возможности одновременного точного измерения представляемых этими операторами динамических переменных. Таковы, например, операторы различных составляющих количества движения pxi Ру и pz. Когда же операторы некоммутативны и, соответственно, не имеют общих собственных функций, нельзя найти такое состояние системы, при котором представленные этими некоммутативными операторами динамические переменные одновременно имеют определенное значение. В канонических уравнениях классической механики сопряжены друг с другом координата х и составляющая рх количества движения по оси х. Операторы, представляющие эти динамические переменные, некоммутативны. Мы уже знаем вид этих операторов. Их произведение: а а а д зф Л дф То же операторное произведение с переставленными сомножителями, т. е. обратный порядок операций, дает иной результат: Вычтем это выражение из предыдущего и мы получим не равное нулю результирующее воздействие оператора хрх — Рх х на функцию ф: Таким образом, мы получаем вид оператора — разности двух операторов: АЛ A A fl хрх-Рхх = ы. Как согласовать это перестановочное соотношение с возможностью применять понятия импульса и положения к частице? ^229
Гейзенберг показал, что перестановочные соотношения могут быть согласованы с таким применением, если допустить некоторую неточность значений координат и составляющих импульса частицы. Неточность измерений величины а обозначим через Да. Если результаты измерений дают числа а^{а1у а2, аг,.._. и т. д.), отличающиеся от среднего а на ок (ах = ах — ау а2 = а2 — а и т. д.), точность измерений будет измеряться средним квадратом отклонения о\ (а не просто akt так как ak может принимать и положительные и отрицательные значения, так что в среднем равна нулю). Квадратный корень из среднего квадрата отклонения и будет мерой точности: Да= )/!*. Теперь определим точность измерений координаты х и импульса рх электрона, находящегося в состоянии, описываемом волновой функцией ф, нормированной к единице. Из выражений для средних значений х и рх мы получим выражения для их средних квадратов х2 и р|. Общее выражение для среднего значения X оператора L в состоянии ф таково (когда ф — нормирована на единицу): х = ^£фЛ. В данном случае вместо L нужно подставить выражения операторов х и рх, волновая функция — это функция координаты х, и интегрировать нужно по dx. Для среднего значения х получаем: х = f ф*хф dx. Среднее значение квадрата х равно: *а = Г ф^ф dx. Аналогичным способом (несколько более сложным, ввиду большей сложности выражения оператора количества движения) находим: 230
Из этих выражений были получены соотношения для средних квадратов отклонений (рх— Рх)2 и {х — х)2 и, следовательно, для мер точности Ах и Ар . Они были получены в виде известного соотношения: и аналогичных неравенств для других координат и составляющих импульса: Смысл неравенств Гейзенберга очевиден: если увеличивается точность измерения компоненты импульса, соответственно уменьшается точность измерения координаты и наоборот. В работах Гейзенберга и Бора 1927 г. принцип неопределенности выводится из общих рассуждений об измерении и воздействии измерения на измеряемые объекты. Рассуждения на эту тему идут примерно по следующей схеме. Объекту измерения противостоит измерительный прибор. Действие прибора направлено на измеряемый объект, действие объекта — на прибор, и в таком взаимодействии состоит измерение, которое по самой своей природе означает изменение объекта. В макроскопическом мире такими изменениями можно пренебречь, в микромире они существенны. Далее идут иллюстрация этого принципа: воздействие процесса измерения координат частицы на ее импульс и воздействие измерения импульса на положение частицы. Этк воздействия нередко рассматривают как частные, конкретные проявления некоторой общей закономерности, свойственной не импульсу и координатам частицы, а всякому измерению. Справедливо ли такое представление, скажем позже; сейчас остановимся на тех мысленных экспериментах, которые служат обычными иллюстрациями принципа неопределенности. 231
Пусть целью эксперимента 1 будет измерение координаты х электрона, причем система координат связана с двумя экранами, поставленными параллельно оси х. Пучок электронов, летящих параллельно оси у, проходит через щель АВ первого непрозрачного экрана и попадает на второй, флуоресцирующий экран. Сцинтиляция на втором экране покажет, что в момент t электрон прошел через щель первого экрана. Тем самым определено положение электрона в этот момент относительно неподвижной системы координат. Точность, с которой определено его положение в момент /, зависит от ширины щели; нам известно только, что электрон прошел в интервале между краями щели. Уменьшая щель, мы можем неограниченно увеличивать точность измерения координаты электрона. Можно ли здесь, в описанных явлениях, усмотреть какое-либо действие процесса измерения на измеряемый объект? Нет, пока мы рассматриваем электрон как частицу и только, мы не можем говорить о действии прибора на электрон. Объектом измерения была координата электрона, и в пределах ширины щели изменение координаты не могло бы оказать никакого воздействия на экран, е ел и бы электрон был только частицей и не более того. В таком случае мы могли бы (разумеется, только в мысленном эксперименте) довести ширину щели до размеров электрона, а принимая электрон за непротяженную точку, бесконечно уменьшать щель, и электрон, прошедший через щель, мог бы не испытать со стороны экрана никакого воздействия, изменяющего координату электрона. Однако в действительности электрон обладает волновыми свойствами и будет испытывать диффракцию. Это означает, что электрон в результате взаимодействия с краями щели будет получать добавочный импульс по оси х. Это взаимодействие, связанное с волновыми свойствами частицы, состоит в изменении импульсов электрона и щели. Чем уже щель, тем шире будет главный диффрак- ционный максимум и неопределенность в значении импульса Арх будет больше. Можно ли его контролировать? Да, можно, но только одним способом: сделать первый экран подвижным и по сдвигам экрана судить об 1 См. Э. Шпольский. Атомная физика. М.—Л., 1944. стр. 275—278. 232
изменении импульса электрона при прохождении через щель. Тогда мы сможем с какой угодно точностью измерить импульс в момент t, когда электрон проходит через первый экран. Но тогда система, связанная с экраном, перестает быть совершенно неподвижной, и мы уже не можем с помощью этой системы точно определить координату х электрона в момент /. Попробуем уменьшить неопределенность импульса, уменьшая взаимодействие электрона и экрана. Для этого нужно расширить щель; зналит, и в этом случае точность определения импульса возрастает за счет точности определения положения электрона. До сих пор речь шла о координате, т. е. о положении в пространстве, с одной стороны, и импульсе — с другой. Но квантовая механика включает тезис о невозможности одновременного точного измерения и другой пары: времени t и энергии Е. Произведение неточностей At и АЕ имеет размерность действия и не может быть меньше постоянной Планка, деленной на 2я. Учитывая последующие работы Бора, это соотношение можно написать в виде: Д(£'-£).Д*>-£. Первый множитель, стоящий в левой части неравенства, представляет собой неопределенность в измерении приращения энергии (Е=- энергия при начале измерения, £'— при конце), a At — неопределенность момента времени, в который производилось измерение энергии — некоторый минимальный промежуток времени. Новая интерпретация этого соотношения предложена Н. С. Крыловым и В. А. Фоком *. Как взаимодействует «прибор» с «объектом» в продолжении At? Этот вопрос в прямом смысле нельзя ставить: чтобы говорить о таком взаимодействии, надо расчленить объективный процесс, используемый для измерения, на ряд процессов, охватывающих меньшие промежутки времени. Такое расчленение противоречит элементарному характеру рассматриваемого процеоса. Но можно придать вопросу о ходе процесса во.время измерения некоторый смысл, а именно: косвенный. Откажемся от прямого измерения приращения энергии за время At. Будем вместо прямого измерения 1 ЖЭТФ, 17, 2, 93 (1947). 233
пользоваться косвенным: до начала измерения включим в систему один «прибор», а в продолжении измерения будем пользоваться другим «прибором». Взаимодействие «объекта» с первым «прибором» можно теперь контролировать, но зато неконтролируемым оказывается взаимодействие «прибора» со вторым «прибором». Мерой неконтролируемого взаимодействия и служит написанное выше соотношение неопределенностей для энергии и времени. Этот сдвиг порога между классическим «прибором» и неклассическим «объектом» при обязательном сохранении такого создающего неопределенность порога — характерная особенность квантовой механики. Из сказанного следует, что изменение энергии системы в течение At не может описываться уравнением Шредингера. Уравнение Шредингера может описывать не прямые, а косвенные измерения, когда некоторый «прибор» характеризуется классическими понятиями, а затем включается в «объект», т. е. характеризуется неклассическими понятиями, и его изучают с помощью другого «прибора» К Другую, более общую, трактовку соотношения неопределенности энергия — время дали Л. И. Мандельштам и И. Е. Тамм 2. Это соотношение в форме выведено из представления об изменении квантовой системы во времени. Замкнутая квантовая система, если энергия имеет определенное значение, находится в стационарном состоянии. Она может изменяться, если энергия не имеет вполне определенного значения. Такое положение означает, что система находится в состоянии, представляющем собой суперпозицию двух и большего числа стационарных состояний. Неопределенность значения энергии системы является мерой скорости изменения состояния системы. Изменение состояния системы характеризуется скоростью изменения математических ожиданий физических величин. Чем больше неопределенность энергии системы, тем скорее (т. е. за.меньшее.время At) 1 См. Л. И. Мандельштам. Подн. собр. трудов, т. V. Изд-во АН СССР, 1950, стр. 360—372. 2 Изв. АН СССР, сер. физич, 9, № 1—2, 122 (1945). 234
изменение характеризующих систему физических величин станет заметным. «Заметным» Мандельштам и Тамм называют изменение физической величины, если оно превышает неопределенность математического ожидания этой величины. Отсюда было выведено, что минимальное время, в течение которого хотя бы одна из физических величин, характеризующих состояние системы, заметно изменится, связано с неопределенностью энергии Д£ написанным выше соотношением: Как полагают Н. С. Крылов и В. А. Фок \ входящая в это неравенство величина At не является временем реального измерения. Оно представляет условную величину и само написанное здесь соотношение неопределенностей Мандельштама — Тамма относится не к индивидуальному эксперименту, а к начальному состоянию. Теперь обратимся к статье Гейзенберга о принципе неопределенности. Эта статья «О наглядном содержании квантовой кинематики и механики», написанная в марте 1927 г.2, состоит из четырех параграфов. В первом даны определения понятий положения, скорости, энергии и т. д.— определения, сохраняющие свое значение в квантовой механике, и указаны условия, при которых они сохраняют значение. Во втором — на основе теории преобразований Иордана и Дирака доказывается, что основой статистического характера соотношений квантовой механики служит характерная неточность определения классических переменных при их одновременном измерении. Третий параграф посвящен квантово-механическому пониманию макроскопических процессов и четвертый — некоторым мысленным экспериментам, иллюстрирующим и доказывающим высказанные тезисы. Гейзенберг начинает с обоснования исходного, по его мнению, тезиса квантовой механики: «все понятия, применяемые в классической теории для описания механической системы, могут быть аналогичным образом строго определены и для атомных процессов». Анализ начинается с понятия положения и скорости. Полному и безусловному 1 ЖЭТФ, 17, 98 (1947). 2 Zeitschr. f. Phys., 43, 172 (1927). 235
одновременному применению этих понятий для описания микромира противоречат, во всяком случае на первый взгляд, перестановочные соотношения: Они заставляют сомневаться в применимости понятий скорости и положения в квантовой механике. Чтобы такие применения удовлетворяли перестановочному соотношению, понятия положения и скорости должны обладать свойствами, не известными классической теории. Далее, для микромира существенна прерывность некоторых процессов, в том числе движения материальной точки. В классической физике можно говорить о движении материальной точки через смежные точки пространства, образующие траекторию такого движения. Направление скорости определяется касательной к траектории. В дискретной теории точки пребывания частицы разделены конечными промежутками. Поэтому теряет смысл понятие скорости как производной; скорость определяется двумя или большим числом положений центра тяжести частицы. Соответственно, для каждого положения ап частицы можно говорить о двух скоростьях: одна определяется положениями аЛ_х и ал, другая —- положениями апиоп+1. Высказав эти соображения об объективной специфичности понятий положения и скорости в микромире, о необходимости ограничить точность определения положения и скорости для строгого определения этих понятий в квантовой механике, Гейзенберг отходит от характеристики самих квантовых объектов. Он рассматривает особенности экспериментов, производимых над квантовыми объектами, причем экспериментов, в которых участвуют классические приборы, т. е. приборы, регистрирующие положение и скорость. Именно такой анализ квантовой механики и кинематики Гейзенберг считает «наглядным истолкованием», которое имеется в виду в названии статьи. Гейзенберг дает следующее определение наглядности: «Физическая теория получает наглядное истолкование, если во всех простейших случаях качественно представимы ее экспериментальные следствия, причем применения теории не приводят к противоречиям». 236
Значит, представление о физическом объекте, не связанное с экспериментом, не является наглядным. Наглядность, о которой говорит Гейзенберг, соответствует наблюдаемости, о которой он говорил в 1925 г. Заметим, что речь идет об экспериментах с участием «классических» приборов (им, как мы увидим, сопоставляются «представления» Дирака). Гейзеяберг рисует наглядную картину эксперимента, определяющего положение частицы. Такое определение может быть произведено с любой точностью. Примером здесь служит мысленный эксперимент, производимый с помощью микроскопа, через который рассматривают электрон. Этот «микроскоп Гейзенберга» получил широкое распространение в литературе по квантовой механике и стал началом множества аналогичных мысленных экспериментов. Принципиально от него не отличается приведенный выше мысленный эксперимент с диафрагмой и флуоресцирующим экраном. Определяя с помощью микроскопа положение электрона и освещая для этого электрон, мы воздействуем на него. Чем меньше длина волны, тем больше энергия фотона, тем больше воздействие его на электрон. Но точность определения положения электрона обратно пропорциональна длине волны: мы можем определить положение электрона с точностью до длины волны. Импульс электрона в момент, когда на него падает свет, определен с точностью до изменения импульса под влиянием фотона. Следовательно, чем точнее определено положение, тем менее точно определен импульс, и наоборот. Положение и импульс связаны известным нам соотношением неточностей. Соотношение неточностей можно представить, разделив фазовое пространство на ячейки, размеры которых равны Л. Не трудно видеть, что фазовое пространство, где координатами служат пространственные координаты и импульсы, может быть разделено на ячейки, величина которых имеет размерность действия. Представим себе двухмерное фазовое пространство, соответствующее движению электрона по оси х. Абсциссами в этом пространстве служат пространственные координаты х, а ординатами— импульсы рх- Предположим, что нет возможности проникнуть внутрь этих ячеек с метрическими соотношениями, что внутри ячеек мы можем пользоваться лишь 237
аффинными соотношениями. Тогда можно определить х с точностью до горизонтального основания Ах ячейки Л, а импульс с точностью до вертикальной высоты /\рх ячейки. Ячейки обладают «упругостью», они могут бесконечно деформироваться, но сохранять при этом неизменную площадь, равную Л. Чтобы получить более точное представление о положении частиц, нужно сжать фазовое пространство по горизонталям, но тогда увеличится высота Арх ячеек. Когда А*-»* 0, т. е. точность определения положения электрона стремится к бесконечности, тогда Арх вырастают, стремятся к бесконечной протяженности, т. е. импульсы становятся совершенно неопределенными. В приведенном примере с микроскопом это соответствует бесконечно малой длине волны света и бесконечно большой энергии фотона. Общий вывод из содержания первого параграфа статьи Гейзенберга таков: все классические понятия могут быть строго определены для атомных процессов при условии допущения характерной неопределенности, заданной соотношением неточностей. Гейзенберг далее рассматривает теорию преобразований Дирака — Иордана. Соотношения между координатами, импульсами, энергией и т. д. могут быть выражены при помощи диагональных матриц. Для каждой физической величины — динамической переменной — имеется система координат, в которой ей соответствует диагональная матрица. Последняя изображает случай, когда не меняется состояние системы: «^-представление» — это «представление», в котором динамическая переменная q изображается диагональной матрицей, и, следовательно, «^-представление» состояния ф (обозначим его ф?) можно разложить в ряд по собственным состояниям Ф?» ф" и т. д., являющимся «состояниями определенности» переменной q. Так они были названы в предыдущем параграфе. Соответственно, переменная принимает в этих состояниях однозначно определенные значения, равные собственным значениям оператора q. Вполне аналогичные рассуждения могут быть отнесены к переменной р и к «р- представлению» состояния ф. Напомнив эти допущения теории преобразований Иордана и Дирака, вернемся к идеям Гейзенберга. Пере- 238
менные, которые в данном представлении изображаются диагональными матрицами, Гейзенберг называет «известными», остальные именуются «неизвестными». Физическая интерпретация этих допущений такова: «Если два эксперимента приводят к различным разделениям физических величин на «известные» и «неизвестные», то между результатами этих экспериментов существует лишь статистическая связь». В послесловии к этой статье Гейзенберг сообщил о соображениях Бора, ознакомившегося со статьей. Бор обратил внимание Гейзенберга на то, что в построениях последнего не учитывается некоторое существенное обстоятельство. «Прежде всего, неопределенность наблюдения..., непосредственно связанная с требованием одновременного ответа на различные вопросы, из которых одни имеют смысл в корпускулярной теории, а другие — в волновой». Речь идет о принципе дополнительности. Высказав его уже в 1927 г., Бор опубликовал фундаментальную работу по этому вопросу в 1928 г.1 и затем возвращался к нему в ряде других работ2. Бор считает принцип неопределенности следствием более общего принципа, принципа дополнительности, согласно которому нельзя в одном эксперименте обнаружить и волновые корпускулярные свойства материи. Изложим соображения Бора с помощью следующего примера3. Электроны, либо электромагнитные волны одной частоты, т. е. поток одинаковых фотонов, падают на диф- фракционную решетку и, отражаясь от нее, падают на фотопластинку, на которой мы увидим светлые и темные диффракционные линии. Положение этих линий полностью определяется волновыми свойствами потока: там, где разность хода отраженных волн от отражающих штрихов решетки равна целому числу волн, будут видны светлые полосы; там, где эта разность будет равна нечетному числу полуволн, будут видны наиболее темные полосы. Если мы будем посылать на решетку и затем фотографировать по одной частице, результат будет тот же. 1 Naturwissensch., 16,245 (1928). 2 См., например, «Athomtheorie und Naturbeschreibung», Берлин, 1931. 3 См. Э. Шпольский. Атомная физика, стр. 272—281. 239
Если полученная фотография отражает какие-то свойства отдельных электронов, то это вероятность их пребывания в той или иной точке, т. е. также континуальное, волновое свойство. Попробуем теперь экспериментально обнаружить корпускулярные свойства частиц, именно: их локализацию в момент отражения от решетки. Для этого будем регистрировать смещение штрихов диффракционной решетки под воздействием попавшей на этот штрих частицы. Тогда смещение штрихов смажет интерференционную картину. Сделаем еще одну попытку одновременно обнаружить волновые и корпускулярные свойства частиц. Направив поток частиц через две щели непрозрачного экрана на флуоресцирующий экран, будем наблюдать появившиеся на последнем интерференционные полосы (волновые свойства) и в то же время оставим себе возможность наблюдать, через какую щель прошла частица (корпускулярные свойства). Тогда мы приходим к противоречию. Предположим, мы определили, что частица прошла через верхнюю щель. Можем ли мы сказать, куда полетит частица дальше, в какое место на флуоресцирующем экране она попадет? Если частица в момент прохождения сквозь первый экран локализована в пространстве и мы можем определить, через какую щель она прошла; значит, вторая щель не влияет на движение этой частицы, не определяет ее дальнейшего пути. Но в действительности распределение частиц на втором экране зависит от взаимного расположения обеих щелей; значит, вероятность того или иного последующего движения одной частицы, прошедшей через одну щель, определяется и второй щелью. И тут перед нами кардинальный вопрос: если частица прошла.через одну щель, то какой же физический объект, определяющий последующую локализацию частицы, прошел через вторую щель? Как только мы задаем этот вопрос, иными словами как только хотим объяснить интерференционную картину на втором экране, нам приходится от него отказываться и при этом вообще отказываться от корпускулярного аспекта. Прохождение частицы, через ту или иную щель можно обнаружить, если, например, частица отклоняет эту щель в сторону. Но при этом смажется интерференционная картина. 240
Анализируя подобные опыты, Бор отметил, что каждый эксперимент обнаруживает либо волновые, либо корпускулярные свойства вещества и не может обнаружить другие. Поэтому волновые и корпускулярные свойства нужно считать не противоречащими друг другу, а дополняющими друг друга. Макс Борн в одной из своих недавних статей 1 излагает принцип дополнительности в очень краткой и ясной форме, позволяющей видеть и содержание этого принципа и идейные истоки его догматической интерпретаций в философских экскурсах некоторых теоретиков. Исходное обстоятельство — противоположность между «импульс- н о - э н е р г е т и ч е с к и м и» свойствами частицы и ее волновыми свойствами, частотой и волновым числом. Между первыми и вторыми установлены соотношения, выражающиеся в двух основных формулах квантовой механики. Первое из них найдено Планком: оно связывает энергию Е частицы с частотой v сопоставленной ей волны где h — постоянная Планка. Второе соотношение, установленное Эйнштейном и де Бройлем, связывает импульсы р частицы с волновым вектором к соответствующей вол • ны де Бройля: p=-hk. Частица рассматривается так, как будто ее размеры несущественны, т. е. как точка. Она может быть точно локализована в пространстве и времени. Но энергия и импульс этой точечной частицы выражаются через волновой процесс, т. е. нечто, длящееся бесконечное время в бесконечном пространстве. Если подойти к волновому процессу с требованием пространственно-временной локализации, встретятся неизбежные осложнения. Ограничивая волновой процесс во времени и пространстве, мы нарушаем его характер. Борн приводит пример такого нарушения не из квантовой области, а из акустики. Утверждение «музыкальный тон длится определенное время» неточно, так как при локализации гармоничная волна может 1 Ргос. Phys. Soc, 66A, 501 (1953). Русск. пер. см.: «Вопросы причинности в квантовой механике», сб. статей, М.— Л., 1954, стр. 106—109. 241
превратиться п набор гармоничных волн разной частоты, т. е. в шум, если волны из источника гармонических колебаний оборвать через промежуток времени, не слишком превышающий период колебаний. Поэтому резкое стаккато на .низких тонах органа плохо звучит К Таким образом, локализация волнового процесса во времени и пространстве влияет на те его свойства, через которые определяются импульсы и энергия частицы. С помощью принципа дополнительности Бор интерпретировал «представления» Дирака. Каждая квантовая система может быть экспериментально определена при помощи различных приборов. Одни приборы сортируют частицы, входящие в изучаемое множество, по их положению. Другая группа приборов сортирует частицы по импульсу. Для каждой квантовой системы измерительные приборы разбиваются на группы. Каждая группа приборов измеряет определенную динамическую переменную (координаты, импульсы, энергии и т. д.) и, вообще говоря, исключает возможность одновременного измерения другой динамической переменной. Пусть перед нами система, состоящая из элементарных частиц. Можно представить себе группу приборов, измеряющих положение этих частиц в пространстве, сортирующих эти частицы по значениям координат. Таким прибором может служить неподвижная диафрагма со щелями, через которые проходят частицы. Возможно, уменьшая просветы щелей, делать такие измерения все более точными. Эти же приборы позволяют определять с неограниченной точностью динамические переменные, являющиеся функциями координат. Описанная группа приборов соответствует «^-пред- ставлению». Можно представить себе другую группу приборов Они измеряют импульсы частиц. Например, при помощи подвижной диафрагмы, отклоняющейся при толчке, получаемом от проходящего через щель электрона, можно измерить импульс электрона, используя закон сохранения импульса. Показания этих приборов соответствуют «р-представлению». Познакомившись с интерпретацией «представлений», можно сказать несколько слов о значении «представле- 1 «Вопросы причинности в квантовой механике», стр. 106. 242
ний» и теории преобразований Иордана — Дирака для доказательства независимости квантовых объектов от методов их изучения. Таким доказательством служит взаимно-однозначное соответствие между «представлениями». Выбрав одно из них, мы можем получить все остальные. В выявлении такой однозначной связи различных представлений — смысл тензорного исчисления, при помощи которого была создана общая теория инвариантов в макроскопической физике — теория относительности. В конце первой части этой книги было уже вскользь сказано о принципиальной возможности непосредственного некоординатного описания процессов, лежащих в основе релятивистских эффектов. В теории относительности «представлениями» служат различные системы четырехмерных координат или же системы трехмерных координат, движущихся прямолинейно и равномерно (специальная теория относительности) либо с ускорением (общая теория относительности) относительно друг друга. В квантовой механике «представлениями» служат многомерные координатные системы, соответствующие сериям физических процессов, связывающих собственно квантовые процессы с точными, определенными, однозначными изменениями или координат, или составляющих импульса (или времени, или энергии). Возможно ли представить себе квантовый процесс без той или иной цепи дальнейших процессов, связывающих его либо с макроскопически регистрируемым точным изменением координат, либо с таким же изменением импульса (и со статистически определяемым изменением другой, сопряженной переменной)? Иначе говоря, возможно ли инвариантное «представление», помимо условно-классических «представлений» Дирака? Этот вопрос, к которому мы уже не раз подходили, останется и сейчас без ответа. Мы вспоминаем о нем вновь и вновь, чтобы проследить стержневую линию, проходящую через историю квантовой механики в течение тридцати лет и, быть может, сейчас приближающуюся к узловому пункту. Вернемся к принципу дополнительности. В том, что сказано до сих пор, нет ничего, что не содержалось бы в обычных иллюстрациях неопределенности. Но Бор приписывает принципу дополнительности более широкую роль. Он считает его общим априорным принципом по- 243
знания, гносеологическим, а не физическим, применимым к любой области знаний К Из подобной догматической, априорной трактовки дополнительности вытекает представление о раз навсегда данном характере современной квантовой механики. Представители копенгагенской школы в своих собственно физических исследованиях подготавливают коренные преобразования современной теории, но этому противоречит задерживающая размах физических исследований философско-методологическая установка. Разумеется, Бор, Гейзенберг -и Борн и в своих общих высказываниях упоминают о перспективах развития и изменения современной теории. Но они исходят из неизменности оснований квантовой механики, неизменной и неизбывной противоположности между классическим «прибором» и неклассическим «объектом». Это мешает должным образом оценить те тенденции экспериментальной и теоретической физики, которые требуют иной постановки проблемы «прибора» и «объекта». С этой стороны очень показательна уже цитированная статья Борна «Состояние идей в физике и перспективы их дальнейшего развития». Борн исходит из явления, которое он называет «устойчивостью принципов». Он разъясняет свою мысль: «...существуют какие-то общие тенденции мысли, изменяющиеся очень медленно и образующие определенные философские периоды с характерными для них идеями во всех областях человеческой деятельности, в том числе и в науке». Паули и Борн назвали эти тенденции «стилями», определяющими принципы научного мышления, «относительно априорные по отношению к данному периоду». Именно из характеристики «стилей» вытекают прогнозы на будущее. Очевидно, они не могут быть особенно радикальными, если основа их — «стили», неизменные в течение долгого периода. Несомненно, наука в своем развитии приходит к таким принципам, которые в дальнейшем уже не могут быть отброшены, а могут лишь конкретизироваться и уточняться. Но Борн, говорит о другом. Он рисует всю историю знаний, как последовательный переход от субъективист- 1 Dialectica, 7—8, 317—318 (1948). 244
ского «стиля» древности и средних веков к объективно-детерминистическому «стилю» науки XVII—XIX вв. и затем объективно-субъективному «стилю» современной науки. Антропоморфные критерии царили в науке вплоть до Кеплера; античное понятие силы как субъективного усилия, поддерживающего движения, «совершенные» круги и эпициклы древней и средневековой астрономии, телеологические объяснения дожили до XVII в. Следы субъективизма остались и в XVIII в.: даже Эйлер придавал субъективистски-телеологический смысл принципу наименьшего действия. Но господствующими стал, начиная с Галилея и Ньютона, другой принцип: мир управляется строгими детерминистическими законами. Выражением этого принципа Борн считает дифференциальные уравнения механики, точно предсказывающие судьбу всякой системы из начальных условий. Наука изучает объективный, детерминированный ход событий. Такой «стиль» Борн называет ньютоновым. Борн прослеживает развивающиеся в рамках классической физики новые тенденции, подготовившие новый «стиль» науки. Классические дифференциальные уравнения не определяют движения полностью, нужны начальные условия. Их ищут в предистории Вселенной, термодинамика отказывается от изучения молекулярных траекторий, определяемых классическими уравнениями движения, в пользу иных путей познания, энтропия получает статистическое истолкование, и все это прокладывает дорогу квантовой теории. Теория Планка и затем боровская идея стационарных состояний и переходов содержали новое представление об объекте и субъекте познания. Борн говорит о субъективном характере случайности: «...случайность может быть понятна только по отношению к ожиданиям субъекта». Эта мысль — заметим в скобках — кажется очевидной и копенгагенской школе и ее оппонентам, зовущим физику к классическим устоям. Борн считает квантовую физику выражением нового «субъективно-объективного стиля». Он думает, что этот стиль незыблем и откровенно указывает на априорные философские истоки такого взгляда: «Я рискну предсказать, что этот стиль мышления останется и в дальнейшем и что будущие изменения, когда они наступят, отнюдь не возвратят нас назад, к прежнему, так называемому классическому стилю, а, наоборот, при- 245
ведут к чему-то еще более далекому от него. Моя уверенность в этом зиждется не только на успехах существующей теории, но и на моей личной привязанности к ее философии». Принцип дополнительности, рассматриваемый исторически, представляет собой попытку вывести соотношения неточностей из более общего допущения. Но, в сущности, принцип неопределенности получает от принципа дополнительности лишь то, что сам дает ему,— рациональное содержание принципов в основном совпадает. Бор, подходивший к идее дополнительности уже в 1925 г., двумя годами позже присоединил к мысли Гейзенберга свои соображения о невозможности исследования волновых и корпускулярных свойств вещества одновременно, в одном и том же эксперименте, и представил эту физическую констатацию в виде априорного закона познания. Отводя такое догматическое понимание дополнительности, явным образом вытекающее не из логики экспериментального исследования, а из предвзятых позитивистских позиций, следует остановиться «а вопросе: является ли собственно физическая констатация дополнительности физическим объяснением соотношения неточностей. Что собственно означают в данном случае слова «физическое объяснение»? Приведем одну историческую аналогию. Можно ли говорить о физическом истолковании ньютоновой механики? Это выражение— «физическое истолкование» имеет в данном случае только один смысл: поиски и установление более общих законов, содержащих классическую механику как частный случай. В этом смысле физическим истолкованием классической механики являются более общие, релятивистские и квантово-механи'ческие законы. Физическим истолкованием квантовой механики может быть более общая теория, из которой в виде частного случая могут быть выведены основы квантовой механики. Принцип дополнительности как констатация определенных отношений между неклассическим объектом и его классическими представлениями опирается на исходные допущения квантовой механики. Принцип дополнительности как более общий, гносеологический принцип — априорная, догматическая, неправомерная конструкция. Следовательно, принцип дополнительности следует рассматривать не как 2dfi
обоснование или истолкование квантовой механики, а как один из аспектов ее основных положений, из которых вырастает логически замкнутая и оправдывающаяся в огромном числе случаев система. Действительным обоснованием квантовой механики будет, по-видимому, теория, выходящая за рамки классического представления неклассических объектов. Можно думать, что такой будет теория элементарных частиц, включающая объяснение их размеров, структуры и других свойств, основанная на новых экспериментальных данных. В истории физики новые теории, дававшие подлинное физическое истолкование старых, всегда включали объяснение понятий и величин, до того бывших феноменологическими. Для Кеплера такими величинами были расстояния между небесными телами и скорости их движения. Кеплер думал о причинах, объясняющих размеры и структуру солнечной системы. Рациональное объяснение дано в далеко не окончательной форме классической механикой и космогонией. У Кеплера впервые отчетливо зазвучала эта тенденция физического объяснения. В XVIII в. появились попытки физического объяснения размеров Земли. Для молекул ответ на вопрос о причине их величины и свойств дан атомистической химией, на вопрос о физических причинах размеров и свойств атомов ответила квантовая механика. Вопрос о причинах, определяющих размеры и свойства электронов и других элементарных частиц, пока не нашел ответа и только сейчас он поставлен в качестве основного, настоятельного, без решения которого физика не может двигаться дальше. Элементарные частицы в основном служили до сих пор средством, а не объектом физического объяснения, и только сейчас физика переходит к физическому объяснению размеров и других свойств элементарных частиц. Принцип неопределенности означает существование некоторого физического объекта, внутрь которого нельзя проникнуть с понятиями одновременно определимых координат и составляющих импульса (или времени и энергии). Можно ассоциировать принцип неопределенности с известной (сформулированной Неттер и Гильбертом) связью между сохранением импульса и однородностью пространства, а также сохранением энергии и однородностью времени. Но подобные соображения, сопоставле- 2А1
иия и выводы будут описанием, а не физическим объяснением (в смысле, исторически развивающемся от Кеплера до наших дней) неопределенности. За пределы такого описания не выходят и соображения Бора о дополнительности. Принцип дополнительности, если оставить в стороне его априорно-догматическую версию, объясняет соотношение неопределенности неконтролируемым взаимодействием квантовой системы («объекта») с системой, подчиненной классическим законам («прибором»). Его нельзя контролировать в силу дискретности действия. Значит, мы возвращаемся к идее Планка и констатируем: узнав за полвека с лишним очень много о следствиях дискретности действия, мы ничего не узнали о ее причинах. Физическое объяснение соотношений неопределенности «координата-импульс» и «время-энергия» должно указать причины дискретности действия. Можно думать, что путь к обнаружению таких причин лежит через дальнейшее и более глубокое слияние квантовой теории с теорией относительности, через исследование структуры и размеров элементарных частиц. Но в 1927 г. до этого было еще очень далеко. 11. Детерминизм, скрытые параметры и полнота квантово-механического описания В 1927 г. собрался очередной, пятый Сольвеевский конгресс физиков, на котором разгорелась оживленная дискуссия по основным проблемам квантовой механики. Здесь впервые применительно к квантовым процессам прозвучало слово «индетерминизм» и группа крупнейших физиков — Бор, Гейзенберг, Шредингер, Борн, Иордан, Паули, Дирак — выступили с тезисом о беспричинности элементарных процессов. Этот тезис, выражавший весьма традиционную позитивистскую философскую концепцию, был встречен резкой критикой со стороны Лоренца, Лан- жевена, Эйнштейна и некоторых других теоретиков. Один из создателей волновой механики, де Бройль, также в этот период стоял на позициях детерминизма микропроцессов и пытался дать новую интепретацию волн материи, исключавшую самую постановку вопроса об индетерминизме. 248
Ланжевен в своем выступлении высказал мысль об условности «классического вопроса» применительно к квантовому объекту. «Если природа,— говорил впоследствии Ланжевен,— не дает точного ответа на наш вопрос относительно электрона, уподобляемого частице классической механики, то не будет ли слишком большой самонадеянностью сразу заключить, «что природа не знает детерминизма». Не будет ли более правильным сказать, что самая постановка вопроса является неправильной и что электрон вообще не может быть уподоблен частице в понимании классической физики» 1. Слова Ланжевена проникают в самую сущность дела. Выступая против индетерминизма, Ланжевен отнюдь не восстанавливает единовластия классического детерминизма, основанного на одновременном, точном определении координат и составляющих импульса частиц. Он не сводит неопределенность и статистический характер квантовых закономерностей к простому незнанию скрытых динамических закономерностей, одновременно и точно определяющих координаты и импульсы. Лаижевен не склонен успокаивать сторонников абсолютного координатно-импульсного детерминизма; он не говорит им, что дело не так плохо, позади квантовой статистики стоят-де пока неизвестные координатно-импульс- ные классические закономерности. Ланжевен отрицает абсолютную законность координатно-импульсного, классического вопроса, задаваемого природе в отношении электрона. Конечно, этот вопрос присущ квантовой механике, и, отвечая на него, современная физика накопила множество достоверных сведений о микромире, но — это вытекает из слов Ланжевена — может встретиться ситуация, когда незаконность вопроса окажется существенной. Именно в ней — разгадка неопределенности. Сейчас, вспоминая выступление Ланжевена на Соль- веевском конгрессе, мы можем сказать, что физика середины XX в., по-видимому, подошла к границе условно- законного уподобления элементарных частиц классическим частицам, иными словами — к границам квантовой механики, основанной на таком уподоблении. 1 П. Ланжевен. Избранные произведения. М., 1949, стр. 396—397. 249
Классический детерминизм — принцип одновременного и абсолютно точного определения координат и составляющих импульса — лежит в основе «классического вопроса», уподобляющего электрон классической частице. На этот вопрос в квантовой механике не может последовать точного ответа. Значит, квантовая механика выражает более общий принцип детерминизма. Несколько иной была позиция Эйнштейна. Оспаривая не только индетерминистские выводы, но и вероятностную трактовку волн де Бройля, Эйнштейн выдвинул следующий пример. Пусть частица, движению которой соответствует плоская монохроматическая волна <|>, проходит через отверстие в плоском экране. Проходя через отверстие, волна благодаря диффракции становится за экраном расходящейся сферической волной. За плоским экраном с отверстием помещен другой, регистрирующий экран, например фотопленка. Последняя имеет форму полусферы с центром, совпадающим с отверстием в первом экране, т. е. все точки фотопленки находятся на одинаковых расстояниях от отверстия — центра расходящейся волны. Согласно вероятностной интерпретации волновой функции ф, частица попадает на некоторую точку фотопленки с вероятностью, равной квадрату ф в этой точке. Частица вызовет здесь потемнение пленки. Ни в какой другой точке потемнение пленки не произойдет, во всех остальных точках попадание частицы исключено ее попаданием в рассматриваемую точку. Значит, как только фотографический эффект, вызванный частицей, произошел, автоматически уменьшаются до нуля вероятности попадания частицы в другие точки. Почему же эти вероятности до фотографической регистрации частицы на полусферической пленке не были равны нулю? Потому, что мы просто не знали еще действительной, вполне определенной траектории частицы, или потому, что эта траектория объективно, независимо от наших знаний, действительно неопределенна, размазана? Эйнштейн рассматривает оба возможных ответа с точки зрения пространственно-временной связи событий. Если наличие частицы в данный момент в данной точке исключает ее пребывание во цсех других точках, значит 250
точка локализована. Появление частицы в этой точке не может мгновенно уничтожить возможность ее пребывания в других точках, если частица не находится в каждый момент времени в определенном пункте пространства. Представим себе, что это так и есть, что частица обладает определенной траекторией, иначе говоря, остановимся на первом из возможных ответов. Тогда неопределенность координаты — чисто субъективное обстоятельство и статистический характер закономерностей квантовой механики — результат простого незнания некоторых параметров (об этих скрытых параметрах — речь впереди). Как только результат действия этих параметров, точно определяющих траекторию частицы, стал известен (благодаря потемнению фотопленки), сразу же отпадает мысль о ненулевой вероятности попадания частицы в другие точки. Эта вероятность была только мыслью, только предположением, только результатом незнания действительной, определенной траектории частицы. Такая субъективная версия полностью восстанавливает детерминизм, причем классический детерминизм Лапласа и Лагранжа: материальные точки, составляющие Вселенную, обладают бесконечно точными значениями координат и беЪконечно точными значениями скорости; эти значения полностью предопределяют все последующие события, всю последующую судьбу Вселенной. Концепция классического детерминизма дана здесь в подчеркнуто лапласовской форме, чтобы оттенить ограниченность того детерминизма, о восстановлении которого шла речь. Второй ответ предполагает объективно-вероятностный характер значений динамических переменных в квантовой механике. Это предположение, как показал Эйнштейн, ведет к крайне парадоксальным выводам. Все дело в том, что частица теряет в известной мере свою пространственно-временную индивидуальность (т. е. точные значения пространственных координат и скорости в каждый момент времени) и не теряет индивидуальности в бесконечно малом пространственно-временном объеме. Именно на подобном выводе и настаивал Бор. Если статистический характер квантовых закономерностей — объективное свойство движущихся частиц, то частица существует каким-то образом во всем простран- 251
стве между плоским экраном и полусферической фотопленкой. Это пространство может измеряться дециметрами — речь идет явным образом о макроскопическом пространстве. Частица присутствует повсюду, но с некоторой вероятностью своего выявления. Бор говорит: «...в конечных областях времени-пространства частицы суть нерезко определенные индивидуальности». Но в своем каузальном, подчиненном закону сохранения энергии воздействии на фотопленку частица обладает резко очерченной индивидуальностью. Де Бройль называет это «способностью частицы конденсироваться в одной точке, производя в ней эффект, сообразный с каузальными законами сохранения энергии». Так он интерпретирует фразу Бора: «Индивидуальность частицы, выходя из пределов пространственно-временного описания, отвечает требованиям причинности» 1. Заметим, что у Бора здесь фигурирует уже не две, а три области физических явлений. Первая—это макроскопические явления, подчиняющиеся классическому детерминизму; вторая — элементарные движения частиц, где «природа совершает свободный выбор», и третья — детерминированные качественные процессы в бесконечно малых масштабах, где частица проявляет свое локализованное присутствие превращениями энергии. Сейчас особенно интересна именно эта мысль о каузальной связи между энергетически эквивалентными эффектами в областях, которые Бор считал бесконечно малыми. Указанная мысль возродилась в развитии теоретической физики в сороковые-пятидесятые годы. В 1927 г. спор шел о движении частицы в конечных областях, например о ее движении между прямым экраном и пленкой в приборе, нарисованном Эйнштейном. Эйнштейн полагал, что исчезновение вероятности пребывания частиц во всех иных точках в момент регистрации частицы в одной точке несовместимо с пространственно- временным описанием мира, и делал отсюда вывод, что нужно отказаться от понимания неопределенности как объективного свойства микрообъектов и от вероятностной трактовки квантовой механики. 1 Л. де Бройль. Введение в волновую механику. Киев, 1934, 252
Что значит в данном случае «пространственно-временное описание мира»? Это выражение можно понимать в смысле объективности пространства и времени. Картина мира, отказывающаяся от такой посылки, перестает быть научной картиной мира. Но под «пространственно-временным описанием» можно понимать и нечто другое: описание мира в виде совокупности материальных частиц, центры тяжести которых изменяют положение со временем, т. е. частиц, координаты которых являются функциями времени х = f(t). Такое описание — наиболее общее определение механики, оно охватывает не только классическую, но и релятивистскую и даже квантовую механику. Наличие волновых свойств у элементарных частиц делает неприменимым (применимым с ограничениями) точное механическое описание и связанные с ним понятия. Если под пространственно-временным описанием понимать описание типа x = f(t), то с ним связаны не только координаты, но и другие переменные. Координаты можно дифференцировать по времени, получить скорости, приписав частице массу, — импульсы и т. д. В этом понимании механическое (в широком смысле) пространственно-временное описание мира означает описание с помощью крординат, импульсов и других переменных как дифференцируемых функций времени. Так же, как и «пространственно-временное описание», детерминизм может означать причинное объяснение мира вообще, отказываясь от которого наука перестает быть наукой, и может иметь более узкое значение — абсолютной применимости уравнений движения, включающих координаты и импульсы. Статистические закономерности квантовой механики, оставаясь целиком в пределах детерминизма, выходят за рамки второго, более узкого понятия, они ограничивают его. Нетрудно видеть, что обе группы, спорившие друг с другом в 1927 г., по существу отказывали статистическим закономерностям в объективном характере. Если, следуя Максвеллу, ввести понятия динамической и статистической закономерностей, то выходит, что и Эйнштейн и Бор (называя их как представителей дискутировавших групп) отождествляли динамические закономерности и объективные закономерности вообще, отрицали объек- 253
тИвный характер случайности, считали случай мерой незнания, а статистическое исследование — результатом вынужденного или произвольного игнорирования некоторых явлений. Вопрос об объективном характере понятия случайности и статистических закономерностей давно решен в положительном смысле философией марксизма. Незнание этой философии и тысячи предрассудков, препятствующих ее изучению в среде естествоиспытателей, тормозили правильный подход к проблеме. Эйнштейн и другие защитники детерминизма отождествляли его с динамическим детерминизмом и, постулируя динамические закономерности, стоящие за статистическими закономерностями квантовой механики, считали статистический характер этих закономерностей субъективным — мерой незнания скрытых параметров, определяющих состояния квантовых систем по всем правилам динамического детерминизма. Бор, Гейзенберг, Дирак и другие также отождествляли детерминизм с динамическим детерминизмом, поэтому статистика и для них исключала детерминизм. Но они делали другой вывод: раз квантовая статистика противоречит детерминизму, значит детерминизм должен быть отброшен. Индетерминистские заявления, начиная с 1927 г., стали постоянным рефреном работ по квантовой механике и основным содержанием философских выступлений копенгагенской школы. В марксистской литературе не раз говорилось, что индетерминизм, как и вся неомахистская линия в философии современной физики, не вытекает однозначно из ее положительного содержания. Прибавим только одно свидетельство. Оно принадлежит Бертрану Расселу. Рассел говорит об ученых, которые «попытались спасти свободу воли человека, апеллируя к нашему незнанию поведения атомов». Рассел утверждает, что эти ученые выступали с индетерминистскими заявлениями «не в качестве ученых и строго научно, но скорее как добрые граждане, желающие защитить добродетель и собственность» 1. Таким образом, и представление о субъективном характере квантовой статистики, и догматическая абсо- 1 Цит. по статье Вассэля в сб. «Вопросы причинности в квантовой механике». М., 1954, стр. 143. 254
лютизация вероятностной интерпретации, противопоставлявшая ее детерминизму как новый тип научного объяснения, не могли указать физике действительно прогрессивный путь. Его указывала диалектико-материа- листическая концепция детерминизма, включавшая представление о статистически-каузальных зависимостях. Но пройти этот путь физика могла лишь на основе экспериментального исследования. Только в середине века, на подступах к новой области явлений, развертывающихся в масштабах порядка Ю-13 см, физика подошла к границам квантовой механики, созданной в 1924—1927 гг. и развернувшейся в тридцатые-сороковые годы в большую и разветвленную систему сведений об атомных процессах. Из собственно физических концепций, противопоставленных в 1927 г. вероятностной интерпретации волновой функции, наибольший исторический интерес представляет «теория двойного решения», принадлежавшая де Бройлю. При изложении гипотезы волн материи было выяснено различие между амплитудой и фазой волн де Бройля: фаза соответствует импульсу и энергии частицы и имеет непосредственный физический смысл, амплитуда же соответствует лишь вероятности .найти частицу в данной точке. Импульсы и энергия частицы в волновом представлении получали точные и достоверные значения, а координаты — вероятные. Де Бройль думал выйти из такого ^противоречия своей теорией двойного решения, окончательно сформулированной в 1927 г.1. Эта теория сводится к следующему. Волновое уравнение имеет непрерывный ряд решений, функция ^ — непрерывное решение уравнения. Де Бройль предположил, что наряду с этим непрерывным решением О существует другое решение иу имеющее особенность, сингулярность. Это значит, что функция и описывает дискретную частицу, сингулярность соответствует значениям координат точки, в которой находится частица. Сингулярность, вообще говоря, соответствует меняющимся координатам, т. е. функция и описывает движущуюся частицу. Обе функции <Ь и и имеют одну и ту же фазу, 1 Journ. de Phys. Rad., 8, 225 (1927). 255
одинаковым образом зависящую от х, у, z и /. Но амплитуды f и и — различны, амплитуда ф непрерывна, а амплитуда и в отличие от нее имеет сингулярность. Де Бройль доказал, что при этом сингулярность описывает траекторию, определяемую условием: в каждой точке скорость сингулярности равна градиенту фазы. Отсюда можно определить зависимость движения частицы- сингулярности от непрерывного волнообразного движения. Можно описать эту зависимость, введя представление о некотором силовом поле, в котором движется сингулярность-частица, о «квантовом потенциале» поля, характеризующем реакцию волны. Таким образом, функция и описывает, во-первых, реальный волновой процесс, определяющий движение сингулярности-частицы, и, во- вторых, самое движение частицы. Напротив, функцию ф де Бройль считал лишенной физического смысла, она не описывает ни физически реальный волновой процесс, ни движение дискретного тела. Эта функция имеет ту же фазу, что и функция и. Движение частицы происходит в направлении градиента фазы ы, или, что то же самое, градиента фазы ф, т. е. траектории частицы ортогональны поверхности одинаковой фазы ф. Отсюда де Бройль нашел, что вероятность пребывания сингулярности-частицы в точке равна квадрату амплитуды ф в этой точке. Понятию вероятности де Бройль придавал субъективный смысл; точнее говоря, он придавал субъективный смысл вероятностному характеру зависимости от координат амплитуды ф — интенсивности непрерывного волнового процесса. Такой характер, говорит де Бройль, результат незнания, в зависимости от наличия сведений о движении частицы вероятность может изменяться. Следовательно, динамическая, нестатистическая (согласно де Бройлю единственно объективная) закономерность описывается функцией и, обладающей физическим смыслом. Оставалось заменить статистические закономерности, описываемые уравнением Шредингера для непрерывной волны ф, нестатистическими закономерностями, описываемыми аналогичными уравнениями для функции и. Но де Бройль не счел себя способным справиться с математическими трудностями исследования функций, имеющих решения с сингулярностью. Поэтому, готовясь летом 1927 г. к докладу па Сольвеевском конгрессе, де Бройль 256
воспользовался компромиссным представлением. Раз движение частицы определяется градиентом фазы ф, значит можно представить дело таким образом, как будто волна ^ «ведет» частицу. В этом состоял основной смысл «теории волны-пилота», изложенной де Бройлем в октябре 1927 г. на Сольвеевском конгрессе. Эта теория позволила де Бройлю обойти математические трудности исследования функции иу «о она зато оказалась легко уязвимой по своему физическому смыслу. Для самого де Бройля вскоре стало ясно, что в теории волны-пилота волна ф (которую он считал физически фиктивной) определяет движение частицы. После возражений против теории волны-пилота, сделанных Паули и другими сторонниками вероятностной версии, де Бройль вскоре присоединился к последней. Много лет спустя он, однако, вновь вернулся к идее двойного решения. В начале тридцатых годов споры о детерминизме в квантовой механике приняли несколько иную форму. Нейман в своей книге «Математические основания квантовой механики» 1 исследовал вопрос о возможности иной интерпретации квантовой механики, помимо вероятностной. Могут ли, вообще говоря, средние значения динамических переменных, указываемые в общем случае квантовой механикой, считаться результатом усреднения точных, нестатистических детерминированных значений, зависящих от некоторых еще не известных нам параметров? В классической статистической физике мы пользуемся средними, потому что не знаем или не нуждаемся в знании скоростей и координат отдельных молекул. Эти параметры определяют не вероятность, а достоверное значение тех же переменных в каждый будущий момент времени. Таким образом, за вероятностными (определяющими вероятность тех или иных определенных значений и средние значения при большом числе измерений) закономерностями макроскопической теории стоят нестатистические закономерности. Может быть, в глубине, за кулисами квантово-механической сцены, на которой действуют статистические закономерности, стоят неизвестные нам параметры, определяющие для всех состояний точные, 1 J. v. Neumann. Mathematischen Grundlagen гег Quantum- mechanik. Berlin, 1932. 257
достоверные значения координат, импульсов и других динамических переменных? Если это так, то квантовая механика в вероятностной интерпретации представляет собой временный отход от классических идей либо теорию, по существу не противоречащую классической, так же как классическая статистика при всей своей специфичности не противоречит классической механике Ньютона и классическим уравнениям движения. Нейман пишет о скрытых параметрах: «Чтобы показать каузальный характер связи функции ф со значениями физических величин по примеру классической механики, можно истолковать ее таким образом: Ф дает не точное описание состояния, для полного описания нужно задать еще ряд чисел, так что, кроме координат, входящих в функцию <5>, система обладает рядом других координат. Знание всех координат позволило бы найти с полной точностью и определенностью значения всех физических величин. Используя только функцию ф (в классической механике также используется лишь часть всех координат 9i» •••»</* и импульсов Pi, ..., р/с), можно высказывать лишь статистические утверждения. Конечно, такое толкование гипотетично. Это—попытка, успех ее зависит от действительного обнаружения дополнительных координат и построения с их помощью каузальной теории. Последняя должна согласоваться при этом с опытом и при усреднении по дополнительным, не входящим в ф координатам давать обычные статистические утверждения квантовой механики» К По сравнению с известными координатами, входящими в функцию ф, дополнительные координаты «грают скрытую роль. Естественно назвать их «скрытыми координатами», или «скрытыми параметрами». Прежде всего нужно подчеркнуть, что вопрос, поставленный Нейманом, не допускает априорного ответа. A priori можно только сказать: 1) что речь идет не о выборе между каузальной и «некаузальной» теориями — вероятностная интерпретация квантовой механики не колеблет детерминизма, что бы об этом ни думали авторы такой интерпретации; 2) что дальнейшее развитие физи- 1 Neumann, loc. cit., S. 108—109. 258
ки приведет к открытию дб сих пор не известных параметров и обнаружит в этом смысле неполноту современного квантово-механического описания, заменив его новым, более (но также не абсолютно) полным; 3) что новая теория — в этом Нейман, разумеется, прав — должна быть уточнением, а не отменой квантово-механических вероятностных утверждений, проверенных таким числом экспериментов и применений, какого не знала еще ни одна физическая теория. Из этих априорных замечаний следует, что можно считать исключенным открытие лишь тех «скрытых параметров», существование которых противоречит утверждениям квантовой механики, получившим достоверное экспериментальное подтверждение. Весь вопрос состоит в том, противоречит ли существование параметров, определяющих нестатистическим образом динамические переменные системы в любом состоянии, точным и достоверным утверждениям квантовой механики, получившим практически полное экспериментальное подтверждение. Нейман доказывает, что скрытые параметры противоречат таким утверждениям. Не будем повторять доказательств. Изложим их основной физический смысл в связи с принципом дополнительности так, как это сделал Гей- зенберг в лекции, прочитанной в Венском университете в 1935 г.1. Гейзенберг исходит из противопоставления классических понятий и классических систем, с одной стороны, и неклассических, квантовых понятий и систем,— с другой. Основной тезис Гейзенберга — неизбывная необходимость •классического представления неклассических, квантовых законов, необходимость классических понятий и аналогий для формулировки любых научных утверждений. Гейзенберг говорит: «...хотя законы классической физики кажутся с точки зрения современной физики только предельными случаями более обобщенных и абстрактных взаимосвязей, все же соответствующие этим законам классические понятия остаются неотъемлемой частью естественнонаучного языка, без которого невозможно даже и говорить о научных результатах». Дальнейшие рассуж- 1 См. русск. пер.: «Принципиальные вопросы современной физики» в сборнике статей Гейзенберга «Философские проблемы атомной физики», М., ИЛ, 1953, стр. 34—46. 259
дения, приводящие к запрету скрытых параметров, вытекают из этого тезиса. Такой характер доказательства позволяет в более ясной форме оценить концепцию Неймана. Обычно запрет скрытых параметров представляют з качестве запрета попятного движения физики: физика «сожгла корабли» и не может вернуться к классическому детерминизму. Сейчас, однако, возможна противоположная функция неймановского запрета. Этот запрет в его догматической версии закрывает не только возврат к классической физике, но и перспективу перехода к более радикальной и общей неклассической теории. Из 'неизбежности классических понятий для изложения неклассических законов Гейзенберг выводит окончательный характер статистической интерпретации, принципа дополнительности и соотношения неопределенности. Допущение скрытых свойств, координат, параметров «заставило бы нас признать ^неверными положения квантовой теории как раз в тех пунктах, в которых они дают точные математические предсказания экспериментальных результатов». Чтобы доказать этот тезис, Гейзенберг уточняет разграничение физического процесса. Одна часть —это объект исследования. Мы, разумеется, можем из цепи связанных друг с другом явлений выбрать определенную часть, определенные звенья, которые нас интересуют. Объективно процессы в ядре (вылет альфа-частицы, ее отражение от диффракционной решетки, приближение к экрану и т. д.) образуют непрерывную цепь. Если нас интересует импульс или положение альфа-частицы, мы выделяем некоторую часть непрерывной цепи физических явлений и считаем ее объектом исследования. События, происходящие в диффракционной решетке и далее, мы уже не изучаем (мы изучаем с их помощью предыдущие события), и устройства, где они развертываются, мы должны считать не объектом исследования, а прибором. Это, так сказать, вторая часть физического процесса. «С помощью более или менее сложных приборов мы задаем вопрос природе, который всегда касается того или иного объективного процесса, происходящего в пространстве и времени» — пишет Гейзенберг. «Того или иного» — значит, от нас зависит выбор того или иного процесса из числа реальных, объективных процессов, про- 260
исходящих в природе, от нас зависит вопрос, который мы задаем, но ответ на этот вопрос, разумеется, определен объективными закономерностями и относится к объективной действительности. «Из такого положения вещей автоматически следует, что при математическом рассмотрении этого процесса мы проводим резкую грань между приборами, рассматриваемыми нами как вспомогательное средство для постановки вопроса и, таким образом, в известном смысле принадлежащими нам самим, и физической системой, о которой мы хотим что-то узнать». Свободный выбор границ изучаемого объекта не представляет собой чего-то специфического для квантовой механики. Макроскопическая механика — и классическая и релятивистская — пользуется свободным выбором координатных систем для решения той или иной динамической задачи. Такие динамические переменные, как положение и импульс, и их функции приобретают различные значения в зависимости от системы отсчета, выбранной по произволу, т. е. в зависимости от «вопроса, заданного природе», от характера динамической задачи. Далее классическая (а в более общей и последовательной форме — релятивистская) механика исключает произвол, переходя к инвариантному представлению физических величин и закономерностей. Специфика квантовой механики выражается (повторим: «выражается», а не «состоит») в том, что, определив границы неклассического объекта, свойство которого изучается и к которому относится «заданный природе вопрос», мы обнаруживаем глубокое различие между объектом и вопросом: «классический» вопрос (например, об импульсе и положении элементарной частицы) относится к объекту, обладающему неклассической природой. В сущности, именно об этом и говорил Ланжевен на Сольвеевском конгрессе. Мы задаем вопросы, точно применимые лишь к классическим объектам, и получаем «еточные ответы. Гейзенберг полагает, что «классические» вопросы неизбежны, что без классических понятий вообще нельзя говорить о научных результатах. К обсуждению этого тезиса мы перейдем несколько позже. Остановимся на проблеме объекта и прибора. Все различие между ними в степени точности, с которой мы определяем процессы, протекающие в том и в другом. 261
Ядро, из которого вылетает альфа-частица,— объект, диффракционная решетка — прибор. Условность этих понятий видна уже из того, что альфа-распад может быть вызван искусственно, а диффракционная решетка может быть поверхностью кристалла, естественно выросшего за тысячелетия до нас. Все дело в том, что мы заранее знаем закономерности, управляющие процессами, происходящими в решетке. Мы не изучаем эти закономерности, мы их уже знаем (с той степенью точности, какая необходима для решения задачи), мы стремимся узнать о других звеньях непрерывной физической цепи причин-следствий, например, о движении альфа-частицц о ее положении и импульсе. В квантовой механике мы изучаем дискретный объект при помощи континуальных «тестов» — приборов. Вопрос о дискретности самого прибора вышел бы за рамки современной квантовой механики. В классической физике непрерывность пространства (а значит, и импульса) и времени (а значит, и энергии) не противоречила дискретности вещества. В квантовой физике появляется дискретность действия. Квантовые объекты, где эта дискретность существенна, изучаются с помощью приборов, т. е. физических объектов с заранее определенными континуальными свойствами: «^-приборов», способных давать любые по точности сведения об одной континуальной величине— координате, и «р-приборов», регистрирующих другую континуальную величину — импульс. Кроме того, могут быть «/-приборы», определяющие время, и «^-приборы», измеряющие энергию. При изложении общих принципов квантовой механики «приборы» иногда выглядят принципиально точными, допускающими любую точность измерения; вся вина за неточность возлагается на квантовый объект. В действительности континуально-классический характер «приборов» — возможность любого точного одновременного* измерения координат и импульса (времени и энергии) — следует считать простым результатом неточного макроскопического определения природы самого прибора. Представление о дискретности действия — по сравнению с классической картиной — более точная картина действительности (хотя и не абсолютная, не устраняющая навсегда континуальные представления в возможных, 262
еще более точных приближениях). Классическая картина — неточное представление, с законным для ряда задач приближением игнорирующее дискретность действия. С таким приближением мы подходим к системам, именуемым «приборами». С более строгими требованиями мы подходим к другим системам — объектам квантово-механиче- ского описания. Переход от менее строгого континуально- классического критерия к более строгому дискретно-квантовому создает, вообще говоря, неопределенность. Статистическая интерпретация прокладывает мост между двумя критериями, и по этому мосту континуальное представление проникает в область дискретных квантовых объектов. Мы заменяем дискретную картину частиц континуальной картиной вероятности пребывания частиц в точках пространства. Переход от достоверных значений к вероятностям и в классической физике позволил континуализиро- вать атомистическую картину молекулярных движений и создать макроскопическую теорию. Все сказанное общеизвестно, но об этом нужно было напомнить, чтобы подойти к пунктам действительных разногласий между Нейманом, Гейзенбергом и другими сторонниками господствующей версии и их оппонентами в вопросе о скрытых параметрах. Гейзенберг рассматривает непрерывную цепь физических явлений и границу, отделяющую звенья, подчиненные классическим закономерностям («прибор»), и звенья, подчиненные квантовым закономерностям («объект»). Там, где проходит граница между ними, проявляется неопределенность, происходит неконтролируемое воздействие прибора на объект и законы квантовой механики приобретают статистический характер. «Таким образом,— пишет Гейзенберг,— детерминистическое дополнение квантовой механики имело бы место только на линии разграничения. Но так как детерминирующие новые физические свойства должны быть приписаны только определенной системе, то при удалении из этой системы разграничительной линии возникает неизбежное противоречие между закономерными следствиями из новых свойств и взаимосвязями квантовой теории. Новые физические свойства наблюдаемой системы, которые должны восполнить пробел статистических законов, стали бы теперь, после смещения разграничительной линии, проявляться там, где невозможно никакое 263
дополнение, они приводили бы лишь к нарушению уже существующих однозначных закономерных взаимосвязей». Гейзенберг иллюстрирует эти соображения тем же примером отражения альфа-частицы от диффракциоино1'| решетки. Такое отражение происходит в направлении, определяемом свойствами всей решетки. Зависимость направления отраженных альфа-частиц от всей решетки — многократно проверенный закон квантовой механики. Пусть некий скрытый параметр — некоторое свойство атома радия — дает возможность достоверно предсказать направление альфа-частицы, вылетевшей из атомного ядра. Иначе говоря, прибавив к известным нам свойствам атома еще одно, мы можем обнаружить нестатистическую зависимость направления альфа-частицы от свойств атома. Тогда от этих свойств с полной достоверностью зависит место диффракционной решетки, «а которое попадет альфа-частица, и дальнейшая судьба частицы целиком определится свойствами этого места, а не свойствами всей решетки. Это противоречит только что упомянутому закону. Все дело в том, что определенная траектория альфа-частицы понимается в классическом смысле: траектория не зависит от всей решетки. Но как иначе понимать определенность траектории? Определенность траектории теряет смысл, если из нее не вытекает независимость от решетки частицы, выпущенной атомом радия. «В конечном счете мы всегда приходим к тому, что где-нибудь — если не для альфа-частицы, то для приборов, применяемых при ее наблюдении — мы без колебаний используем классические понятия». Таким образом, аргументация Гейзенберга (это относится и к аргументации Неймана) основана на предположении, что классические понятия и аналогии неустранимы. Само же это положение не доказывается ни Нейманом, ни Гейзенбергом. Неймановский запрет, если его понимать догматически и относить к любым скрытым параметрам, напоминает так называемое онтологическое доказательство бытия бо- жия: понятие бога включает понятие существования, значит, бог существует... Современная интерпретация квантовой механики включает тезис о невозможности параметров, противоречащих такой интерпретации. Если же понимать неймановский запрет в ограниченном, относительном №
и конкретном смысле, он оказывается вполне рациональным. Из экспериментально проверенных тезисов квантовой механики, т. е. из ее положений, достоверным и однозначным образом подтвержденных экспериментальной проверкой, вытекает невозможность классического истолкования квантовых закономерностей. «Реванш», возврат к классической картине невозможен. При любом классическом представлении квантовых процессов классическая система и квантовая система оказываются подчиненными различным закономерностям, и переход от неклассических закономерностей «объекта» к классическим закономерностям «прибора» неизбежно связан со статистическим характером теории. Это и значит, что закрыта дорога назад, но открыта дорога вперед, что прогресс физики необратим, что -развитие физики — это не ряд прагматически оправданных «удобных» формул, а последовательный и необратимый переход к представлениям, все с большей точностью отражающим действительность, что каждая подлинно крупная и прогрессивная физическая теория (и в том числе квантовая механика) не только сменяется новой теорией, но и вносит в картину мира не окончательные, подлежащие дальнейшему уточнению, но действительные, достоверные, проверенные знания. С гносеологических позиций марксизма можно понять действительный смысл проблемы полноты квантово-меха- нического описания. Вокруг этой проблемы неоднократно велись дискуссии, в результате которых выяснилась, в частности, связь названной проблемы с проблемой скрытых параметров. Остановимся на одной из таких дискуссий, а именно на двух статьях: одной — А. Эйнштейна, В. Подольского и Н. Розена и второй — Н. Бора. Статья Эйнштейна, Подольского и Розена «Можно ли считать, что квантово-механическое описание физической реальности является полным» ], начинается очень четким тезисом: «При анализе физической теории необходимо учитывать различие между объективной реальностью, которая не зависит ни от какой теории, и теми физическими понятиями, с которыми оперирует теория». Эту фразу можно поставить в качестве общего 1 Phys Rev. 47, 777 (1935). русск. пер. УФН. 16. 440 (1936).
эпиграфа ко всем основным физическим трудам Эйнштейна и его ближайших учеников — именно ее, а не субъективистские тезисы, в корте противоречащие идее инвариантного отображения физической реальности. Однако философский тезис об объективной реальности мира сам по себе еще не отвечает на физический вопрос: какие понятия отображают объективную действительность инвариантным образом и какие понятия требуют- дополнительных указаний на условия эксперимента. В теории относительности мы встречаемся с инвариантными понятиями, независимыми от координатной системы, и относительными понятиями, теряющими смысл без указаний на систему отсчета. В квантовой механике основная проблема также заключается в разграничении характеристик микромира, существенно зависящих от характера взаимодействия между микрочастицей и классическим объектом, и характеристик, инвариантных при переходе от одного типа взаимодействия к другому («дополнительному»). В статье Эйнштейна, Подольского и Розена сформулировано условие полноты физической теории: «...каждый элемент физической реальности должен иметь отражение в физической теории». Следовательно, теория согласно известной судебной формуле должна содержать «правду, только правду и всю правду». Пожалуй, разумнее было бы ограничиться двумя требованиями, не ждать окончательного ответа о всех элементах физической реальности от. каждой теории — этапа на бесконечном пути к абсолютной истине. Но речь сейчас идет о другом: можно ли требовать от физической теории полностью однозначного представления всех элементов реальности? Понятие квантово-механического состояния должно выдержать экзамен на звание «полного описания» и экзаменационные требования сформулированы так: «если мы можем без какого бы то ни было возмущения системы предсказать с достоверностью (т. е. с вероятностью, равной единице) значение некоторой физической величины, то существует элемент физической реальности, соответствующий этой физической величине». Это — не необходимое, но достаточное условие. Такие элементы реальности, иначе говоря объективные соотношения, допускающие однозначное достоверное отображение, должны быть полностью учтены физической теорией. 266
Здесь высказано представление о твердом, раз навсегда данном рубеже между достоверным отображением реальности и условным, неточным, включающим известный произвол отображением ее. В действительности этот рубеж подвижен, элементы произвола (произвольного выбора системы отсчета и типа «прибора», т. е. метода эксперимента) последовательно устраняются из картины мира, но такое устранение — процесс и процесс бесконечный. В статье Эйнштейна, Подольского и Розена далее идет анализ квантово-механического описания поведения частицы с одной степенью свободы с точки зрения высказанного выше критерия реальности и ее полного отображения. Мы последуем за авторами, чтобы, помимо прочего, повторить в самом кратком изложении идеи квантовой механики. Эйнштейн, Подольский и Розен обозначают через А наблюдаемую величину и сопоставленный ей оператор. Состояние движения частицы характеризуется волновой функцией ф. Если ф — собственная функция, принадлежащая собственному значению а оператора А, то А с полной достоверностью имеет значение а, когда частица находится в состоянии ф. Тогда с точки зрения высказанного Эйнштейном, Подольским и Розеном критерия реальности физической величине А соответствует элемент физической реальности. Если волновая функция <Ь имеет вид то, действуя на ф оператором импульса А — h д р ~~ 2тг* дх ' мы получаем: Значит, в состоянии ф импульс равен ро, и, следовательно, он представляет собой элемент физической реальности. В данном случае р0 — собственное значение оператора. Если же в состоянии ф а не является собственным значением Л, т. е. если Aty=£aty, то в состоянии ф величине А не соответствует элемент физической реальности. Таковой может быть координата частицы. На функцию О 267
действует оператор координаты, т. е. оператор умножения на независимую переменную: В этом случае уже нельзя говорить о достоверном значении величины А, она будет иметь с некоторой вероятностью значение, лежащее в интервале между а\ и а2. Вероятность эта равна: Р (alt а2) = [ ty'^dx =[ dx = а2 — alt т. е. она зависит не от аг, а от разности а2 — аг, следовательно, все значения величины Л, если эти значения координаты при известном импульсе, равновероятны. Таким образом, в состоянии, изображенном функцией координата не имеет достоверного значения и не имеет физической реальности. Вообще, если операторы Л и В не коммутируют, соответствующие физические величины не могут быть определены достоверно, причем определение одной величины, возмущая систему, искажает сведения о другой величине. Отсюда, применяя высказанные выше определения элемента физической реальности и полноты описания, Эйнштейн, Подольский и Розен делают следующий вывод о некоммутативных величинах: либо они не могут быть одновременно реальными, либо — если они реальны — квантово-механическое описание неполно. Эйнштейн, Подольский и Розен стремятся доказать, что предположение о полноте квантово-механического описания приводит к противоречию. Для этого служит очень остроумная конструкция. Пусть две системы I и II, например две частицы, взаимодействуют в течение времени, протекшего от момента t = 0 до момента / = Т. До момента / = 0 их состояния были известны. После t = Т взаимодействия уже нет. Уравнение Шредингера позволяет вычислить состояние системы, состоящей из двух частиц I + II для любого момента t > Г. Эти состояния описываются функцией ф. Можно ли узнать состояния частиц I и II порознь в моменты времени t > 7\ т. е. после прекращения взаимодействия? Эти состояния нельзя вычис- 268
лить при помощи уравнения Шредингера, зная состояния в момент взаимодействия, т. е. из состояния объединенной системы I + II. Но мы можем определить импульс и координаты одной из частиц, зная импульс и координаты другой частицы. Это определение относится к периоду, когда частицы не взаимодействуют. Тем не менее значения импульса и координат частицы зависят от того, каким образом мы измеряем состояние другой частицы. Если мы измеряем импульс частицы I и получаем точное значение рх, то такое же точное значение рг мы получим для частицы II, а для координаты х2 точное значение в этом случае неопределимо. Если же мы измеряем координату частицы I и получаем ее точное значение хи то неопределимым оказывается значение р2 импульса частицы II. Одновременное точное определение р2 и х2 невозможно, хотя эксперимент, производившийся над частицей (в общем случае — системой) I, не влиял на состояние частицы (системы) II. «Мы видим,— пишут Эйнштейн, Подольский и Розен,— что в результате двух различных измерений, произведенных над первой системой, вторая система может оказаться в двух разных состояниях, описываемых различными волновыми функциями. С другой стороны, так как во время измерения эти две системы уже не взаимодействуют, то в результате каких бы то ни было операций над первой системой, во второй системе уже не может произойти никаких реальных изменений. Это, конечно, является лишь другой формулировкой того, что понимается под отсутствием взаимодействия между двумя системами. Таким образом, одной и той же реальности (вторая система после взаимодействия с первой) можно сопоставить две различные волновые функции...» К Следовательно, кван- тово-механическое описание неполно, если импульс и координаты частиц одновременно обладают реальностью в указанном выше смысле. Иначе получается, что измерение, не действующее на реальные элементы, меняет их: реальность координат и импульса частицы ставится в зависимость от измерения, производимого над другой частицей, не взаимодействующей с данной. «Никакое разумное определение реальности не должно, казалось бы, допускать этого». 1 УФЫ, 16, 444 (1936). 269
Вывод — абсолютно непререкаемый, строгий и четкий. Если исходные определения элементов реальности и полноты описания справедливы, то отрицательный ответ на вопрос, поставленный в названии статьи Эйнштейна, Подольского и Розена, нельзя оспаривать. Ошибочность этой позиции была разъяснена критикой не силлогизма, а исходных определений. Бор опубликовал свой ответ под тем же названием «Можно ли считать, что квантово-механиче- ское описание физической реальности является полным?» 1 Статья Бора уточняет и развивает идеи дополнительности и заслуживает подробного изложения. Очень глубокие и оригинальные, хотя ограниченные в существенном пункте, физические идеи сочетаются здесь с догматическим абсолютизированием дополнительности, ведущим к агностицизму в отношении реального мира, независимого от экспериментальных путей его исследования. Позитивистская философская установка ограничивает физические идеи именно там, где физику необходима правильная философская ориентировка,— в определении перспективы развития физической теории, вытекающей из обобщения современных тенденций. Бор начинает с анализа объективных процессов, приводящих к невозможности одновременного измерения не- коммутирующих величин. Исходное обстоятельство — дискретность действия. Из дискретности действия вытекает, что в определенных пределах воздействие квантовой системы на прибор не вызывает в приборе изменений непрерывных, неквантовых величин. Поэтому взаимодействие квантового объекта с прибором не может быть бесконечным (в смысле 'Интенсивной бесконечности). Эта вполне правильная мысль высказана несколько глухо, на нее как бы заранее бросает тень традиционный философский рефрен, умещающийся в той же фразе. «В самом деле,— пишет Бор,— конечность взаимодействия между объектом и измерительным прибором, обусловленная самим существованием кванта действия, влечет за собой — вследствие невозможности контролировать обратное действие объекта на измерительный прибор (а эта невозможность будет непременно иметь место, если только прибор удовлетворяет своему назначению) — необходимости окончательного отказа от классического идеа- 1 Phys. Rev., 48, 696 (1935). Русск. пер. УФН, 16, 446 (1936). 270
Ла причинности и радикальный пересмотр наших взглйдбВ на проблему физической реальности» ]. Речь идет не о вполне закономерном отказе от «классического идеала причинности» с переходом к новому, более широкому, точному, строгому и конкретному неклассическому пониманию причинности, а об априорном, противоречащем действительному смыслу неклассической физики «индетерминизме». Речь идет также не о закономерном пересмотре проблемы физической реальности в направлении все более последовательной демонстрации ее независимости от познания, а об операционалистской концепции. Бор описывает простой случай прохождения частицы через щель в диафрагме. Это уже известный нам мысленный эксперимент. Дифракция волны, представляющей состояние частицы, изменяет импульс частицы при прохождении через щель. Ширина щели — мера неопределенности Дq положения частицы в момент прохождения через щель. Неопределенность импульса Ар зависит от обмена количеством движения между частицей и диафрагмой. Если диафрагма жестко связана через подставку с экраном и другими частями прибора (а без этого нельзя определить q), то импульс, полученный самой диафрагмой, неопределим с произвольной точностью. Если диафрагма движется, можно определить импульс диафрагмы и (на основе принципа сохранения импульса) импульс частицы. Но в этом случае невозможно точное определение q. «Такого рода отказ обусловлен в конце концов требованием чисто классического описания измерительного прибора...» 2. Если регистрировать смещение диафрагмы, ее нужно рассматривать как объект исследования, диафрагма перестает быть измерителем положения, для самой диафрагмы становится существенным соотношение между ее импульсом и положением. Зная импульс диафрагмы до и после прохождения частицы, мы не можем судить о положении диафрагмы в момент прохождения. Возьмем диафрагму в тот момент, когда частица уже прошла через щель. Нам известен ее импульс до прохождения. После 1 УФН, 16,448 (1936). 2 Там же, стр. 450. 1!71
этого преДостаблйетсй выбор между двумя экспериментами. Можно еще раз измерить ее импульс, тогда мы уже не сможем измерить положение диафрагмы в момент прохождения, так как мы изменим при эксперименте это положение. Можно определить положение, закрепив диафрагму и лишив себя возможности узнать импульс, так как фиксирование диафрагмы изменяет импульс. «С каждой постановкой опыта связан отказ от одной из двух сторон описания физических явлений; эти две стороны будут здесь как бы дополнительными одна к другой, тогда как их сочетание характеризует методы классической физики»1. Бор доказывает, что схема Эйнштейна, Подольского и Розена с двумя невзаимодействующими системами не отличается в принципе от описанного эксперимента. Он предлагает рассмотреть жесткую диафрагму с двумя параллельными щелями. Через щели проходят две независимые друг от друга, невзаимодействующие частицы. Их импульсы заранее известны. Измерен также импульс диафрагмы до и после прохождения обеих частиц. Поэтому известна сумма составляющих импульсов частиц и разность их начальных координат (и то и другое по направлению, перпендикулярному к щелям). Неизвестны пока разность импульсов и сумма координат. Эти канонические сопряженные величины мы не можем определить без дальнейших экспериментов. Можно измерить импульс одной частицы. Поскольку нам известна сумма импульсов обеих частиц, тем самым будет с любой точностью определен импульс другой частицы — без какого-либо воздействия на эту другую частицу. Можно измерить координату первой частицы и, зная разность координат, получить любые по точности сведения о положении второй частицы — также без воздействия на нее, без взаимодействия между частицами. Свобода выбора между двумя экспериментами отличается от ситуации, имевшей место при прохождении одной частицы через щель диафрагмы. Измерение координат частицы определяет ее взаимоотношение с неподвижной деталью прибора. Если мы измерили координаты одной частицы, прошедшей через щели диафрагмы, значит, нам известно не только положение частицы, но и положение диафрагмы относительно 1 УФН, 16, стр. 452 (1936). 272
подставки. Результаты измерения координат первой частицы остаются определенными, пока диафрагма занимает определенное положение относительно подставки прибора, определяющей систему отсчета. В свою очередь определенное положение диафрагмы позволяет найти определенную координату второй частицы. Неподвижность диафрагмы не допускает определения импульса второй частицы, так как она .не позволяет применить закон сохранения импульса к системе, состоящей из диафрагмы и двух частиц. Наоборот, определение импульсов первой частицы не позволяет определить положение диафрагмы, а следовательно и положение второй частицы. Отсюда, заключает Бор, критерий физической реальности, выдвинутый Эйнштейном, Подольским и Розеном (отсутствие возмущения системы при достоверном предсказании значения физической величины), содержит двусмысленность. Измерение координат или импульса первой частицы не изменяет импульса и положения второй частицы, «о изменяет положение или импульс диафрагмы и тем самым условия, от которых зависит, какая величина может быть достоверно определена и результаты каких последующих измерений могут быть точно предсказаны. Теперь представим себе более сложные приборы, для характеристики которых наряду с пространственными характеристиками важны измерения времени. Здесь фигурируют не простые щели в диафрагме, а затворы, открывающиеся и закрывающиеся с определенной скоростью, управляемые часовыми механизмами. Когда речь шла о пространственных смещениях диафрагмы, пространственным координатам противостояли, как дополнительные величины, составляющие импульса, канонически сопряженные с координатами. Когда речь идет о часах как классических приборах, с помощью которых изучается микромир, принцип дополнительности относится к канонически сопряженным переменным — энергии и времени. Подобно не поддающемуся учету переносу импульсов при определении координат и неконтролируемым пространственным сдвигам при определении импульса мы сталкиваемся с невозможностью при определении моментов времени контролировать обмен энергиями и пользоваться законом сохранения энергии и с невозможностью точно определить время, когда эксперимент позволяет учитывать энергию. 273
Таким образом, в полемике с Эйнштейном, Подольским и Розеиом Бор излагает и обосновывает разграничение квантового объекта и классического прибора. Граница между ними может быть проведена по-разному; она определяется в каждом случае неприменимостью классических понятий к одной части системы и применимостью их — к другой. «Фундаментальная важность различия между объектом и прибором в квантовой теории обусловлена, как мы видели, тем, что для толкования всех измерений в собственном смысле необходимо пользоваться классическими представлениями, несмотря на то, что классическая теория «е может сама по себе объяснить те новые закономерности, с которыми мы имеем дело в атомной физике» 1. Измерение динамических переменных квантово- механической системы — это частный случай взаимодействия одной системы, не подчиняющейся классическим закономерностям, с другой, подчиняющейся им. Подобное взаимодействие происходит, вообще говоря, независимо от какой-либо целесообразной сознательной деятельности, от эксперимента, от познания реальности. Оно происходило до возникновения физических лабораторий, до появления человека на Земле, до образования Земли. При прохождении электрона через тонкую щель в естественной преграде всегда имело место изменение импульса электрона. Другое дело, что изменение состояния системы, взаимодействующей с электроном, завися от состояния электрона, может стать методом измерения положения и импульса электрона, и взаимодействующая с электроном система может играть роль физического прибора. Такое понимание взаимодействия электрона с «прибором», замена узкого и субъективного понятия измерения более широким и, вообще говоря, объективным понятием взаимодействия имеют существенное значение для правильного понимания квантовой механики. Л. Ландау и Е. Лифшиц различают «квантовый объект» и «классический объект»2. Квантовый объект — это электрон, фотон, вообще частица или система частиц, не подчиняющаяся законам классической механики. Классический объект 1 УФН, 16, стр. 456. 2 Л. Ландау и Е. Лифшиц. Квантооая механика, ч. I М.— Л., стр. 12—13. 274
подчиняется классическим закономерностям. Взаимодействие между квантовым и классическим объектом и представляет область тех явлений, которые описываются соотношением неопределенности. Отсюда своеобразное отношение квантовой механики к классической. Теория относительности — логически замкнутая теория, связанная с классической механикой только как с предельным случаем, когда распространение света можно считать мгновенным. Квантовая механика также переходит в классическую при предельных значениях некоторых переменных. Но, помимо этого, квантовая механика не может быть сформулирована без классических понятий 1. Это замечание очень важно для характеристики логической структуры квантовой механики, а может быть, и для прогноза о характере будущей теории, призванной сделать то, что оказалось недоступным квантовой механике, созданной в 1924 — 1927 гг. Указанное соотношение между квантовой и классической механикой крайне характерно; можно даже сказать, что квантовая механика — это не столько грамматика неклассического языка, сколько словарь для перевода с этого языка на классический с указанием точности перевода. Точный «импульсный» перевод означает неточность одновременного «координатного» перевода и наоборот. Все дело в неполной применимости понятий «импульс» и «координата» к неклассическому объекту2. Отмеченный Л. Ландау и Е. Лифшицом «неклассически-классический» дуализм квантовой механики как отличие ее от теории относительности вовсе не общепризнанная оценка. Бор считает теорию относительности также дуалистичнои в смысле использования классических и неклассических понятий. В квантовой механике «классически-неклассический» дуализм заставляет отличать неклассический объект исследования от классического прибора. В теории относительности пользуются классическим разделением пространства и времени, несмотря на то, что сущность теории состоит в отказе от такого классического разделения. Бор в изложенной выше статье пишет, что 1 Л. Ландау и Е. Лифшиц. Квантовая механика, ч. I. М— Л., стр. 12. 2 См. Л. И. Мандельштам. Полн. собр. трудов, т. V, стр. 358—359. 275
«обособленное йоложение, которое занимают в описании квантовых явлений измерительные приборы, представляет близкую аналогию с необходимостью пользоваться и в теории относительности обыкновенным описанием всех измерительных процессов, включая резкое разделение на пространство и время, причем эта необходимость имеет место, несмотря на то, что самой сущностью теории относительности является установление новых физических законов такого рода, что для понимания их мы должны отказаться от привычного разделения понятий пространства и времени» ]. С этим нельзя согласиться: разделение пространства и времени в теории относительности не является привычным, т. е. классическим (впрочем, отождествление этих понятий становится постепенно анахронизмом, мы достаточно «привыкли» к неклассическим понятиям), но остается вполне определенным без какой-либо классической аналогии. Разделение мира на пространство и время — это не компромисс с классической теорией. Теория относительности не отменяет такого разделения по самому своему существу. Бор пишет, что зависимость пространственных и временных измерений от движения системы отсчета аналогична зависимости измерений квантовых объектов от классических свойств приборов. Прибор определяет в квантовой механике пространственно-временную систему отсчета и в этом смысле аналогичен системе отсчета теории относительности. «Характерная для теории относительности зависимость всех показаний масштабов и часов от принятой системы отсчета может быть, далее, сравнена с тем не поддающимся контролю обменом количеством движения и энергией между измеряемыми объектами и всеми приборами, определяющими пространственно-временную систему отсчета, который приводит нас в квантовой теории к положению вещей, характеризуемому понятием дополнительности» 2. Это вполне рациональная концепция: дополнительность создается объективным переходом энергии и количества движения из системы, где дискретность действия существенна, в систему, где она несущественна, и обратно. Обычно в работах копенгагенской школы подобные 1 УФН, 16, 456 (1936). 2 Там же, стр. 457. 276
тезисы тонут среди логически несовместимых с ними заявлений об априорной, свойственной познанию «дополнительности». Обмен энергией и количеством движения создает «дополнительность» показаний приборов, фиксирующих положение, и приборов, фиксирующих импульс, т. е. «^-представления» и «р-представления» объективного, независимого от представления квантового объекта: каждое из них оставляет неопределенной (в очень узких рамках) «дополнительную» переменную. В теории относительности «неопределенность» гораздо больше, она вообще ничем не ограничена, и, выбрав определенную систему отсчета X, мы получаем неопределенные показания измерительных приборов, связанных с другими системами X'. Но эта неопределенность полностью устраняется вполне однозначными лоренцовыми преобразованиями Х-+Х' и переходом к лоренц-инвариантному представлению. В квантовой механике нет представления квантовых объектов, независимого от выбора между прибором, фиксирующим положение, и прибором, фиксирующим импульс. Такое представление, разумеется, удовлетворило бы Эйнштейна, Подольского и Розена. Но инвариантного классического представления квантового объекта нет: в этом и состоит принцип дополнительности. Взаимодействие квантовой, неклассической системы с классической дает ту или иную неопределенность в зависимости от характера классической системы. Поэтому, пока речь идет о с о- временной квантовой механике, аналогия с теорией относительности не затрагивает основных особенностей квантовой механики. Но, может быть, аналогия с теорией относительности наталкивает на представление о некоторой новой квантовой теории? В тридцатые годы, когда появились изложенные статьи Эйнштейна, Бора и других, не было ни опорных понятий, ни достаточно сильных импульсов для построения такой теории в том смысле, что производство и эксперимент не поставили еще ограниченность квантовой механики в центр внимания. Антиномия протяженности электрона (ненулевая противоречит теории относительности, нулевая приводит к бесконечной энергии) была известна, но с ней до поры до времени мирились. Мирились и с другими антиномиями. Когда физические понятия представляются уже философски неприемлемыми, 277
но е щ е практически «безвредными» (дальнодействие — до Герца, неподвижный эфир—до Майкельсона, непротяженный и бесструктурный электрон в пустоте — до Лэмба и т. д.) особое значение приобретает правильная философская ориентировка физики. Она недостаточна для построения новой теории без новых экспериментальных и теоретических исследований, но она стимулирует такие исследования. Можно думать, что в тридцатые — сороковые годы теоретический прогресс в физике значительно ускорился, если бы более значительные группы теоретиков исходили из правильной философской оценки квантовой механики. Философские позиции теоретиков, участвовавших в дискуссии 1935 г., были эклектичными и несоизмеримыми по уровню с их собственно физическими идеями. Разумеется, философские экскурсы современного физика, не раскрывавшего книг Маркса и Ленина, так же смешны, как физические экскурсы современного философа, не знающего Ньютона и Эйнштейна. В дискуссии 1935 г. Эйнштейн, Подольский и Розен исходили из противопоставления полного описания физической реальности, отражающего каждый элемент последней, и неполного, а потому неудовлетворительного описания. Под отражением некоторого элемента физической реальности Эйнштейн, Подольский и Розен понимали однозначное, достоверное предсказание (без какого-либо возмущения системы) значения некоторой физической величины. Изменение неопределенности (переход от неопределенности импульса к неопределенности положения, или наоборот) системы либо частицы, находящейся в данный момент во взаимодействии с другой системой или частицей, свидетельствовало с точки зрения Эйнштейна, Подольского и Розена о неудовлетворительности квантово-механического описания. Но такое противопоставление не могло указать дорогу к более полному описанию; ведь само понятие «более полного» исключалось альтернативной постановкой вопроса. Позиция Бора также не указывала дорогу вперед. Бор возводил квантово-механическое описание в ранг окончательного, исчерпывающего описания, компромиссный «дополнительный» характер которого вытекает из самой природы познания. Чтобы подвести итог всему сказанному о дискуссии 278
1935 г., поставим вопрос: каков характер квантового объекта, вне р- и «^-представления», взаимодействующего не с классическим объектом, а с другим квантовым объектом, и приведем три гипотетических ответа на этот вопрос, принадлежащих 1) ортодоксальному приверженцу операцио- нализма, 2) физику, критикующему квантово-механиче- ское описание — с позиций классических «скрытых параметров», и 3) стороннику такой интерпретации квантовой механики, которая, по нашему мнению, соответствует современному состоянию науки. Первый из перечисленных мыслимых собеседников, вероятно, сказал бы, что квашовый объект вне «представлений» и соответствующих экспериментов не существует, что физическая реальность создается экспериментом и т. д. Вместе с тем этот собеседник, рисуя конкретную картину, интерпретирующую дополнительность, говорил бы об измерении координаты, искажающем импульс (очевидно, определенный импульс); об измерении импульса, сдвигающем частицу (очевидно, с определенного положения). Таким образом, микрочастица, по существу, в этом ответе уподобляется классической частице. Ее специфичность — в «податливости» относительно искажающего влияния измерения. Второй собеседник предположил бы, что квантовый объект «сам по себе» подобен классической частице, но квантово-механическое описание представляет собой недостаточно полную картину действительного состояния микроскопической системы с определенными координатами и импульсами частиц. Неопределенность той или иной из этих переменных, дополнительность некоммутативных переменных — все это введено в физику только по незнанию истинных параметров, характеризующих полным образом действительное состояние системы. Третий ответ радикализирует неклассическую концепцию микромира: в микромире самом по себе нельзя встретить локализованную с безграничной точностью, т. е. с определенными координатами, частицу, обладающую определенным импульсом. Нельзя представлять себе, что эти переменные становятся неопределенными при измерении. Граница между объектом и прибором совпадает не с переходом от определенных импульсов или координат к неопределенным, а с переходом от состояния с 270
нерасчлененными сопряженными переменными к состоянию с определенными координатами, либо с определенным импульсом. Однако все дело в том, что такой ответ не только в двадцатые, но и в тридцатые годы мог быть лишь самым неопределенным. Дальнейшее изложение развития квантовой механики должно показать, как создались предпосылки более определенного представления о неклассических параметрах, учет которых ведет не назад, к классической картине мира, а вперед, к более радикальному отказу от классических представлений. Такие предпосылки создавались синтезом квантовых идей с релятивистскими, а основой их был прогресс экспериментальной и производственной техники, толкавший науку от изучения структуры атомов к изучению структуры, размеров и свойств элементарных частиц.
Часть третья ОТНОСИТЕЛЬНОСТЬ И КВАНТЫ 1. Элементарные частицы Параллельное развитие теории относительности и квантовой механики характерно для одного периода развития физики, их слияние — для другого периода. Нерелятивистская квантовая механика была в известном смысле результатом развития физики атома. Если периодизировать историю физики, исходя из последовательного накопления все новых и -новых достоверных каузальных представлений, и характеризовать каждый период присоединением новой области к познанной территории, то такой новой областью в первой трети нашего столетия был «менделеевский мир» — так А. Е. Ферсман называл картину электронов, вращающихся вокруг центрального положительно заряженного ядра, картину, дающую рациональное объяснение периодического закона. Далее физика атомного ядра проследила и отчасти объяснила события, развертывающиеся на меньшей арене. Сейчас, на наших глазах создается физика, рассматривающая события в областях с линейными размерами порядка Ю-13 см. Физика ядра не была историческим результатом появления и развития ядерной энергетики; напротив, к середине сороковых годов XX в. физика ядра имела за собой многолетнюю историю. Если искать исторические истоки ядерной физики и постепенно подходить к ее производственно-техническим корням, то непосредственными истоками ядерной физики оказывается изучение радиоактивности (ядерных процессов, дающих ничтожный макроскопиче- 281
ский энергетический эффект) и космического излучения, т. е. потока элементарных частиц с большими энергиями, так