Текст
                    DIE GRUNDLEHREN
DER MATHEMATISCHEN WISSENSCHAFTEN
BAND XXXVIII
MATHEMATISCHE
GRUNDLAGEN
DER QUANTENMECHANIK
von
JOHANN V. NEUMANN
BERLIN
VERLAO VON JULIUS SPRINGER
1932


ИОГАНН фон НЕЙМАН МАТЕМАТИЧЕСКИЕ ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ Перевод с немецкого М. К. ПОЛИВАНОВА и Б. М. СТЕПАНОВА Под редакцией акад. Н. Н. БОГОЛЮБОВА ИЗДАТЕЛЬСТВО «НАУКА» МОСКВА 1964
530.1 H 46 УДК 530.145 АННОТАЦИЯ Книга Неймана является первым и до сих пор единственным доведенным до конца опытом изло- изложения аппарата квантовой механики с той последо- последовательностью и строгостью, которой требуют обычно при построении математической теории. Поэтому только существованию этой книги мы обязаны на- нашей уверенностью в том, что квантовая механика представляет собой логически непротиворечивую схему. В частности, именно в этой книге изложено доказательство знаменитой теоремы о невозмож- невозможности ввести «скрытые параметры» без кардиналь- кардинальной перестройки всей квантовой механики. Таким образом, книга будет чрезвычайно ценной для всех глубоко изучающих квантовую механику, в первую очередь для студентов старших курсов и аспирантов, как физиков, так и математиков, а также для научных работников этих же дисциплин.
ОГЛАВЛЕНИЕ Предисловие редактора перевода 7 Введение 9 Глава I. Вводные замечания 12 1. Возникновение теории преобразований 12 2. Первоначальные формулировки квантовой механики 14 3. Эквивалентность двух теорий: Теория преобразований .... 21 4. Эквивалентность двух теорий: Гильбертово пространство ... 29 Глава И. Общие свойства абстрактного гильбертова пространства 34 1. Определение абстрактного пространства Гильберта 34 2. Геометрия гильбертова пространства 42 3. Отступление: Об условиях А.—Е 50 4. Замкнутые линейные многообразия 60 5. Операторы в гильбертовом пространстве 69 6. Проблема собственных значений 80 7. Продолжение 83 8. Предварительное рассмотрение проблемы собственных зна- значений 91 9 Отступление: О существовании и единственности решения про- проблемы собственных значений Ц] 10, Коммутирующие операторы 129 11. Шпур 136 Глава III. Квантовомеханическая статистика 148 1. Статистические утверждения квантовой механики 148 2. Статистическая интерпретация 155 3. Одновременная измеримость и измеримость вообще 158 4. Соотношения неопределенности 172 5. Проекционные операторы как утверждения 184 6. Теория излучения 189 Глава IV. Дедуктивное построение теории 221 1. Принципиальное обоснование статистической теории 221 2. Доказательство статистических формул 234 3. Выводы нз экспериментов 244 Глава V. Общее рассмотрение 258 1. Измерение и обратимость 258 2. Термодинамические вопросы 266 3. Вопросы обратимости и равновесия 281 4. Макроскопическое измерение ...,,,,. 293
6 ОГЛАВЛЕНИЕ Глава VI. Процесс измерения 306 1. Постановка задачи 306 2. Составные системы 309 8. Обсуждение процесса измерения 319 Дополнен ие. Доказательство эргодической теоремы и Я-тео- ремы в новой механике (Zs. f. Phys. 57, 30—70 A929)) .... 325 Введение 325 I. Квантовомеханическая формулировка основных понятий ста- статистической механики Гиббса 337 II. Проведение доказательств 344 III. Обсуждение результатов 353 Приложение 357
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Предлагаемая вниманию читателя монография одного из круп- крупнейших математиков нашего времени, недавно скончавшегося Иоганна фон Неймана посвящена вопросам математического обоснования кван- квантовой механики. Основная заслуга автора состоит в том, что он придал квантовой механике логически последовательную форму, из- излагая ее как единую теорию, в которой не остается невыясненным ни один принципиальный момент. Главный математический аппарат его исследований опирается на теорию гильбертова пространства и спектральную теорию самосо- самосопряженных операторов. Многие глубокие положения этих теорий были разработаны самим автором в связи с потребностями матема- математического обоснования квантовой механики. Мы имеем здесь прежде всего в виду спектральную теорию неограниченных самосопряжен- самосопряженных операторов, действующих в абстрактном гильбертовом про- пространстве. Значение этих результатов далеко выходит за рамки по- потребностей квантовой механики; они широко используются в совре- современной математике. Следует подчеркнуть, что в этой книге впервые дано систематическое изложение теории абстрактного гильбертова пространства. Отмеченная основная направленность книги определила отсутствие в ней каких бы то ни было приложений квантовой механики к фи- физическим задачам, из которых в основном и состоят обычные учеб- учебники (например, такие, как книги Шиффа, Зоммерфельда и др.). Единственное исключение составляют изложение вторичного кванто- квантования и вывод формул для вероятностей переходов, проведенные в разделе III. 6 не в общей абстрактной форме, а для физически совершенно реального случая электромагнитного поля. Зато все ве- величины и понятия, которыми оперирует квантовая механика, обосно- обосновываются совершенно точно, все необходимые связи между ними устанавливаются в виде математических теорем, опирающихся на из- изложенную во второй главе общую математическую теорию. В этом смысле рядом с изложением фон Неймана можно было бы поставить
H ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА лишь книгу Дирака. Однако при всей логической красоте и строй- стройности его изложения Дирак позволяет себе использовать понятия, математическая природа которых оставалась в то время невыяснен- невыясненной (Д-функция). Только теперь мы знаем, что Д-функция, как и ряд других подобных математических объектов, которые исполь- используются физиками, получила математически корректное обоснование в развившейся за последние годы теории обобщенных функций (С. Л. Соболев, Л. Шварц и др.). Книга содержит важные оригинальные физические результаты. Во второй части книги автор уделяет много внимания статисти- статистическим аспектам квантовой механики как с точки зрения внутренне присущей ей статистической природы, так и с точки зрения квантово- механического определения понятий статистической физики. Первое заставляет автора последовательно рассматривать не только чистые состояния, но и смеси, в связи с чем он вводит понятие матрицы плотности, оказавшееся чрезвычайно плодотворным в дальнейшем развитии теории. Последнее побуждает к чрезвычайно тщательному анализу макроскопического измерения и введению специальных опе- операторов макроскопических величин и приводит к весьма важному макроскопическому определению энтропии. Наконец, в книге приво- приводится принадлежащее автору доказательство эргодической теоремы в квантовой статистике. В силу важности этого вопроса мы решили добавить к книге перевод, к сожалению мало известной, оригиналь- оригинальной статьи автора. Стиль Неймана весьма своеобразен и не всегда ригорически сле- следует правилам школьной грамматики. Переводчикам книги М. К. По- Поливанову и Б. М. Степанову пришлось немало потрудиться, чтобы найти достойный русский эквивалент. Необычно оформление книги — большая часть формул не вынесена в красные строки, а распола- располагается непосредственно внутри текста. Отсутствует и нумерация формул в обычном смысле — только самые важные выражения по- получают свои специальные названия. Мы пытались сохранить эту особенность, насколько то было возможно по условиям печати. Н. Н. Боголюбов Август 1964 г.
ПАМЯТИ МОЕГО ОТЦА ПОСВЯЩАЮ ВВЕДЕНИЕ Предмет этой книги составляет единое и, насколько это воз- возможно и уместно, математически безукоризненное изложение новой квантовой механики, которая за последние годы достигла, в ее суще- существенных частях, вероятно, уже окончательной формы в так называемой «теории преобразований». При этом основной упор сделан на общие и принципиальные вопросы, возникающие в связи с этой теорией. В частности, надо будет подробно исследовать сложные и зачастую все еще не проясненные до конца вопросы интерпретации. Особенно важно, в связи с этим, отношение квантовой механики к статистике и к классической статистической механике. Что же касается разъясне- разъяснения применений квантовомеханических методов к частным задачам, равно как и изложения отдельных более специальных теорий, ответвляю- ответвляющихся от общей теории, то мы будем, как правило, отвлекаться от них — по крайней мере насколько это возможно без угрозы пони- пониманию общих связей. Это представляется тем более позволительным, что существует или находится в стадии публикации много превос- превосходных изложений подобных вещей '). С другой стороны, мы включим изложение потребного для целей этой теории математического аппарата — теории гильбертова про- пространства и так называемых эрмитовых операторов в нем. При этом ') Это, среди прочих, следующие исчерпывающие руководства: Som- m erf eld, Приложение к Atombau und Spectrallinien, Braunschweig, 1928 (русский перевод: ОНТИ, М. — Л. A938)); Weyl, Qruppentheorie und Quan- tenmechanlk, Leipzig, 1928 (русский перевод: ОНТИ ДНТВУ, Харьков A938)); Френкель, Волновая механика, 1929 (нем.), 1934 (русск.); Born und Jordan, Elementare Quantenmechanik, Berlin, 1930; D i r a c, The Principles of Quantum Mechanics, Oxford, at the Clarendon Press A930) (русский пере- перевод: ГТТИ, М. — Л. A932)). Из более современных книг на русском языке можно привести: Б л о- х и н ц е в, Основы квантовой механики, «Высшая школа», 1963. Дирак, Принципы квантовой механики (перевод с 4-го английского издания), Физматгиз, 1960. Зоммерфельд, Строение атома и спектры, т. II (перевод с немецкого издания 1951 г.), Гостехиздат, 1956. Ландау и Лифшиц, Квантовая механика, Физматгиз, 1963. Ш и ф ф, Квантовая механика (перевод со 2-го английского издания), ИЛ, 1957. {Прим. ред.)
10 ВВЕДЕНИЕ потребуется подробно войти и в рассмотрение неограниченных опе- операторов, т. е. расширить теорию (созданную Гильбертом и Хеллин- гером, Рисом, Шмидтом, Теплицем) за пределы ее классического объема. По поводу метода изложения, принятого здесь, можно заме- заметить следующее: вычисления будут, как правило, производиться с са- самими операторами (представляющими физические величины), а не с матрицами, которые получаются из них лишь после введения в про- пространстве Гильберта какой-либо (специальной или произвольной) си- системы координат. Этот «бескоординатный», т. е. инвариантный и в сильной мере геометризированный способ изложения связан с заметными формальными преимуществами. Дирак в ряде статей и недавно опубликованной книге2) дал столь краткое и элегантное изложение квантовой механики, также имеющее инвариантный характер, что оно вряд ли может быть пре- превзойдено в этом смысле. Поэтому, пожалуй, будет уместным при- привести здесь некоторые соображения в пользу нашего метода, кото- который существенно отличается от метода Дирака. Упомянутый, перешедший сейчас вследствие своей прозрачности и элегантности в большую часть квантовомеханической литературы, метод Дирака ни в какой мере не сможет удовлетворить требова- требованиям математической строгости — не сможет, даже если и снизить их как-то естественно и разумно до, впрочем, в теоретической физике обычного уровня. Так, например, этот метод последовательно цепляется за ту фикцию, что каждый самосопряженный оператор можно при- привести к диагональному виду, что, для операторов, для которых это на самом деле не так, приводит к необходимости вводить «несобственные» функции с самопротиворечивыми свойствами. Такое включение математических «фикций» оказывается иногда неизбежным, даже и в случаях, когда речь идет лишь о подсчете результата наглядно определимого опыта. Это не было бы возражением, будь образование этих, недопустимых в сегодняшних рамках анализа, понятий действительно существенно для новой физической теории. Подобно тому как ньютонова механика сразу принесла с собой возникновение в своей тогдашней форме безусловно самопротиворе- самопротиворечивого анализа бесконечно малых, так и квантовая механика могла бы подсказать новое построение нашего «анализа бесконечно многих переменных», т. е. вызвать изменение математического аппарата, а не физической теории. Это, однако, ни в коей мере не так, и, напротив, будет показано, что квантовомеханическую «теорию преобразований» можно столь же ясно и единообразно обосновать и математически безукоризненным образом. При этом надо подчерк- 2) Ср. Proc. Roy. Soc. London, vol. 109 A925) и ^следующие выпуски, в особенности 113 A926). Независимо от Дирака Йордан [P. Jordan, Z. Physik, Bd. 40 A926)) и Лондон (F. London, Z. Physik, Bd. 40 A926)) предложили аналогичное обоснование теории.
ВВЕДЕНИЕ 11 нуть, что корректное построение отнюдь не состоит в математиче- математическом уточнении и разъяснении метода Дирака, но требует с самого начала отличающегося приема — именно, опирается на гильбертову спектральную теорию операторов. При анализе принципиальных вопросов будет, в частности, пока- показано, как статистические формулы квантовой механики могут быть получены из небольшого числа фундаментальных качественных допу- допущений. Дальше будет подробно обсужден вопрос о том, можно ли свести статистический характер квантовой механики к некоторой неоднозначности (т. е. неполноте) в нашем описании природы — ведь такое объяснение лучше всего отвечало бы тому общему прин- принципу, что всякое вероятностное суждение есть следствие неполноты наших знаний. Такое объяснение с помощью «скрытых параметров», равно как и родственное ему другое, приписывающее «скрытые параметры» наблюдателю, а не наблюдаемой системе, предлагалось не однажды. Между тем оказывается, что это едва ли может удаться удовлетворительным образом, или, более точно, — такое объяснение несовместимо с некоторыми основными качественными постулатами квантовой механики 3). Будет также исследовано отношение этой статистики к термо- термодинамике. Подробное рассмотрение показывает, что известные труд- трудности классической механики, связанные с «предположением о бес- беспорядке», требуемым для обоснования термодинамики, могут быть здесь устранены4). 3) Ср. гл. IV и гл. VI, 3. 4) Ср. гл. V и Дополнение.
ГЛАВА I ВВОДНЫЕ ЗАМЕЧАНИЯ 1. Возникновение теории преобразований Здесь не место указывать на огромные успехи, достигнутые квантовой теорией в период с 1900 по 1925 гг. в ходе развития, над которым господствуют имена Планка, Эйнштейна и Бора5). К концу этого процесса развития представилось ясным и не оста- оставляющим никаких сомнений, что все элементарные процессы, т. е. все происходящее в атомно-молекулярном масштабе, управляются «прерывными» законами квантов. Почти для всех задач имелись и количественные квантово-теоретические методы, которые большей частью вели к результатам, более или менее хорошо согласующимся с опытом. И что имело наибольшее принципиальное значение—само мышление теоретико-физического исследования восприняло ту идею, что господствующий во всем доступном восприятию макрокосмиче- ском мире принцип непрерывности («natura non facit saltus») возни- возникает лишь в результате процесса усреднения в по существу своему прерывном мире — благодаря тому, что человек обычно сразу аппер- цепирует только сумму многих квадрильонов элементарных процессов, так что истинная природа единичного процесса оказывается полностью завуалированной все нивелирующим законом больших чисел. Тем не менее к этому времени не существовало математико- физической системы квантовой теории, которая обнимала бы единым образом все дотоле известное, не говоря уже о такой, которая одновременно включала бы в себя монументальную замкнутость взорванной квантовыми явлениями системы механика — электродина- 5) Его основными этапами были: открытие Планком квантовых законов для случая «черного» равновесного излучения (ср., например, изложение Р 1 а п с к'а в его книге Warmestrahlung, Leipzig, 1906; доказательство корпус- корпускулярной природы света (теории световых квантов) Е i n s t e i п'ом (Ann. d. Physik [4], Bd. 17 A905)), представившее первый пример дуализма волна — частица, который, как мы теперь знаем, господствует во всей микро- микроскопической физике; перенос этих двух групп закономерностей иа модель атома, выполненный Bohr'oM, Phil. Mag. 26 A913); Z. Physik 6 A920).
1] ВОЗНИКНОВЕНИЕ ТЕОРИИ ПРЕОБРАЗОВАНИЙ 13 мика — теория относительности. Вопреки несомненно оправданному притязанию квантовой теории на универсальность, ей недоставало необходимого для этого формального и идеологического аппарата; она представляла собою нелегкую для распутывания смесь сущест- существенно различных, независимых, разнородных и частью противореча- противоречащих друг другу допущений и предписаний. Самыми разительными пунктами были: принцип соответствия, наполовину принадлежащий классической механике и электродинамике, но играющий решающую роль в окончательном прояснении положения вещей, самопротиво- самопротиворечивая двойственность природы света (волны и частицы — ср. прим.5) и прим.148) на стр. 211) и, наконец, существование неквантованных (апериодических) и квантованных (периодических или условно пери- периодических) движений6). Решение принес тысяча девятьсот двадцать пятый год. На основе предложенного Гайзенбергом подхода Борну, Гайзенбергу, Йордану и, несколько позже, Дираку удалось выстроить новую систему квантовой теории, первую замкнутую систему квантовой теории, которую получила физика. Лишь чуть позже Шредингер из совер- совершенно другого исходного пункта нашел «волновую механику», кото- которая к тому же и, как вскоре выяснилось, была (по крайней мере в математическом смысле, ср. 1.3,4) эквивалентна системе Гайзен- берга, Борна, Йордана и Дирака7). На основе борновского статистического толкования квантово- теоретического описания природы8) Дирак и Йордан9) смогли спла- сплавить обе теории в единую «теорию преобразований», в которой обе эти теории объединяются, дополняя друг друга, и в которой оказа- оказалось возможным математически особенно простое понимание физи- физических вопросов. Можно еще упомянуть (хотя это и не относится собственно к нашему предмету), что теперь, после того как Гаудсмит и Уленбек открыли еще магнитный момент и спин электрона, исчезли почти 6) Благодаря Эпштейну и Зоммерфельду стали известны добавляющиеся к механическим законам квантовые законы для условно-периодического движения (ср., например, Sommerfeld, Atombau und Spektrallinien, 4 Aufl. Braunschweig, 1924, русск. перевод: Зоммерфельд, Строение атома и спектры, М. — Л., ГНТИ, 1926, а также перевод с издания 1951 г., т. 1, М., Гостехиздат, 1956). Напротив, было твердо установлено, что сво- свободно движущаяся материальная точка или планета на гиперболической орбите (в отличие от эллиптических орбит) «неквантованы». Читатель найдет полное изложение этой фазы развития квантовой теории в книгах: R e i с h е, Die Quantentheorie, ihre Ursprung und ihre Entwicklung, Berlin, 1921 или Lande, Fortschritte der Quantentheorie, Dresden, 1922. 7) Это было доказано Schrodinge г'ом, Ann. Physik [41 79 A926). 8) Z. Physik, Bd. 37 A926). 3) Ср. прим.2) на стр. 10 и также книгу: Schrodinge r, Abhandlun- gsn zur Wellenmechanik, Leipzig, 1928.
14 ВВОДНЫЕ ЗАМЕЧАНИЯ (ГЛ. I все трудности первоначальной квантовой теории, так что сегодня мы обладаем безукоризненной системой механики. Правда, упомянутое ранее великое единство с электродинамикой и теорией относитель- относительности еще не восстановлено, однако, по крайней мере, есть уни- универсально справедливая механика, в которую квантовые закономерности входят с естественной необходимостью и которая удовлетворительно объясняет большую часть наших опытов 10). 2. Первоначальные формулировки квантовой механики В целях предварительной ориентировки расскажем кратко, как принципиально ставится задача в «матричной механике» Гайзенберга — Борна — Йордана и в «волновой механике» Шредингера. В обеих теориях сперва задается классическая механическая задача, характеризуемая гамильтоновой функцией Н (qi qk, pv ..., рк). (Это означает, как известно, — детальнее смотри в учебниках меха- механики — следующее: Пусть система имеет k степеней свободы, т. е. ее состояние в каждый момент фиксируется заданием численных значений k коор- координат qv ..., qk. Ее энергия есть заданная функция координат и их производных по времени .... qk, qx qk) и именно, как правило, квадратичная функция производных qv .... qk- С помощью соотношений dL dL "P для координат qx qk вводятся «сопряженные импульсы» pv ..., pk, которые в случае сделанного выше предположения зависят от q1 qk линейно. Во всяком случае можно исключить qx qk из L с помощью pv .... рк, так что будет qk, qv 4k> — H{qv .... q&, рг pk). 10) Современное положение вещей можно охарактеризовать тем, что теория приводит к полному успеху, пока оиа имеет дело с отдельными электронами или с электронными оболочками атомов или молекул, а именно с электростатическими силами, равно как и с электромагнитными процес- процессами при испускании, распространении и преобразовании света. Напротив, кажется, что в проблемах атомного ядра и во всех попытках установить общую и релятивистскую теорию электромагнетизма теория, несмотря на значительные успехи в решении частных задач, всегда ведет к огромным трудностям, которые вряд ли удастся преодолеть без введения существенно новых идей.
21 ПЕРВОНАЧАЛЬНЫЕ ФОРМУЛИРОВКИ КВАНТОВОЙ МЕХАНИКИ 15 Эта Н и есть гамильтонова функция.) В обеих теориях мы хотели бы теперь узнать, исходя из этой гамильтоновой функции, возможно больше об истинном, т. е. квантовом, поведении этой системы11) — прежде всего определить возможные энергетические уровни, затем найти относящиеся к ним «стационарные состояния», посчитать «ве- «вероятности переходов» между ними и т. д.12). Наставление, предлагаемое для решения этой задачи матричной теорией, состоит в следующем: надо найти систему 2k матриц <2j Qk, Pj ^ft13)- которые, во-первых, удовлетворяют усло- условиям QmQn-QnQm^O. РтРп-РпРт = 0, 0 при т Ф п, 1 А] при (т, п = 1 k) ") Движение по классической механике, как известно, полностью опре- определяется гамильтоновой функцией, поскольку она дает нам уравнения дви- движения дН ¦ дН „ , qt=^ p^-wt (/=1 k)- До открытия квантовой механики пытались схватить квантовые явления, сохранив эти уравнения движения и лишь налагая дополнительные кванто- квантовые условия (ср. прим. 6) на стр. 13). Уравнения движения определяли для каждого, заданного в момент ^ — 0, набора значений q,, ..., qk, p., ..., pk дальнейшее развитие со временем, «Орбиту» системы в 2й-мерном «фазовом пространстве» q^, ..., q., p., ..., pk- Поэтому всякое дополнительное усло- условие оказывается приводящим к ограничению всех возможных начальных зна- значений (орбит) определенной подсистемой. (Соответственно малому числу допустимых орбит будут возможны лишь некоторые уровни энергии.) Хотя квантовая механика и порвала полностью с этим приемом, все-таки a priori ясно, что функция Гамильтона должна и в ней играть большую роль. В самом деле, весь наш опыт доказывает справедливость воровского принципа соот- соответствия, который утверждает, что квантовая теория должна давать те же результаты, что и классическая механика в так называемом пределе боль- больших квантовых чисел. 1$) Три последних понятия заимствованы из доквантовомехаиического, развитого преимущественно Бором, круга идей теории квант. Позже мы еще детально проанализируем их с точки зрения квантовой механики (ср. отно- относящуюся сюда диракову теорию излучения, изложенную в III. 6). Их истори- историческое развитие можно проследить по работам Бора относительно струк- структуры атома, опубликованным с 1913 по 1916 г. 13) Как показывает более детальный математический анализ, эта задача необходимо приводит к бесконечным матрицам. Мы не будем здесь входить в детали свойств этих матриц, поскольку они будут рассмотрены позже во всей подробности. Пока достаточно знать, что формальные алгебраические операции с этими матрицами следует понимать в смысле известных правил матричного сложения и умножения. В частности, под 0 и 1 мы понимаем нулевую и единичную матрицы (со всеми элементами, тождественно равными нулю, и с элементами, равными единице на главной диагонали, и остальными нулевыми соответственно).
16 ВВОДНЫЕ ЗАМЕЧАНИЯ [ГЛ. I и для которых, во-вторых, матрица W = H(Ql Qk, Pv .... Pk) становится диагональной. Мы не будем здесь входить в детали происхождения этих урав- уравнений, в особенности первой группы —так называемых «правил ком- коммутации», которые определяют все некоммутативное матричное исчи- исчисление в этой теории. Читатель найдет исчерпывающее изложение этого предмета в работах, цитированных в прим. 1) (стр. 9). Вели- Величина h — это планковский квант действия. Диагональные элементы W, пусть wv w2 будут тогда различными возможными уровнями энергии системы. Элементы матриц Q. Q.—о'1', ..., o<*j' извест- ji n Tft /X Tib 11 ным образом определяют вероятности перехода системы (из состоя- состояния т с энергией wm в состояние п с энергией wn, wm > wn) и испускаемое при этом излучение. Вдобавок следует заметить, что матрица W = H(Q1 Qk, P1 Pk) не определяется полностью набором Qx Qk, Pv .. ., Pk и га- мильтоновой функцией Н (qv . . ., qk, px pk) классической меха- механики, поскольку Ql и Рг не коммутируют между собой (при умно- умножении), в то время как в случае классической механики было бы совершенно бессмысленным различать между, скажем, plql и дгрг в #(<7i> .... qk, рг pk). Поэтому надо еще установить в Н порядок множителей qt и рь в дополнение к классическому смыслу этого выражения в отдельных членах. В общем эта процедура не проведена, но для важнейших частных случаев известны целесооб- целесообразные нормировки. (В простейшем случае, когда рассматриваемая система состоит из v частиц и, следовательно, имеет k = 3v коорди- координат qv .... q34, — скажем так, что q^_2, ^-p 43v. СУТЬ ТРИ Декар- Декартовых координаты [х-й частицы, jx = 1 v, — в которых взаимодей- взаимодействие этих частиц определяется потенциальной энергией V(q: <73v), вообще не возникает неоднозначностей такого рода. Классической функцией Гамильтона будет тогда <73v> Pv •¦•¦ Ы = где т^ — масса jx-й частицы, a p^-v Рз^-1> Рз^ — компоненты ее импульса. Что будет означать это после подстановки матриц Q,, ..., <23v, Pv ..., P3w, совершенно ясно. В частности, не возникает никаких затруднений с потенциальной энергией, поскольку все Qv ..., Q3v между собою коммутируют.) Существенно, что дозволены только
2] ПЕРВОНАЧАЛЬНЫЕ ФОРМУЛИРОВКИ КВАНТОВОЙ МЕХАНИКИ 17 эрмитовы матрицы, т. е. такие матрицы А={атп\, для которых тождественно выполняется атп = апт (элементы атп могут быть ком- комплексными!). Отсюда Н{Qv . . ., Qk, Pl Pk) должна быть эрми- эрмитовой, если эрмитовы все Qv .. ., Qk, P1% . . ., Pk, что вносит опре- определенное ограничение в упомянутую задачу определения правильного порядка сомножителей, ни в коей мере недостаточное, однако, чтобы однозначно определить Н(Qj Qk, Pv .. ., Pk) no классической функции #(<7i qk. pv ..., pk)u). Напротив, наставление волновой механики гласит следующее: сперва надо образовать гамильтонову функцию H{qv ..., qk, pv ..., pk), а затем составить для произвольной функции ф (qx qk) в конфигура- конфигурационном пространстве системы (а не в фазовом пространстве, т. е. pv ..., pk не входят в ф) дифференциальное уравнение h д h д При этом h д h д 4k' %J-a7T- ¦¦¦' 0^7 надо понимать в само собой разумеющемся смысле как функциональ- функциональный оператор. Например, в указанном выше случае переводит функцию 14) Если матрицы Q,, P, — эрмитовы, то ни QjP, ни PjQj не обязаны быть такими, но зато всегда эрмитова -~- (QiPi -\-PiQi). Но уже в слу- случае Q2iP1 начинают конкурировать как-^-(Q2lP1-\-P^f), так и правда, если Р^, — Q,P, = -^-т 1, то эти два выражения совпадают), в случае Q\p\ — три выражения 4-(Q?P?-f P?Qi), Qi^?Qi и ^Qi/3, н т.д. (теперь уже не все эти выражения совпадают и в упомянутом частном слу- случае). Мы не будем сейчас вдаваться в это подробнее, поскольку развивае- развиваемое далее операторное исчисление позволит много йснее разобраться в этих соотношениях. 2 И. Нейман
18 ВВОДНЫЕ ЗАМЕЧАНИЯ [ГЛ. I (мы опустили в V и ф переменные qt 9зЛ- Поскольку операция А д 1Сч h д ^•р-т— отлична от операции10) -%^-jrr-4v здесь снова возникает неопределенность, связанная с порядком сомножителей qm и рт в H(q1 qk, px рк), однако Шредингер показал, как можно устранить эту неоднозначность путем сведения к определенному вариационному принципу и притом так, чтобы результирующее диф- дифференциальное уравнение оказалось самосопряженным16). Ну а это дифференциальное уравнение («волновое уравнение») приобретает характер проблемы собственных значений, если интерпретировать X как параметр собственных значений и наложить на собственную функ- функцию (|> = ^(^j qk) требования, скажем, исчезновения на краю конфигурационного пространства (пространства координат qx qk), и, конечно, регулярности и однозначности в нем. По смыслу волно- волновой теории собственные значения X (как в дискретном, так и в не- непрерывном спектреI7) представляют собой возможные энергетические уровни. Также и (комплексные) собственные функции, принадлежа- принадлежащие им, связаны с соответствующими (стационарными в смысле Бора) состояниями системы. Так для системы из ч электронов (? = 3v см. выше, е — заряд электрона) плотность заряда электрона с номе- номером [х, который по Шредингеру надо представить себе «размазанным» по всему пространству х, у, z(==q^_v Чъ^-Х' Чг^)< измеренная в точке х, у, z, задается выражением f ¦¦¦ z, "зТ^з 1S) Мы имеем A тем самым получаем h д где 1 есть тождественный (переводящий ф в себя самое) оператор, т. е. А д к—г-т— и qi удовлетворяют тем же правилам коммутации, что и матрицы Л и <?,. 16) Ср. его первые две статьи в книге, цитированной в прим.9) (стр. 13), также Ann. Phys. [4] 79 A926). 17) Ср. первую из упомянутых в прим.16) работ Шредингера. Точное определение спектра и его частей будет дано позже в §§ II. 6—II. 9.
о] ПЕРВОНАЧАЛЬНЫЕ ФОРМУЛИРОВКИ КВАНТОВОЙ МЕХАНИКИ 19 (Чтобы полный заряд вышел бы равным е, функция ф должна быть нормирована условием [Интегрирование по всем 3v переменным!] Причем для каждого из |х=1 1 получается то же уравнение.) Кроме того, волновая механика может делать высказывания и отно- относительно систем, не находящихся в боровских стационарных состоя- состояниях 18), а именно следующим образом: Если состояние не стационарно, т. е. изменяется со временем, тогда волновая функция ty = if(qv .... qk; t) содержит время и меняется согласно дифференциальному уравнению Это значит, что для t = t0 if может быть задана произвольным обра- образом, а затем однозначно определяется для всех t. Даже стационар- стационарные if, как можно заключить из сравнения двух шредингеровых диф- дифференциальных уравнений, в действительности зависят от времени, но только для них время входит согласно _tLu if(qv .... qk\ t)=e H if (qr qk; 0), т. е. t появляется только в множителе, равном единице по абсолют- абсолютной величине и не зависящем от qv .... qk (т. е. постоянном в кон- конфигурационном пространстве), так что, например, определенное выше распределение плотности заряда не изменяется. (Мы фудем вообще предполагать — и обнаружим, что это оправдается в дальнейшем более детальными рассуждениями, — что множитель в if, равный единице по модулю и постоянный [в конфигурационном пространстве], принци- принципиально ненаблюдаем.) Поскольку собственные функции первого дифференциального урав- уравнения образуют полную ортогональную систему20), мы можем 18) В первоначальном понимании матричной механики (ср. наше изло- изложение выше) не существовало такого общего понятия состояния, для кото- которого стационарные состояния оказываются частным случаем. Только ста- стационарные, сопоставленные собственным значениям энергии, состояния были предметом теории. 13) H = H(qv ..., qk, Pj pk) может даже явно содержать время t. Естественно, что тогда, вообще говоря, не будет вовсе никаких стационар- стационарных состояний. 20) Если имеется только дискретный спектр. Ср. II, 6. 2*
20 ВВОДНЫЕ ЗАМЕЧАНИЯ [ГЛ. I разложить по ним всякую ф = ф (qv .... <7ft). Если tyv ф2, ... суть соб- собственные функции (все опять не зависящие.-от времени) и \v Х2, ... — соответствующие им собственные значения, то разложение имеет вид 2 ' л=1 Если же ф зависит от времени, то t войдет в коэффициенты ап (на- (напротив, собственные функции фр ф2, ... не должны здесь, как и всюду далее, зависеть от времени. Таким образом, если ф=ф(дг1( ..., qk), с которой мы имеем дело, есть в действительности ^(q1 qk; t0), то, с учетом того, что л=1 Л=1 Я=1 И л=1 из второго дифференциального уравнения сравнением коэффициентов получим -— т. е. п f\ > " д а '* \ и/ /У I 1 //7 /7 1 • • • , (/л, ?J — ^JJ е иifJn \}jii • . • , Vaz' л=1 Следовательно, если ф не стационарна, т. е. если не все ап, за ис- исключением одного, обращаются в нуль, то ф (при изменении t) уже больше не меняется лишь на (в пространстве состояний) постоянный множитель абсолютной величины 1. Поэтому будут, вообще говоря, изменяться и определенные выше плотности заряда и, значит, в про- пространстве возникнут реальные электрические колебания 22). 21) Эти, так же как и все последующие разложения в ряды, сходятся «в среднем». Мы это рассмотрим в П. 2. 22) Что в стационарных состояниях (и только в таких) такие колебания отсутствуют, было одним из наиболее важных постулатов Бора 1913 г- Классическая электродинамика находится в прямом противоречии с этим.
3] ЭКВИВАЛЕНТНОСТЬ ДВУХ ТЕОРИЙ: ТЕОРИЯ ПРЕОБРАЗОВАНИЯ 21 Мы видим, что основные понятия и практические наставления обеих теорий звучат заметно различно. Тем не менее с самого начала они всегда приводили к одним и тем же результатам, даже и тогда, когда это касалось деталей, в которых обе они отличались от более ранних концепций квантовой теории23). Эта необычайная ситуация была, как указано в 1.1, вскоре прояснена24) Шредингером, дока- доказавшим их математическую эквивалентность. Мы обратимся сейчас к этому доказательству эквивалентности и в то же время поясним общую теорию преобразований Дирака—Йордана (которая объединяет эти две теории). 3. Эквивалентность двух теорий: Теория преобразований Фундаментальная проблема матричной теории состояла в отыска- отыскании матриц Qv .... Qk, Рг Рк таких, чтобы, во-первых, удо- удовлетворялись перестановочные соотношения из 1.2 (стр. 15) и, во-вторых, чтобы некоторая определенная функция этих матриц H(QV .... Qk, Pv .... Рк) становилась диагональной матрицей. Эта задача была разделена Борном и Йорданом уже в их первой публикации на две части следующим образом: Сначала разыскивались какие-нибудь матрицы Q1 Qk, Р, Рк, которые должны были лишь удовлетворять перестановоч- перестановочным соотношениям, что легко достигается 25); при этом, вообще говоря, Н = //($! Qk,P, Рк) не оказывалась диагональной матрицей. Затем правильные решения разыскивались в форме Qj = S-'QjS Qk = S^QtS. Л = S-^S Pk — S~lPkS, где S могла быть произвольной матрицей (но все же обладающей обратной матрицей S со свойствами S~\S = SS~1 = l). Поскольку из выполнения перестановочных соотношений для Qj Qk, Pv ..., Pk следует (тождественно в силу свойств 51) и их справедливость для Qx Qk, Pl Pk и поскольку H=#(QX Qk, Л Pk) переходит в Н = H(Q1 Qft, Px Pk), где 23) Ср. вторую работу Шредингера, упомянутую в прим.16) на стр. 18. 24) Ср. прим. 7) на стр. 13. 25) Ср., например, §§ 20, 23 книги Борна и Йордана, упомянутой в прим.') на стр. 9.
22 ВВОДНЫЕ ЗАМЕЧАНИЯ (ГЛ. ! 5-1Н5 = Н 26)> то единственное, что надо требовать от S, — это чтобы 5-1Н5 была диагональной матрицей при заданной Н. Следовало бы, конечно, еще позаботиться о том, чтобы при этом S~lQxS, ... остались эрмитовыми, как были Qv .... Однако при более внимательном рассмотрении оказывается, что этому дальнейшему требованию к 5 всегда можно удовлетворить позже; поэтому сейчас в этом предварительном рассуждении мы оставим его без внимания. Следовательно, требуется привести данную Н к диагональной форме с помощью преобразования S~ HS. Давайте поэтому точно сформулируем, что это значит I Пусть матрица Н имеет элементы h^, искомая матрица 5 — эле- элементы s^ и (также неизвестная) диагональная матрица Н — диаго- диагональные элементы w^ и, следовательно, общий элемент w^b^27). H = 5~1HS утверждает то же, что и SH = HS, а последнее озна- означает (если мы приравняем друг другу соответствующие, определяемые по известным правилам матричного умножения элементы с обеих сторон равенства): 21 ^ • WAP = 2! *,« • v V V т. е. Отдельные столбцы slp, s2f, ... матрицы 5 (р=1, 2, ...) и соот- соответствующие диагональные элементы w матрицы Н являются, следо- следовательно, решениями так называемой проблемы собственных значений, которая записывается следующим образом: 26) Поскольку S-I.bS=l, то для любого матричного полинома Р(А, В, ...) S~ lP (A, B,...)S = P E~ MS, 5~ ^5, ...). Взяв в качестве Р левые части перестановочных соотношений, убедимся в их инвариантности; взяв в качестве Р величину Н, получим S~]HS=H. ") &|j.v — эт0 хорошо известный символ Кроиекера: 8|j.v = 1 При [J- = V, Bv = 0 при [л ф 1.
3] ЭКВИВАЛЕНТНОСТЬ ДВУХ ТЕОРИЙ: ТЕОРИЯ ПРЕОБРАЗОВАНИЯ 23 (тривиальное решение х1 — х2 = ... =0 естественно исключается). Действительно, xy=as , X = w есть решение. (Решение л;„з=0 и, следовательно, sv^0 [для всех v] не относится к делу, поскольку тогда р-й столбец S исчез бы тождественно, в то время как S об- обладает обратной матрицей S~ !). Замечательно, что в существенном единственно такие решения и возможны. В самом деле, полученное выше уравнение означает, что преоб- преобразование вектора х= {xv х2, ...} с помощью матрицы Н равняется тому же вектору, умноженному на число X. Преобразуем х = aajjf,, х2, ...} с помощью S'1 и обозначим полученный при этом вектор через у = {ух> у2, ...}¦ Если мы преобразуем у с помощью Н, то это будет то же, что преобразование х с помощью HS~ = = S~'HS • S = S~! • H, а следовательно то же, что преобразова- преобразование Хх с помощью S'1, т. е. Ху. Далее Ну имеет компоненты а Ху — компоненты Ху^, т. е. требуется, чтобы w^y^ = Ху^ для всех |х=1, 2, ..., а это означает, что Уц = 0 для всех w^ Ф X. Это означает, если обозначить через тр вектор, у которого р-я компо- компонента есть 1, а все остальные — нули,—-что у есть линейный агре- агрегат таких tjp, для которых wp = X,—в частности, у нуль, если таковых вовсе нет. Значение х получается применением S к у, сле- следовательно, х есть определенный выше линейный агрегат векторов rf, преобразованных с помощью 5. Компонента Sri? с номером jj. есть (поскольку v-й компонентой rf была 8 ): 2 ^цА» = s . Если мы теперь будем понимать р-й столбец S: sx , s2 , ... как вектор, то х будет линейным агрегатом всех столбцов, для которых w = X, — в частности, х есть нуль, если таковых не существует. Таким образом, наше первоначальное утверждение доказано: wv w2, ... — это един- единственные собственные значения и a:v = sv, X = te> —в существенном единственные решения. Это весьма важно, поскольку не только знания 5 и Н достаточно для определения всех решений проблемы собственных значений, но и наоборот, мы можем определить 5 и Н, коль скоро мы решили проблему собственных значений полностью. Например, для Н: w со- составлено из всех решений X и каждое такое X появляется в ряду wv w2, • ¦. столько раз, сколько есть принадлежащих ему линейно-
24 ВВОДНЫЕ ЗАМЕЧАНИЯ [ГЛ. I независимых решений х{, х2, ... 28), тем самым wv w2, . • ¦ уже определены с точностью до порядка следования 29). Таким образом, центральная проблема матричной теории — это решение уравнения проблемы собственных значений: Перейдем теперь к волновой теории. Основное уравнение этой теории «волновое уравнение»: Е2. Щ(qv ..., qk) = l-y(qv .... qk), где Н — уже обсуждавшийся дифференциальный оператор. Надо отыскать все решения y{qv ..., qk) и X, исключая тривиальное: ср (<7j qk) — 0 и X произвольно. Это похоже на то, что требо- требовалось в Е\.: последовательность xv х2, . . . может рассматриваться как функция xv «прерывной» переменной v (со значениями 1, 2, . . .), соответствующая функции <f(q1, ..., qk) «непрерывных» переменных qv . .., qk; X каждый раз играет одну и ту же роль. И только ли- линейное преобразование на первый взгляд совсем не похоже на преобразование i Як)- Как же достичь аналогии? Мы рассматривали индекс v как переменную и установили парал- параллель между ней и k переменными qx qk, т. е. между положи- положительным целым числом и произвольной точкой ^-мерного конфигура- конфигурационного пространства (которое мы будем отныне называть простран- пространством 2). Поэтому нельзя ожидать, что 2 можно перенести в Q v в виде суммы, скорее правильной аналогией будет интеграл Г ... I ... dqx ... dqk (или, короче, I .. . dv, dti —элемент объема 28) Ведь столбцы s,p, s2p, ... — матрицы S с таким р, что w? = X обра- образуют полный набор решений и в качестве столбцов матрицы, имеющей об- обратную, должны быть линейно независимы. 29) Поскольку произвольная перестановка столбцов S одновременно с соответствующей перестановкой строк S~' переставляет таким же обра- образом диагональные элементы Н, порядок wlt п>г, ... фактически неопределен и неустановим.
3) ЭКВИВАЛЕНТНОСТЬ ДВУХ ТЕОРИЙ: ТЕОРИЯ ПРЕОБРАЗОВАНИЯ 25 dqy . . . (lqk в 2). Матричному элементу А^, который зависит от двух переменных типа индекса м, тогда соответствует функция в которой qv . . ., qk и q[ q'k независимо пробегают всю об- область 2. Преобразование ч v' должно перейти тем самым в а проблема собственных значений Е\. , которая может быть записана как переходит в Задачи собственных значений типа Е$. широко изучались в матема- математике и действительно могут быть представлены в виде, в сильной степени аналогичном проблеме Е\. ¦ Они называются «интегральными уравнениями» 30). Однако, к несчастью, Е2. не представляется в такой форме или, точнее, она может быть представлена в этой форме лишь, если для дифференциального оператора 30) Теория интегральных уравнений обрела свою определенную форму, в работах Фредгольма и Гильберта. Исчерпывающее изложение, пополнен- пополненное литературными ссылками, можно найти в книге Куранта и Гильберта Courant — Hilbert, Methoden der Mathematischen Physik, Berlin, 1931. (Русский перевод: Методы математической физики, Гостехиздат, 1951.)
26 ВВОДНЫЕ ЗАМЕЧАНИЯ [ГЛ. I может быть найдена такая функция h (дх qh; q'x q'\ что q'k)dqx .. . dqh выполняется тождественно (т. е. для всех y(qv ..., qk)). Эту h(qv .... qk; q'v .... q'X если она существует, будем впредь называть (интегральным) «ядром» функционального оператора Н, а сам Н тогда называется «интегральным оператором». Но такое преобразование вообще невозможно, т. е. дифференци- дифференциальные операторы Н никогда не являются интегральными операто- операторами. Даже простейший функциональный оператор, преобразующий каждую ср в самое себя, — этот оператор называется 1 — не является таковым. Остановимся на этом операторе, положив ради простоты k=l. Итак, требуется, чтобы было: = ( h(q, —оо Заменим ср(^) на tp(9 + 9o)> положим <7 —0 и введем переменную со интегрирования q" — qr~\-q0. Тогда ср(д-0)= Г h @, q"—qo)<?(q")dq". — оо Если мы теперь заменим q0, q" на q, q', мы увидим, что Л @, q' —q) решает задачу, так же как и h (q, qr), так что мы вправе считать, что h(q, q') зависит лишь от q' — q. Тогда требование формули- формулируется так: со Д„. <р (?) =s J h (qf — q)<? (qr) dq', (h (q, q') = h(q' — q)). Заменяя снова y(q) на <?(<7 + <70)| убедимся, что достаточно рассмо- рассмотреть случай ^ = 0: А3. <р@)= f h(q)<f(q)dq. Замена <p(q) на <р(—q) показывает, что А(—q) есть, так же как h(q), решение и, следовательно, hl(q) — -?f{h{q)-\-h(—q))—тоже, так что h (q) можно считать четной функцией q.
3) ЭКВИВАЛЕНТНОСТЬ ДВУХ ТЕОРИЙ: ТЕОРИЯ ПРЕОБРАЗОВАНИЯ 27 Ясно, что этим условиям невозможно удовлетворить: если мы выберем 9 (q) > 0 для q ^ О, <р @) = 0, то из А3. следует, что h(q) = O для у§031)' Если же мы выберем ср(^)=1, то получится со f h(q)dq=l, — оо тогда как из предыдущего безусловно следует со f h(q)dq = Q. — оо Несмотря на это, Дирак лицемерно допустил существование функ- функции такого рода: Д4. §(9) = 0 для 9^0, b(q) = b(—q), §b(q)dq=l. Она удовлетворила бы Аз»: f b(q)9(q)dq = <?@) f b(q)dq + f b(q){<f(q)-<f(O))dq = CO —00 —CO oo = cp(O)-l+ J 0.<fy = а следовательно, также А], и Аг. • Мы должны представлять себе эту функцию исчезающей везде, кроме начала координат, и настолько сильно бесконечной в этой точке, что полный интеграл от нее все же оказывается равным единице32). Если уж мы признаем эту фикцию, то можно будет представлять самые разнообразные дифференциальные операторы, как операторы 3|) Точнее, если мы возьмем за основу интеграл в смысле Лебега, то для ?sO должно быть h(q) =¦ О, исключая множество меры нуль, т. е. за исключением этого множества Л(^)==0 тождественно. 32) Площадь под кривой 8 (q) мы должны представлять себе как бес- бесконечно узкий и бесконечно высокий пик в точке ^ = 0, таким образом, что его площадь равна единице, скажем как предельное поведение функции — e~aq при а-> + оо, но это все равно невозможно не в меньшей мере.
28 ВВОДНЫЕ ЗАМЕЧАНИЯ [ГЛ. I интегральные, если в дополнение к Тогда находим, что ввести и ее производные. dqn оо = fb(q~q')q^(q')dq', т. е. что -j-jj и qn имеют интегральные ядра Ь^ (q— q') и b{q— q')qn соответственно. По той же схеме мы можем найти интегральные ядра сколь угодно сложных дифференциальных операторов. При нескольких переменных qv .... qk к цели приводят произведения 8-функций, например: 4'k)dq[...dq'k=, L—со L — оо ... х = ... =?(?1. q 2 qk), и так далее. Так можно навязать интегральное представление /. практически всем операторам.
4] ГИЛЬБЕРТОВО ПРОСТРАНСТВО 29 Коль скоро есть такое представление, аналогия между Е\. и Ез. становится полной, нужно лишь заменить ч, V, 2> х на я» ?;..•••?;; / • • -J • ¦ ¦ ач[ Как векторам xv соответствуют функции <р (<7Р .... qk)< так и матрицам hm< нужно поставить в соответствие интегральные ядра h(ql 4k'> я[> •••• 4k)'> однако еще целесообразней рассматривать эти ядра прямо как матрицы и соответственно считать ^i- • • • • 4k индексами строк, a q'v ..., q'k индексами столбцов, соответствую- соответствующими v и ¦/. Мы тогда имеем, кроме обычных матриц [h^] с ди- дискретными совокупностями столбцов и строк, нумерованными чи- числами 1, 2 еще другие [Л (q1 qk\ q[ q'Jfo (интегральные ядра), для которых каждая совокупность характеризуется й-перемен- ными, непрерывно пробегающими все 2. Эта аналогия может показаться чисто формальной, но в действи- действительности это не так, ибо индексы v и V могут также рассматри- рассматриваться как координаты в пространстве состояний: именно, если понимать их как квантовые числа (в смысле теории Бора: как номера возможных орбит в фазовом пространстве, которые оказываются ди- дискретными вследствие запретов, накладываемых квантовыми условиями). Мы не будем прослеживать далее этот ход мысли, развивая ко- который Дирак и Йордан очертили единую теорию квантовых процес- процессов. «Несобственные» конструкции (такие, как Ь(х), Ь' (х)) играют в нем решающую роль — они лежат за пределами обычно употребляе- употребляемых математических методов, а мы надеемся описать квантовую ме- механику с помощью именно этих последних методов. Поэтому мы перейдем к другому (шредингерову) методу объединения обеих теорий. 4. Эквивалентность двух теорий: Гильбертово пространство Метод, намеченный в I. 3, приводил к аналогии между «дискрет- «дискретным» пространством значений индекса Z = (l, 2, ...) и непрерывным конфигурационным пространством Q механической системы B й-мерио, где k число классических механических степеней свободы системы). Неудивительно, что такая аналогия не могла быть достигнута без некоторого насилия над формализмом и математикой. Пространства Z и 2 в действительности весьма различны и любая попытка соотнести их должна приводить к большим трудностям33). 33) Впрочем, к унификации такого рода задолго до квантовой механики стремился Е. Н. Moore — основоположник так называемого «общего анализа». Ср. статью иа эту тему: Hellinger — Topliz, Math. Enzyklopadie Bd. II 3, 9 Leipzig, 1927.
30 ВВОДНЫЕ ЗАМЕЧАНИЯ [ГЛ. I Однако, что нам в самом деле нужно, это вовсе не соотношение между Z и 2, но только соотношение между функциями в этих двух пространствах, т. е. между последовательностями xv х2 кото- которые суть функции в Z, и волновыми функциями ср(<7г ..., qk), являю- являющимися функциями в Q. Единственно эти функции и представляют собой те объекты, которые входят в постановку квантовой механи- механической задачи. В теории Шредингера важную роль играет интеграл он должен быть равен единице для того, чтобы функции ср можно было дать физическую интерпретацию (ср. 1.2). В матричной теории, напротив (ср. проблему Е\. в 1.3), решающую роль играет вектор xv x2 На этот вектор всегда накладывается условие конеч- конечности суммы 2|xvl2 B ДУхе гильбертовой теории такого рода задач v о собственных значениях (ср. ссылку в прим. 3°) на стр. 25). Обычно даже, чтобы исключить тривиальное решение xv^0, устанавливают нормировку 2 |-*»|2== 1- Это побуждает нас ограничить круг допу- стимых в Z или 2 функций такими, для которых или конечны, поскольку лишь для таких функций V или j ... Г могут v ' s ' быть сделаны равными единице умножением на постоянную, т. е. функции можно нормировать в обычном смысле34). Мы назовем мно- множества таких функций Fz и Fs соответственно. 34) Многократно отмечалось, что в теории Шредингера для волновой функции ? существенно лишь требование конечности интеграла Так что, например, у может быть сингулярна, может обращаться в беско- бесконечность, если только указанный интеграл остается конечным. Поучитель- Поучительным примером такого рода оказывается атом водорода в релятивистской теории Дирака, ср. Dlrac, Proc. Roy. Soc, Lond., 117 A928); и W. Gor- Gordon, Z. Physlk 48 A928).
4) ГИЛЬБЕРТОВО ПРОСТРАНСТВО 31 Далее, выполняется теорема: Fz и Fa изоморфны (Fischer u. F. RieszK5). Точнее это означает следующее: Возможно установить одно- однозначное соответствие между Fz и Fa. т. е. каждой последова- последовательности xv xv ... с конечной Si*,!2 сопоставить функцию v,{qx qk) с конечным J ... j\'f(q1 4k)\ldqx ...dqk и на- 2 оборот, так что соответствие будет линейным и изометрическим. «Линейность» означает: если xv х2, ... соответствует ^(q^ qk) и yv у2, ... соответствует ty(qx qk), то ахх, ах2, ¦ ¦ • и xx-\-yv х2-\-у2, ... соответствуют ay{qx qk) и <pGi 7*) + -\-ty{qv .... qk)\ «изометричность» означает: для соответствующих друг другу хх, х2, • •. и фС^р .... qk) выполняется 2|-*^|2 — v = Г . .. Г |<p(<7i 4k)\2dqx ... dqk (понятие «изометрии» связано s с тем, что принято рассматривать xv х2, ... и <?(qv .... qk) как векторы, a i/ ^ |*v|2 и |/ / • • • Jl'fC^i 4k)?d4x • •. dqk " 2 как соответствующие «длины»). Вдобавок, если дгр дг2- • • • и Уг Уг! • • • отвечают соответственно f(qx qk) и ty(qv ..., qk), то будет даже (и обе части абсолютно сходятся). По поводу этого последнего пункта заметим, что собственно можно было бы желать, чтобы выполнялось или нечто в этом роде, т. е. полной аналогии между суммированием с одной стороны, и интегрированием с другой, однако ближайшее 35) В главе о гильбертовом пространстве мы вернемся к доказательству этой теоремы (ср. II, 2, 3, особенно теорема 5. в II, 2). Заметим, что для многих целей достаточно только части этой теоремы, которая доказывается много проще; именно: изоморфизма между FQ и соответствующей частью F ¦ доказательство этой части восходит к Н I i b e r t'y (GGtt. Nachr., 1906). Так, первоначальное шредингерово доказательство эквивалентности (ср. прим.7) »а стр. 13), тоже основано только на этой части теоремы.
32 ВВОДНЫЕ ЗАМЕЧАНИЯ [ГЛ. I рассмотрение показывает, что сложение 2 и интегрирование V Г ... I ... dqx . . . dqk применяются в квантовой механике всегда только к таким выражениям, как х^у^ или ср^ Чк)$(Я\> • • •¦ ЧиУ Мы не собираемся здесь предпринимать какое-либо исследование того, как это соответствие должно быть установлено, поскольку это все равно будет нашей главной заботой в следующей главе. Но надо подчеркнуть, что означает существование такого соответствия: Z и S весьма различны и установление прямой связи между ними должно приводить к неразрешимым математическим трудностям. С другой стороны Fz и Fs изоморфны, т. е. идентичны по своей внутренней структуре (они реализуют одни и те же абстрактные свойства в раз- различных математических построениях) — и поскольку они (но не сами Z и Q!) суть собственно аналитические субстраты матричной и волно- волновой теорий, то этот изоморфизм значит, что обе теории должны приводить к одним и тем же численным результатам. Поэтому, на- например, изоморфизм сопоставляет матрицу H = //(Q,, ..., Q*. Px, ..., Pk) и оператор Н~н(а а ¦ JLJ- JL. друг другу. Поскольку и та и другой получены с помощью одних и тех же алгебраических операций из матриц Qt, Pt (Z=l, ... k) и функциональных операторов соответственно, то достаточно показать, что qt, ... отвечает матрице Q;, ... и ^7- -J—, ... матрице Pv ... Далее, от матриц Qt, Pl (/=1, ... k) не требовалось ничего, кроме того, чтобы они удовле- удовлетворяли правилам перестановки, упомянутым в I. 2: QmPn~PnQm = = 0 при т ф п h . = -nZTl ПРИ т = п. (т, а—\. 2, ...) Но матрицы, соответствующие (по изоморфизму) qv ••••^7-^" безусловно будут им удовлетворять, поскольку сами функциональные
4] ГИЛЬБЕРТОВО ПРОСТРАНСТВО 33 операторы qv ..., -~-г -к— . • • • обладают этим свойством 36), и свой- свойства эти не теряются при изоморфном переносе на Fz. Поскольку системы Fz и Fq изоморфны, и поскольку квантовые механики, построенные на них, математически равнозначны, то сле- следует ожидать, что единую теорию, не зависимую от случайностей формальной схемы, выбранной в свое время, и представляющую только действительно существенные черты квантовой механики, можно будет построить, лишь если изучить основные внутренние свойства (общие для Fz и Fs), присущие этим системам функций, и взять именно их за исходную точку построения. Система Fz обычно называется «пространством Гильберта». Таким образом, в первую очередь речь пойдет о том, чтобы разыскать те внутренние свойства гильбертова пространства, которые не зависят от специальных свойств его частных воплощений Fz или Fs. Мате- Математический образ, описываемый этими свойствами (и который в кон- конкретных частных случаях можно в целях вычислений с равным пра- правом принимать за Fz или Fq, но для общих целей удобнее рассма- рассматривать непосредственно), будем называть «абстрактным гильбертовым пространством». Итак, мы хотим описать абстрактное гильбертово пространство и затем с полной строгостью доказать следующие положения: /. Что абстрактное гильбертово пространство однозначно характеризуется свойствами, которые будут указаны, т. е. что оно не допускает более существенно различных реализаций. 2. Что его свойства осуществляются как в Fz, так и в Fs. (При этом вещи, обсуждавшиеся в I. 4 лишь качественно, будут строго проанализированы.) Когда это будет сделано, мы применим получаемый таким образом математический аппарат к построению квантовой механики. 36) Мы имеем = 0 при тфп, =*(*,...*,) при т = п, из чего прямо следуют нужные операторные соотношения. 3 И, Нейман
ГЛАВА II ОБЩИЕ СВОЙСТВА АБСТРАКТНОГО ГИЛЬБЕРТОВА ПРОСТРАНСТВА 1. Определение абстрактного пространства Гильберта Нам надо теперь выполнять программу, предложенную в конце 1.4: определить гильбертово пространство, — которое даст нам математи- математическое основание для трактовки квантовой механики, — в терминах исключительно тех понятий, которые впоследствии войдут в саму квантовую механику и которые в силу этого будут иметь равный смысл как в «дискретном» функциональном пространстве Fz после- последовательностей х^ (v=l, 2, ...), так и в «непрерывном» про- пространстве Fs волновых функций 9(<7i. •••. q^) (<7i Як пробе- пробегают все конфигурационное пространство S). Эти понятия, как мы уже однажды указывали, суть следующие: а) Умножение на скаляр, т. е. перемножение (комплексного) числа а и элемента / гильбертова пространства: af. В Fz при этом из х^ получается ах^, а в Fs из <р(<7г .... qk) получается a<?(qv .... qk). C) Сложение и вычитание двух элементов / и g абстракт- абстрактного гильбертова пространства fig. В Fz при этом из xv и yv получается *v ± yv; в Fs из у(дг qk) и ty(qx qk) получается cp(ft qk)±^(qx qk). у) «Внутреннее умножение» двух элементов fug абстракт- абстрактного гильбертова пространства. В отличие от а), C) эта опера- операция приводит к (комплексному) числу, а не к элементу гиль- гильбертова пространства (/, g). В Fz при этом из х^ и ys полу- получается 2-*„У,' а в Fs из cpfaj qk) и ф(?1 qk) получается j ... j tp (qv ..., qk)ty (qx qk)dqx... dqk. ' s (Определения в Fz и в Fa должны быть пополнены необходи- необходимыми доказательствами сходимости. Мы приведем их в II.3).
1] ОПРЕДЕЛЕНИЕ АБСТРАКТНОГО ПРОСТРАНСТВА ГИЛЬБЕРТА 35 Кроме того, в дальнейшем мы будем последовательно обозначать точки абстрактного гильбертова пространства буквами f,g, ..., tp, ф комплексные числа — буквами a, b Jf, у, .... а целые положительные числа — буквами k, I, т, .. ., [i, v, ... Мы будем также в случае необходимости обозначать абстрактное гильбертово пространство символом Шт (как сокращенное обозначение со-мерного евклидова пространства, аналогичное обычному обозначению 0?„ для ««-мерного евклидова пространства» [я=1, 2, ...]). Самое замечательное в операциях а/, / ± g, (/, g) это то, что это как раз основные операции векторного исчисления: те операции, которые делают возможным введение вычисления длин и углов в гео- геометрии Евклида или вычислений, относящихся к силе и работе в механике частиц. Аналогия становится совершенно ясной в случае Fz, если вместо xv х2, ... в 9^ мы рассмотрим обычные точки хх хп из 9?л (для которых ведь операции а), Р), у) могут быть определены так же точно). В частности, для я = 3 мы имеем случай обычного пространства. В некоторых случаях более удобно говорить о комплексе xv .. ., хп не как о точке, но как о векторе, напра- направленном из точки 0 О в точку xv . . ., хп. Итак, для того чтобы определить абстрактное гильбертово про- пространство, мы возьмем за основу фундаментальные векторные опе- операции й/, / i g, (/, g). Как окажется при обсуждении, к которому мы переходим, мы одновременно с 9^ охватим и все 9tn.. Поэтому, пока мы еще не хотим специально различать между ffim и ffin, мы будем пользоваться нейтральным символом 91 как общим обозначе- обозначением пространства. Постулируем прежде всего в 9t характерные векторные свой- свойства 37): A. 9t есть линейное пространство. Это значит: в 9t определены сложение /'-{-g и умножение на «скаляр» а/ (/, g — элементы 9t, a — комплексное число; f i. g и af принадлежат 94), и 9t имеет нулевой элемент О38). 37) Характеристика Ш„ через А., В., С.(п) восходит к Wеу Гю (см. Raum, Zeit, Materle, Berlin A921)). Если мы хотим получить %}т вместо Щп, то естественно CS"^ заменяется на CS°°\ Только в этом случае возникает необходимость в D., Е., ср. обсуждение в тексте ниже. 38) Кроме начала координат или нулевого вектора в 9( есть также число 0, так что один символ употребляется для обозначения двух различ- различных вещей. Однако отношения между ними таковы, что путаницы при этом не возникает.
36 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Таким образом, для этого пространства выполняются известные правила векторной алгебры f-\-g = g-\-f (коммутативность сложения), /г — f _^_ (g _^_ h) (ассоциативность сложения), (дистрибутивность умножения), у у (ab) f = a(bf) (ассоциативность умножения), 0/ = 0, 1/=1 (роль нуля и единицы). Правила вычислений, не указанные здесь, непосредственно сле- следуют из этих постулатов. Например, роль нулевого вектора в сло- сложении: Или однозначная возможность вычитания: определим -/ = (-!)•/; /-* = тогда Или дистрибутивные законы умножения при вычитании a- (—g) = af + a •((—!)¦ «¦) = (« • (-1)) • g = Не стоит, пожалуй, продолжать эти примеры дальше, и так должно быть ясно, что все правила линейного векторного исчисления здесь имеют место. Мы можем, следовательно, как и для векторов, определить, ког- когда известные элементы Д, .,., fk пространства 9? будут линейно независимы. Определение 1. Элементы /х fk линейно независимы, если из a1f1-\- ... -f-aft/A = 0 {av ..., ak — комплексные числа) следует, что ах = а2 = ... = ak = 0. Определим далее аналог линейных объектов векторного исчисле- исчисления (линия, плоскость и т. д., проходящие через начало координат) — линейное многообразие.
1] ОПРЕДЕЛЕНИЕ АБСТРАКТНОГО ПРОСТРАНСТВА ГИЛЬБЕРТА 37 Определение 2. Подмножество Ti пространства 91 назы- называется линейным многообразием, если оно вместе с какими- либо k (k — 1, 2, ...) его элементами fv ..., Д39) со- содержит и их линейные комбинации йг/т —)- ... -\-akfk. Если % есть произвольное подмножество Ш, то множество всех axfx-\- ... -\-akfk (k — l, 2, ...; av .... ak — произвольные комплексные числа; fv ..., fk — произвольные элементы Ж) есть линейное многообразие, которое очевидно содержит ЭД. Ясно, что оно является также подмножеством любого другого линейного многообразия, содержащего ЭД. Оно называется «ли- «линейным многообразием, натянутым на §1» и обозначается сим- символом {Щ. Прежде чем дальше развивать эти представления, сформулируем следующий основной принцип векторного исчисления — существова- существование внутреннего произведения. В. В 9? определено эрмитово внутреннее произведение. Это означает: определено (/, g) (/ и g — элементы О? (/, g) — комплексное число) со следующими свойствами: (/'-f-/", g) = (f, g)-{-(/", g) (дистрибутивность относительно первого множителя), (й • /> g) — a ¦ (/• g) (ассоциативность относительно первого множителя), (/, g) — (g, /) (эрмитова симметрия), (/,/)> 0 и =0 лишь при / = 040) (дефинитность). Соответствующие два закона для второго множителя следуют из законов для первого и свойства эрмитовой симметрии (поменяем / и g и возьмем комплексно-сопряженные с обеих сторон): (/, a-g) = a.(f, g). Это внутреннее произведение очень важно, поскольку оно позво- позволяет ввести определение расстояния. В евклидовом пространстве длина вектора определяется как ||/|| = ]/(/, /L1), а расстояние 39) Достаточно было бы потребовать следующего: если / принадлежит 9SJ1, то и а/ также; если fug принадлежат 331, то f-\-g также. Тогда, если /ь ¦¦¦, fit принадлежат Ш, то в,/,, д2/2, ..., akfk также, и тогда последо- последовательно то же верно для aJl-\-a2f2, ••¦, «i/i-(-«2/2+ ••• +a*/ft- 40) (/, /) — вещественное число вследствие эрмитовой симметрии: дей- действительно, для / = g имеем (/, /) = (/, /). 41) Если / имеет компоненты хи ..., хп, то по замечанию, сделанному в у), II.1 (если мы ограничимся конечным числом компонент) Y{f> f) *" в l/ 2 \хч |2, т. е. II/H есть обычная евклидова длина,
38 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II между двумя точками определяется как ||/ — g\\. Придерживаясь этой аналогии, введем Определение 3. «Длина» элемента / из Ш есть ||/|| = — У(/> /)¦ расстояние между /, g есть ||/ — g\\42). Что это понятие действительно обладает всеми свойствами рас- расстояния, мы сейчас увидим. Докажем для этого следующую Теорему 1. Всегда |(/,?)| =? ||/|| ¦ \\g\\- Доказательство. Напишем сначала И/112+1Ы12- 2 Re(/. g) = (если z*=u-\-iv— комплексное число — и и v вещественны, то Re .г и Imz являются соответственно вещественной и мнимой частями z, т.е. Re.г — и, \mz-v). Если мы заменим / и g на а/ и —g (а вещественно и больше нуля), то левая часть, как легко видеть, не изменится. В правой же мы получим y(«2 ||/||2Ч—г1Ы12г Поскольку это выражение isRe(/, g), то неравенство, в частности, сохраняется и для его минимального значения ||/]| • \\g\\ (это значе- значение достигается для /^фО при а—Л/ jjj и для / = 0 или g — О при «->-)- со или при a->-f-0 соответственно). Следова- Следовательно, Re(/, g)^ H/ll -\\g\\. Если мы заменим здесь / и g на eiaf и g (a вещественно), то пра- правая часть уравнения не изменится (вследствие того, что (а/, й/) = = йй(/, /)=|й2|(/, /), имеем ||й/|| = |а| • ||/|| и, следовательно, при |й| = 1 ||а/1| = II/H). а левая часть перейдет в Re (в" С/. #)) = cosa Re(/. ^) — sin a Im(/, g). Последнее выражение очевидным образом имеет максимум f, g)J+(lm(f, g))*= |(/, g)\, откуда и следует предложение 42) Поскольку </, /) вещественно и |gO, то |/|| веществен, и мы бираем квадратный корень гО. То же еыдолнчется и для ||/ — g\.
1] ОПРЕДЕЛЕНИЕ АБСТРАКТНОГО ПРОСТРАНСТВА ГИЛЬБЕРТА 39 Следствие. Чтобы имело место равенство, /, g должны совпадать с точностью до постоянного (комплексного) множителя. Доказательство. Чтобы имело место равенство в соотношении Re(/, g)^j(\\f\\'2+\\g\\2), необходимо даже, чтобы (f-g, f-g)=0, т. е. должно быть f = g- При переходе от этого соотношения к |(/, g)\^ 11/11 • \\g\\, f и g — заменяются на el'af и —¦ g (а, а вещественны, а > 0), если только ни / ни g не равны нулю. Чтобы в нем сохранялось равенство, нужно, следовательно, чтобы было eiaaf = — g, т. е. g = aVa/ = cf (сфО). Обратно, для / или g, равного нулю, или для g=zcf (с ф 0) явным образом имеет место равенство. Теорема 2. Всегда ||/||2?0 и равенство достигается лишь для / = 0. Выполняется \\а ¦ /|| = \а\ ¦ \\f\\. Всегда будет также ||/ -f-g"|| Si ||/|| -f~ ||g"||. причем равенство достигается лишь для fug, совпадающих с точностью до постоянного вещественного множителя > 0. Доказательство. В правильности двух первых утверждений мы уже убедились выше. Докажем неравенство третьего предложения следующим образом: ) + (/. g) + (g. /) = zz Ц/Ц2+ ||^||2 + 2 Л/К • \\g\\ = = A1/11 + Чтобы достигалось равенство, Re(/, g) должна быть равна 1111 II g" IN Для чег0 необходимо / или g = 0, или g — a2f = cf (с вещественно, > 0) в силу выводов, сделанных при доказательстве предыдущего следствия. Обратно, очевидно, что в этом случае ра- равенство выполнено. Из теоремы 2. немедленно следует, что расстоян е ||/ — g\\ обладает следующими свойствами: Расстояние между / и g есть нуль для / = g и только в этом случае. Расстояние между / и g то же, что и между g и /. Расстояние между / и h меньше или равно сумме расстояний между / и g и между g и h. Равенство достигается только, если g = af-\-(l—a)h (a вещественно, OsgasslL3). 43) По теореме 2. (которую надо применить здесь к / — gag—И) должно быть /—g = 0, т. е. f — g или g — Л=0, т. е. g = h, или же g — h = c{f—g) (с вещественно, > 0), т.е. g = ^-ц-у / + с _i_ I h' иными словами, g=af-\-{\ — a) h с а, равным соответственно 1, 0 или у-ц—. Геометрически это означает, что точка g лежит на отрезке /, h.
40 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Расстояние между af и ag есть умноженное на \а\ расстояние между / и g. Но это как раз те самые свойства расстояния, кото- которые дают возможность свести в геометрии (и топологии) понятия непрерывности, ограниченности, предельной точки и так далее к фунда- фундаментальному понятию расстояния. Мы воспользуемся этим для сле- следующих определений: Функция F (f) в 91 (т. е. функция, определенная для / из 91 и имеющая в качестве своих значений или всегда точки из 9t, или всегда комплексные числа) непрерывна в точке /0 (из Щ, если для каждого s > 0 существует 8 > 0 такое, что из ||/ — /0|| < 8 с необхо- необходимостью следует, что \\F(f) — F (fo)\\ <s или \F(f)— F(fo)\ <e (в зависимости от того, являются ли значения F точками из 9? или комплексными числами). Будем называть эту функцию ограниченной в 9t или в заданном подмножестве 9t, если там всегда \\F(f)\\^C или \F(f)\^gC (С — постоянная, соответствующим образом выбран- выбранная, но фиксированная). Аналогичные определения имеют место для нескольких переменных. Последовательность fv /2, ... сходится к / или имеет предел /, если числа \\fx — /||, ||/2 — /||, ... схо- сходятся к нулю. Точка называется предельной точкой множества Щ. (которое есть подмножество 9?!), если она является пределом после- последовательности из Ш44). В частности, будем называть % замкнутым, если оно содержит все свои предельные точки, и оно называется всюду плотным, если его предельные точки включают все 9t. Мы должны еще доказать, что af, f-\-g, (/, g) непрерывны по всем своим переменным. Поскольку 11«/-«Я1 = М-И/-/1. W+g)-{f'+g')\\ = \\{f-f')+{g-gr)\\ =i \\f-f'\\ + Ik-^'ll. то первые два утверждения очевидны. Далее, из II/-ПК в. \\g-g'\\<s при подстановке /' — / = <р. g' — if —Ф следует, что К/. *)-(/'. g')\ = К/. *) ь g)I При ?->0 это выражение стремится к нулю и может быть сделано меньше любого 8 > 0. 44) Используют также следующее определение предельной точки: для любого ?>0 найдется такое /' из SI, что ||/ — /'|| < е. Эквивалентность обоих определений можно показать дословно так же, как это делается в обычном анализе.
1] ОПРЕДЕЛЕНИЕ АБСТРАКТНОГО ПРОСТРАНСТВА ГИЛЬБЕРТА 41 Свойства А. и В. позволяют нам, как мы видели, сказать об SR довольно много, однако они все же недостаточны, чтобы отличить 5tn друг от друга или от SR^ — ведь о числе измерений пространства до сих пор не было сказано ни слова. Это понятие известным обра- образом связано с максимальным числом линейно независимых векторов. Если такое максимальное число я=1, 2, ... существует, то для этого п мы можем утверждать, что С . Существует точно п линейно-независимых векторов. Это значит, что можно указать п таких векторов, но п-\-\ не существует. Если же не имеется максимального числа, то тогда мы утвер- утверждаем, что С . Существует произвольно много линейно-независимых векторов. Это значит, что для каждого А=1, 2, ... можно указать k таких векторов. Итак, С. не является собственно новым постулатом. Если имеют место А., В., то либо одно из С(л)., либо С!со). также обязательно имеют место. Судя по тому, какое из них мы выберем, мы получим различные пространства SR. Мы увидим, что из С(л). следует, что 9ft обладает всеми свойствами «-мерного (комплексного) евклидова про- пространства. Напротив, постулата С . не хватит, чтобы обеспечить тождество SR с гильбертовым пространством SRoo, нам потребуются для этого еще два постулата D. и Е.. Точнее, дело обстоит сле- следующим образом: мы покажем, что SR с А., В. и С(п). обладает всеми свойствами 3tn и, в частности, свойствами D. и Е., которые будут сейчас сформулированы (и которые, таким образом, следуют из А., В. и Ст.). Далее мы покажем, что Ш с А., В., С(оо)., D., Е. обладает всеми свойствами З^о,, однако в этом случае посту- постулаты D. и Е. существенны (т. е. они не следуют из А., В., С(оо).). Мы перейдем теперь к формулировке D. и Е., а доказательство того, что все Ш„, SRoo обладают такими свойствами, будет несколько отложено (см. II. 3). D. Пространство Ж полно45). Это значит, что если последовательность fv /2, ... в ffi удо- удовлетворяет критерию сходимости Коши (для каждого е > 0 сущест- существует такое N = N(s), что \\fm — /„II <s Для всех т, n^N), то 46) Мы для кратности пользуемся этими топологическими терминами. (Ср. Hausdorff, Mengenlehre, Berlin 1927. Русский перевод; Хаусдорф. Теория множеств, ОНТИ, 1937). Они будут пояснены при дальнейшем изло- изложении,
42 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II она сходится, т. е. обладает пределом / (см. определение этого понятия, данное выше). Е. Пространство Ш сепарабельно45). Это значит, что имеется последовательность fv /2, . .. в Ш, которая всюду плотна в 94. В II. 2 мы, как сказано, построим «геометрию» Ш, исходя из этих основных положений, и покажем ее тождественность с геометрией 9?„ или Sftco соответственно. 2. Геометрия гильбертова пространства Мы начнем с двух определений. Первое из них содержит ровно столько от тригонометрии, сколько нужно для наших целей: понятие о прямом угле -— ортогональность. Определение 4. Два элемента / и g из 94 ортогональны, если (/, g) = 0. Два линейных многообразия Ш и ЭТ ,ортого- ,ортогональны, если каждый элемент из 5ВД ортогонален каждому эле- элементу из Щ. Множество О называется ортонормированной системой, если для всех /, g из О (/• g) = (т. е. каждые два различных элемента ортогональны и каждый элемент по длине равен единице46)). В частности, О будет назы- называться полной, если она не может быть подмножеством какой- либо другой ортонормированной системы, содержащей дополни- дополнительные элементы47). Заметим еще, что утверждение о полноте ортогональной системы О означает, очевидно, что не существует / с |[/|| = 1, который был бы ортогонален ко всей О (ср. прим. 46)). Но будь / просто отличен от нуля и ортогонален ко всей системе О, то /' = —j- ¦ f (ведь ||/|[ > 0) удовлетворяет всем требованиям: [| /' || = j-rj \\f\\ = 1 и /' ортого- ортогонален к О. Следовательно, полнота О требует, чтобы любой /, ортогональный ко всей системе О, исчезал. Второе определение таково, что оно существенно только для 9?а>> поскольку в 9?„ каждое линейное многообразие—такого типа, как то, которое им описывается (ср. конец II. 3). Поэтому мы не можем дать интуитивно-геометрическую картину его смысла. *«) Действительно, ||/|| У(/ /) 47) Как видно, полные ортогональные системы соответствуют декартовым системам координат (т. е. совокупностям единичных векторов, направленных вдоль их осей) в Щ„.
2] ГЕОМЕТРИЯ ГИЛЬБЕРТОВА ПРОСТРАНСТВА 43 Определение 5. Линейное многообразие, которое одно- одновременно замкнуто, назовем замкнутым линейным многообразием. Если Ш. есть некоторое множество из 9t и мы дополним {Ж} (линейное многообразие, натянутое на Ж) всеми его предель- предельными точками, мы получим замкнутое линейное многообразие, содержащее St. При этом оно будет подмножеством каждого другого замкнутого линейного многообразия, тоже содержа- содержащего $48). Мы назовем его замкнутым линейным многообразием, натянутым на 91, и обозначим [ft]. Перейдем теперь к более детальному анализу SR и, в частности, к полным ортогональным системам. К тем теоремам, для которых в дополнение к А., В. потребуются С(л). или С(оо)., D. и Е,, мы будем добавлять соответственно индекс <"' или (°°>. Теоремы общие для обоих случаев оставим по-прежнему без индексов. Теорема 3 • Каждая ортонормированная система имеет </t элементов и будет полной тогда и только тогда, когда она имеет п элементов. Замечание. Из первого утверждения следует, что суще- существует максимальное значение для числа элементов ортогональ- ортогональных систем; те ортогональные системы, для которых достигается это максимальное значение, оказываются, до определению, пол- полными. Итак, в случае С(п). существуют полные ортогональные системы и каждая такая система имеет п элементов. Доказательство. Каждая ортогональная система (если она ко* нечна) линейно-независима. Если ее элементы суть <pv <р2 <рт. то из следует, что а|1 = 0 ({»,= 1, 2, ..., т); в этом можно убедиться, образуя внутреннее произведение с ср^. Следовательно, в силу С . система не может иметь п-{-\ элемент. Произвольная ортогональная система, таким образом, не может иметь подсистем с га-f-l элемен- элементами. Следовательно, она конечна и содержит =1=га элементов. Система из п элементов не допускает расширения и, следова- следовательно, полна. Однако система с т<ге элементами срх срот не полна. Действительно, среди линейных комбинаций a1<fl -f-... -f- #OTcpOT не может быть п > т линейно-независимых. Следовательно, в силу С("\ должен существовать элемент /, отличный от всех й^-)- ... + атут, т. е. такой, для которого <8) Как линейное многообразие, оно должно содержать {Щ и, поскольку оно замкнуто, то и предельные точки {Щ.
44 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II всегда отличен от нуля. Далее, (ф, ср^) = 0 означает, что a^ = (f, cp^) (ji,= l, 2 т). Следовательно, если это условие может одно- одновременно выполняться для всех р,= 1, 2 т, то оно определяет таким образом ф, который показывает, что система <pv ..., cpm не полна. Теорема 3 . Каждая ортонормированная система конечна или есть счетно-бесконечная последовательность; если она полна, то она заведомо бесконечна. Замечание. Значит, мы можем записывать все ортогональ- ортогональные системы в виде (возможно обрывающихся, т. е. конечных) последовательностей срг ср2 что мы действительно и сде- сделаем. Подчеркнем, что теперь число элементов системы только необходимо для ее полноты, но в отличие от случая С . этого условия еще недостаточно49). Доказательство. Пусть О — ортонормированная система, / и g— два различных ее элемента. Тогда Пусть теперь fv /2, ... — существующая согласно Е. последова- последовательность, всюду плотная в 9t. Для каждого / из О существует некоторое fm из последовательности, для которого ||/ — fm\\ < -у )^2. /т и /л> соответствующие fag, должны быть различны, поскольку из /m = /n следовало бы, что II/- ?II = 11 (/ Значит, каждому / из О соответствует fm из последовательности fv /2, ... с различными fm для различных /. Следовательно, О или конечна, или является последовательностью. Как и при доказательстве теоремы 3(га)., показывается, что если в $1 есть > т линейно-независимых элементов, то система срх срт не может быть полной. Однако поскольку в силу С(оо). при любом т в SR имеется больше т линейно-независимых векторов, то полная система должна быть бесконечной. Следующие теоремы в той мере, в какой они говорят о сходи- сходимости, относятся только к С(со)., однако желательно их сформулиро- сформулировать в общей форме, имея в виду другие утверждения, которые в них содержатся. 49) Пусть система <fi. "fa. ¦•• полна. Тогда система <рг> <рз. ¦¦. не полна, хотя она и бесконечна!
ГЕОМЕТРИЯ ГИЛЬБЕРТОВА ПРОСТРАНСТВА 45 Теорема 4. Пусть <pv cp2, ... —ортонормированная система. Тогда все ряды 2 (/> ?„)(?¦ <?-,)• если только они вообще имеют бесконечно много членов, абсолютно сходятся. В частности, для f = g всегда 2 |(/, <p,)|*=s||/||2. 1» Доказательство. Пусть а = (/, ф ), v=l, 2, ... Тогда /—2fl,(Pv==1l' ортогональна ко всем <pv, v—1, 2 N (ср. до- V = I N казательство теоремы 3(п)). Поскольку /=2 flvtPv+4'' то 1 v=l f. f}7r~r. ^i d d (ф , ф ) —1— ^j л (ф, ф ^ —1— /i й (cp > ф^ —j— (ф, ф^~^*~ vTl ' ' v= 1 N т. e. 2 lflvl2= ll/ll2- Если система ср^ ф2- ••• конечна, то прямо v=l следует, что V \п 12^-, II /||2 если же она бесконечна, то при N—>oo мы убеждаемся в абсолютной сходимости 2 lavl2 и в том- что 2 lflv|2^ll/ll2< Тем самым второе V V утверждение доказано. Вследствие того, что |(/, <p,)(g-, ф,)!^-^ {|(/, «pv)|2+|(g-, cpv)|2}. более общее утверждение о сходимости — первое предложение тео- теоремы — следует из уже установленного факта сходимости. Теорема 5. Пусть <fv ср2, ...—бесконечная ортонормиро- 00 ванная система. Тогда ряд 2 -"w^v сходится тогда и только v= I тогда, когда сходится ряд 2 I -^ I2 (члены последнего ряда суть v= 1 вещественные неотрицательные числа и, следовательно, ряд или сходится, или собственно расходится к -(-со). Доказательство. Поскольку высказанное предложение нетри- нетривиально лишь для С(оо)., то мы можем пользоваться D. — критерием оо сходимости Коши. Согласно ему сумма 2 -"-Л сходится, иными сло- v=l
46 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II N вами, последовательность частных сумм 2 хч<?ч сходится при N—>co v=I тогда, когда для любого s > 0 существует некоторое N—N(e) < s. Мы пред- такое, что ПОЛОЖИМ, L ДЛЯ что L 2 = L, М .> М L у х v=l ( \ Ш N будет >yV, тогда ж XI V " v=l *,?,. v=2+ 2 = Xvcpv- i 2 \ M -2 V=I .' <Pv)= х„ г = v=l м Следовательно, Ж Однако это есть в точности условие сходимости Коши для последо- последовательности N->co, т. е. для ряда 2 Следствие. При / = 2 V (/• Ч\)== -^v (независимо от того, является ли ортонормированная система конечной или бес- бесконечной, однако в последнем случае, конечно, предполагается сходимость). Доказательство. При ./V==v имеем JV \ N V 1 V / \ В случае конечной системы срр ср2, .... мы можем положить N равным наибольшему индексу. Для бесконечной системы cpj, cp2, ... можно считать N—>оо, вследствие непрерывности внутреннего произведения. В обоих случаях мы получаем (/, ср^) = л; . Теорема 6. Пусть срр ср2, ... ортонормированная система, а / произвольно. Тогда // = 2-*:vcPvi x^ = (f, cpv)(v=l, 2, ...) V всегда сходится, если ряд бесконечен. Выражение /—/' орто- ортогонально к cpj, cp2, ... Доказательство. Сходимость следует из теорем 4. , 5. ; со- согласно следствию теоремы 5. имеем (/', cpv) = a:v = (/, cpv),
2] ГЕОМЕТРИЯ ГИЛЬБЕРТОВА ПРОСТРАНСТВА 47 После этой подготовки мы можем дать общий, т. е. пригодный даже для С . критерий полноты ортонормированной системы. Теорема 7. Пусть срг, ср2, ...—ортонормированная система. Тогда для полноты системы необходимо и достаточно каждое из следующих условий: л) Растягиваемое срг ср2, ... замкнутое линейное многообра- многообразие [cpj, cp2, .. .] равно SR. Р) Всегда /=2-*7Р„> гДе xv = (f, %) (v=l, 2, .... сумма сходится по теореме 6.). Y) Всегда (/; ?) = 2(/> Ъ)(ё> Tv) (сумма сходится абсо- ¦у лютно по теореме 4.). Доказательство. Если <рр ср2, ... полна, то / — 2-*^ равно V нулю (jcv = (/, срч), v—1, 2, ...), поскольку / ортогонально к tpj, ср2, ... в силу теоремы 6. и тогда Р) удовлетворено. Если Р) выпол- няется, то каждый / есть предел своих частных сумм 2-*\^' ^->о° (если ср,, ср2, . .. в самом деле бесконечна) и, следовательно, прина- принадлежит к [cpj, ср2, ...]. Отсюда [ср[, ср2> . ,.]=JR, т. е. а) удовлетво- удовлетворено. Если л) выполняется, мы можем рассуждать следующим обра- образом: Если / ортогонален ко всем срг ср2 то он также ортого- ортогонален ко всем их линейным комбинациям, и, в силу непрерывности, также ко всем предельным точкам оных, т. е. ко всему [срр ср2, ...]. Следовательно, он ортогонален ко всему $1, а значит, и к себе са- самому: (/, /) = 0, /:=0. И, следовательно, <pi- <p2, ... полна. Итак, мы имеем такую логическую схему: полнота -> р) -> а) -> полнота. Тем самым показано, что я) или Р) действительно необходимые и достаточные условия полноты. Из у) следует, что если / ортогонален ко всем ср5, ср2, .. . и если мы положим f = g, то получим (/, f) = ^0 ¦ 0 = 0, f = 0, тем самым срх, ср2, ... полна. С другой стороны, из Р) (которое ведь теперь эквивалентно полноте) следует / N IV (/¦ g) = Hm f 2J (/, cpv) • cpv, N \ 1 = lim 2 Af-»oo a, v=l N v=I
48 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II (если система ср,, ср2, ... конечна, то в предельном процессе нет необходимости), т. е. f). Итак, у) тоже является необходимым и достаточным условием. Теорема 8. Каждой последовательности fv /2, ... соот- соответствует некая ортонормированная система срх, ср2 на ко- которую натягивается то же самое линейное многообразие, что и на исходную последовательность (обе последовательности могут быть конечны). Доказательство. Сначала заменим fv /2, ... подпоследователь- подпоследовательностью gv g2 которая растягивает то же линейное многообра- многообразие и состоит из линейно-независимых элементов. Это можно сде- сделать так: Пусть g1— первый из элементов /„, отличный от нуля; g2— первый из /„, отличный от всех ujgy, g3— первый из /„, отличный от всех u1g-f-a2§; ... (Если для какого-либо р не суще- существует ни одного /„, отличного от всех alg1-\- ... -\-apgp. мы обрываем систему на gp.) Такие gv g2 . .., обеспечат, очевидно, желаемый результат. Образуем теперь 72 = #2 ~ <#2> <Pl) • «Pi- Ъ = -jj^jj- • Т2. Тз = ?з — («V ?i) • ?i — (gv Ъ) • <р2- Ъ = -jp^ii • Тз- (Это—известный «процесс ортогонализации» Е. Schmidt'a.) Построе- Построение каждого из срр действительно возможно, т. е. все знаменатели UfpH отличны от нуля, ибо, иначе, будь ||fp||—0, gp было бы линейной комбинацией срх Vp-v T- е- линейной комбинацией gt gp-v чт0 противоречит допущенному. Далее ясно, что gp — линейная комбинация ср,, <р2, .... а срр — линейная комбинация g1 gp, следовательно gv g2, ... и cpj, cp2, ... определяют одно и то же линейное многообразие. Наконец, по построению ||<рр||= 1 и для q < р (-(р, ср?) = О, следовательно и (срр> ср?) = 0. Поскольку мы можем поменять р и q местами, то последнее справедливо всегда для р Ф q. Следовательно, cpj, cp2, ... есть ортонормированная система. Теорема 9. Для всякого замкнутого линейного многообра- многообразия Ш найдется ортонормированная система, как раз растяги- растягивающая Ш, как замкнутое линейное многообразие. Доказательство. В случае &п\ эта теорема самоочевидна, ибо если SR удовлетворяет А,, В, и С ',, каждое линейное многообра-
2] ГЕОМЕТРИЯ ГИЛЬБЕРТОВА ПРОСТРАНСТВА 49 зие Tt в 94 удовлетворяет А., В. и С(т>. с некоторым msgra, так что к Tt применимо замечание к теореме 3(я).: существует орто- нормальная система срх срт, полная в Tt, что, вследствие тео- теоремы 7. я), и есть в точности утверждение, которое надо доказать. (Как можно видеть, предпосылка о замкнутом характере Т1 сама по себе не необходима, поскольку она фактически доказывается. Ср. со сказанным перед определением 5.) В случае С . напомним, что, согласно Е., ffi сепарабельно. Мы хотим показать, что то же будет для Tt— что вообще любое под- подмножество SR сепарабельно. С этой целью образуем последователь- последовательность /р /2 всюду плотную в 9? (ср. Е. в II. 1), и для ка- каждого /„ и т=\, 2, ... построим шар $tnm, содержащий все / с ||/ — /„|| < — • Для каждого $лт, содержащего точки из Tt, выберем одну такую точку gnm- Итак, для некоторых п и т такие точки gnm могут быть не определены, но определенные точки gnm образуют последовательность в Tt50). Пусть / — любая точка из Ш и е > 0. Тогда существует некоторое т такое, что — < -j, и неко- некоторый /„ такой, что ||/п — /|| <—• Поскольку $.пт теперь содер- содержит точку из WI (именно /), то gnm определена и ||/„ — gnm\\ <—, 2 значит, ||/ — gnm\\ < ¦— < s. Следовательно, / есть предельная точка определенных выше gnm и, значит, эта последовательность приводит нас к желанному результату. Обозначим через fv /2, ... последовательность из WI, всюду плотную в Tt. Замкнутое линейное многообразие, определяемое ею [fv Л> •••]• содержит все свои предельные точки и, следовательно, все Tt; однако поскольку Tt есть замкнутое линейное многообразие, a /lt /2, ... принадлежат ему, то, следовательно, {/j, /2, ...] есть часть его, следовательно, оно равно Ш. Выберем теперь по тео- теореме 8. ортонормированную систему срх, ср2 Тогда {срх, ср2, ...} = —{fv fi< •••}> и если мы присоединим к обеим сторонам предель- предельные точки, то получим [<pi, cp2, ...] = [/j, /2, ...] = 2Я. В этом и состояло наше утверждение. Надо теперь только положить в теореме 9. Ш — ffi, и мы по- получим по теореме 7. л) полную ортонормированную систему cpj, cp2 Итак: существуют полные ортонормировадные системы. На основании такой системы мы можем теперь показать, что простран- 60) Вспомним, что двойная последовательность gnm (n, т = \, 2, ...) может быть записана и как простая последовательность gn, glit gib g13, #22, g3l, •••• 4 И. Нейман
50 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II ство 3t есть 3tn или SR^ (судя по тому, имеет ли место С(л>. или С(со).), т. е. полностью определить его свойства. Нам осталось только показать, что Ж допускает одно-однознач- одно-однозначное отображение на множество всех {xv ..., хп) или всех [xv х2, ¦¦¦} (\ I-^J2 конечна . v=l / /. Из f*-+{xi> -хг2, •••} следует af*-*\axv ах2, ...}. 2. Из \f**\*vx* ¦¦¦ (следует fJrg^*{x1 + yl, лг2 + У2> Хп Я ИЛИ со следует(/, g) = (в бесконечном случае в 3. надо еще показать наличие абсолютной сходимости). Правило этого сопоставления /•*-*¦ {xj, x2, ...} мы сейчас приведем. Пусть срр ср2, ... — полная ортонормированная система; в слу- случае С . она обрывается на срп, в случае С . она бесконечна (тео- (теоремы З^К и З^К). Положим П ИЛИ оо В силу теоремы 5. этот ряд сходится и в бесконечном случае (поскольку 2 |-*\|2 конечна], т. е. пространства SRn или соответ- соответственно 9^ им полностью исчерпываются. Но в силу теоремы 7. $) л или оо и поскольку 2 |(/> <РЧI2 конечна (теорема 4.), элементы Ж v=l также будут исчерпаны [следует подставить -x:v = (/v, cpv)]. Очевидно, что только один / соответствует каждому {хг, х2, ...}, в то время как обратное следует из следствия теоремы 5. . Утверждения /. и 2. выполнены очевидным образом, а 3. сле- следует из теоремы 7. у). 3. Отступление: Об условиях А. — Е.51) Мы еще должны доказать утверждение 2. из I. 4: что Fz. Fa действительно выполняют условия А. — Е.. При этом достаточно рассмотреть Fs, так как мы уже показали в II. 2, что Ж с А.—Е. по всем своим свойствам идентично с SR^, т. е. с Fz, так что А. — Е. должны выполняться и для Fz. Кроме того, мы докажем 61) Этот раздел не является необходимым для понимания дальнейших частей текста.
3] ОТСТУПЛЕНИЕ: ОБ УСЛОВИЯХ А.,- Е, 51 упомянутую в II. 2 независимость условий D., Е. от А.— С( . и тот факт, что они следуют из А. — С(п)., т. е. что они имеют место в Шп. Эти три чисто математических вопроса составляют содержание этого раздела. Начнем с доказательства выполнения свойств А,—Е. в F$. Для этого нам придется опереться на лебегово понятие интеграла, отно- относительно обоснования которого мы лишь сошлемся на специальную литературу по этому вопросу52). (Интеграл Лебега важен нам только в данном случае, и знакомство с ним не является необходимым для чтения следующих глав.) В I. 4 мы ввели Q как й-мерное пространство элементов qx, ..., qk и Fq как множество всех функций f (с(\, ¦¦•, qk) с конечным /• • • / |/(<7i Як)\2аЯ\ • ¦ • d4k> ПРИ этом все Ч\ Чк могут s меняться от — со до -)-оо. Впрочем, все наши рассуждения оста- останутся справедливыми, и даже вывод будет по большей части дословно тот же, и если бы мы ограничили интервалы изменения qv .... qk (так чтобы 2 было, например, полупространством, внутренностью куба, внутренностью сферы или внешностью этих фигур и т. д.), и даже если бы мы выбрали в качестве 2 искривленную поверхность (как, например, поверхность сферы и т. п.). Но для того, чтобы не потеряться в ненужных усложнениях (их сможет без затруднений рас- рассмотреть читатель по образцу нашего типичного доказательства), мы ограничимся указанным простейшим случаем. Итак, пройдем последо- последовательно А. — Е. одно за другим. Относительно А.. Мы должны показать, что если fag при- принадлежат F, то af, f + g также принадлежат ему. Иными словами, если конечны /I/I2- Q В (мы ввели сокращенное обозначение для )••• I |/(?i. •••. s X^j ••• dqk и J.-.flgiqy gk)\2d4i ••¦ d4k- поскольку это 2 не может привести к путанице], то j|a/|2= |a|2 j |/|2, 52) Например, Caratheodory, Vorlesungen fiber reelle Funktionen, Leipzig, 1927, в особенности стр. 237—274; Kamke, Das Lebesguesche Inte- Integral, Leipzig, 1925. [Из русских руководств по интегралу Лебега можно рекомендовать чи- читателю, например, книгу Натансона, Теория функций вещественной пе- переменной, Гостехиздат, 1950 г., или соответствующую главу в V томе Курса высшей математики В. И. Смирнова, Гостехиздат, 1947 г. (Прим. ред.)]
52 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. И также конечны. Первое утверждение тривиально. Вследствие того, что |/ ± g\2 = |/|2-Ь |gi2 ± 2Яе(/^M3), справедливость второго будет установлена, как только будет показано, что интеграл Г |/ • g\ = Г |/| • \g\ конечен. Однако, поскольку |/| • |^| si 2 2 0/I2I~ \s\2)' T0 последнее следует непосредственно из исход- исходной гипотезы. Относительно В. . Мы определим (/, g) как I fg. Этот инте- 2 грал, как мы только что убедились, сходится абсолютно. Все свой- свойства, постулированные в В., очевидны, кроме последнего: что (/, /) = 0 влечет за собой /==0. Теперь (/, /) = 0 означает, что | |/|2 —0. Следовательно, множество точек, на котором |/|2>0, Q т. е. f(qx, .... дк)ф0, должно иметь лебегову меру нуль. Если мы теперь будем считать две функции / и g\ для которых f4^g [т.е. f (qv ..., Ць) Ф g {Qi Qk)] имеет место только на множестве qx qk лебеговой меры нуль, функциями несущественно различ- различными54), то мы можем сделать тогда вывод, что /==0. Относительно С.. Пусть Ох, .... От — т областей в 2, никакие две из которых не имеют ни одной общей точки, и пусть мера Ле- Лебега каждой из них больше нуля, но конечна. Пусть fi(qv .... qk) есть 1 в О; и нуль повсюду, кроме Ov Поскольку М/г|2 равен 2 мере Ov то /г принадлежит Fs A=1 п). Эти /, /„ ли- линейно независимы. Действительно, alfl-\- ... + anfn==0 означает что функция в левой части не исчезает лишь на множестве меры нуль. Следовательно, она имеет корни в каждой Ot, но поскольку она по- постоянна и равна а, в Ог, то at = 0, 1—1, . . ., п. Поскольку это построение проходит для всех п, то должно иметь место С . Относительно D.. Пусть последовательность /], ..., /„ удо- удовлетворяет критерию сходимости Коши, т. е. для каждого s > 0 су- существует некоторое N — N($), такое, что I \fm — /„ |2 < г при т, n>N. Выберем K1 = /vfyj; n2^nv Ny-^-y, n3>nv n2, 53) Вообще \x + у I2 = (x + у) (х +7) = xx + y~y + {xy + icy) = Это обычное в теории интеграла Лебега определение.
ОТСТУПЛЕНИЕ: ОВ УСЛОВИЯХ Л. - В., 53 "("оз)> ••• Тогда ^ ...; kv> -^]; следовательно, всех I \fn —fn \2<C[—t)- Рассмотрим теперь множество P(v 2 точек, для которых |/„ —/„ | > —г . Если его лебегова мера (v) j равна jj. , то [\fn ~fn?^^(- Рассмотрим также множество Q , возникающее при объединении w __. Вне Qw выполняется Следовательно, вообще для vssv'ssv" |/nv" /nv' = I У/iv' + I / nv' | ~T~ I /nv'+2 //Jv' + l 1 —j— ••• ••• H~|/nv" )Bv"-i I ^ "^/ "t~ gv' + i ' "¦' ' 2V"~ При v'->co эта величина стремится к нулю, независимо от v", т. е. последовательность /„^ /„2> ... удовлетворяет условию сходимости Коши, если qv ..., qk не лежит в Q(v). Поскольку (при фиксирован- фиксированных q1 qk) речь идет о числах, эта последовательность также будет сходиться. Значит, мы можем утверждать обратное: Если по- последовательность /„ , /„ , ... не сходится при каких-либо значениях q1 qk, то они лежат в Qw. Назовем Q множество всех значе- значений qx qk, для которых нет сходимости. Тогда Q есть подмно- подмножество Q(v) и его мера не больше, чем мера Q(v), т. е. < v_, . Это справедливо для любых v, так как Q определено независимо от v. Следовательно, Q имеет меру Лебега 0. Поэтому ничего не случится, если, например, положить все /„ в Q равными нулю (ср. прим. 54) на стр. 52). Но тогда /„ , /„ , ... будет сходиться и в Q, т. е. везде.
54 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Таким образом, мы описали подпоследовательность /„ , /„2, ... последовательности fv /2 сходящуюся в каждой точке qx qk (нет необходимости, чтобы это было верно для всей /,, /2, ...)• Пусть предел /„ , fn2, ... есть f = f(qv ..., qk). Мы должны, стало быть, показать, что: 1. / принадлежит Fe, т. е. Г|/р конечен. Q 2. / есть предел /л > /и . •• • не только в смысле сходимости при каждом qv .... qk, но также и в смысле «сходимости по длине» в пространстве Гильберта, т. е. |/ — /„ |->0 или Г|/ — /„ |2->0. 3. В последнем смысле / — это даже предел всей последовательности /,. Л т.е. ||/-/„||->0. или J|/_/n|2_>0. Выберем s>0 и v0 такое, что n4^,N(e) (например, т и v^v0, n^N(s). Тогда \\fn —fn f < e. Если мы устремим s теперь v->co, то подинтегральное выражение будет стремиться к | / — /„ р, следовательно (в соответствии с теоремой сходимости интеграла Лебега, ср. прим. 52) на стр. 51), Г|/ — /n|2g|e. Соот- е ветственно, во-первых, интеграл I |/ — /„|2 будет конечен, т. е. s f — /„ будет принадлежать F2; а так как /л принадлежит Fs, то и / будет принадлежать Fq также; таким образом 1. доказано. Во-вторых, из полученного неравенства следует, что Г |/ — /п|2->0 е при п—*-со и, значит, 2. и 3. доказаны тоже. Относительно Е.. Мы должны посмотреть последовательность функций /,, /2 всюду вплотную в Fq, Пусть 2р 22, ...—последовательность областей в 2, покрываю- покрывающих всю 2, каждая из которых имеет конечную меру. (Пусть, на- например, 2дг есть шар радиуса ./V с центром в начале координат.) Пусть f = f(qi> •••. qk) — некоторый элемент Fq. Определим fN = = fN(q1 qk) для каждого N—\, 2, ...: если qx qk лежит в Г 4J /7.1. \ /n (9v О во всех других случаях.
3] ОТСТУПЛЕНИЕ: ОБ УСЛОВИЯХ А. - Е. 00 При Л/->оо, fN(qx 4k)~>fDv •••¦ <7*) (начиная с некоторого N достигается даже равенство), следовательно, |/ — fN\2->0. Далее, / — /дг равняется 0 или /, и поэтому |/ — fN\2^\f\2. Следова- Следовательно, интегралы Г|/ — fN\2 мажорируются (конечным!) интегра- й лом Г|/р не зависящим от п. Поскольку подынтегральные выраже- 2 ния стремятся к нулю, то же верно относительно интегралов (ср. цитированную выше теорему сходимости): 11/—fN\2->0, ||/—fN\\->0. Q Назовем классом G класс всех функций g* = ^C^i¦ ¦¦•> Qk)< для которых множество всех точек, где g=h®, имеет конечную меру и которые удовлетворяют во всем пространстве неравенству \g\^C с произвольным, но фиксированным С. Все определенные выше fN принадлежат G. Следовательно, G всюду плотен в Fq. Пусть g принадлежит G и е > 0. Пусть мера множества, где g Ф 0, есть М, а верхняя граница |^| есть С. Выберем цепочку рациональных чисел — С < р1 < р2 < ... < pt < С таким образом, чтобы было р! < — С + г, р2 < p,-fs Pt< P,_i + s, С < р, + е, что легко может быть сделано. Заменим теперь каждое значение Reg(qt qk) на ближайшее ps(s=l, 2 t), оставляя лишь нуль по-прежнему нулем. Тогда мы подучим некую новую функцию h1(q1 qk), которая повсюду отличается от Reg меньше чем на г. Точно так построим /г2 (qv ..., qk) для Im g. Тогда для h = hx-\-ih2 имеем / — /г, |2_f Если дано 3 > 0, то положим е < , и тогда \\g — h\\ < 8. у 2М Назовем классом Н класс всех функций h = h{qv . . ., qk), ко- которые принимают только конечное число различных значений, — именно лишь значения вида p-f-/o, где р и а — рациональные числа,— и каждое такое значение, кроме нуля, лишь на множестве конечной меры. Построенные выше h принадлежат классу Н и, следовательно, Н всюду плотен в О, а следовательно также и в Fq. Пусть П — множество с конечной мерой Лебега. Определим функ цию fn — fn(qi qk)- 1 в П, о всюду1 Кр0Ме п.
56 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Класс Я, очевидно, состоит из всех 2 (ps + '°j)/n (t=l, 2, ...; ps, as рациональны). Найдем теперь последовательность П-множеств ПA), ПB), ... со следующим свойством: Для каждого П-множества и для каждого е > 0 существует П(п) такое, что мера множества всех точек, при- принадлежащих П, но не П(л), или принадлежащих П(п), но не П (такое множество называют разностью множеств П и П(л>), меньше е. Если мы имеем такую последовательность, то совокупность элементов вида (t=l, 2 р^ и as рациональны, ns=l, 2, ...) всюду плотна в И: Действительно, если мы выберем для каждого П4 свое IP •" соответственно предыдущему рассуждению, то f t t i=l 2 ^ 2 / I (P. + 4) /n, - (P. + 4) / («,) P = S=\ 2 t — 2] (P t • (мера разности множеств П^ и n("^)) < 2 (Р^+ а.) Если задано некоторое S > 0, то уже S2 5=1 дает нам Но элементы j(ps-\-ias)f (n\ образуют последовательность, если 5=1 ГГ *' мы их соответствующим образом упорядочим. Это можно сделать
3] ОТСТУПЛЕНИЕ: ОБ УСЛОВИЯХ Л. - В. 57 следующим образом. Обозначая общий знаменатель всех р,, о,, ... ..., pt, at через т, а новые числители через p'v о|, ..., р'г а'(> по- получим где t, t=l. 2, ...; p's, с»; = 0, ±1, ±2 Д,= 1. 2, ... для s=l, 2, .... ?. Задача упорядочения этих функций в последова- последовательность сводится к упорядочению их целочисленных номеров t, т, р|, Oj p't, a', nl пг Среди этих комплексов чисел сгруппи- сгруппируем вместе те, для которых положительное целое имеет одно значение. Затем расставим эти группы в порядке возра- возрастания значения индекса группы /. Каждая из этих групп (с фиксиро- фиксированным /) состоит, очевидно, из конечного числа рассматриваемых комплексов. Если мы теперь расставим элементы в каждой из этих конечных совокупностей каким-либо образом, то мы в самом деле получим простую последовательность всех указанных комплексов. Чтобы иметь возможность описать введенную последовательность множеств ПA), ПB), ..., воспользуемся тем, что для каждого мно- множества П с конечной мерой Лебега М и для каждого 8 > О суще- существует открытое точечное множество IF, покрывающее П, но мера которого превосходит М на величину < 8 (см. литературу, указан- указанную в прим. 52) на стр. 51, а также 45) на стр. 41, где определяется понятие «открытого точечного множества»). Но для каждого откры- открытого IF и 8 > 0, очевидно, существует множество П", состоящее из конечного числа кубов, содержащееся в IF, и мера которого отличается от меры IF на величину < 8. Ясно, что все длины ребер этих кубов и все координаты их центров могут быть выбраны рацио- рациональными. Теперь легко видеть, что разностное множество П и П", определенное выше, имеет меру <8-j-8 = 28 и, следовательно, для 8 < у меру < г. Поэтому мы достигнем цели, если сумеем упорядо- упорядочить в последовательность совокупности описанных выше кубов. Эти совокупности кубов характеризуются числом кубов п— = 1. 2, ..., длиной ребер куба x<v> и координатами центральных точек ?<" Sj>> (v=l, 2 п). Числа х«, ?('>, .... ??> рациональны. Пусть их общий знаменатель (для всех v=l, 2, ..., п) есть tj = = 1, 2 а их числители суть Х/М—1 о • E/(v) f'(v) = 0 +1 +2
58 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Следовательно, совокупности кубов характеризуются комплексами чисел п т) х'A) ?'A). ., ?'A) x'(n), %'w ?'(п) Если мы расставим их в порядке возрастания сумм -... ч- р'О) + ¦•• то мы получим простую последовательность, в точности так, как в предыдущем случае линейных комбинаций функций. Прежде чем продолжать, ответим на следующий вопрос: Дано Ш, удовлетворяющее А. — Е. (с С(оо)); в каких подмножествах Ш из 9t А. — Е. снова удовлетворяются (с теми же определениями a/, fig и (/. g))? Чтобы выполнялось А., %Л должно быть линейным многообра- многообразием. В. справедливо само по себе. Отложим на время С.: во всяком случае или С ., или С . имеют место. D. означает: если последо- последовательность в Ш удовлетворяет критерию сходимости Коши, то она имеет предел в Ш.. Поскольку эта последовательность во всяком случае имеет свой предел в 9t, то D. означает просто, что этот предел должен принадлежать Ш. Это значит, что Ш должно быть замкнутым. Условие Е., как мы убедились при доказательстве тео- теоремы 9., выполняется всегда. Следовательно, мы можем суммировать результат: Ш должно быть замкнутым линейным многообразием. Обратимся к ортонормированной системе, растягивающей Ш (тео- (теорема 9.), <pj, cp2, ... Если она бесконечна, то, очевидно, имеет место С;оо). и Ш изоморфно Ш.^, т. е. самому Ш; если она заканчивается некоторым ср„, то имеет место (например, как следствие теоремы 3(п).) С(п\, т. е. У1 изоморфно Шп. Но поскольку D. и Е. имеют место в Ш во всяком случае, значит они справедливы в каждом 9tn. Значит, они также следуют из А,—С .. Как видно, мы избежали прямой проверки выполнения свойств А.—Е. (с С(п). или С(оо)) в SRn или SROT за счет искусственных логических доводов. Однако и непосредственное установление этих свойств не представляет существенных затруднений. Предоставим это доказа- доказательство читателю. Остается еще показать, что D. и Е. независимы от А. — С(со).. Как мы только что видели, любое линейное многообразие в ffi^ удо- удовлетворяет А., В., Е. и С|п). или С(со).; но если оно не замкнуто, то D. не выполняется. В этом случае в нем должно иметь место С(со)., поскольку из С1"', прямо следует D.. Нетрудно теперь привести при-
3] ОТСТУПЛЕНИЕ: ОБ УСЛОВИЯХ А. - Е, 59 мер такого незамкнутого линейного множества. Пусть cpj, cp2. ... есть N ортонормированная система, тогда элементы 2 *v?v (N=l. 2, ...; I 2 х,, .... xN произвольны) образуют линейное многообразие, однако СО / СО \ незамкнутое, потому что \, — cpv |^Л~) конечна! I является пре- v=l " V 1 / дельной точкой, но не элементом множества N со 4=1 V=I / Следовательно, D. не зависит от А. — С(оо). и Е.. Рассмотрим далее все комплексные функции х(а) с непрерывным параметром а: —oo<a<-f-co. Кроме того, предположим, что х(а)ф6 возможно записать в виде последовательности такой, что сумма 2 Iх (а) |2' распространенная по членам этой последователь- ности, будет конечной55). Все функции х (а) образуют простран- пространство SftCont- Поскольку для любых двух функций х(а), у (а) этого пространства х(а) или у(а)Ф0 только для двух а-последовательно- стей и поскольку мы можем объединить эти две последовательности в одну, то x(a) = y(a) = 0 везде, кроме некоторой а-последова- тельности ocj, a2, ... Следовательно, мы должны обсудить только значения хп = х (а„), уп = у (а„) для всех п — 1, 2, ... Поэтому, пока мы рассматриваем только две точки Sftcont> все будет происхо- происходить так же, как и в Sftoo. Но значит А. и В., выполняются в 9?Cont в точности так же, как и в 9ioo 56). То же будет справедливо и для k(k= 1, 2, . ..) точек SRCont. поэтому С(оо). также имеет место в iRcont- Более того, все остается верным даже для последовательности точек 9tcont • Рассмотрим х1 (а), х2 (а) причем а, для которых хп (а) Ф О, образуют последовательность для каждого п— 1, 2, .. .: а'"', а2"', ... Эти последовательности образуют все вместе двойную последова- последовательность a.W (п, /и=1, 2, ...), которая может быть записана как простая последовательность a'1', a2'), afK а^К а22', а<3', ... Следова- Следовательно, и D. выполняется в Sftcont так же, как и в Ш^. Иначе обстоит дело с Е.. В этом случае играют роль все точки (ведь все они должны быть предельными точками соответствующих последователь- последовательностей), и поэтому мы не можем делать заключение о Sftcont на 65) Хотя а и меняется непрерывно, это будет сумма, а не интеграл, поскольку ведь в сумме фигурирует только некоторая последовательность этих а! 69J Естественным образом мы определяем (х (а), у (а)) как 2 х (а) У (а)
60 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II основании 9too. И это условие действительно не выполняется, потому что не будет справедливым одно из его следствий: существует орто- нормальная система, которая не может быть записана как последова- последовательность (вопреки теореме 3 .). Пусть {1 для а = ( 0дляа=Н для каждого р х^(а) будет элементом Sftcont. и х^(а) образуют орто- нормированную систему. Но в виде последовательности их можно было бы записать, только если бы это было возможно для всех -f-co>p> —со, между тем хорошо известно, что это невозмож- невозможно 57). Следовательно, Е. также независимо от А. — С.^К D.. (В заключение следует отметить фундаментальную разницу между пространством функций / (х) с конечным интегралом I | / (х) р dx — со и пространством функций х (а) с конечной суммой 21x (а) |2> Мы а могли бы, конечно, с равным правом называть первое пространством СО всех х (а) с конечным I da \ х (а) р ! Вся разница — это только замена — со ... da на 2и . .., и, несмотря на это, первое пространство есть I а Fq, оно удовлетворяет, следовательно, условиям А. — Е., и изоморфно пространству 9too. в то время как второе —9tcont нарушает усло- условие Е. и отличается от 9^ существенным образом. И тем не менее оба пространства тождественны и отличаются только определением длины !) 4. Замкнутые линейные многообразия Важность § II. 2 для нас определяется не только доказательством изоморфизма, но также и тем, что там были доказаны теоремы об ортонормированных системах. Мы хотим теперь продвинуться дальше в рассмотрении геометрических свойств пространства Гильберта и детально изучить замкнутые линейные многообразия, которые играют в Э1оэ роль, аналогичную роли прямых линий, плоскостей и т. д. (иными словами, Шт, т^п) в ffin. Напомним прежде обозначения, введенные в определениях 2. и 5.: если 31 есть какое-либо множество в 9t, то {Щ или [Щ суть Б?) Эта теорема теории множеств о «иеперечислимости континуума». Смотри, например, книгу Хаусдорфа, указанную в прим. 45), стр. 41).
4] ЗАМКНУТЫЕ ЛИНЕЙНЫЕ МНОГООБРАЗИЯ 61 линейное многообразие или замкнутое линейное многообразие соот- соответственно растягиваемое ft, иными словами, наименьший представитель каждого из двух типов многообразий, содержащий ЭД, Расширим теперь эти обозначения в том смысле, что если ЭД, 23, ... — какие- либо подмножества SR, а /, g, ... — элементы из SR, то мы будем понимать под Щ, 23 /,§¦,..,] или [Ж, 23 />?".•••] ли- линейное многообразие или замкнутое линейное многообразие соответ- соответственно, натянутое на множество, получающееся соединением ?(, 23, ... и /. g- ¦¦¦ Если, в частности, ЭЙ, Ш, ... суть замкнутые линейные много- многообразия (в конечном или бесконечном числе), то мы будем обозначать замкнутое линейное многообразие [Эй, %1, . ..] символом Эй -\-%1 + ... Линейное многообразие {Эй, %1, ...} состоит, очевидно, из всех сумм / + §"+..¦ '(/ — пробегает Эй, g пробегает 3t, . ..), в то время как замкнутое многообразие [Эй, Ш, .. .] — ЯЯ-\-%1 -(-... получается из незамкнутого присоединением всех его предельных точек. Если мы имеем лишь конечное число множеств Эй, 9?, . . . и каждый элемент одного из них ортогонален всем элементам других, то, как мы уви- увидим, эти два образования равны одно другому. В общем случае они совпадают не обязательно. Если "Эй есть подмножество 01, то рассмотрим еще совокупность всех элементов Ш, ортогональных ко всем элементам Эй. Они тоже составляют замкнутое линейное многообразие, которое может быть названо Ш — Т1. Теорема /4. объясняет причину такого обозначения в виде вычитания. Особый интерес представляет собою множество Ш — W всех /, ортогональных ко всему Tt. Оно называется замкну- замкнутым линейным многообразием, дополнительным к Т1. Наконец, упомянем три особенно простых замкнутых линейных многообразия: во-первых, само SR; во-вторых, множество {0} = [0], состоящее лишь из нулевого элемента, и, наконец, множество всех af (/ — заданный элемент из Ш, а а — переменная), которое, очевидно, представляет собой замкнутое линейное многообразие и, следова- следовательно, одновременно равно {/} = [/]. Введем теперь понятие «проектирования», совершенно аналогичное этому понятию в евклидовой геометрии. Теорема 10. Пусть 5Ш есть замкнутое линейное многообра- многообразие. Тогда каждый /; может быть разделен одним и только одним способом на две компоненты / = g" + A, g из Tt и h из m — Tt, Замечание. Назовем g проекцией / на ЭЙ, h (которое ортогонально ко всему Эй) нормальной к Эй составляющей /. Для g введем обозначение g=*Pmf- Доказательство. Пусть tpi> cp2> • • • —ортонормированная система, существующая в силу теоремы 9., растягивающая замкнутое линейное
62 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II многообразие Т1. Запишем g в виде ряда g" = 2 (/• 9п) Тя- п рый, по теореме 6., сходится (если он вообще бесконечен); его сумма g очевидно принадлежит к 2Я. Далее, по теореме 6., h — f—g ортогональна ко всем ' cpt, cp2, ..., но поскольку векторы, ортого- ортогональные к h, образуют замкнутое линейное многообразие, то вместе с cpj, <f2. • • • все Ш тоже ортогонально h, т. е. h принадлежит к 91 —№. Если бы существовало еще одно такое разложение f = g'-\-h', g' из ?й, ti из SR—Ш, тобыпобы g-\-h = g'-\-h', g—g' = h—h'=j. Вектор у должен был бы одновременно принадлежать к Ж и к Ш—Tt и был бы, следовательно, ортогонален сам себе. Следовательно, (у, у) = 0, у = 0 и, значит, g — g', h — h'. Операция Рщ/ есть, следовательно, такая, которая сопоставляет каждому / из SR его проекцию в Т1, Рщ/. В следующем разделе мы определим понятия оператора. Оператор R есть функция, определен- определенная на подмножестве из Ш. со значениями из Ш., т. е. соответствие, которое сопоставляет определенному / из Ш определенный Rf из SR (Не обязательно каждому /. Для некоторых / из Ш операция может быть не определена, т. е. «бессмысленна»!). Рщ есть, таким образом, оператор, определенный повсюду в 31 и называемый оператором проектирования в Ш. Теорема 11. Оператор Рщ обладает следующими свойствами: Рш (a\f\ + ¦ • • + anfn) — a\P>mfi + • • • + anP.mfn- 5Ш — это множество всех значений Р»д, т. е. множество всех Ра;/; но оно может быть так же охарактеризовано, как мно- множество всех решений уравнения Рщ} — /, в то время как SR — Ш—это множество всех решений уравнения РЭ!/ = 0. Замечание. В следующих разделах мы увидим, что первое свойство определяет так называемые линейные операторы, а вто- второе— так называемые эрмитовы операторы. Третье выражает то, что двукратное применение оператора Р$ц приводит к тому же, что и однократное. Обычная символическая запись этого есть Р>шРт = Рщ или РШ = РШ. Доказательство. Из того, что Л = tfi + Ai. ••¦• /п = ёп + К (gi gn из ЗЯ, hv .... hn из SR — 2И) следует, что ¦ • + angn)+{axhx + . .. + anhn) 2R. o,A,4- ... +a9hn из Ж — 2R),
4] ЗАМКНУТЫЕ ЛИНЕЙНЫЕ МНОГООБРАЗИЯ 63 Таким образом, и первое утверждение доказано. Для доказательства второго утверждения положим g^g"-\-h" (g', g" из Ш, А', А" из SR — Ж). Поскольку тогда g', g" ортогональны к А', А", то, следовательно, (*'. g) = (g'. g" + A") = (?'. g") = (*' + A', g") = (/, g"). т. e. (Рда/, g") = (/, Pang1) и второе утверждение доказано. Наконец, Ад/ принадлежит к Tt, и, следовательно, Ад/— Рда/-|-О есть разложение Рда/ на компоненты, существующее в силу тео- теоремы 10., т. е. Am (Ash/) = Аэд/. Это третье утверждение теоремы. Формула Ай/ = / или 0 означает, что в разложении f = g-\-h, g— из Tt, A — из Ш — Т1 (теорема 10.) или f — g, /г = 0, или g-=0, f = h; т. е. что / принадлежит Т1 или SR — Т1. Это пятое и шестое утверждения теоремы. Все Рщ/ принадлежат к Ж по определе- определению, и каждое /' из Tt равно какому-либо Ащ/: например, по только что сказанному, оно равно Рзд/'. Это четвертое утверждение теоремы. Заметим еще, что из второго и третьего утверждений следует, что (/V, Мы хотим определить теперь проекционные операторы незави- независимо от Ш. Теорема 12. Оператор Е, определенный повсюду (ср. обсу- обсуждение, предшествующее теореме П.), есть проекционный опе- оператор, т. е. Е — Рт для некоторого замкнутого линейного многообразия Ш, если и только если он обладает следующими свойствами: (Я/. *) = (/• Eg), ?» = ?. (См. замечание к теореме 11.) В этом случае Зй однозначно определяется по Е (согласно теореме П.). Доказательство. Необходимость указанных условий, так же как и то, что Ш определяется оператором Е, следует из теоремы П.. Мы должны, следовательно, лишь показать, что, если Е обладает такими свойствами, то существует замкнутое линейное многообразие Ш с Е = РЛ. Пусть ЗМ есть замкнутое линейное многообразие, натянутое на все Ef. Тогда g — Eg ортогонален ко всем Ef: (Ef, g- Eg) = (Ef, g) - (Ef, Eg) = (Ef, g) - (?2/, g) = 0.
64 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА . ПРОСТРАНСТВА [ГЛ. II Множество элементов из 9t, ортогональных к g — Eg, образует замкнутое линейное многообразие; следовательно, вместе с Ef оно включает в себя Ш, и, значит, g — Eg принадлежит к Ж — Ш. Разло- Разложение g по отношению к 1 в смысле теоремы 10. есть, следова- следовательно, g~Eg-\-(g — Eg), и, значит, Pmg — Eg для произволь- произвольного g. Таким образом, вся теорема доказана. Если 2)J = 9t или = [0], то Ш—ЗЭТ = [0] или 9t соответственно, значит, разложение по теореме 11. есть / = /-|-0 или =0-}-/, отсюда Pmf = / или равно 0 соответственно. Мы назовем единич- единичным, 1, оператор, определенный (повсюду!) как Rf — f, и нулевым, 0, оператор, определенный как Rf = 0, т. e. Pffl=l, P[Oj = 0. Далее очевидно, что разложение f — g-{-h{g из Tl, h из Ш — Tt) по отношению к Ш может также употребляться по отношению к 81—2R в форме f = h-\-g (h из «R — Ж, g из Tt). (Ибо, если g принадлежит Ш, то он ортогонален каждому элементу 91—Ш и, следовательно, принадлежит к 91—C1—Tt).) Итак, Pmf — g, Ря-зк/ = = h = f — g, т. е. Р<ц-щ/ = / — Ащ/. Это обстоятельство Р>я-т/ = = 1 / — Раи/ мы выразим символически в виде Р!Л_шг=1—Рш. (О сложении, вычитании и умножении операторов см. теорему 14. .) Нужно заметить еще следующее: Мы уже обнаружили без труда, что Т1 есть подмножество от 9t — (SR — Ш). Непосредственно показы- показывать, что оба множества совпадают, было бы кропотливо. Однако это немедленно следует из того, что Рй-(Я-шу = 1 — Рш-т = 1 — A — Рая) = Рт- Более того, из предыдущего замечания следует, что если Е—проек- Е—проекционный оператор, то и 1 —Е тоже, и, поскольку 1 —A —Е) = Е, то и обратное заключение верно. Теорема 13. Всегда \\Ef\\* = (Ef, /), ||?/|| =§ ||/||, ||??/||=0 или =|[/|| характеризует / из 9t—Ш и из Tt соответственно. Замечание. В частности, отсюда следует, что \\Ef-Eg\\ = \\E(f-g)\\^\\f-g\\, т. е., что оператор Е непрерывен (ср. дискуссию после тео- теоремы 2. в II. 1). Доказательство. Мы имеем (ср. дискуссию после теоремы 11.) Поскольку 1 —Е также проекционный оператор, то Поскольку оба слагаемых (слева) igO, они также оба s;||/||2 и,
4] ЗАМКНУТЫЕ ЛИНЕЙНЫЕ МНОГООБРАЗИЯ 65 в частности, ||?/||2=э ||/||2, ||?/||^||/||. То, что ||?/|| =0, ?/ = 0. выражает тот факт, что / принадлежит к Ш—Ш, нам известно из теоремы 11. вследствие вышеприведенного ||?/|| — ||/|| означает, что |[/ — ?/||=0, ?/ = /; итак, по теореме 11. f принад- принадлежит к Ш. Если R n S — два оператора, то мы понимаем под R + S, aR (а— комплексное число), RS операторы, определяемые соотноше- соотношениями (R±S)f = Rf± Sf, (aR) / = я • Я/, (RS) / = Я (Sf), и пользуемся также следующим естественным обозначением: Я°=1, Rl = R, R2 = RR, R3 = RRR,... Правила исчисления, справедливые в этом случае, довольно просты и естественны. Для R ± S, aR легко показать справедли- справедливость всех элементарных законов счета, справедливых для чисел, но это не так для RS. Легко показать, что выполняется дистрибутив- дистрибутивный закон (R±S)T — RT±ST и R(S±T) = RS±RT (для по- последнего необходима, конечно, линейность Я; см. замечание к тео- теореме 11. и обсуждение в следующем параграфе). Ассоциативный закон также имеет место: (RS) Т — R (ST) — RST, но коммутатив- коммутативный закон RS — SR, вообще говоря, не справедлив ((RS)f — R(Sf) и (SR)f = S(Rf) не обязаны быть равными друг другу!). Если этот закон выполняется для двух частных R и 5, говорят, что они ком- коммутируют. Так, например, 0 и 1 коммутируют со всеми R, опреде- определенными повсюду: Также коммутируют Rm и R", поскольку RmRn = Rm+n и, следова- следовательно, не зависит от порядка т, п. Теорема 14. Пусть Е и F — проекционные операторы замкнутых линейных многообразий ЗХ и 31. Тогда EF будет также проекционным оператором тогда и только тогда, когда Е и F коммутируют, т. е. если EF = FE. Притом EF отно- относится к замкнутому линейному множеству ^, которое состоит из элементов, общих множествам Ш и %1. Оператор E-\-F будет проекционным тогда и только тогда, когда EF — 0 (или, что то же, FE=0). Это означает, что все Ж ортогонально ко всему %l, E-\-F тогда относится к 37? —(— !У? == [2R, Щ], которое в данном случае = [ffi, Щ. Оператор Е—F является проекционным тогда и только тогда, когда EF = F (или, что то же, FE = F). Это означает, что %1 есть подмно- подмножество Ш, и Е—F относится к Ш—%1. Доказательство. Надо проверить, выполняются ли для EF два условия теоремы, 12.: (EFf, g) = (f, EFg) и (EFf = EF. 5 И. Нейман
66 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Поскольку (EFf, g) — (Ff, Eg) = (J, FEg), то первое условие означает, что (/. EFg) = (/, FEg), (f, (FE ~EF)g) = 0. Поскольку это выполнено для любых /, то (EF — FE) g = 0, и поскольку последнее выполняется для любых g, то EF — FE = 0; EF — FE. Итак, коммутативность необходима и достаточна уже для выполнения первого условия, однако и выполнение второго сле- следует из нее: (EFf = EFEF = EEFF = E*F2 = EF. Так как E-\-F удовлетворяет первому условию ((Е-{- F) f, g) — — (/» (E-\-F)g) всегда (поскольку ему удовлетворяют Е, F), нам остается доказать только второе. Так как (?+ FJ = E2-\-F'i-{-EF-\-FE = (Е~\- F) + (EF~-\- FE), то остается показать, что EF-\- FE = 0. Далее при EF = 0, EF есть проекционный оператор и, так как по доказанному тогда EF=FE, то EF-{-FE—0. Обратно, из EF-\-FE — 0 следует, что E(EF-\- FE)E = E2FE-{-EFE2 = EFE~{-EFE = 2 • EFE=0, следовательно, EFE=0, и, следовательно, FE — 0. Таким образом, условие EF = 0 необходимо и достаточно или, так как Е и F играют одну и ту же роль, FE = 0—также необходимое и доста- достаточное условие. Е—F есть проекционный оператор тогда и только тогда, когда 1—(Е — /?) = A—Е)-\-F является тоже проекцион- проекционным оператором, и поскольку 1—Е и F являются таковыми, то в силу доказанного A—E)F — Q, или F — EF = 0, EF — F есть условие того, что 1—(Е — F), а значит Е—F есть проекционный оператор (равным образом F(l— ?) = 0, F — FE — 0, FE—F. Нам еще осталось доказать утверждения относительно Ш, Ш (Е = Рщ, F = Рш). Положим сперва EF = FE. Тогда каждый EFf—FEf принадлежит и к Tt и к Ш, а следовательно к Щ, и для каждого g из *Р Eg — Fg = g, следовательно EFg =Eg = g, т. е. каждый элемент ^ представим в виде EFf. Соответственно ^ есть множество значений EF и, значит, по теореме 11. EF = P^. Затем положим EF = Q (значит, FE = 0 также). Каждый (E-\-F)f = — Ef-\-Ff принадлежит к {Ш, Щ и каждый g из {Tt, Щ равен A-f-y, с h из Ш и j из %1, следовательно, Eh = h, Fh — FEh = 0, Fj = j, EJ = EFj = 0. Но, значит, Fj = Следовательно, g представим в виде (E-\-F)g. Тем самым {Tt, Щ есть множество значений E-\-F, но поскольку E-\-F есть проек-
4] ЗАМКНУТЫЕ ЛИНЕЙНЫЕ МНОГООБРАЗИЯ 67 ционный оператор, то {ЭЙ, Ш} есть соответствующее замкнутое ли- линейное многообразие (теорема 11.). Поскольку {Tt, Ш} замкнуто, то {Ж, Ш} = [Щ, Ш]—-Ш-\-т. Теперь положим EF = F (значит, и FE=F тоже). Тогда Е = Р,т, 1—/7 = р1Л_3!> следовательно, E — F — E — EF = EA—F) равно Р>9, где ф — общая часть Ж и 9t — Ш, т. е. Ж — HI. Наконец, EF = 0 означает, что всегда (EFf, g) — 0, т. е. что (?/, Fg) = 0, иными словами, это значит, что все Ш ортогонально ко всему Щ. A EF=F означает, что F(l —Е) = 0, т. е., что все Ш ортогонально ко всему SR — Ж или это значит, что %1 есть подмно- подмножество «R — (Ш — 2И) = 2И. Если HI есть подмножество Ш, то мы будем для F==P>X и Е = Руг говорить, что F есть часть от ? и символически записы- записывать это в виде E>F или F-?=E. (Такая запись, следовательно, означает, что EF =¦ F, или, что то же, FE — F, и как следствие, что Е, F коммутируют. Рассмотрением Т1, %1 или же прямой вы- выкладкой можно убедиться, что всегда справедливо: Ossfgsl; из E^==F и FgzE следует E=F; из E^gF, F^G следует E^G. Наш знак gj обладает, таким образом, свойствами «упорядочения по величине». Следует заметить дальше, что три утверждения: E^=F, 1—?> 1—F или Е ортогонален к 1—F, эквивалентны друг другу. Кроме того, ортогональность Е', F' следует из ортогональ- ортогональности Е, F, если ?¦'<?¦ и F'^F.) Если Ш и ^Я ортогональны, мы говорим, что Е и F также ортогональны. (То есть это зна- значит, что EF — 0 или также FE = 0.) Напротив, если Е, F ком- коммутируют, мы будем говорить, что соответственные Ш, %1 также коммутируют. Теорема 15. Утверждение E?S.F эквивалентно тому, что всегда справедливо ||?Y||:g||F/||. Доказательство. Из E^F следует, что F — EF, следова- следовательно, \\Ef\\ = \\EFf\\ ?g \\Ff\\ (ср. теорему 13.). Обратно, это соотношение имеет следующее следствие: если Ff = 0, то \]Ef\\ ^ ;g ||/у ||=0. ?/ = 0 и из-за F A — F)f = (F — F*)f = 0 полу- получаем тождественно ??A—F)f — 0, т. е. ??A—F) = E — EF — 0, E = EF, следовательно E^F. Теорема 16. Пусть Ev .,., Ek суть проекционные опера- операторы. Тогда Ег-\- ... -\-Ек будет проекционным оператором тогда и только тогда, когда все Ет, Et (m, 1=1, .... k, т ф Г) взаимно ортогональны. Другое необходимое и доста- достаточное условие — это (для всех /). Более того, ?\,+ ... -\-Ek (Ei = P,M, ... .... Ек = Р-т^} есть в этом случае оператор проектирования 5*
68 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II в 2Ri+ ... -{-Tlk = [Ttv ..., Шк], которое в данном случае равно {Я»! ЭЭТЙ}. Доказательство. Последнее утверждение доказывается повтор- повторным применением теоремы 14.. Отсюда же следует достаточность первого критерия. Если выполнен второй критерий, то то же спра- справедливо относительно первого: Для т ф I, Emf = / будет Поскольку, однако, Em(Emf) = Emf выполняется тождественно, то El(Emf) = 0, т. е. Е1Ет = 0. Наконец, второе условие необхо- необходимо: Если Е1-\- ... -\-Ek — проекционный оператор, то (тео- (теорема 13.): ... +(Ekf, /) = Имеем таким образом следующую логическую схему: Ех-\- ... -j-E/f есть проекционный оператор -> второй критерий -> -> первый критерий ->?]-(- ... -f- ?д есть проекционный оператор т. е. все три утверждения эквивалентны. В заключение мы докажем еще теорему о сходимости проекцион- проекционных операторов: Теорема 17. Пусть Ех, Е2, ... есть возрастающая или убывающая последовательность проекционных операторов: Ех^=± ^Е2^ ... или Е1^Е2> ... Такая последовательность схо- сходится к проекционному оператору Е в том смысле, что для всех / Enf->Ef; и при этом все Еп^Е, или Еп^Е соот- соответственно. Доказательство. Достаточно исследовать второй случай, по- поскольку первый может быть сведен к нему заменой Ev Е2 Е на 1—Ev 1—Е2, ..., 1—Е. Пусть поэтому Е^^Е2^ ... В силу теоремы 15. Ц^/Ц2^ \\E2f\\ Ш •¦¦ ^0. Следова- Следовательно, существует lim Ц-Е^/Ц2. Это значит, что для каждого е > О т->оо существует N = N(e) такое, что для т, 1>N будет Ц^/Ц2 — — 11^г/112<е- Далее, для m^sl, Em^El, Ет — Et есть проекцион- проекционный оператор, и, значит,
5] ОПЕРАТОРЫ В ГИЛЬБЕРТОВОМ ПРОСТРАНСТВЕ 69 откуда следует, что \\Emf — EJ\\ < |/"s. Последовательность EJ, E2f, • ¦ • удовлетворяет, таким образом, критерию сходимости Коши и имеет поэтому предел /* (/>. из II. 1!). Следовательно, Ef — f* определяет оператор, всюду имеющий смысл. Из (Enf, g)~{f, Eng) получается после перехода к пределу, что (Ef, g) = (f. Eg), из (EJ, Eng) = (EJ, g) следует, что (Ef, Eg) = (Ef, g), значит, (Bf, g) = (Ef, g) и B==E. Таким образом, Е есть проекционный оператор. Для/^да, Ц^/Ц^Ц^/Ц, и при 1->оо мы получим |!?¦„/¦ || =S ||?/||> следовательно, Ет^Е (теорема 15.). Если Ev Е2, ... суть попарно взаимно ортогональные проек- проекционные операторы, то Ev Ex-\-E2, Е1-\-Е2-{-Е3, ... суть также проекционные операторы, и они образуют возрастающую последова- последовательность. Поэтому они должны сходиться по теореме 17. к про- проекционному оператору, который больше каждого из них и который мы можем обозначить через Е^-^- Е2-\- ... Пусть ?'i = /\];,> Е2 = Рт2, ..., Еу-\-Е2-\- ... ='Рщ. Поскольку все Ет^Е, то Шт есть подмножество Tt и, следовательно, Ш включает также [Tlv Tt2, ...] = 2R1 + 3M2+ ... =Ш. С другой стороны, все Жп суть подмножества Щг, значит, Ет^Р^ —Е'. Поэтому по непре- непрерывности (ср. аргументацию в приведенном выше доказательстве) Е^Е', т. е. Ш есть подмножество Ш'. Таким образом, 9W —?й', Е = Е', т. е. Ш = Т11 -\-Ш2-\- ... или, переписанное другим спо- способом, г Н~ • • • На этом мы закончим изучение проекционных операторов. 5. Операторы в гильбертовом пространстве Теперь мы в достаточной мере познакомились с геометрическими отношениями в бесконечномерном (гильбертовом) пространстве 9^, чтобы можно было обратиться к линейным операторам в нем, т. е. к линейным отображениям ffi^ на самого себя. С этой целью при- придется ввести некоторые понятия, которые по существу уже были -предвосхищены в некоторой мере в последних разделах. В предыдущих разделах мы уже имели дело с операторами; мы определим их (в соответствии со сказанным там перед, теоремой 11.) следующим образом: Определение 6. Оператор R есть функция, определенная на подмножестве 91, со значениями из Ш, т. е. соответствие, которое сопоставляет некоторым элемента^ / из Ш. эле- элементы Rf из 9t. (Мы допустили здесь и Шп в дополнение к Ш^. Следует обратить внимание на то, что если %м есть F$, то оператор R определен
70 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ II для элементов Fq, т. е. обычных функций в конфигурационном про> странстве, причем его значениями будут такие же функции. Итак, операторы оказываются так называемыми «функциями от функций» или «функционалами». Сравни примеры в I. 2,4). Класс /, для кото- которых определено Rf — область определения R — не обязан включать в себя все Ш, если же он включает все SR, то R называется опре- определенным повсюду. Кроме того, нет никакой необходимости, чтобы множество всех Rf — область изменения R (отображение области определения, осуществляемое R) — содержалась в области опреде- определения R, т. е. если Rf определена, то из этого еще не следует с необходимостью, что R(Rf) = R2f имеет смысл58). В предыдущем разделе мы уже установили, что надо понимать под R + S, aR, RS или Rm (R, S — операторы, а — комплексное число, т — 0, 1, 2, ...): (R±S)f = Rf±Sf. Для установления областей определения этих операторов следует заметить, что левые стороны (т. е. операторы R + S, aR, RS) опре- определены только, если определены также и правые части. Таким образом, например, R + S определено лишь в общей части областей определения R и S, и т. д. Если Rf принимает каждое из своих значений лишь однажды, то R обладает обратным оператором R'1: R~lf имеет смысл, если Rg = f имеет решение g, и g есть его значение (/?"'/ =± /?"'Rg = g). В предыдущем разделе уже шла речь о законах счета для операторов R ± S, aR, RS, здесь мы добавим еще несколько слов относительно соответствующих областей. Опе- Операторы, определенные там в качестве равных, имеют также совпа- совпадающие области определения, однако такие операторные уравнения, как 0 •/? = (), несправедливы для областей определения. Выраже- и) Так, например, если йю есть FQ, где Q — пространство всех веще- вещественных х, — со < х < оо, то djdx есть функция от функции, т. е. опера- оператор, определенный, однако, в нашем смысле только для тех fix), кото- которые, во-первых, дифференцируемы и, во-вторых, обладают конечным m * 12 -з— / (х) dx (ср. II. 8, где этот вопрос обсуждается подробнее). Есте- — со d1 ственно, что тогда в общем случае ¦¦. г f{x) не обязана существовать и Л ¦fix) dx не обязан быть конечным. Например, такого рода по- поведение будет у функции f (х)¦= \х\2е~
5] ОПЕРАТОРЫ В ГИЛЬБЕРТОВОМ ПРОСТРАНСТВЕ 71 ние 0-/ имеет смысл всегда, a (O-R)f, по определению, имеет смысл только когда определено R/ (если, однако, оба они опреде- определены, то оба =0). С другой стороны, когда выполнено 1 •/? = = R ¦ 1 =R и R ¦ Rl = Rm+1, то это же верно для соответствую- соответствующих областей определения. Если R, S имеют обратные операторы, то RS также обладает обратным оператором, который, как легко видеть, имеет вид (RS)~ = = S/?. Далее, для а + 0, (aR)'1 — — R~\ Если существует R, то мы можем образовать и другие отрицательные степени R: После зтих общих замечаний мы перейдем к более детальному исследованию тех специальных классов операторов, которые пред- представляют для нас особый интерес. Определение 7. Оператор А называется линейным, если об- область его определения есть линейное многообразие, т. е. если она содержит все alfl-\- ... -\-akfk вместе с fv ..., /ft, и если В дальнейшем мы будем рассматривать только линейные операторы и именно лишь такие, область определения которых всюду плотна. Последнее замечание позволяет найти — во многих случаях эффек- эффективную — замену требования об определенности оператора повсюду, от которого в квантовой механике нам приходится отказаться. Это об- обстоятельство достаточно важно для нас, чтобы рассмотреть его более подробно. Для примера рассмотрим конфигурационное пространство в волновой механике Шредингера, которое для простоты возьмем одномерным: —оо<^г<-(-оо. Волновыми функциями будут ср(<7) с конечным I \<f(q)\2dq, они образуют пространство Гильберта — 00 (ср. II. 3). Рассмотрим операторы q, ... и уутГ"' '" ^ни> оче" видно, линейны, но их области определения ни в коей мере не охватывают все гильбертово пространство. Для q, ... это не так, потому что = f q2h(q)\2dq
72 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II со может легко оказаться бесконечным, даже при конечном I \y{q)\2dq, — со так что q<? (q) не будет принадлежать более гильбертову про- пространству. Это не так и для -к-г -т- • поскольку существуют недиф- СЮ ференцируемые функции, так же как и такие, для которых I \<f(q) \2dq — со конечен, а ( - \ не конечен ^например, \q\2 б~чг или е~^ sin(e<?2)). Однако их об- области определения всюду плотны: Оба оператора, разумеется, при- применимы к каждой 9(<7), которая =?0 лишь в конечном интервале — C^q^C и всюду непрерывно дифференцируема; а такое мно- множество функций повсюду плотно59). Определим далее: Определение 8. Два оператора А и Л* назовем сопряжен- сопряженными, если они имеют одну и ту же область определения, причем в этой области (АЛ g) = (f. A*g), (A*f, g) = (J, Ag). (Заменяя взаимно /, g и производя комплексное сопряжение с обеих сторон равенства, убеждаемся, что каждое из этих соотно- соотношений следует из другого. Далее ясно, что связь А с А* симмет- симметрична, т. е. что А* и А также сопряженные, так что А** = А.) 53) В соответствии с изложением II. 3 (при обсуждении условия Е.) нам достаточно уметь аппроксимировать с любой точностью все линейные ком- комбинации следующих функций: / (х) = 1 на множестве, состоящем из конеч- конечного числа интервалов, и равно 0 всюду вне их. Это удается, если мы будем уметь аппроксимировать каждую из этих функций в отдельности; в свою очередь достаточно научиться делать это для функций с общим 1-интер- валом (остальные функции будут суммами таких). Пусть, например, интер- интервалом будет а < х < Ь. Функция f(x) = Q для х < а—? или х>Ь-\-г, f(x) = cos2 -=- для а—г^х^=а, f (x) = cos2 -| Х~Ь для Ь-^х^Ь+г, f (х) = 1 для а<х <Ь в самом деле удовлетворяет нашим требованиям регулярности и вместе с тем приближает заданную функцию произвольно точно при достаточно малых г.
5] ОПЕРАТОРЫ В ГИЛЬБЕРТОВОМ ПРОСТРАНСТВЕ 73 Заметим дальше, что для А может быть найден лишь один сопряженный оператор А*, т. е. если А есть сопряженный к А* и к Ач, то А\ — А2- В самом деле, для всех g, для которых опре- определено Ag, и поскольку эти g всюду плотны, Aif = Ач/. И так как это выпол- выполняется всегда, то А\ — Ач- Следовательно, А* определено по А однозначно, так же как и А по А*. Мы немедленно можем убедиться в том, что 0,1 и вообще все проекционные операторы Е самосопряжены (ср. теорему 12.), т. е. для них 0*, 1*. Е* существуют и равны соответственно 0, 1, Е. Далее, (аА)* = аА* и, если только /5±В может быть вообще определено (т. е. если их области определения всюду плотны), то (A + Bf = — А*±В*. Наконец, при ограничениях на область определения, кото- которые могут быть легко установлены, (АВ)* = (В*А*) (ведь (ABf, g)* = = (Bf, A*g) = (f, B*A*g)), равно как и (А'1)* — А* , так как В частности, для случая волновой механики Шредингера (которую мы рассматривали и раньше, но здесь будет иметься в виду ^-мерное конфигурационное пространство), когда гильбертово пространство состоит из <f(qx qk) с конечными — со —со h д мы имеем для операторов qt, ... и -=—- -^—¦, .. h д Первое очевидно, поскольку со со — со —оо со оо = / • • • / ? (Яг Як)-Яг^ (Я: Як) аЧ\ • • • dqh. —со — оэ
74 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Второе утверждает со со — оо —со оо со -00 -00 т. е. 00 ОО т. е. оо оо ¦Иш Г ... Г [9 (?1 ?4)ф(?1 ?*)]?" Ij X Предел должен существовать, поскольку сходимость всех интегралов со со J ... J ... dqx .. . dqk «-ОО —ОО / д д . несомненна 1так как <р, ф, -з-г-<Р> "л^~? принадлежат пространству Гильберта), так что важно только именно его равенство нулю. Но если бы он не был равен нулю, то (несомненно существующий) предел при ^—>-j-°° (или ПРИ Я1~>— °°) выражения со со — 00 —00 был бы не равен нулю, что несовместимо с абсолютной сходимостью интеграла • • • J 9 (<7i 7*Ж?1 Як) dqx... dqx_x dqt dqt+1 ...dqk —оо (<p, ф принадлежат пространству Гильберта!). —oo —оо
5] ОПЕРАТОРЫ В ГИЛЬБЕРТОВОМ ПРОСТРАНСТВЕ 75 Если А есть интегральный оператор .... qk) = .?*•• Ч[ Ч'к)9(я[ q'k)dq[...dq'k, то непосредственно получаем следующее утверждение: А* есть также интегральный оператор, однако ядро его не K(qv •... qk\ q\ q'k), но К{я[ я'к\ Чу .... чк). Рассмотрим теперь положение вещей в матричной теории, где пространство Гильберта состоит из последовательностей л^, х2, ... со с конечной 2l-*>i2> Линейный оператор А переводит [х1, х2, ...} A=1 в {у,, у2, ...} A[xv x2, ...) = {yv y2< ...}, где вследствие линейности A, yv y2, ... должны зависеть от xv x2, ... линейно 60) Это рассуждение не точно, поскольку оно оперирует понятием линей- линейности в случае бесконечных сумм и прочего. Но оно может быть улучшено таким образом: Пусть <fu <pa,... будет полной ортонормированнои системой, СО 00 а Л и А* — сопряженными операторами. Пусть /== 2л\<р,, Af — ^УуУу »=l v=l Тогда v=l [в силу теоремы 7., •()] 2 V S ^ v=l v=l Если мы теперь положим а^ = (Л<рч, «р^), то получим формулу из текста со 'Уи= 2 V« где Уже обеспечивается абсолютная сходимость. 4 = 1 В гильбертовом пространстве последовательностей *,, xit ... последо- последовательности у, = 1, 0, 0, ...; сра = 0, 1,0,...; ...; ... образуют полную ортонормированную систему (в чем можно легко убедиться). Тогда для 00 СО /=(*!,х2,...) имеем /=У\ х,<?„ а для Л/=(у,, у2, ...) ш&еем А/=У. у^ъ, v=l «=1 чем достигается полное согласие с текстом. Если мы образуем a*v для А*, то увидим, что
76 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. И Следовательно, оператор А характеризуется заданием матрицы а^. Легко видеть, что матрица av|1 (комплексно-сопряженная транспони- транспонированная!) соответствует оператору А* (см. прим, 60)). Аналогия с положением в матричной теории, которую мы сейчас обнаружили, подсказывает нам способ ввести понятие эрмитова опе- оператора, которым мы сейчас и воспользуемся. Одновременно мы введем два других понятия, которые окажутся существенными для наших дальнейших целей. Определение 9. Оператор А назовем эрмитовым, если А*=А. Назовем его также дефинитным, если всегда (Af, /)>;О61). Оператор U назовем унитарным, если UU* = U U = 162). Для унитарных операторов мы, таким образом, имеем U =U~ . По определению, (Uf,Ug) = (U*Uf,g) = (f,g), значит, в частности, (при / — §•), \\Uf\\ = |[/||. Напротив унитарная природа оператора следует из последних свойств, если U определен повсюду и принимает все значения (ср. прим. 62)). Мы доказываем это следующим образом: во-первых, если верно, что то, значит, (С//, ?//) = (/. /); (?/•?//. /) = (/, /). f-Lg f о- Если мы заменим здесь / на —к-^- и другой раз на 2 и вычтем их друг из друга, то, как легко подсчитать, Re (С//, Ug) = Re(f, g). Если мы подставим // вместо /, то получим Im вместо Re. Итак, вообще справедливо, что (Uf,Ug) = (J,g), т.е. (irUf,g)=*(f,g). При данном / это верно для всех g, значит, U*Uf — f, и поскольку это выполняется для всех /, то U*U = 1. Мы должны еще показать, что ии*—\ также. Для каждого / существует g такое, что Ug = f, значит, UU*f=UU*-Ug — U ¦ U*Ug — Ug — f, следо- следовательно, UU*— 1. Поскольку вследствие линейности \\Uf-Ug\\ = \\V<J-g)\\ = ||/-*||. el) (Af, f) вещественно в любом случае, так как равно в2) Следовательно, U, U* должны быть определены повсюду. Далее они обратны друг другу и, следовательно, принимают каждое значение Один и только один раз.
5] ОПЕРАТОРЫ В ГИЛЬБЕРТОВОМ ПРОСТРАНСТВЕ 77 то каждый унитарный оператор непрерывен, что отнюдь не обяза- обязательно для эрмитовых операторов. Например, операторы q . .. и ¦н^7 -*- • • •' столь важные для квантовой механики, — не непрерывны63). Из наших формальных правил исчисления для Л* немедленно следует, что если U, V унитарны, то будут унитарны и U~ , UV, следовательно, и все степени U. Если А, В эрмитовы, то А+В также эрмитовы. Напротив, а А — эрмитов лишь при вещественных а (исключая Л = 0), а АВ эрмитов, лишь если А и В коммутируют, т. е. если АВ = ВА. Далее мы знаем, что все проекционные опе- операторы (и в частности 0,1) эрмитовы и что эрмитовы операторы qt, ..., и -п~^~л—> ••• теории Шредингера. Вместе с А эрмитовы и все его степени (так же, как и А~\ если он существует), равно как и все полиномы с вещественными коэффициентами. Замечательно, что при эрмитовом А и произвольном X оказывается эрмитовым и оператор ХАХ*\ (ХАХ*Т = Х~А*Х* = ХАХ*. Следовательно, например, эрмитовы все XX* (А= 1) и Х*Х (X — за- заменяется на А'*). При унитарном U, UAU~ эрмитов, поскольку Непрерывность для операторов, так же как и для численных функций обычного анализа, является свойством первостепенной важ- важности. Мы поэтому хотим сформулировать несколько характерных условий существования этого свойства для случая линейных операторов. Теорема 18. Линейный оператор R непрерывен всюду, если он непрерывен в точке / = 0. Необходимым и достаточным условием для этого опять является существование постоян- постоянной С такой, что всегда \\Rf\\ ^==С ¦ ||/||. В свою очередь, это условие эквивалентно тому, что всегда справедливо К/?/. g)\^c Для эрмитовых R этого достаточно потребовать только для f = g- IW- f)\^c ¦ II/II2 или, поскольку (Rf, f) веще- вещественно (прим.61) на стр. 76), со вз) Приданном / | y(q) \2dq как / q2\y(q)\2dqt так и / -т- <? (q) 2 dq можно сделать произвольно большими. Возьмем, например, <? (q) = ae~bq2. Все три интеграла конечны {Ь > О!), но пропорциональны соответственно a2b~'k, a2b~'!\ a2b^2, так что любым двум из них могут быть предписаны произвольные значения.
78 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Замечание. Концепция непрерывности операторов восходит к Hi lber t'y64). Он характеризовал это свойство как «ограни- «ограниченность» и определял его предпоследним из данных выше кри- критериев. Если в последнем критерии всегда выполняется только одно из неравенств, то R называется полуограниченным: сверху или снизу. Например, всякий дефинитный оператор полуогра- полуограничен снизу (с С = 0). Доказательство. Непрерывность в / = 0 означает, что для каждого е > 0 существует такое 8 > 0, что из ]|/|| < 8 следует \\Rf\\ <е. Тогда из ||/ —/0|| <8 следует, что т. е., что R непрерывно также в / = /0 и, следовательно, всюду. Если выполняется \\Rf\\^gC- \\f\\ (конечноС>0), то мы можем дока- доказать непрерывность, положив 8 — -^. Напротив, если имеется непрерыв- 2 ность, мы можем определить 8 для е = 1 и положить С = у. Ибо выполняется для / = 0 без дальнейшего. Для /ФО, т. е. ||/|| >0 пусть g = -ffff- ^ этом слУчае 11^11 =" 8 и> следовательно, — 5 \\Rg\\ =jff ЦЯ/11 < 1. ЦЯ/11 < ^- = с • II/ II- Из ||/?/||ёС • II/H следует, " что \(Rf, g)\ ^ \\Rf\\ • ||^|| ^ SsC • 11/11 • 11^11- Напротив, из |(Я/. g)\^C ¦ \\f\\ • ||g-[| мы получим . \\\\2^C ¦ H/II • \\g\\, если положим g — Rf, и, следовательно, |^?С- ||/||. Еще остается показать, что для эрмитовых R из |//)|sSC Ц/11 следует \(Rf, g)\^C • \\f\\ . \\g\\. Подставляя ~18 и ~g вместо /, получаем: e4) QOttingen Nachrichten, 1906. в5) В приведении к этому виду важна эрмитовость оператора R: f+S f+S\ (pf~S f-8 \ ~~~2~' 2 ) \* 2 ' 2 )~ ft g) (в третьем шаге).
5) ОПЕРАТОРЫ В ГИЛЬБЕРТОВОМ ПРОСТРАНСТВЕ 79 Подставляем теперь af, — g вместо /, g, как при доказательстве теоремы 1.. Минимизируя правую сторону, получим |Re(/?/, gOjei = ?• 11/11 ¦ Hell- Затем, заменяя / на elaf (а— вещественно), полу- получим в качестве максимума левой части \{Rf,g)\^C\\f\\.\\g\\. Конечно, это справедливо только, если Rg определено, но поскольку эти g всюду плотны, a Rg вовсе не входит в окончательный ре- результат, то в силу непрерывности это выполняется всегда. Докажем еще одну теорему о дефинитных операторах: Теорема 19. Если R эрмитов и дефинитный оператор, то всегда \ЩГё)\ siУ(«/. f)(Rg. g) и, значит, из (Rf, /) = 0 тогда следует, что /?/ = 0. Доказательство. Приведенное неравенство следует из справед- справедливости (Rf, /)^0 (дефинитность) совершенно так, как в тео- теореме 1. доказывалось неравенство Шварца |(/, g)\ si ]/(/•/)(?• S) (т. е. =g ||/1! • \\g\\). исходя из (/, /)^0. Если теперь (Rf, /) = 0, то из этого неравенства следует также, что (Rf, g') = 0, если Rg имеет смысл. Следовательно, оно выполнено для всюду плотного мно- множества g и, значит, в силу аргументов непрерывности, для всех g. Значит, Rf = 0. Наконец, мы коснемся важного понятия коммутативности двух опе- операторов R, S, т. е. отношения RS = SR. Из RS = SR следует, что 5 ... SSR = S ... SRS^S ... RSS= ... =RS ... SS. т. e. R и S" коммутируют («=1,2,...). Поскольку R ¦ 1 = 1 • R = R и S° = 1, то это верно и для п = 0. Если существует 5 , то S~l -SR- S~l = S~1 • RS- S~l и, поскольку S~l ¦ SR ¦ S~l = S~lS R- S~l= RS~\ S'1 ¦ RS ¦ S'1 = S~lR • SS'1 = 5/?, то и S~XR — RS-1. Так что га = — 1 и, значит, и п = —2, —3, ... также допустимы, т. е. R коммутирует со всеми степенями 5. По- Повторные рассуждения показывают, что все степени R коммутируют со всеми степенями 5. Если R коммутирует с 5 и с Т, то он, оче- очевидно, коммутирует со всеми aS, а также с 5 ± Т, ST. Вместе с ре- результатами, полученными выше, это означает, что если R, S комму- коммутируют, то коммутируют также любые полиномы из R с любыми полиномами из S. В частности, при R — S все полиномы по R ком- коммутируют между собой.
80 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II 6. Проблема собственных значений Итак, мы продвинулись достаточно далеко, чтобы рассмотреть в абстрактном пространстве Гильберта ту самую задачу, которая со- составляла в ее частных реализациях Fz или Fa центральный вопрос квантовой механики — решение уравнений Е\. и Е2. из I. 3. Мы на- назовем ее проблемой собственных значений и должны будем сформу- сформулировать ее наново и более единообразным способом. В I. 3 и в Ei. и в Ei. требовалось найти все решения ср Ф 0 уравнения Е. Н<р = Хср, где Н — эрмитов оператор, отвечающий функции Гамильтона (ср. об- обсуждение в I. 3), <р — элемент гильбертова пространства, а X — веще- вещественное число (Н—дано, X и ср — ищутся). При этом, однако, выдвигаются определенные требования относительно числа нужных решений. Их должно быть столько, чтобы /. в матричной теории из этих решений cpi={sn, Sl2, ...}, <?2={%, %, ...), ... (напомним, что мы в Fz\) могла бы быть образована матрица 5 = [s ), которая имеет обратную S (ср. I. 3); 2. в волновой теории в ряд по решениям ?i = <fi(iv • • • • ?/)• ?2 = Ъ(?i <!/)• ¦¦• можно было бы разложить любую функцию cp(<7j qf) (не обя- обязанную быть решением уравнения) оо ?(?i ?/) = 2 <v?« (?i qf) п— 1 (ср,, ср2, ... могут принадлежать различным значениям X). (Последнее обстоятельство не упоминалось, правда, в I. 3, но оно необходимо для дальнейшего развития волновой теории и, в частности, для «тео- «теории возмущений» Шредингера66).) Но /. ведет к тому же, что и 2., потому что матрица 5 пере- переводит {1, 0, 0, ...}, {0, 1, 0, ...}, ... соответственно в и, следовательно, все гильбертово пространство SRco в замкнутое линейное многообразие, натянутое на <fv <p2, ..., и, значит, для того, 66) См. третью статью из упомянутого в прим.9) на стр. 13 сборника (Ann. Phys. [4] Bd. 80 A926)).
6] ПРОБЛЕМА СОБСТВЕННЫХ ЗНАЧЕНИИ 81 чтобы существовала S, последнее обязано тоже быть равным SR^. А 2. утверждает то же самое прямо: оно тоже требует, чтобы каж- каждое ср могло быть аппроксимировано с любой степенью точности линейной комбинацией ср,, ср2, ... 67). Выясним, сколь сильно это условие, и попутно докажем еще раз свойства уравнения Е., пользуясь тем формальным аппаратом, кото- который теперь имеем в своем распоряжении. Во-первых, — поскольку мы требуем ср Ф 0 и поскольку «ср есть решение, коль скоро ср является таковым,—достаточно рассмотреть только решения с || ср [[ = 1. Во-вторых, нет нужды требовать, чтобы X было вещественным, потому что это следует из \\y-~ky. (Н<р. <р) = (Хср, (р) = Ц<р. ср) = Х (ср. II. 5, прим. 61) на стр. 76). В-третьих, решения ср,, ?2> принад- принадлежащие различным Xj, X2, взаимно ортогональны: (H<Pi- ?2) = xi (?i- ЪУ> (H<Pi. ?2) = (?i- Н<р2) = *-2(<Pi- %)• Значит, (ср,, 92) = О, так как Хг (ср,, cp2) = X2(tp1, ср2), а X, =? Xj. Пусть теперь X,, Х2> ...—это отличные друг от друга X, для которых Е. разрешимо. (Если мы выберем для каждого X с разре- разрешимым Н<р = Хср по одному решению ерх длины 1, то эти ср обра- образуют, в силу сделанных прежде замечаний, ортонормированную си- систему. Следовательно, по теореме 3 . из II. 2 этот набор образует конечную или бесконечную последовательность. Но, значит, мы можем записывать и X как (быть может, обрывающуюся) последовательность.) Для всякого Х = Хр все решения уравнения Нср == Хер образуют ли- линейное многообразие и притом замкнутое68). Следовательно, согласно теореме 9. существует ортонормированное множество ср ,,..., ср таких решений, которые как раз растягивают это замкнутое линейное многообразие. Ясно, что число vp — это максимальное число линейно- независимых решений с Х = Х . Это число известно под названием 67) Мы сознательно не входим здесь в более точные вопросы сходи- сходимости; в оригинальных формах матричной и волновой теорий эти вопросы тоже не устанавливались с аккуратностью; позже мы установим это (ср., например, П. 9). 68) Последнее обстоятельство очевидно без дальнейших пояснений только для непрерывных, повсюду определенных Н, т. е. если из /„->/ следует, что Н/„->Н/. Между тем достаточно будет, как легко убедиться, и менее ограничивающего свойства из /л->/. Hfn~*f* следует, что Н/ = /* (это так называемая «замкнутость» Н; ср. работу автора в Math. Ann. Bd. 102 A929)). Это последнее всегда выполняется для квантовомеханических опе- операторов, даже для не непрерывных. Точнее, незамкнутый эрмитов оператор может быть сделан замкнутым (и эрмитовым) с помощью однозначного рас- расширения его области определения (что не имеет места, например, для свой- свойства непрерывности, ср. II. 9, стр. 112). 6 И. Неймац
82 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. И кратности собственного значения X. (v=l, 2 со; ч = оо может встречаться. Например, Х=1 для Н = 1.) В соответствии с преды- предыдущим рассуждением <рр, i <рр, v с двумя разными р также взаимно ортогональны. Следовательно, полный набор всех <PP,v (P==l. 2, ...; v=l vp) также образует ортонормированную систему. Зная источник этой системы, мы замечаем, что на нее натянуто то же самое замкнутое линейное многообразие, что и на все решения <р проблемы Е.. Пронумеруем (р v в любом порядке, обозначая их через tyv фг соответствующие им X— через X , X , ... Итак, сформулированное прежде утверждение, что все решения Е. должны растягивать ffim как замкнутое линейное многообразие, гласит теперь, что это должны делать уже только tyv ф2, ... (подмножество решений!) — и, следо- следовательно, по теореме 7.«), что эта ортонормированная система полна. Таким образом, решение проблемы собственных значений в смысле квантовой механики требовало бы найти как раз столько решений проблемы Е., чтобы из них можно было образовать полную норми- нормированную ортогональную систему. Это, однако, в общем случае никоим образом невозможно. Так, например, в волновой теории мы видим, что часть решений Е. (т. е. ?2. из I. 3), — а ведь нам нужны все, чтобы можно было разложить по решениям каждую волновую функцию (ср. замечание выше), — не обладает конечным интегралом от квадрата абсолютной величины69), т. е. не принадлежит гильбер- гильбертову пространству. В последнем же (а ведь в Еч. мы учитываем лишь его) не оказывается поэтому полной нормированной ортого- ортогональной системы решений. С другой стороны, гильбертова теория проблемы собственных значений показывает, что это явление отнюдь не представляет исклю- исключения в поведении операторов (даже для непрерывных70)). Значит, нам придется разобраться в том, что это означает физически; ср. III. 3). Если это явление имеет место, т. е. если ортонормированная система, составленная из решений Е., не полна, то говорят, что у Н есть «непрерывный спектр» («Streckenspektrum»), (Xlt Xg, ... образуют «дискретный» спектр («Punktspektrum») H). Наша следующая задача состоит в том, чтобы найти, поскольку Е. не годится, формулировку проблемы собственных значений эрмитова оператора и применить ее к квантовой механике. Прежде всего мы должны, следуя пути, указанному Гильбертом (ср. прим. 70)), объяс- объяснить постановку проблемы собственных значений. в8) Ср., например, как рассматривает Шредингер задачу об атоме водо- водорода; работа, цитированная в прим. 16), стр. 18. 70) Ср • работу, цитированную в прим.в4), стр. 78.
ПРОДОЛЖЕНИЕ 83 7. Продолжение Уравнение и требование, чтобы из его решений можно было построить полную ортонормированную систему, перенесены по аналогии из конечномер- конечномерного Шп. В Sftn, H —это матрица {h^}, [x, v=l, ..., п; h^ = Нш, и тот факт, что решения у={х1, х2, .... хп) уравнения Н<р = Хср. т> е- содержат полную ортонормированную систему, хорошо известен в алгебре71). Это свойство $tn, как мы видели, не может быть перенесено в dt^ непосредственным переходом п—>со. Таким образом, проблема соб- собственных значений в Ш.^ должна быть сформулирована иным спосо- способом. Сейчас мы увидим, что проблема собственных значений в Шп может быть преобразована к такому виду, что в этой новой фор- формулировке (которая в Шп эквивалентна старой) переход к «—>со становится возможен. Иными словами, обе формулировки выражают во всех ffin («i=l, 2, ...) одно и то же (а именно — что эрмитову матрицу можно привести к главным осям), но одна может быть рас- распространена на $tw, в то время как другая, напротив, нет. Пусть {хп х1п] \xnV ..., хпп] будет полной орто- нормированной системой из решений уравнения для собственных значений и Х1? .... Х„ будут соответствующие X. Итак, векторы {хп, ..., хы], .... {хп1, .... хпп) образуют декартову систему координат в $tn. Тогда формулы преобразования координат jj $„ в этой координатной системе к некоторым другим ?j, .... %п имеют вид т. е. я п [1=1 [1=1 а для обратного преобразования я _ п _ Si== 2л xiu>u. 5я == 2л A=1 [1=1 71) Ср. книгу Куранта и Гильберта, цитированную в прим. 30), стр. 25. 6*
84 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II n Мы можем записать условия 2^h x = Xjc с помощью перемен- переменных ji, ...,?„ и нового ряда переменных yjj, ..., т\п (с соответ- соответствующими им по предыдущей формуле i)v ..., t)n) в виде т. е. Тогда декартов характер координатной системы выражается формулой Итак, отыскание матрицы {х } со свойствами Z). и О. — вот что эквивалентно в Шп решению проблемы собственных значений; в такой форме переход к $tm нам не удался. Эта неудача отнюдь не неожи- неожиданна по следующей причине. Именно, условия D. и О. не определяют неизвестные X и х^ полностью. В самом деле, как показывает теория этого «приведения к главным осям» (см. прим. 71), стр. 83), вели- величины X определяются единственным образом с точностью до порядка, но положение с х^ гораздо хуже. Очевидно, что каждую строку х v ..., х п можно домножить на множитель Ь абсолютной вели- величины 1, если же некоторые X совпадают, то возможно даже произ- произвольное унитарное преобразование соответствующих строк х v .... х п\ Безнадежно пытаться совершить трудный переход к пределу л—>со с такими однозначно не закрепленными величинами: в самом деле, как может сходиться процесс, если по дороге Хр и х^ могут по произволу испытывать большие колебания, которые оказываются воз- возможными вследствие неполноты в их определении! Но это указывает нам путь для правильного подхода к задаче: мы должны прежде всего попытаться заменить условия D. и О. и неизвестные Хр и х^ такими, которые обладают недостающими свой- свойствами однозначности — после этого, как мы покажем, переход к пре- пределу будет представлять уже меньшие трудности. Если I есть некоторое значение, которое принимает одно или несколько из X , то выражение 2,
7] ПРОДОЛЖЕНИЕ 85 инвариантно по отношению к указанным выше (с D. и О. совмест- совместным) изменениям Хр, лг^. Если / отлично от всех \ , то сумма равна нулю и, значит, тем более инвариантна. Тогда эрмитова форма ($ и т\ обозначают %v ..., 5„ и tjj -цп соответственно) также инвариантна (при произвольном /!). Если мы знаем Е (/; ?, tj) (т. е. ее коэффициенты), то, отправляясь от нее, мы можем без труда вернуться назад к Хр и х^. Следовательно, если мы сформу- сформулируем задачу о собственных значениях (т. е. D. и О.) так, чтобы в ней фигурировала только ?(/; ?, tj) вместо \?, х^, то мы достиг- достигнем желаемой однозначной формулировки. Итак, пусть Е (I) будет матрицей эрмитовой формы E(l; ?, tj) 72). Что будут значить условия D. и О. в применении к семейству ма- матриц Е (/)? Условие О. означает: Если I достаточно велико (именно, больше, нежели все X), то ЕA)=1 (единичной матрице). Из природы ЕA) следует также, что если / достаточно мало (именно, меньше всех \ ), то ЕA) — 0 и если / возрастает от —со до -f-со, то Е(Г) везде постоянна, за исключением конечного числа точек (различные среди значений X,, ..., \п, которые мы назовем /х < 12 < ... < 1т, т^п), где она изменяется скачками. Далее, скачок лежит слева от этой точки /поскольку 2 непрерывна справа как функция от /, тогда как для 2 было бы как раз наоборот\ . Наконец, как мы это покажем, \<1 ! при I'^l" Е (О Е (I") = Е (Г) Е (/') = Е (/') (матричное произведение!). Удобнее доказать это для Е{1'\ $, tj), Е(Г; 5. tj) в системе ко- координат jj ?„ и 9i> ..., 9Я- Вводя эти координаты, мы получим из ЕA'; 5, т;) и Ё (Iя; I tj) 21 SpPP и 2 ?Д- п _ ») Т. е. ?(/) = (ell»@). ?(/;?. и))== 2 V (О М" соответственно (I, V=l
86 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Следовательно, матрицы эти таковы: нули всюду, кроме диагонали, 1 на р-м месте диагонали, если Хр^?/' или соответственно si/", в противном случае также нуль. Для таких матриц высказанное выше утверждение очевидно. Переформулируем теперь еще и D.. Оно означает, очевидно, G0— какое-нибудь число, меньшее 1{). Но поскольку ?(/; !-, ¦»)) п0" стоянно на каждом из отрезков то для любого набора чисел А0<А1<А2< ... <Aft, если /j, ..., /m входят в число Аг Ak, выполняется |X, V=l Т=1 Применяя интеграл в смысле Стильтьеса73), мы можем переписать это как п +со 73) Об интеграле в смысле Стильтьеса см. Perron, Die Lehre von den Kettenbruchen, Leipzig, 1913, а также в смысле специального применения к требованиям операторной теории С а г 1 е m a n, Equations integrates singu- lieres, Upsala, 1923. Читателю, менее заинтересованному в этих вещах, до- достаточно следующего определения: для разбиения Ао, Аи ..., Лд интер- интервала а, Ь, а Ш Ло < Ai < ... < Ak з| Ь образуем сумму Если она всегда сходится, когда разбиения Ло, Аи А2, ..., Л^ делаются все меньше и меньше, то существует интеграл ь f f (X) dg (X), определяемый как предел сумм. (Для g (х) = х он переходит в известный интеграл в смысле Римана.) [Относительно русских руководств по интегралу Стильтьеса ср. прим.52) на стр. 51.—Прим. ред.]
7] ПРОДОЛЖЕНИЕ 87 (+оо ft Г может быть, очевидно, заменен на любой Г, с а < llt -оо а # > 1т\, или, если мы рассмотрим коэффициенты и напишем для са- самих матриц уравнение, справедливое для всех коэффициентов, то как + 00 Н= fldE(X), — CO где Н ={*,„}• Итак, пока возникла следующая задача: Для данной эрмитовой матрицы Н = {h^} надо разыскать семейство эрмитовых матриц Я (X) (—оо<Х<-)-оо) со следующими свойствами: 51. При достаточно { ™и } X, ?(X) = {J}. Е (X) (как функция от X) постоянна всюду, за исключением конечного числа точек, где она изменяется скачками. Скачок всегда происходит слева от данной точки. 52. Всегда Е(к')Е(\") = Е(Шп(\', X")O4). 53. Выполняется (с интегралом в смысле Стильтьеса) + ОО Н= /ХйЯ(Х). — оо Мы сейчас не будем останавливаться на обратном рассуждении — отправляясь от Si. — S3. вернуться к решениям D. и О. (хотя это было бы совсем просто), потому что только последняя форма про- проблемы собственных значений будет нужна нам для квантовой меха- механики. Вместо этого мы сразу перейдем к обобщению Si. — S3. от конечного на бесконечное число измерений, т. е. к переходу от Шп к Я.. В Ш^ мы, очевидно, должны понимать Н и ?(Х) как эрмитовы операторы, — значит, мы должны будем попытаться найти для дан- данного Н такое семейство Е(к), чтобы они сопоставлялись ему некото- некоторым определяемым по примеру Sj. — S3. образом. Должна быть найдена ^-аналогия Si. — S3.! S2. остается неизменным в этом переходе, поскольку число изме- измерений Шп не играет в нем никакой роли. Мы только переформули- переформулируем его, воспользовавшись результатами, полученными в связи 74) Min (а, &,..., ё) есть наименьшее, а Мах (а, &,..., е) — наибольшее из конечного набора вещественных чисел а, Ь,..., е.
88 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II с операторами проектирования (II. 4). Во-первых, это свойство утвер- утверждает, что ?(ХJ —?(Х) при Х' = Х" = Х, т. е. ?(Х) являются опера- операторами проектирования. Но тогда 5г. означает (мы можем ограни- ограничиться случаем X'ssX", поскольку для Х'^Х" получится совершенно аналогичный результат), что из X's=X" следует ? (X') 2= ? (X") (ср. теорему 14. и последующий текст в II. 4). 5з. требует некоторой осторожности, поскольку выражение Л = + СО = I XdE(k) непосредственно лишено смысла, так как интеграл — со Стильтьеса определен для чисел, а не для операторов. Но легко заменить Н и Е(К) числами и это нас опять приведет к нужному операторному соотношению. Потребуем, чтобы для всех /, g из SR^ выполнялось (Н/, g)= /Xtf(?(X)/, g), +со если только Н/ имеет смысл. Соотношение Н= Г Хй?(Х) следует — со понимать символически, только как сокращенную запись преды- предыдущего. Su , наконец, весьма существенно затрагивается переходом к бес- бесконечному числу измерений. Точки, после которых Е(к) становится равным 0 или 1, или в которых Е(к) испытывает скачки, соответ- соответствуют (в \fin) собственным значениям Н, а интервалы, где она по- постоянна— интервалам, свободным от собственных значений. Если теперь устремить п—>оо, то могут произойти самые разные вещи. Наибольшее и наименьшее значения могут уйти соответственно на + оо или на —оо, но остальные, поскольку их становится все больше, могут стесниться все плотнее, так что интервалы постоянства могут постепенно стянуться в точки. (Этот последний признак ука- указывает на то, что в гильбертовой теории операторов при некоторых обстоятельствах появляется так называемый непрерывный спектр 75).) Мы должны, следовательно, изменить 5t. при переходе от 3tn к SR^, совершенно существенным образом. Надо допустить возможность того, что изменения ?(Х) не будут более иметь дискретного, скачко- скачкообразного характера. С такой точки зрения очень естественно будет отказаться от тре- требования, чтоб функция Е(Х) принимала конечные значения 0 и 1, и 75) См. ссылку в прим.64), стр. 78, а также книжку Карлемана, упомя- упомянутую в прим.73) на стр. 86. Нам придется иметь много дела с этим «непре- «непрерывным спектром», ср. II. 8.
7] ПРОДОЛЖЕНИЕ 89 требовать только сходимости к 0 или к 1 (при X —> — со или X—»- —(— оо соответственно). Равным образом вместо постоянства на от- отрезках и скачков в точках выступает допустимость непрерывного возрастания. С другой стороны, менее ограничительное требование, что в возможных точках прерывности разрыв должен происходить только слева, мы можем попытаться сохранить. Соответственно мы сформулируем Si. следующим образом: при X—> — оо, fi'(X)—>0; при X-^-j-oo, Е(Х)->1, а при Х-»Х0, Х^Х0, Е(X)->Е(ХоO6). Кое-что еще следует сказать относительно 5з. В конечномерном т пространстве Шп выполнялось Л=2'т^т> если понимать под /% матрицу ЕAХ)— ?(/т_1). В силу Si., имеем: для а>:т а для s^i — 1 FXE (/,) = Е {lx) E (/„) — E(lx_x)E(/„) = ? (/„) - ? (ie) = 0. Следовательно, поскольку Fa = E(la) — E(la_l), {/\ для т —<з, 0 для т Ф а. Отсюда следует (т \2 т т т=1 ^ Т/ т, ст = 1 т=1 / m \ f и таким же образом Ир = 2 ^^т) • Следовательно, такое же пре- преобразование, что для самого Н. приводит к +оо Поэтому в ffi^ мы предположим символическое уравнение, построен- построенное аналогичным образом, а значит, в числах J )M(E(k)f, g). 76) Обозначая А(к)^>-В, (А(К), В — операторы в Шт, К —параметр), мы понимаем под этим, что для всех / из ffim, А (к) /-* В/. Таким обра- образом, это сокращенная запись утверждения о сходимости в гильбертовом пространстве.
90 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. П (Мы подтвердим это последующим построением.) Для f — g из-за (Н2/, /) = (Н/. Н/)= ЦН/1!2, отсюда следует + ОО Эта формула, однако, дает основания ожидать, что Е(к) не только определяет значения Н/ в тех случаях, когда они существуют, но и позволяет заключить, когда они имеют смысл. В самом деле, инте- + СО грал I X2d( ||E(k)f ||2) содержит неотрицательную функцию (X2ig0) и —со монотонно возрастающее выражение ||?(Х)/||2 под знаком диффе- дифференциала (ср. 5г. и теорему 15. в II. 4). Следовательно, этот ин- интеграл по своей природе сходящийся, — т. е. нуль или положителен и конечен, — или собственно бесконечен, т. е. равен -|-оо77). По- Последнее заключение справедливо независимо от связи с Н> т. е. без- безотносительно к тому, имеет ли Н/ смысл, или нет. Следует поэтому ожидать, что Н/ имеет смысл (т. е. существует в SR^) тогда и только тогда, когда предполагаемое значение ЦН/Ц2 т. е. имеющее для + СО всех / смысл выражение I \2d (\\ E (к) f \\2) конечно. — оо Итак, с нашей новой формулировкой Si.— S3. задача выглядит следующим образом: Для данного эрмитова оператора Н мы ищем семейство проекционных операторов Ё(Х) (—cosgXsgco) с такими свойствами: Sj. При X—> — со или X—>-f-oo, ?(Х)/—>0 или —>/ соот- соответственно. При X—>Х0, XS?X0, E(\) f->Е(\q) f (для каждого/!). S2. Из неравенства X'ssX" следует, что + со S3. Интеграл Г X2d( \\E(X)f\\2), по природе своей сходя- — со щийся (равный нулю или положительному конечному числу) или же собственно расходящийся (+оо) характеризует область опре- определения Н: Н/ определено тогда и только тогда, когда этот I7) Это следует из определения интеграла Стильтьеса, данного в прим.73) на стр. 86. Доказательство смотри в указанной там литературе.
8 РАССМОТРЕНИЕ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 91 интеграл конечен (или нуль). В этом случае для всех g +00 (Н/, ?)= fld(E(l)f, g). —00 (Последний интеграл абсолютно сходится, если первый ко- конечен 78).) Сам Н вовсе не входит в формулировку свойств Si., S2. Семей- Семейство проекционных операторов со свойствами Si., S2. мы будем называть разложением единицы («die Zerlegung der Einheit»). О раз- разложении единицы, связанном соотношением S3. с оператором Н, мы будем говорить, как о принадлежащем Н- Итак, проблема собственных значений в Ш^ ставится следующим образом: Всегда ли существует для данного эрмитова оператора Н, принадлежащее Н разложение единицы, и если существует, то сколько? (Нужный ответ должен быть: существует всегда точно одно.) В даль- дальнейшем нам еще останется показать, как наше определение проблемы собственных значений соотносится с общими методами, которыми пользуются в квантовой механике (в частности, в волновой теории) для определения собственных значений эрмитовых операторов. 8. Предварительное рассмотрение проблемы собственных значений Первый вопрос, возникающий в связи с нашей формулировкой проблемы собственных значений, состоит в том, что Si. — S3. звучат совершенно не так, как задача, с которой мы начинали предыдущий раздел, и их взаимоотношение больше не прослеживается. Правда, мы вывели Si. — S3. в 9?„ из первоначальной формулировки, но в Ш^ все соотношения существенно видоизменились. Обе формулировки более не эквивалентны (как они были — что специально отмечалось в свое время—в Шп). Значит, вся проблема в сущности снова остается открытой, и мы должны показать, в какой мере новая формулировка совпадает со старой, т. е. в каких случаях и каким образом наши Е(к) определяют прежние X,, Х2, .. . и ср,, ср2, . .. Если разложение единицы ?(Х) принадлежит эрмитову опера- оператору А, то в каких случаях уравнение Л? = Хоср разрешимо? Уравнение Ар — Хоср означает то же самое, что (Ар. g) — Х0(ср, ?) = 0 ") Ср. Math. Ann. Bd. 102 A929).
92 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II для всех g, т. е. 0= (U(EQ.)f, g)- —ОО ОО ОО ОО = fld(E(l)f,g)-\0 fd(E(K)f,g)=: J(X-Xo)rf(?(X)/, g). — ОО —CO —СО Положим сначала g = E(lo)ft тогда 0= J(X- — СО ОО = J(X-X0)d(||?(Min(X>X0))/||2). — ОО Х„ оо к0 Мы можем разбить теперь Г в сумму f -|- Г. В Г мы можем — ОО оо — ОО —ОО ^0 —00 оо заменить Min(X, Хо) на X, а в Г на Хо. Значит, в последнем инте- грале под знаком дифференциала стоит константа и таким образом он исчезает. Для первого интеграла остается тогда — оо Далее положим g — f, тогда Вычитая из этого первое уравнение, получим (изменив знак подин-
8] РАССМОТРЕНИЕ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 93 тегрального выражения) Рассмотрим теперь интегралы несколько более подробно. Подынтегральное выражение в обоих случаях ^-0 и под знаком дифференциала стоит монотонно возра- возрастающая функция от X. Следовательно, мы имеем для каждого е > О ^ J (X0- —ОО V-. Следовательно, правые стороны ^0, но поскольку они тожде- тождественно ?g 0, то они должны исчезать. Итак, Я(Хо-е)/ = О, Я(Х0 + е)/ = /. Вследствие непрерывности Е(\) спрз' мы можем устремить е—>0 справа во втором уравнении: Я(Х0)/ При Х^Х0 тогда, в силу второго уравнения (е = Х — Х„ >(),), Я(л;/ = /, тогда как для X < Хо, в силу первого уравнения (г = Х0 — X > 0), Я(Х)/ = О, Итак, ДЛЯ Х-Хо> для Х<Х0. Но это необходимое условие также и достаточно, поскольку из него следует, что ?) = X0(/, g) (следует вспомнить определение интеграла Стильтьеса, данное
94 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. 1Г в прим. 73) на стр. 8G), а значит, (Л/— Xq/, g)—0 для всех g, т.е. Л/ = Х0/. Что означает это условие? Во-первых, оно включает разрыв Е(к) в точке X —Хо. По теореме 17. в II. 4, ?(Х) сходится к проекци- проекционным операторам ЕA)(к0) или ?B)(Х0) при Х->Х0, X < Хо и при Х->Х0, X > Хо соответственно 79). В силу Si., Е{2) (X) = Е (Хо), но в слу- случае разрыва ?A) (Хо) =? ? (Хо). Далее, поскольку Я(Х)^?(Х0) при X<X0(S2.), то ?A)(Х0)^?(Х0). Следовательно, ?(Х0) — ?A)(Х0) есть проекционный оператор, и скачок характеризуется тем, что он не равен нулю. Из того, что Е (X) / = 0 для всех X > Хо, следует, что ?A>(Х0)/ = 0, однако (так как Л(Х)^?A)(Х0)), из второго также следует первое. ?(Х)/ = / для всех Х^Х0 следует из Е(К0) f — / г?(Х0)^?(Х), ?(Х)?(Х0) = ?(Х0), но, следовательно, ?(Х)/ = ?(Х)?(Х0)/ = — ?(Х0)/ = /. Значит, уравнение Л/ = Х0/ характеризуется усло- условием ?A)(Х0)/ —0,?(Х0)/ = /, или (теорема 14. в И. 4) {?(Х0)~ — ^'(Хо)}/ = /. И значит, если мы напишем ?(Х0)— ?A) (Хо) = Адх , то из предыдущего следует, что / принадлежит к Ш\о. Тем самым показано, что Л/ = X/ имеет решения / Ф 0 только в точках разрыва непрерывности ?(Х), и что эти решения / обра- образуют замкнутое линейное многообразие 9йх0, определенное выше. Итак, полная нормированная ортогональная система, которую мы искали в II. 6 из решений (с возможно различными X) существует тогда и только тогда, когда все ffixa (—оо < Хо < оо) вместе растя- растягивают замкнутое линейное многообразие 9?оо- [Мы обсуждали в II. 6, как должно быть достигнуто построение этой системы. Взаимную ортогональность 9йх0 можно продемонстрировать теперь другим спо- способом. Из Хо < [х0 следует, что Рт,Ржн = \Е (Хо) - ЯA) (Хо)] [Е ([х0) - ?A) ([х0)] = О, так как Е (Хо) = ?A) (Хо) =§ Е (Xo)sS ?A) ([х0), Я([х0) - ?A) ([х0) ^ 1 - ?;1) (fx0).] Не устанавливая точных критериев, при которых это выполняется, установим только следующее: если существует некоторый интервал jj,j, 79) Это было показано только для последовательностей X. Однако пре- предел всех таких последовательностей X (К -> \0 и X < Хо или соответственно X > Хо) должен быть один и тот же, поскольку две таких последователь- последовательности могут быть скомбинированы в одну—и поскольку эта последователь- последовательность должна иметь предел, то обе составляющие ее последовательности обязаны иметь одинаковый предел. Из этого следует, что и в случае непре- непрерывного изменения X также существует сходимость (к общему пределу всех последовательностей).
8) РАССМОТРЕНИЕ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЯ 95 р.2, в котором Я(Х) возрастает непрерывным образом [т. е. \>.1 < ji2, ?(Х) непрерывна при ц, =g X =i fi2, ?"([Xj) Ф ?(fJ<2)], то это безусловно не справедлива. В самом деле, при X^ijij, Е(к)— Е^] (к) < Е(X) ^ ^?([Х!), в то время как при (а,<Х^[х2, Е(к)—ЯA)(Х)=^0 в силу непре- непрерывности, а при [Х2<Х, Я(Х) —?A)(Х)^1 — ЯA)(Х)^1—f1^). Следовательно, ?(Х)— ^'(Х) всегда ортогонально к Я([х2) — Е(\ь{). Положим Я([х2) — Я([х1) = Ал, тогда все 2ИХ ортогональны к Ш. Если из них будет выбираться полная ортогональная система, то Щ будет содержать только нуль, т. е. E(\>.2) — Е (lh) —0> В противо- противоречии с первоначальным предположением. Разрывы непрерывности Е(Х) мы назовем дискретным спектром оператора А. Это те X, для которых Л/ = Х/ имеет решения / ФО. Если мы выберем из каждого Шх Ф 0 элемент / с ||/|| = 1, то вследствие взаимной ортогональности Ш^ мы получим ортонормиро- ванную систему. В силу теоремы 3. из II. 2, она или конечна, или образует последовательность. Следовательно, и значения X дискрет- дискретного спектра образуют, в максимальном варианте, последовательность. Все те точки, в окрестности которых ?"(Х) не постоянна, обра- образуют спектр А. Мы видели, что если есть интервалы, заполненные спектром А, но не дискретным спектром, т. е. интервалы непрерыв- непрерывности ?(Х), где она не постоянна, то проблема собственных значе- значений безусловно неразрешима в том смысле, в каком она была сфор- сформулирована в начале раздела II. 6. Мы не будем дальше исследовать точные условия неразрешимости: она может также возникать и при несколько других обстоятельствах, когда точки дискретного спектра проникают во все интервалы, где есть точки непрерывного спектра. Отделение дискретного спектра от остальной части спектра — задача значительно более трудоемкая и выходит за пределы этой работы. (Читатель найдет эти исследования в цитированных выше трудах Гильберта.) С другой стороны, мы хотим показать, как при наличии полной ортонормированной системы ср,, ср2, ... решений Лср —Хер (с Х = = Xj, Х2, ... для соответствующих <р = <pt, cp2, ...) — как мы будем говорить, в случае чисто дискретного спектра — должна строиться Х Мы имеем (Сумма 2 может иметь 0 членов, тогда ?(Х) = 0; или положитель- положительное конечное число членов, тогда смысл ее очевиден; или, наконец, бесконечно много, в таком случае она сходится в силу аргументов в конце П. 4.) °) Это точная переформулировка определения Е (?.; 5, -ц), данного в II. 7.
96 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА S2- в сущности очевидно, потому что при X'rsgX", У^ р [ГЛ. II есть проекционный оператор, поэтому ? (X') :== ? (X") (теорема 14.). Si. мы докажем следующим образом: для каждого / |[p]f Р (теорема 7.), т. е. 2||^)r<pl/|2 сходится. Следовательно, для каж- каждого г > 0 мы можем найти конечное число членов р, так что сумма 2- взятая только по этим членам, будет > ||/||2 — е, и, зна- р чит, каждая сумма 2'« из которой они исключены, будет < е. Зна- р чит, также Отсюда, в частности, следует, что если X взято, соответственно, — достаточно малым, достаточно боль- большим или достаточно близким к Хо (и Х>Х0). Тогда 2 f-E(\)f= 2 р = 2 О р т. е. Si. удовлетворяется. Х-> —схз, при Х->+о при Х->Х0, м) Как показывает построение, выполненное при доказательстве тео- теоремы 10., P[?,f = (/, <р) • 9 (если || 91|=1), следовательно, ЦР^/Ц = .= I (/• Ч) I = I (?. /) I- 82) Имеем (по теореме 7.): Это следует также из рассуждений в конце II. 4.
РАССМОТРЕНИЕ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 97 Чтобы убедиться в справедливости 5з-> положим / —jpjf —J— л:2ср2 —|— ... Тогда Л/ = Xjjtjcpj-f-\х2^2Н~ ••• Для того чтобы Af оо оо было определено, 2 ^р I х? I должна быть конечной. Но р-1 (ld(E(l)f, g)= {\d( У x уЛ = прим.83) J J \ м^ Pry —оо \Х Рассмотрим еще два случая чисто непрерывного спектра, т. е. такие, когда вовсе нет дискретных уровней. Пусть Шт есть про- пространство всех функций /(<7], .... <ft) с конечным со оо ... dqt. — onepafop q]% .... эрмитов характер которого очевиден. 83) По прим. п), стр. 86, х=1 Лт_1<Х()ЙЛт Если везде А^ — A^_j < г (Т. е. если Сетка Ло, ..., Ак достаточно частая), оо то выражение меняется на величину, меньшую е 2 I Jfpl2== eH^U2» если мы p=i заменим его на сумму к 2j li \\х?\ = 2j XpUpI и если Ао достаточно мало, а А^ достаточно велико, то оно произвольно оо близко к 2 *р I -*р р- Таким образом, эта сумма есть искомый предел, т е. т= 1 значение интеграла. Следующая интегральная формула доказывается в точности таким лее способом. 7 И. Нейман
98 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. It Мы видим, что Af = X/ приводит к тому, что (qj—X)/(<7j ^г) = О, т. е. /(<7i> .... <7г) —0 повсюду, за исключением только, может быть, (/—1)-мерной плоскости <fy = X. Однако эта плоскость несуще- несущественна (в соответствии со сказанным в II. 3, в связи с условием В.), поскольку ее мера Лебега (т. е. объем) равна нулю. Следовательно, /==084). Значит, никогда не существует решения Л/ = Х/, не рав- равного нулю. Но мы видим также (не строго!), где можно было бы ожидать решения: (q} — X)/(<7i <7,) —0 означает, что / Ф О мо- может быть лишь при qj — \. Линейная комбинация решений с раз- разными X, скажем с Х = Х, X , .... X<s>, была бы тогда /, не равной нулю только в точках ty = X'. X", .... Xw. 84) В этом пункте строгий математический метод, которому мы следуем, ответвляется от символического метода Дирака (сравни, например, его книгу, цитированную в прим. ') на стр. 9). Последний сводится к тому, что /, для которых (q— X)/(<?•) = О, тоже рассматриваются в качестве решений (для простоты мы положили / == у == 1, gj — q)- Однако поскольку все (f,g) — = I / (q) g (q) dq = 0, a / должна быть =?0, то f (q) надо мыслить бес- бесконечной в точке q = X (единственной, где она Ф 0), и столь сильно бес- бесконечной, что (/, g) Ф 0. Поскольку при q ф X, / (q) = 0, то Г / (q) g (q) dq может зависеть только от g (X) и в действительности ясно, что интеграл, в силу своего свойства аддитивности, должен быть пропорционален g (к) Следовательно, он должен быть равен eg (к), и с должно быть отлично от нуля. Если мы заменим f(g) на —fig), мы получим с — \. Значит, мы имеем фиктивную функцию / (q), для которой имеет место j / (q) g (q) dq = Ш Достаточно, конечно, рассмотреть случай X = 0. Обозначим / (q) = b (q), определяя ее условиями: Д. <?S (<?)== 0, J 8 (q) f fo) dq = / @). Для произвольных X, 5 (д — X) является решением. Хотя функции 5 со свой- свойством Д. и не существует, есть последовательности функций, сходящихся к поведению такого рода (конечно, предельная функция не существует), например: i 1 I -к— При \Х < ? /. (<?) = 2е при t -> +0 ( 0 при | х 1 > е или fa{q) = 1/ — е~ах~ при я-> + со. (Сравни также I. 3 и, в частности, прим. зг), стр. 27.)
gj РАССМОТРЕНИЕ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИИ 99 Таким образом, мы можем рассматривать как линейную комбинацию всех решений с XssX0 такую /, которая Ф О только для Х^Х0. Но в случае чисто дискретного спектра у нас было т. е. Щх состояло из линейных комбинаций всех ср с X <Х0 или из всех решений уравнения Л/ = Х/ с X=gX0. Соответственно — разумеется, в неточном и эвристическом смысле! — можно ожидать, что теперь ?(X0) = P3ix, где У1\а состоит из тех /, которые не равны нулю только для уу^Х0. 9^ — Ш\а состоит тогда, очевидно, из тех /, которые для <7/^=Х0 всегда равны нулю, следовательно, Яд Для Я]^К 0 для ^>Х, Значит, мы нашли совершенно нестрогим образом семейство про- проекционных операторов Я(Х), от которых можно ждать, что они удовлетворяют требованиям Si. — S3. для нашего А. В действитель- действительности Si. и Si. удовлетворяются тривиально, а в Si. даже случай X—>\0 без условия X|gX0, т. е. Я(Х) непрерывна как функция X повсюду. Чтобы убедиться в том, что S3. тоже удовлетворяется, достаточно доказать справедливость уравнений: СО / ОО — со V— оо —оо —со со /со со l —оо ~оо X dqt ... dqj^i dqj+i ... со со = / • ¦ f q) I / (?i. ¦ • .,?y_i - qj, qj + v • ¦ ¦ . 7/)Г X ... dqJ_l dqj dqJ+1 ...dqi = \\ Af\\ — 00 -co
100 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II оо fld(E(l) f,g) = — СО оо / оо ( —со ^—со —сю —со \ оо / оо оо I Г ...dqj ...dqi\= i / / —OO ^ —CO —С CO CC X g (?i 4j~u 4], 4j+i, ...,qi)dqt ... dqJ_1 dq} dqJ+t ...dqi = (Af, g). Мы снова, таким образом, убеждаемся, что старая формулировка про- проблемы собственных значений — формулировка для точечного спектра — здесь не пригодна, поскольку Е(\) непрерывно возрастает повсюду. Этот пример указывает нам и в общем случае путь, на котором можно найти Ё(Х) и для непрерывного спектра: мы можем опреде- определить (некорректным образом!) решения уравнения Л/ = Х/ (по- (поскольку X лежит в непрерывном спектре, эти / даже не принадле- принадлежат к 9^!) и образовать их линейные комбинации для всех Х^Х0. Они уже будут частично принадлежать 9^ и, возможно, образуют замкнутое линейное многообразие ЭТх0. Тогда можно положить ?(A0) = Pgj , и если мы правильно выберем его, то может удастся доказать выполнение Si.—S3. (для А и этих ?(Х)), и тем самым post factum преобразовать эвристические аргументы в точные85). В качестве второго примера мы хотим рассмотреть другой важ- важный оператор волновой механики уг -=—. Чтобы избежать ненуж- ненужных усложнений, положим / = У = 1 (так же точно рассматриваются и другие случаи). Итак, мы должны рассмотреть оператор Если область изменения д есть —оо < q <-|-oo, то это эрмитов оператор, как мы убедились в II. 5. С другой стороны, при конеч- 85) Точную формулировку этой идеи (которую мы здесь рассматриваем только как эвристическое утверждение) можно найти в статьях Hellin- ger'a, J. f. Math. Bd. 136 A909) н Weyl'fl, Math. Ann. Bd. 6S A910)).
РАССМОТРЕНИЕ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 101 ной области a^Sq-^b это не так: (A'f, g)-(f. A'g) ^f^f/(q)gW)dq-f/ (q) ~ g' (q) dq = a a b Чтобы это выражение исчезало, область определения ^—г -j—должна быть ограничена таким образом, чтобы для двух произвольным об- образом взятых из нее / и g было бы f(a)g(a) = f(b)g(b), т. е. / (а): f (b) = g (b) : g (а). Если мы будем теперь менять / при фик- фиксированном g, то увидим, что / (а): f (b) должно быть одним и тем же числом 6 во всей области (G может также быть 0 или со); тогда замена / на g приводит к 6=—, т. е. |6| = 1. Значит, для , h д л того чтобы -^ у был эрмитовым оператором, мы должны посту- постулировать «граничное условие» вида (где 6 — любое фиксированное число абсолютной величины 1). Сначала мы возьмем интервал —оо < q < oo. Решениями урав- уравнения Лср —Хер, т. е. у-т ср' (q) — Хер (q) будут тогда функции ?(?) = « h . Однако они непосредственно не могут быть использованы для наших оо оо нужд, потому что Г |ср(<7)|2rf<7 = \ \с\2dq —-\~оо (если только не — оо —оо имеет места с = 0, ср^О). Заметим, что в первом примере мы нашли решение b(q — X), т. е. фиктивную несуществующую функцию (ср. прим.84)). Теперь мы нашли е h , т. е. вполне добропорядоч- добропорядочную функцию, которая, однако, не принадлежит к Ш^ вследствие бесконечности интеграла от квадрата ее модуля. С нашей точки зре- зрения оба эти факта значат одно и то же, ибо то, что не принадле- принадлежит 9?^, для нас не существует86). 86) Конечно, только успех в физических приложениях может оправдать эту точку зрения и ее использование в квантовой механике.
102 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. И Как и в первом случае* образуем теперь линейные комбинации решений с Х^Х0, т. е. функции —оо Нам надо надеяться, что среди них встретятся функции из Ш^ что оные образуют замкнутое линейное многообразие ?Я\0 и, наконец, что проекционные операторы Е(\0) — Рт> образуют принадлежащее оператору Аг разложение единицы. Мы получим подтверждающий первое предположение пример, полагая, скажем, [ 1, для л . . X, <Г Хл, 0, для X < \ l ^ ° г . потому что эта /(^) регулярна при всех конечных значениях аргу- мента и убывает как \jq при д—> ±оо, так что I |/(^)|2^ коне- —оо чен* Но и другие предположения также оказываются выполненными, как то действительно следует из теории интегралов Фурье. В самом деле, эта теория утверждает следующее87): оо Пусть f(x) — любая функция с конечным \\f(x)\2dx. Тогда может быть образована функция — OQ ОО I f(x) = F (у) == -L. feix»f(x)dx, — оо оо для которой интеграл i \F(y)\2dy также конечен и именно равен — оо оо I \f(x)\2dx. Более того, LLf(x)^=f(—х). (Это так называемое преобразование Лапласа, играющее важную роль во всей теории диф- дифференциальных уравнений.) 87) Plancherel, Circ. Math, dl PaJ. 30 A910); T i t с h m а г s h, Lond. Math. Soc Proc. 22 A924).
8J РАССМОТРЕНИЕ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 103 Если мы заменим л:, у на 1/ -^- qt 1/?у Р» то получим пре- преобразование V 00 _2*? — go обладающее теми же свойствами- Именно, оно отображает 9^ на самое себя [Mf(q) = g(p) разрешимо для всякого g(p) из ^оо : / (Я) = Л4# (— РI • оставляет || /1| инвариантной и линейно- Согласно II. 5 этот оператор М унитарен. Кроме того, M2f(q) = = /(—?) и> значит, M~lf(q) = M*f(q) = Mf(— q), так что М коммутирует с Ж2, т.. е, с операцией /(?)—>/(—?)- Далее, то, что мы имели в виду относительно Щ\о, состояло в следующем: f(q) принадлежит к Щ\^ если F(p) — M~~f{q) равно нулю для всех р > Ао. (Здесь F (р) = У he (p) с с(Х), определенным выше.) Но эти F(p), как мы знаем, образуют замкнутое линейное многообразие 91^. Следовательно, и отображе- отображение ^ этого ffix , полученное с помощью М> есть также замкнутое линейное многообразие. Ef (Хо) образуется из Я(Х0) совершенно так же, как Ш[ из !1?х : преобразованием всего 9^ при помощи М. Значит, ?'(Х0) —Л4? (Х0)М~\ Тогда Е* (X) так же, как и ?(Х), об- обладает свойствами 5ь, 5г.. Остается еще доказать S3*, т, е. то, что разложение единицы Е(Х) принадлежит к А\ При этом мы ограничимся тем, что покажем следующее: Если f(q) дифференцируема без особых трудностей в смысле сходимости /h 2 Г 2^r f {q) dq конечен, то и интеграл I \2d\\E(k)f -00 -00 00 также конечен и (Л7/. ?)== f Xrf(?'(X)/, —00 S81 !) То есть ?' (X) принадлежит не самому А* = -=—: -т- , но оператору, область определения которого включает в себя область определения Л' ц совпадает с Л' в этой области, В развитие этого замечания см. IL 9.
104 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА (ГЛ. II В самом деле, \M~xf(q)— F (р)\: 2ra" dq Ы ' (р) ¦ р ¦ е h M dp = M (pF {p)). Следовательно, для упоминавшихся /, А' = МАМ (А опера- оператор q..., или, поскольку мы пользуемся здесь переменной р, то р ...). Поскольку сделанные выше утверждения выполняются для А, Е (к), то они справедливы и после преобразования Шж с по- помощью М. Следовательно, они выполняются также и для А' — МАМ'1 и Е'(к) = МЕ(\)М~1. Существенно иначе обстоит дело для у^--г- в интервале as==q^==b (a <C_b, а и b конечны), когда, как мы выяснили, для сохранения эрмитовости оператора необходимо также граничное условие Уравнение уг -у f (q) = X/ (q) опять решается функцией f(q)=ce" *, но теперь интеграл ь конечен, так что / (q) всегда принадлежит к 9?^. С другой стороны, должно быть удовлетворено граничное условие или, если мы положим 0 = е~ы @<;аЗг2тс), h h (/г = 0, ±1, +2, ...).
g) РАССМОТРЕНИЕ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 105 Следовательно, мы имеем дискретный спектр и нормиррпанное ре- решение определяется теперь условием (Ь—а)|с|2=1, т. е., напри- мер. ^ = 7=3 " (* = 0. ±1, ±2, ...). Таким образом, это ортонормированная система, но она также и полна. В самом деле, если f(q) ортогональна ко всем <?k(q), то еь~а-" f(q) ортогональна ко всем еь~а и, значит, е2т /( 2д л:I ортогональна ко всем е1Ъг, т. е. к 1, cosx, sinx, cos 2л;, sin2л:, ... Кроме того, она определена в интервале — Ь — а —-ь а ^= —о—Jc^o. длина которого равна 2и, так что она должна, согласно известным теоремам, обращаться в нуль89). Следовательно, f(q) — O. Итак, мы имеем здесь дело с чисто дискретным спектром — слу- случай, подробно обсуждавшийся в начале этого раздела. Следует об- обратить внимание на то, как «граничное условие», т. е. 6 или а, оказывает влияние на собственные значения и собственные функции. В заключение мы можем рассмотреть случай полуограниченного интервала, скажем, 0<;<7 < + °°- Прежде всего мы опять должны убедиться в эрмитовости оператора. Имеем (A'f, g)-if. A'g) = ~f (/' (q) glq) + f (q) g4q) dq = Что f(q)g(q) стремится к нулю при q—>-j-oo, показывается так же, как это делалось в П. 5 в случае бесконечного (в обе стороны) интервала. Следовательно, требование должно состоять в том, что /@)g-@) = 0. Если мы положим f = g, то увидим, что «граничное условие» есть /@) = 0. В этом случае обнаруживаются серьезные трудности. Решения уравнения А'у='ку те же самые, что и при интервале — оо < q < -)- со, именно се h ; они не принадлежат к 9?^ 89) Все коэффициенты Фурье исчезают, следовательно, сама функция должна обращаться в нуль (см., например, книгу Куранта и Гильберта, ци- цитированную в прим.30), стр. 25).
106 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА (ГЛ. II и не удовлетворяют граничному условию. Последнее подозрительно. Но еще удивительнее, что, следуя намеченному выше приему, мы должны были бы достичь того же Е(к), что и для интервала — оо<<7< + со, поскольку (несобственные, т. е. не принадлежа- принадлежащие к 9^) решения — те же самые. Как примирить это с тем, что сам оператор другой? К тому же это не то, что нам нужно, так как, если мы опять определим в гильбертовом пространстве Fs функций / оо \ / Г I 1 f (q) 0 2g<7<-|-oo, I \f{q)\2dq конечен I операторы М и М~ : V J / l= F(p) = yj I етРЧ f(q)dq, 0 со 1 J' e—h mf (p)dp (== MF¦(_ p))i то Ж отображает гильбертово пространство Fa' всех /(<7). со 0=S«7 < оо. f\f(q)\2dq, о на другое гильбертово пространство: пространство FS" всех F(p), оо -оо^р<оо, /|F(p)|2rfp. О В то время как, естественно, все еще выполняется ||Л1/(<7)|[ = ||/(<7)|| (это следует из ранее упоминавшихся теорем, если положить в них f(q) = 0 для —со < q < 0), ЦЛ!/7^)!! = ||F(p)||, вообще говоря, не имеет места, поскольку, в силу упоминавшихся теорем, если мы 1 ? -*±ря определим f (q) и для q < 0 формулой / {q) = -7= e Л F(p)dp, у h J —оо ТО — оо = f\f(i)\2dq,
8] РАССМОТРЕНИЕ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 107 И) следовательно, || Ж/7]! < \\F\\, если только случайно f(q) (в той форме, как нам ее только что пришлось определить) не ис- исчезнет для всех q < 0. Следовательно, Е' (X) = ME (к) М~ — это со- совсем не разложение единицы90), т. е. наш метод отказывает. Мы скоро увидим (в прим. 1о5), стр. 128), что это лежит в самой природе вещей, поскольку этому оператору вообще не принадлежит никакого разложения единицы. Прежде чем закончить эти ориентирующие рассуждения, приведем несколько формальных правил вычислений с операторами, предста- представленными в символической форме от А = J X dE (к) с помощью их разложения единицы. Во-первых, пусть F будет проекционным оператором, коммути- коммутирующим со всеми Е(к). Тогда для всех X'< X", || е (X") Ff-E (к') F/ |р = 1 (Е (X") - Е (к')) Ff f = следовательно, поскольку Е(к"), Я(Х'). Е(к")— Е(к), так же как и E(k")F, E(k')F, E(k")F — E(k')F = (E(k") — E(l'))F, суть проекционные операторы, то IIЕ (к") Ff |Р -1| Е (к') Ff |р < IЕ (к") f (Р -1E (X0 / |p. OO 00 Следовательно, J Wd\\E(\)ff^, j k2d\\E(k)Fff. Тогда, по ST., 90) Правда, в действительности верно, что М 1Mf (q) — f (q) (доста- (достаточно определить /(q) = 0 при q <0 и воспользоваться предыдущими тео- теоремами), но не всегда должно выполняться MM~1F (p) = F (р), потому что, вообще говоря, ||^И/г||<||/:'|| и, звачит, ||ЛШ~1/?||<||/!'||. Следователь- Следовательно, М 1М = 1, а ММ~хф\, т.е. М~1 неесть истивный обратный элемент М- (Не может существовать и никакого другого обратного элемента, так как если бы он был, то, поскольку М~ХМ = \, он должен был бы быть равен нашему М'1.) Как следствие этого для Е' (X) = МЕ{\)М~Х, например, за- заключение ?'2 (к) = Е' (X) еще может быть сделано (поскольку сюда входит лишь М~1М), однако Е' (X) -+ММ~1ф\ (при Х->со).
108 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. 11 AF/ имеет смысл, если имеет смысл А/. Далее, тогда оо оо AF = J X d(E (к) F) = J X d(FE (к)) = FA, 9l) — ОО —ОО т. е. Л и F тоже коммутируют. В частности, мы можем выбрать любой Е(к) в качестве F (согласно 5г0- Тогда со оо АЕ (X) = f I'd (Е (Х0 Е (X)) = J I'd (E (Min (X, X'))) = — ОО —ОО X оо X со = / + /= fl' — со X —оо и поскольку Г = 0 (так как функция, стоящая под знаком диффе- X ренциала есть константа), то х АЕ (X) = ? (X) Л = fl'dE (X'). — СО Вдобавок отсюда следует, что X СО ОО t К \ ОО А2 — j X </(? (X) Л) = J X rf| J X'dE(kf) J == прим. 92) = f WdE (k)- — oo —oo \—oo / —oo 91) Собственно это следовало бы доказать не символически при помощи строгого уравнения (Af,g)=fld{E(k)f,g). Тогда преобразования выглядят так: . g) = J * <*(? (X) /7, г) = J X <*(У? (X) /, g) = = J Xd(? (X) /, ^) = (A/, Fg) = Отсюда следует, что Л/14 = FA. 82) Это следует из уравнения х Всегда справедливого ;;ля интеграла Стильтьеса. Это уравнение ясно без Л дальнейшего обсуждения в силу обратного характера операций d и | . Точное доказатедьстио било дано автором: Annals of Mathematics 32 A931).
8] РАССМОТРЕНИЕ ПРОБЛЕМЫ СОБСТВЕННЫХ ЗНАЧЕНИЙ 109 Вообще, мы имеем ОО Л"= Jk"dE(k), —со поскольку мы можем по индукции переходить от п — 1 к п: ОО ОО / Л i Л" = Л'1-1Л= fl"-1d(E(X)A)= f*-"~ld( fk'dE(k')\ = — ОО —ОО \— СО / ОО ОО = прим. 92) = J X"-1 • к dE (к) = J VdE (X). — ОО —СО Тогда, если р(х) = aQ~\-axx-\- ... -\- апх" есть некоторый поли- полином, то со р(А)= f p(\)dE(K) 1 —ОО (под р (Л) мы понимаем, конечно, ОО JdE(k)=l следует из &.). Далее установим следующее: если г (к), s(k) — две любые функ- функции, и если мы определяем два оператора В, С (символически) фор- формулами ОО СО Б = J r{l)dE (к), С = J s (I) dE (к) 93), — ОО —СО то следует, что ОО ВС= J r (к) s (к) dE (к). эз) Это значит СО ОО (В/, ?) = fr (X) d(E (к) /, g), (Cf, g)=? f s (k) d(E (X) /, g).
— оо X СВ = 110 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Доказательство мы проведем в точности так же, как в специаль- специальном случае В = С = А: оо со BE (X) = f r (к') d(E (X') Е (X)) = f г (X') d (E (Min (X, X'))) = > х г (к') dE (X) = J г (X') dE (X'), X со оо , Л , = fs(k)d( fr(k')dE(k')\ = — СО \ —ОО / со оо = J s (X) г (X) dE (X) = j s (X) г (к) dE (к). -со —оо Могут быть легко установлены также следующие соотношения: со со В* = j r(X) rf? (X), аВ= f ar(k) dE (X), -СО —СО ОО fi±C= J(/-(X)±s(X))rf?(X). — со Значит, не существует никаких формальных возражений про- против того, чтобы писать В — г (Л) для таких функций г (X)94). В частности, замечательны следующие (разрывные!) функции: I 1 для X'rgX, — е, (Х') = { „ , ,^ , Имеем для них, согласно Si., А ' ( 0 для X' > X. со X ех(А)= j ex(k')dE(k)= j dE (к') = E (X). — со —со (В начале этого раздела мы обсуждали оператор A = qj . .. . Его Е(X) было умножением на 1 или на 0 соответственно для q^k или q > X, т. е. умножением на ex(q). Поэтому ex(qj .. .) = ex(qj) ... Этот пример очень хорош для того, чтобы дать интуитивное пред- представление о введенной выше концепции.) 84) Точное обоснование этого понятия функции дано автором в Annals of Math. 32 A931). F. Riesz первый определял общие операторные функ- функции с помощью предельного процесса, примененного к полиномам.
9] О СУЩЕСТВОВАНИИ РЕШЕНИЯ ПРОБЛЕМЫ СОБСТВЕН. ЗНАЧЕНИЙ 1 1 1 9. Отступление: О существовании и единственности решения проблемы собственных значений В предыдущем разделе мы рассмотрели вопрос о том, какие раз- разложения единицы Е (к) соответствуют данному эрмитову оператору А только качественно, иллюстрируя его частными примерами. Система- Систематическое изучение этой задачи еще предстоит провести. Правда, во всей математической полноте оно вышло бы за рамки нашей книги, и нам придется ограничиться доказательством нескольких моментов и лишь формулировкой остальных, тем более, что точное знание всех этих соотношений не абсолютно необходимо для понимания кван- квантовой механики 95). Согласно теореме 18., непрерывность линейных операторов выражается в том, что (St.) .|| Л/1| =? С Ц/11 (С произвольно, но фиксировано). По теореме 18. существует и еще несколько эквивалентных форм УСЛОВИЯ S:. (ЯЬ.) КАЛ /)|=ёС-||/|Р (последнее только для эрмитовых операторов). Условие St\. , эквивалентное условию непрерывности, выражает введенное Гильбертом понятие ограниченности. Для ограниченных (т. е. непрерывных) эрмитовых операторов Гильберт поставил и раз- разрешил проблему собственных значений (сравни прим. б4), стр. 78). Но прежде чем обсуждать этот случай, мы должны ввести еще одно дополнительное понятие. Эрмитов оператор А называется замкнутым, если он обладает следующим свойством: Пусть fv /2, ... есть точечная последова- последовательность, все Afn имеют смысл и выполняется /„->/. Afn—>f*, тогда Af также имеет смысл и равно /*. Следует заметить, что можно было бы определить непрерывность способом, весьма близким к этому требованию, именно так: если все Afn и Af имеют смысл и если /п->/. то Afn—>-Af. Различие двух определений состоит в том, что для замкнутости заранее требуется существование предела /* последовательности Afn, и только в этом предположении утверждается, 9S) Теория неограниченных эрмитовых операторов, на которую мы в дальнейшем будем ссылаться (в дополнение к гильбертовой теории огра- ограниченных операторов), была развита автором (см. ссылку в прим.78), стр. 91). Независимо к подобным результатам пришел М. Stone, Ргос. Nat. Acad. Sci. of USA, 1929 и 1930.
112 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II что он равен Af. В требовании непрерывности, напротив, утвер- утверждается и существование /*. Несколько примеров. Пусть 9^, опять будет пространством со всех / (д) с конечным интегралом \\f(q)\2dq (—со < q < со), — оо Л — оператором q ..., определенным для всех / (q), для которых оо оо f |/(<7I2^<7 и Г <721 / (?) I2 dq конечны, а А'— операто- — со —со ром -cj^TT-t определенным для всех всюду дифференцируемых функ- со оо ций, для которых конечны / \f(q)\2dqn / -=—-/'(?) dq. Как мы — со — оо знаем, оба эти оператора эрмитовы. Оператор А замкнут. В самом оо деле, положим /„->/, Л/„->/*, т. е. J \fn(q) — f (q)\*dq-+0; — CO CO f I 4f (Ч) — /*(Ч) I2 dq-^Q. На основе сказанного в II. 3 при дока- — со зательстве D, существует подпоследовательность fn , fn , ... после- последовательности fv /2, ..., сходящаяся к пределу повсюду, за исклю- исключением ^-множества меры нуль /„ (q) -> g (q). Следовательно, со со /U(?) — /(?)|2rf? = 0, f [qg(q) — /4q)\2dq = 0, т. е. всюду, — оо —со кроме множества меры нуль g{q) = f (q) и точно так же qg (q) = /* (q), следовательно, qf(q) — f*(q), т. е. f*{q) и qf{q) не различны суще- существенно. Но поскольку f*{q) принадлежит, по предположению, к SR^, то qf{q) принадлежит к Шт также. Соответственно Af (q) имеет смысл и равно qf(q) — f*(q)- Напротив, оператор А' не замкнут. Действительно, положим fn(q) = e ' n, /(^) = e-l?i. Очевидно, все Afn имеют смысл, но Af не определено (/ не имеет производ- производной в точке <7 = 0). Тем не менее, в чем легко непосредственно убедиться, /„->/¦ Afn-~>f*, если положить f*(q) = — sgn(q)e'"^ (sgn(<?) = —1« 0- +1 соответственно для д<, =, > 0). Покажем теперь, что в отличие от непрерывности замкнутость •— это свойство, которое без особого труда может быть достигнуто для всех эрмитовых операторов. Это достигается при помощи про- процесса продолжения, т. е. путем того, что мы оставляем оператор неизменным во всех точках Sft^, где он был определен, но дополни-
9] О СУЩЕСТВОВАНИИ РЕШЕНИЯ ПРОБЛЕМЫ СОБСТВЕН. ЗНАЧЕНИЙ 113 тельно определяем его в некоторых точках, где он до того опре- определен не был. В самом деле, пусть А — некоторый произвольный эрмитов опе- оператор. Мы определим оператор Л таким образом: Af имеет смысл, если существует последовательность fv /2, ... со всеми имеющими смысл Afn и при том такая, что / есть предел /„ и Afn также обладает пределом /*. Тогда Л/ — /*. Такое определение приемлемо, однако, только в том случае, если оно однозначно, т. е. если из /«->/¦ gn-+U А/п~>Г- Agn-+g* следует, что f* — g*. Действи- Действительно, если Ag имеет смысл, то (/•, g) = \im(Afn, g) = lim(fn, Ag) = (f, Ag), (g*, g) = lim (Agn, g) =± lim (ga. Ag) = (/, Ag). и, следовательно, (/*, g) = (g*, g)- Но эти g всюду плотны и, зна- значит, f* = g*, т. е. мы определили Л корректно. Это А есть про- продолжение А, т. е. повсюду, где Л/ определено, определено и Л/, равное Af: достаточно положить все fn — f и f*—Af. Из линей- линейности и эрмитовости оператора Л те же свойства следуют для А (по непрерывности). Наконец, Л также и замкнут. Действительно, пусть все Л/„ имеют смысл, /„->/. Л/„—>/*. Тогда существуют последовательности /пЛ, f пЛ, ... с определенными Afnitn, /„„,—>•/„. Afn m->/* и Afn = f\ Для каждого п существует Nn такое, что при Следовательно, Af д, — /*->0. Отсюда следует, по определению, что Af = f*. ' п (Следует обратить внимание на то, что не непрерывный оператор никогда не может быть сделан непрерывным с помощью продолжения.) Если оператор В является продолжением оператора Л, т. е. если, коль скоро Af имеет смысл, Bf также имеет смысл и равно Л/, то мы будем записывать это как В$- А или Л -$ В. Мы доказали уже, что Л -$ Л и что А эрмитов и замкнут. Очевидно без дальней- дальнейшего обсуждения, что для каждого замкнутого В такого, что Л -$ В, должно выполняться также Л -3 В. Соответственно А есть наимень- наименьшее замкнутое продолжение Л. (Значит, Л = А) Тесная связь между А я А подсказывает нам, что Л может быть во всех рассуждениях заменено на А, поскольку А естественным образом расширяет область определения Л или, если посмотреть с другой стороны, Л без всякой необходимости ограничивает § И. Нейман
114 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II область А. Сделаем так, т. е. заменим везде А на А, тогда мы сможем считать, что все эрмитовы операторы замкнуты. Рассмотрим опять непрерывный эрмитов оператор А. В этом случае замкнутость эквивалентна замкнутости его области определе- определения. Далее условие || Af\\ < С • \\f\\, характеризующее непрерывность, очевидным образом выполняется также и для А. Следовательно, А также непрерывен и, поскольку область определения А таким образом замкнута, и, вместе с тем, всюду плотна, она должна сов- совпадать с 9tOT. Значит, А имеет смысл повсюду и тем самым каждый замкнутый и непрерывный оператор также повсюду определен. Обратное утверждение тоже верно: Если замкнутый оператор всюду имеет смысл, то он непрерывен (это теорема Тб р И tz'a 96), в дока- доказательство которой мы не можем здесь углубляться). Результат, полученный Гильбертом, состоит в следующем: Каждому непрерывному оператору соответствует одно и только одно разло- разложение единицы. (См. прим.64), стр. 78.) Поскольку непрерывный оо оператор всегда имеет смысл, то интеграл I I? d\\E (к)]]2 всегда — СО должен быть конечен; поскольку, к тому же, он равен ||Л/||2 и, следовательно, по St.^C2- ||/||2, мы имеем Положим теперь f=E(—C—e)g. Тогда Е (к) f=E (Min (к, —C—e))g и, следовательно, для Х> — С — е это константа, так что нам -С-е остается рассмотреть только Г . В этом случае Е (к) f — E (к) g и — со X2 — С2^ (С 4-еJ — С2>2Се, так что -С-ш 0^2Cs J d\\EQ.)g\\* = 2Ce\\E(-C-e)g^, — СО ||?(_C-s)g'||2^0, E(-C-e)g = 0. Таким же путем при f = g — E(C-\-e)g может быть показано, что »6) Math. Ann. Bd. 69 A911),
9] О СУЩЕСТВОВАНИИ РЕШЕНИЯ ПРОБЛЕМЫ СОБСТВЕН. ЗНАЧЕНИЙ 115 Тем самым, для всех s>0 будет Е(—С — е) = 0, Е(С-{-г)=\, т е. Е(к) — 0 при Х< — С и ?(Х)=1 при Х>С. (В силу $Г. последнее выполняется еще и для Х = С.) Итак, Я(Х) измеййется лишь в интервале —С<^Х<^С. Обратно, из этого как следствие вытекает непрерывность А: -С -С Мы видим таким образом, что все непрерывные А исчерпываются разложениями единицы, изменяющимися лишь в конечных интервалах переменной X. Как же обстоит дело для остальных не непрерывных эрмитовых операторов? Ведь можно еще использовать все разложе- разложения единицы, изменяющиеся для сколь угодно больших X, исчер- исчерпают ли они все упомянутые эрмитовы операторы? Необходимо прежде всего правильно оценить то обстоятельство, что эти операторы могут иметь смысл не повсюду. Само по себе мыслимо, что какой-либо эрмитов оператор может оказаться не определенным в тех точках гильбертова пространства, в которых это можно было бы сделать разумным образом. Так, на- например, наш оператор А' = -п—г-$— был не определен для /(<7) = е~1«1, и мы могли бы даже Ограничить -к—г -?— применением только к аналитическим функциям (в интервале —со < q < со, q — вещественно)97) и так далее. . / со / с 97) Даже /(<?), аналитические в —со<<7<оэ I с конечными I \f{q)\2dq, \ -со со , /\ | /' (q) \2 dq, ... \ , всюду плотны в 9^. Действительно, по II. 3, D. линей- -со / ные комбинации функций _ Г 1 для а< q < b, I 0 в остальной области расположены всюду плотно. Следовательно, достаточно аппроксимировать их произвольно близко при помощи упомянутых выше / (q). В самом деле, например, е * +1 будет функцией искомого типа и сходится к fa,b(q) при е 8*
116 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Область определения уже застрахована от слишком произвольных сокращений требованием того, чтобы она была всюду плотной. Далее, мы можем ограничиться замкнутыми операторами. Все же еще и это не достаточно эффективно. Действительно, возьмем, например, опе- оператор А' = -~—r -jT- в интервале OgS^riil и предположим, следова- следовательно, что /(д) всюду дифференцируемы, а интегралы f\f(q)\2dq Г °* и I \f'(q)?dq конечны. Чтобы А' оказался эрмитовым, надо еще о наложить граничное условие /@): /A) — e-'a@^a < 2iu); пусть множество этих / (q) называется %а, а сам А' называется Л\ Рас- Рассмотрим далее еще граничное условие / A) = / @) = 0 и назовем соответствующее множество 31°, а соответственно ограниченный опе- оператор А' назовем A'Q. Все А'а суть продолжения А'о (который эрми- эрмитов, и область определения которого всюду плотна98)) и, следова- следовательно, и замкнутые А'а также суть продолжения A'Q. Все они отличны один от другого и от A'Q. Действительно, явно унитарная операция f(q)->e^f(q) преобразует А' в Л' + Ц-1 и Ste в Sta+p, % в %0; и, значит, А'а в л;_р+|^1. А'о в А'о~{-^\; и, значит, А'а у^ ^ Т° есть из ^==^о сдедовало бы, что А'а_а = А'о, т. е. все А' были бы равны между собой. Тем самым достаточно показать, что А'л Ф А' при а Ф f, а это заведомо так, если Л/, А' не имеют общего эрмитова продолжения, т. е. если А' не эрмитов в соединении Sta и Щ. Поскольку ег°"? принадлежит к 3ta, е1лЯ принадлежит к 31Т и 1 = J 98) Опять достаточно аппроксимировать функции fai,(q), 0^a<6rgl при помощи функций из St°. Например, для этого можно воспользоваться функциями j 1 П (х-а-г)(х-Ь+г) fa, Ь W - у -  th \ 7 " ДГ=Г^) с ?, стремящимся к -1-0.
9] о СУЩЕСТВОВАНИИ РЕШЕНИЯ ПРОБЛЕМЫ СОБСТВЕН. ЗНАЧЕНИЙ 117 то именно этот случай имеет место. Это означает, что замкнутый эрмитов оператор А'о определен в слишком ограниченной области, так как существует его истинное (т. е. отличное от него самого) замкнутое эрмитово продолжение А'а и при этом процесс расширения бесконечно многозначен, так как можно воспользоваться каждым из А' и любой из них будет порождать иное решение проблемы собственных значений. (Каждый раз мы будем иметь чисто дискрет- дискретный спектр, но он зависит от а: набор л(^ + ^)> А = 0, ± 1, ±2,...). С другой стороны, с помощью самого оператора А'о мы вообще не можем ждать никакого разумного решения проблемы собственных значений. В самом деле, мы еще покажем дальше в этом разделе, что эрмитов оператор, принадлежащий какому-либо разложению единицы (т. е. такой, для которого проблема собственных значений разрешима), не имеет ни одного истинного продолжения. Оператор, не имеющий никакого истинного продолжения, — иными словами, уже определенный во всех тех точках, где его можно было бы опре- определить разумным образом, т. е. не нарушая его эрмитова харак- характера,— мы назовем максимальным. Значит, по сказанному, разложение единицы может соответствовать только лишь максимальным опе- операторам. С другой стороны, имеет место следующая теорема: Каждый эрмитов оператор может быть продолжен до максимального эрмитова оператора. (И притом каждый не максимальный, но замкнутый опе- оператор всегда бесчисленными различными способами. Таким образом, единственный однозначный шаг процесса продолжения — это „замы- „замыкание" А->А. Ср. прим.95), стр. 95.) Поэтому наиболее благо- благоприятным решением проблемы, на которое мы вправе надеяться, было бы: Каждому максимальному эрмитову оператору принадлежит одно и только одно разбиение единицы. (Каждый замкнутый непре- непрерывный оператор определен повсюду в 9?^ и является, следова- следовательно, максимальным.) Таким образом, следует ответить на вопросы: Всегда ли обладает максимальный эрмитов оператор разложением единицы? Может ли случиться так, что несколько разложений будет отвечать одному и тому же оператору? Мы начнем с того, что сформулируем ответы: Данному макси- максимальному эрмитову оператору не принадлежит ни одного или принад- принадлежит точно одно разложение единицы, причем первый случай реально встречается, т. е. проблема собственных значений наверняка од- однозначна, но при некоторых условиях неразрешима. Тем не менее последний случай надо рассматривать и известном смысле как
118 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. It исключение. Мы наметим в основных чертах метод, приводящий к этому результату. Если мы применим рациональную функцию /(X) к (бесконечно- (бесконечномерной и диагонализуемой с помощью унитарного преобразования) матрице А, то собственные векторы матрицы А сохранятся, а соб- собственные значения Xlt .... Хл перейдут в /(X,), ..., /(Х„)99). Если теперь / (X) отображает вещественную ось (в комплексной плоскости) на окружность единичного радиуса, то матрицы с лишь веществен- вещественными собственными значениями перейдут в матрицы с собственными значениями, равными по модулю единице, т. е. эрмитовы матрицы перейдут в унитарные100). Этим свойством обладает, например, / (X) = . . : . Соответствующее преобразование U== ' Л:= —'TZTT называется преобразованием Кэли (Cayley). Мы попробуем это пре- преобразование и для эрмитовых операторов в 9?^, т. е. мы определим следующий оператор U : Uf имеет смысл тогда и только тогда, когда / — (Л-)-И)<р = Л<р-)-/<р и именно тогда Uf = (A— Л)<р = Лср— /ср. Мы рассчитываем, что это определение даст нам однозначное Uf для всех / и что U будет унитарным. Доказательство в 9?„ есте- естественно не является более аргументом, поскольку оно предполагает возможность преобразования к диагональной форме, т. е. разреши- разрешимость проблемы собственных значений и даже с чисто дискретным спектром. Но если наши утверждения относительно свойств U пра- правильны, то мы сможем разрешить проблему собственных значений А следующим путем. Для U проблема собственных значений решается таким обра- образом — существует единственное семейство проекционных операторов ") Поскольку мы можем представить себе функцию /(X) апроксими- рованной полиномами, то достаточно рассмотреть полиномы, или их основу, т. е. степени / (I) = Xs (s = 0, 1,2, ...). Поскольку унитарное преобразование здесь не играет роли, мы можем считать А диагональной матрицей; так как диагональные элементы и суть собственные значения, то они суть Хь Х2, ..., Х„. Мы должны, следовательно, показать, что и As диагоиальна и что ее диаго- диагональные элементы суть Ц, Ц> •¦¦> X*, но это очевидно. 10°) Чтобы убедиться в том, что эти свойства характерны для эрмитова или соответственно унитарного характера матрицы, опять достаточно дока- доказать это для диагональных матриц. По отношению к диагональной матрице А с элементами X,, ..., Х„ диагональная матрица А* с элементами X,, ..., А„ есть сопряженная транспонированная; значит, А = А* утверждает, что X, = Хь ..., ХЛ = Х„, т. е. что Хь ..., \п вещественны. А АА* = А*А = 1 утверждает, что ХД, = 1, ..., Х„ХЯ =1, т. е. что | X, | = ... = | Хя | = 1.
gj О СУЩЕСТВОВАНИИ РЕШЕНИЯ ПРОБЛЕМЫ СОБСТВЕН. ЗНАЧЕНИЙ 119 Е(о) (Or==o=i;l), удовлетворяющее следующем условиям: Si. Е@) = 0, ЕA)=1 и при в—>о0, з>о0 имеет место Ef S2. Из о'^о" следует, что Е(о')^Е(р"). Sj. Всегда выполняется (Uf, g) = Г е2"' d (Е (о) /, g) (Uf определено повсюду и интеграл в правой части всегда абсолютно сходится101)). Это доказывается в рамках и средствами теории Гильберта, что оказывается возможным в силу того, что унитарный оператор U всегда непрерывен (см. указанную в прим.64) стр. 78 и в прим.101) лите- литературу). Аналогия с формулировкой Si. — S3. для эрмитовых опе- операторов бросается в глаза. Вся разница сводится к тому, что под интегралом вместо вещественного X, пробегающего интервал — со<>.<-|-со, оказывается комплексная величина е2"", пробегаю- пробегающая окружность единичного радиуса (уже в Ш.п соотношение эрми- товость — унитарность было глубоко аналогично соотношению веще- вещественная ось — контур единичного круга; ср. прим.100) на стр. 118), и что описание области определения оператора в S3. здесь оказы- оказывается излишним, поскольку унитарные операторы определены повсюду. В силу S77, Е(о)/->?@)/ = 0 при о^О (поскольку а^О по самой своей природе!), в то время как при о—>1 (так как а=?1!) не обязательно должно быть E(o)f-+E(l)f = f. Если это в дей- действительности не выполняется, то Е(а) терпит разрыв как раз в точке о = 1. Но поскольку существует проекционный оператор Е' такой, что для о->1, о< 1, Е (о) /->?'/ (ср. теорему 17. в II. 4, а также прим.79) на стр. 94), это означает, что Е' Ф Е(\)— 1, т. е. что ?''/ = 0 также имеет решения /фО. Поскольку Е (о) ^Е', 101) Доказательство этих фактов смотри в работе автора, цитированной в прим.78), стр.91, а также у A. Wintrier'a: Math. Z. Bd .30A929). Абсолютная сходимость всех интегралов I / (a) d (Е (а) /, g) с Ограничен- о ными /(а) доказывается так: Достаточно рассмотреть вещественную часть Re (? (а) /, g), поскольку замена /, g на if, g превращает ее в Im (Е (а) /, g). Но так как Re {Е (а) /, g) = (? (а) 1±М. , *±М^ - (fi (а) t1 ( ±М. , ±М^ (fi (а) ^-, 1~ то достаточно исследовать только (? (а) /, /). Но в интеграле I / (a) d (Е (а) /, /) подынтегральное выражение ограничено, а функция а о под знаком дифференциала монотонна. Таким образом, утверждение очевидно.
120 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II то из E'f = 0 следует, что Е (о) / = 0 для всех а < 1. Обратно, по определению Е' первое следует из второго. Если все E(a)f — 0 (о < 1), то мы убеждаемся совершенно так, как в начале раздела II. 8, что (Of, §¦) = (/, g) для всех g и, следовательно, Uf = f. Напро- Напротив, если Uf = f, то 1 fe^d(E(o)f, f) = (Uf, /)=-(/, /), о i l Re J e™< d (E (o) /, /) = (/, /), J A — cos B*o)) d (E (o) /, /) = 0, о Отсюда, совершенно так же, как в начале II. 8, мы получаем E(o)f = 0 для всех a < 1 (и > 0, но это выполняется и для <з = 0). Тем самым разрыв непрерывности Е(о) при <з=1 означает, что Uf — f разрешимо при f Ф0. Для наших кэли-образов U будет теперь ср = Л/—|— г/, ?/ср = Л/ — If и из ?/ср —ср таким образом следует, что / = 0, ср = 0. При этом Е (о) f—> f должно выполняться также и для о->1. Вследствие этого с помощью отображения (которое отображает друг на друга однозначно и монотонно интер- интервалы 0<а<1 и —оо < X < -f- oo) мы можем получить из Е(а) разложение единицы для F(к) в смысле Si., 5г. (С.) F(k)=E(— iarcctg^), E=F(— ctgico). Мы хотим теперь показать, что Z7^) удовлетворяет условию S3. с оператором А тогда и только тогда, когда Е(о) удовлетворяет условию S3. с оператором U и таким образом свести вопрос о суще- существовании и единственности решения проблемы собственных значений эрмитова (возможно не непрерывного) оператора А к тому же вопросу в отношении унитарного оператора U. Последняя же задача, как было описано, в желаемом смысле решается. Итак, пусть А — эрмитов оператор и U — его кэли-образ. Для начала рассмотрим случай, когда U унитарен, так что для него существует Е(а), удовлетворяющая условиям S\., S2. так же, как и S3.- Образуем теперь F(к) согласно (С,), тогда для него выпол-
g] О СУЩЕСТВОВАНИИ РЕШЕНИЯ ПРОБЛЕМЫ СОБСТВЕН. ЗНАЧЕНИЙ 121 няются Si.. S2.. Если Af имеет смысл, то Af-\-tf — <?, Af—if — U<? и, следовательно, f_t — U<t ,f_ 9 + ^? /— 2/ ' J~ 2 Подсчитаем, в несколько символическом смысле102), -i- ? (с) / = f i=—— d {E (с) ? (с') <р) = о 1 Г 1 — e2ld 6 / о a i—1 «- 2n/a' ОсрЦ2)^ J si 102) Мы применяем здесь интегралы Стильтьеса к элементам Sft^, вместо чисел. Так что все наши соотношения должны пониматься в том смысле, что мы выбираем некоторое фиксированное g из 3^ и вместо каждого элемента Жт, появляющегося в вычислениях, подставляем его внутреннее произведение с этим g. Соотношения выполняются для любых g. В про- противоположность операторным интегралам Стильтьеса в II. 7 это лишь на- наполовину символический процесс; вместо одного g из ffi^ мы должны были там выбирать /, g — два произвольных элемента из 3^ и вместо (..., g) должны были образовывать (.../, g) (точки стоят вместо операторов).
122 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Следовательно, входящий в Sj. интеграл есть О = J ctg2(ua) d I J sin2 (то' о Vo 1 = / ctg2 (iw) -sin2 (its') tf || E (a') cp у2 = 1 Но поскольку он абсолютно мажорируется интегралом Г о = ||<р||2, то он конечен. Далее = y («р + Щ) = y 6 1 р2"'" -4-1 1 — о 1 = / - Ctg (ua) rf И Х -? dE (а') у о ¦ Vo 1 оо = fldF(k)f, т. е. окончательное соотношение из S3. также выполнено. Соответ- Соответственно А есть во всяком случае продолжение того оператора, ко- который, по S3. , принадлежит F (к), но, поскольку (как мы покажем) он максимален, то А должен с ним совпадать103). 103) Здесь содержится неявное допущение, что для каждого данного раз- разложения единицы F (X) такой оператор в действительности существует. Это оо значит, что предполагается, что при конечном I \2d\\F (\) /[|2 может быть
9] О СУЩЕСТВОВАНИИ РЕШЕНИЯ ПРОБЛЕМЫ СОБСТВЕН. ЗНАЧЕНИЙ 123 Рассмотрим теперь обратное утверждение. Пусть F (к) принад- принадлежит А в смысле Si.—S3. Что можно сказать об U? Определим сперва ?(а) при помощи (С). Оно, следовательно, будет удовлет- удовлетворять Si., S2. Пускай (р произвольно. Напишем (опять символически) оо 1 J ^ + i Y •/ — О \ ограничена, то все сходится . Но тогда i d (E (a) E (a') cp) = y ^ =7 -l-e^E^- и, значит, Af + // = J rf? (a) w = cp; Af — tf = J ё1™ dE (a) «p. найдено такое /*, что для всех g- (/*, g) = fid (F (к) f, g) и что / с этим свойством повсюду плотны. (Эрмитовость оператора, определенного таким образом, следует тогда из S3.: нужно поменять / и g в последнем выражении и взять комплексно-сопряженное.) Оба эти предложения доказываются в статье, цитированной в прим. 78), стр. 91).
124 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II 1 Тем самым ?/ср определено и равно I е2кЬ dE (а) ср. Поскольку ср было о произвольно, то U имеет смысл всюду. Если мы образуем внутреннее произведение с произвольным ф и возьмем комплексно-сопряженное, 1 то убедимся, что U*if — Г e-2*h dE(e)ty. Выкладка в конце II. 8 по- о- казывает тогда, что UU* = U*U = 1, т. е. что U унитарен и при- принадлежит Е(а). Итак, разрешимость проблемы собственных значений оператора А эквивалентна унитарному характеру его кэли-образа U. Его единствен- единственность этим установлена и таким образом последний остающийся вопрос это — всегда ли мы можем образовать U, и если да, то когда он будет унитарен? Чтобы ответить на эти вопросы, мы опять начнем с замкнутого эрмитова оператора А. Мы определили U таким образом: Если ср —Л/ + ;/ и только тогда ?/ср имеет смысл и равно Af— if. Но сначала следует пока- показать, что это определение вообще приемлемо, т. е. что для одного ср не может существовать нескольких /. Или, иными словами, что из Af -\- if = Ag -\- ig следует, что / = g, или, в силу линейности А, что из Af -f- // = 0 следует, что / = 0. Мы имеем , Af±tf) = = (Af, Af) ± (Af, if) ± (if, Af) + (//, //) = , f)±i(f, Af)+ ||/||2= Итак, из Л/ + г/ = 0 вытекает ||/||2^-||Л/ + //||2 = 0. / = 0, и, значит, наш способ определения оправдан. Во-вторых, \\Af — lf\\ = = ||Af-\-if\\, т. е. \\U<f\\ = ||cp||. Но, значит, U, коль скоро он определен, непрерывен. Далее, пусть © — область определения U (т. е. множество всех Af-\-lf) и % — область изменения U (мно- (множество всех U/, т. е. множество всех Af — if). Так как А и U линейны, то (? и g суть линейные многообразия, но они еще и замкнуты. Действительно, пусть ср — предельная точка © или § соот- соответственно. Тогда существует последовательность cpj, ср2, . .. из 6 или из § соответственно, сходящаяся к ср: срт —> 9- Значит, yn=Afn i if n. Поскольку срл сходится, они удовлетворяют критерию сходимости Коши (ср. D. из II. 1), и поскольку \\fm- /пШ\\А(/т- fn) ± L(fm- fn)\\ = \Wm-9nh то и /„, безусловно, удовлетворяют этому критерию, но так как
9] О СУЩЕСТВОВАНИИ РЕШЕНИЯ ПРОБЛЕМЫ СОБСТВЕН. ЗНАЧЕНИЙ 125 то и Л/„ также удовлетворяют критерию. Следовательно, /j, /2, . .. и Afv Af2, ... (по D. из II. 1) тоже сходятся: /т->/. Л/т->/*. Поскольку А — замкнутый оператор, Af определено и равно /*. Имеем, следовательно: <?я=Л/я±//„->/*±// = Л/±//. <ря-><р. Но, значит, <р=Л/±//, т. е. <р также принадлежит к б или к g соответственно. Итак, U определен в замкнутом линейном многообразии Ш, и ото- отображает его на замкнутое линейное многообразие g. Оператор U линеен и, так как \\Uf— Ug\\ = \\U{f — g)\\ = \\f— g\\, то оста- оставляет все расстояния инвариантными. Мы назовем его изометрическим. Тем самым из iff ф Ug следует, что f ф g, т. е. отображение однозначно. Верно также, что (/, g) = (Uf, Ug), что доказывается совершенно так же, как в конце II. 5 доказывается аналогичное соотношение для унитарных операторов. Следовательно, U оставляет также неизменными все внутренние произведения. Но унитарным U будет, конечно, тогда и только тогда, когда © = $ = 9^. Если А и В — два замкнутых эрмитовых оператора, U и V — их кэли-образы, а вышеописанными множествами будут соответственно (S, § и ®> §• то сразу видно, что если В есть истинное продолже- продолжение А, то и V есть истинное продолжение U. Следовательно, © есть истинная часть (§,, % — истинная часть ф. Следовательно, Ш-фШ^, § ф Ш^. Значит, U не унитарен и проблема собственных значений А неразрешима. Так мы доказали неоднократно упоминавшуюся прежде теорему: Если проблема собственных значений А разрешима, то не существует истинных продолжений А, т. е. А максимален. Вернемся теперь к замкнутому эрмитову оператору А с его @, § и U. Если Af имеет смысл, то для Af-\-if = y U<? тоже имеет смысл и, именно, Af — if = [/9, следовательно, / — —^(у Af = -н-(ср-f-t/tp), т. е., если мы положим ф==-тр-ср, то/ = ф Af = I (ф + Uty)- Наоборот, для / = ф — Щ, разумеется, определено Af; так как поскольку t/ф имеет смысл, то ф = Af -\-lf {Af опре- определено !), U if = Af — if и, следовательно, / = ф — ?/ф = 2i/'. Область определения Л есть, таким образом, множество всех ф — t/ф и, при / = ф — t/ф, Л/ = г (ф -}- ?/ф). Тем самым Л тоже однозначно определяется по U (так же, как © и g). Одновременно мы убеждаемся, что множество ф — ?/ф должно быть всюду плотно (как область определения Л). Пойдем теперь в обратном направлении, начиная с двух замкну- замкнутых линейных многообразий 6, J и линейного изометрического U, отображающего © на %. Существует ли эрмитов оператор Л, кэли- образом которого является этот W? Во всяком случае для этого
126 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II необходимо, чтобы ф— ?/ф были, всюду плотны, так что это пред- предполагается. Искомый оператор Л определяется тогда, согласно только что сказанному, однозначно, и остается открытым лишь вопрос о том, возможно ли такое определение, будет ли этот А в дейст- действительности эрмитовым, будет ли U в действительности его кэли-обра- зом. Первое, несомненно, справедливо, если / однозлачно определяет ср (когда оно вообще существует) через соотношение / = <р — ?Ар, т. е., если <р = ф следует из ср —?/ср = ф—?/ф или ср=О следует из <р— ?Лр=О. В самом деле, положим <р — ?/ср = 0. Тогда из g = ty — ?/ф следует, что и, поскольку эти g1 всюду плотны, то ср = О. Во-вторых, нам нужно доказать, что (Л/, ?) — (/, Л^), т. е. что (Л/, g-) переходит в комплексно-сопряженное выражение при замене / и g. Положим / = <р — U<f, g = ty — Uty, тогда Af = I (cp—?/<p) и (Л/, g) = (t(<p+U<t), ф — ?/ф) = . ф) — (t/ф, ср)]з= и последнее выражение, очевидно, ведет себя желательным образом при перемене мест / и g, т. е. <р и ф. Ответ на третий вопрос мы получим следующим образом. Обозначим через V кэли-образ Л. Его область определения есть множество всех Af + // = I (<р + t/«p) + / (? — t/?) = 2/ср, т. е. область определения У, и в этой области V B/ср) = V {Af + if) = Af — if = *(<p + Л/ср) — / (<p — t/cp) = 2/t/cp, т. e. Vcp = t/cp. Следовательно, У = /7. Таким образом (замкнутые) эрмитовы операторы Л со всюду плотными ср — ?/ср соответствуют нашим линейным изометрическим U одно-однозначно, если мы отнесем каждому Л его кэли-образ ?/104). 104) Чтобы проблема собственных значений А была всегда разрешима, из этого должна была бы следовать унитарность U, т. е. условие (§ = % = 3fл или Шоо- Как мы вывели из существования не максимальных А, в $«, это не так. Напротив, в 9?„ это должно выполняться, в чем легко убедиться и непосредственно: поскольку каждое линейное многообразие в Шп замкнуто, то то же будет и для многообразия всех ср — U<f, и, поскольку оно всюду плотно, оно равно Щл. @ — множество всех <р — имеет не меньшее число измерений, чем его линейное отображение — множество всех tp — U<f, т. е. имеет максимальное число измерений п. Последнее должно иметь место также и для g — линейного одно-однозначного изображения @. Но при ко- конечном п отсюда следует, что © = % = Шп.
9] О СУЩЕСТВОВАНИИ РЕШЕНИЯ ПРОБЛЕМЫ СОБСТВЕН. ЗНАЧЕНИЙ 127 Мы можем теперь обозреть все В— эрмитовы продолжения А, посколь- поскольку все V — изометрические продолжения U можно найти без всякого труда (ср— Vcp автоматически повсюду плотны, так как ср— Л/ср — подмножество предыдущего множества — всюду плотны). Чтобы опе- оператор А был максимальным, U должен быть тоже максимальным и наоборот. Если U не максимален, то б Ф dlm, % Ф 3^. Из этих неравенств в свою очередь следует не максимальный характер U. В самом деле, тогда SRra — ® —О, Ж^ — %фО; поэтому мы можем выбрать некоторое ср0 из SRra — § и некоторое ф0 из Sft^— S такие, что <?оф0, $0ф0; и если мы их еще заменим на ?0 , ¦ У*.. . мы будем иметь ||<ро|| = |[фо|| = 1. Определим теперь оператор V в [®. ср0] так, что для / = ср -f- #<Ро (<р из ®, а — некоторое число) Vf=U<?-\- аф0, причем V, очевидно, линеен; так как ср ортогональна к ср0 и t/cp ортогональна к ф0, то ||/||2= !|<р||2 + | а |2, ||V/||2 = ^llt/срЦ2-)- | а |2, и, значит, \\Vf\\ = ||/|| и V изометрический опе- оператор. Наконец, V есть истинное продолжение U. Следовательно, максимальный характер А определяется тем, что Ш, = Sft^ или § = З^о- Если, с другой стороны, А не максимален, то оба замкнутых линейных многообразия ffim — ® и Я1т — % отличны от нуля. Пусть ортонормированными системами, растягивающими эти многообразия, будут ср] срр и ^i <|»? соответственно (ср. теорему 9. из II. 2); р=1, 2, ..., оо; q=l, 2 оо; при р или q, рав- равном оо, ряд ср или ф не обрывается. Пусть r = Min(jo, q), тогда мы определим оператор V в [©, срх срг] следующим образом: для г г / = <P + S«v(Pv (9 из ®: ai аг —числа), V/ = Щ + 2 «,<!»,• V=l 11=1 Далее легко убедиться в том, что V — линейный и изометрический оператор и что он является истинным продолжением U. Его область определения — это [®, срх срг], т. е. при г = р она совпадает с [Ш, Шт — ©1 = 9^; его область изменения — это [g, tyv ..., фг] и, следовательно, при r — q она совпадает с [§, ^ — S]==^Co< Значит, одна из двух областей во всяком случае равна Шт. Пусть V будет кэли-образом эрмитова оператора В. В соответствии с нашим рассуждением В есть продолжение А и притом максимальное. За- Заметим, что ср и ф могут быть выбраны бесконечным числом разных способов (например, мы можем заменить ф] на любое бфх с |б| = 1). Соответствующая неопределенность остается и в выборе V и В. Итак, мы до конца проанализировали проблему собственных зна- значений и пришли к следующему выводу: если она разрешима, то она имеет лишь одно решение, однако для немаксимальных операторов она, безусловно, неразрешима. Немаксимальные операторы всегда могут быть бесконечно многими способами продолжены до макси- максимальных (мы все время имеем в виду эрмитовы замкнутые операторы).
128 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ И Но условие максимальности не есть в точности то же, что условие разрешимости проблемы собственных значений. Первое гласит, что © = №„, или S = 9tco, в то время как последнее — что © = SRM и 8 = Я«. Мы не собираемся подробно исследовать здесь те операторы, для которых имеет место первое условие и не имеет места второе, т. е. операторы, для которых проблема собственных значений неразрешима и поскольку (вследствие максимальности) они не имеют истинных продолжений, то это положение для них окончательно. Операторы эти характеризуются тем, что для них A = ^, g ф Ш^, или (s,^9tm, § = Sftoo- Такие операторы существуют на самом деле и все они могут быть получены из двух простых нормальных форм, так что их можно рассматривать как исключения по сравнению с максимальными опе- операторами с разрешимой проблемой собственных значений. Читатель может найти более подробные сведения об этом предмете в статье автора, упомянутой в прим.95) стр. 111. Во всяком случае в настоя- настоящий момент эти операторы должны быть исключены из квантово- механического рассмотрения. Причина этого состоит в том, что раз- разложение единицы, принадлежащее данному эрмитову оператору, столь существенно входит (как мы вскоре убедимся) во все представления квантовой механики, что просто невозможно отказаться от его суще- существования, т. е. от разрешимости проблемы собственных значений 105). В соответствии с этим мы будем, как правило, допускать только такие эрмитовы операторы, для которых проблема собственных зна- значений разрешима. Поскольку это свойство является усилением макси- максимальности, мы будем называть такие операторы гипермаксималь- гипермаксимальными 106). 105) Тем не менее, как указал автор (цитировано в прим.78), стр. 91), следующий оператор является максимальным, но не гипермаксимальным: пусть 9?^ — пространство всех / (q), определенных в интервале 0 ^ <? = + °°> со с конечным интегралом I \f{q)\2dq; и пусть R — оператор, —г-, опреде- о Ленный для всех непрерывно дифференцируемых /(q) с конечным ннтегра* со лом I \f'(q)\2dq и с условием /@) = 0, причем оператор, сделанный -оо 2те замкнутым. Он равен тогда j~ А', если взять А' из II. 8 для интер» вала 0, со, следовательно, эрмитов. Этот R максимален, но не пшермакси* мален. Убедиться в этом можно прямым вычислением 6 и §. Это замечательно потому, что А' = g— R надлежит интерпретировать физически как оператор импульса в полупространстве, ограниченном с одной стороны стенкой q = 0. юб) это понятие восходит к Erhard'y Schmidt'у, ср. ссылку прим.78), стр. 91.
10] КОММУТИРУЮЩИЕ ОПЕРАТОРЫ 129 В заключение следует отметить два класса (замкнутых) эрмитовых операторов, которые в то же время непременно гипермаксимальны. Во-первых, это непрерывные операторы: они определены повсюду и, следовательно, максимальны, а поскольку, согласно Гильберту (смотри ссылку в прим. 64), стр. 78), проблема собственных значений для них всегда разрешима, они также гипермаксимальны. Во-вторых, это операторы, вещественные в какой-либо реализации Ш^, если они максимальны. Ведь единственное различие между б и % по их опре- определению сводилось к знаку перед I, который, если все остальное вещественно, не имеет значения. Таким образом, »5==^со оказывается следствием ® = 3ftTO и наоборот, т. е. гипермаксимальность следует из максимальности. Без предположения о свойстве максимальности мы, во всяком случае, можем сказать, что Sft^ — © и 9?ю — % имеют одинаково много (одинаковое число) измерений. Следовательно (в тер- терминах, принятых выше при исследовании соотношений продолжения), p = q, и, значит, r = p=q и [®. «Pi ?,] = [& &„-&] = &„. IS. *1 <М = [3. 9*00-31=^00. т. е. продолжения, полученные тогда, были гипермаксимальны. Итак, вещественные операторы всегда имеют гипермаксимальные продолже- продолжения. В литературе, указанной в прим.95), стр. 111, показывается, что то же самое справедливо для всех дефинитных операторов. 10. Коммутирующие операторы Два оператора R и S коммутируют согласно данному в II. 4 определению, если выполняется RS = SR; при этом области опреде- определения обеих сторон равенства, если только они не имеют смысл всюду, также должны совпадать. Мы ограничимся сперва эрмитовыми операторами, и притом, чтобы не возникало трудности с областями определения, такими, которые определены всюду, следовательно — непрерывными. Одновременно с R и 5 мы будем рассматривать и принадлежащие им разложения единицы Е(к) и F(k). Коммутативность R и 5 означает, что (RSf, g) — (SRf, g) для всех /, g, т. е. что (Sf, Rg) — (Rf, Sg)- Далее, из коммутатив- коммутативности R с S следует и коммутативность Rn с 5 (п = 0, 1, 2, ...), значит, и коммутативность р (/?) с 5 для всех полиномов р (х) = = ао-\-а1х-\- . .. -\-апх". Символически с с R= jldE(l), s(R)= js(k)dE(k) -с -с 9 И. Нейман
130 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II (С — постоянная, введенная в II. 9 для непрерывного оператора R, который обозначался там через A; s(x)— какая-либо функция; ср. II. 8, особенно прим.94) на стр. ПО.) Для полиномов s(x) выпол- выполняется (s(R)f, Sg) = (Sf, s(R)g), т. е. с с *. f s (к) d (Е (к) f,Sg) = fs(k)d (Sf, Е (к) g). -с -с Поскольку любую непрерывную функцию можно сколь угодно хорошо аппроксимировать полиномами (равномерно в —С ^ х ^.С), то *. выполняется еще и для непрерывных s(x). Пусть теперь (= Хо — л: для х <; kQ, = 0 для *>V тогда *. даст нам \ хо Хо - X) d (Е (X) /, Sg) = / (Хо - X) d (Sf, E (X) g). -с -с Заменяя здесь к0 на Xq-j-s (s > 0), получим, вычитая и деля на е: Хо X0+s fd{E(k)ftSg)+f ^ -с >~а \ Х„+в = fd(Sf,E(X)g)+ f h=L -с ia и при е->0 (вспоминаем Si.!) fd(E (к) f, Sg)= fd (Sf, E (X) g); (E (Xo) /. 5^) = (Sf, E (k0) g). -c -c Таким образом, все Е(к0) для —C^^<^C коммутируют с S, для остальных же это очевидно непосредственно, поскольку для Хо < — С или для к0 > С Е (Хо) = 0 или соответственно 1. Итак, если R коммутирует с S, то то же выполняется и для всех Е (к). Обратно, если все Е(к) коммутируют с S, то *. выпол- выполняется для каждой функции s(x), благодаря чему все s(R) коммути- коммутируют с S. Отсюда мы можем вывести, во-первых, что R тогда и только тогда коммутирует с S, когда это имеет место для всех Е(к), и, во-вторых, что в этом случае коммутируют с 5 и все функ- функции s (R) от R.
10] КОММУТИРУЮЩИЕ ОПЕРАТОРЫ 131 Но теперь некоторое Е(к) будет коммутировать с 5 тогда и только тогда, когда это будет иметь место для Е (к) и всех F (;а) (мы применяем нашу теорему для 5 и Е(к) на месте R и 5). Таким образом, для коммутативности R и S характерно и то, что все Е(к) должны коммутировать со всеми F(\>.). Далее, коммутативность R i\S имеет, согласно сказанному выше, следствием и коммутативность г (R) с S, что в свою очередь (если заменить R, S на S, r (R)) — комму- коммутативность r(R) с s(S). Если эрмитовы операторы R и 5 не связаны условием непрерыв- непрерывности, то положение усложняется, поскольку области определения RS и SR могут слагаться очень ненаглядным образом. Так, напри- например, R • 0 имеет смысл всегда (так как О/ —О, R • 0/ = R (Of) = = R • 0 = 0), а 0 • R, напротив, только если R имеет смысл (ср. ска- сказанное по этому поводу в II. 5). Таким образом, для не всюду опре- определенного R вследствие различия областей определения R • 0 Ф 0 • R, т. е., строго говоря, R не коммутирует с 0. Такое положение вещей чрезвычайно неприятно для наших дальнейших целей: оператору 0 следовало бы коммутировать не только с непрерывными, но и со всеми эрмитовыми операторами107). Мы определим поэтому для не не- непрерывных R, S коммутативность другим способом; мы ограничимся при этом единственно интересными, согласно II. 9, гипермаксималь- гипермаксимальными R и 5. Определяем: R u S должны называться коммутирую- коммутирующими в новом смысле, если все Е(к) коммутируют со всеми F(\>.) (это опять соответствующие им разложения единицы) в старом. Для непрерывных R и S новое определение, как мы уже знаем, совпадает со старым, напротив, для разрывных R или 5 (или обоих) это при некоторых обстоятельствах не имеет места. Примером последнего служит случай операторов R и 0: в старом смысле они не коммути- коммутировали, а в новом — коммутируют, поскольку для оператора 0 ка- каждое F (fj.) равно 0 или I108), следовательно коммутирует с Е (к). Выше мы доказали, что если R и 5 — два коммутирующих (не- (непрерывных) эрмитовых оператора, то каждая функция г (R) опера- оператора R коммутирует с каждой функцией s(S) оператора 5. Поскольку для R = S эта предпосылка выполняется всегда, то две функции r(R) и s(R) одного и того же оператора всегда перестановочны (это сле- 107) Поскольку (ср. II. 5) как R-\, так и \-R имеют смысл тогда и только тогда, когда имеет смысл R, то при а Ф 0 то же справедливо и для R-a\, a\ ¦ R. Таким образом, оба эти произведения равны друг другу, т. е. R коммутирует с а-\. Тем самым коммутативность R с а-\ выполняет- выполняется с единственным исключением, а = 0, R определен не всюду. Это выгля- выглядит очень неизящно и подсказывает нам изменение определения коммута- коммутативности. 108) Оператору а-\ отвечает, как легко вычислить, разложение едн- г. , . Г = 1 для и. *>. а, ницы вида F (jj.) = I ' ^ 1=0 дли р. < а. 9*
132 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II дует и из формулы умножения в конце II. 8: г (R) s (R) — t (R), если г (х) s(х) = t (x)). Если г(х) и s(x) вещественны, то, кроме того, r(R) и s(R) будут эрмитовыми (в силу II. 8: если г(х) вещественна, то (г (Я) )* = ?(/?) = /•(/?)). Справедливо и обратное утверждение: если А и В — два комму- коммутирующих эрмитовых оператора, то существует такой эрмитов опе- оператор R, что оба они будут его функциями: A = r(R), B = s(R). Можно утверждать и несколько большее: если задано произвольное (конечное или бесконечное) множество коммутирующих эрмитовых операторов А, В, С, .... то существует такой эрмитов оператор R, функциями которого будут все А, В, С, ... Мы не можем привести здесь доказательство этой теоремы и нам придется ограничиться ссылкой на литературу вопроса109). Для наших целей понадобится эта теорема только для конечного числа операторов А, В, С, .. . с чисто дискретным спектром. Для этого случая она будет сейчас доказана, относительно же общего случая мы сможем привести лишь некоторые ориентирующие замечания. Итак, пусть А, В, С, ...—конечное число эрмитовых операто- операторов с чисто дискретным спектром. Если X— некоторое число, то назовем 2Х замкнутое линейное многообразие, натянутое на совокуп- совокупность решений уравнения А/ = Х/; соответствующий проекционный оператор назовем Ех. Число X тогда и только тогда будет дискрет- дискретным собственным значением А, когда существуют решения / Ф О, следовательно, для 2Х ф @), что значит ЕхФ0. Аналогично мы обра- образуем 9ИХ и Fx для оператора В, Шх и Ох для С Из Л/ —X/ следует ABf — BAf — В (X/) = \Bf. Это значит, что вместе с / в gx входит и Bf. Так как Exf всегда принадлежит к йх, то то же справедливо и для BExf; тем самым ExBExf = BExf. Это выполняется тождественно, следовательно, ЕХВЕХ — ВЕХ. Применение *. приводит отсюда к ЕХВЕХ — ЕХВ. Следовательно, ЕХВ — ВЕХ. Точно так же, как мы заключили сейчас из коммутативности А и В о коммутатив- коммутативности В и Ех, из коммутативности Вн Ех следует коммутативность Ех и F^. Поскольку А и В никак не были выделены среди опера- операторов А, В, С, .. ., можно утверждать, что все ?х, F^, Gv, ... комму- коммутируют друг с другом. Итак, К (Xjxv • • • )= EXF^Q-, • • • — тоже проекцион- проекционный оператор; его замкнутое линейное многообразие назовем К (Xjxv)- ¦.. Согласно теореме 14. (II. 4), $(X[iv.-.) будет пересечением йх, Ш , 109) Для двух эрмитовых операторов А и В, принадлежащих нашему специальному классу (так называемых вполне непрерывных, ср. прим.70) на стр. 82), Теплиц (ср., например, прим.83) на стр. 29) доказал теорему, из которой следует сформулированная выше (именно, существование полной ортонормированной системы из общих собственных функций операторов А и В). Общая теорема для произвольных А и В или А, В, С, ... была дока- доказана автором в другом месте (ср. прим.94) на стр. 110).
10] КОММУТИРУЮЩИЕ ОПЕРАТОРЫ 133 g^ т. е. совокупностью всех общих решений уравнений Пусть X, (л, v, .... и X', [i/, v', ...—две различные системы чи- чисел, т. е. ХфХ' или [1 Ф(л', или чфч' Пусть / принадлежит к 5t (Xfxv- • •), а /' — к 5t(X'(iV- • •). Функции / и /' ортогональны: для ХфХ' из-за Af==\f, Af' = lf, для рфр' из-за Bf = \>.f, Bf' = \>.'f' Тем самым всё $(Хр---) ортогонально ко всему V Поскольку Л имеет чисто дискретный спектр, то всё SR^ (рас- (рассматриваемое как замкнутое линейное многообразие) натягивается на йх. Поэтому / Ф 0 не может быть ортогональной ко всем 2Х, т. е. по крайней мере для одного 2Х ее проекция в йх должна быть Ф 0, т. е. E-J ф 0. Точно так же должно существовать одно (х с F^f Ф 0, одно ч с QJ фО, ... Вследствие этого мы можем найти для каждой / Ф 0 одно X с ?х/ =? 0, затем цс^ (?х/) =? 0, затем v с Gv (/^ (?х/)) ^= =5^ 0 Так оказывается окончательно, что т. е. что / не ортогональна к 5t(X{iv- • •). Итак, функция /, ортого- ортогональная ко всем 5t (X[i.v- - -), =0. Тем самым на совокупность всех 5t(X(iv- ..) натягивается все $? как замкнутое линейное многообразие. Пусть теперь ср^ )t tp(^v , ...—ортонормированная система, на которую натягивается замкнутое линейное многообразие $(X[iv- • •). (Эта последовательность обрывается или нет, судя по тому, имеет ли 5t(X(xv- • •) конечное или бесконечное число измерений; если, напротив, 5?(Х[лм- ..)г=0, то она состоит из 0 членов.) Каждая tp№ принадле- принадлежит некоторому 5t(X(xv- • •), является, следовательно, собственной функ- функцией всех А, В, С Две различные tpj^' всегда ортогональны^ друг другу: если они обладают одной и той же системой X, р, v то на основании их построения, если они обладают различными си- системами X, (л, v, .... то поскольку они принадлежат к различным 5t(X(xv- • •). Все функции cpW растягивают то же замкнутое линейное многообразие, что и все 5t(X[iv--.) — многообразие St^. Тем самым Ta'v ) образуют полную ортонормированную систему. Итак, мы построили полную ортонормированную систему из одних лишь общих собственных функций операторов А, В, С, . .. В даль- дальнейшем мы предпочтем обозначать ее через фх, <J>2 a соответ- соответствующие уравнения будем записывать в виде Возьмем теперь какую-нибудь систему различных друг от друга чисел хх, х2, х3, ... и построим эрмитов оператор /? с одними лишь
134 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II дискретными собственными значениями %х, х2, ... и соответствую- соответствующими им собственными функциями фр <|>2> • • •. т. е. положим Пусть, далее, F (х)— определенная в интервале —со <•/<-|-оо функция, для которой имеет место F(y.m) = Xm (т—1, 2, . . .) (для всех остальных значений х функция F (у.) может быть произвольной); точно так же О(х) — функция с G(xm) = [im, Я(х)— функция с Я(хт)=чт, ... Покажем, что A — F(R), B — Q(R), C*=H(R), ... Нам надо показать, что, если R обладает чисто дискретным спек- спектром Xj, *2' • • • с собственными функциями <]>], ф2 то F (г) будет обладать чисто дискретным спектром F (%{), F (х2), ... с теми же самыми собственными функциями <tyv ф2, ... Поскольку, однако, функции фр A»2, ... во всяком случае образуют полную ортонорми- рованную систему, то будет достаточно доказать, что F(R)tym = Пусть, в согласии с II. 8, Е(к)=- — принадлежащее R разложение единицы. Тогда, как мы знаем, можно будет записать символически и, по определению, 1!0) xi> *2, хз> ••• следует выбрать ограниченными, например, хт=—, чтобы R оказался непрерывным. Действительно, из непрерывности R, т. е. йз ||/?/||<С 11/Ц, следует тотчас же а из | у.т |< С (т = \, 2, ...) — обратно: 2 / \ R 11/11 = ХтУ-пНт xm4m m=l и 12 Km I r следовательно, оператора R. C2 • ||/||2, ||/?/||g С ¦ ||/||, т. е. непрерывность
Ю] КОММУТИРУЮЩИЕ ОПЕРАТОРЫ 135 Далее = 0 для *т>Х. Отсюда следует, что для всех g М . *) = ^ Ю • (ф„ g). т. е. действительно /="(/?) <J»m == F (xm) ¦ фт. Тем самым доказательство для случая чисто дискретного спектра, как мы и обещали, выполнено. Для случая непрерывного спектра нам придется удовлетвориться указаниями примечания109) (стр. 132). Мы хотели бы только остановиться на одном особенно характерном случае. Пусть SR^ — пространство всех /(ft. q2) с конечным Г fl/(?i> q2)\2dqxdq2, определенных в квадрате O^ft, #2= 1. Обра- Образуем операторы A — qx- • •, В —q2- • •. Они эрмитовы, в рассматри- рассматриваемой области определения на плоскости ft, q2 также и непрерывны (при —оо < ft, <72<-j-oo—нет!), далее, они коммутируют. Следо- Следовательно, они оба должны быть функциями одного R. При этом последний должен коммутировать с А и В, откуда, на доказатель- доказательстве чего мы не будем здесь останавливаться, следует, что R дол- должен иметь вид s(ft, q2)'• • [s(ft. q2) — ограниченная функция]. Но тогда Rn(n = 0, 1. 2, ...) должен равняться (s(ft, ft))"-'-, и F(R) равняться F(s(qv q2))- ¦ •> если F(v.) — полином. Последнюю формулу можно, однако, во что мы также не можем глубже вникать здесь, распространить на все F(%). Итак, из F(R) = A, Q(R) = B следует, что F(s(qx. ft)) = ft. O(s(qv q2)) = q2m). Это значит, что взаимно обратные отображения s(ft, ^2)==х и F(v.) = qi, O(v.) = q2 должны были бы одно-однозначно отображать поверхность квадрата O^ft, <72<[1 на линейное числовое множество переменной х — нечто, что противоречит геометрической интуиции. Однако на основе упоминавшегося выше доказательства мы знаем, что это тем не менее должно быть возможным. И в самом деле, отображение желаемого рода действительно осуществляется посред- посредством так называемой кривой Пэано п2). Внимательное изучение при- приведенного в прим.109) доказательства действительно показывает, что оно приводит в рассматриваемом примере к кривой Пэано или род- родственным ей образованиям. '") На qu думножестве лебеговой меры 0 были бы допустимы ис- ключения! 112) Ср., например, прим. 45) на стр. 41.
136 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II 11. Шпур Мы хотим определить здесь некоторые важные инварианты опе- операторов. Для одной матрицы {а^} из 9?„ таким инвариантом будет шпур л 2 а№- -О" унитарно-инвариантен, т. е. не меняется, если преобра- преобразовать {а^} к другой (декартовой) системе координат113). Если же заменить матрицу {а^} соответствующим оператором л A\xi хп} = {у1 уп), у =2в ,*,, v= 1 то элементы а выразятся через Л следующим образом. Векторы <р,= {1, 0, .... 0}, ср2={0, 1 0}, .... срл={0, 0 1} образуют полную и нормированную ортогональную систему, и, оче- очевидно, а^ = (Лсрч, ср^) (ср. II. 5, в особенности прим. ®) на стр. 75). Итак, шпур выражается формулой 2(^?,*> Тр.)- и ег0 инвариант- ii=i ность утверждает, что его значение будет одним и тем же во всякой полной нормированной ортогональной системе. Такое образование понятия шпура можно немедленно перенести по аналогии в 9^: если А — линейный оператор, то мы выбираем ш) Матрица {а^} представляет преобразование (т. е. оператор) л Чи = У^ц-Д, 0х = 1' • • •• Пу СР- ВЫВОДЫ в U- 7). Если мы будем преобразо- v=l вывать координаты по формулам v=l . (f* = 1 П) <v= 2] vv* (ft v«=i,.... л). p, 1=1 где {a^} — преобразованная матрица. При этом, очевидно, будет л л_ " / " _ \ " A=1 (I, р, О=1 Р, 4 = 1 V=l / р=1 т. е. шпур останется инвариантным. то с из этого v=l получится л 1 п
и] шпур 137 какую-нибудь полную ортонормированную систему tpj, ср2 для которой все Лср^ имеют смысл (этого, безусловно, можно добиться, если область определения Л всюду плотна — достаточно взять в ней плотную последовательность /р /2, ... и ортогонализировать ее ОС с помощью теоремы 8. из II. 2) и полагаем Spur (Л) = 2 (Ар„> <pJ# Надо показать, что так образованная величина действительно зависит только от А (но не от ср^!). Для этой цели введем сперва две полные ортонормированные системы tpi, tp2, ... и фр ф2, ... и положим Spur (Л; ср, ф)= 2 (Л? <K)(tv. ?„). |l, v = l Из теоремы 7. раздела II. 2 следует, что это выражение равняется со 2 tJ. т. е. зависит от ф„ только кажущимся образом. Далее A, v=l |i, v=l p., ¦»=! т. е. Spur (Л; ср, ф) = 5риг(Л*; ф, ср). Поскольку правая часть зави- зависит, согласно сказанному выше, от ср только кажущимся образом, то это же должно быть справедливо и для левой: она зависит, сле- следовательно, только кажущимся образом и от ср^ и от <})„, в действи- действительности же есть функция только от Л. Поэтому мы можем обо- обозначать Spur (Л; ср, <3?) просто как Spur Л. Поскольку он равен оо . <Рц)| то желаемое доказательство инвариантности завершено. При этом из последнего равенства следует еще и Spur (Л) == Spur (Л*). Соотношения Spur (a A) = a Spur (Л), Spur (A±B) = Spur (Л) ± Spur (В) очевидны. Далее, выполняется (и для некоммутирующих Л и В) соот- соотношение Оно доказывается так: со оо Spur (АВ) = 2(АВ%, %) = 2
138 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II где tpj, ср2, ... и <|>], ф2' • • • можно считать двумя произвольными полными ортонормированными системами, и симметрия последнего выражения в А и В (при одновременной перестановке ср и ф) оче- очевидна. Таким образом, для эрмитовых операторов Л и В: Spur (АВ) = Spur ((АВ)*) — Spur (В*А*) — Spur (ВА) — Spur (АВ), следовательно, Spur(AB) веществен (для шпура Spur (Л) это есте- естественно так). Если ¦№ — замкнутое линейное многообразие, а Е — его проек- проекционный оператор, то Spur(?) определяется следующим образом. Пусть Ф], .... <tyk — ортонормированная система, на которую натяги- натягивается линейное многообразие Ш, a Xi1*-*1 Хг — система, растяги- растягивающая 9^ — ¦№ (естественно, что или k, или /, или же оба они бесконечны). Тогда <]>, <J*ft, Xi X; растягивают в совокуп- совокупности все Ш^, т. е. образуют полную ортонормированную систему (теорема 7. а. из II. 2). Поэтому 2iv 4v2% x^S(V W+S x,) (l=I A = 1 A=1 A=1 A=1 т. e. Spur(f') равен числу измерений многообразия ЭЯ. Если оператор А дефинитен, то все (Лср^, ср^)^О и, следова- следовательно, Spur/l>0. Если при этом Spur (Л) = 0, то должны обра- обращаться в нуль и все (Лср^, ср^), и поэтому ЛсрA = О (теорема 19. из II. 5). Если ||ср||=1, то можно подыскать полную ортонормиро- ортонормированную систему срх, tp2, ... с срх = ср (если последовательность fv /2, ... всюду плотна, то мы «ортогонализуем» <р, /х, /2, ...—ср. доказательство теоремы 7. в II. 5—, благодаря чему возникнет начинающаяся с ер полная ортонормированная система), следовательно, будет Лср = 0. Если теперь / произвольна, то для / = 0 конечно будет Л/ = 0, для случая же / ф 0 то же следует из предыдущего, если положить «р === —-tv/- Итак, Л = 0. Это значит, что если Л дефинитен и Ф 0, то Spur Л > 0. При всей краткости и простоте наших рассуждений относительно шпура, математически они не безукоризнены. Действительно, мы рас- со со сматривали ряды 2 (^V W^iV ?„.) и 2j (^Ta- ?J не обращая A, v=I a=I внимания на их сходимость, преобразовывали их друг в друга (ме- (меняли порядок суммирования) — короче, делали все, что при коррект- корректном обращении делать нельзя. Хотя неряшливость такого рода допу-
ill шпур 139 скается в теоретической физике и в других случаях, и хотя данная небрежность и не приведет в дальнейших применениях к квантовой механике ни к какой беде, — надо все-таки ясно заявить, что дело идет о неряшливости. Тем существеннее подчеркнуть, что в основных статистических утверждениях квантовой механики используется только шпур опера- операторов АВ, если и А и В оба дефинитны, и что это понятие может быть обоснованно и совершенно точным образом. Поэтому в остав- оставшейся части параграфа мы установим те свойства шпура, которые доказываются с абсолютной математической строгостью. Рассмотрим сперва шпур произведения А*А (А — произволен, А*А в силу II. 4 эрмитов и вследствие (A*Af, /) = (Л/, ^0 дефинитен). Мы имеем: Spur(.4M)= 2(ЛМТ «р ) = у.= 1 [1 = 1 |1«1 Поскольку этот ряд содержит лишь члены isgO, то он либо схо- сходится, либо расходится к -j-co, т. е. в любом случае имеет смысл. Покажем теперь независимо от предыдущих рассуждений, что его сумма не зависит от выбора <рр Ъ При этом мы встретимся лишь с рядами, все члены которых 2gO, поэтому все будет иметь смысл и любое изменение порядка суммирования будет дозволено. Если срр <р2, ... и фх, <]>2> ...—две полные ортонормированные системы, то определим чу. t) = Согласно теореме 7. f. из II. 2 это выражение равняется 2lH'fJ|2- 11=1 т. е. ? (Л; ср^, i|jv) зависит от <J>V только кажущимся образом. Далее (как Лср^, так и A*ty4 должны иметь смысл), [I, v=l S tJ., v = 1 Поэтому зависимость от <р тоже только кажущаяся, поскольку так обстоит дело для крайнего правого выражения. Тем самым оказы- оказывается, что 2 (Л; с?^, фч) зависит вообще только от Л, и мы назо- назовем ее S (Л). Согласно доказанному выше. p., v = l
140 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. П и ?(Л) = ?(Л*). Таким образом, Spur (Л*Л) определяется заново (и теперь корректно) как ? (Л). Докажем еще независимо некоторые свойства ? (Л), которые следовали бы и из уже выведенных общих свойств шпура. Из определения следует, что всегда Е(Л)>0, а для ?(Л) = 0 должны все ЛсрA==О, откуда, как и раньше, следует, что Л — 0. Это значит, что для Л Ф 0 будет S (Л) > 0. Ясно, что Е(аЛ)== |а|2?(Л). Если А*В = 0, то выполняется: - || В% || 2 = (ЛV Д следовательно, после суммирования Это соотношение не изменится, если переставить в нем Л и В. Следовательно, оно будет справедливым и для В*А = 0. Далее, мы можем заменить Л, В на Л* и В*; следовательно, в равной степени достаточно и условий АВ* = 0 или ВА*~0. Для эрмитова Л (или В), мы можем поэтому написать АВ — 0 или В А — О. Если Е — проекционный оператор замкнутого линейного много- многообразия Ш, то для рассматривавшихся при определении шпура Spur (?) функций «h <lv xi Хг= A=1 A=1 Иными словами, и Е (?) оказывается равным числу измерений М (из-за Е*Е = ЕЕ = Е ничего другого и нельзя было ожидать). Теперь, к ? можно свести 5риг(ЛВ) для двух дефинитных (эрми- (эрмитовых) операторов Л и В. Именно, существуют два таких же опе- оператора А', В' со свойством А'" = A, Bf2 = Bni) — мы назовем их YA и YB- Чисто формально пишем: Spur (АВ) = Spur (Ya Ya Yb У в) = Spur (У'в у~А У л у в) = = Spur((УА УЩ{УА УВ)) = Ъ(УА ]ГВ). П4) Точно это утверждение формулируется так: Если А гипермакси- мален и дефинитен, то существует один и только один такой же оператор А' с А'2 = А. Докажем существование.
и] шпур 141 Теперь эта ? (У A Ув) обладает, — на основании собственного опре- определения и без какого бы то ни было учета связей со шпуром, — всеми свойствами, которые мы ожидаем для шпура Spur (Л^) — именно: Е (У А У В) = Е (У В У А), Е (У~А УЖ+С) = Е (У А У В) + Е (У А /с), ус) = е(Уа ус) + е (Ув ус). Первое следует из того, что Е(АГК) в А' и К симметрично: Е(ЛУ) = 2 |(A-KV t)|2= 2 |(KV ВД2> второе следует с помощью первого из третьего, следовательно, остается доказать лишь его, т. е. что Е ()/Л |Лз) аддитивна в А. Пусть Л = I Ы? (X) — представление оператора А через его соб- —со ственные значения. Поскольку А дефинитен, то Е (X) для X < 0 постоянно (следовательно, согласно Sv, равно 0), поскольку иначе для соответственно выбранных Xj < Х2 < 0 было бы Е (Х2) — Е (к{) ф 0, значит, можно было бы выбрать / Ф 0 с (?(Х2)— ?(Xj))/ = /. Но отсюда следовало бы, как мы уже многократно заключали, для X =s Х2, для ASA,, следовательно, oo Aj А^ (Л/, /)= J ld(E(k)f, /)= J ld(E(\)f, /) =i / X2 rf (? (X)/, /) = —CO Aj A( Поэтому со со со A = J X dEQ.) = J X rf?(X) = J [ж2 rffi (p.2), -oo 0 0 oo и А' = Г (л rf? (|л2) представляет собой желаемый оператор. Подчеркнем: из дефицитности мы заключили о том, что Е (X) = 0 для X < 0. Так как из последнего естественно следует дефинитность, то это, т. е. то обстоятельство, что весь спектр igO, — является характерным для дефи- дефицитности.
142 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Но в последнем мы убедимся, если запишем Т,(У Аув) в виде е {у а У в) = 21У л ув% Г = 2 (/л ув%, у~А ув%) = = 2 (/л • /л V^v /%)- S { 1 1 Тем самым строгое обоснование понятия шпура в том объеме, который мы признали выше желательным, проведено. Последняя формула позволяет сделать и следующее заключе- заключение: если А и В дефинитны, то АВ = 0 является следствием ра- равенства Spm(AB) = 0. Действительно, последнее утверждает, что 1>(У Аув) = 0, следовательно, и У Л |/ В =0 (ср. сказанное на стр. 140 или следующее ниже рассмотрение Е); следовательно, ав = У А ¦ у~л.уъ • /2F = о. Для дефинитного эрмитова оператора А вычисления со шпуром корректны и в первоначальной форме. В самом деле, если <pi> <Р2> • • • — полная ортонормированная система, то 2 (-^Tu.- ?J (сумма, кото- рая была призвана определить шпур !) будет суммой с только не- неотрицательными членами и, следовательно, будет или сходиться, или собственно (к + оо) расходиться. Теперь могут встретиться два случая: или эта сумма бесконечна при любом выборе <pj, <р2, ..., — тогда шпур действительно определен независимо от ср,, <р2 а именно равен -)- со, — или же она по крайней мере при одном вы- выборе <pi> ?2 пусть при <pi> %¦ •••> конечна, но тогда из-за оо v % ?v)^ 2 K^v ?,)|2=Е(л) (Л., V=l (JL, V=l будет конечной и Е(Л), пусть, например, равной С2. Если теперь tjij, ф2, ... — какая-либо полная ортонормированная система, то Поскольку каждое <|> с ||ф|| = 1 можно выбрать за tyt такой системы, то из ||<|>|| = 1 следует ||Л^||^;С. Тем самым в общем случае будет ||Л/||^С||/||: для / = 0 это очевидно, а для /ФО достаточно положить <р = —у-/. Но тем самым А удовлетворяет условию St. из II. 9, т. е. Л будет непрерывным оператором. Однако можно утверждать и значительно больше.
п] шпур 143 Именно, из-за конечности Е(Д) оператор А принадлежит к классу так называемых полностью непрерывных операторов, для которых Гильберт показал, что проблема собственных значений разрешима для них в первоначальной форме, т. е. что существует полная орто- нормированная система <|>lt <|>2, ... с Aty = \ ф (и притом еще Х^—>0 для (л —> оо)п5). Из дефинитности А следует, что ^V 1)ц)>0' далее = S(А) = Если cpj, <p2, систему, то 2 образуют некоторую полную ортонормированную со/со со / со ( 2( S |i=l\v = со / со ( = 2 ( 21 l \ 1 115) Ср. прим.64) на стр. 78. Прямое доказательство удается провести следующим образом. Пусть Ха < \г < Х2 < ... < К„, все они > е или же все< — е,?(Х0) фЕ(\1)фЕ(\г)ф...фЕ(к„). Тогда ?(Х.,) — ?(Х,_,) ?= О, следовательно можно выбрать <pv ф 0 с (?(A.V) — Е(К^_{)) <pv = <pv, откуда следует, что ?(K)<pv = | v ^ "" . Мы можем достичь и ||«р,|| = 1. Из (О для л<л„_, сказанного следует, что (<р^., <pv) = 0 для р. Ф •». Тем самым функции <Pi, ..., <р„, образуют ортонормированную систему и мы можем расширить ее до полной «pi ?п. ?л+1. ••• Выполняется (v = 1, ..., я) J Следовательно, С2 что значит, что я < —=- . Таким образом, для | К | > s E(l) вообще может С2 принять только <;2 • —^ различных значений, т. е. меняется лишь конечным числом скачков, между которыми лежат интервалы постоянства. Но это значит, что при | X | > е имеется только дискретный спектр. Поскольку это справедливо для всех е > 0, то и вообще существует только дискретный спектр.
1 44 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Поскольку всё ^- 0, мы вправе переменить порядок суммирования 2(\ %) 2 J(v WI2aB A=1 |Х, V=l V=l \(JL= 1 2 v=l oo Итак, и в этом случае 2 (^Tu.. ?J оказывается не зависящей от <Pj, <p2 а именно равной сумме собственных значений. Поскольку для системы <рр ?2> • • • она конечна, то, значит, она конечна и всегда. Итак, Spur Л опять окажется однозначным, только теперь конечным. Тем самым мы обосновали обращение со шпуром в обоих случаях. Получим еще несколько результатов, относящихся к шпуру Spur (Л) и к Е(Л). Для всех А с конечной 2(Л) выполнялось Ц/1/11 ¦^УЕ(Л) • ||/||, для всех дефинитных (эрмитовых) Л с ко- конечным шпуром—|| Л/1|.^ Spur (Л) • [|/||. Пусть теперь Л — дефи- дефинитный оператор, Spur (Л) =1 и для соответственно подобранной <р с ||<р|| = 1 ||Л<р||2^1—s или (Ар, <р)^>1—s. Поскольку из-за (Лкр, <р)<^|| Л<р|| • ||<р|| = || Ар|| первое условие следует из второго (с A—еJ^>1—2е вместо 1—е, значит с 2е вместо е), то доста- достаточно рассмотреть только его. Пусть <|> ортогональна ср, ||ф|| = 1. Тогда можно найти полную ортонормированную систему %v %2, ... с )Q = <p, ^2 = ф. Следо- Следовательно, Для произвольной ортогональной к <р функции / отсюда следует || Л/||<; |/е II/H (для / = 0это ясно, в противном случаеty —jjj A ¦ Если учесть еще, что (Л/, g) = (/, Ag), то мы сможем сказать, что КАЛ g")|-^Vs • II/H • \\g\\, если / или g ортогональна к <р. Если теперь fug произвольны, то где /' и g' ортогональны к <р, а а = (/, <р) и р = (§•, <р). Таким образом, (Л/, ?) = а
и] шпур 145 следовательно, если положить (Лср, <р)=с, |(Л/, g-)-*Fc|<l*l • К Ар. g')\+№ • \(Af. ?)| + |(Л/', g')\ и, согласно полученным выше оценкам, _ <2/2^.1/|«|2+11Л12/|Р12+1к'||2 = 2 У2г. II/H • \\g\\. С другой стороны, (Л/, g) — caf={Af, g) — c(f, ?)((p. g) = ((A — cPM)f, g). Поэтому всегда выполняется |((Л— cP[f])f, ^)|<2 ]/s • ||/|| • \\g\\» а значит, как мы знаем из II. 9, и Для / = <р это дает (с = (-Дер, <р) вещественно и ^> 0): —с? II < 2 | <||рр|| 1>-||^(р_С(р|Ц-И<р||> У2г. Поэтому /27)|| PMf |K Итак, для е—>0 Л равномерно сходится к Р^. В заключение рассмотрим еще шпур Spur (Л) и ?(Л) в реализа- реализациях Fz и Fa пространства 91^ (ср. I. 4 и II. 3), поскольку именно в них будут получаться физические следствия. / В Fz (множество всех {xls х2, ...} с конечной 2 I-^J2) опе" ратор А описывается матрицей {а^}: оо A{XV X2, ...} = {yv y2, ...}, у =S fl,xv^V ц = 1 Векторы A, 0, 0, ...], {О, 1, 0, ...}, ... образуют полную орто- нормированную систему <pi> Ъ> • • • и Ау — {а: , в2 , ...} = оо со = 2 flfA- следовательно, (Ар. ср ) = в , И?11||2= 2 |ap(J,|2. 10 И. Нейман
146 ОБЩИЕ СВОЙСТВА ГИЛЬБЕРТОВА ПРОСТРАНСТВА [ГЛ. II Отсюда сейчас же получаем = 1 |в | В Fs (множестве всех определенных в 2 функций f (P) с конечным I \f(P)\2dv) мы рассматриваем только интегральные операторы А/(Р)== j a (P. P')f(P')dv' 2 (й(Р, Р') — определенная в 2 функция двух переменных, «интеграль- «интегральное ядро», ср. I. 4). Если ^i(P), <?2(P)< ••• —некоторая полная ортонормированная система, то ix=i a а <?' рг>> ^(р/) dv'] J и, поскольку всегда выполняется (теорема 7.C.) из II. 2 в при: менении к g(P) ) S е(П%(П dv'\ ^ (Я)= то Далее имеет место Spur (Л) = j a(P, P) dv. jl=1 2 f "(Р> n<?^P' dv. значит из-за (теорема 7.^. из II. 2) <v'= f\g(P')\*dv'
и] шпур 147 и = f f\a(P, Я')|2dvdv''. 2 2 Мы видим, что операции Spur (Л) и Е(Л) производят то, что было достигнуто в разделе 1.4 ценой применения математически весьма рискованных искусственных приемов: при переходе от Fz к Fs сумма заменяется интегралом I • • • dv. ,х1 Мы продвинулись теперь в математическом изучении эрмитовых операторов достаточно далеко. Дальнейшие сведения по этому пред- предмету интересующийся математической стороной читатель найдет в при- примыкающей литературе116). 116) Кроме упоминавшихся по ходу рассуждений оригинальных исследо- исследований сюда в первую очередь относится статья Хеллингера и Теплица в энциклопедии математических наук (ср. прим.33) на стр. 29).
ГЛАВА III КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА 1. Статистические утверждения квантовой механики Возвратимся теперь к анализу квантовомеханических теорий, пре- прерванному математическими рассуждениями главы II. До сих пор мы обсудили лишь, как позволяет квантовая механика определить все возможные значения одной определенной физической величины, энер- энергии,— это будут собственные значения оператора энергии Н. т. е. числа из его спектра. Напротив, вопрос о том, что может она ска- сказать о значениях других величин, равно как о причинных или ста- статистических связях между ними, не был затронут. Теперь нам надо заняться теми утверждениями теории, которые относятся к этим про- проблемам. За основу примем волново-механический метод описания, так как эквивалентность обеих теорий уже установлена. При таком методе описания ясно, что все, что мы хотим сказать о состоянии системы, надо извлекать из ее волновой функции ср(<7!, .... qk). (Пусть у системы k степеней свободы и qv ..., qk — координаты ее конфигурационного пространства.) При этом мы не будем ограничиваться только стационарными состояниями системы (квантовыми орбитами, волновые функции <р которых являются соб- собственными функциями оператора Н: H<? = ty, ср. 1.3), но допускать все состояния системы, т. е. любые волновые функции <р (изменение которых определяется временным дифференциальным уравнением Шре- дингера: N9 = — Т^~~дГ^' СР" ^¦^)% Какие же высказывания можно сделать относительно системы, находящейся в состоянии ср? Прежде всего заметим, что волновая функция <р была нормиро- нормирована (I. 3) соотношением J ...
1] СТАТИСТИЧЕСКИЕ УТВЕРЖДЕНИЯ КВАНТОВОЙ МЕХАНИКИ 149 т. е. в нашей новой терминологии — как точка гильбертова простран- пространства 9^ всех / {qv .... qk) с конечным l ...dqk (некоторого Fs\) — соотношением ||<р||=1. Иными словами, точка должна лежать на поверхности единичного шара в гильбертовом про- пространстве ш). Мы уже знаем, что постоянный (т. е. не зависящий от <7j qk) множитель в ер лишен физического смысла. (Т. е. можно заменить ер на а<р, а — комплексное число. В силу нормировки ||ер|[=1, должно быть |а| = 1). Далее, надо указать еще на то, что ер, помимо координат q1 qk конфигурационного простран- пространства нашей системы, зависит еще и от времени t; однако гильбер- гильбертово пространство строится лишь относительно qx qk (ведь и нормировка относилась только к ним), не учитывая зависимости от t, которое следует скорее рассматривать как параметр. Вследствие этого ср. как точка Ш^, зависит от t, но, напротив, не зависит от qx qk: ибо как точка Ш^ ер представляет всю функциональную зависимость от qv .. ., qk в целом. Поэтому мы будем иногда ука- указывать параметр t в ер (когда ер рассматривается как точка Э^), за- записывая ер<- Итак, рассмотрим состояние <p = <p(^j, ..., qk). Статистическое утверждение, которое можно тогда сделать, гласит: система находится в точке q1 qk конфигурационного пространства с плотностью вероятности |ep(<7i. •••. <7а)|2. т. е. вероятность того, что система окажется в объеме V конфигурационного пространства, будет равна (Это один из первых и самых простых примеров, на которых был осознан статистический характер квантовой механики1'8); впрочем, связь между этим утверждением и предположением Шредингера о рас- распределении заряда [ср. I. 2] является очевидной.) Далее, пусть энер- энергии системы соответствует оператор Н. его собственными значениями 117) Согласно геометрической аналогии, шаром в dim с центром <р0 и радиусом г должно быть множество точек, для которых ||/ — <ро11^=Л его внутренностью — множество ||/ — foil < Л а поверхностью — множество II/ — 9о\\ —г- Для единичного шара <ро = О, г=1. 118) Первые статистические утверждения о поведении системы, нахо- находящейся в состоянии <р, восходят к М. Борну; более детально вопрос рас- рассматривался Дираком и Иорданом, ср. ссылки в примечаниях8) и2) на стр. 13 и 10.
150 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА будут Xj, Х2, .,., а собственными функциями — <fv cp2 вероятностью значения энергии Х„ в состоянии <р будет [ГЛ. III тогда IJ (Ср. работы, упомянутые в прим.118).) Желательно теперь объединить эти два утверждения и придать им единую форму. Пусть V — fc-мерный параллелепипед Обозначим интервалы [q'v q"A, ..., [q'k, q"A соответственно через /j Ik. Координатам q1 qk сопоставляются операторы qx- ¦ • qk- ¦ • соответственно. Разложения единицы, принадлежащие этим операторам, определим следующим образом (ср. II. 8): разло- разложение, принадлежащее qj(jz=l, .... k), обозначается ?,(Х) и Як) 0 для Введем следующее общее обозначение: если F (X) — некоторое раз- разложение единицы, а / — интервал {X', X"}, то положим F(I) = =r=F(\") — /7(Х/) (это — проекционный оператор, так как при X'sgX" F(к')si F (X")). Тогда вероятность того, что система находится в ука- указанном выше объеме V, т. е. что qx лежит^в Iv .... qk в 1к, со- составит «1 «"к f ... J \<f{qv .... qk)\idql ...dqk=* = J ... /|ВД) ... Ek(Ik)9(qv .... qk)\*dqi ...dqk (поскольку ?i(/i) ... Ek(Ik)<f(q1 qk)=xV(qi qk), если qx принадлежит Iv ..., qk принадлежит 1к, а в остальных случаях = 0), В качестве второго примера рассмотрим вероятность того, что энергия лежит в интервале /, равном (X', X"}. Разложение еди- единицы Е(Х) оператора Н определено (ср. II. 8) как Е(к)= 2 Р\ч ь поэтому
1] СТАТИСТИЧЕСКИЕ УТВЕРЖДЕНИЯ КВАНТОВОЙ МЕХАНИКИ 151 Но рассматриваемая вероятность, — поскольку лишь значения энер- энергии \v Х2, ... относятся к делу, — является суммой вероятностей всех Х„, для которых Х'<Х„^|Х", и, следовательно, равна i 4k)d4i ••• Итак, в обоих случаях достигается результат, который можно сформулировать следующим образом: (W.) Вероятность того, что в состоянии ср величины с опе- операторами Rv .... Rtm) принимают значения из соответствую- соответствующих интервалов Iv .... /г, равна где ?\(Х), ..., ?;(Х) — разложения единицы, принадлежащие операторам Rx Rt соответственно. Первый случай соответствовал 1 = k, R1 = q^ , ,. •, Rk = qk второй —1=1, /?j = H. Мы хотим теперь принять, что утвержде- утверждение W. справедливо и в общем случае; в самом деле, оно включает в себя все статистические утверждения квантовой механики, сделан- сделанные до сих пор. Одно ограничение его применимости все же необходимо. По- Поскольку при постановке задачи порядок операторов Rv ..., Rt со- совершенно произволен, то он не должен сказываться и на результате, т. е. операторы El(Il), .... ?г(/г) или, что то же самое, все опера- операторы EiQ~i), ..., ?г(Х,) должны коммутировать между собой. Со- Согласно II. 10, это означает, что /?j Rt коммутативны. Это усло- условие выполняется в случае qx-¦ •, ..., qk-", а при / = 1, /?j = H оно даже беспредметно. Итак, постулируем W. для любых коммутирующих операторов /?, Rv Тогда Е1A1), .... f;(/j) взаимно коммутируют и, следо- we) В IV. 1 мы обсудим более обстоятельно вопрос относительно этого соответствия, сопоставляющего каждой физической величине эрмитов опе- оператор. Пока же мы знаем лишь на основании 1.2, что операторы q,,..., q. соответствуют координатам,операторы -^"л—> ••••1Г~г'7э— соответствуют импульсам, а «оператор энергии» Н —энергии.
152 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. Ш вательно, Е1 {[{) . . . Et {Ij) будет проекционным оператором {тео- {теорема 14. в II. 4), а рассматриваемая вероятность принимает вид {теорема 12. в П. 4.). Прежде чем идти дальше, надо установить некоторые свой- свойства W., которые должны иметь место в любой разумной статисти- статистической теории. 1. Порядок утверждений безразличен. 2. Пустые утверждения, т. е. такие, для которых fj есть интервал {—оо, -f-oo}, можно вставлять по желанию, не изменяя W, ибо их вклад сводится лишь к множителю Ej (/) = ?(+ оо) — ?(— оо) = 1 — 0 = 1. 3. Выполняется теорема сложения вероятностей, т. е. если мы разобьем интервал Ij на два интервала /у, /;-, то старая вероятность будет суммой двух новых. Действительно, пусть /у, Ij, I} обозначают соответственно интервалы {X', X"}, {X', X}, {X, X"}, тогда Е (X") - Е (X') = {Е (X) - Е (X')) + {Е (X") - Е (X)), т. е. E{Ij) = e(i'j)-\-E(Ij), что в силу второй из приведенных выше форм W (линейной по Ех {!{) ... Е}{1}) ... ?г(/г)) и дает аддитив- аддитивность вероятностей. 4. Для абсурдных утверждений (один из /у пуст) W — 0, по- поскольку в этом случае соответствующее Ej{Ij) = O. Для тривиально справедливых предложений (бее fj равны {—оо, -|-оо}) W=\, по- поскольку тогда все Ej{Ij)=\, U^ = ||cp||2= 1. Всегда имеет место неравенство 0^Ws=l в силу теоремы 13. из II. 4. Наконец, заметим, что W. содержит утверждение: величина Rj может принимать лишь свои собственные значения, т. е. числа из ее спектра. Действительно, если интервал Ij, равный {X', X"}, лежит вне спектра, то ?/(Х) постоянно в нем и, значит, ?,(/,) = Еу(Ь")-?у(Х') = О, откуда следует, что W = 0. Положим теперь / = 1 и обозначим R1 просто через R. Пусть Ш — та физическая величина, которой сопоставляется оператор R (см. прим.119)). Пусть F(k) — произвольная функция. Требуется вы- вычислить математическое ожидание F{ffi). Для этой цели разделим интервал {—оо, +°°} на последова- последовательность подинтервалов {Х„, Х„+1}, я = 0, ± 1, ± 2, . .. Вероят- Вероятность того, что Ш лежит в подинтервале {Х„, Хп+1}, будет ( № (W - Е (Х„)} <р, <р)»(Е (Хп+1) ср. ?) - {Е (Х„) ср, ср),
I) СТАТИСТИЧЕСКИЕ УТВЕРЖДЕНИЯ КВАНТОВОЙ МЕХАНИКИ 153 и математическое ожидание F(ffi) оказывается, следовательно, рав- равным сумме если Х^ является надлежащим промежуточным значением из подинтер- вала {Х„, Хя+1}. Начнем теперь выбирать точки подразделения ..., Х_2, Х_! Хо, Xj, X2, ... все более и более близкими, тогда эта сумма будет сходиться к интегралу Стильтьеса оо f F(l)d(E(k)9, cp). —оо Поэтому рассматриваемое математическое ожидание также равно этому интегралу. Но в силу общего определения операторной функ- функции в II. 8 этот интеграл равен (F(/?)cp, ср)- Следовательно, мы пс- лучаем: (Ei.) Пусть 91 — произвольная физическая величина, R— ее оператор (см. прим. п9)), a F(l.)— произвольная функция. Тогда для математического ожидания F(ffi) в состоянии ср выполняется Erw (/>(«); <р) = 0Р(Я)?. ср). В частности, если мы положим F(k) = \, то будет: (?г.) Пусть Ш, R будут как и раньше. Тогда для матема- математического ожидания Ш в состоянии ср имеем Erw(«; ?) = (/??. ?). Перейдем теперь к исследованию связей между W., Е\„ Е2.. Мы вывели Ей из W. и Е2. из Ei.. Если обозначить оператор величины F (Ш) через S, то сравне- сравнение Ei. с Ег. даст нам для любого состояния ср> т- е. для всех ср с ||ер||= 1. Следовательно, и вообще E/, f) = (F(R)f,f) (для / — 0 это очевидно, а в остальных случаях ср ==——/), зна- значит, также (Sf,g) = (F(R)f,g) заменить / на ^ g и на ~Г^ и результаты вычесть — получим равенство вещественных частей; беря if, g вместо /, g — мнимых
154 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III частей). Таким образом, должно быть S = F(R). Сформулируем этот важный результат отдельно. (F.) Если величине Щ соответствует оператор R, то вели- величине F{91) должен соответствовать оператор F (R). В предположении F., однако, Е\. очевидным образом следует из Е2. • Поэтому (предполагая F.), Е\. и Е2. являются эквивалентными утверждениями. Покажем, что они эквивалентны также и W.. По- Поскольку они следуют из W., то остается лишь убедиться, что W. следует из Ей или из Е2.. Пусть /?i Rt— взаимно коммутирующие операторы, при- принадлежащие соответственно величинам Ш1, ..., Ш^ Согласно 11.10, они являются функциями одного эрмитова оператора R: Примем, что R также принадлежит некоторой величине 91. (Этим самым допускается, что любой величине 91 принадлежит некоторый [гипермаксимальный] эрмитов оператор R и наоборот. Ср. прим. п9) на стр. 151 и раздел IV. 2.) Тогда благодаря F. Допустим теперь, что 1Х /г — интервалы, о которых говорится в W., и 1 для X из {1 для X из Ij, 0 для X вне Ij С/=1 Положим и образуем величину = //(«). Если 91, лежит в /,, т. е. /^(91) лежит в /,, то ОД/7, (91)) равняется 1; в остальных случаях оно равно 0. Таким образом, <&> = Н (91) равно 1, если все 91, лежат в своих /, (J = 1 Г), в остальных случаях — это 0. Математическое ожидание <2 равно, стало быть, вероятности W того, что 9^ лежит в Iv ..., 91, лежит в /г Отсюда W = Erw (@, ер) = {И (R) Ь <?) = = (О! (Z7! (/?))... Ог (Ft (R) ) ср, ер) = (О! (/?!) . . . О, (/?j) ер, ер). Обозначим снова разложение единицы, относящееся к /?;-, через ?,(Х), и пусть Ij — интервал [kj, kj]. Тогда, на основании сказанного
2] СТАТИСТИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ 155 в конце II. 8, в принятых там обозначениях О,(Х)=е.(Х)-е .(X). °j (*/> = ех". Щ - ^ (Ъ) = Е> W) - Ei М = Ъ (Л) и, значит, W = (?1(/1)...?,(/,)<p. cp). Но это как раз и есть W.. Вследствие простоты формулировки, утверждения Е2. и F. осо- особенно удобны как основа, на которой строится вся теория. Мы видели, что наиболее общее возможное вероятностное утверждение W. следует из них, но утверждение W. обладает двумя замечательными особенностями: 1. W. является статистическим, а не причинным утвержде- утверждением, т. е. из него не следует, какие значения принимают вели- величины Шг 9tj в состоянии ср, но лишь с какими вероятно- вероятностями эти величины принимают все возможные значения. 2. На вопрос в постановке, свойственной W,, нельзя отве- ответить для произвольных величин 9tj ffit, но только для таких, для которых соответствующие операторы Rv .... Rt коммутируют друг с другом. Обсудить значение этих двух фактов будет нашей ближайшей задачей. 2. Статистическая интерпретация Классическая механика представляет собой причинную дисциплину, т. е. если состояние описываемой ею системы известно со всей подробностью,—для чего в случае k степеней свободы необходимо задать 2k чисел: k координат qv .... qk конфигурационного про- и dq\ dqk странства и k их производных по времени ~, ..., —^- или же, вместо последних, k импульсов рл, .... pt,—то значение любой физической величины (энергии, момента и пр.) можно определить единственным образом и численно точно. Несмотря на это, существует и статистический метод исследования классической механики, но он является, так сказать, лишь роскошью или приправой. А именно, если нам известны не все Ik фиксирующих состояние параметра (Я\> •••' Як< Pv •••¦ Рк^< ы0 лишь часть из них (причем даже sth последние могут быть известны не точно), то можно, усредняя каким-нибудь способом по параметрам, оставшимся неизвестными, сделать по крайней мере статистические утверждения относительно всех физических величин. Это же справедливо и для прошлых или будущих состояний системы: если известны qv .... qk, pv .... рк
156 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. Ш в момент t — t0, то с помощью уравнений движения классической механики можно (причинным образом) вычислить состояние в любой другой момент t; но если известны лишь некоторые из параметров, то надо усреднить по остальным, и о состояниях в другие моменты времени 12°) можно делать уже лишь статистические утверждения. Статистические утверждения, с которыми мы сталкиваемся в кван- квантовой механике, имеют другой характер. Здесь в случае k степеней свободы состояние описывается волновой функцией cp(<7i' •••• Qk)> т. е. точкой ср надлежащим образом реализованного ^„(Ц?!^! — численный множитель абсолютной величины 1 несуществен). И хотя мы считаем поэтому, что задание ср полностью определяет состояние, оно тем не менее делает возможными лишь статистические утвержде- утверждения о значениях физических величин. Впрочем, эта статистичность ограничена предсказаниями значений физических величин, в то время как прошлые и будущие состоя- состояния ср/ вычисляются из ср/в = ср причинным образом. Это позволяет сделать временнбе уравнение Шредингера (ср. I. 2), так как h д u определяют всю эволюцию состояния ер,. Решение этого дифферен- дифференциального уравнения можно получить даже в явном виде ср, = е j. (В Н не зависит от времени, но ср/ определяется однозначно и для h ° унитарно l2l)j. (В этой формуле предполагается, что 120) Хорошую иллюстрацию к этим соотношениям дает кинетическая теория газов. Один моль C2 г) кислорода содержит 6 • 1023 молекул кислорода и является, учитывая, что каждая молекула О2 состоит из двух атомов кисло- кислорода (внутренней структурой которых мы пренебрежем, рассматривая их как точечные массы с тремя степенями свободы у каждой), механической системой с 2- 3- 6-1023 = 36 • 1023 = k степенями свободы. Итак, знание 2k параметров позволило бы описать его поведение причинно, но теория газов использует лишь два: давление и температуру, которые являются определенными, сложными, функциями этих 2k параметров. Поэтому она может делать лишь статистические (вероятностные) утвер- утверждения. То, что они во многих случаях оказываются почти причинными, т. е. соответствующие вероятности — близкими к 0 или 1, не меняет прин- принципиального положения вещей. 121) Пусть Ft (X) — зависящая от времени функция, -^ Ft (К) = О/ (X), и пусть Н — эрмитов оператор, тогда -^ Ft (Н) = Gt (Н), поскольку -^- полу- получается вычитанием, делением и переходом к пределу. Если Ft (X.) =
2] СТАТИСТИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ 157 зависящего от времени Н. так как наше дифференциальное уравне- уравнение первого порядка, только тогда нет больше простых формул для решения.) Если желать объяснить акаузальный характер связи между ср и значениями физических величин по примеру классической механики, то, очевидно, естественно понимать его следующим образом: На самом деле ср вовсе не определяет состояния во всех деталях, напротив, чтобы узнать его полностью, необходимо задать дополнительные числа. Иными словами, у системы, помимо ер, имеются еще и другие характеризующие ее параметры или координаты. Будь все они известны, мы смогли бы указать значения всех физических величин точно и определенно; напротив, с одной только ср — точно так же как в классической механике на основе лишь некоторых из qv ..., qk, pv .... pk — возможны только статистические утверждения. Такое понимание — это, конечно, гипотеза, попытка, ценность которой зависит от того, удастся ли в самом деле найти дополнительные координаты, добавляющиеся к ср. и построить с их помощью при- причинную теорию, находящуюся в согласии с опытом и приводящую при задании одной только ср (и усреднении по остальным координа- координатам) снова к статистическим утверждениям квантовой механики. Обычно эти гипотетические дополнительные координаты называют «скрытыми параметрами» или «скрытыми координатами», так как они должны были бы играть скрытую роль в сравнении с волновой функцией ер, которая только и раскрыта в настоящее время. Объ- Объяснение с помощью скрытых параметров уже свело в классической физике некоторые, казалось бы статистические, соотношения к при- причинным основаниям механики: характерным примером является кине- кинетическая теория газов (ср. прим. 12°). Вопрос о том, возможно ли объяснение этого типа с помощью скрытых параметров в квантовой механике, обсуждался не один раз. Тот взгляд, что на этот вопрос когда-нибудь будет получен положи- положительный ответ, имеет и сейчас выдающихся представителей. Если бы он подтвердился, то сегодняшнюю форму теории пришлось бы , то это дает и после применения к <р приводит к желаемому дифференциальному урав- уравнению. Так как \F,(K) | = 1, F, (X) /7(Х) = 1, то Ft (Н) [Ft(H))* = 1, т. е. наш -т?у-адн оператор Ft(H) = e унитарен. Поскольку при t —10 он, оче- очевидно, равен единице, то требование <р( = <р также выполнено.
158 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. Ш объявить предварительной, поскольку описание состояний с помощью волновых функций оказалось бы тогда существенно неполным *). Ниже будет показано (IV. 2), что введение скрытых параметров заведомо невозможно, во всяком случае без фундаментальных изме- изменений существующей теории. Пока же подчеркнем только, что волно- волновая функция ср тем весьма существенно отличается от частичной системы координат и импульсов qx qk, pv . .., pk классической механики, что зависимость ср от времени причинна, а не статистична: (ft, как мы видели выше, определяет все ср/ однозначно. До тех пор, пока более подробный анализ положений квантовой механики не позволит нам объективно доказать (в отрицательном смысле) возможность введения скрытых параметров (что делается в указанном выше месте), мы откажемся от возможности такого объяснения и станем на противоположную точку зрения, т. е. при- примиримся с тем фактом, что законы, управляющие элементарными процессами (т. е. законы квантовой механики), имеют статистическую природу. (Причинность в макромире может, во всяком случае, быть симулирована нивелирующим действием «закона больших чисел», который проявляется, когда многие элементарные процессы про- происходят одновременно. Сравни замечание в конце прим. 12°) на стр. 156 и прим. 175) на стр. 243.) В соответствии с этим мы убеждаемся, что W. (или также Ег.) является наиболее всеобъемлющим утвержде- утверждением относительно элементарных процессов. Это понимание квантовой механики, принимающее ее статисти- статистические утверждения за истинную форму законов природы и отказы- отказывающееся от принципа причинности, и есть так называемая стати- статистическая интерпретация. Она восходит к М. Вогп'у122) и является сейчас единственной последовательно проводимой интерпретацией квантовой механики, т. е. суммы нашего опыта относительно элемен- элементарных процессов. В дальнейшем мы будем придерживаться этой интерпретации, до тех пор пока не сможем приступить к более подробному обсуждению положения вещей. 3. Одновременная измеримость и измеримость вообще Вторая замечательная особенность, отмеченная в конце III. 1, была связана с тем, что W. объясняло не только вероятности, с ко- которыми некоторая величина 91 принимает те или иные числовые значения, но и указывало вероятностные взаимозависимости между *) В настоящее время точка зрения, противоположная взглядам автора, разрабатывается группой de Вго§11е'я (Vigier, Lochak и др.) во Франции, а также ВоЬт'ом в Америке и Терлецким у нас. — Прим. ред. 122) Z. Physik 37 A926). Все дальнейшее развитие (ср. прим. 2) на стр. 10) основывается на этом представлении.
3] ОДНОВРЕМЕННАЯ ИЗМЕРИМОСТЬ И ИЗМЕРИМОСТЬ ВООБЩЕ 159 несколькими величинами 9tj 9^ — W., определяло вероятность того, что эти величины одновременно примут некоторые заданные значения (точнее, что эти значения попадут в некоторые интервалы /j /г). (Все относится к заданному состоянию ср-) Но эти вели- величины 9tj, ..., 9tj были подчинены своеобразному ограничению: их операторы Rv ..., Rt должны были коммутировать. В случае же некоммутирующих Rv .... Rt, напротив, W. не давало совершенно никаких сведений о вероятностных взаимозависимостях между 9^, .... 9tj и его можно было использовать лишь для определения распределения вероятностей каждой из этих величин самой по себе, безотносительно к остальным. Скорее всего, тут хотелось бы допустить, что утверждение W. неполно и что должна существовать более общая формула, охва- охватывающая и эти случаи. Действительно, даже если квантовая меха- механика и дает лишь статистические сведения о природе, все же мы могли бы по меньшей мере ожидать от нее описания не только статистики индивидуальных величин, но и корреляции между ними. Однако в противовес этому представлению, которое на первый взгляд кажется разумным, мы убедимся вскоре, что подобное обоб- обобщение W. невозможно и что наряду с формальными (основанными на структуре математического аппарата теории) в пользу ограничения говорят и веские физические причины. Необходимость этого огра- ограничения и его физическое толкование позволят нам даже глубже заглянуть в сущность природы элементарных процессов. Прежде всего, сошлемся на важный эксперимент, поставленный Compton'oM и Simons'ом еще до создания квантовой меха- механики 123). В этом опыте свет рассеивался на электронах и количе- количественное изучение процесса рассеяния состояло в том, что рассеян- рассеянный свет и рассеянные электроны перехватывались и проводилось измерение их импульсов и энергий, т. е. между квантами света и электронами происходили столкновения, и наблюдатель мог, измеряя пути после столкновения, проверить, удовлетворяются ли законы упругого удара. (Нужно рассматривать только упругие удары, так как нельзя представить себе, чтобы кванты света или электроны могли воспринимать энергию в форме, отличной от кинетической. Ведь весь опыт говорит за то, что и те и другие являются однозначными жестко установленными структурами. Естественно, что расчет стол- столкновения нужно вести релятивистски123).) Такой математический кон- контроль был возможен на самом деле: так как траектории до столкно- столкновения были известны, а после столкновения наблюдались, то тем самым задача о столкновениях была переопределена. Ведь чтобы фиксировать 123) Phys. Rev. 26 A925). Сравни также исчерпывающий обзор W. В о t h e в Handbuch der Physlk 23 (Quanten), Berlin, 1926, глава З, в особен- особенности § 73.
160 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА (ГЛ. III ее с точки зрения механики, достаточно двух из этих четырех пу- путей и «центральной линии» удара (направления передачи импульса), т. е.; во всяком случае, достаточно знать три пути, а четвертый можно использовать для проверки. Эксперимент полностью подтвер- подтвердил механические законы удара. Если считать законы удара справедливыми, а траектории до столкновения известными, то этот результат можно сформулировать также следующим образом. Как измерения траектории кванта света после столкновения, так и измерения такой траектории для элек- электрона достаточно, чтобы определить место и центральную линию столкновения. Эксперимент Комптона — Симонса показывает, что оба эти наблюдения дают один и тот же результат. Обобщая, можно сказать: одна и та же физическая величина (именно, какая-либо координата точки столкновения или же напра- направление центральной линии) измеряется двумя разными способами (с помощью захвата квантов света или электронов), а результат по- получается всегда один и тот же. Эти два измерения происходят не совсем одновременно (квант света и электрон приходят не сразу, и надлежащим изменением из- измерительной аппаратуры любой из них можно поймать первым — конечно, речь идет о 10~9—10~10 сек). Назовем более раннее изме- измерение Mv а более позднее — М2, а измеряемую величину — 91. Теперь существенно следующее. Хотя вся установка такого рода, что до измерения можно делать только статистические утверждения относи- относительно Ш, т. е. относительно М1 и М2 (см. ссылку в прим. 123)), статистическая корреляция между Мц и М2 оказывается совершенно резкой (причинной): значение 91 для М1 наверняка равно значению 91 для М2. Итак, до измерений Жг и М2 оба результата совершенно неопределенны. После же выполнения Мх (но еще не М2) резуль- результат М2 уже определен причинным и единственным образом. С принципиальной точки зрения можно сказать: a priori мыслимы три степени причинности или непричинности. Во-первых, значение величины 91 могло бы быть полностью статистическим, т. е. результат измерения можно было бы предсказать лишь статистически; и если бы непосредственно вслед за первым было выполнено второе измерение, то оно могло бы опять обладать некоторым распределением, совершенно не зависящим от значения, найденного при первом измерении, например столь же широким, как и у первого ш). Во-вторых, мыслимо, что значение величины 91 может иметь дисперсию в первом измерении, но что каждое непосредственно за ним следующее измерение вынуждено 124) Одна статистическая теория элементарных процессов была создана Boh г'ом, Kramer s'om и State г'ом на основе таких представлений. См. Z. Physlk 24 A924), а также прим. 123) на стр. 159. Эксперимент Комптона — Симонса можно рассматривать как опровержение этого взгляда.
3] ОДНОВРЕМЕННАЯ ИЗМЕРИМОСТЬ И ИЗМЕРИМОСТЬ ВООБЩЕ 161 давать результат, согласующийся с первым. В третьих, 91 могло бы быть определено причинным образом с самого начала. Эксперимент Комптона — Симонса показывает теперь, что в ста- статистической теории возможен лишь второй случай. Поэтому, если первоначально система находилась в некотором состоянии, в котором значение 91 не может быть предсказано с достоверностью, то это состояние переходит при измерении М величины 91 (в вышеприве- вышеприведенном примере — Mi) в другое состояние: а именно в такое, в ко- котором значение величины 91 однозначно определено. Кроме того, новое состояние, в которое М переводит систему, зависит не только от установки для получения М, но также от результата измерения М (который не может быть предсказан причинным образом в перво- первоначальном состоянии), поскольку значение 91 в новом состоянии должно быть как раз равно этому Ж-результату. Пусть теперь 91—некоторая величина, оператор которой R имеет чисто дискретный спектр Xj, Х2, ... с соответствующими собствен- собственными функциями 9i> ?2> ¦¦¦> которые, следовательно, образуют пол- полную ортонормированную систему. Кроме того, пусть каждое соб- собственное значение будет простым (т. е. кратности 1, ср. II. 6), т. е. V ^ К ПРИ V1 ^ v> Предположим, что мы измерили 91 и нашли зна- значение X*. В каком состоянии окажется система после этого изме- измерения? В силу предыдущей дискуссии это состояние ср должно быть таким, чтобы возобновленное измерение 91 давало бы результат X* с достоверностью. (Конечно, это измерение нужно делать немедленно, - — тН так как через t секунд ср перейдет в е h ср. Ср. III. 2, Н — это оператор энергии.) На этот вопрос — когда измерение величины 91 в состоянии ср с достоверностью дает значение X* — мы ответим в общем случае, без ограничительных предположений относительно оператора R. Пусть Е(к) — относящееся к R разложение единицы, а / — интер- интервал {X', X"}. Наше допущение можно сформулировать и так: вели- величина 91 попадает в интервал / с вероятностью 0, если этот интервал не содержит X*, или с вероятностью 1, если X* принадлежит /, т. е. если Х'<Х*^Х". Согласно W. это означает, что ||Я(/)ср||2= 1, или, так как ||ср|| = 1, что ЦС^срН = ||ср||. Так как Е{1) — проекционный опе- оператор, так же как и 1—Е{1) {теорема 13., II. 4), то 11 И. Нейман
162 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III Предельный переход X' -> — оо дает Е (к") ср = ср, а переход Х"-»-|-оо дает ?(Х')<р=О (ср. 5ь , II. 7). Поэтому ср для Х>Х*. о Для Х<Х*. Но, согласно II. 8, это условие как раз характеризует #ср = Х*ср. Другой способ доказать, что #ср=Х*ср, основан на Е\. (т. е. на Ег.). То обстоятельство, что величина ffi принимает с достоверностью значение X*, означает, что математическое ожидание величины (9i — X*J равно 0. Это означает, что оператор F(R), где /7(Х) = = (Х — X*J, т. е. оператор (R— X* • IJ, имеет то же математическое ожидание. Поэтому, должно быть ((Я_Х*.1Jср, Т) = ((Я — Х*.1)ср, (R — Х*.1)ср) = т. е. /?ср = Х*ср. Итак, мы видим, что в частном случае, который мы рассматри- рассматривали прежде, должно быть #ср = Х*ср. Как было указано в II. 6, это приводит к следствию, что X* должно равняться одному из Х^ (так как ||<р|| = 1, то уфО), а 9 = асрA. Так как 1^11 = 11^11 = 1, то и \а\ должно быть =1, и, значит, его можно опустить, не из- изменяя состояния. Итак, Х* = Х^, <р = <р11 для какого-либо из (х=1, 2, ... (утверждение относительно X* можно было бы полу- получить и непосредственно из W., но не утверждение о ср!). Итак, при сделанных допущениях относительно оператора R из- измерение величины 91 имеет своим следствием превращение любого состояния t[» в одно из состояний cpj, cp2, ..., соответственно связан- связанных с результатами измерения Хх, Х2, ... Вероятности этих пере- переходов равны поэтому вероятностям измерения Xj, X2, ..., так что их можно вычислить из W.. Вероятность того, что значение величины ffi лежит в интервале /, дается тогда, согласно W., выражением ||?(/)t}>||2. Отсюда, если учесть, что, согласно II. 8, ?¦(/)== 2 ^W'\- будет следовать <!»)= 2 (P[9J. <!»)= 2 №1». Значит, можно ожидать, что вероятность найти Х„ равна |(t[», ср„)|2. Если можно выбрать интервал / так, чтобы он содержал только одно Хт, которое тогда и есть как раз Х„, то высказанное предпо- предположение непосредственно следует из вышеприведенной формулы. Если же это не так (т. е. если другие Хт сгущаются к Х„), то можно рассуждать, например, следующим образом: Пусть /7(Х)=1 для Х = ХЛ и =0 в остальных случаях. Тогда искомая вероятность Wn
3] ОДНОВРЕМЕННАЯ ИЗМЕРИМОСТЬ И ИЗМЕРИМОСТЬ ВООБЩЕ 163 будет математическим ожиданием величины F (9?) и, согласно Е2. (или Ei.), равна (F(R)ty, ф). Ну, а согласно определению A1.8), Вспоминая определение интеграла Стильтьеса, легко заметить, что это выражение равно 0, если E(k)ty непрерывно (по X!) при Х = ХЛ и, вообще говоря, равно скачку (монотонно возрастающей) Х-функции |[?(Х)ф||2 в точке Х = ХЛ. Но этот скачок равен ЦАмфЦ2, где Ш — замкнутое линейное многообразие, растягиваемое всеми решениями уравнения Rty = \nty (ср. II. 8). В рассматриваемом случае ЭД? = [срл] и поэтому Мы ответили таким образом при сделанных предположениях от- относительно оператора R на вопрос о том, «что» происходит при измерении его величины 9i. Конечно, вопрос «как» остается пока невыясненным. Этот разрывный, скачкообразный переход из ф в одно из состояний cfj, cp2, ... (которые не зависят от ф, поскольку t[» входит лишь в соответствующие вероятности Wn=\(<!p, <?n)\2, п=1, 2, ... этих скачков) — это, конечно, не переход типа, опи- описываемого временным уравнением Шредингера. Ведь это уравнение всегда приводит к непрерывному изменению t[», при котором конеч- конечный результат однозначно определен и зависит от t|> (ср. сказанное в III. 2). В дальнейшем мы попытаемся перебросить мост через эту пропасть (ср. VI) 125). Предположим опять, что оператор R обладает чисто дискретным спектром, но не будем больше требовать, чтобы все собственные значения были бы простыми. Тогда снова можно образовать после- последовательности <pi> ср2, ... и Xj, X2 но среди Хл могут встре- встречаться равные. После измерения величины 91 с достоверностью осу- осуществляется состояние ср, для которого R<? = Х*ср (X* — результат измерения). Отсюда будет следовать, что X* равно одному из Хя, но относительно ср можно сказать лишь следующее. Обозначим те из Хл, которые равны X*, через ХП1, Х„2, ... (их число конечно или беско- бесконечно). Тогда (Если имеется бесконечно много «v, то сумма 2|aJ2 должна быть v конечной.) Две таких ср описывают одно и то же состояние, только 125) То обстоятельство, что эти скачки связаны с представлением о «квантовых скачках» старой теории квант Бора, обнаружил Jordan Z. Physik 40 A924). 11*
164 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА 1ГЛ. Ill если они отличаются лишь численным множителем, т. е. если отно- отношение ах : а2: ... у них одно и то же. Поэтому, коль скоро имеется больше чем одно «„, т. е. коль скоро собственное значе- значение X* кратно, то состояние ср после измерения не определяется однозначно и знанием результата измерения. Вероятность значения X* (согласно W. или, соответственно, Е\. или Е%.) вычисляется в точности так же, как и раньше. Она равна = 2 |D>. <рЛ2 Если спектр оператора R не чисто дискретен, то возникает сле- следующая ситуация. Все решения / уравнения Rf = Xf растягивают замкнутое линей- линейное многообразие Шх, все ЗЯХ вместе — в свою очередь многооб- многообразие Ш и для несуществования чисто дискретного спектра харак- характерно Ш Ф ffi.^, т. е. -ЭТ = 9^ — Ш Ф (О) (ср. по этому поводу, а также и по поводу нижеследующего, II. 8). Шх ф @) в крайнем случае для некоторой последовательности X, и такие X образуют дискретный спектр оператора R. Когда мы измеряем величину ffi в состоянии ф, то вероятность того, что в результате измерения будет получено значение X*, равна Разумнее всего доказать это с помощью применявшейся выше аргу- аргументации, основанной на Е2. (или Ех.) и на функции I 1 для X —X*, F (Х) = 1 0 для X ф X*. Вероятность того, что значением величины 9i окажется некоторое X* из дискретного спектра SJJ оператора R, будет соответственно равна к* в ф в чем можно убедиться непосредственно с помощью функции 1 для X* из ^, О в остальных случаях. Если, однако, 91 измеряется точно, то после этого должно осу- осуществиться состояние ср, удовлетворяющее /?ср:=Х*ср, и поэтому ре- результат измерения X* должен принадлежать ф, — вероятность удачи точного измерения равна поэтому (в лучшем случае) |-Р«гф|Р. Но это число не всегда равно 1 и в случае t[» из Щ даже равно 0, значит, точное измерение возможно не всегда.
3] ОДНОВРЕМЕННАЯ ИЗМЕРИМОСТЬ И ИЗМЕРИМОСТЬ ВООБЩЕ 165 Мы видели, что величина 9? всегда (т. е. в любом состоянии ф) может быть точно измерена тогда и только тогда, когда эта вели- величина обладает дискретным спектром. Если она не обладает дискрет» ным спектром, то она может быть измерена лишь с ограниченной точ- точностью. Именно, можно разделить числовую прямую —оо < X < +оэ на интервалы .... /(~2), Z'', /<0), /A), /B), ... (пусть точками деле- ния будут .... Х<Л X*-1', Х@), ХA), Х<2), ...; /<"> = {Х(л), Х(л+1)}; ма- ксимальная длина интервала s = Max(X<n+1)— Х(/г)), расстояние между точками деления является тогда мерой точности) и указать, в каком интервале лежит величина 91. Математическое рассмотрение этого процесса можно продолжить и дальше. Именно, пусть F(X) обозна- обозначает функцию (Х„—некоторое промежуточное значение из интер- интервала /</г), выбираемое для каждого « = 0, ±1, ±2, ... произвольным, но в интересах дальнейшего, фиксированным образом): F(X) = Xn, если X лежит в /<л)- Тогда приближенное измерение величины 9i будет эквивалентно точ- точному измерению величины F(%1). Значит, V^ 1 ' { Ш\ л = —со ,(л) л=—со Очевидно, что для всех / из принадлежащего E{l(n)) замкнутого линейного многообразия имеет место уравнение F (R)f — Х„/, т. е. для оператора F (R) многообразие 2ft, содержит это линейное многообразие. Следовательно, Р>ж ,>?(/) и поэтому -f СО +СО Я=-со ^л л=—со Отсюда следует, что + СО т. е. F(R) имеет чисто дискретный спектр, который состоит из кп.
166 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА 1ГЛ. Ш Поэтому F (91) действительно точно измерима, и вероятность того, что ее значение равно ~кп, т. е. что значение Ш лежит в / , равна п .1. о 1 &fr(n)\.,. ||2 г-ж , п в согласии с утверждением W. для 91. Этот результат может быть интерпретирован и физически, и при этом выясняется хорошее согласие теории с обычной физической наглядной точкой зрения. В свойственном классической механике методе рассмотрения (без каких бы то ни было квантовых условий) хотя и приписывают каждой величине 9i в любом состоянии совершенно определенное значение, но в то же время считают, что любой мыслимый измерительный аппарат, как следствие несовершенства человеческой способности наблюдать (которая позволяет прочесть указание стрелки или же ло- локализовать почернение фотографической пластинки лишь с ограни- ограниченной точностью), может дать это значение лишь в пределах неко- некоторой, никогда не исчезающей, ошибки. Правда, пределы этой ошибки удается за счет достаточного уточнения метода измерения сдвинуть сколь угодно близко к 0, но точно нулем они никогда не будут. Можно ожидать, что это будет так же и в квантовой теории для тех величин 9i, которые, согласно сложившимся для них (в особенности до открытия квантовой механики) наглядным представлениям, не кван- квантованы, например, для декартовых координат электрона (которые могут принимать любое значение от — оо до -f- oo и операторы ко- которых имеют непрерывный спектр). С другой стороны, для тех ве- величин, которые (согласно нашему наглядному представлению о них) «квантованы», верно обратное положение: поскольку они способны принимать лишь дискретные значения, то достаточно наблюдать их лишь с такой точностью, чтобы не возникало более сомнения, какое именно из этих «квантованных» значений было наблюдено, — оно-то уж наверняка будет абсолютно точным. Например, если мы знаем о водородном атоме, что у него меньше энергии, чем нужно для второго снизу энергетического уровня, то мы знаем его энергию с абсолютной точностью: это энергия низшего уровня. Но такое деление на «квантованные» и «неквантованные» вели- величины соответствует, как мы видели при анализе матричной теории (ср. I. 2 и II. 6), делению на величины 91 с оператором R, обладаю- обладающим чисто дискретным спектром, и такие, для которых это не имеет места. И как раз для величин первого рода, и только для них, мы нашли возможность абсолютно точного наблюдения, тогда как вели- величины второго рода можно наблюдать лишь со сколь угодно хоро- хорошей (но никогда не абсолютной) точностью126). 126) Во всех таких случаях мы делаем предположение, что структура наблюдаемой системы и измерительной аппаратуры (т. е. все действующие
3] ОДНОВРЕМЕННАЯ ИЗМЕРИМОСТЬ И ИЗМЕРИМОСТЬ ВООБЩЕ 167 (Отметим кстати, что упомянутое во введении, равно как и в I. 3, привлечение «несобственных» или не принадлежащих гильбертову пространству собственных функций, — ср. также II. 8, в особенности прим. 84), 86) на стр. 98 и 101, — как раз здесь передает действитель- действительность хуже, чем наш метод, вводя нас в заблуждение о существовании таких состояний, в которых величины с непрерывными спектрами принимают в точности определенные значения, хотя как раз этого никогда не бывает. Хотя такие идеализации и предлагались много- многократно, мы считаем, что их надо отклонить и по этой причине, не говоря уже об их математической несостоятельности.) Тем самым мы достигли некоторой, пока достаточной, ясности в вопросе о процессах, происходящих при измерении одной вели- величины, и мы можем обратиться к одновременному измерению несколь- нескольких величин. Пусть сперва 91 и @ будут две величины с операторами R, S соответственно. Примем, что они одновременно измеримы. Что отсюда следует? Будем сначала требовать абсолютно точной измеримости, так что оба оператора R и S должны будут обладать чисто дискретным;! спектрами: Xj, Х2, ... и [Xj, [x2, ... Пусть соответствующие полные ортонормированные системы состоят из собственных функций <р1з ср2, . .. И ^, ф2, . . . Чтобы начать обсуждение с простейшего случая, мы предположим сперва, что у одного из этих операторов, скажем у R, есть только простые собственные значения, т. е. Хт=?Хя для тфп. Если 9i и @ измеряются одновременно, то после этого возникает состояние, в котором как 91, так и @> наверняка имеют только что измеренные значения, скажем X— и [х—, а состояние t[», которое тогда возникает, должно удовлетворять уравнениям /?ф = Х—•]•, 5г]) = \х—¦]). Из первого из них следует, что ф = ср- (с точностью до численного множителя, которым можно пренебрегать), тогда как из второго — что ф = 2 а$п • если Рп ' Рп ' • '" пРеДставляют собой все \>.п, рав- равные [а—. Если начальным состоянием было <р> то ^> <РТн имеет силовые поля и т. д.) известна точно и ищется лишь состояние, т. е. мгно- мгновенные значения координат. Если это (идеализированное) предположение окажется неверным, то, конечно, появятся дополнительные источники неточ- неточности. Даже и в нашем методе описания неточного измерения содержалась не- некоторая идеализация. Мы предположили, что оно состоит в том, что мы с абсолютной достоверностью решаем, принадлежит рассматриваемое значе- значение интервалу /= {X', \"}, I' < X" или нет. На самом деле границы I', I" размыты, т. е. необходимое решение происходит лишь с определенной ве- вероятностью. Тем не менее наш метод описания представляется математически наиболее удобным, во всяком случае в настоящее время.
168 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА (ГЛ. III вероятность |(<р, <р-)|2- Для ср = срт будет поэтому наверняка т = т, так что для каждого т можно сказать, что срт равно сумме 2 а$п v v с равными ^, т. е. S^m = ^m (где (х == ^ == ^ = ...). Следова- Следовательно, для / = срт будет выполняться RSf = SRf (обе части соот- соотношения равны \т ]х срт). Так что это равенство справедливо также и для их линейных комбинаций и, если R n S непрерывны, то и для предельных точек этих комбинаций, т. е. для всех /. Следовательно, R и S коммутируют. Если R и 5 не непрерывны, то рассуждать надо следующим образом. Разложения единицы ?(Х), /?(^), принадлежащие операто- операторам R и S, определяются соотношениями Следовательно, F (jx)cpm = cpm или =0 в зависимости от того, |х>; или < введенного выше [х. Далее, ?1(X)cpm = cpm или =0 в зависи- зависимости от того, Xi> или < Хт. Поэтому в любом случае Е(к) F(\).)fm= = Z7 (|х) ? (X) срт для всех tpm. Отсюда, как и выше, следует комму- коммутативность Е(к), F(\i) и, значит (согласно II. 10), коммутатив- коммутативность R и S. Но, согласно II. 10, существует полная ортонормированная си- система собственных функций, общих для R и 5, т. е. можно принять, что cpm = фт. Так как \т Ф Хл для тф п, то можно построить функ- функцию F(k), для которой |х„ для Х = Х„, «5=1, 2 произвольна при других значениях X, и тогда S = F(R), т. е. @ = F (91). Это значит, что 9i и @ не только измеримы одновременно, но каждое измерение 9i является также из- измерением @>, поскольку @ есть функция от 91, т. е. @ причинным образом определяется через 91127). Перейдем теперь к более общему случаю, когда не делается ника- никаких предположений относительно кратности собственных значений R, S. В этом случае мы применим совершенно другой метод. Рассмотрим сначала величину 9Ц-@. Одновременное измерение 91, @ является также измерением 91 + <?, так как сложение результатов измерений дает значение 91 -\- @. Вследствие этого математическое ожидание 91 -f- @ в любом состоянии t[» является суммой математиче- математических ожиданий 9i и <2>. Заметим, что это имеет место независимо |27) Последнее предложение можно проверить с помощью W.! Разложе- Разложения единицы, принадлежащие R и S, можно построить, следуя II. 8.
3] ОДНОВРЕМЕННАЯ ИЗМЕРИМОСТЬ И ИЗМЕРИМОСТЬ ВООБЩЕ 169 от того, являются ли 91 и @ статистически независимыми или же между ними существует какая-нибудь корреляция, так как закон Математическое ожидание суммы = сумме математических ожиданий, как известно, справедлив всегда. Поэтому, если Г есть оператор величины 91-|-<2>, то рассматриваемое математическое ожидание рав- равняется, с одной стороны, (Tty, <[»). а с другой — т. е. для любого ф Поэтому 71=/?-f-S. Следовательно, величине 9i -f-S соответствует оператор /? + 5128). Таким же способом можно показать, что вели- величина аШ-\-Ь& (а, Ь — вещественные числа) имеет оператор aR~\-bS. (Это следует и из первой формулы, если мы подставим 9i, <2> и R, S в функции /7(Х)=аХ, O([x) = Z>[x.) Одновременное измерение 91, @> является также измерением величин Операторами этих величин (если воспользоваться еще тем обстоя- обстоятельством, что если Т — оператор величины Z, то у величины F(Z) будет оператор F(T), откуда у величины Z2 — оператор Г2) будут, следовательно, R — S RS-\- SR Это значит, что 91 ¦ @> имеет оператор 5- . Это справедливо также для всех /^ (91), G(<2>) (которые ведь тоже измерились вместе с 91 и @), и поэтому F (9i) • О (@) имеет оператор 2 Пусть теперь Е(к) и F(\i) — разложения единицы, соответствую- соответствующие R и 5. Пусть, далее, F(\) = 1 для Х^Х. О для X > X 1 для fx <;j. О для [х > [х 128) Мы доказали этот закон, согласно которому оператором величины 91 + <2> является сумма операторов величин 91 и @> для одновременно изме- рлмых «ft. ф- Ср., что говорится по этому поводу в конце IV. 1 и IV- 2,
170 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА (ГЛ. III Как мы знаем, F(R) = E(k), G(S) = F(p). поэтому F($l)-G(&) имеет оператор 5- (для краткости мы пишем Е и F вместо Е(к) или F (jl)). Поскольку F($t) всегда равно 0,1, то F (9tJ = F (Ш), и поэтому F (Щ ¦ (F (ft) ¦ G(&)) = F($l)G(&). Применяя теперь нашу формулу умножения к F(%1) и F(9i)-G(^) (все они измеримы одновременно), получим для этого произведения оператор ±_±_F 2 "*" 2 __ E2F + 2EFE + FE* _ EF + FE + 2EFE 2 "~ Это выражение должно равняться ^ , откуда следует, что EF + FE — 2EFE. Умножая слева на Е, получаем E2F-\-EFE=2-E2FE, EF-\-EFE = 2 ¦ EFE, EF = EFE, а умножение справа дает EFE-\-FE2=2- EFE2, EFE + FE=2- EFE, FE = EFE, т. e. EF — FE, т. е. все Е(к), F(\>.) коммутируют и, следовательно, в свою очередь коммутируют и R, S. Согласно II. 10, это условие, т. е. коммутативность R и S, озна- означает то же самое, что и требование существования некоторого эр- эрмитова оператора Т, функциями которого являются R и S: R~F(T), 5 = 0(Г). Если этот оператор соответствует величине X, то будет также Щ. ==F(Z), <2> = G(Z). Поэтому это условие оказывается идо- статочным для одновременной измеримости, поскольку измерение Z (абсолютно точное, так как % обладает чисто дискретным спектром, ср. II. 10) измеряет одновременно также и его функции 91 и B>. Итак, коммутативность R и S является необходимым и достаточным условием одновременной измеримости. Если дано несколько величин 9t, <2>, ... (но конечное число) с операторами R, S, .. . и снова требуется абсолютно точная изме- измеримость, то положение с одновременной измеримостью будет обстоять следующим образом. Если все величины Ж, @, ... одновременно из- измеримы, то то же должно выполняться и для всех образованных из них пар, т. е. все операторы R, S, ... должны коммутировать друг с другом. Обратно, если R, S, .. . коммутируют друг с другом, то тогда, согласно II. 10, существует оператор Т, функциями которого все они являются: R = F(T), S~G(T), ..., и поэтому для соот-
3] ОДНОВРЕМЕННАЯ ИЗМЕРИМОСТЬ И ИЗМЕРИМОСТЬ ВООБЩЕ 171 ветствующей величины X: ffi = F(Z), Ф = О(?). Точное измерение величины % (Z снова обладает чисто дискретным спектром, ср. II. 10) является, следовательно, одновременным измерением величин 91, ф, т. е. коммутативность операторов R, S, . .. необходима и достаточна для одновременной измеримости величин 91, Ф, ... Рассмотрим теперь такие измерения, которые не абсолютно точны, но выполняются с (произвольно большой) заранее заданной точностью. Тогда R, S, ... уже не обязаны иметь чисто дискретный спектр. Поскольку измерения величин Ш, Ф, ... с ограниченной точ- точностью означают то же самое, что и абсолютно точные измерения величин F (Ш), О(Ф), ..., где F (к), О (к), ... —известные функции, способ построения которых был описан в начале этого параграфа (при обсуждении измерения ограниченной точности; там, разумеется, было дано лишь построение F Q.)), тогда 91, ф, ... наверняка из- измеримы одновременно, если все F(91), О(Ф), ... измеримы одно- одновременно с абсолютной точностью. Но последнее эквивалентно тре- требованию коммутативности операторов F(R), O(S), .. ., которая в свою очередь следует из коммутативности операторов R, S, ... Поэтому коммутативность операторов R, S, ..., во всяком случае, достаточна. Обратно, если считать величины 91, ф, ... одновременно изме- измеримыми, то поступим следующим образом. Достаточно точное изме- измерение величины 91 позволит решить, является ее значение > \ или ¦?==\ (ср. наше определение «ограниченной точности», обсуждавшееся, в частности, в прим. 126) на стр. 166). Тогда, если F (К) определено так, что F(k)—l для ^gl и =0 для Х>Х, то F(91) измеримо абсолютно точно. Соответственно если О([х)=1 при |а^=|а и =0 при [х > [х, то О(ф) измеримо с абсолютной точностью и, более того, обе величины измеримы одновременно. Следовательно, F (R), 0E) коммутируют. Пусть теперь Е(к) и F (\х) — разложения единицы, принадлежащие R a S. Тогда F (R) = E(k), G(S)=F(\>.) и, следо- следовательно, Е(к) и F (\х) коммутируют для всех \ и \х. Следовательно, R к S коммутируют, и так как это должно иметь место для любой пары из R, S, ..., то и все R, S, ... должны коммутировать друг с другом. Таким образом, это условие также и необходимо. Итак, мы видим, что характеристическим условием одновременной измеримости произвольного (конечного) числа величин 91, ф, ... является коммутативность их операторов R, S, ... Действительно, это верно как для абсолютно точных измерений, так и для измерений с произвольной точностью, только в первом случае надо еще по- потребовать, чтобы операторы обладали чисто дискретными спектрами, что характеристично для возможности абсолютно точного измерения. Тем самым мы построим математическое доказательство того, что W. — это наиболее далеко идущее утверждение, которое вообще
172 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА (Г\Я. Ш возможно в этой (т. е. во включающей W.) теории. Ведь оно пред- предполагает лишь коммутативность операторов Rv ..., Rt, а без этого условия относительно результатов одновременных измерений величин 9tj 9lr вообще ничего сказать нельзя, так как одновременное измерение этих величин вообще невозможно. 4. Соотношения неопределенности В предыдущих параграфах мы пришли к важным выводам об из- измерительном процессе, шла ли речь об одной величине или же о нескольких, измеримых одновременно. Теперь нам надо выяснить, как будут вести себя величины, не измеримые одновременно, — мы будем интересоваться их статистикой в одной и той же системе (и в одном и том же состоянии ср). Итак, пусть даны две такие величины 91 и ф, равно как и их (не коммутирующие) операторы R и 5. Несмотря на это предполо- предположение, такие состояния ср, в которых обе величины имеют точно определенные значения (т. е. дисперсию, равную 0), могут существо- существовать, т. е. могут существовать собственные функции, общие для них обеих, нельзя только образовать из них полную ортогональную си- систему, так как тогда R и S коммутировали бы. (Ср. построение, приведенное в II. 8 для соответствующих разложений единицы Е(к), F(к): если <pj, cp2, ... образуют полную ортогональную систему, о которой шла речь, то как Е(к), так и F (к) будут суммами P[f] и потому будут коммутировать, так как коммутируют Prf i.) Легко понять, что это означает, что замкнутое линейное многообразие Ш, натянутое на эти ср, должно быть меньше, чем ffi^,—потому что, будь оно равно ffi^, искомая полная ортонормированная система могла бы быть построена точно так же, как это было сделано в на- начале II. 6 для одного оператора. В состояниях из Ш наши величины 91 и ф измеримы одновре- одновременно, что проще всего показать, приведя модель такого одновре- одновременного измерения. Поскольку общие собственные функции ср опе- операторов R n S растягивают Ш, то тем самым существует и растягивающая 2JJ (т. е. полная в Ш) ортонормированная система таких ср: cpj, cp2, ... (и их можно получить путем только что упомя- упомянутого построения из II. 6). Расширим систему cpj, cp2, ... до полной системы cpj, cp2 ф], ф2 добавляя ортонормированную систему <]»1( ф2 которая растягивает 9?^ — WI. Пусть теперь \, \2> ••• ..., [Xj, [j.2, ...—все различные числа, Т — оператор, определенный соотношением Ъ хп • <pe-f- 2 Уп • Уп)= 2 Хпхп • ?«+ S я п I п a J — соответствующая этому оператору величина.
4] СООТНОШЕНИЯ НЕОПРЕДЕЛЕННОСТИ 173 Измерение X создает (как мы это знаем из III. 3) одно из со- состояний <pj, ср2, .... tyv ф2, ... Если таким состоянием окажется срл (что мы заметим потому, что результатом измерения будет одно из Х„), то нам будут известны и значения величин 91 и 2>. Действи- Действительно, 91 и @ имеют в состоянии срл по предположению точно опре- определенные значения, и мы можем с достоверностью предсказать, что в измерении 91, 25, которое производится немедленно вслед за этим, будут найдены как раз эти значения. С другой стороны, если в ре- результате измерения образуется фя, то ничего подобного не известно (фл не принадлежит дЯ; поэтому 91 и 2> не определены точно в со- стояниии фя). Но вероятность того, что система будет обнаружена в состоянии фя, равна, как мы знаем, Ргф i ср, ср, а вероятность найти систему в любом из состояний фл (п—1, 2, ...) — Эта вероятность равна 0, т. е. 91 и 2> измеримы одновременно с до- достоверностью, если <р = jPajicp, т. е. если ср принадлежит к Ш 129). Так как нас интересуют сейчас одновременно неизмеримые вели- величины, примем, что осуществляется крайний случай 9й = @), т. е. предположим, что 91 и 25 не измеримы одновременно ни в каком состоянии или, иными словами, что не существует общих собствен- собственных функций для R и S. Если операторы R, S обладают разложениями единицы Е(к), F (к) и система находится в состоянии ср, то, как мы знаем из III. 1, математические ожидания операторов R и S будут равны р = (/?<р, ср), c = (Scp. ср), а их дисперсии, т. е. математические ожидания величин (91 — рJ и B>— оJ (ср. обсуждение абсолютно точного измерения в III. 3), бу- будут равны S2 = ((/?_ р. 1J ?, ?)=||(#-р.1)ср||2=||Яср-рсрР, 7J = (E-о- 1Jср, 0=11E —о. !)<p||2=||S,p--o<p||S«. После известного преобразования эти выражения принимают вид130) 2 -(/??. 9J, 7J = 12Э) Дальнейшее подробное обсуждение «одновременной измеримости в состоянии <р из 9Л» величин 91 и 25. не измеримых абсолютно точно (не- (непрерывные спектры) и т. д., предоставляется читателю. Его можно провести точно таким же способом, какой был использован в рассмотрениях III. 3. 130) Вычисление с операторами делается следующим образом: — 2р • (/?ср, <р) + Р2 = I2 - 2 • {R<f, 4f + {R% <рJ = IIR, II2 - (#<?, <рJ и соответственно для г,2.
174 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. Ш (так как ||cp[j = l, то уже неравенство Шварца, т. е. теорема 1. из II. 1, показывает, что левые части 2s 0). Возникает вопрос: поскольку е и т] не могут одновременно равняться нулю, хотя по- порознь s и т) могут быть сделаны сколь угодно малыми (ведь Ш и ф по отдельности измеримы с произвольной, возможно даже с абсо- абсолютной точностью), то должны существовать соотношения между е и т], которые препятствуют их одновременному уменьшению — какой вид они имеют? Существование таких соотношений было открыто Н е i s e ri- rife erg' ом131), и они чрезвычайно важны для познания неопределен- неопределенностей, вносимых квантовой механикой в описание природы. Поэтому их называют соотношениями неопределенности. Мы выведем сначала математически самое важное соотношение этого типа, а затем вер- вернемся к его принципиальному значению и его связи с опытом. В матричной теории важную роль играли операторы Р и Q с перестановочными соотношениями PQ-QP-ш1- они сопоставлялись, например, координате и сопряженному ей им- импульсу (ср. I. 2) или, более общо, любым двум величинам, которые были канонически сопряженными друг другу в классической механике (см., например, работы, упомянутые в прим. 2) на стр. 10). Рас- Рассмотрим несколько более общо любые два эрмитова оператора Р и Q, для которых PQ — QP=a- 1. (Так как (PQ — QP)* — QP — PQ, то (а • 1)* = о • 1 = — а • 1, а = — а, т. е. а должно быть чисто мнимым. Это операторное равенство не распространяется, конечно, на области определения обеих его сторон: PQ — QP может иметь смысл не везде.) Для любого состояния ср тогда будет 2 Im (Pep, Qcp) = I [(Pep, Qcp) — (Qcp, Pep)] = _ / [(QPcp, cp) — (PQcp, cp)] = Пусть а ф 0, тогда мы имеем (теорема 1. из II. 1) JL 131) Z. Physlk 43A927). Эти соображения были обобщены Bohr'ом, Naturwiss. 16 A928). Аналитическое рассмотрение, которое мы собираемся сейчас изложить, было предложено К е n n a r d' ом, Z. Physlk, Bd. 44 A926), Robertson придал ему современный вид.
4) СООТНОШЕНИЯ НЕОПРЕДЕЛЕННОСТИ 175 поэтому в случае ||ср|| = 1 это дает Так как операторы Р — p.l, Q— а-1 удовлетворяют тем же пере- перестановочным соотношениям, то имеем аналогично и если мы введем математические ожидания и дисперсии р = (/У ср), е2=ЦАр — р?||2, c = (Qcp, cp), f=|iQcp-acpP, то получится (и.) s^ijL. Для того чтобы имел место знак равенства, необходимо и достаточно, чтобы в неравенствах 2g, использованных при выводе, всегда ис- использовался бы знак =. Полагая Р' — Р— р-1 и Q' = Q — a-1, будем иметь Согласно теореме 1. из II. 1, второе уравнение означает, что Р'ср и Q'cp отличаются друг от друга лишь на постоянный множитель, и поскольку из iJP'tpH • HQ'cpll^-LgJ-> 0 следует, что Р'уфО и Q'cp ф О, то должно быть P'cp = c-Q'cp, с ф 0. Первое уравнение означает, что (P'<p. Q'<?) — c- ||Q'<p||2 чисто мнимо и даже что коэф- коэффициент при / имеет тот же знак, что и у '—- (вещественного !), т. е. противоположный знаку а. Итак, c = tf, if вещественно и sgO в зависимости от того, — 5=гО. Следовательно, (С/.) Р'ср = щ¦ Q'cp, ^ вещественно и «SO для ia^O. Определение р и о требует еще, чтобы было (Р'<р, ср) = 0 и (Q'cp, ср) = 0. Но поскольку из {GI.) следует, что (Я'ср, ср) =/•[¦ (Q'<p, ср), где слева стоит нечто вещественное, а справа — нечто чисто мнимое, то оба эти уравнения выполняются автоматически. Нам еще осталось опре- определить е и т). Имеем [| ||Q'«?II = | с \ = | Т |. еЧ
176 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. Ill поэтому, так как е и tj оба положительны, В случае квантовой механики а = -^~ и мы получаем из (?/.) Можно обсудить и соотношение (С/.) для того случая, когда Р, Q являются, например, операторами теории Шредингера: Р = ~!ш ~3~ " " Ф —?•••• (Ср. 1-2, мы принимаем, что рассматри- рассматривается механическая система с одной степенью свободы, ее един- единственной координатой является д.) Тогда (С/.) дает где из-за /а = -гц-> 0 f > 0. Поэтому т. е. Г f 2тс 2х 2х ,-, 2хр оо Благодаря 7^*0 оказывается, что ||ср||2== I \<?(я)\2^Ч в самом деле со конечно, и С определяется из условия ||ср|| = 1: со со ?7tr I Г'I —
4] СООТНОШЕНИЯ НЕОПРЕДЕЛЕННОСТИ 177 Поэтому, пренебрегая не имеющим физического смысла множителем модуля 1, найдем, что С = \-?-\ , т. е -t$f-- е и т) мы Уже знаем: г-, h Поэтому, если отвлечься от условия гч\ = -+г, они, пока i меняется от 0 до -f-oo, пробегают все значения, т. е. любой набор из четы- 1 рех величин р, a, s, т;, удовлетворяющих условию щ = -^—, реали- реализуется в точности в одном состоянии ср. Впервые такие состояния ср были исследованы Гейзенбергом и применены для разъяснения кван- товомеханических соотношений — они исключительно удобны для этой цели, так как дают наивысшую возможную (в квантовой механике) степень приближения к соотношениям классической механики (где ни р, ни q не имеют дисперсии!) и так как е и т| можно придать по произволу приписанные значения (ср. ссылку в прим. 13i) на стр. 174). Наши предыдущие соображения относятся лишь к одному, а именно формальному, аспекту соотношений неопределенности; для полного понимания этих соотношений необходимо еще рассмотреть их с дру- другой точки зрения: с точки зрения непосредственного физического опыта. Действительно, соотношения неопределенности стоят к нему в более прозрачном и более простом отношении, чем многие другие факты, на которых была основана квантовая механика, и потому заслуживают большего, чем приведенное выше чисто формальное до- доказательство. Наглядное обсуждение тем более необходимо, что на первый взгляд могло бы даже возникнуть впечатление, что мы сталки- сталкиваемся здесь с противоречием со здравым смыслом: ведь без даль- дальнейшего обсуждения непонятно, почему нельзя было бы измерить положение и скорость (т. е. координату и импульс) материального тела одновременно и со сколь угодно большой точностью, если только есть достаточно тонкие измерительные средства. Поэтому надо сделать совершенно ясным, путем подробного анализа тончай- тончайших процессов измерения (осуществимых, возможно, лишь в смысле мысленных экспериментов), что это не так. Более того, хорошо из- известные законы волновой оптики, электродинамики и элементарных атомных процессов ставят непреодолимые трудности на пути точного измерения как раз там, где того требует соотношение неопределен- неопределенности. Дело обстоит даже так, что в этом можно убедиться, еще рассматривая упомянутые процессы чисто классически (не квантово- 12 И. Нейман
178 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА {ГЛ. III Sch теоретически!). Это обстоятельство имеет принципиальное значение, так как показывает, что в классической, обоснованной независимо от справедливости квантовой механики, области (т. е. там, где квантовые явления еще не требуют существенных поправок к старому способу рассмотрения, — значит, единственно непосредственно доступной на- нашему наглядному восприятию 132)) мы не вступаем в противоречие с парадоксально звучащими соотно- соотношениями неопределенности кванто- квантовой механики. Нам следует, таким образом, по- показать, что если р и q являются двумя канонически сопряженными величинами и система находится в состоянии, в котором значение р может быть задано с' точностью г (т. е. измерение р допустимо с ошиб- ошибкой в пределах е), то значение q нельзя узнать с точностью, превосхо- превосходящей 7)= 7j— : е- Иными словами, из- измерение р с точностью е вносит неоп- неопределенность т)= 7j- : e в значение q. Естественно, что при таком очень •качественном рассмотрении нельзя надеяться точно передать все детали: вместо соотношения &ч\ = Л- мы сможем показать только, что щ-^h (т. е. щ равно h по порядку величины) в случае по воз- возможности наиболее точного измерения. В качестве типичного при- примера мы рассмотрим сопряженную пару: положение (координата) — импульс частицы Т ш). Исследуем сначала определение положения. Определить положение частицы Т можно, наблюдая ее, т. е. если она освещается и рас- рассеянный ею свет поглощается в глазу. Итак (рис. 1), квант света L испускается источником света / в направлении частицы Т, при столк- столкновении с Т отклоняется от прямолинейного кпути (^ в направле- направлении рр2 и в конце своего пути гибнет, поглощаясь экраном Sch 132) Фундаментальный смысл этого обстоятельства был подчеркнут Бо- Бором (см. ссылку в прим. 131)). Однако метод описания, которому мы сле- следуем ниже, не является совершенно классическим в одном отношении: мы будем предполагать, что существуют световые кванты или, иными словами, что свет частоты ч никогда не проявляет себя с количеством энергии мень- меньшим, чем кч. 133) Нижеследующим обсуждением мы обязаны Гайзенбергу и Бопу см. ссылки в прим. ш) на стр. 174. Рис. 1.
4] СООТНОШЕНИЯ НЕОПРЕДЕЛЕННОСТИ 179 (представляющим собой глаз или фотографическую пластинку). Изме- Измерение состоит в констатации того, что L встречает экран не в точке / (в конце неотклоненного пути pPi), а в точке 2 (в конце ?ф2)- Но для того чтобы отсюда сделать вывод о месте столкновения (т. е. о месте нахождения частицы 7"), надо знать и направления р и р2 (т. е. направление движения кванта света L до и после столкнове- столкновения): этого можно достичь, добавляя систему диафрагм ss и s's'. (При этом мы, собственно, не измеряем координату частицы 7", но лишь судим, имеет ли эта координата определенное — соответствую- соответствующее точке пересечения направлений р и ^2> которую можно выбрать по желанию, установив соответствующим образом щели, — значение или нет. Только суперпозиция многих таких рассуждений, т. е. установка многих щелей s's', эквивалентна измерению.) Как же обстоит дело с точностью такого измерения положения? Его точность принципиальным образом ограничена законами об- образования оптического изображения. Действительно, с помощью света с длиной волны \ невозможно резко отобразить объекты меньшие, чем X, или же хотя бы подавить дифракцию до такой степени, чтобы можно было говорить об одном (искаженном) изображении. Конечно, мы не требуем оптического изображения, так как для определения положения Т достаточно простого факта отклонения L. Однако щели ss и s's' нельзя делать уже, чем \, так как иначе L не сможет легко преодолеть их без искажений и возникнет целая куча интер- интерференционных полос, так что по направлениям линий, соединяющих последовательные щели ss и s's', уже ничего нельзя будет заключить о направлениях световых лучей fj и р2. Отсюда следует, что с по- помощью такой бомбардирующей частицы L невозможно прицелиться и попасть с точностью большей, чем \. Итак, длина волны X это в то же время и мера ошибки при из- измерении координаты: Х~е. Дальнейшими характеристиками свето- светового кванта L являются его частота v, его энергия Е, его импульс р; между ними существуют хорошо известные соотношения с 5 г Лс - Ё fit h v = -r, Е—Нч = ^г-, р = — =— — — л к ^ с с X (с — скорость светаI34). Следовательно, р . В точно не извест- известном процессе столкновения между L и Т происходит некоторая пе- передача импульса, которая, очевидно, имеет порядок самого ~р, т. е. тот же порядок, что и — . Отсюда для Т вытекает неопределенность h т)^/— в значении импульса. 134) Ср., например, оригинальную работу Е i n s t e i n'a, Ann. Physik 14 A905) или любой современный учебник. 12*
180 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. Ш Этим соотношение stj—h было бы доказано, не будь при этом просмотрена одна деталь. Дело в том, что процесс столкновения не так уж неопределенен. В действительности известны направления дви- движения L до и после ф и C2) и поэтому также его импульсы, откуда может быть найдена передача импульса частице Т. Следовательно, р не является мерой т;. Таковой, скорее, является возможная неопре- неопределенность в направлениях лучей $ и р2. Чтобы установить точнее связь между «прицелом» на маленький объект Т и неопределенностью в направлении, которая с этим связана, разумно воспользоваться приспособлением с лучшей фокусировкой, чем щель ss, а именно линзой. Следовательно, надо учесть ре- результаты известной теории микроскопа, согласно которой для освещения элемента поверхности с линейными размерами е (т. е. для попадания в частицу Т лучом L с точностью е) необходимо, чтобы меж- между длиной волны X и апертурой линзы X существовало соотношение ;—~е 2 sin |- (рис. 2I35). Неопределенность в ^-ком- ^-компоненте импульса луча L связана с тем, что его направление лежит в угле между 9 - X h п h J- и -\--k-t а в остальном неизве- неизвестно. Следовательно, ошибка будет порядка Но это — правильная мера для "ц, следова- h '—, т. е. е тельно, снова Этот пример очень ясно раскрывает механизм принципа неопре- неопределенности: чтобы точнее прицелиться, необходимы широкие глаза (большая апертура '<р) и очень коротковолновое излучение, т. е. очень неопределенные (и большие) импульсы световых квантов, которые сталкиваются (эффект Комптона) с наблюдаемым объектом Т в зна- значительной степени неконтролируемым образом и тем самым «разма- «размазывают» его импульс. 135) По поводу теории микроскопа см., например, Handbuch der Physlk, Berlin, 1927, Bd. 18, Кар. 2. G. В очень точных измерениях s, а значит и X, очень мало, т. е. надо пользоваться 1слУчами или еще более короткими длинами волн. Обычная линза отказывает при таких условиях, и примени- применимой была бы только такая, молекулы которой не разрушались бы и не вы- выбивались из своих положений этими 7"лУчами. Поскольку существование таких молекул и частиц не нарушает никаких известных законов природы, то их допустимо использовать для целей мысленного эксперимента.
i] СООТНОШЕНИЯ НЕОПРЕДЕЛЕННОСТИ 181 Рассмотрим еще противоположный процесс измерения: измерение скорости (импульса). Сначала следует заметить, что естественным ме- методом измерения скорости частицы • Т являются измерение ее поло- положений для двух различных моментов времени, скажем 0 и t, и де- деление изменений координат на t. В этом случае, однако, скорость в интервале времени 0, t должна быть постоянна; если же она из- изменяется, то это изменение является мерой отклонения вычисленной выше скорости от настоящей скорости (скажем, в момент времени t), т. е. мерой неопределенности измерения. То же справедливо для измерения импульса. Дальше, если измерения координаты сделаны с точностью е, то это в действительности не влияет на точность из- измерения среднего импульса, так как t можно выбрать произвольно большим. Тем не менее это приведет к изменению импульса по- h рядка — и, следовательно, к неопределенности в конечном значении импульса порядка у\ . Итак, в любом случае получается ?7j~</z. Чего-нибудь нового, если только это вообще возможно, можно было бы ждать поэтому только от таких измерений импульса, кото- которые не связаны с измерением положения. Такие измерения вполне возможны, и ими часто пользуются в астрономии, они основаны на эффекте Допплера, и мы сейчас рассмотрим этот эффект. Как хорошо известно, эффект Допплера состоит в следующем. Свет, излученный телом Т, движущимся со скоростью V, частоты v0 (измеренной на движущемся теле), воспринимается покоящимся на- наблюдателем как свет измененной частоты v, которую можно вычи- вычислить из соотношения - —— cos 6 F—угол между направлением движения и направлением излучения. Правда, эта формула нереляти- v вистская, т. е. она верна лишь при малых —, но ее легко можно было бы исправить). Поэтому определение скорости возможно, если v наблюдается, a v0 известно, скажем, потому, что это определенная спектральная линия известного элемента. Точнее, измеряется компо- компонента скорости в направлении наблюдения (направлении излучения света) i>cos6 = с lv ~v<" или же соответствующая компонента им- импульса р' — р cos 0 = mc ^ ~ (пг — масса тела Т). Дисперсия ч\ импульса р' зависит, очевидно, от дисперсии Av частоты м, так что 7wOTC ~——-. Импульс тела Т, конечно, изменяется из-за того, что оно испускает квант света частоты v и тем самым с импульсом
182 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III h Av -• р = , но неопределенность в этой величине пренебрежимо с с тс Av .од. мала по сравнению с 1Д0). Частоту v можно измерить каким угодно интерференционным ме- методом. Но при таком измерении абсолютно точное значение v полу- получится, естественно, лишь для чисто монохроматических цугов свето- световых волн. Такой цуг волн имеет форму asinl^^iS-—vn-)-aj (q— координата, t — время, а — амплитуда, a — фаза, — это выра- выражение представляет любую компоненту напряженности электрического или магнитного поля) и, значит, распространен по всему бесконеч- бесконечному пространству и времени. Чтобы избежать этого, приходится заменить это выражение, которое можно записать также и как -i ?|-|-a|, так как Х= —, другим, F\ —— t\, отлич- с / ' / v ^ \с ) ным от нуля лишь в конечном интервале изменений своего аргумента. Если световая волна имеет такую форму, то ее, как известно, надо подвергнуть анализу Фурье + СО F (х) = I av sin Btcvx + av) rfv. о Тогда интерференционная картина покажет все частоты v, для кото- которых av =? О, причем интервал частот v, v-f-^v войдет с относитель- относительной интенсивностью a? rfv. Дисперсия v, т. е. Av, должна быть вы- вычислена из этого распределения. Если рассматриваемый цуг волн имеет протяженность х по х, т. е. соответственные протяженности по t и q составят х и ее, то, как легко видеть, дисперсия частоты v будет ~ —ш). Неопреде- .... ,, тс Av h Av 136) утверждение: — велико по сравнению с означает, что v тс2 =- , , мало по сравнению с -т—. или же E=hi мало по сравнению с тс2, т. е. энергия светового кванта L мала по сравнению с релятивистской массой покоя тела Т, — это и без того неизбежное предположение при нереляти- нерелятивистских вычислениях. 137) Пусть, например, F (х) является конечным монохроматическим цугом волн частоты v0, протяженным от 0 до т: | a sin 2гл0х для 0 ^ х ^ х, у 0 вне этого интервала. (В силу непрерывности, на концах интервала sin27tvox должен равняться О, т. е. должно быть ^в = -^-' п=1, 2, 3, ...J Тогда на основе известных
СООТНОШЕНИЯ НЕОПРЕДЕЛЕННОСТИ 183 ленность положения возникает при таком способе измерения из-за того, что тело Т испытывает отдачу — (в направлении наблюдения) за время индивидуального акта испускания кванта света, т. е. его скорость подвергается изменению порядка —. Поскольку на про- процесс испускания требуется промежуток времени х, то момент этого формул обращения интеграла Фурье (см. прим. 67) на стр. 102) в?=&,+с,, где 1=2 / = 2a /*sln2« sln2«v0* • dx = = — a cos У + Vo) Д(У —Уо) Jo (—1)" COS ДУТ — 1 (—1)" COS ДУТ — 1 — a _ 2av0 A— (—1)" cos дут) (—l)"slnitvt (—1)" sin дут] _ 2ayo(—l)"slnr:yT д(у-|-у0) поэтому _2ау0ул2 — 2(—1)" cos дут _ (v-v0) J sin ) 1 cos H ДУТ _ 4ay0 [ sin д (y — vp) т 1 Как видим, наиболее сильно представлены частоты из окрестности у = у0, так что наибольшая часть энергии цуга волн попадает на тот интервал ча- частот, в котором д (у — у0) т имеет умеренные значения. Поэтому дисперсия v — у0 (или, что то же самое, дисперсия у) по порядку величины равна —. > — ynr dv Точное вычисление выражения дает тот же результат.
184 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА (ГЛ. III изменения скорости не может быть локализован точнее, чем в преде- лах т. Отсюда следует неопределенность в положении е— —-т. Поэтому Av тс Дм тс 1 , г 1/ так что мы имеем снова e7j~ft. Если тело Т не самосветящееся, как предполагалось выше, а рас- рассеивает чужой свет (т. е. оно освещено), то вычисление выглядит совершенно аналогично. 5. Проекционные операторы как утверждения Рассмотрим, как в III. 1, физическую систему S с k степенями свободы, конфигурационное пространство которой описывается k координатами qv . . ., qk (ср. также I. 2). Все физические величины Ш, которые могут быть построены для системы S, являются, в рамках классической механики, функциями от qx qk и от сопряженных импульсов pv ..., pk: 9t = %l(qv ..., qk, pv ..., pk) (например, энергия является гамильтоновой функцией H(qv . . ., qk, pv ..., pk)). С другой стороны, в квантовой механике, как уже было указано в III. 1, величины Ш взаимно однозначно сопоставлены гипермакси- гипермаксимальным эрмитовым операторам /?; в частности, qv ..., qk соот- соответствуют операторам Qi=qx• ¦ ¦ Qk—Qk• • • • & Pi< ••¦> Pk — операторам Р\ = ~Ы1Га * Рк== ^ITa В общем слУчае> как был0 пояснено в I. 2 на примере гамильтоновой функции, нельзя из-за неперестановочности Qt и Pt определить R как /?==M(Q1, .... Qk, Р1 Pk). He будучи в состоянии высказать что-либо вполне опре- определенное о соотношении между величиной 9^(^,, .. .. qk, pv .. ., рк) и ее оператором R, мы тем не менее установили в III. 1 и III. 3 следующие частные правила. L. Если операторы R, S соответствуют одновременно наблю- наблюдаемым величинам 91, @, то оператор aR-\-bS (a, b — веще- вещественные числа) соответствует величине affi-\-b<&. F. Если оператор R соответствует величине Ш, то вели- величине F (Щ (F(ty — произвольная вещественная функция) соот- соответствует оператор F (R). L., F, допускают еще некоторое обобщение. Оно вынуждается свойством F. и гласит: F*. Если операторы R, S, ... соответствуют одновременно измеримым величинам 91, ®, ... (следовательно, коммутируют, пусть их число конечно), то величине /?(М, ®, . ..) соответ- соответствует оператор F(R, S, ...)•
g) ПРОЕКЦИОННЫЕ ОПЕРАТОРЫ КАК УТВЕРЖДЕНИЯ 185 При этом мы примем, что F (к, р., . . ¦) — это вещественный поли- полином по X, р., ..., так чтобы смысл выражения F(R, S, ...) не вызывал вопросов (R, S, ... коммутируют), хотя F*. можно было бы обосновать и для произвольной функции F(K, jx, ...) (относительно определения общего выражения F(R, S, ...) см. ссылку в прим. 94) на стр. ПО). Тогда, так как любой полином можно получить по- повторением трех операций аХ, >- + (*, Хр., достаточно рассмотреть лишь эти последние, а поскольку Х|а = — @- + 1*J — (X— (*J). т. е. равно то указанные три операции можно заменить также операциями аХ, Х-)-(х, X2. Но две первые принадлежат к типу L., а последняя — к F.. Следовательно, F*. доказано. С другой стороны, L. распространяется в квантовой механике даже на те случаи, когда 91, S> не измеримы одновременно. Мы оС- судим этот вопрос позже (в IV. 1), а сейчас ограничимся замечанием, что даже смысл выражения аЧЛ-\-Ь^>, если Ш, ® одновременно не измеримы, вовсе не представляется ясным. Наряду с физическими величинами 91 существует еще нечто, являющееся предметом физики: именно альтернативные свойства*) системы S. Альтернативным свойством будет, например, что некото- некоторая величина 91 принимает определенное значение X, или что значе- значение величины 91 положительно, или что значения двух одновременно измеримых величин 9? и © равняются соответственно X и jx, или что сумма квадратов этих значений > 1 и т. п. Мы обозначали величины через 91, S> будем обозначать альтернативные свойства бук- буквами @, fj, ... Величинам отвечают, как мы только что установили, гипермаксимальные эрмитовы операторы R, S, .... что же будет соответствовать альтернативным свойствам? Мы можем сопоставить каждому альтернативному свойству (§; величину, определив ее так: каждое измерение, разрешающее альтер- альтернативу наличия или отсутствия свойства @, рассматривается как измерение этой величины; при этом ее значение равно 1, если (§; имеет место, и нулю в противном случае. Величину, которая соот- соответствует альтернативному свойству @, будем также обозначать через (?. *) Мы решили воспользоваться для перевода немецкого «Eigenschaften» таким оборотом, который точнее передаст по-русски смысл дальнейших рассуждений. Ради краткости мы будем говорить и просто об «альтернати- «альтернативах»— Прим. ред.
186 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III Такие величины принимают лишь значения 0 и 1, и обратно, любая величина 91, принимающая лишь эти значения, соответствует альтернативному свойству @, которое, очевидно, состоит в следую- следующем: «Значение величины 91 не равно 0». Поэтому для величин (§;, сопоставляемых альтернативным свойствам, этот признак является характерным. То обстоятельство, что @ принимает лишь значения 0, 1, может быть сформулировано также следующим образом: его подстановка в полином F(k) = X— X2 тождественно обращает последний в нуль. Если величине (? соответствует оператор Е, то величине F (@) соответствует оператор F(E) = E— Е2; поэтому наше условие гла- гласит: Е — Е2 = 0, или Е = Е2. Иными словами: оператор Е величины @ — это проекционный оператор. Итак, альтернативным свойствам (? (через посредство соответ- соответствующих величин (?, которые мы только что определили) сопоста- сопоставляются проекционные операторы Е или замкнутые линейные много- многообразия ffi, если рассматривать наряду с проекционными операторами Е — Р>ж и принадлежащие им замкнутые линейные многообразия Ш. Рассмотрим теперь более подробно вычисления с взаимно соот- соответствующими друг другу (?, Е и Ш. Если мы хотим рассудить альтернативу, обладает или нет состоя- состояние ср свойством @, то мы должны измерить величину (? и устано- установить, равно ли ее значение 1 или 0 (это — то же самое по опреде- определению). Тем самым вероятность первого, т. е. того, что @ имеет место, равна математическому ожиданию @, т. е. а вероятность второго, т. е. того, что (§; не имеет места, равна математическому ожиданию 1—@, т. е. (A -?)ср, ср)= ||(i -?)ср||2= \W-PmW2- (Сумма, конечно, равна (ср, ср), т. е. единице.) Следовательно, @ на- наверняка имеет место/не имеет места, если соответственно вторая/пер- вторая/первая вероятность равна нулю, т. е. при Р^ср = ср / Рэ<р = 0. Иными словами, если ср принадлежит к ffl/ ортогонально к Ш ил» же если ср принадлежит к 1/к 9^» — Ш. Стало быть, Ш может быть определено как множество всех ср, с достоверностью обладающих свойством (?. (Собственно, этим опре- определяется лишь подмножество Ш, лежащее на поверхности ||ср|| = 1. Само 9Ji получается отсюда умножением на положительные константы и добавлением нуля.) Если мы назовем свойство, противоположное свойству @ (отри- (отрицание @), «не @», то из сказанного выше непосредственно будет следовать, что если Е или Ш относятся к @, то к «не (?» отно- относятся 1 Е ИЛИ 'Лоо — SN-
5] ПРОЕКЦИОННЫЕ ОПЕРАТОРЫ КАК УТВЕРЖДЕНИЯ 187 Как и в отношении величин, здесь также возникает вопрос одно- одновременной измеримости (или, вернее, одновременной рассудимости*) свойств). Ясно, что (?, fj одновременно рассудимы тогда и только тогда, когда соответствующие величины @, ?$• одновременно измеримы (неважно, абсолютно точно или с произвольно большой точностью, noci ольку они ведь могут принимать лишь значения 0 и 1), т. е. если Е, F коммутируют. Аналогично обстоит дело в случае несколь- нескольких свойств (?,$$,<$,... Из одновременно рассудимых свойств @, ^ можно образовать дальнейшие свойства «@ и %» и «& или ^». Величина, соответ- соответствующая свойству «@ и fj», равна 1, если обе величины, соответ- соответствующие (? и fj, равны 1, равна 0, если одна из них равна нулю, т. е. произведению этих величин. Согласно F*. ее оператором будет произведение операторов величин @ и ^, т. е. EF. По теореме 14. из II. 4, соответствующее замкнутое линейное многообразие будет общей частью $Р многообразий Ш и Ш. С другой стороны, свойство «(? или ^» можно записать как «не ((не @) и (не ? и, следовательно, его оператором будет 1— A— ?)A— F) = E-\-F — EF по способу построения это, конечно, тоже проекционный оператор). Так как F — EF является проекционным оператором, то линейным многообразием, принадлежащим к E-\-F— EF, будет 5U-f-(^ — Щ (теорема 14. из II. 4). Оно является подмножеством {Ш, Щ и, оче- очевидно, содержит Ш, значит, по симметрии также и Ш, а следова- следовательно, и {Ш, Ш]. Следовательно, оно равно {Ш, Щ, которое, как замкнутое множество, само равно [Ш, У1]. Если @ является свойством, которое всегда имеет место (т. е. пустым), то соответствующая величина равна тождественно 1, т. е. ?¦=1, 2){ = 0?оэ. С другой стороны, если & никогда не имеет места (т. е. невозможно), тогда соответствующая ему величина тождественно равна 0, т. е. ?' = 0, 2){ = 0. Если два свойства &, $ несовместны, то во всяком случае они должны быть одновременно рассудимы и свойство «@ и ?$•» должно быть невозможно, т. е. Е и F должны коммутировать, a EF — 0. Но поскольку из EF = 0 вытекает пере- перестановочность (теорема 14. из II. 4), то это свойство характерно само по себе. Если предположить, что Е и F коммутируют, то тогда EF = 0 означает попросту, что общее подмножество множеств Ш и ЭТ состоит лишь из 0, однако из одного последнего условия перестано- *) Мы переводим словами «рассудить», «рассудимость» используемую автором терминологию «entschelden», «Entscheidbarkeit», не имеющую ана- аналога в нашей литературе. Прим. перев.
188 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III вочность Е и F следовать не будет. Напротив, в общем случае EF = 0 утверждает для Ш и Щ, что всё Ж ортогонально ко всему Ш (тео- (теорема 14. из II. 4). Если 91— это величина с оператором R, которому принадлежит разложение единицы Е(к), то оператором свойства «91 лежит в интер- интервале /={Х', (х')»#(Х'^(х') будет оператор ?(|х')— Е(к'). Чтобы убе- убедиться в этом, достаточно заметить, например, что вероятность сде- сделанного утверждения равна ((?(|а') — Е(к')) ср, ср) (ср. W, в III. 1). Другой способ: величина, соответствующая рассматриваемому свойству, равна @ = F (Щ, где ( 1 при Х'<Х=?и/, \ 0 в остальных случаях, так что F (R) = E ($.') —EQJ) (ср. П. 8 или III. 1). В III. 1 этот оператор обозначался через ЕA). Итак, мы пришли к следующим выводам относительно связи между свойствами @, их проекционными операторами Е и замкнутыми линей- линейными многообразиями 2>J этих операторов: «) Вероятности того, что свойство @ имеет или не имеет места в состоянии ср, равны (Яр. «p)= или (A _?)ср, ср)= ||A - Р) & с достоверностью имеет или не имеет места в состоя- состояниях ср, принадлежащих ffi или Jftco—9К соответственно, и только в таких состояниях. у) Для одновременной рассудимости нескольких свойств (?, 3% . .. перестановочность их операторов ?\ F, ... является характерной. S) Если f, 2){ принадлежат свойству @, то 1 —Е, Шсо — 2)? принадлежат свойству «не (§:». s) Если Е, Ш принадлежат свойству (J, a F, У1 — свойству ?$• и если & и ^ одновременно рассудимы, то fF и общая часть 2)?, У1 принадлежат свойству «@ и $», a f-)-/7 — fF и {Ш, Щ (равное [9К, S'J]) принадлежат свойству «@ или ?$•». Y]) @ всегда имеет место, если Е= 1 или же если 2tf = 3too, и никогда не имеет места, если С = 0 или же если 33i = (O). 91) @, ?$? несовместны, если EF = 0 или, также, если всё ЯЯ ортогонально всему Ш- Q Пусть величине 9? соответствует оператор R и пусть / — некоторый интервал. Пусть Е(к) — разложение единицы, принадлежащее R. 1={к',р'} (Х'^ц'), Е (/) = Е (ц') — Е (к') (ср. III. 1). Тогда оператор Е (/) принадлежит свойству «91 лежит в /».
6] ТЕОРИЯ ИЗЛУЧЕНИЯ 189 С помощью предложений а) — Z) можно вывести указанные выше вероятностные утверждения W., Е\., E%., а также утверждения из III. 3 относительно одновременной измеримости. Ясно, что послед- последние утверждения эквивалентны у); W. следует из «), г), Z), а Ей , Ег. являются его следствиями. Мы видим, что связь между свойствами физической системы, с одной стороны, и проекционными операторами, с другой, делает возможным некое логическое исчисление над ними. Однако в проти- противоположность исчислению обычной логики эта система обогащена характерным для квантовой механики понятием «одновременной рае- судимости». Это, основанное на проекционных операторах, исчисление пред- предложений имеет, пожалуй, определенные преимущества над исчисле- исчислением величин, опирающимся на совокупность всех (гипермаксимальных) эрмитовых операторов, состоящие в том, что понятие «одновременной рассудимости» является уточнением понятия «одновременной измери- измеримости». Например, чтобы вопросы «лежит ли 91 в /?» и «лежит ли S> в J?» [91 и ® обладают операторами R и S, а эти в свою очередь — разложениями единицы Е(к) и F(jx); /= {X', \"), J= {jx', jx"}] были бы одновременно рассудимы, мы требуем лишь (согласно у). ?))> чтобы операторы Е(/) = Е (X") — Е (к') и F (J) = F ([х") — F (|х') коммутиро- коммутировали. Для одновременной же измеримости 9t, ® необходима переста- перестановочность всех Е(\) со всеми F (jx). 6. Теория излучения Мы снова вывели все статистические утверждения квантовой механики, приведенные в I. 2, и даже существенно обобщили их и придали им систематический порядок с одним-единственным исключе- исключением. Именно, нам недостает гайзенбергова выражения для вероят- вероятности перехода из одного стационарного состояния квантованной системы в другое, хотя как раз оно сыграло важную роль в создании квантовой механики (ср. сказанное по этому поводу в I. 2). Следуя методу Dirac'a138), мы покажем теперь, каким образом могут быть выведены эти вероятности переходов из обычных статистических утверждений квантовой механики, т. е. из только что изложенной теории. Это тем более важно, что такой вывод позволит нам глубже заглянуть в механизм переходов между стационарными состояниями, а также в смысл частотно-энергетических условий Эйнштейна — Бора. Теория излучения, развитая Дираком, является одним из самых пре- прекрасных достижений в области квантовой механики. 138) Proc. Roy. Soc, London 114 A927). См. также изложение в книге Weyl'fl, Oruppentheorie und Quantenmechanik, Leipzig, 1931; 2-е изд., стр. 91 и последующие.
190 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ III Пусть 5—система (например квантованный атом), энергии кото- которой соответствует эрмитов оператор Но- Обозначим координаты, описывающие конфигурационное пространство системы 5 (если, на- например, S состоит из / частиц, то имеется 3/ декартовых координат: ) 1 z2 г зг1 i краткости через %; далее, для простоты пусть Но имеет чисто дис- дискретный спектр: собственные значения Wv W2, ¦ ¦ ¦, собственные функции cpi (?)• %©> ••• (некоторые из Wn могут совпадать). Произ- Произвольное состояние системы S, т. е. волновая функция ср (?), разви- развивается в соответствии с временным уравнением Шредингера (ср. III. 2) т. е. если при t = t0 <рД?) = <р (k) = 2 а*?* (?)> то Для произволь- произвольного времени со 2%1 Состояние cpE) = cpft(?) переходит, следовательно, в е h ку и/ т. е. само в себя (так как множитель е h * не играет роли). Значит, состояния cpft (?) стационарны. Таким образом, мы сперва вовсе не находим переходов из одного состояния cpft (Е) в другое. Как же получается, что о таких переходах все-таки говорят? Объя- Объяснение несложно. Мы не учли агента, который вызывает такие пере- переходы,— свет. Ведь уже согласно первоначальной теории Бора ста- стационарные квантовые орбиты нарушались лишь при испускании света (ср. прим. 5) на стр. 12), но если не обращать на него внимания (как в только что намеченной постановке задачи), то совершенно разумно, что получается абсолютная и постоянная стабильность. Таким обра- образом, следует расширить исследуемую систему так, чтобы она вклю- включила в себя и свет, который, возможно, будет испущен S, т. е. вообще весь свет, который может вступать во взаимодействие с S. Обозначим через L систему, образуемую светом (т. е. электромагнит- электромагнитным полем классической теории, исключая стационарное поле, поро- порождаемое электронными и ядерными зарядами). Рассмотрению подле- подлежит тогда система S-\-L. Итак, надо найти следующие вещи: /. Набор переменных для квантовомеханического описания системы L, т. е. конфигурационное пространство L. 2. Оператор энергии системы S-j-L. Эта энергия состоит из трех частей: «) Энергия системы S, существующая независимо от L, т. е. невозмущенная энергия S: для системы S — это оператор Но.
6] ТЕОРИЯ ИЗЛУЧЕНИЯ 191 §) Энергия системы L, существующая независимо от S, т. е. невозмущенная энергия L. Обозначим соответствующий опера- оператор через Hj- у) Остальная часть энергии, т. е. энергия взаимодействия S и L. Обозначим ее оператор через Hw- Как видно, здесь идет речь о вопросах, на которые, в духе основных принципов квантовой механики, сначала нужно ответить классически, с тем чтобы полученные таким образом результаты можно было затем перевести на язык операторов (ср. I. 2). Встанем поэтому сперва на чисто классическую точку зрения относительно природы света: будем рассматривать его (в духе электромагнитной теории света) как осцилляторное состояние электромагнитного поля 13Э). Во избежание излишних усложнений (диссипация света в беско- бесконечном пространстве и т. д.) будем считать, что S и L заключены в очень большой замкнутой полости Н объема Т с абсолютно отра- отражающими стенками. Состояние электромагнитного поля в Н описы- описывается, как известно, напряженностями электрического и магнитного полей: б = {<§.х, бу, б2}, ?>={&,, Фг $z}. Все величины б, §г являются функциями декартовых координат х, у, z общей точки полости Н и времени t. Следует указать еще, что теперь мы будем часто рассматривать вещественные пространственные векторы a^jct^, cty, аг], Ъ = {ЬХ, Ьу, Ъг] и т. д. (например, б, <?), а также разные конструкции с ними, как, например, внутреннее или скаляр- скалярное произведение [a, Ь) = лхЬх + луЪу + агЬг. Здесь, конечно, не возникает опасности спутать это скалярное произ- произведение с внутренним произведением (ср, i|>) в 91^. Обозначим диф- д2 д2 д2 ференциальный оператор -к-^ -\~ -3-5- + -r-j- через Д, а известные век- векторные операции — через div, grad и rot. Векторы 6 и § удовле- удовлетворяют в пустом пространстве Н уравнениям Максвелла: 13Э) Интересующийся этими вопросами читатель может найти изложение электромагнитной теории света в любом учебнике электродинамики, напри- например, Abraham-Becker, Theorie der Elektrizitat, Berlin, 1930. (Есть рус- русский перевод: А б р а г а м-Б е к к е р, Теория электричества, ОНТИ, Л.—М., 1936.) Ср. также дальнейшее изложение, проходящее в рамках теории Ма- Максвелла.
192 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. П1 Первое уравнение первой строки будет удовлетворено, если поло- положить .§> = гоШ (где ЗС = {%.х, 3ty. ЗСг)—так называемый вектор- потенциал; его компоненты также зависят от х, у, z, t), а второе— если б = -тг 31. После этого уравнения второй строки приобре- приобретают вид (A.) div9t = O, ДЯ —-Jr-JJ-Я^О. [В целях повышения симметрии пространства и времени, вектор-по- вектор-потенциал вводится часто несколько отличным способом. То, что пред- предложенный способ введения 31 дает общее решение уравнений Ма- Максвелла— здесь надо обратить особое внимание на то, что из первого уравнения второй строки следует лишь, что -n-div3t=0, т. е. div3t= — f(x, у, z), —доказывается в большинстве изложений теории Ма- Максвелла. Поэтому мы не станем дольше останавливаться на этом. Ср. прим.139) на стр. 191.] Уравнения (Д.) являются исходным пунктом для дальнейшего. Свойство стенок полости Н отражать свет можно выразить в виде условия перпендикулярности вектора-потенциала ЗС к стенкам на границах Н. Известный метод нахождения всех таких 31 состоит в следующем. Так как в рассматриваемой проблеме t нигде не фигурирует явно, то наиболее общим выражением для ЗС будет линейная комбинация всех решений, имеющих вид произведения век- вектора, зависящего от х, у, z, на зависящий от времени скаляр, %¦==%.(х, у, z, 0 = fO, У. z)- q(t). Уравнения (А.) дают тогда (Аи) div! = 0, Д1=тI, IT перпендикулярно к стенкам Н на границе. (А2.) -^-7@ = с217 (О- Здесь, согласно (Аи), ~q зависит лишь от л:, у, z, а согласно (А%.) — лишь от t. Значит, ~q есть константа. Таким образом, уравнения (Аи) формулируют проблему собствен- собственных значений, в которой ~q является параметром для собственных значений и 31 — собственной функцией. Теория таких задач полно- полностью разработана, и мы приведем здесь лишь результаты140). ио) Ср. R. С о и г a n t und D. H i 1 b е г t, Methoden der mathematischen Physik I, VI, §2,2.-5., стр. 358—363, Berlin, 1924.
61 ТЕОРИЯ ИЗЛУЧЕНИЯ 193 Задача (Ль) имеет чисто дискретный спектр, все собственные зна- значения Tjj, тJ, ... (пусть им соответствуют Щ, 9t2, ...) отрицательны и стремятся к —оо при «->-}-со. Полную систему 9tp 9t2, ... можно нормировать условием / / Шт< %]dxdydz = \ для т=.п, 0 для т Ф п. (Мы выбрали 4тсс2 вместо обычной 1, поскольку в дальнейшем такая нормировка окажется немного более практичной.) Обозначим т]л(<0) через 2~~ (Рл > О- ПРИ «-> + оо имеем также р„ —>> -|— оо), тогда даст qn (f) = у cos 2тсрл (t — t) (f, t произвольны). Таким образом, самое общее решение Ш имеет вид (fp Tf2» •••• ^р Т2> •••—произвольные константы). Энергия произ- оо вольного поля 1=2^л(л:' У> z)<ln{t) (рДе 51 не предполагается л = 1 решением задачи (Л.)> т- е- коэффициенты qn (t) произвольны) со- составляет и 4 5 га, п=1 @ ?„ (О 13 И Нейман
194 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. II! Интегрируя по частям, получим 141) (rot ttm, rot %n] dx dy dz = f f f и =J I f[rot rot ®m' ®n] dx dy dz s H / ^ div ^»- ЙЯ1 н H Поэтому ffl, tl~ 1 X / H m-\ Ho qv q2, ... можно рассматривать как координаты, описывающие мгновенное состояние поля, т. е. как координаты конфигурационного пространства системы L. Сопряженные импульсы рп (в смысле клас- классической механики) находятся из формулы в форме 141) Именно, J J J' [о, rot b]dxdydz= С f f [rot а, Ь] благодаря тождеству [о, rot Б] — [rot а, 6] = div (а X Ь) (аХ& — так называемое внешнее, векторное произведение векторов а и Б), если только нормальная компонента произведения а X Ь исчезает на гра- границе Н. Так как а X Ь перпендикулярно к а и Ь, то это безусловно так, если а или Б перпендикулярно к Я. У нас а = rot Sfm, Ъ = Жп, так что пер- первое безусловно выполняется.
6] ТЕОРИЯ ИЗЛУЧЕНИЯ 195 (ср. I. 2). Отсюда можно получить уравнения движения классической механики ~ д ~ д г, ~ чЕР т. е. что в точности совпадает с уравнениями (Дг.), вытекающими цэ урав- уравнений Максвелла. Тем самым доказана теорема Джинса: Поле излучения L можно описать в смысле чисто классической механики координатами qv q2, .... — которые связаны с мгновенным значением вектор-потенциала 21, описывающего поле, соотношением Ш = Ш(х, у, *)=S ?Д,(*. у. z), - посредством энергии (гамильтоновой функции) п=1 Точка массы 1, движущаяся по прямой линии, с координатой q, находящаяся в потенциальном поле Cq2, С = 2я2р2, обладает энергией 9) +4яЗр292|- Или же, поскольку опять p—-^—q, равной у (р2-\- 4тс2р2<72). Уравнение движения такой частицы имеет, следова- тельно, вид -зр-д'-]- 4тг2р27 = 0, решением которого является q = ="]f cos 2яр(^ — т) (f, x произвольны). Благодаря такому характеру движения эта система называется «линейным осциллятором частоты р». Следовательно, L можно рассматривать как совокупность некоторой последовательности линейных осцилляторов, частоты которых являются собственными частотами полости Н: pv p2, ... Это «механическое» описание электромагнитного поля важно по- потому, что его можно немедленно реинтерпретировать в духе обыч- обычного метода квантовой механики, описывая конфигурационное про- пространство системы L координатами qv q2, . .. и заменяя в выраже- „ h д нии для Е величины рп и q на -^—г -д— ... и qn • • ¦ соответственно. Последние операторы обозначим через Рп и Qn. Тем самым вопросы 13*
196 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III 1. и 2. Р) будут разрешены, в частности, оператором, о котором шла речь в 2. ?), явится Вопрос 2. а) был решен заранее, так как мы приняли, что Но из- известно. Таким образом, остается лишь вопрос 2. у), который, однако, не готовит нам дополнительных трудностей. Согласно классической электродинамике, взаимодействие между S и L вычисляется следующим образом: Пусть S состоит из / частиц (скажем, протоны и электроны) с зарядами и массами ev тг, ... .... еи mi соответственно и с декартовыми координатами xx = qv У\ = Яг> 2i = <73 xt = qzl_2, yl = q3l_v г1=-цц (совокупность которых образует символ ?, введенный выше) и пусть им соответ- соответствуют импульсы р*, рУ, pzv ..., pxv p\, pzv Тогда энергия взаимо- взаимодействия будет иметь вид (в достаточном приближении) Соответствующий оператор квантовой механики получается путем замены р*, рУ, р*, хч, уч, zw (v=l, .... I) на операторы Jj__d_ JLJL h д которые мы обозначим через Р%, Я,, Р%. Qf. Qv. Q?- Учитывая еще, что оо 31 (х, у, г) = 2?Л(;с' У> z)> получаем искомый оператор Hw в виде оо I Я=1 v=l V Здесь следует заметить, что мы заменили произведения />*ЭДЛ (х^, yv, z} операторами, используя произвольный порядок сомножителей: Р^^п, x(Q*< Qv. Qv)- хотя мы могли бы с равным основанием взять Шп,х (Q», Qv, Qv)^> а чтобы обеспечить эрмитовость возникающего 2) См., например, ссылку в прим. 138) на стр. 189.
ej ТЕОРИЯ ИЗЛУЧЕНИЯ 197 оператора, в действительности следовало бы пользоваться симметрич- симметричной записью вида К счастью, все это не играет роли ввиду того, что а. Ql Таким образом, полная энергия нашей системы S-J-/, и ее оператор Н = Но теперь полностью определены. Но прежде чем преобразовывать Н дальше, заметим следующее: конфигурационное пространство системы S-j-Z. описывается координатами % (т. е, qx q3l или же xv yv zv .... xv yt, zj) и qv q2 а волновая функция зависит от всей их совокупности. Но допускать в рассмотрение системы с беско- бесконечно многими степенями свободы или же волновые функции с беско- бесконечно большим числом переменных неудобно в формальном отноше- отношении и сомнительно с точки зрения законности математических опе- операций, — наши предписания относились ведь всегда к случаю конечного числа координат. Мы будем поэтому сперва учитывать лишь N первых из координат qv q2 а именно qv ..., qN (т. е. мы ог- ограничим ЧЦ линейными комбинациями Stj. ..., У1К), и лишь после того, как будет получен готовый результат для такой упрощенной системы, мы выполним фактически необходимый предельный переход из) Так как Pf коммутирует с Qf, QJ и не коммутирует только с Of, то для того, чтобы обосновать последующее преобразование (мы опускаем излишние индексы и заменяем 91 на F), следует доказать соотношение в котором Р = -я—г-'-s , Q — q- ¦¦ Это соотношение, играющее в матрич- матричной теории исключительно важную роль, проще всего проверяется с помощью прямого вычисления.
198 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ, III Таким образом, получаем N Н = Но + \ Ц № + ±* л=1 +2 2zs;5 л = 1 v=l Вместо Я„, Qn удобно ввести (не эрмитовы!) оператор Йп и сопря- сопряженный ему Rn: Rn = -4r BuPnQn + /Р„), & = -^ Bир„ёл - 1РЯ). Тогда Qe = ^- |/-2^-(^л + Л„). и так как PnQn -QnPn = -±-1, то -±- т'! • R*n~Rn = Поэтому, в частности, RnRn — RnRn—1- После этого формула для энергии принимает вид N =1 v=l N где С = const == -j V /гр„. Поскольку аддитивная постоянная в вы- я=1 ражении для энергии не имеет смысла, то константу С можно опу- опустить. Это тем более желательно, поскольку при N —>-{-оо С ста- становится бесконечным, что нарушило бы разумную конечность теории. Эрмитов оператор RnRn является гипермаксимальным и обладает чисто дискретным спектром, именно, состоящим из чисел 0, 1, 2, ...
6] ТЕОРИЯ ИЗЛУЧЕНИЯ 199 Соответствующие собственные функции обозначим через $"u(qn), ^"(qn), г„ \ ЛГ ~h [Если положить -я- 1/ — q вместо qn, то /2А?Я К 2Л Чп 2ЛР„ 2я/ д?л 2я V 2Ы i dqn 1 lid перейдут в —j^q и —f^~. соответственно, так что получим п п* 1 & I 1 2 I 1 t\nt\n— 2 E^2 ~т^ 2 " ^^ 2 ' s*s _ 1 а2 _, 1 2 ! «л«п 2 -ffi-TJI —  • Теорию собственных значений этих операторов можно найти во многих изложениях, например, Courant — Hilbert, стр. 261, формулы D2), D3) и относящийся к ним материал, а также стр. 76, формулы F0), F1) (русский перевод: Р. Курант и Д. Гильберт, Методы математической физики, ГТТИ, 1933, стр. 84, формулы C0), C1) и стр. 310, формулы D8), D9)); или Weyl, Gruppentheorie und Quan- tenmechanik, стр. 74 и далее.] Так как ^ (?), ф2 (?), ... образуют полную ортогональную систему в пространстве %, a ty"(qn), ^1(qn)< ••¦ образуют полную ортогональ- ортогональную систему в пространстве qn, то k — l, 2 Mv ..., MN — Q, 1, 2, ... образуют полную орто- ортогональную систему в пространстве 5, qv .... qN, т. е. в конфигу- конфигурационном пространстве. Мы можем тогда разложить любую волновую функцию Ф = Ф(?, <7i 4n) следующим образом: То обстоятельство, что мы нумеруем полную ортогональную систему и коэффициенты разложения /V-j-1 индексом k, Mv .... MN,
200 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА (ГЛ. ИГ а не одним, не играет никакой роли. Как показывают рассуждения в II. 2, гильбертово пространство волновых функций Ф можно интер- интерпретировать также как пространство (N-\-1 -кратных) последова- ОО 2 тельностей акМ. ... mn ( с конечной 2 2 ••• 2 \анм,...мК 1 \ *=i лг,=о л^=о' ' Какой же вид принимает оператор Н при таком понимании гиль- гильбертова пространства? Чтобы выяснить это, вычислим сначала НФ^м,... Мрг Так как Но действует только на I, а фА(?) является собственной функцией Но с собственным значением Wk и, далее, так как RnRn действует лишь на дп, и tynM (q Л является собственной функцией R*nRnc собственным значением Мп, то Для любого оператора А, который (подобно выражению [...]) дей- действует лишь на переменную 5, можно пользоваться разложением ЛЬ @ = 2 (А|>*. фу) • ф;E) = 2 (Л),у^E). где (Л)Ау=(ЛфА, ^). Дальше, как показано в упомянутой выше работе, КГм(Ч„)=УМГМ-г (Я„). КГм(Чп) (при М = 0 правую часть первого уравнения надо считать, не об- обращая внимания на появляющееся в ней выражение ty"_v равной нулю). Следовательно, я=1 +Ё у=1 я=1 X
(:] ТЕОРИЯ ИЗЛУЧЕНИЯ 201 Теперь оператор Н можно представить себе как оператор, действую- действующий на коэффициенты аьм mn по формула где / N оо TV Здесь наше обсуждение оператора Н достигло того этапа, когда можно уже осуществить предельный переход ЛГ—>оо. Поскольку система индексации коэффициентов аш м изменяется при таком процессе, то в результате возникает совершенно новый оператор Н- Нам нужно ввести компоненты аш м с бесконечно многими ин- дексами Мг, М2, .... но уже для того, чтобы гарантировать конеч- оо ность суммы 2 hpnMn, фигурирующей в Н, следует ограничиться п=1 такими последовательностями Mv М2 ..., которые содержат лишь конечное число элементов, отличных от нуля. Итак, начиная с этого момента будет строиться гильбертово пространство последователь- оо оо оо ностей аЬмхмг... с конечной суммой 2 2 21 I «*ж,ж2... I2; при * = 1 ЛГ, = О ЛГ2=0 этом индексы k, Mv M2 пробегают следующую область: k=l, 2, .... Mv M2, ... =0, 1, 2, ..., с конечным (но произвольным) числом Мп Ф 0144). Окончательно оператор принимает следующий 144) То, что так описанная система индексов k, Mv Мь ... действительно образует последовательность, можно проще всего доказать следующим об- образом. Пусть jtj, jt8, щ, ... есть ряд простых чисел 2, 3, 5, ... Произведе- Произведения п^1^1-!^2 ... в действительности будут конечны, так как, кроме ко- конечного числа исключений, все Мп == 0, т. е. сомножители пп"\ = 1- Далее, если k, Мь М2, ... пробегают полностью всю нашу систему индексов, то числа nf~ 1п21 'т^2... пробегают совокупность всех чисел 1, 2, 3, ... и при- принимают каждое значение только один раз. Поэтому можно воспользоваться числами %f~~ 1п21'г^г ¦¦¦> чтобы получить однократную систему текущих ин- индексов для коэффициентов в/м^м, ...•
202 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. Ill вид: (со я=1 оо оо + 2 2^2/ {VМп-\- 1 ajM м ...м +1...Н- VMnajM,M. ... м -1...) где tcf^ определяется выражением Прежде чем извлекать из этого результата интересующие нас физические выводы, напомним, что он был получен на основе элек- электродинамической теории света. Было бы желательно установить сперва, достаточно ли проделанного нами шаблонного квантовомеханического преобразования, чтобы передать отклонения света от волновой модели, в частности его на самом деле дискретно-корпускулярную природу. (Конечно, вполне разумно было бы ожидать, что для достижения этой цели надо бы исходить прямо из корпускулярной модели, а не «кван- «квантовать» электромагнитное поле, как было сделано выше.) Непосредственно из вида полученного выражения Н для энергии ясно, что что-то вроде световых корпускул в нем есть. Дей- Действительно, если опустить в этом выражении второй член, пред- представляющий своего рода возмущение и который, как вскоре будет видно, является причиной квантовых скачков системы 5 из одного «стационарного состояния» в другое (т. е. причиной интере- интересующего нас сейчас явления, которое, однако, всегда существенно слабее, чем сама материальная система 5 и уже присутствующее излучение, и которые, как мы увидим, овеществлены в первом сла- слагаемом Н). то останется только Но это выражение для энергии можно интерпретировать следующим образом: это энергия Wk системы S, к которой добавляются энергии hpnMn (л=1, 2, ...)¦ в связи с чем напрашивается интерпретация чисел Л4„ —0, 1, 2, ... как чисел частиц, обладающих соответст- соответственно энергиями йр„. Но Лр„—это в точности та энергия, которую, по Эйнштейну, надо приписать световому кванту частоты р„ (ср. прим. 134) на стр. 179). Итак, строение Hi говорит в пользу того представления, что находящееся в полости Н электромагнитное поле (за вычетом электростатической части), т. е. L, состоит в действи- действительности из квантов света с частотами plF р2, .. . и с энергиями
g] ТЕОРИЯ ИЗЛУЧЕНИЯ 203 /zpj, #p2 числа которых указываются индексами Mv M2, ... (=0, 1, 2, .. .). То обстоятельство, что других частот, помимо рр р2 нет, можно сделать легко понятным, если заметить, что эти частоты являются собственными частотами полости Н. Действи- Действительно, векторы-потенциалы %п (xyz) f cos 2тгрл (t — т) представляют собой единственно возможные в Н стационарные электромагнитные колебания. Приведенные соображения и интерпретации обладают поэтому лишь эвристической силой; полностью удовлетворительный и окончатель- окончательный ответ на наш вопрос мы получим лишь тогда, когда, и если, нам удастся получить выражение Н для оператора энергии, отпра- отправляясь, от модели световых квантов для изучения L. Мы вынуждены были провести сначала классическое рассмотрение из-за того, что доквантовомеханическая гипотеза световых квантов не дает нам выра- выражения для энергии взаимодействия кванта света с материей (в этом пункте реинтерпретацию классической электродинамики никогда не удавалось провести). Теперь же мы сможем определить этот член взаимодействия сравнением коэффициентов, если только окажется, что результат, который мы получим, пользуясь общим выражением для энергии взаимодействия, совпадет по форме с оператором Н. Что такое конфигурационное пространство L (вопрос 1.) с точки зрения гипотезы световых квантов? Один-единственный световой квант (в полости Н) можно было бы охарактеризовать известными координатами, совокупность которых мы обозначим символом и 145). Пусть его стационарные состояния (в Н) обладают волновыми 145) В качестве координат, описывающих световой квант, можно исполь- использовать, например, его импульсы рх, ру, pz, а также координату п, опреде- определяющую его состояние поляризации. Компоненты рх, ру, pz определяют на- направление движения светового кванта, т. е. его направляющие косинусы ах, ау, az (а^ -(- а2у -f- a2, = l), равно как его частоту ч, длину волны X и энер- энергию, ибо согласно Эйнштейну длина вектора импульса равна — (ср. прим. 134) на стр. 179), и следовательно, fat hv hv т. е. "> = -^Vpx + p)jtP1z' X = V' энергия = /tv, _ срх _ сру _ cpz ах~~Ь"' аУ~ТГ' a~~h7' Здесь, однако, начинает мешать то обстоятельство, что наши собствен- собственные колебания 31„ (х, у, г) 7 cos 2тср„ (t—т) являются стоячими волнами —иных и не может быть в полости Н из-за отражающих стенок, — а такие собст-
2U4 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III функциями фДк), ф2(к)> ••• (которые образуют полную ортонорми- рованную систему) и энергиями Ev Е2, ... Эти стационарные состоя- состояния отвечают электромагнитным собственным колебаниям З^, 3t2, ... с частотами plt р2, ... (Согласно представлениям Эйнштейна должно быть En = hpn, что также будет доказано.) В связи с этим надо заметить следующее: уже при электромагнитном рассмотрении мы так нормировали энергию света, что ее минимальное значение было равным О, оно соответствовало индексам Мг = М2— ... =0. Тем самым мы при- признали и несуществование за возможное состояние света, и это объективно оправдано. Ведь световые кванты могут в самом деле испускаться и поглощаться, т. е. создаваться и уничтожаться. Между тем такое представление совершенно чуждо квантовой механике: каждая ча- венные колебания %п нельзя поставить в соответствие ни с каким «напра- «направлением луча» ах, ау, az. Непосредственно ясно, что наряду с направлением ах, ау az, во всяком случае, имеется и противоположное направление — ах, —ау, —az, и то же утверждение справедливо и для импульса. Следовательно, в полости Н надо пользоваться не рх, ру, рг, я, а какими-то другими коор- координатами. В некоторых новых изложениях рассматриваемого предмета это затруд- затруднение преодолевается с помощью следующего приема. Будем считать, что полость Н является параллелепипедом — А<х<А, —В<у<В, —C<z<C, граничные поверхности которого х= ± А, у = ± В, г = ± С не считаются отражающими стенками. Отождествим вместо этого „ А с х = ^4 v = В с v = В z = С с z ^= С Это означает, что излучение, падающее на стенку х — А в точке А, у, z возобновляет в точке — А, у, z свое движение в том же направлении (снова внутри полости Я), как если бы ничего не случилось, и т. д. (ср., например, статью Л. Ландау и Р. Пайерлса, L. Landau und R. Peierls, Z. Physik, 62 A930)). Можно сказать также, что пространство считается периодическим в направлениях х, у, z с соответствующими периодами 2А, 2В, 2С. Аналитически рассмотрение остается прежним, но граничными условиями теперь будут Ш(А, у, z) = SI (— А, у, г), Ш (х, В, z) = 51 (х, — В, z), Ш(х, у, С) — Ж(х, у, —С) (вместо прежних: ^— Э1 = 0 на границе), а «элементарные решения», по которым идет разложение, примут вид j cos (sin (а не %{х, у, z)?(t)). Можно легко найти принадлежащие собственным ре- решениям v = ря и Дальнейшее же развитие теории совпадает с приводимым в тексте.
б] ТЕОРИЯ ИЗЛУЧЕНИЯ 205 стица привносит свои координаты в конфигурационное пространство системы и тем самым настолько интимно входит в формальное опи- описание всей системы, что фактически ведет Себя, как абсолютно не- неуничтожаемая. Поэтому и после уничтожений ей приходится припи- приписывать своего рода латентное существование, когда ее координаты все еще принадлежат конфигурационному пространству. Следовательно, одно из состояний ф„(и) с энергией Еп — 0 должно отвечать несу- несуществованию кванта света, — мы предпочитаем обозначать такое состояние через фо(и)(?о = О), так что волновые функции ^(и), ф2(к), ... описывают существующий световой квант, но только %(и), tyi(u), ф2(к)> ••• образуют полную ортогональную систему. Перейдем теперь к рассмотрению L, системы всех световых квантов. Поскольку в счет идут и неприсутствующие кванты, то L состоит из столь многих квантов, что их никогда не может ока- оказаться больше этого числа, т. е. количество световых квантов в L бесконечно велико. Поскольку все же нецелесообразно с самого на- начала иметь дело с бесконечно многими составляющими системы L, то будем сперва поступать так, как если бы имелось всего 5 свето- световых квантов E=1,2,...), и только в конце перейдем к пределу S->-j-oo 146). Перенумеруем эти световые кванты с помощью чисел 1, .... 5 и обозначим их координаты через иг, .... ид. Конфигура- Конфигурационное пространство системы L будет тогда описываться пере- переменными их us, а конфигурационное пространство S-{-L — переменными 5, uv ..., us. Наиболее общей волновой функ- функцией S-\-L будет поэтому /(?, uv ..., us), а совокупность функций 5 образует полную ортогональную систему. Далее, световые кванты обладают фундаментальным свойством быть совершенно тождественными друг другу. Это значит, что на свете не существует способа различить два кванта с одинаковыми координатами и. Иными словами, состояние, в котором световые кванты с номерами тип имеют некие координаты, например ит= и', ип = и", нельзя отличить от состояния, в котором ит—и", ип-=и'. (Это классический, а не квантовомеханический, способ описания, так как мы задали значения к, а не волновую функцию <р(и)!) Квантовомеханически это будет означать, что состояния, принад- принадлежащие волновым функциям /(?, uv .... ит, .... ип us) и И6) Этот предельный переход S ->-(- со отличается от предельного пере- перехода N->-\- со, проделанного в электромагнитной теории! Действительно, если и индексы М{, М2, ... интерпретировать как числа световых квантов, то N будет ограничивать число некогерентных световых квантов (т. е. све- световых квантов с несовпадающими частотой, направлением распространения — они совместно определяют импульс — и поляризацией; ср. прим. 143) на стр. 197), тогда как S ограничивает число световых квантов вообще.
206 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. Ш /( ,«! ип ит, .. ., us) неразличимы. Иными словами, любая физическая величина 91 имеет в обоих этих состояниях одно и то же математическое ожидание (а значит, поскольку то же справедливо для F(ffi), каждая физическая величина имеет одну и ту же статисти- статистику— ср. в III. 1 обсуждение предложений Ей и Е2.). Обозначим функ- функциональную операцию, которая переставляет ит и и„, через Отп (От/1 является одновременно эрмитовым и унитарным оператором Отп = 1, в чем легко убедиться), тогда сделанное утверждение будет означать, что математическое ожидание (ft по какой-нибудь волновой функции / будет совпадать с математическим ожиданием по волновой функ- функции °mnf> т. е. (/?/. f) = (ROmnf, Omnf) = (OmnROmnf, /), откуда R = QmnROmn, или же ROmn = OmnR. Это Означает, что в рассматриваемом случае допустимы лишь такие операторы R, которые коммутируют со всеми Отп (т, я=1, ... . .., S, т Ф п), т. е. (вспоминая определение Отп) такие, в которые все координаты их us входят симметрично. Волновая функция /, симметричная по всем переменным uv .... us, т. е. для которой Omnf = f (т, п = \ S, т Ф п), переходит под действием такого оператора R в новую волновую функцию того же рода: OmnRf = ROmnf = Rf. Такие / образуют замкнутое линейное многообразие, т. е. они образуют гильбертово подпро- подпространство Stio' в гильбертовом пространстве SR^,' всех функций /, а операторы R отображают элементы ffta, на элементы из того же подпространства, т. е. их можно рассматривать как операторы в гильбертовом пространстве 9t^J. Таким образом, пространство 5R»' столь же полезно для нужд квантовой механики, как и первоначально рассматривавшееся 9^, и возникает вопрос, не надо ли ввиду сим- симметрии L по отношению к обменам световыми квантами ограничиться симметричными волновыми функциями, т. е. заменить $& на 9^'. Мы сделаем это, и результат, т. е. желаемое полное совпадение с выражением для Н. полученным в электромагнитной теории, оправдает нас post factum147). Волновые функции срй($)ф„ (и{) ... ф„5 (us) образуют полную ортонормированную систему в 9^'. Пользуясь этой системой, построим теперь полную ортонормированную систему в 9^. Пусть Мо, 147) Такая замена Ш^ на SrW равнозначна замене обычной статистики так называемой статистикой Бозе—Эйнштейна, если рассматривать след- следствия этой замены безотносительно к квантовой механике. Ср. по этому поводу работы Дирака в прим. 138) на стр. 189.
6] ТЕОРИЯ ИЗЛУЧЕНИЯ 207 Mi, ¦¦• —некоторые числа =0, 1, 2 удовлетворяющие усло- условию Мо-\-М1-{- . ..=? (так что лишь конечное число из них отлично от нуля). Обозначим через [Мо, Мх, ...] совокупность всех систем индексов nv .... ns, в которых 0 фигурирует М{) раз, 1 фигурирует Мх раз, ... Имеется в точности Мо\ Мх\ ... различных систем. Положим ФжоЖ, («1 ... us) = S <k («О ¦¦•bs (>- ni ... ns в [M0Mi ...] Так как волновая функция ФмоМ, ... является суммой Мо\ Мх\ ... попарно ортогональных слагаемых, модуль каждого из которых равен 1, то квадрат модуля этой волновой функции будет суммой М0\М1\... единиц, так что ее модуль будет равен УЛ^.'ЛТ,! .... Две различные волновые функции содержат попарно ортогональные слагаемые, а потому сами взаимно ортогональны. Волновые функции •W (« U) Ф (" U) образуют, таким образом, ортонормированную систему. Волновая функция /(?, иг us), симметричная по uv .... us, имеет одно и то же внутреннее произведение со всеми слагаемыми, образующими функцию ?* (S) ®m лг (иг ¦'" us)< значит, она ортогональна к каждому из них, если она ортогональна к <рк (?) Фм м (ut иЛ, т. е. к «р^СОфмд! (uv •••> us)- Следовательно, если она орто- ортогональна ко всем yk(Z)tyMM («!• •••• «s). то она будет орто- ортогональна ко всем cpft (?)ф (иЛ ¦ • • фя («s) и, следовательно, она =sO. Стало быть, волновые функции <$k(S)tyMM (иг . .. иЛ (которые сами принадлежат к SR^') образуют полную ортонормированную си- систему В З^то'. Рассмотрим теперь набор энергий, выступающих в системе S-\-L. Во-первых, [2. а)] там имеется энергия системы S, оператор кото- которой для 5 определяется уравнением Н0<р* 00 = ^Vp* 0;) и, значит, для S-\-L — уравнением Но?, © W ... (И1 • • • us) = *Л @ Флад,, ...(«I'" Ks)' Во-вторых, [2. §)] каждый световой квант /' обладает энергией Нг'ф„(и) = ?'пфл(и). Поэтому /я-й квант (т = 1 5) обладает в S-\-L энергией @ фя, («0 • • ¦
208 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III так что нужно образовать сумму Нг=Нг + ... +Нг„. Наконец, [2. у)] пусть энергия взаимодействия светового кванта /' с систе- системой S описывается, пока еще точно не известным, оператором V, который мы представим в виде матрицы: В системе S-\-L, следовательно, будем иметь для m-го светового кванта со оо = 2 So vkHmfJp4j © t, («О • • • Ь К) Р ...Л.Р - \ т S E (я) равно 1 при я = 0, 0 при п Ф 0), и нужно образовать сумму Н« = ^+ ... +^s. Собирая все вместе, будем иметь ns) Т* @ Фй1 («,) • • • ts («s) СО GO / x /1 о In. — pA . . . V ъ , ¦ ... ; = 1 p ... p =0 m=l V ' ' Knml'pm n ... p 1 S В результате легкого вычисления это выражение принимает вид СО Д я>20 Wwfll © Ф^Л ... Ж„-! ... Vl ... («1 • • • «5)
6] ТЕОРИЯ ИЗЛУЧЕНИЯ 209 (для ге = р надо заменить ... Мп — 1 ... Мр -{- 1 ... на ... Мп ...) и, значит, для ортонормированных функций Jo ад) ъ (о Ф Jo со со 4- 22 п /Ч, (М„ + 1 - 8 (я - />)) ^Я,/Л © X J— I Л, /7=0 Общую волновую функцию /(?, alt ..., к5) из sJtiJ лгожно разло- разложить по этим ортонормированным функциям: (I (Д1о+ЛГ,+ ... = S) Следовательно, 9^ можно представлять себе и как гильбертово про- пространство последовательностей аш™ , k=\, 2,...,M0, Mv...= = 0, 1, 2 Мо-{-Мх-\- ... =S, с конечной суммой 2 \akMM ?• ^ этом слУчае оператор определяется из уравнения со оо ... =5) со со так что (ft, у и я, р обменялись ролями по сравнению с формулой для *Р* С?) Фдл^м, ...(«I ••• «s): вместо VyrtSB мы написали Vkn/Jp, учитывая эрмитовость V.) Перейдем к подготовке перехода к пределу ?->-(-со. Так как Мо определяется числами Mv M2, ..., согласно соотношению. 14 И. Нейман
210 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА 1ГЛ. Ill M0 = S—Мг—М2— . . ., то можно вместо akM писать akMM При такой записи индексы оказываются ограниченными условиями k= = 1, 2. .... Mv M2, ... =0, 1, 2 Мх-\-М2+ ... t^S. Если заметить, что Ео = 0 и ввести обозначения SV^o/jo = Vkij, Y$ Vkoijn = — Vkijm V$ Vknijo = Vjikn (Vknjjp—эрмитова матрица!), то найдем СО IVм" V —j - со со Теперь можно устремить 5-> + оо. Коэффициенты й^ж,^... будут тогда снова определены для всех последовательностей kM1M2..., в которых к = 1, 2 Mv М2, . . . = 0, 1,2 причем только лишь конечное (но произвольное) число Мпф0 (ср. прим. Ш) на стр. 201), а из Н получится S /у,2Н S S(;7*« /я + ;/w,ж2...мп+\... aJMlM2...Mn-i...)-{- оо со 2 2 Vknljp УТЛАЖ^Т) CLjMM ...М-1...М +1.... ;=1 п,р=1 1 2 я р Сходство с уравнением, полученным на основе электромагнитной теории излучения, 'теперь очевидно; чтобы сделать оба выражения тождественными, следует лишь положить
61 ТЕОРИЯ ИЗЛУЧЕНИЯ 211 Итак, мы видим, что концепция световых квантов оказывается то- тождественной классической электромагнитной концепции, если: 1. Последняя переписывается в соответствии с общей кван- товомеханической схемой. 2. Энергия каждого светового кванта, в соответствии с правилом Эйнштейна, приравнивается й-кратной частоте. 3. Энергия взаимодействия светового кванта с материей определяется правильным образом (ср. приведенное выше вы- выражение для V). На этом пути блестяще разрешается один из труднейших парадоксов квантовой теории в ее ранней форме — двойственная природа света (электромагнитные волны и дискретные корпус- корпускулы световых квантов) 148). Конечно, трудно найти прямую, наглядную интерпретацию только что вычисленной энергии взаимодействия V света и материи. Это тем более трудно, что ее единственно отличные от нуля матричные элементы Vun\)p (т- е- Для которых п = О, р Ф О или пфО, р — §) зависят от числа всех возможных световых кван- квантов 5 (они пропорциональны j_ ), а ведь окончательно нужно положить 5—»-j-oo. Тем не менее можно примириться с этим, если учесть, что любое модельное описание является лишь приближением, тогда как точное содержание теории и как раз дается выражением для оператора Н. Возвратимся теперь к нашей первоначальной задаче: определению вероятностей перехода. Согласно временному уравнению Шредин- гера, изменения в коэффициентах акММ = акмм W опреде- определяются из h д -2 2 wh (Vmn+i aJ Так как главное изменение в акММ вызывается первым членом этого выражения, то целесообразно выделить его с помощью под- подстановки 148) Дальнейшие подробности относительно того, как понималась эта «двойственная природа» и как парадоксально она воспринималась, читатель найдет в литературе того времени. См., например, работы, указанные в прим. в), стр. 13. Часто говорилось, что квантовая механика предписывает материи ту же двойственную природу, поскольку дискретные частицы (электроны, протоны) 14*
212 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III Тогда Физический смысл коэффициентов akMM и bkMM можно уяснить себе из способа их введения: при конечном Мй-\-М1-\- ~\-М2~\- ¦ ¦ • —S волновая функция <р^ @ ^"л! A (ui • • • "s) описы- описывала состояние, в котором система 5 находилась на А-й квантовой орбите и имелось Мо, Мх, М2, ¦ ¦. световых квантов в состояниях Фо> $\< 4*2' • ¦ • соответственно, т. е. Мо световых квантов в состоя- состоянии «несуществования», a Mv М2, ... в состояниях, принадлежащих соответствующим собственным колебаниям Stj, 212, ¦ ¦ • Коэффициенты ашм • принадлежащие этой волновой функции, имеют тогда вид пШ1М2 ... = 8 (k - *) 8 (^1 - ^l) 8(^2 - Щ ¦ ¦ ' (Лишь конечное число множителей отлично от 1, так как равенство Мп — Мп — 0 имеет лишь конечное число исключений.) Это, конечно, останется справедливым и после перехода к пределу 5—>-)-оо. В слу- случае произвольного состояния akMM системы S-\-L упомянутая конфигурация (если она измеряется, см. сказанное в III. 3 по поводу невырожденного чисто дискретного спектра) имеет, следовательно, вероятность В частности, полная вероятность того, что система 5 находится на k-й квантовой орбите, равна- 0^ = 2 |* также описываются волновыми функциями и проявляют типично волновые свойства, например дифрагируют на решетке. [Ср. эксперименты D a v i- son'a — Germer'a, Phys. Rev. 30 A927), Proc. Nat. Acad. Sci. U. S. A. 14 A928), а также СР. T h о m p s о n' a, Proc. Roy. Soc. 117 A928) и Rupp'a, Ann. Physik 85 A928).] В противоположность этому, однако, надо Под- Подчеркнуть, что квантовая механика выводит обе «природы» из одной единой теории элементарных явлений. Парадокс прежней квантовой теории состоял в том, что для объяснения эксперимента приходилось попеременно привле- привлекать две противоречащих друг другу теории (электромагнитную теорию Максвелла — Герца и теорию световых квантов Эйнштейна).
6] ТЕОРИЯ ИЗЛУЧЕНИЯ 213 Пусть первоначально (t = 0) атом находился в k-u состоянии и пусть имелось Mv М2, ¦ ¦. световых квантов в состояниях 21,, %2, .... т. е. В силу приведенного выше дифференциального уравнения и как пер- первое приближение (т. е. для настолько коротких промежутков вре- времени t, что правая часть может считаться постоянной) отличными от нуля будут вообще лишь те из ^ff>kMM , для которых либо набор Mv М2, .... Мп-\-\, ..., либо набор Mv М2, .... Мп—1, ... совпадает с набором Mv М2, • ¦ ¦'• т. е. все k, Mv М2, ... ..., Мп + 1, ... После интегрирования найдем для них -"^(Wr-W -Ар \t 1 — е h \ k * "¦> , /-¦= Ь W1ю W ; I/ М -\- I, -^irCW-r-W.+hi! \ I У Все прочие bkMM равны в этом приближении нулю. (За исклю- исключением коэффициента Ь^ ^ , который в этом приближении, т. е. с точностью до ^-членов, должен был бы равняться своему началь- начальному значению 1. Тем не менее тот вывод, что -^^д}^ = 0, ста- становится сомнительным из-за того, что правая часть нашего диффе- дифференциального уравнения содержит в этом случае в нашем приближе- приближении бесконечно много членов Ь^-^ м ±\ ' не обращающихся 1 п в нуль. Поэтому из малости каждого из этих слагаемых — при малых i— нельзя еще делать вывод о малости их суммы. И действительно, вычисление приближений более высоких порядков показало бы, что отклонение b-k-^-^ от 1 пропорциональной, а не t2 14Э). Поскольку, однако, 2' \ьшм _j= 2 так что |* __ |2—1_ V | RM1M2 ..• | l i?— ш,м2. 149) Точное решение этого дифференциального уравнения было дано Weifikopf'oM и Wigner'OM (Z. Physlk 63A930)). С помощью этого решения можно убедиться в справедливости сделанных утверждений.
214 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III то прямое вычисление коэффициента Ь^'м на самом деле не обязательно.) Из приведенных формул ясно видна качественная природа про- проф b соответствующий испусканию цесса: коэффициент светового кванта % м +г (с частотой рп), становится тем больше, чем меньше знаменатель W^—Wk — hpn, т. е. чем ближе частота света рл W-—W к «боровской частоте» ——¦—-150); аналогичным образом коэффи- коэффициент bjijjj ж ж -i ' соответствующий поглощению, возрастает при W — W. приближении р„ к k —- . Мы видим, таким образом, что воровское соотношение частот выполняется не точно (ведь р„ цредоставляют в наше распоряжение не все частоты), но все же с подавляюще боль- большой вероятностью — если время t мало, а частоты р„ расположены очень густо (как то и будет для большой полости Н). Далее, частоту таких процессов увеличивают и матричные элементы 1^. Мы вскоре сможем отождествить их с вероятностями переходов. Из нашей формулы для ^ +i следует, что 1—cos 2я I р„— I bkMlM2 .мп+х. .Ma-1. » r Л2 А W—Wt k—r-k- ft* | W — W-\* k k bkMiAI> = 0 для kMxM2 .. . ФШ1М2 .... Ш1М2 ... Mn±l 16°) H. Бор, как известно, установил в 1913 г. фундаментальный принцип (см. ссылку в прим. 5) на стр. 12), согласно которому при переходах из стационарного состояния с энергией W^ в стационарное состояние с энер- энергией WB) атом испускает свет частоты ^ (конечно, W(l) > WB)). В нашем случае этому соответствует 161) Имеет место | е1* _ 112 = (eix - 1) (eix - 1) = (в" ' _ е~ 'ж = 2 — 2 cos л: = 2 A — cos л:).
6] ТЕОРИЯ ИЗЛУЧЕНИЯ Отсюда получаем для Ьк, кфк, выражение г— W. л=1 I W--W \ 1 —cos2«^Pe h *¦) t л=1 ; — cos 2т. ( f 215 wk-w-k W — WT\'2 ( Первая сумма 2 соответствует испусканию, а вторая сумма 2 \ /1=1 Л=1 поглощению. ] Чтобы можно было придать этим ftk замкнутый вид, надо сделать упрощающие предположения. Именно, будем считать, что, с одной стороны, полость Н очень велика (т. е. ее объем у—>оо), а с другой стороны, будем подсчитывать собственные коле- колебания %п в Н статистически. Для этой цели объединим в каждой из приведенных сумм члены, принадлежащие частотам р„, заключенным в интервале между р и ние и предположим, что (вместо ¦ш"_ мы подставим его значе- значе1 v= 1 X X 1 —cos2«^p к—г--) t _ _ W — W- a затем повторим эту процедуру, но с Мп вместо Мп -f- 1 и -г W- — W вместо ——-—-. После этого остается еще вычислить квадратные а скобки [...]. Заметим теперь, что при обычном способе описания не задают значений Mlt M2 но ограничиваются гораздо меньшим, а именно заданием интенсивностей, т. е. заданием энергии излучения I(p)dp. приходящейся на спектральный интервал от р до p-f-rfp и единиц}-
216 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА объема. Это означает, что [ГЛ. III Число частот р„, лежащих в интервале p^ip0 < p-f-rfp, равно гс 2Р dp, согласно всегда справедливой асимптотической формуле Вейля (ср. ссылку в прим. тельно, на стр. 192) % / dp, и, следова- h? dp. Итак, для квадратных скобок [...] мы получим в указанных выше двух случаях следующие выражения: если только величина v=l флуктуирует (достаточно быстро) в интервале р ^ рл < р -f- dp вокруг некоторого среднего значения, которое мы обозначили через wft^(p). W-—W W — W- Напишем еще Чт. вместо , суммы примут вид и v.-r вместо г ft тогда наши При малых ^ зтот интеграл будет, очевидно, порядка ^2 (потому что таков порядок веллчины i—cos2ivc^), за исключением лишь того
6] ТЕОРИЯ ИЗЛУЧЕНИЯ 217 участка области интегрирования, в котором знаменатель (р — ч^Л* или (р — vk-A2 мал. Здесь могут возникнуть вклады, большие по сравне- сравнению с t2, и если это так, то эти вклады и будут представлять собой асимптотические выражения для Ьк. Действительно, окажется, что это так, ибо мы получим вклады порядка t, — их-то и надо нам теперь вычислить. Wk~Wk Так как s*k-k —— \? = z . то при Wk > Wk малым будет только знаменатель первого члена, а при Wj < Wk— только знаме- знаменатель второго, поэтому при Wk > Wк мы оставим лишь первый член, а при Wk < Wk — лишь второй. Кроме того, так как для р, лежа- / - \Wk-Wk\\ щего вдали от чкк и чкк- I обозначим для краткости чкк = г 1, получаются вклады в интеграл лишь порядка t2, то можно заменить подынтегральное выражение его значением при p = vft^, т. е. через где I = 1 fak-A-\—-T"v^ или / (vftjA соответственно. Следовательно, = 4лчч- J kk о kk о ) oo oo Далее, Г можно заменить на I , так как это ведет лишь к до- 0 —со полнительным вкладам порядка t2, и ввести еще новую переменную интегр ирования х — 2тс Гр — vk-A t. Поскольку Г 1 — cos 2тс h — v -\ t - л **i dp = 2vt / 1~C2°S^ dx - и») ^ I62) Имеем (ср. Courant — Hilbert, стр. 49), CO OO CO /1 — cos x _ Г 1 — cos л: . /* 1 0 0 — со sin2 у _ У2 су~'
218 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА то окончательно находим [ГЛ. III t леи доказывается также и то, что Ьк порядка t. Для вычисления wkj{^k-^) нужно получить для величины I 2 выражение, свободное от %п. К такому выражению можно прийти, если заменить вектор %п, имея в виду его быстро осциллирующий характер, иррегулярно ориентированным вектором постоянной длины (ввиду его постоянства в пространстве, т. е. независимости от Qf, Q%, Qf. он является численным вектором, умноженным на матрицу 1). Постоянную длину ~[п можно найти из условия нормировки dy dz = н Поэтому Г На л;-компоненту %П: х приходится в среднем -^ скалярного произ- произведения [${„, Жп] =%п, ^ + ?tn, у + ^л, z — il' T- е- она равна-5-^ = и аналогично для остальных компонент ЭДЛ| у и %п, z. Имеем, следовательно, kk(&— Среднее Так как Но. т. е. энергия одной только системы S, равняется кине- кинетической энергии -|- потенциальная энергия и имеет, следовательно, вид l Qf Qf,
6] ТЕОРИЯ ИЗЛУЧЕНИЯ то оказывается, что153) 219 = -g^j- ~ Я. и поскольку Но — диагональная матрица с диагональными элементами Wv W2, ... [(Но)*;==^*8*у]. то отсюда следует для матричных эле- элементов, что r-<#Ho)ftI 16 я3 с2 -2 Таким образом, kk Подстановка в выражение для Ьк дает формулу Vv=O ftft -It. Полученный результат, положив еще и», г- = Aft можно, очевидно, интерпретировать следующим образом. Атом 5 в k-м состоянии претерпевает следующие переходы (квантовые скачки): 1. Переход в высшее состояние k(Wj^>WЛ происходит JfTwkk' \ h / Раз в секУндУ- т> е> ег0 частота пропорцио- пропорциональна интенсивности поля излучения соответствующей боровской частоты W- — W К К 163) P* коммутирует со всеми Q*, Q-J, Именно, И значит, ^, f*, P-^, P^, за исключением ср. прим. из) на стр. 197.
220 КВАНТОВОМЕХАНИЧЕСКАЯ СТАТИСТИКА [ГЛ. III 2. Переход в низшее состояние k (W^ < WЛ происходит -I раз в секунду, т. е. его частота пропорцио- wkk нальна интенсивности поля излучения соответствующей воровской частоты т • 3. Кроме этого, происходит еще переход в низшее состояние _ 64л4 / Wk — Wj \з k (W-r <W Л с частотой о, -, w.-r\ ; раз в секунду, т. е. \ к к/ otlC RR \ /j I * j j с частотой, совершенно не зависящей от присутствующего поля излу- излучения. Переход 1. соответствует процессам поглощения из поля излуче- излучения; переход 2. — процессам излучения, индуцированным полем излу- излучения; а переход 3. соответствует процессам спонтанного излучения, которые всегда будут происходить с атомом, пока он не добьется окончательного покоя в своем низшем стационарном состоянии (мини- (минимальное Wkl). Три механизма переходов 1. — 3. были термодинамически найдены Einstein'oM еще до открытия квантовой механики154), не хватало лишь значений «вероятностей переходов» w^. Приведенное выше выражение i V = 1 v=1 kk kk как уже упоминалось, содержится в первой интерпретации, данной Гейзенбергом. Мы получили его снова (следуя Дираку) из общей теории. Physik. Z.18 A917).
ГЛАВА IV ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ 1. Принципиальное обоснование статистической теории В главе III нам удалось свести все утверждения квантовой меха- механики к статистической формуле (названной там Е2.) (?.) Erw («Н, ср) = (Дер, ер) (Erw (9?, ер) является математическим ожиданием величины 9? в со- состоянии ер, Д есть оператор величины 9?). В дальнейшем мы покажем, как сама эта формула может быть выведена из немногих общих качественных предположений, и одновременно мы еще раз проверим правильность всего построения квантовой механики в том виде, в каком оно было развито в III. Однако црежде чем переходить к этому, не- необходимо сделать следующее замечание. В состоянии ер величина 9? обладает математическим ожиданием р=(Дер, ер), и, в качестве дисперсии е2, — математическим ожиданием величины (9?—рJ, т. е. ((Д— р-1Jер, ер) = |[Д<р||2— (Дер, ерJ (ср. прим.130) на стр. 173, все эти математические ожидания вычисляются на основе Е. !). Последнее выражение, вообще говоря, больше нуля (и равно нулю только, когда Дср = р-ер, ср. III. 3) — уже в одном индивидуальном состоянии ер существует, следовательно, как мы это уже неоднократно устанавливали, только статистика. Но статисти- статистический характер может обостриться еще и за счет того, что неиз- неизвестно, какое же состояние имеется на самом деле — например, когда в описании участвует несколько состояний cpj, ер2, .. . с вероятностями wv w2, ... (wl^0, w2^Q wl-\-w2-\- ... =1) соответственно. Тогда математическим ожиданием величины 91, в смысле всегда справедливых правил вычисления с вероятностями, будет р' = л Далее, имеется общее соотношение (Дер, ер) = Spur (Р^ • Д). Дей- Действительно, выберем полную ортонормированную систему фц ф2, ...
222 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV так, чтобы ф1 = ср (и, значит, ф2, ф3, ... были ортогональны к ср), тогда (со для га = 1, I О в остальных случаях, и, следовательно, Поэтому наше р' = Spur / | 2 «'„Л Л- R\- Оператор будет дефинитным в силу дефинитности всех Рг и условия wn ^ О, а его шпур будет, так как Spur Р. = 1, равен ^wn= I. Тем самым этот оператор полностью характеризует только что описан- описанную смесь состояний в смысле ее статистических свойств: р' = Spur (?//?). Заметив, что наряду с состояниями нам придется иметь дело также и с этими смесями, перейдем к более общему исследованию. Забудем всю квантовую механику и будем держаться только сле- следующих положений. Предположим, что дана система 5155), которая для экспериментатора характеризуется заданием всех эффективно 155) Важно подчеркнуть разницу между понятиями просто системы и си- системы в некотором состоянии. Система, например, водородный атом, т. е. электрон и протон с известными действующими между ними силами, фор- формально будет описана, если указать, что конфигурационное пространство имеет шесть измерений, что координаты — это q^ q$, импульсы — />t, ..., ps, а функция Гамильтона равна YD\ — Чд2 + (?г — ЧьJ + (Чъ — q6J ' Состояние же фиксируется ливдь при указании дальнейших данных: в класси- классической механике с помощью задания численных значений q^,..., q^p®,..., р\ координат и импульсов qlt ..., qe, рь ..., рь, а в квантовой механике — с помощью волновой функции <р (q{ .., q6). В большем числе данных, чем эти, никогда не возникает потребности: если известны система -(- состояние, то теория дает однозначную вычислительную процедуру для ответа на любой вопрос.
1] ПРИНЦИПИАЛЬНОЕ ОБОСНОВАНИЕ СТАТИСТИЧЕСКОЙ ТЕОРИИ 223 измеримых в ней величин и их взаимных функциональных зависи- зависимостей. Под величиной подразумевается, собственно, наставление, как ее измерять, т. е. как найти или же вычислить ее значение из рас- расположения стрелок измерительных приборов. Если 91 — какая-нибудь величина, а / (х)— произвольная функция, тогда величину f (91) сле- следует определять так: чтобы измерить f (91), измерь 91, найди при этом (для 91) значение а, тогда значением f (91) будет / (а). Как видим, все величины / (91) (91 фиксировано, / (х)— произвольная функция) измеримы одновременно одна с другой, а также с вели- величиной 91: это первый пример одновременно измеримых величин. Вообще же, назовем две (или больше) величины 91, <2> одновременно измеримыми, если существует установка, которая измеряет одновре- одновременно обе величины в одной и той же системе, — при этом, конечно, их соответственные значения вычисляются по-разному из показаний приборов. (В классической механике, как известно, все величины одновременно измеримы, а в квантовой механике, как мы видели в III. 3, это не так.) Для таких величин и какой-нибудь функции двух переменных f(x, у) можно определить и величину / (91, @): она будет измерена, если одновременно измерить 91, @, и если для них будут найдены значения а, Ь, то значением / (91, @) будет /(а, Ь). Надо, однако, ясно представлять себе, что совершенно бессмысленно желать построить f(9l, <2), когда 9?, @ не измеримы одновременно: ведь тогда невозможно указать надлежащую измерительную процедуру. Но исследование физических величин на одном-единственном объекте S не является единственным, что мы можем делать — особенно тогда, когда возникает сомнение относительно одновременной измери- измеримости различных величин. В таких случаях можно рассматривать и большие статистические ансамбли, состоящие из многих систем S, SN (т. е. из N экземпляров системы S, N великоI56). В таком ансамбле [5], ..., SN] измеряется, естественно, не «значение» некото- некоторой величины 91, но распределение ее значений, т. е. для каждого интервала a'<a=ga" (а', а" заданы, а'^а") число тех из си- систем 5], .... SN, для которых значение Ш лежит внутри него. ./V-я часть этого числа является функцией распределения w(a', a") — = w(a") — w(a'I57). Большое преимущество рассмотрения таких ансамблей состоит в следующем: !56) Такие ансамбли, называемые коллективами, вообще необходимы, чтобы можно было обосновать теорию вероятностей как науку о частот- частотностях. Они были введены R. v. Mlses'oM, который осознал их значение для теории вероятностей и осуществил их надлежащее построение (ср., напри- например, его книгу: Wahrschelnllchkelt, Statistik und ihre Wahrheit, Berlin, 1928). I57) w (а') является вероятностью того, что agga', т. е. относится к интервалу —оо, а'. Как видно, функция w (а) или же, как мы будем ее называть, чтобы подчеркнуть ее зависимость от «й, в»я (а) обладает следую- следующими свойствами: При а->— оо дая(а)->0; при a->-J-co ю,л (а) ->• 1; при
224 дедуктивное построение теории ггл iv /. Даже в том случае, когда измерение какой-нибудь величи- величины 9? сильно изменило бы измеряемую систему S (в квантовой механике дело обстоит именно так, и в III. 4 мы видели, что в фи- физике элементарных процессов это принципиально должно быть так, ибо воздействие измерения имеет тот же порядок вели- величины, что и система или же ее наблюдаемая часть), статисти- статистический снимок распределения вероятности величины 9? в ан- ансамбле [5! SN] изменится при таком измерении сколь угодно мало, если только N достаточно велико. 2. Даже если две (или больше) величины 9t, 2> не являются одновременно измеримыми в единственной системе @> их распре- распределения вероятностей в одном и том же ансамбле [®j <itN] можно получить с произвольно большой точностью, если только N достаточно велико. Именно, в случае ансамбля, состоящего из N элементов, доста- достаточно собрать статистические показания о распределении значений величины 9? не со всех N элементов 5! SN, а лишь с неко- некоторой подсистемы из М (s=sN) элементов, скажем [Sx, ..., SM], если только М, N оба велики, причем М можно сделать совсем малым по сравнению с N158). Тогда при измерении будет вообще М , подвергнута изменению лишь -vr-я часть ансамбля, т. е. сколь угодно М , N й малая, если -jy- выбрано достаточно малым, что при достаточно боль- большом N возможно даже для больших М, — в соответствии с утвер- утверждением /. Чтобы измерить одновременно две (или больше) вели- величины 91, <2>, нам потребуются две подсистемы, скажем [S1 SM] и [SM+l, .... S2M] {2M^N), так чтобы первая была применена для снимка статистики Ш, а вторая — для @. Тогда оба измерения не помешают одно другому, — хотя они и производятся на одном и том же ансамбле [Sj S»,], — и даже изменят ансамбль лишь 2М на произвольно малую величину, если -гг- достаточно мало, что возможно и для очень больших М, если только N достаточно велико, в соответствии с утверждением 2. а=^а0, а->а0 wm (а) -> %&ш (а0); при a' g^= a" wn (a') 2| Wgj (а"). (В квантовой механике ¦wst(a)— || Е (а) <р ||2 = (Е (а) % <р), где Е(Х) означает разложение единицы, относящееся к R.) Если а>д{ (а) дифференцируема, то вместо нее можно ввести хорошо известную «плотность вероятности» —т— w^(a); если же "и>щ(а) в точке а = а0 разрывна (естественно, слева), то точка а = а0 обладает «дискретной вероят- вероятностью» Wgj(a0) — и)а1(й0 — 0). Исходным же понятием тг>,я(а) можно поль- пользоваться всегда; ср. ссылку в прим. 156) на стр. 223. 158) Это вытекает из так называемого закона больших чисел, теоремы Бернулли.
1] ПРИНЦИПИАЛЬНОЕ ОБОСНОВАНИЕ СТАТИСТИЧЕСКОЙ ТЕОРИИ 225 Как видим, привлечение статистических ансамблей, т. е. теоретико- вероятностных методов, обусловлено возможностью того, что изме- измерение окажет влияние на одну отдельную систему, и возможностью неодновременной измеримости нескольких величин. Общая теория должна учитывать эти обстоятельства, появление которых для эле- элементарных процессов всегда подозревалось159), а сегодня, как пока- показывает подробное обсуждение положения вещей (ср. III. 4), стало несомненным. Статистические ансамбли опять устраняют эти трудности и делают тем самым снова возможным объективное описание (описа- (описание, которое не зависит от случая, равно как от того, измеряется ли в данном состоянии та или другая из двух неодновременно измеримых величин). Для таких ансамблей не удивительно, что физическая величина 9t не имеет точно определенного значения, т. е. что распределение ее значений не состоит из единственного значения а016°), но допускает многие значения или интервалы значений, так что дисперсия поло- положительна 16°). Все же для такого поведения мыслимы два различных основания: /. Отдельные системы S] 5дг нашего ансамбля могут находиться в различных состояниях, так что ансамбль [Sv ..., SN] определяется их относительными частотами. То, что мы не получаем здесь точно определенных значений для физических величин, обусловлено нашим незнанием: ведь мы же не знаем, в каком состоянии мы измеряем, а потому и не можем сказать, что при этом получится. 159) Так, например, главной трудностью в определении электрического поля считалось то, что необходимое для этого «пробное тело» не может быть меньше электрона. по) Точно определенное значение соответствует функции распределе- распределения 1юш(а) вида f 1 для а>а, я v ' \ 0 для а < а. В этом и только в этом случае дисперсия е2 равна нулю. Обычно же сред* нее значение р и дисперсия е2 вычисляются следующим образом (интегралы Стильтьеса!): + оо р = J adwn(a), — оо + ОО + 0О +СО ?2= Г (a — fJdwn{a)— I a2 dwm(a) — 2р J a dwM(a) -j- p2 = — со (ср. III. 4, 15 и. прим. Нейман — оо + СО = / atdw^a) — ОО 13°) на стр. 173). -Р2 = — СО + СО /« — со
226 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ (ГЛ. IV //. Все отдельные системы 5j SN находятся в одном и том же состоянии, но законы природы не каузальны. Тогда причиной дисперсий будет уже не наше незнание, а сама при- природа, которая не считается с «принципом достаточного осно- основания». Случай /. общеизвестен, важным же и новым является, напротив, случай //.. Конечно, сначала мы будем относиться скептически к воз- возможности его осуществления, но затем найдем объективный критерий, который позволит отличать случаи, когда он имеет место, от случаев, когда его нет. На первый взгляд кажется, что существуют серьезные возражения против возможности понять его и придать ему точный смысл. Мы полагаем, что эти возражения не имеют основания и что случай //. является единственным выходом из известных трудностей (например, в квантовой механике). Перейдем поэтому к обсуждению принципиальных трудностей случая //.. Против //. можно возразить, что природа вообще не может на- нарушить «принцип достаточного основания», т. е. причинность, так как здесь скорее идет речь просто об определении тождественности. Иными словами, теорема о том, что два тождественных объекта Sv S2,— т. е. два экземпляра системы 5, находящиеся в одном и том же состоянии, — будут вести себя одинаково при всех мыслимых воз- воздействиях, верна, поскольку она ничего не говорит. Ведь если бы системы Si, S2 вели себя по-разному при одном и том же вмеша- вмешательстве (например, если бы они давали разные значения некоторой величины Ш при ее измерении), то их нельзя было бы назвать одина- одинаковыми. Таким образом, в ансамбле [S] SN], имеющем диспер- дисперсию по отношению к величине ffi, отдельные системы Sv ..., SN, по определению, не могут все находиться в одном и том же состоя- состоянии. (Применительно к квантовой механике это означало бы: по- поскольку при измерении одной и той же величины 9t на нескольких системах, которые все пребывают в состоянии, описываемом волно- волновой функцией ср, получаются разные значения, если ср не является собственной функцией оператора R величины 9?161), то эти системы не одинаковы, т. е. описание с помощью волновых функций не является полным. Поэтому должны были бы существовать другие характеристики, упомянутые в III. 2 «скрытые параметры». Вскоре мы увидим, что это предположение не проходит без дальнейших осложнений.) Следовательно, для большого статистического ансамбля, до тех пор пока хоть одна величина ffi продолжает иметь в нем дисперсию, должна существовать возможность разбиения его на многие, различным образом построенные части (в соответствии с раз- i6i) речь идет о независимых измерениях на нескольких системах: последовательные измерения на одной и той же системе всегда давали бы одинаковые значения (ср. III. 3).
I] ПРИНЦИПИАЛЬНОЕ ОБОСНОВАНИЕ СТАТИСТИЧЕСКОЙ ТЕОРИИ 227 личными состояниями его элементов). Это тем более правдоподобно, что на первый взгляд кажется, что фактически существует простой способ подобного разбиения: именно, ансамбль можно разбить в соот- соответствии с различными значениями, принимаемыми в нем величиной ffi. По-настоящему однородный ансамбль был бы получен только после подразделения или разбиения по отношению ко всем имеющимся вели- величинам Ш, @, %, ... В конечном итоге ни одна из этих величин не имела бы дисперсии ни в одном из подансамблей. Утверждения, содержащиеся в последних фразах, ошибочны прежде всего потому, что не учитывают, что измерение изменяет измеряемую систему. Если величина Ш (принимающая ради простоты лишь два значения av а2) измеряется во всех объектах Si, ..., SN и прини- принимает значение, скажем, ах на системах 5] 5уу,> а значение а2— /Г И на системах 5ь ..., олг-лг,. то после этого она не будет иметь дисперсии ни в ансамбле [Si, .... S^J, ни в ансамбле [Si, ..., Syv-w,] (там она всегда равна ах или соответственно а2). Тем не менее это не будет простым разбиением ансамбля [Sv ..., SN] на две указанные части, так как отдельные системы были изменены при ЭД-измерении. Правда, согласно /., у нас имеется метод нахождения распределе- распределения значений величины Ш таким образом, чтобы ансамбль [S1 SN]; изменился лишь незначительно (для этого надо измерять на Sx SM, .. М \ М велико, -j-r мало], однако этот прием не приводит ни к какому разбиению, поскольку для большинства систем Sx, ..., SN (а именно для систем Sm+i, • . •, SN) он не позволяет ничего сказать о том, какое значение имеет величина Ш в каждой отдельной системе из их числа. Теперь мы убеждаемся, что указанный выше метод построения совершенно однородной системы не приводит к цели. Действительно, измерим еще другую величину @ (также принимаю- принимающую лишь два значения bx, b2) в подансамблях [s[ S'N] и [Si S"N-m]. Пусть в системах Si" S%n и Si, ..., S^12 най- найдено значение bv а в системах Slv, ..., S]v,-Nn и S^1, .... 5^!_лг,-лг12— значение Ь2. Тогда в ансамблях [Si" S^J, [s\v 5^_лг„]. [S^ S//J- [5] Sm-n,-n,^ величина @ больше не имеет дисперсии (ее значения будут равны соответственно bx, b2, bv b2). Однако несмотря на то, что первые два ансамбля являются частями ансамбля \s{ 5^,], а два последних ансамбля — частями ансамбля [s'i Sat-wJ. в которых величина 9? не имела дисперсии, в каждом из этих новых четырех ансамблей величина 9? может иметь дисперсию, так как ©-измерение изменило отдельные системы (из которых состоят ансамбли)! Это значит, что мы не продвигаемся вперед: 15*
228 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV каждый новый шаг разрушает результат предшествующего162) и ни- никакое повторение последовательных измерений не сможет привнести причинный порядок в эту путаницу, ибо атомные явления лежат на краю физического мира, где любое измерение вносит изменение того же порядка, что и сам измеряемый объект, так что последний изменяется существенным образом, в основном из-за соотношений неопределенности. Таким образом, при известных обстоятельствах не существует метода, с помощью которого можно было бы разлагать дальше ансамбли с дисперсией (без изменения их элементов) или даже про- пробиться до вообще не обладающих дисперсией однородных ансамблей, которые мы должны представлять себе состоящими из причинно определенных, тождественных между собой отдельных объектов. Несмотря на это, можно было бы попытаться поддержать фиктивное представление о том, что всякий ансамбль с дисперсией можно раз- разбить на две (или больше) отличные друг от друга и от всего ансамбля части; и даже без изменения его элементов, т. е. так, что смешива- смешивание обоих ансамблей разбиения снова давало бы исходный ансамбль. Как видим, попытка интерпретировать причинность как определение тождественности приводит ввиду этого к реальному вопросу, на который можно и должно ответить, возможно в отрицательном смысле. Именно: возможно ли на самом деле получить всякий ансамбль [5], .. ., SN], в котором имеется величина 9? с дисперсией, в виде смеси двух (или большего числа) ансамблей, отличных друг от друга, а также от заданного ансамбля? (Случай, когда число ансамблей больше двух, скажем, га = 3, 4, ... приводится к случаю га = 2, если рассматривать первый из ансамблей и смесь га — 1 остальных.) Если бы, скажем, [S] SN] был смесью двух ансамблей [s[ S'p) и [Si, ..., Sq], to вероятностную функцию w&. (a) любой величины Ш (см. прим. 157) на стр. 223) можно было бы выразить через вероятностные функции w'm (a), w'^ (а) последних двух ансамблей: ,(а). а > 0, р > 0, а + р = 1. Р О Здесь aL — jTnfy = -^?(N — P-{-Q) не зависят от Ш. Итак, в ко- конечном счете мы наталкиваемся на математический вопрос: пусть в каком-нибудь ансамбле имеется величина 91, обладающая дисперсией 1б2) Посмотрим, например, что получится, если за % <2> взять не изме- измеримые одновременно (из-за соотношений неопределенности) величины q (декартову координату) и р (импульс). Если в каком-нибудь ансамбле дисперсия q очень мала, то />-измерение с точностью (т. е. с дисперсией) е приводит к дисперсии в q, по меньшей мере равной j— (ср. III. 4), т. е. все разрушает.
I] ПРИНЦИПИАЛЬНОЕ ОБОСНОВАНИЕ СТАТИСТИЧЕСКОЙ ТЕОРИИ 229 с вероятностной функцией wm(a) (относительно соответствующего свойства функции wm(a) см. прим. 16°) на стр. 225), существуют ли тогда два других ансамбля с вероятностными функциями w'n(a), соот- соответственно w'^(a), такие, что утверждение Mi. имеет место для всех 91? Этот же вопрос можно сформулировать еще несколько иначе, если характеризовать ансамбль не вероятностными функциями wn(a) вели- величин 91, а математическими ожиданиями + 0О Erw (9t) = J adwn(a). — со Наш вопрос звучит тогда так: В ансамбле нет дисперсии, если в нем для каждой величины 91 математическое ожидание Erw ([91 — Erw (9t)]2) = Erw («К2) — [Erw («К)]2 равно нулю (ср. прим. 160) на стр. 225), т. е. если (Stri.) Erw («К2) = [Erw (9t)]2. Всегда ли возможно в том случае, когда это не так, найти два дру- других ансамбля с Erw'(91), Erw" (9t) (Erw (91) ф Erw' (91) ф Erw" (91)) такие, чтобы выполнялось условие (М2.) Erw (9t) = <x Erw'(9t)-fP Erw" (91), а > О, р > О, где <х, р не зависят от 91? (Заметим, что в случае единственной заданной величины 91 число Erw (91) не может быть заменителем функции w&(a); напротив, знание всех Erw (9i) эквивалентно знанию всех Wst(a)- Действительно, если fa(x) определить равенством 1 для xsgfl, , то будем иметь W3i(a) = Erw(fn(9l)).) О для х > а, • При математическом рассмотрении этого вопроса целесообразнее иметь дело не с ансамблями [5] SN], а с соответствующими ожиданиями Erw (91). Каждому ансамблю соответствует такая функ- функция, которая определена в S для всех физических величин 91 и имеет значениями вещественные числа и которая, наоборот, полностью характеризует все статистические свойства ансамбля. (Ср. сказанное выше о связи между Erw(91) и wst(ci),) Конечно, еще надо установить, какими свойствами должна обладать функция от 91, чтобы она пред- представляла собой Erw (91), по некоторому надлежащим образом выбран-.
230 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ 1ГЛ. IV ному ансамблю. Но как только это будет выполнено, мы можем дать определение: а) Функция от 9?, являющаяся математическим ожиданием Erw (9?), называется бездисперсной, если она удовлетворяет усло- условию Str\.. Р) Функция от Ш, являющаяся математическим ожиданием Erw (9?), называется однородной или чистой, если для нее из М%. следует, что Erw (Щ = Erw (Ш') == Erw (9Г). То, что всякая бездисперсная функция Erw (9?) является чистой, ясно просто по смыслу и вскоре будет доказано. Наш же вопрос звучит так: является ли любая чистая функция Erw(9?) бездисперсной? Ясно, что любая функция Erw (9?) должна обладать следующими свойствами: A. Если величина 9t тождественно равна 1 (т. е. если пра- правилом ее измерения является: ничего не надо измерять, так как 9t всегда имеет значение 1), то Erw(9ft)=l. B. Для любой величины 9t и для любого вещественного числа а имеет место равенство Erw(a9?) = a Erw (9?I63). C. Если по своему смыслу величина 9? никогда не бывает отрицательной, если она, например, является квадратом 163) не- некоторой другой величины ®, то и Erw(ffi)>:0. D. Если величины 91, @, .. . одновременно измеримы, то должно быть Erw («Н + @ + ...) = Erw (9?) + Erw (@) + ...163). (Для неодновременно измеримых величин 91, Ф, ... величина 9t-(-@-f- ... не определена, ср. выше.) Все это непосредственно вытекает из определений рассматривае- рассматриваемых величин (т. е. из предписаний для их измерения), а также из определения математического ожидания как арифметического среднего всех результатов измерений по достаточно большому статистическому ансамблю. В отношении D. следует заметить, что его справедливость основана на той теореме из теории вероятностей, согласно которой математическое ожидание суммы всегда равно сумме математических ожиданий отдельных слагаемых, независимо от того, существует между ними вероятностная зависимость или нет (в противоположность, на- например, математическому ожиданию произведения). Естественно, что мы сформулировали D. лишь для одновременно измеримых величин 9t, <2> — ведь в противном случае величина 9?-|-@-)- ... не имеет смысла. Но в квантовой механике имеется еще одна, выходящая за пре- пределы обсуждавшихся до сих пор, вычислительная операция: именно, 1вз) Выражения а%1, 2>2, 91 + 3+ ¦•¦ означают: величины 91, 2>, ... подставляются, в смысле данного выше общего определения, вместо х, у, ... в функции / (х) = ах, /(х) = х2, / (х, у,...) = х-{- у -j- ¦ ¦ • соответственно.
И принципиальное обоснование статистической теории 231 сложение двух произвольных, не обязательно одновременно неизме- неизмеримых, величин. Эта операция основывается на том, что сумма R-\-S двух эрмитовых операторов R и S опять является эрмитовым опе- оператором, даже и тогда, когда R и S неперестановочны, в то время как произведение RS, например, оказывается эрмитовым лишь в слу- случае коммутативности (ср. II. 5). Математические ожидания по любому состоянию ср складываются: (/?ср, cp)-f-(Scp, ср) = ((R-f-S)ср, ср). (Ср. Е2. из III. 1). То же справедливо и для многих слагаемых. Мы отметим этот факт в нашем общем, пока еще не специализированном на случай квантовой механики, подходе: Е. Пусть 9t, <2>, ... — произвольные величины, тогда суще- существует новая величина 9t-f-®-f- ... (не зависящая от выбора функции Erw (9t)) такая, что Erw(«R + <2> + ...) = Erw(«R)-f Erw(®)+ ... Если 9t, @, ... одновременно измеримы, то эта 9t-f-<2>-{-... должна, согласно D., быть обычной суммой. В общем же случае эта величина лишь неявно определяется утверждением Е., и мы едва ли можем из измерительных предписаний для Щ, <2>, ... составить изме- измерительное предписание для 9t-f-<2>-{- ... 164). К сказанному выше добавим еще: мы хотим ввести в рассмотре- рассмотрение не только функции Erw(SR), представляющие собой математиче- математические ожидания, но также и такие функции, которые выражают собой относительные математические ожидания, т. е. мы опускаем условие нормировки А.. Если Erw(l) (что, согласно С, ^0) конечно и фО, Erw (ОД) то это несущественно, так как для -g—jry- все остается по-старому. Случай Erw(l) = oo соответствует, однако, существенно отличной возможности, ради которой мы и делаем это обобщение. Ее можно 164) Так, например, в гейзенберговой теории оператор энергии электрона, движущегося в потенциальном силовом поле V (х, у, z), н0 = (ср., например, III. 6) является суммой двух неперестановочных операторов СрХч2 I (py\2L/pZ\2 р R = у ' 2/д ¦ и S = V {Qx, Qy, Qz). Тогда как измерение вели- величины «Н, соответствующей оператору R, является измерением импульса, а измерение величины B>, соответствующей оператору S, — измерением координаты, величина 9t + <2>, соответствующая оператору Ho = ^ + S, из- измеряется совершенно по-иному: например, с помощью измерения частоты спектральных линий, испускаемых этим (связанным) электроном, поскольку эти частоты определяют (на основании условия частот Бора) энергетические уровни, т. е. значения величины 9t + <2>- Тем не менее при любых обстоя» тельствах Erw («H + ®) = Erw (ОД)-f Erw
232 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV лучше всего проиллюстрировать на одном простом примере. Именно, существуют случаи, когда лучше оперировать с относительными ве- вероятностями, а не с истинными, в особенности с бесконечной полной относительной вероятностью (выражение Erw(l) представляет ведь собой полную вероятность); подобным случаем является, например, следующий. Пусть рассматриваемой системой будет частица, движу- движущаяся в одном измерении, и пусть ее статистическое распределение будет таким, что она находится с равной вероятностью всюду на бес- бесконечной прямой. Тогда вероятность любого конечного интервала этой прямой будет равна нулю, но равновероятность всех положений на этой прямой выражается не этим обстоятельством, а тем, что от- отношение вероятностей двух конечных интервалов равно отношению их длин. Так как -^ не имеет смысла, то это можно понять, лишь приписав длинам смысл относительных вероятностей, но тогда полная относительная вероятность будет равна, конечно, со. Учитывая все сказанное до сих пор, мы приходим к следующей, окончательной форме наших условий (А', соответствует С. , а В'. соответствует В., D., ?.): А'. Если величина Ш по своей природе никогда не отрица- отрицательна, если она, например, является квадратом некоторой другой величины @, то Erw(ffl)a;0. В'. Если ffi, @, ...—произвольные величины и если а, Ь, ...—вещественные числа, то Erw (a9t + ?®-)- ...) = = а Erw(ffi)-f-6Erw(®)-f ... Подчеркнем еще: /. Поскольку мы рассматриваем относительные математиче- математические ожидания, то функции Erw(9t) и cErw(9t) (с > 0 — кон- константа!) надо считать не существенно различными. 2. Функция Erw(9t)^0 (для всех Ш) не выражает никакого высказывания, а потому должна быть исключена. 3. Мы имеем дело с абсолютными, т. е. с правильно нор- нормированными математическими ожиданиями, если Erw(l)=l. Согласно А'., выражение Erw(l), во всяком случае, >0, и если только оно конечно и ФО, то /. с с = -=—туг возвращает нас к правильной нормировке. При Erw(l) = 0, как будет по- показано, имеет место 2., а потому этот случай исключается. Если Erw(l) = oo, то мы имеем дело с существенно ненорми- руемой (т. е. относительной) статистикой. Нам остается теперь возвратиться к нашим определениям я), (J). Имея в виду /., условие Mi. можно заменить следующим более про- простым условием: (Me.) Er w (И) == Erw' (И) + Erw" (И).
I] ПРИНЦИПИАЛЬНОЕ ОБОСНОВАНИЕ СТАТИСТИЧЕСКОЙ ТЕОРИИ 233 Следует иметь в виду, что и при выводе Stru предполагалось ра- равенство Erw(l)=l. В случае Erw(l) = oo нельзя дать определение свойству отсутствия дисперсии, так как это свойство означает, что Erw ((91— рJ)=0, где р — абсолютное математическое ожидание ве- вето Erw (R) личины 'л, т. е. -g—jjy, каковое отношение не имеет смысла, так как равно —165). Итак л), C) гласят теперь: л') Функция от 9t, являющаяся математическим ожиданием Erw(9t), называется бездисперсной, если Ехч/(\)фО и конечно, так что можно считать, согласно /., что Erw(l)=l. Характе- Характеристичным является тогда Str\.. $') Функция от 91, являющаяся математическим ожиданием Erw(9t), называется однородной или чистой, если для нее усло- условие Жз. влечет за собой соотношения Erw' (ffi.) = с' Erw (ffi.), Erw" (ffi.) = с" Erw (ffi.) (с', с" — константы, конечно с' -\-с" = 1, ив силу А', и /. , 2., с'>0, с">0). Принимая за основу А'., В'. и л'), $'), мы будем в состоянии принудительно разрешить вопрос о причинности, если только нам будут известны физические величины 91, ®, ... в S, а также суще- существующие между ними функциональные связи. Это приведет нас в по- последующих параграфах к соотношениям квантовой механики. В заключение этого параграфа сделаем еще два замечания. Сначала замечание, относящееся к случаю Erw(l) —0. Тогда из В'. следует, что Erw(c) —0, а потому, если только какая-нибудь вели- величина 91 всегда 5t cf, s§= с", будут, согласно А'., иметь место соот- соотношения Erw (с" — 9t)^0, Erw(9t — с')^0, так что, согласно В'., будем иметь Erw (с') ^ Erw (Ш) ^ Erw (с"), т. е. Erw(«R) = 0. Пусть теперь 9? произвольно и fi(x), /2(X). •••—некая последователь- последовательность ограниченных функций, для которой / , . . sin x , , . sin их sin (л—1) х п (^например, f1{x) = —^-, fn(x) = —^ {п-\)х при п==2< 3, ...). Тогда Erw(//1(9t)) = 0 для и=1, 2, ..., так что, со- согласно В'., будет также Erw(9t) = 0. Следовательно, в соответствии с ранее сделанными утверждениями, случай Erw(l) = 0, согласно 2., должен быть исключен. Во-вторых, отметим следующее замечательное обстоятельство. Согласно Str\. для отсутствия дисперсии характеристично условие Erw(9t2)= [Erw(9t)]2, хотя в этом случае Erw (9?) равно попросту значе- значению величины ffi, а значит, Erw(/(9t)) есть значение величины /(91), 165) В случае бездисперсных ансамблей, однако, нет оснований не вво- вводить истинные математические ожидания.
234 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV так что должно быть (Str2.) Erw(/ER)) = /(Erw(9t)) для любой функции f(x). Значит, Str\. является частным случаем Stfy.: f (х) = х2. Но каким же образом это условие может быть достаточ- достаточным? Ответ гласит: если Str2. выполняется для f(x) — x2, то оно будет справедливо и для всех f(x). Можно было бы даже х2 заме- заменить любой другой непрерывной и выпуклой функцией от х (т. е. функцией, обладающей свойством: /1 х ~^у ) < ^х' "|" ^' при лю- любых х ф у). На доказательстве мы не будем останавливаться. 2. Доказательство статистических формул Как мы знаем, физическим величинам квантовомеханической си- системы однозначно сопоставлены гипермаксимальные эрмитовы опера- операторы (ср., например, дискуссию в III. 5). Целесообразно сделать допущение, что это соответствие взаимно однозначно, т. е. что каж- каждому гипермаксимальному эрмитову оператору соответствует на самом деле некоторая физическая величина. (Частные применения этого до- допущения делались также в III. 3.) Тогда будут справедливы следую- следующие правила (ср. F., L. в III. 5, а также сказанное в конце IV. 1): /. Если величине Ш соответствует оператор R, то величине /(9t) будет соответствовать оператор /(/?)• II. Если величинам 91, @, ... соответствуют операторы R, S то величине 9t-j-<2>-f- ... будет соответствовать опера- оператор R-\-S-\- ... (Одновременная измеримость величин ffi, <2>, ... при этом не предполагается. Ср., что говорилось по этому поводу выше.) А'., В'., л'), Р') и /., //. образуют математический базис нашего анализа. Пусть cpj, cp2, ... — полная ортонормированная система функций. Вместо оператора R мы будем рассматривать матрицу а^ = (Ry^, ср„). Построим еще следующие эрмитовы операторы, матрицы которых имеют вид ( j f(mn) _ Мтп) — если jj.= v==/i, 0, в остальных случаях 1, если р. = /re, v = re, 1, если (j, = re, v = /m О, в остальных случаях I, если [А = /га, ч = /г, — /, если [j, = /i, ч — т О, в остальных случаях
2] ДОКАЗАТЕЛЬСТВО СТАТИСТИЧЕСКИХ ФОРМУЛ 235 Эти операторы можно записать как Pr? i, Pr?m+ р -, — Рг? _9 Pr<em+i<? i — ¦Рг.р -if у Пусть им соответствуют величины U("', L mV~2 " \ [ "у-2 " \ »(m'n), Ж(т>п). Очевидно (так как апт= атп), что ^ 21 Rea^ и потому /пп f mn m <n /n<n 2 Re«mn m m а значит, в силу Н. и fi'., mn m <n mn ' mn m<n ReamnErw(B('nn»L- + 2 ImamnErwB8(mn)). mn m <n Поэтому, если положим (m < л). то будем иметь Так как ипт = итп, то можно определить эрмитов оператор U усло- условием (U<fm, <?„)= итпт), после чего в правой части окажется 166) То есть для чего, разумеется, необходима конечность ^ I итп I2- В ией можно убе- п диться, например, так: Если ~^{хп\2 = 1, то оператор R — Я[|р] имеет ма- _ п трицу л^*,, для <р = 2 -*л?п и соответствующая этому оператору величина 91 п будет иметь математическое ожидание 2 итпхтхп ^ак как ^1?)= М?1' тп
236 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV Spur (UR) (ср. II. 11). Таким образом, окончательная формула гласит: (Sp.) Erw (9i) = Spur (?//?), где U— не зависящий от R эрмитов оператор167), определяемый, сле- следовательно, лишь самим ансамблем. В силу П, соотношение Sp. удовлетворяет условию В', при лю- любом выборе оператора U. Поэтому нам остается лишь установить, какие ограничения накладываются на U условием А'.. Если ||ср|| —1, но в остальных отношениях ср произвольно, то величина Ш, соответствующая оператору Рм будет благодаря Р[Т] = Р[Т] и /. обладать свойством 9t2 —9t, так что согласно А'. будет Erw(9t)^0. Таким образом, Spur(UP\f]) = (f/cp, cp)^O. Если/ 1 — Л»] — 0—Л<р]J' то эт0 математическое ожидание будет igO, sjErw(l) и, значит, — по крайней мере, для нормированных Erw (9t), —i=0, 2=1. Если xN j = xjy+2~ •-• = ^> то эт0 означает, что ^-мерная эрмитова форма ./V N 2 атпхтхп при ^ l*nl2=1 имеет значения ;>0, s|l, т. е. собствен- т, п = 1 п-\ ные значения матрицы и^, [х, v= 1, ..., N будут i=0, s| 1. Поэтому длины N _ векторов ут = ^ итпхп будут всегда S длин векторов *ш. Положим 1 для т — т, тогда у = и —, так что 0 для тф т т N N N V v 12 =»- \^ I « 12 1 ^> X1 ^j ^m I = 2l I У/п I I l ~ 7. Поскольку это справедливо при любом N, то будет также У\]и— pgl. п • тп] т) Все рассмотрение, строго говоря, обосновано лишь в том случае, когда все функции ?,, <f3, ... принадлежат области определения оператора R. Хотя, конечно, для любого R можно найти такую полную ортонормирован- ную систему у,, <f7, ... (ср. 11.11), но если R имеет смысл не везде, то эта система будет зависеть от R. Собственно говоря, каждой полной ортонор- мированной системе функций у1г <р2, ... соответствует, таким образом, свой, зависящий от нее оператор U такой, что равенство Erw («R) = Spur (UR) имеет место лишь для тех R, к области определения которых принадле- принадлежат <р„ ср2, ... Между тем все эти операторы U равны друг другу. Действительно, пусть U', U" — два таких оператора. Тогда наше равенство будет справед- справедливо для них обоих, если только R везде имеет смысл. Иными словами, тогда Spur (U'R) = Spur (U"R). Полагая /? = P[f], найдем (U'% <f)=(U"% у), ((U' — U") ?, ?) = 0. Так как это соотношение справедливо для всех ? с II? 11 = 1. а тем самым и для всех элементов пространства Гильберта, то должно быть также и U—U' = 0, т. е. U = U'.
2] ДОКАЗАТЕЛЬСТВО СТАТИСТИЧЕСКИХ ФОРМУЛ 237 произвольно, то при условии /ФО функция ер — . • / будет допу- допустимой, и тогда (f/cp, ср)= . (<7/, /), так что снова (Uf, /)Ш0; при условии же / = 0 это соотношение выполняется автоматически. Таким образом, оператор U дефинитен. Но свойство дефинитности U, следующее, как мы убедились, из А'., является и достаточным, чтобы А', было справедливым. Действительно, А', означает лишь, что всегда должно быть Erw(®2)i>0 и ничего больше. Потому что, если величина Ш прини- принимает лишь неотрицательные значения, то для f(x) — \x\ будет = Ш, и так как для g{x)=Y\x\ тождественно выполняется 2 = /(*). то (§• («) J = / (9ft), Ю = @а, где ® = ?-(9*I68). Если величине <2> соответствует оператор S, то должно быть также Spur(/752)>0. Так как оператор S2 дефинитен то, написав А, В вместо U, S2, видим, что речь идет о доказатель- доказательстве теоремы: если операторы А ш В эрмитовы и дефинитны, то имеет место соотношение Spur (АВ)>0. Но она была доказана в II. 11 с помощью общей теоремы о дефинитных операторах (ср. прим.114) на стр. НОI69). !68) Непосредственная подстановка @> = У 9t, т. е. B>=h («R), h (x) — Ух, не проходит, так как мы рассматриваем лишь вещественно-значные функции, определенные для всех вещественных х, а функция У х не является тако- таковой, поскольку для отрицательных х она мнима. 169) Удается провести простое непосредственное доказательство. Пусть <рц ?2> • • ¦ — полная ортонормированная система функций, а^ = (Ау^, ?,), Ьх,, = (ЯV <Pv). Spur (АВ) = ^ а^'ьщ- Он ^ °-если все 2 а^ьщ = °- ПУСТЬ tiV U., V= 1 ;v n n / = Е^Л- тогда (Л/,/) = 2 VV 2 VV A=1 p., v = l (Л, v=l так что конечные матрицы а^, b^(y-, v = 1, ..., Л^) также дефинитны. Как N свойство дефинитности, так и величина суммы \J alVibWiL являются инва- р., v= 1 риантами ортогональных преобразований в iV-мерном пространстве. Так как матрица 6ц„ эрмитова, то (в iV-мерном пространстве!) ее можно привести с помощью ортогонального преобразования к диагональному виду. Поэтому ее можно считать диагональной, т. е. 6„„ = 0 при v-Фч. Таким образом, N N 2 ар-->ьщ = 2 ai>. Aiv Но> в силУ дефицитности, я№ ;> 0, Ь1Цк & О p., Vril (полагаем х, тельно S:0. С =1 при v = (x, I \ < ), и значит, наша сумма деистви- [ = 0 при v ф (х | /
238 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV Тем самым мы полностью задали функции Erw(9t): они соответ- соответствуют дефинитным эрмитовым операторам /7, причем связь между ними дается соотношением Sp.. Оператор U будем называть стати- статистическим оператором рассматриваемого ансамбля. Вернемся теперь еще раз к замечаниям /., 2., 3. из IV.I. Они будут утверждать: /. С точки зрения относительных вероятностей и математи- математических ожиданий операторы /7 и cU не различаются между собой существенно (с > 0 — константа). 2. О = 0 не приводит ни к каким утверждениям, а потому должно быть исключено. 3. Абсолютные (т. е. правильно нормированные) вероятности и математические ожидания получаются в случае, когда Spur U=\. Коль скоро Spur U конечен, оператор U можно .нормировать, согласно /., умножив его на c = -q jr- (В силу дефицит- дефицитности U, имеем Spur U > О, причем даже Spur /7 > 0, так как из Spur?/=O вытекает, как было показано в общем виде в конце IV. 1, но в нашем случае получается также из II. 11, что U = 0, т. е. случай, исключенный согласно 2..) Только для бесконечного Spur U мы сталкиваемся с существенно относи- относительными вероятностями и математическими ожиданиями. Наконец, надо еще исследовать «), {5) из IV. 1, т. е. найти среди операторов U те, которые отвечают бездисперсным и однородным ансамблям. Сначала бездисперсность. В этом случае U можно считать пра- правильно нормированным (ср. IV. 1), причем должно выполняться тре- требование Erw («R2) = [Erw (9i)]2, т. е. Spur (UR2) = [Spur (?//?)]2. Поло- Положив /?==P|Tj, имеем /?2 = /? = Р[|р], Spur ((/Р[Т]) = (L/cp, ср), так что должно быть (Сер, ср) = (Сср, срJ, т. е. (t/cp, ср) = О или 1. Пусть Рср'|| = 1, ||ср"|| = 1, тогда функцию ср можно изменять непрерывным образом так, что она начинается с ср' и в конце равна ср", причем все время ||ср|| = 1 17°). При этом (f/cp, ср) тоже изменяется непре- непрерывно, и так как это выражение равно или 0 или 1, то оно постоянно. Таким образом (f/cp', cp') = (f/cp", ср")- Это означает, что ({/ср, ср) всегда равно либо 0, либо 1, откуда сейчас же получаем f/ = 0 или /7=1. Случай /7=0 исключен согласно 2., а случай U=l ненормируем 17°) Для ?' = tf" это очевидно. Пусть поэтому у'фу". «Ортогонализа- ция» функций <р', <f" (ср. II. 2) приводит к некоторой функции у] с || <ft || = 1, которая ортогональна к у', так что ?" является линейной комбинацией у', у,. Итак, ср" = ау' + 6<Fi. Il?"il2 = I a|2 + l 6|2 = 1. Пусть, скажем, | а | = cos О, I b | = sin 0, так что а = eia cos О, Ь = ei<? sin 0. Тогда a(jr) = eiXa cos *8, &№ = eix$ sin *0 также удовлетворяют условию | a(Jr) |2-f-1 6(Jr) |2 = 1. Поло- Положив <р<х) = a^f' -j-b^'fx, будем иметь |[<p{Jr) J| = 1. При этом ?(jrj непре- непрерывно изменяется от <f'(x = 0) до у"(х—1).
2] ДОКАЗАТЕЛЬСТВО СТАТИСТИЧЕСКИХ ФОРМУЛ 239 (Spur?/= числу измерений пространства = оо) и, как легко видеть непосредственно, не бездисперсен. Таким образом, не существует ансамблей без дисперсии. Перейдем теперь к однородным ансамблям. Согласно C) и «S. оператор U будет чистым, если из W (V, W — дефинитные эрмитовы операторы, как и U) следует, что V — c'U, W = c"Um). Мы утверждаем, что это свойство имеет место тогда и только тогда, когда U = Р[<?] (||ср|| = 1). Предположим сначала, что U обладает указанным свойством. Так как U фО, то существует /0, для которого и/0Ф0, а значит, /0ф0 и, следовательно, (?//0, /0) > 0 (ср. П. 5, теорема 19.). Построим два эрмитовых оператора тогда Vf ~ (Ufa, /o) Ufo' Wf Uf Wo,fo) (Ufo,fB) (cp. II. 5, теорема 19.), т. е. операторы V, W дефинитны, причем, очевидно, U = V-{-W. Поэтому V=c'U, и так как Vfo= и/0ф0, то с'=\, т. е. U = V. Пусть теперь ср= . .Ц/о(\\(?\\ = 1) и II <^У о II ( и, согласно I., U в существенном совпадает с Р\чу Пусть теперь, обратно, U — P[9\ (||ср|| = 1). Если f/ = V-j-lF, где V, W — дефинитные операторы, то аргументация ведется сле- следующим образом. Из Uf=0 следует, что О ^ (Vf, /) ^ (У/, /) + (Г/, /) = (Uf. f) = О, (F/, /) = О и, значит, V/=0 (ср. выше). Но из (/, ер) = 0 следует, что Uf = P[9]f = 0, а тем самым и У/ = 0. Поэтому, каково бы ни было g, всегда (/, Vg) — (Vf, g) = 0. Таким образом, всё, что орто- ортогонально к ср, ортогонально также и к Vg, ввиду чего Vg = cg- cp (с„—число, зависящее от g), но нам нужен лишь случай g = <p, т. е. Уср = с'.ср. Любой элемент / имеет вид (/, <р) •? + /'• гДе /' ортогонален к ср, так что Vf = (/, ср) • Vy + Vf = (/, Т). С'Т = c'P[?]f = с'?//. I?') Из-за условия 2. следовало бы, собственно говоря, потребовать, чтобы V ФО, \РфО. Случаи же V = 0 или W = 0 здесь содержатся, если положить с' = 0, с" = 1 или с' = 1, с" = 0.
240 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV Поэтому V=c'U, W=U — V~(\—с')U, чем и завершается дока- доказательство. Однородные ансамбли соответствуют, таким образом, операторам U = P[9], ||<р|| = 1, причем соотношение Sp. переходит в формулу Ег. из III. 1: (?2.) Erw (И) = Spur(PWR) = (Дер, ср). Заметим, что ErwA) = Spur(P^)= 1 (ввиду того, что Р[9] соответ- соответствует одномерному [ср], или же согласно Е%.), т. е. рассматриваемая форма оператора U правильно нормирована. Выясним еще, наконец, при каких условиях Р[?] и Рщ обладают одной и той же статисти- статистикой, т. е. при каких условиях Pi?] = cPm (с > 0 — константа, ср. /.)• Так как Spur (Рад) = Spur (Яда), то с = 1, так что Р[9] — Р^], [ср] = [ф], и <? = а<11), а из ||ср|| = ||ф|| = 1 следует для константы а, что \а\ = 1; очевидно, это условие также достаточно. Резюмируя, можно сказать: ансамблей без дисперсии не суще- существует. Однородные же ансамбли существуют, причем они соответ- соответствуют операторам U = P[^, j|cp|| = l и только этим операторам. Для таких U соотношение Sp. переходит в Ег.; нормировка в этом случае правильна, и U не изменяется при замене ср на аср (а — кон- константа, |а| = 1), при любом же другом изменении ср оператор U изменяется существенным образом (см. /.). Таким образом, однород- однородные ансамбли соответствуют состояниям квантовой механики, как эти последние были охарактеризованы выше: с помощью элементов ср гильбертова пространства с ||ср|| = 1, причем постоянный множитель абсолютной величины 1 не играл роли (ср., например, III. 2), а ста- статистические утверждения выводились из Ei.172). Все это мы вывели из чисто качественных условий А'., В'., «), Р). А , П.. Таким образом, в рамках наших условий мы пришли к решению, и притом направленному против причинности: в самом деле, все ансамбли обладают дисперсией, даже и однородные. Остается еще обсудить поднятый в III. 2 вопрос о «скрытых параметрах», т. е. вопрос о том, не вызвана ли дисперсия однород- однородных ансамблей, описываемых волновыми функциями ср (т. е. соотно- соотношением /?2.) тем, что эти ансамбли не являются истинными состоя- состояниями, но лишь смесями многих состояний, в то время как для описания истинных состояний, помимо задания волновой функции ср, 172) Дедукция двух последних параграфов, приводящая к однородным ансамблям, была указана автором Qott. Nachr., 1927. Существование одно- однородных ансамблей, а также их связь с общими ансамблями были обнаружены независимо Н. Weyl'eM, Z. Physik 46 A927) и автором в указанной выше работе. Один частный случай более общих ансамблей (а именно, случай двух связанных систем, ср. дискуссию в VI.2) был рассмотрен ранее Лан- Ландау, Z. Physik 45 A927).
2] ДОКАЗАТЕЛЬСТВО СТАТИСТИЧЕСКИХ ФОРМУЛ 241 было бы необходимо задать еще и другие характеристики (они и являются «скрытыми параметрами»), которые все вместе описывают всё причинным образом, т. е. приводят к ансамблям без дисперсии. Статистика однородного ансамбля (U = P[f], ||ср|[ = 1) возникала бы тогда в результате усреднения по всем настоящим состояниям, из которых состоит ансамбль; иными словами, в результате усреднения по той области значений «скрытых параметров», которая реализуется в этих состояниях. Но это невозможно по двум причинам: Во-первых, потому, что тогда рассматриваемый однородный ансамбль можно было бы представить в виде смеси двух различных ансамблейш), вопреки его определению. Во-вторых, потому, что ансамблей без дисперсии, которые должны были бы соответствовать «истинным» состояниям (т. е. которые состояли бы исключительно из систем, находящихся в одном и том же «истинном» состоянии), вообще не существует. Заметим, что нам вовсе нет надобности вдаваться здесь более подробно в детали механизма «скрытых параметров»: твердо установленные результаты квантовой механики никоим образом нельзя будет получить с их помощью. Ведь если бы наряду с волновой функцией должны были бы существовать еще и другие фиксирующие состояние параметры («скрытые параметры»), то было бы даже исключено, чтобы те же самые физические величины стояли в тех же самых отношениях друг к другу (т. е. чтобы выполнялись /., //.). Не помогло бы также предположение о том, что помимо извест- известных изображаемых в квантовой механике с помощью операторов физических величин, существуют еще другие величины, до сих пор неизвестные. В самом деле, ведь тогда даже для известных физиче- физических величин оказались бы неверными соотношения, взятые из кван- квантовой механики (т. е. /., //.). Таким образом, дело здесь совсем не в вопросе интерпретации квантовой механики (как нередко счита- считалось). Напротив, квантовая механика должна была бы оказаться объективно ошибочной, чтобы стало возможным другое описание элементарных процессов, отличное от статистического. Стоит упомянуть еще следующее обстоятельство. Соотношения неопределенности имеют на первый взгляд некоторое сходство с ос- основными постулатами теории относительности. Именно, там утвер- утверждается, что принципиально невозможно установить одновременность двух событий, происходящих в точках, разделенных расстоянием г, 173) Если «скрытые параметры», совокупность которых мы обозначим через я, принимают лишь дискретные значения я,, я2, • • •¦ ял (« > 1). то два ансамбля, смесь которых является исходным ансамблем, могут быть полу- получены так: отнесем к первому ансамблю те системы, для которых я = я,, а ко второму ансамблю те системы, для которых я=?я,. Если же я изме- изменяется непрерывно в области П, то выделим подобласть П' области П и отнесем систему к первому ансамблю, если для нее я принадлежит к П', и ко второму ансамблю, если для нее я не принадлежит к Л'. 1§ И. Нейман
242 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV с точностью, превосходящей интервал времени длительностью — (с — скорость света), в то время как, согласно соотношениям неопре- неопределенности, принципиально невозможно указать положение материаль- материальной точки в фазовом пространстве с точностью, превосходящей область объема (-т~) • Несмотря на это, существует фундамен- фундаментальное различие. Теория относительности отрицает возможность объективного, точного измерения одновременности, но, несмотря на это, введением галилеевой системы отсчета можно наложить на мир координатную систему, которая позволит произвести определение одновременности, вполне согласующееся с нашими нормальными пред- представлениями по этому поводу. Этому определению одновременности нельзя приписать объективного смысла только потому, что такую систему координат можно выбирать бесконечно многими различными способами, в силу чего получается бесконечно много различных, одинаково хороших, определений. Иными словами, в силу невозмож- невозможности измерения, существует бесконечная многозначность в возможных теоретических определениях. По-другому обстоит дело в квантовой механике: там вообще невозможно описывать систему, характеризуе- характеризуемую волновой функцией ср, точкой в фазовом пространстве, невоз- невозможно даже в том случае, когда вводятся новые (гипотетические, ненаблюдаемые) координаты, «скрытые параметры», поскольку это привело бы к ансамблям без дисперсии. Иными словами, не только измерение невозможно, но невозможно и никакое разумное теорети- теоретическое определение (т. е. такое определение, которое хотя и не могло бы быть эмпирически доказано, как в случае теории относи- относительности, но во всяком случае не могло бы быть и эмпирически опровергнуто). Таким образом, принципиальная невозможность изме- измерений основывается на том, что в одних случаях имеется бесконечно много, а в других случаях не имеется вовсе конструктивных опреде- определений спорных понятий, которые не противоречили бы непосред- непосредственному опыту (или же общим допущениям теории). 174) Это фазовое пространство шестимерно. Его шестью координатами являются три декартовы координаты точки qu q2, из и три соответствующих импульса Р\, р2, Рз- Согласно III. 4, соответствующие дисперсии ги г2, г3, -»)j, tj2, 7j3 удовлетворяют соотношениям т. е. и в пределах этого объема положение в фазовом пространстве классической механики никогда не определено.
21 ДОКАЗАТЕЛЬСТВО СТАТИСТИЧЕСКИХ ФОРМУЛ 243 Резюмируя, можно охарактеризовать положение причинности в со- современной физике следующим образом. В макромире не существует опыта, который поддержал бы ее. Более того, такой опыт невозмо- невозможен, так как видимый причинный порядок макромира (т. е. для объектов, воспринимаемых невооруженным глазом) не имеет, конечно, другой причины, кроме «закона больших чисел», совершенно неза- независимо от того, являются управляющие элементарными процессами (т. е. настоящие) законы природы причинными или нет175). То, что макроскопически тождественные объекты ведут себя макроскопически одинаково, имеет мало общего с причинностью: ведь в действитель- действительности эти объекты не тождественны, поскольку соответствующие координаты, определяющие состояния образующих их атомов, почти никогда не совпадают. Макроскопическое рассмотрение усредняет по этим координатам (здесь это — «скрытые параметры»), но так как их число очень велико (примерно 1025 на 1 г материи), то это усреднение, в соответствии с известными теоремами теории вероят- вероятностей, ведет к чрезвычайно сильному уменьшению всех дисперсий. (Вообще говоря, конечно. В особых же случаях, например в броуно- вом движении, в нестабильных состояниях и пр., эта кажущаяся макроскопическая причинность уже не имеет места.) Вопрос о при- причинности оказалось возможным проверить как следует лишь при изучении атомных явлений, самых элементарных процессов, но здесь, на современном этапе наших знаний, все говорит против. Действи- Действительно, единственная имеющаяся в нашем распоряжении формальная теория, упорядочивающая и обобщающая, в известной степени удо- удовлетворительно, наш опыт, т. е. квантовая механика, находится с причинностью в непреложном логическом противоречии. Конечно, было бы преувеличением утверждать, что тем самым с причинностью покончено: несомненно, что квантовая механика в ее нынешнем состоянии остается еще неполной, и могло бы даже оказаться, что она ошибочна, хотя последнее и представляется совершенно неве- невероятным в свете ошеломляющих возможностей, предоставляемых ею для понимания общих проблем и для численного расчета конкретных. Хотя квантовая механика находится в блестящем соответствии с опы- опытом и хотя она приоткрыла нам завесу над одной качественно новой стороной мира, тем не менее ни об одной теории никогда нельзя сказать, что она доказана опытом, но лишь что она дает для него лучшее из известных объяснений. Учитывая все эти предосторожности, можно все же сказать: в настоящее время не существует ни повода, ни извинения для разговоров о причинности в природе. Действи- Действительно, нет опыта, который поддерживал бы наличие причинности, поскольку макроскопические опыты для этой цели принципиально 175) Ср. необычайно ясное рассуждение Schodinger'a по этому поводу: Naturwiss. 17, Heft 37 A929). 16*
244 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV непригодны, а единственная известная теория, которая совместна с совокупностью наших опытных знаний относительно элементарных процессов — квантовая механика — ей противоречит. Речь идет здесь, разумеется, об исстари укоренившемся способе рассмотрения, присущем всем людям, но никоим образом не о логи- логической необходимости (что, между прочим, видно хотя бы из того, что статистическую теорию вообще удалось построить), и тот, кто подходит к предмету без предвзятого мнения, не имеет никакого основания упорствовать в таком способе рассмотрения. Обосновано ли при таких обстоятельствах жертвовать ради него разумной физи- физической теорией? 3. Выводы из экспериментов Последний параграф учит нас, что самый общий статистический ансамбль, совместный с нашими основными качественными предпо- предположениями, характеризуется, согласно закону Sp., некоторым дефи- дефинитным оператором U. Ансамбли частного вида, названные нами однородными, характеризуются операторами U = P[9] (||cp|| = l). Поскольку эти ансамбли являются истинными (дальше неразложимыми) состояниями системы S, то,мы их будем называть также состояниями (именно, U — P[9] назовем состоянием ср). Если спектр U чисто дискретен, скажем, с собственными зна- значениями wv w2, ... и с собственными функциями срх, ср2, ... (кото- (которые образуют полную ортонормированную систему), то будем иметь (ср. II. 8) В силу дефинитности U все wn > 0 [действительно, ?/ср„ = да„срл, так что (?/ср„, <Pn) —wn> и значит, да„>0], причем S^n — и — SC^fyn- Тл) — Spurt/ (ср. также начало IV. 1), так что ~SiWn=l, п п если U правильно нормирован. Тем самым можно, согласно сказан- сказанному в начале IV. 1, понимать U как смесь состояний срх> ср2, ... с соответствующими относительными весами wv w2- • • ¦ — если U правильно нормирован, то эти веса правильны и абсолютно. Но правильно нормированный оператор U, т. е. такой, что Spur?/=1, будет, согласно 11.11 (ср., в частности, прим. ш), стр. 143), вполне непрерывным и, значит, будет обладать чисто дискретным спектром. То же самое, конечно, справедливо и в слу- случае конечного Spur U. (Случай бесконечного Spur U можно рассма- рассматривать как предельный случай, на чем мы не будем останавливаться.) Таким образом, в действительно интересном случае рассматриваемый ансамбль представим в виде смеси состояний, которые мы, кроме того, выбирали попарно ортогональными. Поэтому мы будем общие
3] ВЫВОДЫ ИЗ ЭКСПЕРИМЕНТОВ 245 ансамбли (в противоположность однородным, т. е. состояниям) назы- называть смесями. Если все собственные значения оператора U просты, т. е. все wv w2, • •. отличны друг от друга, то, как мы знаем, система <Рр ср2. ••• определяется однозначно с точностью до постоянных множителей модуля 1, а значит, соответствующие состояния (и опе- операторы Pjip,]. Р\чгУ •••) — полностью. Равным образом однозначно определяются и веса w1, w^, ..., разумеется, если не принимать во внимание их порядок. Таким образом, в этом случае можно однозначно указать, из каких (попарно ортогональных) состояний построена смесь U. Существенно по-иному обстоит дело, если U обладает также и кратными собственными значениями («вырожде- («вырождения»). В II. 8 мы обсуждали подробно, как могут быть выбраны cpj, ср2, . ..: это можно сделать бесконечно многими, существенно различными способами (тогда как wlt w2, ¦ • • все еще могут быть определены однозначно). Следует выписать те из wv w2, ..., кото- которые отличны друг от друга: w', w", .... для каждого из них ука- указать замкнутое линейное многообразие принадлежащих им собствен- собственных функций (т. е. решений уравнения Uf = wf) Tiw', 2Яда», ... и затем выбрать произвольным способом в каждом из TtW', 9Ида», ... ортогональные системы y'v Хг • • • > Xi • Х2 ¦ растягивающие данные многообразия. Эти системы ух, у^, ...; у'^, у2, ...; ... образуют тогда систему срр ср2 а соответствующие собственные значения w', w', ...; w", w", ...; ... являются тогда весами щ, w2, . . ¦ Коль скоро какое-либо 9Ида имеет больше чем одно измерение, т. е. имеется кратное собственное значение, принадле- принадлежащее ему, Xi. Ъ> • • • не определяются больше с точностью до по- постоянного множителя модуля 1 (например, в качестве ^i можно взять любой нормированный элемент 9)?да), т. е. соответствующие им со- состояния также многозначны! Это явление можно сформулировать также следующим образом: если состояния yv y2> • • • попарно ортогональны (т. е. у1, у2, ... образуют ортонормированную систему, безразлично — конечную или бесконечную) и мы их смешиваем таким образом, что все они входят с одинаковыми весами (скажем, с относительными весами 1:1:...), то получающаяся в результате смесь зависит лишь от замкнутого линейного многообразия Ш, растягиваемого ух, ^2, ... Действи- Действительно, Если число Xi> X2' ••• конечно, скажем, равно s: yY у^, то оператор U можно представить себе как смесь всех нормированных элементов Ш, т. е. всех состояний из Ш. Эти состояния имеют вид
246 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV В самом деле, положим х1 = и1~\- ivv ..., xs = us-\-tvs, через К обозначим Bs — 1)-мерную поверхность сферы u\-\-v\-\- ... ... -f- м| —f- ff = 1. соответствующей условию |х,|2-|- ... -f- \xs\2 — I, и через do элемент поверхности этой сферы. Положим еще тогда = f f ... f { р., v=l v=l Таким образом, поскольку все я,^, и^-интегралы, а также все иAиу, гуг^-интегралы обращаются в нуль при ja Ф ч из соображений симметрии ш), а при jj. = v все эти последние интегралы = = -?(С>0I76), находим 11=1 A=1 176) Замена м,А -> — м^. (или mv -> — и, и fр. -> — v^) является операцией симметрии поверхности К, в результате которой первые множители подынте- подынтегральных выражений изменяют знак, так что соответствующие интегралы равны 0. Замены и^->v^, v^->u^ и и^->uv uw->u^ представляют собой такую операцию симметрии поверхности К, при которой последние интегралы переходят друг в друга, ввиду чего оии равны между собой, а значит, равны ^-й их суммы: //•••/J(Mi к — площади поверхности К, которую обозначим через С.
ВЫВОДЫ ИЗ ЭКСПЕРИМЕНТОВ 247 Это означает, что s т7 , = — и, т. е. U', U отличаются друг от друга несущественным образом. Эти обстоятельства имеют большое значение для характера кван- товомеханической статистики. Ввиду этого мы повторим их еще раз: /. Если смесь состоит из взаимно ортогональных состояний с в точности равными весами, то нельзя больше установить, какие это были состояния. Иными словами, в результате сме- смешивания в точно равных отношениях различных (взаимно орто- ортогональных) компонент можно получить одну и ту же смесь. 2. Полученная таким образом смесь в случае конечного числа компонент идентична смеси всех состояний, являющихся линей- линейными комбинациями этих компонент. Вот простейший пример: если смешивать ср и ф (ортогональные!) 11 f -4-Ф I : I, то получится то же, что и если, например, смешать ' т и ? ,_. 1:1, или же все лгср-|-уф( |;c|2-f- |у|2= 1)- Если смешиваются неортогональные ср, ф (отношение может не быть 1 : 1), то их тем менее можно идентифицировать по готовой смеси, поскольку эту смесь наверняка можно представлять себе как смесь ортогональных со- состояний. Дальнейшее углубление в природу смесей мы отложим до термо- термодинамических рассмотрений в V. 2 и далее. Формула Sp. в IV. 2 указывала, как надо вычислять математи- математическое ожидание величины И с оператором R в смеси со статисти- статистическим оператором U: это Spur (?//?). Вероятность того, что значение а оператора R лежит в интервале а' < а-^а" (а', а" заданы, а'-^а"), находится как в 111. 1 или III. 5: с помощью функции {1 для а' < х^ а", О в остальных случаях строится величина F (И), ее математическое ожидание и будет ука- указанной вероятностью. Если величине F(ffi) соответствует (согласно /. в IV. 2) оператор F(R) и если Е(к) — относящееся к R разложение единицы, то, как мы неоднократно вычисляли, F{R) = E{a") — Е{аг) и искомая вероятность w(a', a") = SpurU(E(а") — Е(а)). Поэтому функцией распределения, определяющей статистику величины И, будет <w(a) = SpurUE(a) [ср. IV. 1, прим.175) на стр. 243; в случае со- состояний, т. е. когда i/ = P!(pl, снова будет w(а) — SpurР[9]Е(а) = — (Е(а)]у, ср)]. Естественно, что эти вероятности будут лишь отно- относительными, если оператор U нормирован неправильно.
248 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV На вопрос о том, когда величина И с оператором R с достовер- достоверностью принимает значение X* в смеси со статистическим операто- оператором U, можно ответить непосредственно с помощью функции w (a): для а < X* должно быть <w(a) — Q, а для aSsX* w(a)—l, или же, если U неправильно нормирован, = Erw A) = Spur U. То есть Spurf/?'(a) = O, если а < X*. Spur UA — Е(а)) = 0, если а^Х*177) Но в случае дефинитных операторов А, В из Spur АВ = О вытекает что АВ — 0 (ср. II. 11), так что будем иметь UE(a) = 0, если а < X*, и UE(a) — U, если а>Х*, или, что то же самое, поскольку в силу эрмитовости произведения сомножители должны коммутировать, ( = / для а ^ X' E(a)U = Q илиже = U, т. е. если/ = Ug, тоЕ(а)/\ ., ^ = и для а <С л. Согласно проведенной в II. 8 дискуссии, это означает, что /?/ = Х*/, т. е. RUg — \*Ug тождественно по g\ Следовательно, последнее условие гласит: RU — \*U. Если обозначить через Ш замкнутое ли- линейное многообразие, порожденное всеми решениями h уравнения Rh=Vh, то можно сказать также: Uf всегда лежит в №.. Тот же результат, впрочем, можно было бы получить из условия обращения в нуль дисперсии, т. е. обращения в нуль (возможно, от- относительного) математического ожидания величины (91 — X*J. Мы ответили в III. 3 на следующие вопросы (91, ®, ... — физи- физические величины, R, S, ...—их соответствующие операторы): /. Когда И измеримо абсолютно точно? Ответ: Если R обладает чисто дискретным спектром. 2.. Когда И, © абсолютно точно измеримы одновременно? Ответ: Если R, S обладают чисто дискретными спектрами и перестановочны между собой. 3. Когда несколько величин И, 2>, ... абсолютно точно измеримы одновременно? Ответ: Если R, S, ... обладают чисто дискретными спектрами и все перестановочны. 4. Когда несколько величин 91, ®, ... измеримы с произ- произвольной точностью одновременно? Ответ: Если R, S, . . . все перестановочны. 177) Если Spur U бесконечен, то последняя формула, полученная с по- помощью вычитания, может показаться сомнительной. Тем не менее ее можно обосновать также следующим образом: то, что величина 91 имеет значение )*, означает, что w {а', а") = 0, т. е. Spur U (? (а") — Е (а')) = 0, если а" < I" или a' gs X*. Так как этот шпур всегда ^Ои так как он не убывает с а" и не возрастает с а', то при а" < I* достаточно рассмотреть его lim , а'-* —со а при а' > X* — его lim , т. е. Spur UE (а") = 0, если а" < V, а"-»+со Spur U A-Е (а1) ) = 0 при а' >X*.
3] ВЫВОДЫ ИЗ ЭКСПЕРИМЕНТОВ 249 При этом мы использовали следующий принцип, абстрагирован- абстрагированный из результата эксперимента Комптона — Симонса: (М.) Если физическая величина И дважды измеряется на системе S, причем измерения следуют непосредственно одно за другим, то в обоих случаях получается одно и то же значение. Это будет справедливо даже в том случае, когда в исходном состоянии системы S 91 обладала дисперсией, так что М-изме- рение, помимо всего прочего, могло изменить состояние си- системы S. Физический смысл М. мы уже обсудили подробно в III. 3. Даль- Дальнейшими предположениями для ответов /.—4. были: статистическая формула Ег. из III. 3 для состояний; допущение F. из III. 3, в силу которого величине F (Ш) соответствует оператор F (/?), если только величине 5R соответствует оператор R; допущение, согласно которому величине 9t-j-2> соответствует оператор R-\-S, если (одновременно измеримым) величинам И, B5 соответствуют операторы R, S. Так как эти три предположения по-прежнему осуществляются (первое вытекает из формулы Sp. в IV. 2, а два других соответ- соответствуют /., II. в IV. 2) и так как М. также должно считаться вер- верным,— поскольку мы считаем его необходимым для принципиального построения квантовой механики,—то здесь также останутся в силе приведенные в III. 3 доказательства /.—4.. Таким образом, указан- указанные ответы снова оказываются правильными. В III. 5 мы исследовали такие физические величины, которые при- принимают лишь два значения: 0 и 1. Они взаимно однозначно соответ- соответствуют альтернативным свойствам (J. Действительно, если бы было задано (§:, то соответствующую величину можно было бы определить так: эта величина будет измерена, если мы сможем рассудить (см. прим. перев. на стр. 187), имеет® место или нет; ее значениями будут соответственно 1 и 0. Наоборот, если была задана величина, то @ было следующим свойством: названная величина имеет значение 1 (т. е. не 0). Из приведенного там F. (т. е. из /. в IV. 2) следовало, что соответствующие операторы Е как раз и являются операторами проектирования. Вероятность того, что (§: имеет место, равнялась математическому ожиданию определенной выше величины. В III. 5 эта вероятность вычислялась лишь для состояний ср (т. е. для и = Рщ, ||ср||= 1), но ее можно вычислить и в общем случае по формуле Sp. '. она равна Spur UE (относительная!, абсолютная, только если U пра- правильно нормирован, т. е. когда Spur Л/ = 1). Установив справедливость положений /.—4., мы тем самым до- доказали вытекающие из них утверждения а) — ?) из III. 5. Следует отметить, правда, что там а) давало информацию лишь относительно состояний, а здесь мы распространили его на любые смеси: а') В смеси со статистическим оператором U вероятности того, что свойство (J имеет место или же не имеет места, равны
250 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV соответственно Spur (UE) или Spur(?/A — ?)) (вероятности относительные!, абсолютными они будут лишь в том случае, когда U правильно нормирован, т. е. когда Spur?/ = 1). Если рассматривается несколько величин И,, ..., Иг, причем ве- величинам И,, ..., Mj соответствуют операторы Rx /?; с разло- разложениями единицы Ех (X) Et (к), и если, далее, задано / интерва- интервалов 1\ : \\ < X ^ Xj //: X/ < X ^ X/', и положено ?\ {1\) — == Ei (l'i) — Ei (\'i), . . ., Ei{h) = Ei (X/') — Ei (l'i), то свойствам «Mi лежит в Д», ..., «Иг лежит в ft» соответствуют проекционные операторы ?, (/;) Е( (/г) (ср. ?)). Характеристичным условием одно- одновременной рассудимости этих свойств является перестановочность проекционных операторов Е1A1), .... ?г(/г) (ср. у)). Их одновре- меннэму осуществлению будет соответствовать проекционный опера- оператор Е — Е1A1) ¦ ¦ ¦ Е( (It) (ср. е)), а соответствующая вероятность будет равна Spur(t/?') (ср. а')). Пойдем теперь по обратному пути: предположим, что мы не знаем состояния системы S, но зато проделали в S некоторые измерения, результаты которых нам известны. Ведь в действительности дело обстоит всегда именно таким образом, так как узнать что-нибудь о состоянии S можно лишь из результатов измерений. Строго говоря, состояния — это лишь теоретические конструкции, в действительности в нашем распоряжении оказываются лишь результаты измерений, и задача физики состоит в том, чтобы установить связь между про- прошлыми и будущими измерениями. Конечно, для достижения этой цели всегда вводится вспомогательное понятие «состояния», но физическая теория должна тогда научить нас, как, с одной стороны, заключить из прошлых измерений о настоящем состоянии и как, с другой сто- стороны, перейти от настоящего состояния к будущим результатам изме- измерений. До сих пор мы занимались только вторым вопросом, теперь же нам надо обратиться к первому. Если предшествующие измерения недостаточны, чтобы однозначно установить настоящее состояние, то при известных обстоятельствах из них можно узнать вероятности, с которыми входят отдельные со- состояния (это справедливо как в причинных теориях, например в клас- классической механике, так и в квантовой механике). Итак, задача со- состоит, собственно, в том, чтобы по данным результатам измерений найти смесь, которая обладала бы той же статистикой, что и ожидае- ожидаемая для системы S, относительно которой нам известно только, что в ней проделаны указанные измерения и что они дали указанные результаты. Конечно, мы должны уточнить смысл выражения: относи-
8] ВЫВОДЫ ИЗ ЭКСПЕРИМЕНТОВ 251 тельно системы S «известно только то» и ничего больше, а также указать, как отсюда может быть получена некоторая статистика. Связь со статистикой должна, во всяком случае, быть следующей: если для многих систем Si, .... Sm (многих экземпляров системы S) эти измерения дают упомянутые результаты, то тогда ансамбль [Si, .... Sm\ в0 всех своих статистических свойствах совпадает со смесью, которая дает те же результаты измерений. То, что измере- измерения на всех системах Si, .... Sm дают одни и те же результаты, можно приписать в духе М. тому обстоятельству, что первоначально имелся большой ансамбль [S{ SN], в котором были проделаны измерения, а затем из тех элементов, для которых получался тре- требуемый результат, был образован новый ансамбль, который и является ансамблем [Si Sm\- Конечно, все зависит от того, как был вы- выбран ансамбль [St SN]. Этот исходный ансамбль, так сказать, задает априорные вероятности индивидуальных состояний системы S. В целом положение вещей хорошо известно из общей теории вероят- вероятностей: для того чтобы можно было из результатов измерений делать выводы о состояниях, то есть из следствий — о причинах, т. е. для вычисления апостериорных вероятностей, необходимо знать априорные вероятности. Вообще говоря, последние можно выбирать многими способами, вследствие чего наша задача не решается единственным образом, тем не менее мы увидим, что при наличии специальных квантовомеханических соотношений имеется некоторый особенно под- подходящий выбор первоначального ансамбля [Sx SN] (т. е. априор- априорных вероятностей). Совсем по-другому обстоит дело, когда известно достаточно много результатов измерений, чтобы полностью определить состояние си- системы S: в этом случае всякий вопрос должен иметь однозначный ответ. Мы увидим вскоре, каким образом проявляется это обстоя- обстоятельство. Отметим, наконец, еще следующее. Вместо того чтобы говорить, что нам известны многие результаты измерений, относящиеся к си- системе S, можно сказать также, что система S подвергалась испыта- испытанию относительно какого-то известного свойства 6 и что его нали- наличие было установлено. Из а) — ?) нам известно, какая существует связь между этими вещами: если, например, имеются результаты одно- одновременно допустимых измерений, из которых следует, что значения величин Шг Щ{ лежат соответственно в интервалах /, /г, то (пользуясь введенными выше символами) проекционным оператором величины И. будет Е = Е1(/1) ... ?г(/г). Итак, наши знания о S всегда выражаются в наличии некоторого известного свойства 6, которое формально характеризуется заданием проекционного оператора Е. Надо найти статистический оператор U ансамбля [s[, .... Sm] с одинаковыми значениями, равно как и ста-
252 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV тистический оператор Uo общего исходного ансамбля [Sv ..., SN]. Каковы те математические соотношения, которые связывают между собой Е, U, Uo? В силу М. свойство (? наверняка имеет место в [Si, . ¦ ¦, Sm\* т. е. величина, принадлежащая (?, имеет там значение 1. Это озна- означает, как мы видели в начале этого параграфа, что EU — U, т. е. что Uf всегда лежит в 2R, где Ш означает множество всех /, для кото- которых Ef = /, т. е. замкнутое линейное многообразие, принадлежащее Е. Вместо EU = U мы можем написать также UE = U, U A—Е) = 0, т. е. Ug — 0 для любых g — (l—E)f, иными словами, для всех g из замкнутого линейного многообразия, принадлежащего к 1-Е, т. е. для всех g из 9t — 2R. Итак, Uf равно 0 для всех / из 9t— Ш, а для / из ffl. Uf также лежит в Ш. На этом пути относительно U больше ничего сказать нельзя. Этим оператор U определяется тогда и только тогда (в суще- существенном, т. е. с точностью до постоянного множителя), когда мно- множество Ш является 0- или 1-мерным. Действительно, в случае 5Ш=[0] мы имеем G = 0, что, согласно IV. 2, замечание 1, невозможно; в случае же 2>J = [cp] (ср=?О, поэтому можно принять, что ||<р[| = 1) будем иметь G/ = сер, так что и для всех / из Ш (поскольку они равны аср) будет Uf — cf и, следовательно, вообще Uf — UEf — cEf, U = сЕ = сР[<с], и так как с > 0 (поскольку U дефинитен и Ф 0), то U в существенном = Е = Р^. В том случае, когда у множества Ш число измерений 3=2, можно выбрать два ортонормированных эле- элемента ср, ф из ffl, и тогда Р[9], Р[ф] будут двумя существенно раз- различными операторами U, удовлетворяющими нашим условиям. Итак, равенство Е — 0 невозможно, при Е — Р^ (||<р|| = 1) будет U — = ?' = P[tp], во всех других случаях U многозначно. То, что для Е = 0 вообще нельзя найти никакого U, было бы нехорошо, если бы 5 могла обладать таким свойством (?. Однако, согласно ¦»)), это исключено: такое свойство @ никогда не имеет места, его вероятность всегда равна 0. Одномерное множество Ш, т. е. Е — Рщ (|[<р[| = 1), определяет U однозначно, и даже как со- состояние ср, т. е. это то самое измерение, которое полностью опре- определяет состояние системы 5, если оказывается утвердительным, причем этим состоянием оказывается ср178). Все прочие измерения не являются полными и их не хватит для определения состояния. 17S) To есть если <? имеет место, то состоянием будет <?• Если же оно не имеет места, то имеет место «не <?», в силу чего вместо Е = Я^,, S01 = [<р] выступят 1 — Е = 1 — Я^], dl — SOt = Ш — [?], которые не определяют U един- единственным образом. (@ как раз соответствует вопросу: «Это состояние, есть ли оно ч?»-) Измерение, которое при любом исходе определяет состояние одно- однозначно,— это измерение величины <Ц, оператор которой R обладает дискрет- дискретным спектром с исключительно простыми собственными значениями, ср. III. 3. Тогда после измерения будет осуществляться одно из состояний <?i, 9г- ¦ • •
3] ВЫВОДЫ ИЗ ЭКСПЕРИМЕНТОВ 253 В общем случае мы поступаем следующим образом. Обозначим величину, соответствующую свойству (?, также через (?. Тогда U получается за счет того, что в ансамбле [Sv ..., SN], принадлежа- принадлежащем Uo, измеряется (?, а затем все элементы, для которых получено значение 1, объединяются в ансамбль оператора U (т. е. в \s[ Sm])- Само измерение свойства @ можно проводить многими различными способами, например измеряя какую-нибудь другую величину 91, из- известной функцией которой является свойство (?: @ —F(9t). Если, например, срр ср2, ... является ортонормированной системой, растя- растягивающей 9И, а фр ф2, ... является соответствующей для 9t — Ш, то система ср2, ср2 фр ф2, ... растягивает 2R-)-(SR — 2Ji) = 9t, т. е. является полной. Пусть Хр Х2, ..., [Ар [а2, ...—попарно различные вещественные числа, а оператор R определен посредством Оператор R имеет, очевидно, чисто дискретный спектр Хр Х2, .. р,р [а2, ... с соответствующими собственными функциями срр ср2, .. фр ф2, ..., причем все собственные значения просты. Если F(х) какая-нибудь функция, для которой то F(R) имеет для срр ср2, ... собственное значение 1, а значит, и для любого / из Ti. В случае же фр ф2, ... собственным значением будет 0, а значит, и для любого / из 91 — Ш. Таким образом, Е= F (R). Если R принадлежит 91, то тем самым @ = F (91) и ©-изме- ©-измерение можно истолковать как 91-измерение. В этом случае мы можем вычислить, какая связь существует между Uo, U. После 91-измерения каждая система будет находиться в одном из состояний срр ср2 фр ф2, . .. в соответствии с тем, какое из значений Хр Xj р.Р р,2, ... было обнаружено. Относящиеся сюда вероятности будут равны соответственно Spur (U0PM) = (?/оТр срО, Spur (U0PM) = (Uo92, c?2) Spur (?/0Р1ф1]) = (t/0^. <h). Spur (?/,/>[«) = (^2. Ы ¦ ¦ ¦ (ср. соображения из III. 3, справедливость которых была нами уста- установлена). Это значит, что эти части ?/0-ансамбля переходят в ансамбли (собственных функций оператора R), т. е., вообще говоря, измерение изме- изменяет состояние системы S. Аналогично, ©-измерение также изменяет состоя- состояние, поскольку после него в случае положительного результата оказывается U = Р[9у а в случае отрицательного результата, напротив, UA—P^=U, UP,у] = 0, т, е. Uу = 0, тогда как первоначально ни один из этих случаев не был обязательным. Это квантовомеханическое «отыскание» состояния, таким образам, изменяет его, как и следовало ожидать.
254 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV P[Vl], Р{92], .... <Р[Ф,]> Р\№ •¦¦ Поскольку значению @=1 соответ- соответствует 9t = Xj, X2, .... то (/-ансамбль возникает путем объединения первой группы. Таким образом, находим Далее, каждый оператор Р\9 ] перестановочен с R179), а потому R должен коммутировать и с О. То есть если U перестановочно не с любым из операторов R, получающихся указанным способом, то некоторые измерительные процедуры (а именно те, которые основы- основываются на соответствующих Щ исключаются при приготовлении U из Uo. Тогда мы знаем об U больше, чем то, что он возник посред- посредством ©-измерения. Но поскольку U как раз должен представлять это состояние наших знаний, то мы попытаемся придерживаться сле- следующего условия: если имеются такие U, для которых не приходится исключать ни одного измерительного процесса из величины (?, то мы окажем им предпочтение. Посмотрим поэтому, существуют ли такие U и что они собой представляют! Как мы видели, U должен был коммутировать со всеми R, полу- получающимися указанным способом. Отсюда следует, что RU<?n = UR<pn = = ?/(Х„<р„) = Х.л?/<рл, т. е. U?n является собственной функцией опе- оператора R с собственным значением Х„, в силу чего ?/срл = а„ср„. В частности, f/cpj —^ср,. Пусть задан произвольный элемент ср из Эй, для которого ||ср|| = 1, тогда можно так выбрать систему срр ср2, ... ...,<]>!, ф2. . . ., чтобы было <р1=ср, а потому любое такое ср является собственной функцией U. Все такие ср должны тем самым принадле- принадлежать одному и тому же собственному значению. Действительно, если бы ср и ф принадлежали различным собственным значениям, то они должны были бы быть ортогональны. Но тогда Ч'_? также /2 была бы собственной функцией, причем, в силу соотношений (9. 9) V~2 ' Т _ (9. 9) _ 1 /2 /2 1/2 ' т/ /2 /2 не ортогональной ни к ср, ни к ф, а потому должна была бы при- 179) Например, благодаря будем иметь
3J ВЫВОДЫ ИЗ ЭКСПЕРИМЕНТОВ 255 надлежать тому же собственному значению, которому принадлежат ср и ф| что невозможно, поскольку последние должны были относиться к различным. Следовательно, U<? = аср с одним и тем же а. Условие ||<р|| = 1 можно, очевидно, опустить, так что для любых / из Ж будет иметь место соотношение Uf—af. Таким образом, всегда UEg — aEg, т. е. UE=aE, но поскольку U — UE, то U = аЕ. Далее, U, Е оба дефинитны и Ф 0. Поэтому а > 0 и, следовательно, можно положить U — E, не изменяя его существенным образом. Но этот оператор U действительно решает поставленную задачу для любого R, т. е. для любой системы срр ср2 tyv ф2> ¦ ¦ •• если только Uo выбрано надлежащим образом. Именно, для ?/0=1 будет <р„) Р[,п] = 2 (<р„. <р„) я[9 j = j п Тем самым устанавливается, что U = E в смысле набросанной выше программы. Можно определить и оператор Uo, если допустить, что он универсален, т. е. не зависит ни от Е, ни от R. Желаемое дается тогда оператором ?/0=1, и только им. Именно, мы имеем (V<?m> <Pm) = (Е<?т> 9т) = (?«• ?т) = 1 • «- Тл) I (Тя. Тш)|2 и следовательно, (U0<fm, ут)— Ь Поскольку любой ср из 2# с ||«р||= 1 можно выбрать за «Pi. то должно быть (?/оср, ср)= 1, а отсюда следует, что для всех / из Ш будет иметь место равенство (Uof, /) = (/, /). Но ведь Ш произвольно, а потому это соотношение должно выпол- выполняться вообще для всех /. Тем самым показано, что ?/0—1. Пусть даны не обязательно одновременно устанавливаемые, альтер- альтернативные свойства @. $¦ Согласно изложенному выше, вероятность того, что система 5, относительно которой только что установлено, что она обладает свойством (?, при непосредственно следующем изме- измерении будет обладать и свойством $, дается выражением Spur (EF) = = j(EF) (E, F являются операторами величин @, $; первая фор- формула справедлива, так как U — E, а вторая в силу Е?- = Е, F2=F, согласно 11.11). Впрочем, эти вероятности относительные, причем (& нужно считать фиксированным, а ^ переменным; в том случае, когда число Spur(?) = _2(?.) = 4HCJiy измерений Ш оказывается конечным, их можно нормировать, деля на это число. Вместо свойств (?, ^ мы можем рассматривать также физические величины. Пусть 91! Щ — одновременно измеримые величины и,
j j jг^ [ = *i (К) - *, (XJ) Я ¦ (/,-) = ?, (ХД - Е, (Х;.), />, G,) = F, 256 ДЕДУКТИВНОЕ ПОСТРОЕНИЕ ТЕОРИИ [ГЛ. IV кроме того, пусть <2>i, .. ., <2>г —также одновременно измеримые вели- величины. Их операторами пусть будут Rv .... Rj и Sx St, а раз- разложения единицы для этих операторов обозначим через ?\(Х) Ej(k) и Fj(X) ^"г(Х). Пусть, далее, А : Xi <XssXi, ..., /у : Ху- <Х^Ху, ij < X ^ [ij Уг: р,^ < X g; p,[ — интервалы и Et (/j) = , ;) ( = F, (){)()() Вопрос состоит в следую- следующем: пусть 91! 9t;- измерены в 5 и пусть их значения попали в интервалы /t /;- соответственно; сколь вероятно, что вели- величины <2>! <2>г при измерении, непосредственно следующем вслед за первым, попадут в интервалы Jv .... Jt соответственно? Очевидно, что надо положить: E = El(Il) ... Ej(Ij), F=F1(Jl) ... Fl(Jl) (ср. е), ?)), и тогда искомой вероятностью будет Spur (?, (/,) ...Ej (/j) ¦ F, (Ji) ... Fl (Jt)) = = S (Ei (/i) • • • Ej (/y)' ^i (Л) • • • ^ W )• В заключение надо еще раз вернуться к смыслу общего исход- исходного ансамбля ?/0=1. Мы получаем из него ансамбль U, разделяя его на две части при 91-измерении. Если бы мы не выполнили этого разделения, т. е. провели бы 91-измерение на всех его элементах, а затем снова объединили их всех в одном ансамбле, то мы снова получили бы ?/0=1. В этом можно легко убедиться или прямым вычислением, или выбирая ?=1; тогда собственные значения Хр Х2, ... и собственные функции <рр ср2, ... выпадают, а собственные значения Хр Х2, . . . и собственные функции cpj, cp2, ... образуют полную систему. Итак, хотя при некоторых обстоятельствах 91-изме- рение и изменяет индивидуальные элементы, все эти изменения должны в точности компенсироваться, поскольку ансамбль в целом не изме- изменяется. Впрочем, это свойство характерно для Uo= 1. Действительно, если для всех полных ортонормированных систем cpj, cp2, ... имеет место соотношение /1=1 то U0 перестановочно с P[tp,], а так как это может быть любой Яг,, -,, то это значит, что Uo коммутирует с любым Я[?], |jcpj| = 1. Таким обргзом, имеем ?/0<р = f/0P[9]cp = Я(<р]1/Оср = (t/0«p, cp) ¦ ср. т. е. ср является собственной функцией ?/„. Равенство t/0=l сле- следует отсюда в точности таким же образом, как выше из соответ-
3] ВЫВОДЫ ИЗ ЭКСПЕРИМЕНТОВ 267 ствующих соотношений (с Ж и Б вместо Ш и 1) получилось, что U = E. В ансамбле [/0= 1, таким образом, все возможные состояния на- находятся в наиболее равновесном из всех возможных состояний равно- равновесия, и никакое измерение не может его изменить. Для любой пол- полной ортонормированной системы <plf <р2, ... имеет место равенство иными словами, смесь 1:1:... всех состояний срх> ср2, ... Отсюда мы заключаем, что ?/0=1 соответствует обычному в старой кванто- квантовой теории термодинамическому допущению об «априорной равно- равновероятности всех простых квантовых орбит». Такой ансамбль будет играть важную роль и в наших термодинамических рассмотрениях, которым посвящены следующие ниже параграфы.
ГЛАВА V ОБЩЕЕ РАССМОТРЕНИЕ 1. Измерение и обратимость Что происходит со смесью со статистическим оператором U, если в ней измеряется какая-нибудь величина 91 с оператором R? (Под измерением в ансамбле мы понимаем здесь измерение величины Щ на каждом элементе ансамбля с последующим объединением полученных в результате этого измерения отдельных систем снова в один ан- ансамбль.) На поставленный вопрос можно ответить в той мере, в ка- какой этот вопрос вообще допускает однозначный ответ. Во-первых, рассмотрим случай, когда R имеет чисто дискретный и невырожденный спектр. Пусть cpj, ср2, ...—полная ортонормиро- ванная система собственных функций, a Xj, X2, ... —соответствующие им собственные значения (по предположению все отличные друг от друга). После измерения возникнет следующее положение вещей: В доле (?/<р„, <р„) исходного ансамбля величина Щ будет иметь зна- значение Х„ (д=1, 2, ...). Эта доля образует тогда ансамбль, в кото- котором 91 имеет значение Х„ с достоверностью (Л1. в IV.3). Этот ан- ансамбль находится в состоянии сря с (правильно нормированным) ста- статистическим оператором Prf ¦>. Собирая эти подансамбли, мы получим, таким образом, смесь со статистическим оператором Пусть теперь R обладает чисто дискретным спектром, а срР <р2, ... и Xj, X2, ... имеют прежний смысл, за исключением лишь невырож- невырожденности, т. е. среди Х„ могут быть равные друг другу собственные значения. Тогда процесс измерения не определен однозначно (как уже было, например, в случае @ в IV.3). Действительно, пусть fij, [а2, ...—различные вещественные числа, а 5 — оператор, соот- соответствующий cpi, ср2, . .. и [ij, [а2, ... Пусть этому оператору отве- отвечает величина <3>. Определим функцию F (х):
1] ИЗМЕРЕНИЕ И ОБРАТИМОСТЬ 259 тогда F(S) = R и, значит, Р(<3>) = %1. Таким образом, измерение ® можно рассматривать как измерение 91. Это превращает оператор U в оператор U', определенный выше, причем W не зависит от (со- (совершенно произвольных) [ij, [a2, •••, но зависит от cpj, <р2, ..., хотя эти собственные функции, в силу кратности собственных значений R, не определяются единственным образом. В IV.2 мы установили, осно- основываясь на II.8, что можно сказать относительно cpj, <р2, ...: пусть X', X", . .. —различные собственные значения среди Хг Х2, . .., пусть ffiy, SWx"' ¦••—множества /, удовлетворяющих уравнениям Rf = = X'/. Rf = Х'7, • • • Пусть еще г[, Хг хГ- Хг - — про- извольные ортонормированные системы, растягивающие Tl^, 9ЛХ», ... соответственно. Совокупность всех х[< Хг Xi> Хг- образует тогда самую общую систему cpj, cp2, ... Таким образом, U' может в зависимости от выбора <3>. т. е., собственно, в зависимости от вы- выбора измерительной процедуры, иметь вид любого выражения типа А это выражение однозначно лишь в особых случаях. Укажем теперь такой особый случай. Каждое отдельное слагаемое должно в этом случае быть однозначным. То есть для каждого соб- собственного значения X, если 9ЛХ означает множество /, удовлетворяю- удовлетворяющих уравнению /?/ = Х/, сумма 2 (^Хл> Хп)Р\г 1 должна иметь одно и то же значение при любом выборе ортонормированной си- системы Xi. X2' • • •• на которую натягивается Шх. Назовем эту суммуV, тогда дословное повторение рассуждения из IV.3 (там только Uo, U, Ш надо заменить на U, V, 2КХ) показывает, что должно быть V=o,/V (ex — константа, > 0), а это требование эквивалентно справедливости равенства (?//, /) = сх(/, /) для любого / из ЯЯу Поскольку эти / совпадают со всеми Р,т g для любых g, то мы требуем (UPm)g, Pn}g) = cx(Pihg. P>mxg). т. е. (PmxUPWlg, g) = cK(PWxg, g), т. е. для любых собственных значений X оператора R. Если же это усло- условие, которое, очевидно, сильно ограничивает U, не выполняется, то различные процедуры измерения действительно могут преобразовать U в различные V. (Тем не менее, исходя из термодинамических прин- принципов, в V.4 мы сможем в общем случав сказать еще кое-что отно- относительно результата 91-измерения.) 17*
260 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V В-третьих, пусть R вообще не имеет чисто дискретного спектра. Тогда, в соответствии с III.3 (или IV.3, критерий /.), соответствую- соответствующая величина не может быть измерена с абсолютной точностью, а Ш-измерения с ограниченной точностью, как указывалось по этому поводу выше, равнозначны измерениям некоторых величин с чисто дискретным спектром. Другой тип воздействий на материальную систему, — в противо- противоположность разрывным, непричинным и мгновенно действующим экспе- экспериментам или измерениям, — представляет нам временнбе дифферен- дифференциальное уравнение Шредингера. Это уравнение описывает непрерыв- непрерывное и причинное изменение системы с течением времени, если только известна ее полная энергия. Для состояний <р это уравнение имеет вид где Н — оператор энергии. Для статистического оператора состояния ср^, Ut — P[9] это урав- уравнение дает нам -я- Если же Vi — не состояние, но смесь многих состояний, скажем Pr mi» Рх BI. ... с соответствующими весами w,, w0, .... то он № J К J должен изменяться так, как это следует из изменений отдельных Рг (щ, Рт BП, ... Складывая соответствующие уравнения Zi,, при- приходим к выводу, что Z2. имеет место также и для этого Vv Но ведь все U являются или смесями такого типа, или же их предельными случаями (например, любое U с конечным Spurt/ является такой смесью), поэтому можно объявить Z2. справедливым всегда. В Zz,t как и в дифференциальном уравнении Шредингера Zu* Н может, кроме того, зависеть от t. Если же это не так, то можно дать явные решения, а именно для Z\mt как мы уже знаем, h cp0,
1] ИЗМЕРЕНИЕ И ОБРАТИМОСТЬ 261 а для Z2. (Легко проверить, что эти выражения являются решениями, а также что они следуют одно из другого. Ясно также, что имеется лишь одно решение при заданных начальных значениях ср0 или соответ- соответственно Uo: дифференциальные уравнения Z\., Z<i, являются ведь уравнениями первого порядка по t.) Итак, мы пришли к двум фундаментально различным типам воз- воздействий, которые могут быть оказаны на систему S или ансамбль [Slf ..., SN]. Во-первых, это — произвольные изменения, вызываемые измерениями, которые передаются формулой со n=l l J , cp2, ...—полная ортонормированная система, ср. выше). Во-вто- Во-вторых, — автоматические изменения, вызываемые течением времени, ко- которые передаются формулой 2^ B.) U-±Ut = e h Ueh (Н — оператор энергии, t — время; Н не зависит от /). Если Н за- зависит от t, то надо разбить рассматриваемый интервал времени на малые интервалы, в каждом из которых Н не изменяется — или же изменяется лишь очень слабо, — и применить 2. к этим отдельным интервалам. Суперпозиция приведет тогда к окончательному результату. Нам следует теперь более детально разобраться в этих двух ти- типах воздействий, в их природе и в их отношении друг к другу. Прежде всего поразительно, что 2. допускает (в указанном выше смысле) возможность зависимости Н от времени, так что, собственно, надо было бы ожидать, что уже 2, будет достаточно, чтобы описать воздействие, вызываемое измерением: ведь физическое воздействие не может быть ничем, кроме как производящимся время от времени включением в наблюдаемую систему известных энергетических связей, т. е. введением надлежащей (предписанной наблюдателем) временнбй зависимости Н- Почему же в таком случае нам нужен для измерения особый процесс /.? Причина состоит в следующем: при измерении мы не можем рассматривать систему S саму по себе, напротив, для того, чтобы проследить аналитически ее взаимодействие с измеритель- измерительным аппаратом М, надо рассматривать систему S-\-M. Теория изме- измерения является утверждением относительно S-j-M, она должна опи- описывать, каким образом состояние S связано с известными свойствами состояний М (а именно с положениями известных стрелок, так как наблюдатель отсчитывает по ним). Кроме того, кажется в некоторой мере произвольным, не надо ли включить в М и самого наблюдателя
262 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V и не поставить ли на место зависимостей между состояниями S и по- положениями стрелок М зависимости между состояниями S и химиче- химическими изменениями в его глазу или даже в его мозгу (т. е. тем, что он «увидел» или «воспринял»). В VI. 1 мы исследуем этот вопрос подробнее. Так или иначе, речь может пойти, следовательно, лишь о применении 2. к системе S-\-М. Правда, надо будет еще показать, что это дает для S то же самое, что и непосредственное примене- применение /. к S. Только лишь после того, как это удастся, мы достигнем единого способа описания физического мира на квантовомеханической основе. Мы отложим обсуждение этого вопроса до VI.3. Во-вторых, отметим в связи с /., что, как мы неоднократно ука- указывали, измерение, в смысле /., должно быть мгновенным, т. е. должно проводиться в столь короткий промежуток времени, чтобы изменение U, обусловленное 2., не было бы еще заметно. (Если бы мы захотели поправить результат, вычисляя измененный Ut с по- помощью 2., то все равно бы ничего не вышло, — ведь чтобы прибе- прибегнуть к какому-либо Uv надо знать t, момент измерения, точно, т. е. длительность измерения все равно должна была бы быть короткой.) Однако такое требование сомнительно в самом принципе. Ведь хо- хорошо известно, что существует величина, которая в классической механике канонически сопряжена времени: энергия 18°). Поэтому можно ожидать, что для канонически сопряженной пары время — энергия должны существовать соотношения неопределенности, аналогичные соотношениям неопределенности для пары декартова координата—- импульс181). Специальная теория относительности также показывает, что должна существовать далеко идущая аналогия: три простран- пространственные координаты и время образуют 4-вектор точно таким же образом, как и три пространственных импульса и энергия. Подобное соотношение неопределенности означало бы, что невозможно очень точно измерить энергию за очень короткий промежуток времени. Действительно, можно ожидать, что между ошибкой измерения е и промежутком времени х существует соотношение вида вх~> h. Физическое рассмотрение, аналогичное проведенному в III.4 для р, q, действительно приводит к этому результату181). Не входя в детали, мы рассмотрим случай светового кванта. Неопределенность в его энер- энергии s равна, в силу условия частот Бора, А-кратной неопределен- неопределенности в частоте: "Mv. Но Av, как показано в прим.137) на стр. 182, 1в0) Это соотношение можно найти в любом учебнике классической (га- мильтоновой) механики. 181) Соотношения неопределенности для пары время — энергия неоднократ- неоднократно обсуждались. Ср. изложение результатов yHeisenberg'a в Die Physika- Iischen Prinzipien der Quantentheorie, § II. 2. d., Leipzig, 1930. (Русский пере- перевод: Гейзенббрг, Физические принципы квантовой теории, ГТТИ, М., 1932.)
1] ИЗМЕРЕНИЕ И ОБРАТИМОСТЬ 263 в лучшем случае равно обратной величине временной длительности 1/4, так что е^, —, а для того, чтобы монохроматичность светового кванта могла себя проявить во всем интервале х, измерение должно простираться на весь этот интервал. Случай светового кванта ха- характерен, так как атомные уровни энергии определяются, как пра- правило, из частот соответствующих спектральных линий. Поскольку энергия ведет себя таким образом, можно предположить существова- существование зависимости между точностью и длительностью измерения и для других величин Ш. Как же после этого можно было бы оправдать наше допущение о моментальном измерении? Прежде всего следует согласиться, что это возражение напра- направлено против существенного недостатка, в сущности главного недо- недостатка, квантовой механики: против ее нерелятивистского характера, выделяющего время t по сравнению с тремя пространственными коор- координатами х, у, z и принимающего представление об объективной одновременности. Действительно, в то время как все остальные ве- величины (в частности, координаты х, у, z, тесно связанные с t пре- преобразованием Лорентца) изображаются операторами, времени, как и в классической механике, сопоставляется обычный численный пара- параметр t. Или же: система, состоящая из двух частиц, обладает волно- волновой функцией, которая зависит от 2X3 = 6 пространственных коор- координат, и только лишь от одного времени t, хотя, в силу преобразования Лорентца, желательно было бы иметь два времени. С этим нереля- нерелятивистским характером квантовой механики могло было бы быть связано и то обстоятельство, что мы можем игнорировать естествен- естественный закон минимальной длительности измерения. Это — разъяснение, но отнюдь не радостное! Более точное исследование этого вопроса показывает между тем, что ситуация все же не так плоха. Действительно, что нам на самом деле нужно, это совсем не малое время t, но лишь малый его эффект при вычислении вероятности {Ufn, сря) — и, значит, при образовании оо суммы U'= 2 (?/<ри, fn)P\f ] —независимо от того, исходим ли мы -—мн — <-н из самого оператора U или же из Ut = e " Ue h , В силу соотношения ) W * е этот результат может быть достигнут с помощью такого изменения Н возмущающей энергией, при котором е л срп отличалось бы от fn лишь на постоянный множитель модуля 1. Это значит, что состоя- состояние срл должно оставаться под влиянием 2. в своей существенной
264 ОБЩЕЕ РАССМОТРЕНИИ !ГЛ. V части постоянным, т. е. должно быть стационарным состоянием! или же Н<р„ должно равняться некоторой вещественной константе, умно- умноженной на <р„, т. е. срп должно быть собственной функцией Н. На первый взгляд такое изменение оператора энергии Н, при котором собственные функции оператора R стационарны и, следовательно, являются также собственными функциями Н (т. е. R, Н перестано- перестановочны), не кажется правдоподобным. Но на самом деле это не так, можно даже убедиться, что типичное измерительное приспособление предполагает как раз изменение такого сорта в Н- Действительно, любое измерение заканчивается тем, что световой квант или частица, обладающая массой, испускаются с известной энергией и в известном направлении и посредством своих характе- характеристик, т. е. своих импульсов, выражают результат измерения; или же тем, что частица с массой (например, стрелка на шкале) приходит в состояние покоя и ее декартовы координаты дают результат изме- измерения. Итак, для светового кванта заданию измеряемой величины эквивалентно, пользуясь терминологией III. 6, задание того Мп, для которого Мп — 1 (все остальные = 0), т. е. задание значений всех Ж], М2, ...; для вылетающей частицы с массой — задание трех ком- компонент импульса Рх, Ру, Pz, а в случае покоящейся частицы с мас- массой— задание трех ее декартовых координат х, у, z, или же, поль- пользуясь их операторами, Qx, Qy, Qz. Но измерение будет действи- действительно проведено лишь тогда, когда световой квант или частица с массой действительно улетят «прочь», т. е. когда световой квант не подвергается больше риску быть поглощенным или когда частица с массой не может уже больше отклоняться потенциальными энер- энергиями; или же когда покоящаяся частица с массой действительно покоится, для чего необходима большая масса182). (Последнее необ- необходимо уже в силу соотношений неопределенности, поскольку ско- скорость должна быть близка к 0, поэтому ее дисперсия мала, хотя ее произведение на массу, — импульс должен, из-за малой дисперсии координат, обладать большой дисперсией. В действительности стрелки являются макроскопическими объектами, т. е. они огромны.) Далее, оператор энергии Н. поскольку он имеет отношение к световому кванту, имеет, согласно III. 6, вид 182) Все остальные подробности измерительного приспособления отно- относятся лишь к связи величины 9$> которая собственно и представляет инте- интерес, или ее оператора R с указанным выше Мп или Рх, РУ, Pz, или Qx, Qy, Qz. Конечно, практически именно это является наиболее важной сто- стороной измерительной техники.
1J ИЗМЕРЕНИЕ И ОБРАТИМОСТЬ 265 в случае же обоих примеров частиц с массой — это (от — масса, V — потенциальная энергия). Наши критерии будут гласить, что w%, должны обращаться в нуль или же что V должно быть постоянно, или же что т должно быть очень велико. Но это как раз и приводит к тому, что Мп или Рх, Ру, Pz или Q*, Qy, Qz начинают коммутировать с указанными Н. В заключение следует подчеркнуть, что «делание стационарными» собственно интересующих нас состояний (здесь это cpj, cp2, ...) играет роль также и в других отделах теоретической физики. Предположе- Предположение о возможности прерывания химических реакций (их «отравления»), которое часто необходимо в физико-химических «мысленных экспе- экспериментах», имеет именно такую природу183). Два воздействия /. и 2. отличаются друг от друга фундамен- фундаментальным образом. То, что оба они по форме однозначны, т. е. при- причинны, не существенно: действительно, так как мы рассматриваем статистические свойства смесей, то не удивительно, что любое измене- изменение, даже если оно статистическое, приводит к причинному изменению вероятностей и математических ожиданий. Ведь именно по этой при- причине и вводят статистические ансамбли и вероятности! Очень суще- существенно, напротив, то, что 2. не приводит к увеличению суще- существующей в U статистической неопределенности, тогда как /. при- приводит к такому увеличению: 2. переводит состояния в состояния Г"в V "'",,)¦ а /. вполне может перевести состояние в смесь. В этом смысле можно сказать, что эволюция состояния согласно /. является стати- статистической, а согласно 2. — причинной. Далее, при фиксированных Н и t, 2. является просто унитарным преобразованием всех U: Ut=AUA , A~e h унитарно, т. е. из Uf = g следует, что Ut (Af) = Ag, так что Ut получается из U с помощью унитарного преобразования А гильбертова пространства и тем самым с помощью некоторого изоморфизма, который оставляет инвариантными все наши основные геометрические представления (ср. принципы, разъясненные в 1.4). Поэтому 2. обратимо: доста- достаточно заменить А на А~1, а это возможно в силу того, что А и А можно считать совершенно произвольными унитарными операторами ш) Ср., например, Nernst, Theoretische Chemie, Stuttgart (много- (многочисленные издания, начиная с 1893), книга IV, Обсуждение термодинамиче- термодинамических доказательств «закона действующих масс»,
266 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V благодаря далеко идущей свободе в выборе Н к (. Точно так же как и классическая механика, 2. не воспроизводит поэтому одну из наиболее важных и удивительных черт реального мира, а именно его необратимость, фундаментальное различие между направлениями вре- времени в «будущее» и в «прошлое». Фундаментальным образом по-иному ведет себя /.: переход не является безусловно обратимым. Вскоре мы увидим, что он вообще необратим: в том смысле, что вообще невозможно возвратиться от данного V к его U с помощью повторного применения какого- нибудь из процессов /. или 2. I Здесь мы достигли такого положения, когда целесообразно при- привлечь термодинамические методы рассмотрения, так как лишь они позволяют нам правильно понять различие между /. и 2., в котором замешаны вопросы об обратимости. 2. Термодинамические вопросы Мы будем исследовать термодинамику квантовомеханических ан- ансамблей с двух различных точек зрения. Сперва мы предположим справедливссть обоих основных начал термодинамики, т. е. невоз- невозможность perpetuum mobile первого и второго рода (законы энергии и энтропииI84), и вычислим, исходя отсюда, энтропию каждого ансамбля. При этом будут применяться обычные средства феномено- феноменологической термодинамики, а роль квантовой механики ограничится лишь тем, что наше термодинамическое рассмотрение будет отно- относиться к таким объектам, поведение которых определяется законами квантовой механики (нашим ансамблям, равно как и их статистиче- статистическим операторам ?/), — правильность же обоих основных начал предполагается и не доказывается. Затем мы перейдем к доказатель- доказательству выполнения основных начал в квантовой механике, причем выяснится, что закон энергии выполняется без каких-либо оговорок, а закон энтропии — лишь в рамках задачи. Именно, мы покажем, что воздействия /., 2. никогда не уменьшают энтропию, вычисленную по первому способу. Такая последовательность, казалось бы, не- несколько неестественна, но обусловлена тем, что только в ходе фено- феноменологического обсуждения нам удается достигнуть того понимания ш) Построенную на такой основе феноменологическую систему термо- термодинамики читатель сможет найти в бесчисленных учебниках, например в книге: М. Planck, Vorlesungen uber Thermodynamik, Berlin, 1930. Для дальнейшего особенно существенно статистическое понимание обоих начал, как оно разъясняется, например, в работах: Einstein, Verh. d. deutsch. phys. Gesel. 12 A914); L. Szllard, Zs. f. Phys. 32 A925),
2] ТЕРМОДИНАМИЧЕСКИЕ ВОПРОСЫ 267 всей проблемы, которое потребно для рассуждений второй половины задачи. Итак, мы начинаем с феноменологического рассмотрения, которое, между прочим, позволит нам также разрешить один известный пара- парадокс классической термодинамики. Здесь сразу следовало бы под- подчеркнуть, что «авантюристический» характер наших мысленных экспериментов, т. е. невозможность провести их практически, не причинит какого-либо ущерба их доказательной силе: по смыслу фе- феноменологической термодинамики всякий мысленный процесс имеет доказательную силу, если только не нарушает основных начал. Нашей целью будет определить энтропию некоторого ансамбля [5Х SN] со статистическим оператором U, который предпола- предполагается правильно нормированным, т. е. так, что Spur t/ = 1. Поль- Пользуясь принятым в классической статистической механике способом выражения, мы имеем здесь дело с ансамблем Гиббса — это значит, что статистика и термодинамика относятся не к (взаимодействующим) составным частям единой, очень сложной, механической системы со многими (и только недостаточно известными) степенями свободы 185), но к набору очень большого числа механических систем, каждая из которых уже одна, сама по себе, может (но не обязана) обладать необозримо большим числом степеней свободы, и которые следует мыслить не взаимодействующими и совершенно разделенными друг от друга186). В силу полной разделенности систем S1 SN и благодаря тому обстоятельству, что мы хотим применить к ним основанные собственно просто на счете методы исчисления вероят- вероятностей, не возникает сомнения, что следует использовать обычные методы теории вероятностей и что отступающие от них способы счета Бозе — Эйнштейна и Ферми — Дирака, уместные для известных ансамблей неразличимых и взаимодействующих индивидов (именно, для световых квантов и соответственно для электронов и протонов, ср. III. 6, особенно прим. 147) на стр. 206), не относятся здесь к делу. Введенный Эйнштейном метод термодинамического рассмотрения таких ансамблей [S1 SN] состоит в следующем 187): Каждая из систем iSj, ..., SN заключается в свой ящик Кх KN, стенки 185) Такой подход составил бы максвелл-больцманов метод в стати- статистической механике (ср. обзор в статье P. und T. Ehrenfest в Еп- zykl. d. Math. Wiss., Bd. II. 4. D., Leipzig, 1907). В теории газов, например, «очень сложной» системой является газ, состоящий из многих (взаимодей- (взаимодействующих) молекул, и эти молекулы подвергаются статистическому иссле- исследованию. 18в) Это составляет метод Гиббса (ср. 185)). Здесь отдельной системой будет весь газ, и мы будем следить за судьбами многих экземпляров одной и той же системы (т. е. одного и того же газа) и определять статистически их свойства. 187) Ср. выше, прим. 184) на стр. 266. Этот метод развивался далее Сцилардом, L. S г i I a r d, Zs. f. Phys. 32 A925).
268 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V которого не проницаемы ни для каких переносов взаимодействий, — в силу невзаимодействия рассматриваемых систем это допустимо. Далее, каждый ящик должен обладать очень большой массой, чтобы возможные изменения состояний (а тем самым и энергий, следовательно и масс) систем Sv ..., SN затрагивали бы их массы лишь в малой степени. Благодаря этому и их скорости окажутся в проводимом мысленном эксперименте столь малыми, что будет допустимо считать нерелятивистским способом. Эти ящики АГр •. •, KN мы в свою очередь поместим в очень большой ящик К (последнее означает, что объем If ящика AT должен быть много больше суммы объемов К\ KN)\ ради простоты в К не должно быть силовых полей (в частности, следовательно, он должен помещаться далеко от всех гравитационных полей и быть столь большим, чтобы массы К\ KN не оказывали бы никакого действия). Поэтому можно рассматривать теперь Ki Kn (содержащие Sv ..., SN соответственно) как молекулы газа, запертого в большом ящике АГ- Если мы теперь приведем К в контакт с очень большим резервуаром тепла температуры Т, то и стенки ящика К тоже примут ту же температуру, и их (настоящие) молекулы придут в соответствующее броуновское движение. Но тогда они станут передавать импульсы ближайшим ящикам К\ KN, из-за чего последние придут в движение, передавая импульсы и остальным ящикам К\ KN- Вскоре все ящики АГ], .... KN ока- окажутся в движении, обмениваясь импульсами: у стенок К— с молеку- молекулами стенок, а благодаря взаимным соударениям (внутри К) — друг с другом. Состояние стационарного равновесия такого движения будет достигнуто лишь тогда, когда ящики К\ KN примут то распре- распределение скоростей, которое будет в равновесии с броуновским дви- движением молекул стенок (температуры Т), т. е. максвелловское рас- распределение скоростей для газа температуры Т, в качестве «молекул» которого следует рассматривать ящики ATj. .... АГлг188)- Итак, мы можем сказать, что \SX 5^-газ принял температуру Т. Ради краткости будем называть в дальнейшем ансамбль \SV ..., SN] со статистическим оператором U ^/-ансамблем, a [Sv .... 5^1-газ — (/-газом. Причина, по которой мы решили заняться подобным газом, лежит в том, что разность энтропии ^/-ансамбля и V-ансамбля (U и V — дефинитные операторы со шпуром 1; соответствующие ансамбли — [Sj, .... SN] и [s'u .... S'n]) находится по определению путем обра- 18S) Именно так описывает, как известно, кинетическая теория газов тот процесс, в котором стенки передают свою температуру заключенному в них газу. Ср. выше, прим. 184), lS5).
2] ТЕРМОДИНАМИЧЕСКИЕ ВОПРОСЫ 269 тимого^ преобразования первого из них во второй !89), а это удается проще всего выполнить обходным путем через U- или соответственно V-газ. Именно, мы утверждаем: разность энтропии U- и V- ансамблей в точности та же, что и разность энтропии U- и К-газов, если оба последние рассматриваются при одной и той же температуре Т, которая в остальном может быть произвольной. Если Т прибли- приближается к нулю, то это утверждение, очевидно, справедливо с любой степенью точности, ибо разница между (/-ансамблем и (/-газом исче- исчезает при температуре 0, поскольку ящики К\ KN последнего не обладают тогда никаким собственным движением, а присутствие покоящихся ящиков ATi. . • ¦, KN, К термодинамически несущественно (аналогично для V). Таким образом, мы достигнем цели, если пока- покажем, что для некоторого заданного изменения температуры Т энтро- энтропия tZ-газа меняется на столько же, на сколько энтропия V-газа. Изменение энтропии некоторого одного газа, когда он нагревается от температуры "\х до температуры Т2, зависит только от его тепло- теплового уравнения, точнее, от его теплоемкостей 190), —при этом, конечно, нельзя допустить идеальности газа, так как, как раз в нашем случае, Т, должно быть выбрано вблизи нуля191). Напротив, оба газа {U и V) гарантированно имеют одно и то же уравнение состояния и одина- одинаковые теплоемкости, — с точки зрения кинетической теории газов ящики АГ] АГдг доминируют подавляющим образом и совершенно маскируют заключенные в них системы Sx, ..., SN или S\, ..., S^- Итак, при рассматриваемом процессе нагревания различие между U и V не сказывается и, как и утверждалось, обе разности энтропии совпадают. Поэтому в дальнейшем мы будем сравнивать друг с дру- другом только U- и К-газы, и при этом выберем температуру Т столь большой, что их можно было бы рассматривать как идеальные192). 189) Если при этом преобразовании используются количества тепла Q,, ..., Q; при соответствующих температурах Ть ..., Т;, то разность энтропии составит-—-)- •¦• +"^г~- Ср. выше, прим.184) на стр. 266. 19°) Если с(Т)— теплоемкость нашего количества газа при темпера- температуре Т, то в интервале Т, T-\-dT он принимает количество тепла с(Т)сП. т2 Согласно 18в) разность энтропии составит тогда / 2. . т, 191) Для идеального газа с (Т) = const; для очень малых Т это гаранти- гарантированно нарушается. Ср., например, прим.6) на стр. 13. _ 192) Для этого требуется также, чтобы объем У ящика К был велик сравнительно с суммарным объемом всех Kv ..-, KN и, далее, чтобы «при- «приходящаяся на одну степень свободы» энергия kT {k — постоянная Больцмана) ft2 была бы велика сравнительно с ^—; здесь h — постоянная Планка, a jj. — масса отдельной молекулы; построенная величина имеет размерность энер- энергии. Ср. Е. F e r m i, Zs. f. Phys. 36 A926).
270 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ V Тем самым их газокинетическое поведение станет полностью ясным, и мы сможем обратиться ьс собственно нашей задаче — обрати- обратимо перевести (/-газ в V-газ. При этом нам придется, в отличие от уже рассмотренных процессов, затронуть и находящиеся внутри fCi KN системы Sv ..., SN, т. е. придется «открыть» наши ящики Ki KN- Покажем прежде всего, что все состояния U = P[f\ обладают одной и той же энтропией, т. е. что Р^-ансамбль удается обратимо перевести в Рдо-ансамбль без затраты или получения тепловой энер- энергии (механическую энергию придется, естественно, затратить или вы- выиграть, если только средние значения энергии в Р^ и в Рщ различны), ср. прим.185) на стр. 267. Действительно, для этого нам вовсе не понадобится привлекать только что рассматривавшиеся газы — жела- желательное переведение удается выполнить и при температуре 0, т. е. с самими ансамблями. Следует также подчеркнуть, что как только это будет доказано, то мы сможем (и действительно так сделаем) пронормировать энтропии (/-ансамблей таким образом, что все со- состояния будут обладать энтропией 0. Впрочем, намеченное выше преобразование Р[<р] в Рщ не обязано даже быть обратимым, поскольку не будь оно таким, то разность энтропии должна была бы быть ^> выражения, приведенного выше, в прим. 189), следовательно ^>0; если мы переменим теперь Р^ и Р[ф], то точно так же получим, что оно должно быть ^0; поэтому оно равно 0. Простейшим способом было бы привлечь сюда зависящее от вре- времени дифференциальное уравнение Шредингера, т. е. наш процесс 2., для чего следовало бы найти некоторый оператор энергии Н и чис- ленное значение t такие, чтобы унитарный оператор е п пере- переводил бы ср в ф. Тогда за t секунд Р^] сам по себе перешел бы в Рщ, процесс был бы даже обратимым и о тепле не было бы и речи (ср. V. 1). Мы предпочтем, однако, уклониться от каких-либо допу- допущений о возможных формах оператора энергии Н и будем применять только процесс /., т. е. воздействия типа измерения. Самым простым, что можно было бы придумать, было бы тогда измерение в ансамбле Р[<р] некоторой величины Ш, оператор которой R имел бы чисто дискрет- дискретный спектр с одними лишь простыми собственными значениями Xj, X2 притом так, чтобы ф встретилась бы среди его собствен- собственных функций ф1, ф2 например ф: = ф. Поскольку при таком изме- измерении состояние f преобразуется ведь в смесь фр ф2 то возникает и состояние ф. Тем не менее это нецелесообразно, поскольку ф: = ф возникает лишь с вероятностью | (ср, ф) |2, в то время как доля 1 — | (ср, ф) |2 переходит в другие состояния, и для ортогональных ср и ф эта доля даже составляет целое. Несмотря на это, сходный прием приведет нас к цели: путем последовательного выполнения большого
2] ТЕРМОДИНАМИЧЕСКИЕ ВОПРОСЫ 271 числа различных измерений мы переведем Р^} в такой ансамбль, ко- который сколь угодно мало отличается от Рщ. То, что все эти опе- операции необратимы (или по меньшей мере могут оказаться такими), будет, как мы уже замечали выше, несущественно. Мы будем считать ср и ф ортогональными, так как иначе мы могли бы выбрать ортогональное к обоим x(llxll==!0 И перейти сперва от ср к х> а затем от х к Ф. Пусть & = 1, 2, ... будет числом, которым мы еще должны распорядиться, и положим Очевидно, что Ф@) = ср, ^к} — ^ и что всегда ||t]/v)|[ = l. Каждую из Ф(У) (v== I, ..., k) мы дополним до полной ортонормированной си- системы Ф(А Фг', ... с (|4v) = i|/v\ Пусть /?w будет оператором с чисто дискретным спектром и всеми различными собственными значениями, например Xjv), Х^, ..., для которого $\ ф?\ .. . будут собствен- собственными функциями; соответствующей величиной пусть будет 9t(v). Заметим еще, что Теперь мы измерим в ансамбле с ?/<°> ==/3r.@)i==P[<P] величину благодаря чему возникнет ?/A), затем в UA) — величину 3i<2), благодаря чему возникнет /7<2) наконец, в U{k~l) — величину 5И(А), благодаря чему возникнет U . Что для достаточно большого k U будет сколь угодно близок к Рг,щ—Р можно пояснить следующими нагляд- наглядными соображениями. Когда мы измеряем 3i(v) в ^~1\ то в фм пере- переходит доля Кф''', (j)(v))|2 = (cos -^-J • Следовательно, при последо- вательных измерениях величин 91A), 5И<2) Ш(к) из Ф@) = ср через посредство ФA), ФB) ф'*' перейдет в Ф = '1)<А) по меньшей мере доля Icos-oTr) • ^ поскольку при k->yo (cos-gT-l ->1, то воз- возникнет почти одно лишь Ф, если k достаточно велико. Строгое до- доказательство проходит следующим образом: Поскольку процесс /. не
272 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V меняет шпура, то, в силу Spur ?/@) = SpurP(?]= 1, будет Spui t/ ' = = Spurt/B) = ... =Spurt/<y)= 1. С другой стороны, следовательно, для v = 1, .... А—1 и / = <|4V+1) = <|/V+I) или же, соответственно, для v = A и / —<]/j ' = <]/ '==ф будет n \2 — COS 77 Вместе с это дает Поскольку Spur/7<A) = 1 и (cos-^-) -> 1 при А->со, мы можем применить результат, найденный в 11.11: U сходятся к Р№]. Наша цель достигнута. Теперь мы должны обсудить вопрос о том, в каких пределах можем мы опираться на такое вспомогательное средство, как «мыс- «мысленные эксперименты» феноменологической термодинамики, также и при рассмотрении квантовомеханических систем; именно, мы имеем в виду вопрос о так называемых полупроницаемых стенках. В феноменологической термодинамике имеет место теорема: Если / и II —два различных состояния одной и той же системы S, то до- допустимо принять существование такой стенки, которая для / пол- полностью проницаема, а для // — совершенно непроницаема193); это, так сказать, термодинамические определения различия, следовательно и совпадения, двух состояний. В какой мере допустимо подобное пред- предположение в квантовой механике? Докажем сперва, что если cpj, ср2, .... Цлх, <]>2, ... —ортонормиро- ванная система, то существует полупроницаемая стенка, беспрепят- беспрепятственно пропускающая систему 5 в каждом из состояний cpj, cp2, ... и отражающая ее в неизменном виде в каждом из состояний <Jij, ф2, ... 183) Ср., например, прим. 184) на стр. 266.
2] ТЕРМОДИНАМИЧЕСКИЕ ВОПРОСЫ 273 Напротив, системы, находящиеся в других состояниях, могут при со- соударении со стенкой даже и измениться. Систему срр ср2 фр фя, ... можно принять за полную, так как в противном случае ее можно было бы завершить в полную добавле- добавлением дальнейших функций ^:, %2 .... которые можно было бы при- причислить, например, к cpj, ср2, ... Выберем теперь оператор R с чисто дискретным спектром и лишь простыми собственными значениями Хг Х2 (jlj, ji2 собственными функциями которого могли бы быть cpj, ср2 фр ф2, ..., и пусть при этом будут все Хл < О, а все (а„ > 0. Пусть к оператору R относится величина 5Я. Прорежем в стенке много окошек, каждое из которых устроено следующим образом: Когда любая из «молекул» Kv ..., KN нашего газа (мы снова рассматриваем теперь /7-газ при температуре Т > 0) попадает в окошко, она там задерживается, открывается, в содержащейся в ней системе 5j или ... или SN измеряется величина 5Я, затем ящик снова закрывается, и, судя по тому, оказалась ли измеренная величина 91 < 0 или же > 0, ящик вместе с его содержимым и без изменения импульса пропускается через окошко или же отражается. То, что такое устрой- устройство достигает желаемой цели,-—это ясно; остается только обсудить, какие изменения остаются в нем после таких соударений и не род- родственно ли оно в какой-либо степени так называемому «максвеллову демону» термодинамики194). К первому вопросу следует сказать, что поскольку при извест- известных обстоятельствах Й-измерение меняет состояние 5, следовательно и математическое ожидание ее энергии, то по смыслу первого начала эта разность механической энергии должна быть предоставлена или, наоборот, воспринята измерительной установкой (например, путем использования пружины, которая будет при этом ослаблена или, на- наоборот, напряжена сильнее, или каким-нибудь аналогичным образом). Так как здесь идет речь о совершенно автоматически функционирую- функционирующем измерительном механизме и так как преобразуются только ме- механические (не тепловые!) энергии, то, конечно, мы не встретимся здесь ни с какими изменениями энтропии, что единственно важно для нас сейчас. (Находись S в одном из состояний cpj, ср2, ..., ф1# <]>2, ..., 91-измерение вообще не изменит 5, и потому в измерительном аппа- аппарате вовсе не останется компенсирующих изменений.) Второй пункт гораздо опаснее; наше приспособление несколько напоминает «максвеллова демона», т. е. полупроницаемую стенку, пропускающую летящие справа молекулы, но отражающую летящие слева. Вставь мы подобную перегородку посередине наполненного газом сосуда, вскоре весь газ собрался бы на левой стороне, ж) Ср. прим. 185) на стр. 267. Читатель найдет исчерпывающую дискус- дискуссию связанных с понятием «максвеллова демона» трудностей у L. S г 11 & г а'а, Zs. f. Phys. 53 A929). 18 И. Неймм
274 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V т. е. объем уменьшился бы вдвое без затраты энтропии. Это озна- означало бы нигде не компенсирующееся уменьшение энтропии газа, по- поэтому по второму началу термодинамики такая стенка не может су- существовать. Все же наша полупроницаемая стенка отличается от этой, термодинамически недопустимой, весьма существенно в том отношении, что она принимает во внимание только внутренние особенности «мо- «молекул» AT]. .... KN (состояние заключенных в них систем 5t SN), а не внешние (движутся ли они справа или слева и т. п.). Как раз от этого все и зависит. Подробный анализ этого вопроса стал воз- возможен на основе исследований Сциларда, которые прояснили природу полупроницаемых стенок, «максвеллова демона» и вообще роль «вме- «вмешательства разумного существа в термодинамические системы»; мы не можем вдаваться здесь в эти вещи подробнее, тем более что чита- читатель найдет исчерпывающее изложение этого вопроса в упоминаемой в прим. 194) работе. Проведенные рассуждения показывают, в частности, что два со- состояния системы 5 безусловно можно разделить полупроницаемыми стенками, если эти состояния ортогональны. Мы хотим показать теперь обратное: если ср и ф не ортогональны, то допущение подобной полу- полупроницаемой стенки противоречит второму началу. Это значит, что необходимым и достаточным условием разделимости полупроницае- полупроницаемыми стенками будет (ср, 40 —О, а не ср=?ф, как в классической тео- теории (мы пишем ср и ф вместо использовавшихся выше / и //). Тем самым разъясняется старый парадокс термодинамики в ее классической форме, именно, досадное отсутствие непрерывности при оперировании с полупроницаемыми стенками: сколь угодно слабо различные состоя- состояния все еще поддаются 100-процентному разделению, а абсолютно тождественные — не поддаются вовсе. Теперь мы имеем дело с не- непрерывным переходом, поскольку 100-процентная разделимость со- сохраняется лишь при (ср, 40 = 0, а при растущем (ср, ф) она становится все хуже. Состояния же ср и ф становятся идентичными только при максимальном (ср, ф), именно при |(ср, ф)|=1 (ведь ||ср[| = ||<]*|| = 1, поэтому из JСер, 40|=1 следует, что cp = c<J», где с — постоянная и |с|—1), и тогда разделение совершенно невозможно. Чтобы провести обещанное рассуждение, нам придется заимство- заимствовать конечный результат этого параграфа — значение энтропии для {/-ансамбля. Естественно, что мы не будем использовать этого ре- результата при его выводе. Итак, допустим, что существует полупроницаемая стенка, разделяю- разделяющая ср и ф; должно быть выведено, что тогда (ср, ф) = 0. Рассмотрим -я- (Р[9] -j- Р[ф])-газ (т. е. состоящий из -к- систем в состоянии ср и-д~ систем в состоянии ф; шпур такого оператора равен 1) и выберем 7° (т. е. К) и Т так, чтобы он был идеальным. Пусть АГ имеет изобра-
ТЕРМОДИНАМИЧЕСКИЕ ВОПРОСЫ 275 4a женное на рис. 3 продольное сечение 12341; на одном конце мы вставляем в него нашу полупроницаемую стенку аа и сдвигаем ее затем до середины (положение bb); температура газа должна при этом поддерживаться постоянной за счет контакта с большим тепло- тепловым резервуаром W температуры Т на другом конце 23. С ср-мо- лекулами при этом процессе не происходит ничего; ^-молекулы же, напротив, оттесняются в правую половину К (между bb и 23). Иными словами, если рассматривать -^-(Р^ + Р^-газ как 1:1-смесь Р|<Р]-газа и Р[ф]-газа, то с первым не происходит ничего, а второй ока- оказывается изотермически сжатым до половинного объема. Из уравнения состояния идеальных газов следует, что при этом процессе будет совер- N шена механическая работа-^- хТ In 2 (N -к это число молекул Рда-газа, а V- — постоянная БольцманаI95), и, поскольку энергия газа (из-за изотер- мии) не меняется196), это количество энергии возьмет себе тепловой резер- резервуар W. Увеличение энтропии резервуара составит, следовательно (ср. прим. 186) на стр. 267), ^ — №- у1- После этого процесса слева от bb содержится половина перво- первоначального Р^-газа, т. е. Af/4 молекул; справа же от bb — половина первоначального Р[9]-газа, т. е. Af/4 молекул, и весь Pm-газ, т. е. N/2 молекул, — т. е. всего ZN/4 молекул [-gP[f] -\~~ъР\Ф] раза. Сожмем и соответственно расширим эти газы до объемов ~т п ~т > причем соответствующая механической работе энергия опять перейдет к тепловому резервуару W (или будет заимствована у него). Эта / а b Рис. 3. 195) Если идеальный газ состоит из М молекул, то его давление р = Му.Т Поэтому при сжатии от объема V{ до объема V2 будет совершена механи- механическая работа J В нашем случае М= N = т и т\ = v. 196) Как известно, энергия идеального газа зависит лишь от его темпе- температуры. 18*
276 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V работа составит -j-xTln2 или -j-xTln-y (ср. прим. ш) на стр. 269), и, следовательно, энтропия резервуара возрастет на Nx • -у In 2 или, со- 3 3 ответственно, на —N% • -j In -^. Все вместе составит 2+| In 2- Итак, в результате мы пришли к одному Р(<р]- и к одному n , 2n \ N 3N ^l?] i ТНФ1 )"газам из -j-и, соответственно, -j- молекул, зани- занимающих объемы -j- и —?-. Первоначально же у «ас был один i) P\t\-\-itР[<1>])-газ из N молекул в объеме V или, что то же, два / 1 п . 1 D \ N 3N , V 3V \~2 "lf\ ~г ^W раза из -j- и -j- молекул в объемах -т- и -j- соответственно. Таким образом, весь процесс привел к следующим N V 11 1 \ изменениям: -j- молекул в объеме -т- перешли из I -^ P[f] ~)~ ~о Р\$\ V газа в Я[<р]-газ; —г молекул в объеме —^- перешли из \-кР\^\ Н-тгЛ /1 2 \ газа в (-jr/%;-|--д-Р[ф] 1-газ; к энтропии резервуара W добавилось Nv. • -j- ln у. Поскольку процесс обратим, то полное увеличение энтро- энтропии должно составить 0, т. е. изменения энтропии обоих газов должны как раз скомпенсировать увеличение энтропии W. Поэтому нам надо еще знать изменения энтропии газов. Как мы увидим, энтропия /7-газа из М молекул составляет — My- ¦ Spur(t/ ln U), если энтропия Р1х]-газа того же объема и той же температуры нормирована на нуль (ср. выше). Поэтому, если U обла- обладает чисто дискретным спектром с собственными значениями wlt w.2 со то это составит—Mv. ¦ 2 iwn\nwn (при этом xlnx следует считать л = 1 равным 0 для х = 0). Теперь, как легко сосчитать, операторы Р^], ¦o^wbf^l и ("J Л?1 ~Ь з" ^Ф!) обладают собственными зна- чениями 1,0 или, соответственно, —i—,—„— ¦ 0 или- соответственно, следовательно >0
2] ТЕРМОДИНАМИЧЕСКИЕ ВОПРОСЫ 277 и < 1), из которых 0 во всех случаях бесконечно кратен, а осталь- остальные однократны197). Поэтому энтропия газов возрастает на о л Добавляя сюда еще и увеличение энтропии Ny. • х^Т РезеРвуара W, мы должны получить 0. Если разделить все на N-/.JA, то получится 6 21п 6 г A+аIп^+2A-аIп-Ь^ + причем 0 ^а^ 1. 1 = 0, 197) Определим собственные значения оператора (йЯ[. + *Лф]). Должно быть и, поскольку левая часть является линейной комбинацией f и ф, то такой будет и правая, следовательно и /, если \ ф 0. X = 0 наверняка будет соб- собственным значением бесконечной кратности, так как к нему будет относиться любая /, ортогональная к ? и ф. Поэтому достаточно рассмотреть ХфО и /=х<?-\-у<\> (? и ф должны быть линейно независимы, так как иначе <р = сф, | с | = 1, т. е. два состояния тождественны). Тогда выписанное выше уравнение будет гласить т. е. а• х-\- а{% 4j)-y = \-x, b (<?, ф) • х-f- * • У = Детерминант этих уравнений должен обращаться в нуль: X2 —(a + 6)X-fa;6(l —a2) = 0; а-\- b ±V{a + by — Aab (\ —a^) a + * ± /(a — Если теперь положить здесь a=l, 6 = 0 или а = -н-, *=="q'» или а = Т' 2 й = -~-, то получатся формулы текста. о
278 общее рассмотрений [Гл. v Легко заметить, однако, что левая часть здесь При а, изменяю- изменяющемся от 0 до 1, монотонно возрастает198), именно от 0 до 31п-~-; поэтому должно быть <х = 0 (для а Ф О процесс, обратный описан- описанному, уменьшал бы, вопреки второму началу, энтропию!). Тем са- самым утверждение (ср, ф) = 0 доказано. После этих предварительных рассуждений мы подошли к тому, чтобы определить энтропию некоторого /7-газа из N молекул 198) Так как (х\пх)' = \пх-\-1, следовательно 1±1 m 1+1 + 1=1 In 1=1 V 2 + 2 in^ ± 2 J 1 Л 1Н \ 1/ 1— у то производной нашего выражения будет -з.11п3+ 2 3 — 1-е Утверждение, что она > 0, означало бы, что . 1 + « 2а . 34-/14-8а2 In ' > In ~r ' 1—а /1_(_8а2 3 — ] т. е. что о о Мы докажем последнее неравенство даже с -^- на месте -=-. Тогда, в силу о 1 — р2 = -д- A — а2) и а < р (второе следует из первого из-за а < 1), неравен- неравенство будет утверждать, что ln 1п 2а '" 1-а > 2Р Ш"Ь^рГ' Оно будет гарантированно выполняться, если мы выясним, что щ 2л; П1— х будет монотонно убывать в 0 < х < 1, что можно, например, видеть из раз- разложения в ряд
ТЕРМОДИНАМИЧЕСКИЕ ВОПРОСЫ 279 в объеме Т и при температуре Т, точнее присущий ему избыток энтропии сравнительно с Р[?]-газом при тех же условиях. Та же ве- величина будет тогда, согласно нашим прежним замечаниям и в рам- рамках избранной выше нормировки, также и энтропией /7-ансамбля из N отдельных систем. Spuri/ мы будем, как уже говорилось выше, считать равным 1. В таком случае U обладает, как мы знаем, чисто дискретным 1 спектром wv w2, р wl -f- w2 -f- .. • = 1. б а а Ъ Ъ 1 С | с d d 5 Рис. 4. Соответствующими собственными функциями пусть будут cpj, ср2, со тогда U = 2 wn P[f i (CP- IV. 3). Тем самым наш /7-газ является смесью Р[Ь]-, Р[ъГ< •• --газов из w1Nv т г j ?е>2М,, ... молекул соответственно, за- заключенных все в один и тот же объем У. Пусть Т и Т опять таковы, что все эти газы идеальны, а К обладает прямо- прямоугольным сечением. Чтобы разделить срг, ср2-, ...-молекулы друг от друга, предпримем следующие обратимые воз- воздействия (рис. 4). Пристроим к К B3452) второй, такого же размера, прямоугольный ящик К' A2561) и заменим общую стенку 25 двумя тесно прилегающими стенками, одна из которых B5) пусть будет неподвиж- неподвижной и полупроницаемой, именно проницаемой для cpt и отражающей для ср2, ср3, .... а вторая (bb) — подвижной, но обычной, совершенно непро- непроницаемой, стенкой. Далее, вдвинем в положение dd, тесно прилегаю- прилегающее к 34, еще одну полупроницаемую стенку, на этот раз прони- проницаемую для ср2, ср3 но отражающую <ра. После этого мы сдвинем bb и dd, сохраняя их относительное расстояние неизменным, до по- положений аа и се (т. е. вплотную к 16 или к 25). Эти действия совсем не затронут ср2-, ср3-, ...-молекул; молекулы же cpj, напротив, будут вынуждены все время оставаться между подвижными стенками bb и dd; поскольку расстояние между ними постоянно, то нам не пона- понадобится затрачивать работы (против давления газа), и потому ника- никаких тепловых процессов не произойдет. В заключение мы заменим стенки 25 и ее неподвижной, совершенно непроницаемой стенкой 25 и удалим аа, в результате чего будут снова созданы ящики К и К'. Лишь все tpj-молекулы будут теперь находиться в /С, т. е. мы «от- «отцедили» их обратимым образом без какой-либо затраты работы, пере- передачи тепла или изменения температуры из К в такой же ящик К1199J- 19?>) Ср. в связи с этим, характерным для феноменологической термо- термодинамики искусственным трюком, например, прим.184) на стр. 266.
i 280 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V Точно так же мы «отцедим» ср2-, ср3-, ...-молекулы в одинаковые ящики К", К'", ... и придем, наконец, к Р[91]-, P[9l)-. ...-газам, состоящим из w{N, w2N, ... молекул, каждый в объеме Т. Теперь мы сожмем их изотермически до объемов w{P, w{P, ... соответ- соответственно, для чего нам придется подвести из большого резервуара (температуры Т, чтобы процесс был обратимым) количества тепла wxN%'l\nwv w2Nv. ¦ Т In w2, ¦•¦ (все они < 01), так как механические работы сжатия отдельных газов как раз равны этим величинам с обрат- обратным знаком (ср. прим. ш) на стр. 269). Итак, увеличение энтропии со при этих процессах составит 2 WnNn-lnw,,. Наконец, переведем в за- л = 1 ключение все Р[ь\-, Р[<р2]-> ¦ ¦ .-газы в один Р^-газ (ср — произвольное состояние). Итак, мы получили теперь сплошь Р^-газы, состоящие из wxN, w2N, ... молекул и заключенные в объемы w{V, w27*, ... Поскольку все они идентичны и обладают одинаковой плотностью (N: Т), то их можно смешать, не нарушая обратимости, и у нас возникнет один Р^-газ из Af молекул в объеме Т (из-за Тем самым желательный обратимый переход выполнен. Энтропия оо при этом увеличилась на ./Vx 2 wn ln wn- и поскольку в конечном состоянии она равна (по нашей нормировке) 0, то в начальном со- оо стоянии она равнялась — N% 2 wn In wn. л=1 Поскольку оператор U обладает собственными функциями cpj, tf>2> ••• с собственными значениями wv w2, ..., то U In U будет обладать теми же собственными функциями, но с собственными значе- значениями WjlnWp w2\nw2, .... и, следовательно, Spur(t/ In t/) = оо = ^ wnlnwn. Заметим, что ¦к>п^0, ^1, значит wn In wn ^ 0 и п=г притом =0 лишь для wn = 0,l,—что для т2>„ = 0 надо брать зна- значение •да„1п'да„ = 0, видно из того что в нашем рассмотрении не нужно учитывать обращающихся в нуль wn; впрочем, соображения непрерывности приводят к тому же. Итак, мы определили, что энтропия состоящего из ./V отдельных систем /7-ансамбля составляет —N% Spur(U In U). Сказанное ранее относительно wnlnwn показывает, что она всегда ^0 и для равен- равенства нулю все wn должны быть =0 или 1. Поскольку Spur/7—1, то при этом в точности одна wn = 1, все остальные = 0, т. е. U — P[9). Итак, только U = Р((р;, т. е. только состояния имеют энтро- энтропию = 0, все остальные смеси имеют энтропии > О-
S] ВОПРОСЫ ОБРАТИМОСТИ И РАВНОВЕСИЯ 281 3. Вопросы обратимости и равновесия Теперь мы можем заняться доказательством высказанного в V. 1 утверждения о необратимости процесса измерения. Если, например, U — состояние, U = P[f\, то в результате измерения некоторой вели- величины Ш, оператор R которой обладает собственными функциями ср1( ср2, ..., оно переходит в ансамбль U> = J2 {РШп, 9п) ¦ РЫ = Д | (?, 9п) |2 Р[9пу и если W — не состояние, то при этом происходит возрастание энтро- энтропии (энтропия U была 0, а энтропия U' будет > 0), так что процесс необратим. Но чтобы U' было состоянием, следовательно было Ры и где cp?i —ег0 собственные функции, должно быть |(ср, ср„)|2=О для всех ср„, исключая одну (для нее — 1), т. е. ср должна быть орто- ортогональна ко всем срл, пфп. Но тогда ср = сср_, причем |с| = 1, сле- _ п довательно ^^ = ^^1 и U = U'. Итак, всякое измерение в состоя- состоянии необратимо, исключая случай, когда собственная функция из- измеренной величины (т. е. эта величина в данном состоянии) имеет точное значение, когда измерение вообще не меняет состояния. Как мы видим, акаузальное поведение однозначным образом связано по- поэтому и с определенными сопутствующими термодинамическими явле- явлениями. Мы хотим обсудить теперь с полной общностью, когда процесс оо /. U->U' =2 С^Ри' 9п) ¦ Р\? ] повышает энтропию. Ансамбль U обладает энтропией — Me Spur (U In U), и если •Ш], w2, ...—его собственные значения, а фх, ф2- •••—собственные функции, то это равно оо со - Мс 2 wn In wn = - TV/ 2 т„, ф„) In (U%, фя). n=l л=1 Что до U', то он обладает собственными значениями (f/tp2, cp2), ..., следовательно его энтропия равна со -Me 2 (?/?„, <ряIп(?/<р„, ср„). Поэтому энтропия ансамбля U^ энтропии W в зависимости от того, будет ли оо со 2 №• ф„) In (Щп< Ф„) Ш 2 П-1 Л=1
282 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V Покажем сперва, что в *, во всяком случае, выполняется знак ^-, т. е. что процесс ?/->?/' не уменьшает энтропии; хотя это и ясно термодинамически, тем не менее для наших дальнейших целей будет важно обладать и чисто математическим доказательством этого обстоя- обстоятельства. Именно, мы будем считать U, а вместе с ним и фц, ф2, ... фиксированными, а систему срр ср2> ••¦ —пробегающей все возможные полные ортонормированные системы. Мы можем сперва ограничиться из соображений непрерывности такими системами срр ср2 в которых только конечное число функ- функций ср„ отличны от соответствующих функций <|)„. Итак, пусть, напри- например, для п > М всегда ср„ = <|)л. Тогда функции срп с п^.М будут линейными комбинациями функций ф„ с п ^М и наоборот, т. е. м 2*. 1 л=1 „<!>„ (т=1, ..., М), и М-мерная матрица {хтл} очевидно фт) = 'Шт и, как легко вычислить, унитарна. Выполняется м так что требуется доказать, что м м / м т = 1 т т нг=1\л=1 |2 Aи = 1 М). х„ 1п 2 л=1 Поскольку правая часть является непрерывной функцией М2 ограни- ограниченных переменных хтп, то она имеет максимум и ([хтп\ унитарна!) принимает его; так как левая сторона является значением правой для 1 для т = п, О для т ф п, то остается показать, что названный максимум осуществляется как раз для этой системы переменных хтп. Итак, пусть х°тп (т, п = \, .... М) — те значения переменных, для которых осуществляется максимум. Если перемножить матрицу [х°т п} с унитарной матрицей a, J3, 0, . О ' -р". а, 0, . О 0,0, 1, . О * • • • 0.0.0. . lj
ВОПРОСЫ ОВРАТИМОСТИ И РАВНОВЕСИЯ 283 то получится унитарная матрица {-tf^J. т. е. опять допустимая си- система переменных хтп. Пусть, именно, a = "jA—8s, J3 = &e (е веще- вещественно, |&| = 1) и- е мало, так что в дальнейших вычислениях мы будем учитывать только члены порядка 1, е, е2, а членами порядка е3, s4, ... —пренебрегать. Тогда а» 1 —-^-е2, ив новой матрице \х' } будет х' —jk° Хтп— Хтп (т > 3), и, следовательно, далее м м л \п f м S Re м м 2>л| л=1 ' м п = М Подставляя эти выражения в f(x) = x\nx, учитывая при этом, что и выполняя сложение, мы получим М / М М I М \ / М \ SlS «„ I х'тп I2 Ьп I У w, I *' I2 » rt«l Vn=l / \л«1 / \ / М \ n I Хтл | I Ш I 2U n I mn I / V / M M M
284 ОБЩЕН РАССМОТРЕНИЕ [ГЛ, V (М М \ 2%ki2-5Xki2 + л=1 л-1 / +±/ ^+ ^\'л 15XKI' 2XKI2 Г-1 \л=1 л=1 / Чтобы первый член справа осуществлял максимум, коэффициент при е должен = 0, а коэффициент при е2 быть <[0. Первый из них содержит два множителя, м \ / м л=1 Будь первый из них = 0, в коэффициенте при е2 первый член будет = О (он всегда ^0), так что второй член, который, очевидно, всегда ^г- О, должен будет обратиться в нуль, чтобы весь коэффициент был <^ 0. м _ _ Это означает, что У\ 2™Refftx? x2 ") = 0, т. е. второй множитель П— I в коэффициенте при е должен тогда тоже = 0, что можно записать также и в форме 2Re( &2 wnx°inx2n ) = 0- Поскольку это условие \ л=1 / переходит, при соответствующем выборе &, на абсолютную величину м м _ суммы 2 • т0 она должна обращаться в нуль: 2 ^л^л^гл== ^- Поскольку мы могли бы поставить на место 1 и 2 любые два различных А, /=1 М, то получается М ^j W Х^ X® ~""" 0 ДЛЯ л=1 Но это значит, что унитарное преобразование координат с матри- матрицей {х0Л преобразует диагональную матрицу с диагональными эле- элементами wv .... wn снова к диагональной форме. Поскольку диаго- диагональные элементы являются мультипликаторами (или собственными значениями) матрицы, то при преобразовании координат они не ме- меняются, а могут, самое большее, переставиться. До преобразования
ВОПРОСЫ ОБРАТИМОСТИ И РАВНОВЕСИЯ 285 это были величины wm(m=\ М); после преобразования это м м будут величины 2 wn \ х%„ |2 (т= I, .... N). Итак, суммы 2 wn 'n wn л=1 л=1 и 2J ния, т. / м 2 ЧЛ=1 е. при ran -,„ / м B \л=1 тл == ¦Ш л ¦{i пгп ДЛЯ ДЛЯ 2 j имев т — п, т Ф п имеют те же самые значе- осуществляется максимум, как то и утверждалось. Установим теперь, когда в соотношении * имеет место знак равенства. Когда это выполняется, сумма л=1 будет принимать максимальное значение не только для )(„ = ф„ (я=1, 2, ...) (собственных функций оператора U, ср. выше), но и для Хл = сРл (#=!• 2, ...). (Считаем, что Xi> Хг> ••• пробегают все полные ортонормированные системы.) В частности, это выполняется, если унитарное преобразование испытывают только М первых <рл (т- е- если in = ?п Для п > М). Пусть итп = (t/cpm, <р„) («, ге = 1 Ж), г>! vM будут собственными значениями конечной (а также и эрмитовой и дефинитной) матрицы {итл}, а {атл} (т, п—1 М)— матрицей, приводящей {итп} к диагональному виду. Функции cplt . .., ум м пусть она переводит в <ov ..., wM, ym = 2 amnwn (m =r ^ ^)> л=1 тогда t/ш- = г;яа)„, следовательно, для т = п. для ж Для ? 2 хтпфп(т— 1 1 2 л=1 ной) будет, следовательно, (Щк, ж = 2 м 2 пусть тоже будет унитар- _ vnxknxjn- Поэтому, согласно допущению о ?1 9м, величина 2 ( 2 vn\xmn\2)ln 1 \1 2 Л=1 м 2 Л=1 принимает максимум при хт м ства отсюда следует 2 vnaknajn = Q Для ДЛЯ k ф j, k, j =а 1 М. \ / / о.тп. В силу предыдущего доказатель- т. е.
286 ОБЩЕЕ РАССМОТРЕНИЕ Р"Л. V Это должно выполняться для всех М; следовательно, U<pk орто- ортогональна ко всем еру, кф], поэтому равна w'k<pk (w'k — константа). Тем самым cpj, (р„, ... оказываются собственными функциями U с соб- собственными значениями w'v w'2, ... (т. е. с перестановкой собственных эначений wv w2, ¦. ¦)• Но при таких обстоятельствах оо оо w=2 (</*.. ?„) ¦ рш=2 •; • рш = а Итак, мы нашли, что Процесс /., U —>U' =* ^ (?Лр„, <р„) • Яг? i (?i> <Р2> • • ¦ — с°б- ственные функции оператора fi измеряемой величины Ш) никогда не уменьшает энтропии; он даже увеличивает ее всегда, исключая слу- случай, когда все yv <jS2. ... являются собственными функциями U, т. е. когда U = U'. Впрочем, в этом случае U коммутирует с R, и это тоже харак- характерно для того, чтобы такой случай имел место (поскольку коммута- коммутативность равносильна существованию системы общих собственных функций ср!> <р2, .... ср. II. 10). Итак, процесс /. необратим во всех случаях, когда он вообще приводит к каким-либо изменениям. Теперь мы должны рассмотреть вопросы обратимости при про- процессах /. и 2. независимо от феноменологической термодинамики, как то было прокламировано в V. 2 в качестве второго пункта про- программы. Математический метод, с помощью которого это может удаться, мы уже знаем: Если выполняется второе начало, то энтропия должна равняться — Nv. Spur (U In U), и эта величина не вправе умень- уменьшиться ни, при каком процессе /. или 2.. Поэтому нам надо рассмо- рассмотреть теперь—Nv. Spur (U In U) как чисто математическую величину, независимо от ее толкования как энтропии, и выяснить, что проис- происходит с ней при /. и 2. 2о°). -Ы.т 24-м При процессе 2. из U возникает Ut = e h Ue* , т. е. если обозначить унитарный оператор в h ' через A, U-*¦ Ut= AUA^1. Поскольку в силу унитарности А замена f—>¦ Af осуществляет изо- изоморфное отображение гильбертова пространства само на себя, кбторое переводит каждый оператор Р в АРА, то вообще F(APA~1)=AF(P) А'1. Поэтому Ut\n Ut~ A-U In U • А'1. Отсюда Spur (Ut In Ut) — Spur (U In U), т. е. наша величина — TV/. Spur (U In U) сохраняется при 2. постоянной. Что происходит с ней при /., мы 2|>°) Мы, естественно, могли бы опустить здесь множитель N% и рассма- рассматривать просто — Spur (U In U) или же, чтобы сохранить пропорциональность числу элементов N, величину — N Spur (I/ In U).
31 ВОПРОСЫ ОБРАТИМОСТИ И РАВНОВЕСИЯ 287 только что (и притом без ссылок на второе начало) выяснили: если U при этом меняется (т. е. U Ф U'), то она возрастает, при неизмен- неизменном же U (т. е. при U = U' или же при cpj, cp2 являющихся собственными функциями U, или же при коммутирующих U и R) она, естественно, тоже остается неизменной. Итак, при воздействии, составленном из многих процессов /. и 2. (в произвольных числе и порядке), —Nx Spur (U In U) остается, следовательно, неизменной, если каждый из процессов /. недействен (т. е. не совершает каких- либо изменений), а во всех остальных случаях — возрастает. Поэтому, если рассматриваются только воздействия /. и 2., то каждый из про- процессов /., который вообще что-либо меняет, необратим. Существуют, правда, и более простые выражения, чем—Spur (U In U), которые не убывают при процессах /. и остаются постоянными при 2., например, наибольшее собственное значение оператора U. В самом деле, при 2. оно, как и все собственные значения U', не меняется, при /. же собственные значения wv w2, ... оператора U переходят со оо в собственные значения 2 wn\xin]?< 2 wn I хы I2' ••• оператора U' л=1 л=1 (ср. рассмотрение этого параграфа), и, поскольку из-за унитарности СО матрицы [хтп\ будет выполняться 2 [х1л|2=1, 2 l*2nl2==l> •••• л=1 л=1 то все эти числа ^ наибольшего wn (наибольшее wn существует, со . поскольку все wn^Q, и из-за 2дал=1 должно быть •да„->0). л=1 / Поскольку безусловно можно изменить U таким образом, чтобы со величина — Spur (U In U) = —2 fnlnwn осталась бы инвариантной, л = 1 а наибольшее собственное значение wn уменьшилось бы, то видно, что существуют переходы, возможные с точки зрения феноменологи- феноменологической термодинамики,—которые, следовательно, действительно можно провести путем наших газовых процессов, но которые никогда не могли бы произойти лишь через посредство последовательного при- применения /. и 2.. Это показывает, что введения газовых методов нельзя избежать.. Вместо — Spur (t/ In f/) мы могли бы, конечно, рассматривать Spur(/7(f/)) для какой-либо подходящей F (х). Что последнее выра- выражение будет увеличиваться при /. для ЦфО' (Для t/ = t/', равно как и при 2., оно, естественно, останется инвариантным), можно доказать точно так же, как мы делали для F (jc) = — х In x, если только для функции F (х) будут выполняться те свойства, которые мы единственно использовали выше; именно, что /?"(jc)<0 и что
288 ОБЩЕЕ РАССМОТРЕНИИ [ГЛ. V F' (х) монотонно убывает (последнее, впрочем, следует из первого). Итак, для нашего нетермодинамического рассмотрения необратимости мы можем употребить любой Spur (Z7 (?/)), будь только F (х) выпук- выпуклая кверху функция, т. е. выполняйся /7"(jc)<0 (в интервале O^jc^I, поскольку в нем лежат все собственные значения U). В заключение следовало бы еще показать, что и смешивая два ансамбля U и V (например, в соотношении а: р, а > 0, р > О, а-(— р = 1) мы не придем к уменьшению энтропии, т. е. что — Spur ((aU + Ю In (aU + pF)) > — a Spur (U In С/)—р Spur (V In V). И это утверждение остается справедливым для всякой выпуклой функ- функции F(x) на месте —jclnjc; доказательство мы предоставим читателю. Займемся теперь розыском стационарно равновесной смеси, т. е. смеси максимальной энтропии при заданной энергии. Последнее надо, конечно, понимать в том смысле, что предписано математическое ожидание энергии, — только такое понимание будет соответствовать идее цитированных в прим. ш) (стр. 266) методов термодинамического исследования статистических ансамблей. Таким образом, допусти- допустимыми будут лишь те смеси, для чьих U выполняется Spur t/= 1 и Spur(t/H) = E, где Н — оператор энергии, а Е — ее предписанное математическое ожидание. При этих дополнительных условиях надо сделать —N% Spur (U In U) максимальной. Сделаем еще то упрощаю- упрощающее предположение, что Н обладает чисто дискретным спектром, именно, собственными значениями Wv W2, ... и собственными функ- функциями срх, ср2, ... (среди них могут быть и многократные). Пусть эт — некоторая величина, чей оператор R обладает теми же собственными функциями (рх, ср2, . •., но всеми различными собствен- собственными значениями. Измерение Ш преобразует U согласно 2. в [/' = оо = 2 (?ty»« 9n)P\v ]'• ПРИ этом —Me Spur (U In U) возрастает, a Spurt/ л=1 l ni и Spur(t/H) не изменяются — последнее из-за того, что ср„ — это собственные функции Н и, следовательно, (Нсрт, срл) для тфп обра- обращаются в нуль: Spur (t/'H) = Л (UVb, <ря) Spur (Рш И) = 2 (Щп. <р„)(Н<рл. т„)= 2 (UVm, «pe)(H?e. (Pm) = л=1 т, л=1 это должно выполняться и из-за коммутативности R и Н (т. е. из-за одновременной измеримости Ш и энергии). Поэтому искомый максимум будет таким же, как если бы мы ограничились операторами U', т. е. статистическими операторами с собственными функциями (р1Р <р2 и будет достигаться как раз на этих функциях.
ВОПРОСЫ ОБРАТИМОСТИ И РАВНОВЕСИЯ 289 оо Итак, пусть ?/=2 wnP\t i> и так как все операторы U, UH л=1 1 "' и U In U обладают собственными функциями <р„, но собственными значениями wn, Wnwn и wnlnwn соответственно, то речь идет о том, оо чтобы достичь максимума для —Л/х^] le^lnw,, при дополнительных л=1 со со условиях 2 wn ~ 1 и 2 ^л^л = Е. Но это в точности та же за- л=1 л=1 дача, что и встающая в соответствующей проблеме равновесия в обыч- обычной теории газов 201), и поэтому она решается так же. По известным правилам нахождения экстремумов, для максимальной системы чисел wv w2, ... должно выполняться =0. \m=l / \m = l где а и В— подходящие постоянные и га—1, 2, ... Это значит, что где вместо а введена постоянная а = е1. Из 2 ^л == ^ следует, что л=1 1 а = со л=1 ¦за е ОО 2 w -, и поэтому nwn = Е должно со л=1 со S t т — \ ВЫПОЛНЯТЬСЯ Q W? Р " что фиксирует, р. Если ввести, как обычно, «сумму состояний» 201) Ср. М. Plan k, Theorie der Warmestrahlung, Leipzig, 1913. 19 И. Нейман
290 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V (ср. сюда и далее прим. 197) на стр. 277), то будет P 2 „ л=1 и следовательно, условие для [3 будет гласить _ И р ' Z(p) ~с- (со с» Мы допустили здесь еще, что 2 e~pW" и ^ НР„е"р1^« сходятся л=1 л = 1 для всех Р > 0, т. е. что для п->со значения Wn->oo, и притом достаточно быстро. Например, хватит требования -=—-—>оо. j Для самого U возникает следующее выражение: iT«J SpurG?-^) -MM Итак, свойства равновесного ансамбля U, которые фиксируются заданием значения Е или J3, т. е. зависят, как то и должно было быть, от одного параметра, можно определить с помощью методов, обычных в кинетической теории газов. Энтропия нашего ансамбля будет равна = — Nx Spur (U In U) = — Nx Spur (-^- In а полная энергия 7VE = — N ¦ (эту полную энергию, а не саму Е надо ставить в параллель к S). Тем самым U, S и NE выражены через р. Вместо того чтобы выра- выражать р через Е, будет практичнее найти температуру Т равновесной смеси и свести все к ней. Это делается так: Приведем нашу равно- равновесную смесь в соприкосновение с тепловым резервуаром темпера- температуры Т', чтобы она могла перенять от него энергию NdE, при этом (по смыслу обоих начал) суммарная энергия не должна измениться,
3] ВОПРОСЫ ОБРАТИМОСТИ И РАВНОВЕСИЯ 291 а энтропия — уменьшиться. Тепловой резервуар теряет при этом энер- ,,.. NdE гию NdE, поэтому его энтропия увеличивается на =;-, и в то же время должно быть ^с NdE _ i dS С другой стороны, конечно, NdE^O, судя по тому Т'^Т, по- поскольку более холодные тела получают энергию от более теплых; поэтому Т' Щ Т означает, что NdE V т. е. что т, & N dE dS ~~ dS ' Поэтому т " d$ 1 — ds — т. е. ( 1 \ , Z (Р) / ич 0 Z'(P)\' 1 ' (P) V (P) ) Тем самым все величины U, S и Л/Е представлены как функции температуры. Аналогия полученных выше выражений для энтропии, равновес- равновесного ансамбля и т. п., соответствующим результатам термодинами- термодинамической теории, основывающейся на классической механике, сразу бросается в глаза. Прежде всего, энтропия — McSpur(?/ In U). Смесь оо U— 2 wnP[? ] — это смесь ансамблей Prf i, P\9y ... в соотноше- соотношениях ¦да1 : w2: ... , т. е. Nw1 систем cpj, Nw2 систем ср2, ... Больц- манову энтропию этого ансамбля можно получить с помощью «термо- N1 динамической вероятности» -rjj—чТТТТ—V ' она ^Удет Равна ее ч-кратному логарифму (прим. 201) на стр. 289). Поскольку N ве- велико, то мы вправе приблизить факториал формулой Стерлинга л:! яй }[2ъхе-ххх; тогда х 1п -^— " переходит в своей сущест- со венной частив —Л/х 2 "Wn\nwn, а это как раз и есть —McSpur(?/ln?/). я=1 19*
292 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V Далее, для равновесного ансамбля у нас было U — e *т / 1 \ (мы опускаем здесь численный множитель „ „ 1; это равно 2 « 1ТРы. т. е. представляет собой смесь состояний Р[9{]> Р[?2] т- е- смесь стационарных состояний с энергиями Wv W2, ... и с (относительными) весами е *т : е *т : . . . Если какое-либо собственное значение энергии многократно, например Wni= ... =Wn^W, то смесь Р[?п } + ... -+- Р[9] войдет w с весом e~/F> T- е- правильно нормированный ансамбль w +/V*i)(ср> начал0 IV-3>~C весом ve xT • Но как раз так и определяется классический «канонический» ансамбль (если отвлечься от появления специфически квантовомеханического образования — (Р + ••• -\-Р )', это так называемая теорема v v К] [?ni)J Больцмана (см. прим. т) на стр. 289). Для Т—>-оо веса е *т стремятся к 1, следовательно, наш U — со к 2 Р[чп\== ^• Таким образом, U=\ является абсолютным состоя- л= 1 нием равновесия в случае, когда нет энергетических ограничений, — результат, который мы уже получили в IV. 3. Мы видим, что «априорная равновероятность квантовых орбит» (имеются в виду простые, невырожденные; в общем случае кратность уровня является «априорным весом», ср. сказанное выше) возникает в этой теории сама собой. Стоит установить, сколь много может быть высказано относи- относительно равновесного ансамбля U заданной энергии нетермодинами- нетермодинамически, т. е. на основе только тех обстоятельств, что U стационарен (не меняется с течением времени, процесс /.) и что он остается не- неизменным при всех измерениях, не затрагивающих энергии (т. е. при измерениях величин, измеримых одновременно с энергией; про- процесс 2. с коммутирующими R и Н, т. е. с tpj, <p2 являющимися собственными функциями Н). Первое означает, в силу дифференциального уравнения -*т U = = -д- (UH — HU), только, что Н и U коммутируют. Последнее утверждает, что если <pj, cp2, ... можно использовать в качестве полной системы собственных функций для Н. то U = W, т. е.
4] МАКРОСКОПИЧЕСКОЕ ИЗМЕРЕНИЕ 293 <fv <p2, ... будут собственными функциями и для U- Пусть соответ- соответствующими собственными значениями Н будут Wx, W2 а для U — w1, w2, ... Если Wj=Wh, то мы можем заменить для Н 9j+<fk fj — fa функции tp;-, cpft на —j=—, ———; поэтому эти комбинации тоже будут собственными функциями U, откуда следует, что Wj = wk. Поэтому можно построить функцию F(x), удовлетворяющую F(Wn) = wn (л=1, 2, ...), и тогда будет F(H) = U- Ясно, что этого достаточно, равно как и то, что это повлечет за собой ком- коммутативность Н и U. Итак, на этом пути вполне выводится U = F (Н), однако уста- установить вид F (х) (т. е. что, как мы знаем, F{x)= 7... е~9х. Р = --т-) не удается. Из условий Spurf/= 1 и Spur(f/H) = E no- лучается еще, что но этими результатами метод исчерпывает себя полностью. 4. Макроскопическое измерение Хотя наше выражение для энтропии является, как мы видели, образованием, совершенно аналогичным классической энтропии, пред- представляется удивительным, что при временном развитии системы (процесс 2.) она остается постоянной и увеличивается только при измерениях (процесс /.), — в классической теории (где измерения вообще не играют роли) она ведь, как правило, увеличивалась уже при обычном механическом развитии системы во времени. Поэтому этот кажущийся парадокс нуждается в разъяснении. Нормальная процедура классической термодинамики протекает следующим образом. Берется сосуд объема 7°, в правой половине / v которого объем -=-, отделенный от другой половины промежуточ- промежуточной стенкой) находятся М молекул (ради простоты — идеального) газа температуры Т. Если мы расширим этот газ изотермически и обратимо до объема 7° (давая промежуточной перегородке ото- отодвинуться под действием давления газа, используя освобождающуюся механическую работу и поддерживая температуру газа постоянной большим тепловым резервуаром температуры Т), то энтропия вовне (в резервуаре) уменьшится на М%\п2 (ср. прим.195) на стр. 275), следовательно, энтропия газа на столько же возрастет. Если же,
294 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V напротив, мы просто вытянем перегородку, то газ продиффундирует в свободную левую половину, объем возрастет до 7°, т. е. энтропия увеличится на /ИхIn 2, без того, чтобы создалась какая-либо ком- компенсация. Процесс будет, таким образом, необратимым, и энтропия возрастет в ходе простого механического развития системы во вре- времени (именно, в ходе диффузии). Почему же наша теория не при- приводит ни к чему похожему? Соотношения становятся всего яснее, если положить Ж=1; для такого одномолекулярного газа термодинамика все еще справедлива, и то, что его энтропия возрастает на х In 2 при удвоении объема, это верно. Однако эта разница на х 1п 2 действительно есть лишь до тех пор, пока мы на самом деле не знаем о молекуле ничего более того, IP что она находится в объеме -^- или соответственно 7°. Если, напри- например, молекула находится в объеме 7°, но известно, расположена она справа- или слева от середины сосуда, то достаточно вставить посередине перегородку и дать молекуле оттеснить ее изотермически и обратимо к левому или правому концу сосуда. При этом будет совершена механическая работа чТ1п2, т. е. эта энергия отнимется от теплового резервуара. В результате молекула опять окажется в объеме 7°, однако мы уже не будем знать, располагается ли она справа или слева от середины, но зато произошло ведь компенси- компенсирующее уменьшение энтропии (в резервуаре) на ос In 2. Иными сло- словами, мы обменяли наше знание на уменьшение энтропии на х In 2 202). Можно сказать, что энтропия в объеме 7° будет такой же, что и в объеме -=-, если только известно, в какой половине сосуда рас- расположена молекула. Поэтому, если бы мы перед диффузией знали молекулу (т. е. ее положение и импульс) с полной подробностью, то для каждого момента после диффузии можно было бы вычислить, расположена она в правой или в левой половине, т. е. энтропия вообще бы не возросла. Только тогда, когда в нашем распоряжении имеется одна лишь макроскопическая информация, что первоначаль- ный объем составлял -у, в процессе диффузии действительно проис- происходит возрастание энтропии. Итак, для классического наблюдателя, знающего все импульсы и координаты, энтропия постоянна, а именно равна нулю, так как 202) Сцилард показал (ср. прим. 19<) на стр. 273), что это «знание» нельзя также и добыть дешевле, чем ценой компенсирующего увеличения энтропии на у.1п2: в общем случае *1п2— это «термодинамическая цена» знания, какой из двух альтернативных случаев осуществляется. Для любых попыток провести описанный выше процесс в случае, когда неизвестно, в какой половине сосуда находится молекула, можно доказать их несостоя- несостоятельность, хотя они и оперируют зачастую с весьма сложными автоматиче- автоматическими механизмами
4] МАКРОСКОПИЧЕСКОЕ ИЗМЕРЕНИЕ 295 больцманова «термодинамическая вероятность» (ср. выше, прим. 201) на стр. 289) равна тогда 1, — как раз как в нашей теории для со- состояний, U — Р[9], которые ведь тоже отвечают наибольшей возмож- возможной степени знаний наблюдателя относительно системы. Изменения энтропии со временем касаются, следовательно, той ситуации, когда наблюдатель знает не всё или может выяснить (изме- (измерить) не всё, что принципиально измеримо. Его чувства как раз позволяют ему воспринимать только так называемые макроскопиче- макроскопические величины. Это разъяснение изложенного в начале параграфа кажущегося противоречия налагает, однако, на нас обязанность найти для квантовомеханических ансамблей точный аналог классической амакроскопической энтропии, т. е. энтропии, рассматриваемой с точки зрения такого наблюдателя, который может мерить не все величины, но лишь некоторые избранные, именно — макроскопические, величины, да и эти — в зависимости от обстоятельств — только с ограниченной точностью. В III. 3 мы узнали, что все измерения с ограниченной степенью точности могут быть заменены абсолютно точными измерениями дру- других величин, являющихся функциями от них и обладающих чисто дискретными спектрами. Если 9t — такая величина, R — ее оператор, а X*1', Х(', ... — отличные друг от друга из числа ее собственных значений, то измерение 9t равносильно ответу на вопросы: «Равно ли 9t значению Х( ?», «Равно ли 9t значению Х()?», . . . Мы могли бы, ко- конечно, сказать и непосредственно: если величина ® с оператором 5 должна быть. измерена с ограниченной точностью, например надо рассудить, в каком из интервалов сл_,<Х^сл она лежит (. .. < с_2 < с_! < с0 < сг < с2 < .. .; сп->-\-оо или к — со при п->-\-оо или к —со), то речь идет об ответе на все вопросы: «Лежит ли ® в с„_! <Х<сл?», п = 0, ±1, ±2, ... Но таким вопросам соответствуют, согласно III. 5, проекционные операторы Е, чьи величины @ (принимающие только два значения О и 1) собственно и подлежат измерению. В наших примерах вели- величинами <& будут функции Fn(ffi), /г = 1, 2, .. ., где I 1 для Х = Х(Л), F (X) = | { 0 в остальных случаях, или же функции О„(®), /г —0, ±1, ±2 где 1 для с„_!<Х<;с„, { О в остальных случаях, а операторами Е будут соответственно Fn(R) или Gn(S). Итак, вместо того чтобы задавать макроскопически измеримые величины S> вместе с достижимой точностью измерения, можно задать вопросы @,
296 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V на которые могут ответить макроскопические измерения или же их проекционные операторы Е (ср. III. 5). Как раз это является отли- отличительным признаком макроскопического наблюдателя — задание его Е (классически мы характеризовали бы его, например, тем, что он в состоянии измерить в каждом кубическом сантиметре занимаемого газом объема температуру и давление — возможно с определенной ограниченной точностью, — но ничего другогоJ03). В самой природе макроскопического измерения заключено, что все, измеримое вообще, измеримо тотчас же, т. е. что все вопросы, на которые можно ответить макроскопически, тотчас же находят свой ответ; это значит, что все Е перестановочны друг с другом. Как раз потому ведь неодновременная измеримость квантовомеханических вели- величин и произвела сначала столь парадоксальное впечатление, что это понятие чужд.о макроскопическому образу восприятия. Благодаря боль- большому принципиальному значению этого пункта будет уместно обсу- обсудить его несколько подробнее. Представим себе яснее способ, которым две явно не измеримые одновременно величины, например координата q и импульс р (ср. III. 4), измеряются одновременно с ограниченной точностью. Пусть средними ошибками измерения будут е и т) (согласно соотношению неопреде- неопределенностей ет;~Л), обсуждение в III. 4 показало, что при таких пре- претензиях к точности одновременное измерение в самом деле воз- возможно,— измерение положения (q) проводится не слишком коротко- коротковолновым светом, а измерение импульса (р)— не слишком длинными цугами волн. Когда все приготовлено таким образом, то собственно измерение состоит в том, что как-либо идентифицируются, например фотографируются, два световых кванта — один световой квант, от- отклонившийся за счет комптон-эффекта при измерении q, и второй, отразившийся при измерении р с эффектом Допплера, свою частоту изменивший и для обнаружения этой частоты соответствующим опти- оптическим устройством (призмой, дифракционной решеткой) отклонен- отклоненный, световой квант. Итак, в конце опыта мы имеем дело с двумя световыми квантами или даже просто с двумя фотографическими пластинками, и из направления этих квантов или из расположения почернений на пластинках мы должны вычислить q и р. Здесь сле- следует отметить, что ничто не препятствует нам определить эти два направления или места этих двух почернений сколь угодно точно, — ибо очевидно, что это — одновременно измеримые величины (это импульсы или соответственно координаты двух различных объектов), — но это нисколько не поможет измерению q и р. Действительно, как было показано в III. 4, связь этих величин с q и р так устроена, что для последних как раз сохраняются неточности е и т/ (даже при 203) Такая характеристика макроскопического наблюдателя восходит к Вигнеру.
4] МАКРОСКОПИЧЕСКОЕ ИЗМЕРЕНИЕ 297 совершенно точном знании первых), и нельзя устроить опыт так, чтобы стало ет;<^Л. Итак, если мы введем эти два направления или два положения почернений как самостоятельные физические величины, их операторы пусть будут называться Q' и Р', то видим, что Q' и Р' совершенно точно перестановочны, но принадлежащие q и р операторы Q и Р можно выразить с их помощью не аккуратнее, чем с точностью до е и -г]. Пусть относящимися к Q' и Р' величинами будут q' и р'\ та интерпретация, что макроскопически измеримые величины — это, собственно, не сами q и р, но q' и р', совершенно естественна и полностью соответствует нашему постулату об одновременной измеримости всех макроскопических величин. Целесообразно трактовать выясненное обстоятельство вообще как характеристику макроскопического способа рассмотрения. Это рас- рассмотрение состоит тогда в том, чтобы заменить все возможные опе- операторы А, В, С, ..., как правило, не коммутирующие друг с дру- другом, другими операторами А', В', С функциями которых они приближенно являются и которые коммутируют друг с другом. По- Поскольку эти функции операторов А', В', С, ... можно тоже обо- обозначить через А', В', С, ..., то мы вправе сказать, что А', В', С, ... являются приближениями для А, В, С, ..., но коммутируют друг с другом. Если порядок величины операторов А' — А, В' — В, С — С, ... задан числами еА, гв, ес, ..., то мы видим, что произ- произведение еАев будет такого порядка, как АВ — В А (что ведь, вообще говоря, Ф 0) и т. д., — это определяет границы достижимой степени приближения. Разумно, конечно, уже при задании А, В, С, ... огра- ограничиться лишь такими операторами, чьи физические величины хоть в каком-либо приближении макроскопически постижимы. Эти чисто качественные рассуждения остаются пустой программой, пока мы не сможем показать, что они требуют чего-либо математи- математически проводимого. Остановимся поэтому на том, чтобы обсудить для характерного случая Q и Р вопрос о существовании Q' и Р' чисто математически. Итак, пусть заданы два положительных числа е и f\ с г-q = -j-; мы ищем два коммутирующих оператора Q' и Р' таких, чтобы Q' — Q и Р'—Р имели бы (в некотором, еще подле- подлежащем более точному определению смысле) порядок величины е и щ. Мы достигнем этого с двумя совершенно точно измеримыми ве- величинами q' и р', т. е. такими, чтобы Q' и Р' обладали чисто ди- дискретным спектром; поскольку они перестановочны, то существует состоящая из их общих собственных функций полная ортонормиро- ванная система yv cp2, ... (ср. 11.10). Соответствующие собственные значения Q' и Р' пусть будут а,, аг, ... и bv b2, .... так что
29'8 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V оо со Q' = 2 апР\<? 1 и Р'— ~2ibnPt.c т. То, что их измерение — пусть /i = i l "J /j = i l'"J проводимое так, что после него возникает одно из состояний ср-,, ср2, ... (измеряя, например, некоторую величину ffi, которой соответствует оператор R с собственными функциями срх, ср2, ... и всеми различ- различными собственными значениями cv с2, ..., тогда Q' и Р' будут функциями Р.),— включает приближенно и измерение Q и Р, видно из следующего: В состоянии ср„ операторы Q и Р выражаются при- приближенно через соответствующие значения Q' и Р', т. е. через ап и #„, в том смысле, что их дисперсии вблизи этих значений малы. Этими дисперсиями будут математические ожидания величин (Ч — ап? и (Р — ЬпJ> т. е. Они будут масштабами для квадратов разностей между Q' и Q или соответственно между Р' и Р, т. е. должны примерно равняться s2 или yf. Итак, мы требуем, чтобы Поэтому, вместо того чтобы говорить о Q' и Р', целесообразнее просто найти полную ортонормированную систему срр tp2 для которой при соответствующем выборе av а2, . . . и bv b2, ... выполнялись бы приведенные оценки. Отдельные tp (с |jcp|| —1), для которых при соответственно по- подобранных а и Ъ выполняется ||Qcp — о;ср|| =s и ||Ptp —fttp|| =tj, мы уже знаем из III. 4: тсу 2-ггр ) е где мы из-зает) = -^- опять положили е= 1/ -j-^-, tj= I/ -j— It. e. h л / опять положили е= 1/ -j-^- tj= I/ -j— f = ^-1 и где надо выбрать а —а и Ь = р. Речь идет теперь о том, чтобы составить из этих ср а< ^ полную ортонормированную систему. Поскольку р — это математическое ожидание оператора Q, а о — опе- оператора Р, то хотелось бы допустить, что р и о пробегают системы чисел независимо друг от друга, и притом так, чтобы первая имела примерно плотность s, а вторая — ч\. В действительности оказывается удобным выбрать единицы 2 |Лс • г = Y^I и ^ У^ ' ^ зш I/ ~" ¦ так
41 МАКРОСКОПИЧЕСКОЕ ИЗМЕРЕНИЕ 299 чтобы было p = ]/72f(j., о=1/—v ((л, v = 0, ±1, ±2,...). Итак, функции (V- ^ = 0. ±1. ±2,...) должны будут играть роль ср„ (л=1, 2, ...); то, что вместо одного индекса у нас появились два —(л и v,— конечно, несущественно. Однако эти ф^ v пока еще не ортогональны. (Нормированными они являются, и условия выполнены.) Если мы «ортогонализируем» (ср. II. 2, док. теоремы 8.) их методом Шмидта (в какой-нибудь последовательности), то для ортонормированной системы ф' v, которая тогда возникнет, можно будет без труда доказать полноту и установить справедливость оценок причем для С получится значение <~" 60. Доказательство этих утвер- утверждений потребовало бы довольно громоздких, но не требующих каких-либо новых точек зрения, выкладок, которые мы обойдем. Множители С<~60 не играют большой роли, поскольку измеренная в макроскопических (CGS) единицах величина s-q = -j— оказывается совершенно необычайной малости (— 10* l). Итак, мы можем сказать теперь, подводя итоги, что допущение о коммутативности всех макроскопических операторов мотивировано; следовательно, в частности, это так и для введенных выше макро- макроскопических проекционных операторов Е. Операторы Е отвечают всем вопросам (?, на которые можно отве- ответить с макроскопической точки зрения, т. е. всем разбиениям на различ- различные случаи, относящиеся к исследуемой системе, которые могут быть проведены макроскопически. Как мы видели, они все перестановочны; согласно III. 5, вместе с ? к ним относится и 1—Е, далее, вместе с Е и F— также и операторы EF, E-\-F — EF и Е — EF. Естест- Естественно допустить, что их существует лишь конечное число: Ех Еп. Введем на мгновение обозначение Е<-+) = Е и ?(~)=1—Е и рас- рассмотрим все 2" произведений е\*1' . .. Е„ (sx $„== ± I). Любые два различных из них обладают произведением нуль, так как если Е\ '...?¦„ и ?j " ... е\ ™ — два таких произведения, у которых, например, sv Ф tr то в их произведение войдут множители Е; *' и Е\ v*, т. е. Е$р = Е и ?^-)=г1—Е, произведение которых равно нулю.
300 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V Каждое ?v является суммой нескольких таких произведений, именно F — У Е?^ ¦ ¦ ¦ Я<\->> ¦ F(+) • р<\+'> ... ЕЫ *1 \-|'Vh sn=±l Если мы назовем те из этих произведений, которые отличны от нуля, Ei Е'т (ясно, что /га ^ 2", но должно быть даже /га ^ я — 1, так как все они должны встретиться среди Е1 Еп и не равны нулю), то будет Е^фО, Е^Е^ = 0 для (л ф v и каждый ? есть сумма нескольких Е-,. (Из последнего следует также, что п = 2т.) Заметим, что никогда не может случиться, что Е^-\-Еч ~Ее, исключая ?^.= 0, Е^ = Е? или Е^ — Е'о, Е^ — 0, так как иначе Е^ и ?v были бы сум- суммами нескольких Е'ж, следовательно Е9 — суммой ^-2* операторов Ек (возможно, с повторениями). По теоремам 15. и 16. из II. 4 все эти операторы были бы отличны друг от друга, поскольку их ^> 2, и от Е9- Но поэтому должны были бы равняться нулю их произве- произведения с ?р, следовательно и произведение их суммы, что противо- противоречит тому, что эта должна была быть равной Ег Итак, соответствующие операторам Е\, ...,Е'т свойства (&[, ...,@щ— это макроскопические свойства следующего рода: Ни одно из них не абсурдно. Любые два взаимно исключают друг друга. Любое макроскопическое свойство оказывается расщепимым на некоторые из них. Ни одно из них нельзя дальнейшим расщеплением разложить на два более точных макроскопических свойства. Итак, @ь .... @т осуществляют самое глубокое макроскопическое различение случаев, которое вообще может быть сделано; они макроскопически нераз- неразложимы. В дальнейшем мы не будем требовать конечности их числа, но только существования макроскопически неразложимых свойств @ь &2> ... Соответствующие проекционные операторы пусть будут Ei, Еч, ... , опять все ф 0, любые два ортогональные и такие, что каждый макроскопический Е есть сумма некоторых из них. Поэтому и 1 должна быть суммой некоторых из них; не войди некоторый ?\, в их число, он был бы к ней, т. е. к 1, ортогонален, т. е. было бы ?,=:?¦,• 1=0, что невозможно. Поэтому Е\ -j- E'2 -f- -f- ... = 1. Мы опустим теперь штрихи и будем писать (?], <$2. • • • и Ех, Е2, ... Относящиеся к ним замкнутые линейные многообразия будут называться Ttv Sftj, .... а числа их измерений —Sj, s2, ••• Будь все sn=l, т. е. Шп одномерны, то было бы и ЗИл = [срл], Еп^^Ри?л и, из-за Ех -\-Е2 -f- ... = 1, срр ср2, ...—полной орто- нормированной системой. Это означало бы, что уже макроскопические измерения позволяли бы полностью установить состояние рассматри-
4J МАКРОСКОПИЧЕСКОЕ ИЗМЕРЕНИЕ 301 ваемой системы. Поскольку в нормальном случае это не так, то, вообще говоря, будет sn > 1 и даже sn^>h Заметим кстати, что операторы' Еп, являющиеся элементарными кирпичиками макроскопического описания мира, в некотором смысле соответствуют обычному в классической теории разделению на клетки фазового пространства. Что они в состоянии приближенно передавать поведение некоммутирующих операторов, в частности поведение столь важных для фазового пространства Q и Р,—мы уже видели. Какой же энтропией обладает смесь U для макроскопического наблюдателя, чьи неразложимые проекционные операторы — это ?j, Е2, ...? Или, более точно, какую максимальную энтропию может выиграть такой наблюдатель при преобразовании U в V, т. е. какое уменьшение энтропии (оно может быть, естественно, ЩО) во внешних объектах в состоянии он в лучшем случае создать в качестве компенсации за переход U—>V? Прежде всего следует подчеркнуть, что два ансамбля U и U', для которых все Ег, Е2, ... обладают одинаковыми ожидаемыми значе- значениями, т. е. такие, что Spur(UEn) = Spur{U'En) (n—U 2, . ..) он вовсе не может различить друг от друга. Правда, он смог бы, возможно, сделать это спустя некоторое время, так как U и U' эволюциони- эволюционируют согласно 2. и равенство Spur (Ж/Л~1?л) = Spur (AU'A~lE^) Jj±tH с А — е h не должно было бы более выполняться204), но мы ведь рассматриваем только измерения, которые можно выполнить тотчас. Итак, при изложенных выше условиях мы вправе считать U и V неразличимыми. Далее, наблюдатель может употреблять лишь такие полупроницаемые стенки, которые пропускают <р некоторых Еп и отражают все остальные. Этого оказывается достаточно, чтобы, как без труда можно убедиться, следуя методу V. 2, перевести сю сю некоторый U' = 2 хпЕп в некоторый V = 2 УпЕп обратимым обра- я=1 л=1 зом, так что для разности энтропии сохранится выражение х Spur (?/' In ?/') — % Spur (V In V), т. е. энтропия U' будет равна — % Spur (?/' In U'). Правда, надо 204) Если Еп коммутирует с Н, следовательно и с А, то равенство все же выполняется из-за Spur (A ¦ UA~lEn) = Spur (UA~lEn ¦ А) = Spur (UA~lAEn) = Spur (UEn). Но все Еп, т. е. все макроскопические величины, все они ни в коей мере не коммутируют с Н. Многие из них, например центр тяжести какого-либо газа при диффузии, изменяются со временем вполне заметно. Это значит, что Spur (UEn) не постоянен. Поскольку все макроскопические величины перестановочны, то Н ни в коем случае не есть макроскопическая вели- величина, т. е. энергию нельзя совершенно точно измерить макроскопически. С этим можно согласиться без дальнейшего.
302 ОБЩЕЕ РАССМОТРЕНИЕ (ГЛ. V заметить, что,—чтобы такие U' со свойством Spur?/' = 1 вообще существовали, — шпуры Spur?n, т. е. числа sn, должны быть ко- конечны. Поэтому мы примем, что все sn конечны. Оператор U' об- обладает Sj-кратным собственным значением xv «2-кратным собственным значением х2 поэтому — U'lxiU' будет обладать «,-кратным собственным значением —х1\пх1, «2-кратным собственным значением оо — х21п х2, ... Таким образом, Spur U' = 1 означает, что 2 snxn == ^• п=\ оо а энтропия равняется —% 2 snxn In х„. Из-за я = 1 оо V'Em = S хпЕпЕт = хтЕт; Spur (U'Em) = хт Spur Em = smxm, , f Spur(f/'?m) , будет хт= ——^ -, поэтому обсуждаемая энтропия будет равна V с nun м Spur Ш'ЕЛ — х У Spur (?/'?„) In -i-i «i . Для произвольного U (Spur t/ = 1) энтропия тоже должна равняться Spur Действительно, положи мы Spur {UEn) ц,_ л=1 то будет Spur (UEn) — Spur (U'En), и поскольку U ш U' неразличимы, то они должны обладать одной и той же энтропией. Надо еще упомянуть, что эта энтропия всегда превосходит обык- обыкновенную: всегда будет оо — % У Spur {UEn) In Spur {UEn) > — ¦/ Spur (U In U), ** sn n =1 oo и знак равенства достигнется только для U — 2 хпЕп- Согласно результатам V. 3, это гарантированно будет иметь место, если оо U' = V ———'——Еп может быть создано из U несколькими (не обязательно макроскопическими) применениями процесса /., так как оо слева ведь стоит —xSpur(t/' In U'), a U= 2 хпЕп означает то же, л=1
4] МАКРОСКОПИЧЕСКОЕ ИЗМЕРЕНИЕ 303 что и U =11'. Выберем ортонормированную систему срм <fW, растягивающую принадлежащее Е.л линейное многообразие ЗИ„; из-за оо 2 Еп = 1 совокупность всех ср(«)(я=1, 2, ...; v=l, ..., sn) об- я = 1 разует полную ортонормированную систему. Пусть R — оператор, собственными функциями (со всеми различными собственными значе- значениями) которого они являются, a 9t— его физическая величина. При измерении 91 из U получается, в силу /., Положим теперь ' S« v=l Функции ф'л> ф(л) образуют ортонормированную систему, кото- п рая растягивает то же замкнутое линейное многообразие Шп, что и ср(л>, .... cpW. Поэтому и ф("> (« = 1, 2, ...; v = 1 sn) образуют полную ортонормированную систему. Построим с этими собственными функциями оператор S и относящуюся к нему физическую величи- величину <&. Отметим еще, что выполняются следующие формулы: 10 для тфп, sn sn i для „-». 2 Vl^SVr^- Поэтому при измерении ® в силу /. из U" получится Y у Spur (UEm) p _ у Spur (UEm) p __.,„ m— 1 i=l m= 1 Таким образом, двух процессов /. хватает, чтобы преобразовать U в U', — и это все, в чем мы нуждались для доказательства.
304 ОБЩЕЕ РАССМОТРЕНИЕ [ГЛ. V Для состояний (и — Р[9]. Spur (?/?„) = (?„ср, <р)= ||?„ср||2) эта энтропия я=1 не испытывает более тех зол, что «микроскопическая», — она, во- вообще говоря, не остается постоянной во времени (т. е. при процес- процессе 2.) и не для всех состояний равна нулю. Действительно, что Spur (UEn), из которого строится наша энтропия, вообще говоря, не остается постоянным со временем, уже обсуждалось в прим.204) (стр. 301). Легко выяснить, когда состояние U = P[9] будет обладать энтропией 0: Поскольку пУ—^.0 и -^1, то все слагаемые ||?я<р||21п—" в выражении для энтропии <^0, они должны были бы, следовательно, все обратиться в 0. Это требует, чтобы ¦-¦ — = 0 или =1. Первое означает, что Еп<р = 0, последнее — что ||?я<р|| =Vsn- Поскольку, однако, ||?„<р||<1, 5„>1. то для последнего нужно sn=l и ||?„<р|| = ||<р||. т- е- Еп9~? или sn = 1 и ср лежит в ffin. Это последнее не может, конечно, выпол- выполняться для двух различных я, но не может и не выполняться ни для одного, так как тогда было бы всегда ?'пср = О, т. е., в силу со :п = 1, ср = О. Итак, надо, чтобы в точности для одного п ср лежала бы в Ш„, и при этом было бы sn = 1. Поскольку ранее мы установили, что, вообще говоря, все sn^>U то это невозможно. Итак, наша энтропия всегда > 0. Поскольку макроскопическая энтропия зависит от времени, то сле- следующий вопрос, который нам надо разрешить, состоит в том, ведет ли она себя, как энтропия феноменологической термодинамики в дейст- действительном мире, т. е. возрастает ли она прогрессивно? В основан- основанной на классической механике теории утвердительный ответ на этот вопрос получается через посредство так называемой Н-теоремы Больц- мана, но при этом приходится делать известные статистические допущения, так называемые «гипотезы беспорядка»205). В квантовой 205) Относительно классической Н-теоремы ср. В о 11 г m a n n, Vorlesun- gen tiber Gastheorle, Leipzig, 1896, равно как и чрезвычайно поучительное обсуждение у П. и Т. Эренфестов (см. прим.185) на стр. 267). «Гипотезы мо- молекулярного беспорядка», которые могли бы занять в квантовой механике место соответствующих гипотез Больцмана, формулировал Паули (в зоммер- фельдовом юбилейном сборнике, 1928), там же с их помощью доказывается Н-теорема. Недавно автору удалось доказать и эргодическую теорему класси- классической механики, ср. Ргос. Nat. Ac, янв. и март 1930, равно как и усиление у О. D. В irk h off, Proc. Nat. Ac, декабрь 1929, март 1930.
4] МАКРОСКОПИЧЕСКОЕ ИЗМЕРЕНИЕ &05 механике автору удалось доказать соответствующую теорему без пред- предположений такого рода206). Более близкое знакомство с этим пред- предметом, равно как и с теснейшим образом связанной с ним эргоди- ческой теоремой (ср. прим.206), где последняя также доказывается), завело бы нас слишком далеко, и мы должны отказаться от передачи этих исследований. Заинтересованного в этом направлении читателя мы отсылаем к приведенным работам *). 20в) Zs. f. Phys. 57, 30A929). (См. перевод этой статьи в конце книги.) *) См. прим.20в). Прим. ред.
ГЛАВА VI ПРОЦЕСС ИЗМЕРЕНИЯ 1. Постановка задачи В предыдущем рассмотрении мы выяснили, как относится кван- квантовая механика к различным, причинным и статистическим, методам описания природы, и обнаружили своеобразную двойственность ее предписаний, которая не была еще исчерпывающе объяснена. Именно, мы нашли, что, с одной стороны, некоторое состояние ср преобра- преобразуется под действием оператора энергии Н за время 0 ^ т ^ t в со- состояние ср' по закону ¦*г^ = —1гнъ (°<*<о. То = ?¦ Ъ = 9'' или, иными словами, 2« /и ср — е п ср, т. е. чисто причинным образом. Смесь U преобразуется тогда соот- соответственно в U' = e h Ue h , и в согласии с причинным изменением ср в ср' состояния U = P.. пе- переходят при этом в состояния U' = P[f>] (процесс 2. в V.1). С дру- другой стороны, при измерении — пусть, например, измеряющем некото- некоторую величину с только простыми собственными значениями и собст- собственными функциями срх, tp2, ... — состояние ср испытывает акаузальное изменение, в результате которого может возникнуть каждое из со- состояний срр ср2 и притом с вероятностями |(ср, cpj)|2, | (ср. ср2) |2, ... оо соответственно. Это значит, что возникает смесь t/' = S|(?i(Pn)!2> P[v ]¦ со В общем случае смесь U переходит в U' ==2|(^/фп>?пI2-^)Г?1 i (про-
Ц ПОСТАНОВКА ЗАДАЧИ 307 цесс /. в V.1). Поскольку состояния переходят здесь в смеси, то этот процесс не является причинным. Различие между двумя этими процессами ?/->?/' глубоко фунда- фундаментально: даже отвлекаясь от разного поведения относительно прин- принципа причинности, они отличаются и тем, что первый (термодинами- (термодинамически) обратим, а второй — нет (ср. V. 3). Сравним теперь эти соотношения с теми, которые действительно осуществляются в природе или при ее наблюдении. Во-первых, само по себе безусловно верно, что измерение или связанный с ним про- процесс субъективного восприятия является по отношению к внешнему физическому миру новой, не сводящейся к нему сущностью. Дейст- Действительно, такой процесс выводит нас из внешнего физического мира или, правильнее, вводит в неконтролируемую, так как в каждом конт- контрольном опыте уже предполагаемую, мысленную внутреннюю жизнь индивидуума (ср. ниже). Однако имеется, несмотря на это, фундамен- фундаментальное для всего естественнонаучного мировоззрения требование, так называемый принцип психофизического параллелизма, согласно ко- которому должно быть возможно так описать в действительности вне- физический процесс субъективного восприятия, как если бы он имел место в физическом мире, — это значит сопоставить его последова- последовательным этапам физические процессы в объективном внешнем мире, в обычном пространстве (естественно, что при этом процессе сопо- сопоставления (Zuordnungsprozefi) возникает еще необходимость локализо- локализовать эти физические процессы в таких точках, которые лежат в за- занимаемой нашим телом части пространства). В применении к простей- простейшему примеру это наше понимание выглядело бы примерно следующим образом. Пусть измеряется температура. Мы можем, если захотим, продолжить теоретическое вычисление этого процесса до тех пор, пока не получим температуру окружения ртутного сосуда термометра, и сказать затем: эту температуру измеряет термометр. Мы можем, однако, продолжить расчеты далее и вычислить, исходя из объясняемых молекулярно-кинетической теорией свойств ртути, ее нагревание, рас- расширение и результирующую длину ртутного столбика, после чего мы скажем: эту длину видит наблюдатель. Идя еще дальше, мы могли бы, включая в рассмотрение источник света, учесть рассеяние свето- световых квантов на непрозрачном столбике ртути и путь остальных кван- квантов в глаз наблюдателя, затем преломление в хрусталике и образо- образование изображения на сетчатке, и только тогда мы сказали бы: это изображение регистрируется сетчаткой наблюдателя. Наконец, если бы наши физиологические знания были полнее, чем сегодня, мы могли бы пойти еще дальше и указать химические реакции, возбуждаемые этим изображением на сетчатке, в нерве и в мозгу, и только тогда сказать: эти химические изменения в его мозговых клетках восприни- воспринимает наблюдатель. Однако в любом случае, сколь далеко ни продол- продолжали бы мы вычисления — до ртутного сосуда термометра, до его 20*
308 ПРОЦЕСС ИЗМЕРЕНИЯ [ГЛ. VI шкалы, до сетчатки или до клеток мозга, — в некоторый момент мы должны будем сказать: а это воспринимается наблюдателем. Это зна- значит, что мы всегда должны делить мир на две части — наблюдаемую систему и наблюдателя. В первой из них мы можем, по крайней мере прин- принципиально, сколь угодно подробно исследовать все физические процессы; в последней это бессмысленно. Положение границы между ними в вы- высокой степени произвольно. Так, в приведенном выше примере мы видели четыре разные возможности; следует специально подчеркнуть, что наблюдатель в рассматриваемом смысле ни в коей мере не иден- идентифицируется с телом настоящего наблюдателя, — в приведенном при- примере мы в одном случае причислили к наблюдателю даже термометр, в то время как в другом не включили его глаза и нервные пути. То, что такую границу можно переместить сколь угодно далеко внутрь организма действительного наблюдателя, и составляет содержание принципа психофизического параллелизма. Однако это обстоятельство ничего не меняет в том, что при каждом способе описания эта гра- граница должна быть где-нибудь проведена, если только все не прохо- проходит впустую, т. е. если сравнение с опытом должно быть возможным. Ибо опыт может приводить только к утверждениям этого типа — на- наблюдатель испытал определенное (субъективное) восприятие, но ни- никогда не к утверждениям таким, как: некоторая физическая величина имеет определенное значение. Квантовая механика описывает как раз те события, которые ра- разыгрываются в наблюдаемой части мира за то время, пока она не приходит во взаимодействие с наблюдающей частью, с помощью про- процессов 2. (V.1); как скоро, однако, такое взаимодействие возникает, т. е. производится измерение, она предписывает использование про- процесса /.. Тем самым двойственность оправдана207). При этом, однако, возникает опасность нарушения принципа психофизического паралле- параллелизма, если только мы не покажем, что (понимаемую в указанном выше смысле) границу между наблюдаемой системой и наблюдателем можно смещать произвольным образом. Чтобы обсудить последний вопрос, разделим мир на три части /, // и III. Пусть / означает собственно наблюдаемую систему, II — измерительный инструмент, а ///—собственно наблюдателя208). Нам надо показать, что границу можно провести с равным успехом как между / и //-)-///, так и между /-{-II и III. (В приведенном выше 207) N. Bohr (Naturwlss. 17 A929)) первый указал как на то, что воз- возникшую в результате открытия квантовой механики с формальной точки зрения неизбежную двойственность в описании природы можно оправдать и с точки зрения природы вещей, так и на связь с принципом психофизи- психофизического параллелизма. . 208) Последующие рассуждения, равно как и дискуссия в VI.3, содержат существенные элементы, за которые автор должен быть благодарен разгово- разговорам с Л. Сцилардом. Ср. также аналогичные рассуждения у Гейзенберга (прим, ш) на стр. 262).
2] СОСТАВНЫЕ СИСТЕМЫ 303 примере при сравнении первого и второго случаев / соответствовало исследуемой системе, // — термометру, а /// — системе свет-)-наблю- свет-)-наблюдатель; при сравнении второго и третьего — / соответствовало иссле- исследуемой системе-f-термометр, // — свету-f-глаз наблюдателя, /// — на- наблюдателю, начиная от его сетчатки; при сравнении третьего и чет- четвертого случаев /—всему, вплоть до сетчатки наблюдателя, // — его сетчатке, нервам и мозгу, /// — его абстрактному «Я».) Это значит, что один раз надо применить 2. к /, а /. к взаимодействиям между / и //-)-///, а другой раз — 2. к /-)-//, а /. — к взаимодействиям между 1-\-П и ///. (Само III остается каждый раз вне рассмотрения.) Доказательство того, что оба пути приведут к тем же самым утверж- утверждениям относительно части / (она и только она принадлежит оба раза к наблюдаемой части мира), и составляет, собственно, нашу задачу. Однако, чтобы быть в состоянии успешно заняться ею, нам надо будет сперва более подробно исследовать процесс объединения двух физических систем в одну (который ведет от I n II к 1-\-П). 2. Составные системы Рассмотрим, как было намечено в конце предыдущего параграфа, две физические системы I к II (они не обязательно должны иметь обсуждавшийся там смысл) и получающуюся их объединением систему /-)-//. Пусть с точки зрения классической механики система/ обла- обладает k степенями свободы, следовательно, координатами qv .... qk, вместо которых мы ради краткости будем писать одну букву д. Си- Система // пусть обладает соответственно I степенями свободы, опи- описывается координатами гх rt, сокращенно г. Тогда у системы /-)-// будет k-\-l степеней свободы и ей будут соответствовать ко- координаты qv .... qk, rx rv сокращенно^, г. При квантовоме- ханическом описании волновые функции / будут тогда иметь вид ср(^), системы // — ?(г), а системы 1-\-П — Ф(<7, г). Внутреннее произве- произведение в соответствующих гильбертовых пространствах Щ7, Ct77 и SR/+// естественно определить как / ср (q) ф (q) dq или / % (г) т] (г) dr, или r)W(q, r)dqdr. В соответствии с этим физические вели- величины систем /, II и III будут (гипермаксимальными) эрмитовыми опе- операторами А или А, или А в SR7, или в Шп, или в 9ft/+/J'. Каждая физическая величина в / является, конечно,, такой и в си- системе I -{-II, и при этом ее оператор А получается из А следующим образом: чтобы получить АФ(^, г), следует считать г постоянными и применить А к ^-функции Ф (q, гJ0Э). Это правило сопоставления, 209) Можно легко показать, что оператор А будет одновременно с А эр- эрмитовым или гипермаксимальным.
310 ПРОЦЕСС ИЗМЕРЕНИЯ [ГЛ. Vt во всяком случае верно для операторов координат и импульсов «?i Qk и Рг Pk, т. е., ср. 1.2, qv ...,qk, J^-?-,... Ad. , ..., -n~- -a—) и находится в согласии с общими принципами сопо- сопоставления /. и II. из IV.2210), поэтому мы постулируем его и для общего случая. (В квантовой механике оно общеупотребительно.) Точно так же каждая физическая величина в // является такой и в /-[-Я, и ее оператор А приводит к ее А по тому же правилу: АФ(<7, г) равняется АФ(д, г), если при образовании последнего вы- выражения рассматривать q как постоянные и Ф(^, г) — как г-функцию. Если ym(q) (т=1, 2, ...) образуют полную ортонормированную систему в 9?', а \п{г) (п= 1, 2, .. .) — такую систему в Щ.г/, то функ- функции $>min{q< >~) = <fm(q)ln(r) (т, д=1, 2, ...) составят, очевидно, такую же систему в SR/+//. Тогда операторы А, А или А можно бу- будет представить матрицами {am/m'} или {an!nt} или {атп/т/л/} (т, т',п, п' = 1, 2, ...JП), к чему мы будем ниже часто прибегать. Матричное представление означает, что оо со '^m' (Я), А\п (г) = 2 а„,„^„/(г) ' 1 m' =1 И оо А Фт„ (?. Г) = 2 <tmnlm'n'®m'n<(q< Г), т', п' = \ т. е. оо А <Рт (?) Sn (Г) = 2 «¦тп/т'п'Чт' (?) V (/")• т', п' = 1 В частности, сопоставление А —> А устанавливает, что оо т. е. что (( 1 для п = д',\ *"/я'—( 0 для а Фа'.) Аналогично сопоставление Л->А устанавливает, что атп!т<п' = 210) Для /. это ясно, для //. — тоже, пока рассматриваются только по- полиномы. Для произвольных функций это следует из того обстоятельства, что взаимосвязь разложения единицы и какого-либо эрмитова оператора не на- нарушается при переходе А -> А. 21') Из-за большого числа разнообразных индексов мы прибегнем для матриц к такому обозначению, несколько отличному от применявшегося.
2] СОСТАВНЫЕ СИСТЕМЫ 311 Статистический ансамбль в / + // характеризуется его статисти- статистическим оператором U или соответствующей последнему матри- матрицей {о/яп/т'п'Ь Этот оператор определяет статистические свойства всех величин в /-f-//, следовательно, в частности, и статистические свойства величин в /. Таким образом, этому ансамблю отвечает и статистический ансамбль в одной лишь системе /: в самом деле, на- наблюдатель, могущий учитывать существование только /, но не //, воспринял бы ансамбль, относящийся к системам /-)-//, как отно- относящийся к системе /. Что же будет теперь статистическим опера- оператором U или его матрицей {iim/m'}, относящимся к этому /-ансамблю? Определим его из следующих соображений, /-величина с матри- матрицей {am/m1} будет обладать, как (/ + //)-величина, матрицей {a"w/m'8n/n'l> следовательно, на основе вычислений в / будет иметь среднее значение ?л Urn /m'Sim' [т* т, т' = 1 в то время как вычисления в ([-{-II) приведут к 2ш1 m,n,m',n' / Si V \ .Zj umnjm'n т, т' = 1 \ и'= 1 Чтобы эти два выражения совпали, должно быть 2л и» 1 Совершенно аналогичным образом определяет наш (/-)-//)-ансамбль в случае, когда учитывается только //, а / игнорируется, //-ансамбль со статистическим оператором U и соответствующей ему матри- матрицей и„/И'. Совершенно так же тогда получается, что иЫп' *== 2i °mnlmn'- Итак, мы вывели правила сопоставления и для статистических операторов U, U и U систем /, // и /-f-//, однако эти правила существенно отличаются от тех правил сопоставления, которые имели Место для операторов Д. А и А физических величин. Надо еще отметить, что выбранное сопоставление операторов U. (/ и U зависит от выбора полных ортонормированных систем <?m(q) й |„(г) только кажущимся образом, поскольку оно было выведено ив инвариантного условия (которому можно удовлетворить только
312 ПРОЦЕСС ИЗМЕРЕНИЯ [ГЛ. VI таким сопоставлением) — совпадения средних значений операторов А и А или Л и Д. Оператор U выражает собой статистику в системе /-}-//, опе- операторы U или U — статистику, ограниченную системами / или //. Возникает вопрос, определяют ли U и U оператор U однозначно или нет? В общем случае следует ожидать отрицательного ответа, по- поскольку при знании только операторов U и U, т. е. лишь свойств разделенных систем I n II, у нас выпадают все «зависимости вероят- вероятностей», могущие существовать между обеими системами. Если, од- однако, как состояние /, так и состояние // известны точно, то «за- «зависимости вероятностей» не играют роли и 1-\-11 узнается точно. За этими качественными соображениями должно, конечно, последо- последовать точное математическое рассмотрение, к которому мы сейчас приступим. Задача состоит в том, чтобы для двух заданных дефинитных мат- матриц {iim/m'} и {«„/„'} построить третью дефинитную матрицу {о/т/т'п'} такую, что оо со Vmn/m'n == Um/m'< JLi ^mnjmn' == "«'«'• n-l m=l @0 ОО Из 2 Um/m = 1. 2 unin = 1 следует тогда автоматически, что 2 °тл/тл=1. т. е. правильная нормировка сохраняется. ] Разре- тп=\ / шима задача всегда; так, например, птп\т'п' —Um/m'Unin' всегда бу- будет решением (легко убедиться, что эта матрица дефинитна); вопрос состоит в том, когда это решение будет единственным. Мы покажем, что это выполняется тогда и только тогда, когда, по крайней мере, одна из двух матриц {um/m1} и {«„/„¦} будет со- состоянием. Докажем сперва необходимость этого условия, т. е. су- существование многих решений в случае, когда обе матрицы соответ- соответствуют смесям. Действительно, тогда (ср. IV. 2) Um/m' — «Vm/m' + PWm/m'- unjn' = Т^л/и' + 8ДО„/Л' (матрицы Vm/т' и Wm/m' дефинитны и отличаются не только посто- постоянным множителем, то же для vn\n< и wnjn'\ со со со оо ЧСТ ЧСТ 'КП V 4 т=1 т=1 л=1 л=1 а, р, 1> 8 > 0; a-j-p=l; f-f-5=l), и легко проверить вычисле- вычислением, что каждая матрица р, о, х
2] СОСТАВНЫЕ СИСТЕМЫ 313 будет решением. Числа те, р, о и т можно выбрать при этом беско- бесконечным числом различных способов (поскольку a-j-p = f-J-8, то из четырех уравнений независимы только три, пусть, например, р = f—те; о = а — те; т = (8—а Чтобы все было положительным, должно быть а — 8 = f — j3< <те < а, f , что выполняется для бесконечного числа значений те), и различные те, р, о, т ведут к различным итщт'п'< так как Vmim'Vnin' Wm/m'^n/n' линейно независимы, поскольку это имеет МеСТО как ДЛЯ Vm/m'. Wm/m'. ТЭК И ДЛЯ Vnlrf, Wnjn<. Перейдем теперь к доказательству достаточности, причем можем принять, что состоянию отвечает umim' (другой случай рассматри- рассматривается точно так же). Итак, пусть \J = P^. Поскольку полная ор- тонормированная система ср:, ср2, ... была произвольна, можем при- принять, что ?! = ?• Оператору U = /5[<?1] соответствует, очевидно, матрица [ 1 для т — т' = 1, m'm JO в остальных случаях. Итак, 1 для т — т' = 1, 2,mninin { 0 в остальных случаях. В частности, для тф\ 2°тл/шл = 0> но поскольку по определе- 1 нию ътп1т,п. все иш„/тл>0 (действительно, отп/тп = A1ФтЛ. Фшл)). то в этом случае umn/mn = 0. Это значит, что A1ФШ„, Фшл) = 0, следовательно, в силу дефинитности U, и A1Фтл. Фщ'п') — ® (ср. II. 5, теорема 19.) для произвольных т'', л'. Но это значит, что из тф\ следует отп/т-П' = 0, а вследствие эрмитовости то же будет следовать и из т'Ф\, Но для от = /я' = 1 получается Тем самым, как и утверждалось, оказывается, что решение определено однозначно. Резюмируя, можно сформулировать наш результат следующим образом. Статистический ансамбль в /+ // с оператором U = {итщт'п') однозначно определяется определенными только в / и только в // статистическими ансамблями с операторами U = {iim/m'} и t/= {} тогда и только тогда, когда выполняются следующие условия:
314 ПРОЦЕСС ИЗМЕРЕНИЯ [ГЛ. VI 99 00 со (Из равенства Spur 11= 2 ити/тл = 2 Vm/,« 2'°л/п = 1 сле- т,л=1 т = 1 л=1 дует, что мы можем умножением Vm/m' и ¦#„/„- на два взаимно об- обратных множителя добиться выполнения со оо Za Vm/m = 1 ¦ 2 ^п/я = 1 ¦ m = 1 и = 1 Но ТОГДа ВИДНО, ЧТО будет Um/m' =_Vm/m' И Unin-=V„!„'.)_ 2. Выполняется либо Vm/«r =xmxm', либо vn,n' — хпх'п. / со [Ибо U =/^i означает, что ср = 2 У/Лг следовательно, \ ;л=1 11т/т' = УтУт' и соответственно для Vm/m'i аналогично рассуждаем И ДЛЯ ?/ = Р[Е] В дальнейшем мы будем называть U и U проекциями оператора U в / и в // т). Обратимся теперь к состояниям из / + //, И=Р[Ф]. Относя- Относящиеся к ним волновые функции Ф (q, r) могут быть разложены по полной ортонормированной системе Фтп(д, г) — Чт ОО т, л=1 Мы можем также заместить их коэффициентами fmn {т., « = 1,2, ...), со которые ограничены только условием 2 l/mnl2 —ll^ll2 конечна. m,n=l Можно ввести также два оператора F и F* равенствами = /Ф(?, r)<?(q)dq. (q, r)%{r)dr. Они линейны и обладают той своеобразной особенностью, что, бу- будучи определенными в W или соответственно в W, принимают зна- значения из Ши или соответственно из IR7. Они соотносятся как сопря- сопряженные операторы, поскольку, очевидно, (Ftp, ?) = (<p, F*?) (внутрен- (внутреннее произведение в левой части образуется в W', а в правой — в W\). Поскольку различие между 9?7 и W не имеет математического зна- значения, то мы можем применить результаты II. 11, и поэтому S (F) 212) Проекции состояния из /-{-II оказываются в / и в //, вообще го- говоря, смесями, ср. ниже. Это обстоятельство было открыто Ландау (L. Lan- Landau, Zs. f. Phys. 45 A927)).
2] СОСТАВНЫЕ СИСТЕМЫ 315 и %(F*), поскольку речь идет об интегральных операторах, будут равны //(?. f)\*dqdr=\\<b\\*=\ и, следовательно, конечны. Поэтому F и F* будут непрерывными, даже полностью непрерывными операторами, произведения F*F, равно как и FF*, будут дефинитными операторами и Spur (F*F) = Б (F)= 1, Spur (FF*) = S (Z7*) = 1. Обращая снова внимание на различие между Si1 и Ш", замечаем, что F*F определено в W, a FF* — b W. СО Так как Fym(q) оказывается равным S/mn^n(r)' то оператор F _ "-1 имеет своей матрицей [fmn\ (при использовании полных ортонор- мированных систем <рш(#) и %п(г))\ аналогично матрицей опера- оператора F* будет {/„,„}• Поэтому F*F и FF* будут иметь матрицы 00 1 С °° — 1 .Zj fmnfm'n | и I 2Lifmnfmn' | ¦ л=1 J U=l J С другой стороны, оператор U = Р[ф] будет обладать в системе функций Фтп(д, r) = <fm(q)ln(r) матрицей {Ттп/т'п1}- так что мат- оо рицами его проекций U^UbIhbII будут ^fmnfm'n и соот- со ветственно 2 Jmnfmn'213)- Поэтому U = Z"*/7, U = FF*. Это утверждение не будет зависеть от выбора функций <рт и 5Л (так как U, U и Z7 не зависят от такого выбора). Операторы U и U полностью непрерывны и, согласно 11.11 и IV.3, могут быть записаны в виде где фй образуют полную ортонормированную систему в W, ч\к — такую систему в W1 и все w'k, w"k*^Q. Опустим теперь в каждой из обеих формул члены с <w'k = 0 или ®^ = 0и перенумеруем остав- оставшиеся опять последовательными числами 1, 2, ... Тогда функции фА или ч]к будут образовывать уже только ортонормнрованную, но 213) Математически это рассуждение соприкасается с работой Е. S с h m i d Г a, Math. Ann. 63 A907).
316 ПРОЦЕСС ИЗМЕРЕНИЯ [ГЛ. V! со не обязательно полную систему, на месте сумм 2 выступят М' М" 2 й 2 > гДе М' и М" с равным правом могут как равняться бесконечности, так и быть конечными, но зато все w'k и w"k будут теперь строго больше нуля. Рассмотрим некоторую фл. Будет ифА = ^Ф^. следовательно, Далее {wk для к = 1, О для k + l. Поэтому, в частности, II Ftyk ||2 = w'k. Итак, функции ——=;Ftyk об- разуют ортонормированную систему в 5t/; и, более того, они будут собственными функциями оператора U с теми же собственными зна- значениями, что у функций i|»ft для U (т. е. равными w'\ Это значит, что всякое собственное значение U будет и собственным значением не меньшей кратности для оператора U; переставляя U и U, полу- получаем, что эти операторы имеют одинаковые собственные значения с одинаковыми кратностями. Итак, числа w'k и w"k совпадают попарно с точностью до порядка нумерации. Поэтому М' = М" = М, и изме- изменением порядка нумерации w"k мы можем достигнуть выполнения <w'k = w"k = wk. Но, коль скоро это так, мы можем, не теряя общ- общности, выбрать f\k = ——=. Ftyk. Тогда будет У wk Итак, Дополним теперь ортонормированную систему ф^ ф2, ... до полной фг ф2 *!• *2 а систему Tjj, тJ, ... до т;,, тJ г,;, щ'г ... (каждая из систем ф|, ф^, ... и y\'v т^, ... может быть пустой, конечной или бесконечной; они строятся независимо друг от друга). Все предыдущие рассуждения не зависели от выбора полных орто- *) См. прим. 212) на стр. 314.
2] СОСТАВНЫЕ СИСТЕМЫ 317 нормированных систем ср1( ср2, ... и %v |2, •••> мы можем поэтому выбрать в качестве их системы фг ф2 i}'v ф2, • ¦ • и Vv Ч2 f\'y i\y ... Именно, пусть i|>ft совпадает с ср^ , t\k — с ?v ((х^ |х2, ... взаимно различны; то же для v,, ч2, .. .). Тогда Итак, _ ( У1*^ для m = (ift, п = vft, & = 1, 2 I 0 в остальных случаях, или, что то же самое, Ф(д, г) = %Уч<р (q)L(r). k=1 я ^ Таким образом, мы достигли, путем соответствующего выбора систем срт(#) и $„(г), того, что каждая строка и каждый столбец матрицы \fmn} содержат самое большее один не равный нулю эле- элемент (то, что он даже веществен и положителен, именно равен yrwk, для дальнейшего не важно). В чем заключается физический смысл этого формального утверждения? Пусть А — оператор с собственными функциями ср,, ср2 и всеми различными собственными значениями, например а,, а2, ...; В — такой же оператор с функциями %х, %2, ... и значениями bv b2, ... Оператор А соответствует некоторой физической величине в /, опе- оператор В — в //; эти две величины допускают, следовательно, одно- одновременное измерение. Легко видеть, что утверждения «Л имеет значение ат» и «В имеет значение Ьп» определяют совместно со- состояние Фтп(д, r) — ym(q)?n(r), которое имеет в состоянии Ф(^, г) вероятность (Р[Фтп]Ф> Ф)= |(Ф, Фшл)|2— \fmn\2- Таким образом, наше утверждение означает, что А ж В одновременно измеримы, и если бы один из них был измерен в Ф, то тем самым значение другого было бы однозначно определено. (Собственное значение ат, которому отвечают все /т„ = 0, встретиться не может, поскольку оо его полная вероятность 2 \fmn\2 He может равняться нулю, если ат л=1 вообще можно найти. Итак, точно для одного п fmn Ф 0. Для Ьп — так же.) Это означает, что в состоянии Ф может встретиться много значений оператора А (каждое значение ат, для которого со 2 \fmn\2 > 0. т. е. существует п с fmn Ф0, — в большинстве случаев это будут все а^) и столько же значений оператора В (каждое Ьп,
318 процесс измерения [гл. vr для которого 2 |/mJ2>°« т- е- существует одно т с /тпф0), п = \ J но Ф устанавливает между возможными значениями А и В одно- однозначное соответствие. Если назвать возможные т: [Xj, (x2, ..., а соответственные воз- возможные п: Vj, v2, ..., то будет О в остальных случаях, т. е. (М — либо конечно, либо бесконечно) м ф(#. /¦)=Scft?u, (я)^ (/)• ft=l pft ft Далее будет для т = т' = (Аь, ^=1, 2, .... со I [г S-f f Iе fmnfm'n — I n, л=1 I u в остальных случаях, Ck\2 ДЛЯ n = tl' — Vk, k=l, 2 m" ' " в остальных случаях, следовательно, Итак, будучи спроектировано в / или в //, Ф становится, вообще говоря, смесью, оставаясь состоянием только в /-{-//, поскольку оно включает утверждение относительно / + //, которое нельзя использовать ни в рамках одной системы /, ни в рамках одной системы //, — взаимно однозначное соответствие между значениями операторов А и В. Таким образом, для любого Ф мы можем так выбрать А и В, т. е. функции срт и ?п> что это наше условие будет выполнено, но для произвольных А и В оно, конечно, нарушится. Иными словами, каждое состояние Ф устанавливает определенную связь между / и //, в то время как связываемые величины А к В зависят от Ф. В какой степени определяет их, т. е. срт и ?„, состояние Ф, легко установить. Если все \ck\ различны и не равны нулю, то U и U (которые фи- фиксируются заданием Ф) определяют срт и %п однозначно (ср. IV. 3); обсуждение общего случая мы оставим на долю читателя. В заключение заметим, что если МФ 1, то из-за |cft|2>0 ни U, ни U не будут состояниями. Для М = 1 состояниями будут оба: U~PK| и и==Р\(-.\ Тогда Ф(-д- Г) = С1\(Я)^1(Г)< а ci можно будет включить в ср^ (q). Итак, U и U будут состояниями тогда и
3] ОБСУЖДЕНИЕ ПРОЦЕССА ИЗМЕРЕНИЯ 319 только тогда, когда Ф(<?, г) имеет вид <f(q)t(r); они будут тогда равняться Р[т-] и Рр]. На основе полученных выше результатов мы можем сформули- сформулировать следующее утверждение. Находится система / в состоянии <?(q), а система // — в состоянии ?(г), то и / + // будет находиться в со- состоянии Ф(д\ г) = <р(q)%{r). Если же, напротив, /-{-II находится в состоянии Ф(<?> г), не имеющем формы произведения y{q)\(r). то / и // будут смесями, но Ф установит взаимно однозначное соот- соответствие между возможными значениями определенных величин в / и //. 3. Обсуждение процесса измерения Прежде чем довести до конца обсуждение процесса измерения в смысле развитых в VI. 1 идей с помощью найденных в VI. 2 фор- формальных средств, мы хотели бы еще использовать результаты VI. 2, чтобы исключить многократно предлагавшуюся возможность объясне- объяснения статистического характера процесса /. (V. 1). Она основывается на следующем рассуждении. Пусть / означает наблюдаемую систему, а //—наблюдателя. Если / находится до измерения в состоянии U = P[oi, a // — в смеси U = 2jWnPn 1, то 1'-{-II будет в одно- значно определенной смеси U, именно, как легко сосчитать, следуя VI. 2, будет СО и = 2J ™пР[Фпу ф« (?. о=? (?) $д (г). Если теперь имеет место измерение величины А в /, то его надо понимать как взаимодействие между / и //, т. е. как процесс 2. (V. 1) с некоторым оператором энергии Н. Если оно продолжается время t, то превратит U в именно, как легко видеть, в Если бы теперь всякое Ф„(д\ г) имело форму ^n(q)f\n(j), где ф„ — собственная функция А, а ч\п образуют некоторую фиксированную полную ортонормированную систему, то это вмешательство имело бы характер измерения, переводя каждое состояние <р системы / в смесь собственных функций ф„ оператора А. Статистический характер возникает здесь из того, что, хотя система / и находилась до изме-
320 ПРОЦЕСС ИЗМЕРЕНИЯ [ГЛ. VI рения в одном определенном состоянии, но // была смесью, а в процессе взаимодействия «смешанный» характер // «заразил» и систему /-)-//, в частности, превратил в смесь проекцию в /. Иными словами, измерение не приводит к определенному результату из-за того, что состояние наблюдателя перед измерением не является точно определенным. Было бы мыслимо, что такой механизм функциони- функционирует, так как степень информации наблюдателя о его собственном состоянии могла бы быть ограничена законами природы. Эти границы нашли бы себе выражение в значениях wn, которые должны были бы определяться только наблюдателем (т. е. не зависели бы от <р!). Как раз здесь эта попытка объяснения терпит крушение, ибо квантовая механика требует, чтобы было «'« = (''[*„]?.?)= 1(<Р. «I2- т. е. чтобы wn зависело от <р! Существующее, возможно» другое разложение и'=2ЧРГф'1 <в КОТОРОМ ф'„^' г) = пX ортогональны и нормированы!) тоже не помогает, поскольку w'n однозначно устанавливаются (с точностью до порядка) смесью U' (IV. 3) и, следовательно, совпадают с wn 2И). Итак, акаузальность процесса /. обусловлена не недостаточностью знаний о состоянии наблюдателя. Поэтому в дальнейшем мы будем всегда принимать, что оно известно точно. Обратимся снова к задаче, сформулированной в конце VI. 1. /, // и /// будут иметь определенное там значение; для квантово- механического описания систем I n II будут использоваться обозна- обозначения VI. 1, в то время как /// вообще останется вне вычислений (ср. сказанное по этому поводу в VI. 1). Пусть А означает подле- подлежащую измерению величину (в /), cpi(#), <р2(<?)> ...—ее собственные функции, а система / находится в состоянии ср (q). Если / считается наблюдаемой системой, а // + /// — наблюдате- наблюдателем, то нам следует прибегнуть к процессу 2., и мы найдем, что измерение переводит / из состояния ср в одно из состояний ср„ (п=\, 2, .. .) с соответствующими вероятностями |(ср, <р„)|2 (я = 1, 2, ...). К какому же способу описания следует нам прибегнуть, если считать наблюдаемой системой 1-\-П, а наблю- наблюдателем — III? В этом случае мы должны сказать, что // — это измерительный прибор, показывающий на шкале значение величины А (из /). Поло- Положение стрелки на этой шкале есть некоторая физическая величина В (из //), которая, собственно, и наблюдается системой /// (если // 214) Эта форма допускает еще некоторые вариации, которые также не заслуживают рассмотрения по аналогичным причинам.
3] ОБСУЖДЕНИЕ ПРОЦЕССА ИЗМЕРЕНИЯ 321 лежит уже внутри организма наблюдателя, то на месте шкалы и по- положения стрелки выступят соответствующие физиологические понятия, например сетчатка и изображение на ней) и значения которой одно- однозначно связаны со значениями величины А. Пусть значения А будут av,a2, .... значения В — bv b2 а нумерация выполнена так, что как раз ап и Ьп связаны друг с другом. Первоначально / находится в (неизвестном) состоянии <р(<7)« а // — в (известном) состоянии ?(/¦), следовательно, /-)-// — в со- состоянии Ф (q, г) = ср (q) \ (г). Измерение (пока оно проводится систе- системой // над системой /) совершается, как и в прежнем примере, по- посредством оператора энергии Н (в /-f-//) за время t. Это будет -— т процессом 2., который превратит Ф в Ф' = е Л Ф. С точки зрения наблюдателя /// об измерении можно заговорить, только если дело обстоит так, что начни /// измерять посредством процесса /. одновременно измеримые величины А и В (в / и соответственно в //, или же обе в /-)-//), то пары значений ат, Ьп с т Ф п стали бы появляться лишь с вероятностью нуль, напротив, пары с т~п—с некоторыми определенными вероятностями wn. Иными сло- словами, достаточно «рассмотреть» //, чтобы А из /оказалась бы измерен- измеренной. Квантовая механика потребует тогда еще, чтобы wn—\(<p, сря)|2. Произойди такое, и процесс измерения, в той мере, в какой он протекает в //, будет теоретически «объяснен» — рассматривавшаяся в VI. 1 граница сдвинута из положения / \II-\-III в I-\~II\III. Итак, математическая задача состоит в следующем. Задана полная ортонормированная система <pi- 9г> • • • в '• Такую же систему ?1> ?2< • • • в ^/7> равно как и состояние % в W, надо найти. Далее следует подобрать оператор (энергии) Н в W+n и значение t так, чтобы выполнялись следующие условия. Если <р—произвольное со- состояние в W, а -— (Н г) foN() Ф'( ) » по построению, то Ф' {q, r) должна представляться в виде оо 2 спср„ (q) ?„ (г) (коэффициенты сп могут, естественно, зависеть от <р)- я=1 При этом должно быть |с„|2=|(<р, <р„)|2 (то, что последнее условие соответствует сформулированным выше физическим требованиям, было выяснено в VI. 2). В дальнейшем мы будем наряду с <pi- ?г» • • • считать фиксиро- фиксированными и l-j, ?2, ... и |, а вместо Н искать унитарный оператор Математическая задача сводится к уже разрешенной в VI. 2: там была задана Ф', и мы показали существование сп, <р„ и ?„; теперь нам заданы 21 И. Нейман
322 ПРОЦЕСС ИЗМЕРЕНИЯ [ГЛ. VI постоянные срл, \п и зависящие от ср Ф и сп, и задача состоит в том, чтобы так определить Д, чтобы эти сп, ср„ и %п получились бы из Ф' = ДФ. Мы покажем, что такое построение Д действительно возможно. При этом мы будем интересоваться лишь принципиальной стороной дела, т. е. вопросом существования какого-либо такого Д. Дальней- Дальнейший вопрос о том, обладают ли требуемыми свойствами операторы * -Ч- * Д = е п простейших наглядных схем постановки опытов (напри- (например, рассмотренных в III. 4), не должен нас заботить. В самом деле, поскольку, как мы видели, наши условия действительно совпадают с наглядным критерием измеримости и, с другой стороны, в упомя- упомянутых схемах опытов наглядные требования к измерению тоже удо- удовлетворяются, то квантовая механика должна была бы приводить к грубо противоречащим наблюдению результатам, если бы соответ- соответствующие Д не удовлетворяли бы (по крайней мере приближенно) нашим условиям 215). Таким образом, в дальнейшем нам надо будет найти только абстрактный оператор Д, точно удовлетворяющий на- нашим условиям. Итак, пусть функции срт (/и = 0, ±1, ±2, ...) и %п (га = 0, ±1, ±2, ...) образуют две заданные ортонормированные системы в S' и соответственно в W (мы даем теперь тип пробегать не значения 1, 2, .... а значения 0, ±1, ±2, ...; это основано на технических соображениях и не имеет принципиального значения) и пусть, простоты ради, состояние !¦ совпадает с ?0. Определим опе- оператор Д равенством оо со т,п = —со т, л= -оо Поскольку как tpm(q)?„(г), так и <?m(q)Z,n+m(r) образуют в W полные ортонормированные системы, то такое Д будет унитарным. Теперь оо ? (?) = 2 (?. ?j • 9т (м е (о = So (о- т~ —оо Следовательно, Ф (q, г) = ср (<7) 5 (Г) == 2j (?. <Pm) • <Pm (?) So (Г) m = ~ со и CO ф' (у, г) = ДФ (?, r) = 2 (9- ?/»)' f™ 215) Для рассматривавшегося в III. 4 измерения положения соответ- соответствующее вычисление имеется в работе W е 1 zs а с k e r'a, Zs. f. Phys. 70 A931).
3] ОБСУЖДЕНИЕ ПРОЦЕССА ИЗМЕРЕНИЯ 323 Но тем самым наша цель достигнута, мы добились даже равенства Сп = (<Р> ?«)• Мы получим, однако, более наглядное представление о механизме этого процесса, рассмотрев пример с конкретными шредингеровыми волновыми функциями и задавая само Н вместо Д. Как наблюдаемый объект, так и наблюдателя (т. е. / и //) будет достаточно охарактеризовать одной непрерывно пробегающей от — оо до -\- оо переменной q или г, т. е. мы будем представлять их как линейно двигающиеся точки. Их волновые функции будут иметь вид ф (q) и ч] (г). Мы примем, что их массы тх и т2 столь велики, что кинетической энергией 1 / h д \2 . 1 / h д \2 2т{ \ 2%l dq ) ' 2m2 \ 2%l дг ) в операторе энергии можно будет пренебречь, и в Н останется только ответственная за измерение энергия взаимодействия, для которой мы выберем специальную форму ъ~- Ч 1Г ' Зависящее от времени дифференциальное уравнение Шредингера для волновой функции tyt = tyt(q, r) системы / + // будет тогда гласить: _h__d_, ч_ h _д_. т. е. что приведет к ЫЯ> r) = f(q. r — tq). Если для t = 0 ф0 (q, г) = Ф {q, г), то мы получим / (q, г) = Ф (q, r) и, следовательно, фДу, г) = Ф(д. r — tq). Если, в частности, начальные состояния систем / и // предста- представляются функциями ср(<7) и ?(г), то, в духе нашей вычислительной схемы (если выбрать участвующее в ней время t равным 1), будет Ф {Я' г) = «р (Я) Z (П. Ф' (?, г) = <pi (?, г) = ср (9) $ (г — 9). Покажем теперь, что найденные результаты могут послужить для измерения координаты системы / системой //, т. е. что координаты q и г взаимно связаны. (Поскольку q н г обладают непрерывным спект- спектром, т. е. только сколь угодно точно, но не абсолютно точно изме- измеримы, то это может удаться только приближенно.) Допустим для этой цели, что ?(/•) отлична от нуля только в очень узком интервале —? < г0 < е (т. е. что координата г наблюдателя 21*
324 ПРОЦЕСС ИЗМЕРЕНИЯ (ГЛ. VI известна до измерения очень точно). Кроме того, I должна, есте- естественно, быть нормированной: ||?|| = 1. т. е. Вероятность того, что q лежит в интервале q0— 8 < <7 <.qo-\-§, а г — в интервале г0 — 8' < г0 < го-\-Ь', будет тогда составлять ?о+6 го+6' ?0+6 го+6' \®'(q,r)fdqdr= f f Если q0 и r0 отличаются друг от друга больше чем на S —(— 8' —(— е, то она обратится в нуль, т. е. q и г связаны столь сильно, что их разность никогда не может стать > 8 —|— 8' —|— е. Для случая же г0 = q0 она, если мы выберем 8'^8-f-e, будет из-за допущений-относительно \ равняться I \y(q)fdq. Так как, однако, мы можем выбрать 8, 8' и е сколь угодно малыми (они должны быть только ббльшими нуля!), то это значит, что q и г связаны сколь угодно сильно, а плотность вероятности имеет требуемое квантовой механикой значение |<р(<7)|2- Таким образом, условия для измерения в той форме, как они обсуждались в VI. 1 и в этом параграфе, осуществляются. Обсуждение более сложных примеров, например, аналогичных нашему четырехчленному примеру из VI. 1, или таких, как контроль со стороны второго наблюдателя /// измерения, выполненного // над /, проводится совершенно аналогично. Мы предоставим его читателю.
ДОПОЛНЕНИЕ ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ В НОВОЙ МЕХАНИКЕ *) Показывается, каким образом должно разрешаться кажущееся противоречие между макроскопическим понятием фазового простран- пространства и существованием соотношений неопределенности. Затем дается квантовомеханическое истолкование самых основных представлений статистической механики, формулируются и доказываются (без «допу- «допущения о беспорядке») эргодическая теорема и //-теорема. После этого следует обсуждение физического смысла математических условий, ограничивающих области их применения. Введение 1. Темой настоящей работы является выяснение связи между макроскопическим и микроскопическим рассмотрениями сложной си- системы, т. е. обсуждение вопроса, почему дело обстоит так, что обыч- обычные термодинамические методы статистической механики дают воз- возможность делать в подавляющем большинстве правильные утверждения относительно систем, известных неполным образом (т. е. только макроскопически). В частности: каким образом, во-первых, возникает своеобразное, казалось бы, необратимое поведение энтропии и почему, во-вторых, для известной неполным образом (реальной) системы поз- позволительно подставлять статистические свойства (фиктивного) микро- микроканонического ансамбля **). И на эти вопросы мы должны ответить, пользуясь средствами квантовой механики. Как известно, в классической механике эти вопросы привели к построению двух детально разработанных теоретических систем: больцмановой и гиббсовой статистических механик. Первая теория не *) J. v. Neumann, Zs. f. Phys. 57, 30—70 A929). **) Здесь имеются в виду замкнутые и изолированные системы. Известно, что для системы, сообщающейся с большим тепловым резервуаром, характе- характеристичным является так называемый канонический ансамбль. Но методы статистической механики позволяют без труда свести этот случай к преды- предыдущему, если только тепловой резервуар присоединить к системе.
326 ДОПОЛНЕНИЕ смогла дать окончательного и удовлетворительного решения, потому что в ней приходится существенно пользоваться так называемым предположением о «беспорядке»,—а понимание природы этого «бес- «беспорядка» и представляет как раз основную задачу *). Вторая теория по своему подходу была бы вполне пригодна для этого: однако она привела к математической проблеме, так называемой проблеме квази- квазиэргодичности, оказавшейся абсолютно непреодолимой ни при тогдаш- тогдашнем состоянии науки, ни при нынешнем. Поэтому теория Гиббса приведет к цели, только если предположить правильность соответ- соответствующей математической теоремы. Далее, в общих принципиальных вопросах новая квантовая механика отличается от классической механики совершенно необычайной просто- простотой **). И именно благодаря этому обстоятельству в квантовой меха- механике цель может быть достигнута с помощью сравнительно простых математических средств, если только следовать гиббсову пути. Так, в дальнейшем окажется возможным доказать эргодическую теорему и //-теорему (которые являются двумя указанными выше постанов- постановками вопроса) независимо от каких бы то ни было предположений о беспорядке. Однако прежде, чем переходить к подробному разго- разговору об этом, не лишне сказать несколько слов о понятии макроско- макроскопического в квантовой механике. 2. Принципиальной трудностью квантовомеханического воссозда- воссоздания гиббсовой теории является то, что здесь нельзя избегнуть обра- обращения к понятию «фазового пространства», т. е.—для системы с / степенями свободы — к 2/-мерному пространству, описываемому/ коор- координатами (ft, .. ., qf и их / импульсами рх pf,—все важные для этой цели понятия (энергетическая поверхность, фазовые ячейки, микрокано- микроканонические и канонические ансамбли и т. д.) определяются в нем. В кванто- квантовой механике никак нельзя построить такое фазовое пространство, так как координата qk и ее импульс pk не могут быть измерены одновременно, напротив, между их вероятными ошибками (разбросами) &.qk и b.pk всегда имеет место соотношение неопределенности b.qk ¦ Ь.р^-г- ***). Более того, невозможно даже указать для какого-либо состояния системы два интервала /, J таких, что qk с достоверностью лежит в /, a pk с достоверностью лежит в J (этого нельзя сделать и тогда, *) Ср. (также и для дальнейшего) критическое обсуждение этих усло- условий в работе Р. и Т. Е h г е п f e s t, E n z у k I. d. Math. Wlss., Bd. IV, 4. D. (Art. 32) и далее Phys. Zs. 8 A907). **) Правда, в случае многих специальных проблем дело обстоит как раз наоборот. ***) Ср. W. H else n berg, Zs. f. Phys. 43, Heft. 3/4 A927), а также N. Bohr, Naturwissenschaften 16, Heft 15 A928). Относительно границы -j- см., например, H. W e у I, Oruppentheorie und Quantenmechanik, Leipzig, 1928, S. 272.
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И //-ТЕОРЕМЫ 327 когда произведение их длин намного больше, чем т— ! *)),—так что не только непрерывное фазовое пространство, но и его дискретные разбиения на ячейки лишены смысла! Несмотря на это, в действи- действительности совершенно очевидно и то, что при макроскопических измерениях координаты и импульсы измеряются одновременно,—здесь возникает даже представление, что это возможно благодаря неточности макроскопических измерений, которая намного больше неточности, при которой еще можно было бы опасаться коллизии с соотноше- соотношениями неопределенности. Как же согласовать эти два противоречащих друг другу обстоятельства? Мы считаем, что правильной является следующая интерпретация: при макроскопическом одновременном измерении координаты и им- импульса (или двух других величин, квантовомеханически одновременно не измеримых) в действительности одновременно и точно измеряются две физические величины, только эти величины не являются в точ- точности координатой и импульсом. Пусть, скажгм, это будут положения двух стрелок или места двух почернений фотографических пласти- пластинок **), —ничто не мешает нам измерить их одновременно и с доста- достаточной точностью, но связь этих величин с реальными интересующими нас физическими величинами (qk и pk) довольно неопределенна, при- причем мерилом этой необходимой по законам природы неточности связи как раз и является соотношение неопределенностей (ср. прим. ***) на стр. 326). Математическая формулировка: квантовая механика сопостав- сопоставляет величинам qk и рк известные операторы Qk = qk .. . и *) Это означает, что если волновая функция <f>(^i, ..., q/) обращается в нуль для всех значений q^, лежащих вне какого-нибудь конечного интер- интервала /, то ее коэффициенты Фурье с(ри ..., pj) (мы разлагаем / с(рх, ..., Pf)eh (p««» +/7*/) dpi _ dpf) должны всегда =^=0 при произвольно больших pk, **) Координату и импульс частицы можно представлять себе измерен- измеренными в смысле цитированных в прим. ***) на стр. 326 работ, скажем, следую- следующим образом: с одной стороны, частица освещается пучком света, сфокусиро- сфокусированным в приблизительном месте ее нахождения, и рассеянный свет фотографируется (координата) и, с другой стороны, частица освещается достаточно моиохроматичным и плоскопараллельным пучком света, причем отраженный свет фотографируется после прохождения через призму (для констатации длины волны) (импульс). Естественно, что должна соблюдаться связь между точностями, обусловленная соотношением неопределенностей. Таким образом получаем на двух пластинках два почернения, устанавливаю- устанавливающие с известными точностями координату и импульс.
328 ДОПОЛНЕНИЕ Рк — 1у---т— ...*), неперестановочность которых @кРкФ PkQk, раз- разность же равна, как известно, -к—. 1) соответствует одновременной неизмеримости этих величин **). Предположим теперь, что суще- существуют два других перестановочных оператора Qk и Pk, которые лишь мало отличаются от Qk, Pk, причем настолько мало, что для их соответственных отклонений мерой являются два числа Щк и ДРА, произведение которых не превосходит существенно -т- из соотноше- соотношения неопределенностей. (Естественно, что в силу PkQk — QkPk = = -j—. 1, Qk?k — PkQk—Q оно не может быть меньше -т- !) Немного тЛ, QuPu — ^0й=0 оно не может быть меньше ~ отличная, но, как легко убедиться, по существу, та же формулировка получается, если заметить следующее: перестановочные операторы Qk, Pk должны обладать полной ортогональной системой общих соб- собственных функций ***), назовем их <рх, ср2, ... Потребуем тогда от этой системы следующее: в любом состоянии ср„ дисперсии Qk и Pk меньше, чем ^Qlг и ДРА соответственно (и при этом AQfe • APft~j^j. Тогда одновременное измерение Qk, Pk, после которого должно наступать некоторое состояние срп, действительно дает нам одновре- одновременную информацию относительно Qk и Pk. Впрочем, достаточно отыскать полную ортогональную систему ср^ <р2> • • • с указанными выше свойствами; тогда Qk, P'k могут быть сейчас же установлены — для этого достаточно лишь задать их собственные значения в состоя- состояниях срл (п=1, 2, ...), каковые собственные значения целесообразно вы- выбрать равными математическим ожиданиям Qk, Pk в состояниях ср„ ****). *) Ср. S с h г б d i п g e г, Ann. d. Phys. 79, 8 A926). **) Ср. P. D i г а с, Proc. Roy. Soc. 113 A927) и W. H e i s e n b e r g, 1. c, прим. ***) на стр. 326. ***) Будем считать ради простоты, что реально измеренные величины Qk, Pk имеют только дискретный спектр, что бывает на самом деле, если мы имеем дело с конечным объемом. Тогда существование общей системы собственных функций доказывается в точности так же, как в случае обыч- обычных (конечномерных) матриц. Ср. по этому поводу F г о b e n i u s, J. f. Math. 84 A877), Hellinger и. Toeplitz, Enzykl. d. Math. Wiss., Bd. II, С 13 (Art. 41). ****) To есть / ?»(?!, .... qf)?dq,...dqf Ш
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 329 Это, по существу, убедительное допущение мы можем теперь подтвердить математически: каковы бы ни были два положительных числа е, rt с ет] —С • — (С—константа, ср. по этому поводу прим. *)), существует полная ортогональная система срх, ср2, ... такая, что в любом состоянии срл дисперсии Qk и Pk будут меньше, чем е, т) соответственно *). Задание срп и доказательство их свойств приводит к довольно затруднительным выкладкам **), приводить которые мы здесь не станем, тем более что сказанное до сих пор достаточно проясняет принципиально наиболее важное. Таким образом мы делаем следующее допущение о сущности макроскопических измерений: они являются исключительно измерениями одновременно измеримых величин (с взаимно перестановочными опера- операторами), которые связаны с простыми и не измеримыми одновременно физическими величинами (координаты, импульсы и т. д.) лишь на- настолько, насколько это допускается соотношениями неопределенно- неопределенности. В дальнейшем изложении работы должно быть показано, как это осуществляется в деталях. 3. Относительно общего формального аппарата квантовой механи- механики надо иметь в виду следующее. Состояния системы будут характери- характеризоваться известным образом комплексными функциямиcp=<p(<7i. • • •, <7/) (так называемыми волновыми функциями), определенными *) Как видно, С ml было бы идеальной Оценкой (использующей все возможности, допускаемые соотиошением неопределенности). Автору удалось л. шь достичь С < 3,600, но поскольку j- в макроскопических (CGS)-eAHHH- цах составляет я;10~28, то это несущественно. **) Нужно воспользоваться введенными Гейзенбергом, I. с. прим. ***) на стр. 326, волновыми пакетами — мы пишем q вместо qk и Опускаем остальные нз <?i> ..., д/, в указанном выше состоянии Q = q ... и Р = „ ... имеют средние значения а, Ъ и 2ти да I h \2 квадраты дисперсий б2,1— соответственно, — где н /, У = 0, ±1, ±2,... Получающиеся таким образом функции записываются в каком-нибудь порядке в виде последовательности н затем, согласно Шмидту (Е. Schmidt, Math. Ann. 63 A907)), «ортогонализируются». Это дает желаемую систему <h, ??>•••
330 ДОПОЛНЕНИЕ в «пространстве состояний» системы, т. е. в /-мерном пространстве, описываемом / координатами qx <fy, физические же величины — эрмитовыми операторами А, В, ... *). Важнейшими операциями с этими объектами являются: «внутреннее произведение» (ср, f) = J ¦•• j ?(<7i ?/Ж?1 4j)*d4\ ••-dq/ (* мы обозначаем комплексное сопряжение) и «абсолютная величина» qx ...dqf**). Простейшее описание состояний с помощью волновой функции ср де- делается так: математическое ожидание величины А в состоянии ср рав- равняется (Лср, ср). Задание всех математических ожиданий означает, по- поскольку одновременно с этим становятся известными математические ожидания всех степеней (т. е. так называемые высшие моменты рас- распределения вероятностей), знание всего распределения вероятностей любой величины, т. е. полную статистическую характеристику си- системы***). Нам нужна также статистика величин в системе, в которой имеется не одно состояние ср, а много состояний ср,, ср2> ... с соответствую- соответствующими вероятностями щ, w2, ... Тогда математическое ожидание А равно, очевидно, 2 дал (^ ?«¦ ?/))> чт0 удобнее записать по-другому. п Именно, будем описывать оператор А в некоторой полной орто- ортогональной системе функций матрицей а , а функции ср„ — векто- векторами *?([i,, v=l, 2, ...)****). Тогда 2 «„ (А ср„, срл) = 2 ™п 2 в „,<*," = 2 а, Г 2 <»я*?<1. т. е. если обозначить через U оператор с матрицей 2w х"х^*, то рассматриваемое выражение будет равно шпуру от AU *****). Тем са- *) В способе обозначений и методах, используемых ниже, мы придер- придерживаемся работы автора в Gott. Nachr. 11 Nov. 1927, S. 245 — 272. Однако все необходимое для поставленной цели будет резюмировано здесь. **) Вычисления с этими объектами описываются вкратце, например, в работе автора в Oott. Nachr., 20 Mai 1927, S. 1—57. ***) Ср. D i г а с, I. с, прнм. ***) на стр. 328 и работу автора, I. с, прим. *). ****) Ср. !. с, прим. **). *****) Ср. I. с, прим. *) н далее Dlrac, Proc. Combr. Phil. Soc, 29 Oct. 1928. Шпур — это сумма диагональных элементов матрицы; так как эта сум- сумма инвариантна по отношению к унитарным преобразованиям, то можно просто говорить о шпуре оператора безотносительно к определенной полной ортогональной системе функций.
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 331 мым статистическое поведение введенных смесей многих состояний харак- характеризуется оператором U на основании правила: математическое ожи- ожидание А равняется Spur(^{/). Мы называем U статистическим операто- оператором смеси. Как видно, знания его достаточно для описания смесей, причем нет нужды задавать отдельные состояния, из которых состоит смесь. Кроме того, удобно ввести особое обозначение для оператора с матрицей х^Хч (^ — вектор волновой функции ср): Р . Легко ве- верифицировать и другое определение: Р / = (/, ср) • ср (/ — любая дру- другая волновая функция). Тогда будет и=^хапР^ , в частности Р п является статистическим оператором самого состояния ср. 4. Теперь мы можем непосредственно перейти к (квантовомеха- нической) формулировке эргодической теоремы. А именно, мы обсу- обсудим сначала два подхода, которые хоть и не решают саму проблему, но, как нам кажется, проясняют и делают более прозрачными суще- существующие здесь соотношения. Классическая формулировка эргодической теоремы (точнее, квази- эргодической теоремы) звучит так: точка фазового пространства, изображающая систему, в своем движении (определяемом из диффе- дифференциальных уравнений механики) сколь угодно близко приближается к любой точке энергетической поверхности системы, при этом время, проводимое изображающей точкой в среднем за большой промежуток времени в какой-нибудь области энергетической поверхности, про- пропорционально объему этой области *). Тем самым в случае заданного состояния статистические свойства временного ансамбля (который по- получается усреднением каждой величины по всем временам) оказы- оказываются тождественными статистическим свойствам его микроканони- микроканонического ансамбля. Этот последний представляет собой смесь всех то- точек, изображающих систему, лежащих на энергетической поверхности, причем кускам поверхности равной площади (ср. прим. *) приписыва- приписываются равные веса. Пусть теперь в квантовомеханической формулировке Н будет опе- оператором энергии, cpj, ср2> • • • — его собственными функциями **), a Wv *) В качестве объема, как известно, здесь берется не B/ —1)-мерная площадь энергетической поверхности, а 2/-мерный объем прилегающего к энергетической поверхности слоя, т. е. интеграл от обратного градиента энергии по указанному куску поверхности. — На существенную (и часто не- недооцениваемую) разницу между двумя половинами приведенной в тексте формулировки квазиэргодической теоремы указывали П. и Т. Эренфесты A. с, прим. *) на стр. 326): вторая половина неизбежно необходима для обос- обоснования статистической механики Гиббса. **) Точнее, некоторая полная ортогональная система, образованная из них, — система координат, в которой Н — диагоналей. (Мы предполагаем, что сплошной спектр отсутствует.)
332 ДОПОЛНЕНИЕ W2, ... — соответствующими собственными значениями. Состояние ф —2ал • ?л эволюционирует с течением времени t (Щ®\ в смысле временнбго дифференциального уравнения Шредингера следующим образом: n л Прежде всего, здесь надо теперь проанализировать несколько под- подробнее понятие энергетической поверхности. Именно, с течением вре- времени постоянными остаются все | ап (t) |2 = | я„ |2, а не только мате- математическое ожидание энергии (Щ(, ф,) = 2 I ап (О I2 Wn. Поскольку л эти |яя(/)|2 характеризуют всю энергетическую статистику *), мы мо- можем сказать так: Закон сохранения энергии классической механики переносится в квантовую механику не просто в форме сохра- сохранения только средних значений, но в форме сохранения рас- распределения вероятностей энергии. Если бы мы определили кван- товомеханическую «энергетическую поверхность», казалось бы, естественным образом с помощью 2 ! ап I2 Wл == const, то о справед- л ливости эргодической теоремы не могло бы быть и речи — ведь су- существует бесконечно много «интегралов движения» | ах |2, | а212, ... Ее надо определить, скорее, посредством | ах |2 = const], | «212 == const2, ... Так возникает вопрос: Будь я„ = гп- еЫ"(г„^ О, О ^S а„ < 2гс), тогда энергетическая поверхность состоит из всех ф = 2 ап • ?л с а'п = л = гп • е ""@^<х'п < 2гс). Подходят ли тогда an(t) = rn- е *¦ h n п> произвольно близко ко всем а'п, т. е. -j-Wnt-\-a.n — к а„ (конечно по mod 2u, причем для всех »=1, 2, ...), и как велики будут «отно- «относительные времена пребывания» в заданных «„-интервалах? Мы мо- W жем спросить и так: Будет ли -jr-t сколь угодно близко подходить для надлежащего t к произвольной системе —^—— (mod 1 для всех »=1, 2, ...), и каковы будут относительные времена пребывания? Согласно теоремам Кронекера для выполнения первой половины тре- требования необходимой и достаточной является целочисленно-линейная независимость —-3- между собой, т. е. условие, что не существует *) Например потому, что они, согласно (#*ф/( ^О ~ 2 I an (f) |2 Wn' опРе- п деляют математические ожидания всех степеней энергии, т. е. все моменты ее статистики.
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 333 соотношения хх -~- +...-)- хп —г2- = 0 (л произвольно велико, но конечно; хх х„ целочисленны), если только не имеет места ра- равенство хх = ... = хп = 0 *). Из дальнейших теорем Вейля следует, что в этом случае времена пребывания также оказываются правиль- правильными, а именно, они пропорциональны произведениям длин интерва- интервалов **). Итак, в этой формулировке эргодическая теорема вытекает из того, что между термами —-тр- системы не имеется резонансов ***). Собственно, мы здесь потребовали даже слишком многого: дейст- действительно истинным, существенным для всех приложений, ядром эрго- дической теоремы является, как уже упоминалось выше, соответствие между временным ансамблем и микроканоническим ансамблем, а вовсе не вопрос о том, какой именно путь проделывает на энергетической поверхности точка, изображающая систему. Как мы знаем из 3., для этого необходимо лишь соответствие между статистическими опера- операторами этих двух ансамблей (их «настоящий» состав в отношении волновых функций здесь заведомо не может быть установлен). Пусть теперь tyt имеет статистический оператор Р^ , тогда речь идет о том, что он один раз усредняется (при фиксированных а„) по всем t (временной ансамбль), а другой раз — при t = 0 по всем а„ (мы пишем ад вместо а.', т. е. микроканонический ансамбль). Запи- Запишем оператор Р$ в виде матрицы в системе координат yv cp2, ... W »'+a") • В силу того, что tyt—ZirneKh ' ' <Рп> ег0 т' п-кот°- п нента будет равна гтгпе ^~( m~W")t+ i"m-an)) усредняя ее по всем аг, получаем 0 при тфп и гт при т = п. Чтобы тот же результат *) Ср. К г о п е с к е г, Ber. d. Preufi. Akad. d. Wiss. zu Berlin, 1884, S. 1071—1080, 1179—1193, 1271—1299. **) Cp. Wey 1, Math. Ann. 77 A915). ***) Может показаться странным, что здесь фигурируют —~, а не —УЬ—г——, но это связано с некоторой неточностью нашего рассмотрения. А именно, постоянный множитель (с модулем 1) не имеет смысла для вол- волновой функции if (например, он выпадает из статистического оператора Р^), поэтому мы должны были бы, собственно говоря, налагать указанные выше требования не на сами фазы -г- Wnt -f- an, но лишь на их разности, скажем, 2л на -j--(Wn — W{)t +(an — al) (п — 2, 3, ...). Тогда мы снова получаем тре- требования из текста, но уже относящиеся к собственным частотам —2-j- - (л = 2, 3, ...).
334 ДОПОЛНЕНИЕ получился при усреднении по t, должно быть —r-(Wm—Wn)^0, т. е. mn, при тфп. Это означает: вырождение должно полностью отсутствовать (условие намного более слабое, чем предыдущее!). Тем самым эргодическая теорема была бы доказана, казалось бы, в удовлетворительном объеме. Тем не менее этот результат не мо- может нас удовлетворить, поскольку здесь ничего не говорится о роли макроскопичности. Ведь мы здесь оперировали с совершенно точно заданными системами, так, например, энергетическая поверхность опи- описывалась точным заданием всех | ап |2. Для того чтобы подойти к только частично известным системам статистической механики, нам надо еще несколько модифицировать нашу постановку вопроса *). 5. Эта модификация должна состоять в первую очередь в том, что надо макроскопически переосмыслить понятие энергетической поверхности, т. е. надо расширить микроканоническйЙ ансамбль до совокупности всех состояний, энергетические статистики которых макроскопически неотличимы от энергетической статистики данных состояний. При таких обстоятельствах соответствия между времен- временными и микроскопическими средними следует требовать лишь для макроскопических величин. Но зато это ослабление влечет за собой существенное усиление, которое становится возможным лишь при макроскопическом способе рассмотрения. А именно, мы покажем, что для любого состояния системы значение любой (макроскопически измеримой) величины не только имеет микроканоническое среднее в качестве временнбго среднего, но и обладает малой дисперсией, т. е. временные точки, в которых значение отклоняется от среднего не мало, очень редки. Полезно сравнить это с соответствующими соображениями из клас- классической теории. Там указанную теорему, эквивалентную оправданию статистически-механических методов, разбивают на два шага следую- следующим образом: прежде всего надо показать, что для любой величины временная статистика совпадает с микроканонической, а затем, что для так называемых макроскопических величин последняя имеет малую дисперсию. Первое утверждение как раз и является классической квазиэргодической теоремой, которая не может быть доказана в на- настоящее время, а второе, напротив, можно легко доказать с помощью комбинаторных вычислений **). Взамен этого, как уже было сказано, мы будем называть эргодической теоремой указанное выше след- следствие из обеих частей. *) То, что доказанная только что теорема не может быть правильной эргодической теоремой, видно также из того, что ее предпосылки (невырож- (невырожденные энергии) являются слишком слабыми: они сохраняют силу для извест- известного контрпримера против классической эргодической теоремы! Ср. III., 3. **) Ср., в особенности, 1. с, прим. *) на стр. 326.
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 335 Более точная дискуссия будет приведена в ходе этой работы, здесь же мы укажем только на два следующих обстоятельства: во-пер- во-первых, в нашей формулировке эргодической теоремы мы потребуем, чтобы намеченное выше временнбе поведение действительно имело место для каждого начального состояния системы (для любого ф) без исключения (классически можно было бы вполне допустить исключения в частях энергетической поверхности, имеющих меньшую размерность). Во-вторых, надо подчеркнуть, что реальное состояние, с которым мы и работаем, является волновой функцией, т. е. чем-то микроскопическим, —если бы мы здесь действовали макроскопически, то это означало бы введение гипотезы о беспорядке, но мы как раз этого хотим безусловно избежать. То же самое можно сказать и об операторе энергии, который фигурирует в зависящем от времени дифференциальном уравнении Шредингера *), его тоже надо рассма- рассматривать точно (микроскопически). (Иначе, конечно, будет при по- построении энергетической поверхности, что будет видно из дальней- дальнейшей дискуссии.) Перейдем теперь после сказанного к небольшому разговору об условиях, которые оказываются необходимыми для справедливости эргодической теоремы. 6. Они распадаются на две группы: во-первых, те, которые отно- относятся к (микроскопическому) оператору энергии Н, во-вторых, те, которые относятся к подразделению (макроскопической) энергети- энергетической поверхности на фазовые ячейки и к величине последних. (Дальше мы точно установим, что следует понимать квантовомеха- нически под энергетической поверхностью, фазовыми ячейками и дру- другими конструкциями в фазовом пространстве; предварительно же вполне достаточно будет оперировать с этими понятиями так, как это было обычным в доквантовомеханической теории. В частности, под фазовыми ячейками мы понимаем такие подразделения фазового пространства, которые могут быть осуществлены с помощью макро- макроскопических измерений.) Относительно энергии оказывается: разности термов (собственные колебания) должны отличаться друг от друга, а также и сами термы (отсутствие вырождения!), т. е. если Wx, W2, ... являются собствен- собственными значениями, то все Wm — Wn {тфп) должны отличаться друг от друга, а также и все Wn. (Допустимы даже редкие исключения!) Как видно, по своей силе это условие занимает промежуточное поло- положение между двумя найденными в 4. В раз)гмности этого условия мы убедимся в разделе III. 3. этой работы. В частности, мы увидим, что оно нарушается как раз в классических контрпримерах против эргодической теоремы (идеальный газ без соударений, объем, запол- *) Оно гласит -гт- i/t — —г— Hi/t; в 4. мы воспользовались его явным решением.
336 ДОПОЛНЕНИЕ ненный излучением без поглощения) и опять восстанавливается известными (но признаваемыми действенными лишь эвристически) контрправилами (введение столкновений, а также поглощений и испу- испусканий соответственно). Относительно величины фазовых ячеек получается в существенном следующее: число состояний {квантовых орбит) в каждой фазовой ячейке не только должно быть очень велико, но в среднем должно быть все еще велико по сравнению с числом фазовых ячеек на их энергетической поверхности. Более подробное разъяснение этого условия оставим до дальнейших обсуждений этой работы, здесь же укажем только на следующее: если совершать предельный переход Л—>0 (так что квантовая механика приближается к класси- классической), но не менять макроскопически технику измерений, то пер- первое число будет неограниченно возрастать, тогда как второе будет постоянным, так что наше условие выполняется все лучше. Итак, его выполнимость обеспечена во всяком случае, если макроскопи- макроскопическая техника измерений слишком груба, чтобы достигнуть кванто- квантовых эффектов (тогда Л практически равно 0). Еще остается сформулировать Я-теорему (которую мы тоже до- докажем). Мы можем естественным образом сопоставить каждому состоянию ф энтропию, а равным образом и его микроканонический ансамбль *), а затем проследим за временным изменением энтропии и сравним ее первоначальное значение с конечным (последнее, как легко показать, всегда s= начального). Как и в классической меха- механике, здесь также не может быть и речи о постоянном возрастании энтропии и тем менее о преимущественно положительном знаке ее производной (или же отношения разностей): здесь, как и там, остаются в силе возражения, связанные с обратимостью и повторимостью. В духе обсуждения этого обстоятельства, проведенного П. и Т. Эрен- фестами (ср. 1. с, прим. *) на стр. 326), мы склонны скорее видеть существенную часть утверждения Я-теоремы в следующем: времен- временная средняя энтропии состояния tyt лишь мало отличается от энтро- энтропии микроканонического ансамбля,— и поскольку последняя является верхней гранью для первой, это означает, что энтропия состояния tyt спускается сколько-нибудь заметно ниже границы лишь очень редко. Мы увидим, что Я-теорема справедлива при тех же предположе- предположениях, что и эргодическая теорема. Итак, резюмируя, можно сказать вот что: В квантовой механике эргодическую теорему и Я-теорему можно доказать во всей стро- строгости и без гипотезы о беспорядке, тем самым устанавливается гаран- гарантированная применимость статистически-механических методов к тер- термодинамике без привлечения каких бы то ни было дальнейших *) Ср. конец 1.3„ где приводятся подробности относительно связи этой энтропии с энтропией, определенной автором в Oott. Nachr., 11 Nov. 1927, S. 273-291.
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 337 гипотез *). Совершенно ясно, конечно, что это связано с тем обстоя- обстоятельством, что, как и дифференциальные уравнения классической механики, зависящее от времени уравнение Шредингера, лежащее в основе квантовой механики, обладает свойством обратимости и повторимости *), ввиду чего само по себе не может быть доста- достаточным для объяснения необратимых процессов**). 7. Можно было бы сказать еще несколько слов о связи этой работы с другими квантовомехаиическими исследованиями вопросов статистической механики и термодинамики. Статьи Шредингера *), а также Нордгейма***) и Паули****) описывают макроскопические соотношения на основании предположения о беспорядке, а потому отно- относятся к другому направлению. Одна более ранняя работа автора стоит полностью на микроскопической точке зрения и также преследует другую цель: из предположенной справедливости феноменологиче- феноменологического второго закона термодинамики сделать вывод относительно величины энтропии. Автор хотел бы здесь подчеркнуть, что он считает себя обязанным выразить глубокую благодарность Е. Вигнеру за многочисленные обсу- обсуждения, в процессе которых возникли постановки вопросов этой работы. I. Квантовомеханическая формулировка основных понятий статистической механики Гиббса 1. Как говорилось и было обосновано во введении, мы исходим из того, что вообще все макроскопически возможные наблюдения могут быть совершены одновременно. Их операторы коммутируют, следовательно, между собой, а потому существует полная ортогональ- ортогональная система coj, co2, ... волновых функций, которые для каждого оператора являются собственными функциями (ср. прим. *) на стр. 328). При этом следует ожидать, что среди coj, co2, ... имеются группы многих сол, для которых макроскопические операторы имеют одни и те же собственные значения: ведь в противном случае проведение *) Ср. по этому поводу рассуждения Schrodlnger'a, Ann. d. Phys. 83, 15 A927), в особенности в последнем параграфе. Наши результаты позволяют провести его рассуждения без допускаемого им «статистического предположения» (гипотезы о беспорядке), т. е. свести во всей строгости к обычной статистической интерпретации квантовой механики. Тем самым дается ответ на поднятый Шредингером 1. с. вопрос, надо ли и в квантовой механике бороться с эргодическими трудностями. **) Правда, квантовая механика знает один необратимый элементар- элементарный процесс, а именно, процесс измерения. Этот процесс необратим (ср. 1. с, определение указанных процессов дается там в прим.21), стр. 283), но, имеет лн он какое-нибудь отношение к необратимости реально происходя- происходящего, остается невыясненным. В этой работе мы не будем больше остана- останавливаться на этом. ***) L. Nordheim, Proc. Roy. Soc. 119A928). ****) w, p a u 11, Sommerfeld-Festschrift, 1928, S. 30—45. 22 И. Нейман
338 ДОПОЛНЕНИЕ всех макроскопически возможных наблюдений позволяло бы добиться полного различения между coj, co2, ... (т. е. абсолютно точного опре- определения состояний, что, вообще говоря, не так). Эти группы будем обозначать (заменяя применявшуюся до сих пор простую систему индексов п = 1, 2, ... двойной р = 1, 2, ... и X = 1 sp) через {со1;) i?>s р], /?=1, 2 так что для всех макроскопических величин *) группы и^ со^ представляют собой взаимно вы- вырожденные функции. Поэтому система а>1 ..... u>s равнозначна любой системе со' со' , которая получается из первой с по- •р р'р мощью линейного унитарного преобразования. Если все состояния одной группы {u>liP, .... шs р) смешиваются с весами 1 : ... : 1, то получается статистический ансамбль со стати- sp стическим оператором — Ер = — V ?<*. . причем этот оператор ?р р р x=i не изменяется при замене <оХр на любые со^ (ср. выше), в чем легко убедиться. Каждый макроскопический оператор имеет соХр в качестве собственных функций, т. е. является линейной комбинацией операто- операторов Pw с коэффициентами, равными собственным значениям **), а поскольку все соХр с одним и тем же р имеют одно и то же собственное значение, то будет также линейной комбинацией Ер, — отметим это для дальнейшего. В остальном —? является, как это видно из его построения, sp статистическим оператором ансамбля, для которого все макроскопи- макроскопические величины имеют значения, относящиеся к р-й группе (при этом все из sp квантовых орбит обладают одними и теми же ве- весами), — он соответствует таким образом р-й из альтерна- альтернатив, относящихся к свойствам системы, которые могут быть отличены друг от друга с помощью макроскопических изме- измерений. Тем самым он является эквивалентом «фазовых ячеек» ста- *) Макроскопической величиной является такая величина, значения ко- которой могут быть точно установлены с помощью макроскопических измере- измерении. Итак, если А может принимать все значения от —с» до -f-oo, a макроскопическая неопределенность характеризуется тем, что эти значения можно различить между собой лишь для различных интервалов k, k-\-\ (k = 0, ±1, ±2, ...), то тогда макроскопически измеримой будет лишь f (А), где /(х) является следующей функцией: f(x) = k для Sgj;< k-\-l (? = 0, ± 1, ±2, ...). Ср. также дискуссию во введении 2 и прим.*) на стр. 327. **) Эрмитов оператор с собственными функциями xi> Хг> ••• и с соответствующими собственными значениями wl, «j2> ••• должен равняться 2 W*n Ра ^Р" также '• с#> ПРИМ- *) на СТР' 330<
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 339 тистической механики Гиббса. Число sp=Spur?p (Spur означает шпур, ср. прим. *****) на стр. 330) является числом истинных (микроскопи- (микроскопических) состояний, т. е. квантовых орбит в этой ячейке, —его вели- величина является, таким образом, мерой грубости макроскопического способа рассмотрения. 2. Рассмотрим теперь оператор энергии Н с собственными функ- функциями cpj, ср2, ... и собственными значениями Wv W2, ... соответ- соответственно, так что H=^WnP . Следует подчеркнуть, что Н дол- п л жен быть точным оператором энергии, а вовсе не каким-нибудь макроскопическим приближением. Функции ср„, в общем, не являются функциями тгр и Н не есть линейная комбинация Ер, так как энергия, не будучи макроскопи- макроскопической величиной, не может быть измерена абсолютно точно с по- помощью макроскопических средств *). Но с известной (незначительной) точностью это все же возможно, т. е. можно подразделить собствен- собственные значения энергии Wx, W2, ... системы на группы {Wh а, ..., Ws t \ (мы здесь снова заменяем простую нумерацию Wn, ср„ с п~ 1, 2, ... на двойную Wpiа, срра с а = \, 2 р=1 Sa) таким обра- образом, что все W а с одним и тем же а расположены близко друг- к другу и лишь те из них, для которых а отличаются между собой (т. е. полные группы) могут быть различены макроскопически. Как сформулировать теперь, что уже сама принадлежность значений энер- энергии к одной группе \Whа, ..., WSa<oj макроскопически измерима? Мы сделаем это, применив упомянутый выше и неоднократно используемый в 1. с, прим. *), стр. 330, искусственный прием. Пусть fa (х) — функция, которая для х = Wh a, .... WSai a (а фиксировано) принимает значение 1, а в остальных случаях — 0. Тогда /о (//) будет величиной, которая имеет значение 1, когда значение энергии при- принадлежит к указанной группе, и 0 в остальных случаях, — следова- следовательно, она макроскопически измерима. Из H=^W'nPv следует fa(H) — 2tfa(Wn)P (ср. 1. с, прим. **), стр. 329), так что П sa — 2 Лр • а эта последняя группа должна быть линейной ком- комбинацией ?. Далее 2 Л» • а также и каждый ?_— 2 Р* v p=i ч>.а р x=i х> р равняется своему квадрату, а произведение любых двух различных ? *) Вспомним хотя бы условия наблюдения обычного газа! Конечно, в принципе энергия с дискретным спектром (ср. стр. 332) при благоприят- благоприятных обстоятельствах измерима с абсолютной точностью: можно, например, рассудить, находится осциллятор в основном состоянии или нет. 22*
340 ДОПОЛНЕНИЕ равно 0 *); отсюда следует, что в упомянутой линейной комбинации Е каждый из коэффициентов равен своему собственному квадрату, т. е. S Sa 2 равен 0 или 1. Итак, 2 Лр является просто суммой нескольких ?р, которые можно назвать ?1а, ..., ?N a: Sa Na =?/•¦•• ,? Na Взяв шпур от этого равенства, получим Sa — 2 s,, a-) Поскольку, V— 1 / Na Nb согласно сказанному выше, произведение сумм 2^v а и 2 ^>г> V=I ' V=l (а Ф Ь) равно сумме слагаемых ?, общих обеим суммам, и поскольку, S 2 с другой стороны, это произведение равно произведению сумм 2 Лр sb p=I p." и 2 Р • которое обращается в нуль, то сумма общих ? равна 0. Итак, общих слагаемых нет, потому что сумма нескольких ?р, т. е. нескольких Рш , никогда не исчезает**). Наконец, ?va исчерпывают ?р (до сих пор мы знали только, что они образуют взаимно однознач- однозначную систему индексов некоторого подмножества), что, согласно только что сделанному замечанию, будет гарантировано, если только со iva со будет доказано равенство 2 2 ?., а ~ 2 Ер- Левая часть является a=l v=l ' р=1 суммой всех ?v а, т. е. всех Р , т. е. 1 (в случае полной орто- ортогональной системы Xv J.2< • • • сумма всех Рг равняется 1 ***), а ср образуют полную ортогональную систему); правая часть является суммой всех ? , т. е. суммой всех Рт , т. е. тоже 1 (сох, р также л, р *) Это будет доказано, если мы сможем показать, что для произвольных двух (но различных) элементов <р. ф некоторой ортогональной системы функ- функций имеют место соотношения /^ = Pf, Р?Р^ = 0. Пусть / — какая-нибудь волновая функция, тогда (ср. введение, 3.) ')^/=((/. ?)•?. ?)•? = (/. ?)•(?. ?)•?==(/. ?)•?= V' P^f=((f' 40-«Р. ?)•? = (/. Ф)'(Ф. ?)-? = 0. **) Из Рш, -f- Рщ» -f- ... =0 (со', ш", ... взаимно ортогональны), если умножить его на Рт', следует равенство Рт, =0, что заведомо неверно. ***) Если привлечь матричное определение оператора Р (введение, 3.), то можно убедиться, что это тождественно обычной форме соотношений полноты. Ср. также 1. с, прим. *) на стр. 330,
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 341 образуют полную ортогональную систему), — вместе с тем все до- доказано. Таким образом, ?v>a, sv>a с о=1, 2, .... v=l, .... Na— это просто заново перенумерованные ?р, sp с р=\, 2, ... Соответст- Соответственно будем писать шх, ¦,, а вместо шх, Р- Положим "а— j!mi гю — ZJ *•¦», a' р = 1 тр> a v=j Как видно, -я— Аа является смесью состояний (?1 а 9s а с ве" сами 1 : ... : 1 или же смесью обсуждавшихся выше смесей Ei а, .... ?/v , а> соответствующих фазовым ячейкам с ве- sl, a ' sNa, a "' сами *1>e:...:^e>e. Вполне понятно, с другой стороны, что является аналогом этих представлений в гиббсовой теории: -=— Аа соответствует энергети- энергетика ческой поверхности, т. е. микроканоническому ансамблю, Л^а является числом фазовых ячеек ?v> a на энергетической поверхности и Sa = = Spur Аа является числом истинных состояний, т. е стационарных квантовых орбит на энергетической поверхности. Макроскопически возможные измерения энергии разбивают тем самым множество мыслимых состояний на энергетические поверхности, соответствующие Аа, о=1, 2, ...; дальнейшие измерения энергии (которые разбили бы Аа на ср д, р=1, ..., Sa) с этими средствами невозможны. Если же дальнейшие измерения все-таки макроскопи- макроскопически возможны, то они должны относиться к таким величинам, опе- операторы которых не коммутируют с Н, т. е. к величинам, которые не могут быть измерены одновременно (с микроскопической) энергией. На классическом языке это означает, что они относятся к неинте- неинтегралам движения, к изменяющимся во времени величинам *). Эти из- измерения разбивают энергетическую поверхность Аа на фазовые ячейки ?ъа, v=l, .... Na. Дальнейшее разбиение (которое разбивало бы ?Vj а на o>x, v, а> ^ = 1. • • ¦. sVj a) макроскопически вообще невозможно. Тем самым величина Na является мерой того, насколько сильно пересекаются макроскопические методы измерения величин, неизмери- неизмеримых одновременно с энергией, т. е. в какой мере неточность макро- макроскопических измерений энергии обусловлена естественным образом *) Например, в случае газа, заключенного в сосуде К, полная энергия молекул, находящихся в левой половине К, с известной точностью макроскопически измерима, но она не является интегралом и колеблется во времени,
342 ДОПОЛНЕНИЕ соотношениями неопределенностей. Напротив, величина sv> a (т. е. величина фазовых ячеек ?ъ a) является мерой неточности макро- макроскопических методов как таковых, т. е. вытекающей из их непол- неполноты. Неточность, связанная с Na, компенсируется знанием неинте- неинтегралов, она не является слабой стороной нашей измерительной аппаратуры, но зато неточность, связанная с sVi a, таковой является. Наконец, Sa = 2 sv, а является мерой для произведения обеих не- точностей: для полной, настоящей неточности измерения энергии. 3. Пусть теперь задано произвольное состояние Ф (волновая функ- функция Ф нормирована, т. е. |Ф|2 —(ф, ф)—1). Вероятность того, что при макроскопическом измерении в этом состоянии будет получено значение из фазовой ячейки ?Vj a, равняется, как известно, сумме вероятностей переходов из этого состояния в состояния описываемые собственными функциями w1> wa ws ^ а, образующими ?Vj a, т. е. sv. a *v. a "У, I СФ ш, 1 2 = У! (Р Ф, ФЧ| = С? Ф Ф1. \— 1 Л=1 ' Можно сказать, что настолько плотно занята ячейка ?v a в со- состоянии Ф. Для того чтобы значение энергии относилось к группе {^i,a- •••> Ws ifl}, получается соответственно выражение Sa Sa p=I P' p = l 'f а Это является также числом заполнения энергетической поверхности Аа. В духе этих представлений имеем Na 2 {?,. «Ф. Ф) = (Авф. ф). . 2 (Авф. ф) = (ф. ф) = 1 • v=1 а = 1 Теперь мы можем определить микроканонический ансамбль, при- принадлежащий состоянию Ф, т. е. задать его статистический оператор. Если бы одно только (АаФ, Ф) равнялось 1, а все остальные были бы равны 0 *), то мы должны была бы, конечно, выбрать в качестве статистического оператора оператор -к— Аа, рассматривающийся уже в 2. **). Если же несколько (или все) (АаФ, Ф)=?0, то надо определять *) Отметим, что все наши «числа заполнения» по своему построению =?0. **) В 1. с., прим. *) на стр. 330 приводились общие основания для того, чтобы всегда этот статистический оператор принадлежал тому статисти- статистическому ансамблю, о котором известно лишь то, что его энергия лежит в а-й группе.
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 343 по-другому, а именно установим, что тогда должна браться смесь ¦н- А1( -р- А2, ¦ ¦ • с весами (АЛ, ф): (А2Ф- Ф): • • • • Микроканонический ансамбль будет иметь тогда следующий статистический оператор: 0=1 Собственно, оправданием этого определения является лишь после- последующий успех: эргодическая теорема и //-теорема справедливы лишь в этом случае. (Во всех практических случаях, конечно, все (Аа<\>, ф), кроме одного-единственного, очень малы.) Остается еще определить энтропии для iji и ^ (самого состояния и относящегося к нему (виртуального) микроканонического ансамбля). Не имеет смысла пользоваться здесь выражениями для энтропии, дан- данными автором, так как они вычислены с точки зрения наблюдателя, который может проделать все принципиально возможные измерения, т. е. безотносительно к макроскопии (например, каждое состояние («чистый случай») имеет там энтропию 0 и лишь смеси имеют энтро- энтропию > 0!). Если принять во внимание, что наблюдатель способен измерять только в макроскопическом смысле, то придем к другим выражениям для энтропии (имеющим ббльшие значения, так как на- наблюдатель теперь менее удачлив и при определенных обстоятельствах может отнимать у системы лишь меньшую механическую работу); но теорию можно построить также и в этом случае. Е. Вигнер рас- рассмотрел, каким образом надо поступать *). Формулы для энтропии 5(ф), SA/ф) состояния <j> и мнкроканонического ансамбля U^ соот- соответственно имеют вид со =— У "а v=l 0=1 Впрочем, эти формулы для энтропии тождественны с обычными фор- формулами, основанными на больцмановском определении энтропии (с использованием формулы Стирлинга). Стоит лишь заметить, что *) Е. Вигнер устно сообщил автору относящиеся сюда результаты, до сих пор еще не опубликованные. Здесь будут использованы лишь формулы, требуемые для наших целей, нет необходимости обсуждать общую теорию. **) Мы опустили обычный множитель к (постоянная Больцмана), т. е. за единицу температуры принимается эрг на степень свободы.
344 ДОПОЛНЕНИЕ (?,1Йф, ф), (Ааф, ф) являются числами заполнения фазовых ячеек, энергетических поверхностей соответственно, a s4i a, Sa — числа на- находящихся в них квантовых орбит, т. е. их так называемые априор- априорные веса. II. Проведение доказательств 1. Временная эволюция ф, исходного состояния ф определяется из зависящего от времени дифференциального уравнения Шредингера оо sa \ Н— оператор энергии, = 2 2 ^, « ' ^ ) ¦ Таким образом, 0=1 р=1 Р' > в/ если оо sa 0 = 1 р— 1 то будем иметь а= 1 р = Г Положим для краткости *,. a = (?v, аЬ' Ы «о = (АвФ|. Ь) = (КЬ Ф) (оба последних выражения равны друг другу, потому что 22 = 2 (^ Ф«. W == 21 «v ?р, о) I2 = 1 ч т а ' 1 a не зависит от t). Как видно, 2-"Ч а==иа' 2 "а1^'- -^v, a зависит v=l ' а=1 от Л а ма не зависит*). Из определений энтропии нам известно, что х,1п, иа неотрицательны и что имеют место соотношения o=l v=l *) Так что микроканонический ансамбль (/ф = ^, -^- Да также не из- меняется при замене ф на Фл
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 345 Так как сумма всех хч>а, как и всех иа, равна 1, то все они ^ О, ^1 и вместе с тем обе энтропии всегда Sg 0. Займемся теперь по- подробнее соотношением между их величинами. Имеем §^х^а^иа\ заменим хъа переменной z и примем сна- чала 0^z^= а< так что z — 1 ?| 1. Тогда будет i Г Sa .f eLs,,e«a J s,,aua Sa З В силу j—к ной величине + ... = 1, сумма последних членов по абсолют- v, аиа Г 5а , I2 ^— и— г — 1 I , поэтому можем написать •За lS4, aua J Чтобы доказать это для остальных значений z, сравним левую часть (без |...|) с половиной правой. Для z= s*'?Ua обе исчезают, вообще же производные равны ===== In \ z Sy, aua 1 __ L -Sa J
346 ДОПОЛНЕНИЕ Первое выражение, очевидно, всегда gg второго и Щ 0 для z^s~"?Ua > поэтому левая сторона Щ, чем половина правой для z Щ 5"'оа"а-, но она всегда >0. Тем самым имеем всегда — i, a Положим теперь z — x4>a и просуммируем по всем v=l, Na Nd В СИЛУ 2 sv а — $а' S Jc, a = ив ПОЛуЧИМ l ' 1 ' Na v. a »=1 v-1 Если теперь просуммировать еще по а = 1, 2, ..., то будет Л=1 v=l Эта оценка позволит нам доказать //-теорему. Перейдем теперь к эргодической теореме. Окажется, что и для нее дело сведется к оценке того же выражения. 2. Пусть А — макроскопически наблюдаемая величина, т. е. * = 2 Si* А а- а=1 ч=\ Функции шх> v a фазовой ячейки ?v a являются собственными функ- функциями А, соответствующими собственным значениям tjVj a, т. е. tjv является значением А в фазовой ячейке ?va. В состоянии ift и в микроканоническом ансамбле U^ величина А будет иметь математические ожидания СО Л^ СО JV e=lv=l ''" *" a=l v=l "'" 1lJ
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 347 spur(ли$=spur 2 Si'.«?'.«'SS|;?H = a=l v=l соответственно. Назовем их Ед (ф) и ?л (#ф), тогда можем дать оценку (привлекая неравенство Шварца): \а=1 v=I ( °= "а \2 У V л/ S,,aUg ,/ Sa ( S,,aUa\ -\ h l v sa ^« v a*a s \a=l v=l I2 J a=l v=l a = l v = l Назовем первый множитель т;2, в силу а а s и \ч \Л s и \Ч \^ s и 1 — а=1 v=l a=l v=l это — среднее значение значений т;2 а величины А2, а именно, микро- микроканоническое математическое ожидание: U^ как раз является смесью •к- Аа(а= 1, 2, ...) с весами иа, т. е. смесью ?v (а = 1, 2, ... ; <>а si, a ' v = 1 Л^а) с весами v'а а и А2, как мы знаем, имеет в ?Via значение т;2 а. Поэтому в любом случае t] является разумной мерой порядка величины для величины А. Итак, имеем а=1 v=l *) Число членов уменьшается благодаря тому, что fv> аЕ,^, ь = 0, если только не имеют места равенства v = щ а — Ь, "а в этом последнем случав произведение равно ?v, a и его шпур равен sv, a.
348 ДОПОЛНЕНИЕ 3. Усредним теперь по времени t, что будем обозначать через М(. Тогда ,a«aL v'a Sa J Тем самым эргодическая теорема и //-теорема будут доказаны еди- единым махом, как только мы покажем, что Mt {•••}, стоящие справа, равномерно малы для всех начальных состояний ф (т. е. для всех rt,a- °W 2 2 г2 =|ф|2=1 ). (Заметим, что в *v>a входят Л а=1 р = 1 г' / ''р, а- ар, а> в ма входит лишь г а, все остальное — константы.) Чтобы это показать, подсчитаем сначала дг,_в. Будет и дальше sa Р, »=1 (мы и р, а а, а учитываем, sa ^ гр, ага, р, а= 1 р?=т что a р=1 '"' Sa X (f,, a?P, а- Та, а) + S ГР, Л (?v, а?Р, а- ТР, а) ~ ^f Р=1 *) Число членов уменьшится из-за того, что (?Vl atp 6, ^Bj c) = =(tpp, j, Яч", а?,, с)=0, если только не имеет места равенство a—b—с. Достаточно показать, что fv, а<рр,г> = 0 при а Ф b или же (в силу fv, аДа = ?Vl а, ср. sa I., 2.) Да<рр, ft = 0. Это следует из Да = ^У, Pf , так как <р„, ь ортогонально а=1 т'а ко всем <ра,а.
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Н-ТЕОРЕМЫ 349 Это выражение надо возвести в квадрат и усреднить по /, тогда выпадут все члены с eic'(, где с ф 0. Если поэтому выполняется при р^о *L(W9-Wa)*0, если только не рфр', афа', —т. е. если для каждого фиксированного а все Wp.aCp^L 2, ...) отличны друг от друга, и равным образом все W а — WQ<а(рфа, р, о=1, 2, ...), —то мы получим Sa (\ г 5у аиа Х\ — Vr2 Г2 \(Е ш , ср ^ 1 р, а= 1 Положим теперь Мах ?ф: р, »=i, ¦ Мах P=i....,sa где Mv а, Nv a — константы, т. е. не зависят от t, r a и а (т. е. от tyt). В силу ^ г2 а = ма будет тогда р,а=1 \р=1 и поэтому 00 00 Na 2 S4, gUg T °° /^ ^ В силу Уиа=1 это также g= Max V__s_(M a + Nv a) , при o^l e=1.2. ... \~ sv. a ' ' у этом достаточно ограничить Мах такими а, для которых и j= о, в=1,г,...
350 ДОПОЛНЕНИЕ т. е. энергетические поверхности которых на самом деле входят в микроканонический ансамбль. Тем самым цель будет достигнута, если мы покажем, что v=l мало для таких а, причем тогда наш результат будет иметь место для всех таких ф: поскольку названное выражение является константой, т. е. не зависит от ij> (t, r^a, ар>а) — в него входят лишь ?va (и тем самым Sa, Na, sv> a, Аа, равно как и свх> v> e). Для того чтобы оценить это выражение, надо оценить Mva, Nv>e. 4. Мы считаем Н, а вместе с ним W а, ср а фиксированными (и удовлетворяющими условиям из 3. *)), так же как и Sa, Na, sVj a, и Аа, и варьируем лишь ?va внутри этих границ. Это означает, что мы варьируем ортогональную систему o>Xj v a(v=l Na\ X=l,..., sv J, которая связана лишь условием 2 2 Р°> = ^а1 и полагаем Еч<а= 2 Ло , v=l, ..., Na. Заметим, что все такие ортого- ортогональные системы <0XjVja возникают из одной из них, скажем из шх>,>а, с помощью линейных унитарных преобразований (поскольку а фикси- Na ровано, в ^}jS a — S измерениях)! (Можно вспомнить, например, V=I ' матричное определение Рт, введение, 3..) MVia, N,a зависят тогда еще лишь от a>Xj v> а и их никоим образом нельзя сделать настолько малыми, как это нам нужно при каждом выборе системы (этого нельзя также избежать с помощью каких бы то ни было разумных условий на Sa, Na, sVi(l). Если, например, шх,,,а совпадают с ср (а фиксировано, обеих имеется по Sa штук), то мы видим, что *) Эти условия можно слегка ослабить. Так, можно было бы полностью Отказаться от различия самих W?ia и потребовать от W?l а—Wa, a только следующее: должно существовать такое разбиение пар р, а с р ф а, о, о=1, ..., Sa на k групп, Что внутри каждой из этих групп разности Wfl a—И^о, а отличаются друг от друга,—будет ли k для всех а фиксирован- фиксированным числом и будут ли далее достаточно хорошо выполнены указанные ниже условия относительно соотношений между величинами Sa, Na, sVl а, не играет никакой роли. Это означает: небольшие нарушения наших условий не причиняют вреда. Мы не будем останавливаться на этом более подробно. (В частности, отказ от первого условия не дает большого выигрыша: ведь из Wo a = W, a, W9,ia = Wa,ia сейчас же следует, что W? a—Wa a =
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 351 любое (?„<рр, a, «Ре, а) принимает среди прочих и значение 1, так что 1 Ц^-\ i?-v (если, что всегда имеет место, все и потому т, —— (Mv mm 5V| a ' ^ *- v=l т. е. для больших Л/в произвольно велико. Неблагоприятный результат в этом случае зависит, естественно, от того, что подобный выбор шх, v, а вообще не является разумным: ?v> a имеют тогда те же собственные функции, что и Я, а потому перестановочны с ним, — а этого не может быть (ср. I. 2.)! Между тем такое поведение является лишь сингулярным и исклю- исключительным, для преобладающего большинства систем u>>;Vj a, о кото- которых шла речь, Mv>a, Nv_a имеют правильный порядок величины. Но прежде чем доказывать это, мы хотим (неточно!) сориентиро- сориентироваться в том, чего мы могли бы ожидать в лучшем случае для MV) a, NV) a- С этой целью мы поступим так: вместо того чтобы усреднять Mv> а = Мах (| ?,_ асрр,, ?ф',?.'=1 Sa Nv,a= Мах (?,|в«р , тр,й)-^ p=i, ...,sa \l ^^ по всем возможным системам и\ v,a (т. е. установить, какие значения преимущественно принимаются; как определяется усреднение и как оно осуществляется, будет детально показано в приложении; ср. также дискуссию в III. 1.), мы усредним сами |(?,, „'-р., а. <рр, аI2 =l Sa) и а затем возьмем максимум. Мы заменяем, таким образом, среднее от максимума максимумом среднего—так получаются неправильные, причем слишком заниженные (т. е. слишком благоприятные) числа, но для первой ориентировки этим можно удовлетвориться. Как будет показано в приложении к этой работе, средние от l?v, а% «Т., а)|2 (Р Ф 3). (?„ a9f. a- ?Р, а)' { (*„ «Тр. a' <?t, а) j равны соответственно ?"¦ а (fа ~ s"'Na) , -^-^-, s"' "E""~ Sv:o) , так что Ms?1) s S=(S+l) если s^a<^.Sa (как и бывает на самом деле), то будем иметь для ее с средних ~, -"' а , -^. Подставим поэтому в виде опыта Sa Sa Sa
352 ДОПОЛНЕНИЕ вместо MVja, NV; a величину 2 ¦ тогда Sa 2Na v=l N v?iSv'a S Это мало, если -$г- мало, т. е. если —rj = -~ велико. Итак, Sa Na Na s^t a, а значит, фазовые ячейки должны в среднем быть большими. Этот результат совершенно разумен, мы перейдем поэтому к кор- корректному усреднению MVj a, Ns, a no coXj Vj a. б. Для средних от MVi a, NVj а по всем сох> Vj a N. s. . в приложении будут найдены верхние границы ¦ ^- и —^^—~ ¦Sa Sa соответственно. Как видно, они в — — и соответственно в S^ln.^ раз больше использовавшихся в 4. чисел (полагаем 1 , аа в частности, первая оценка существенно хуже второй. Возможно, что наши оценки допускают существенное улучшение и могут быть приближены к оценкам из 4., — это следует подчеркнуть, чтобы правильно оценить условия, которые мы получим для соотношения между величинами Sa, Na, sv_a: они во всяком случае достаточны, но возможно не необходимы. Подставляя приведенные выше выражения, для среднего от находим, что оно N Sa /lnSa | 9sv, а1п5а\_, c ( 9Na , у 1 sl Введем арифметическое и гармоническое средние от sVi a (v=l, ..., Na): 7 — _lVo —I*. JL- l V l
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 353 тогда указанное выше выражение равно In Sa • (-=—l-^5-). Поскольку S'S=sa и Na^> \ (это выражает оправданное допущение, что на энергетической поверхности лежит много фазовых ячеек), то это ~ In Sa •-=#-. Когда это выражение мало? sa _ _ _ Во всяком случае должно быть sai>sa^>Na, \nsa>\nNa, так что In Sa=; In sa-\-lnNa, можно заменить на \nsa. Итак, усло- условием будет sa sa In sa т. е. Na Это означает, что sV; a должны быть велики и по отношению к их числам Na (т. е. фазовые ячейки по отношению к их числу на энергетической поверхности), а не только, как в 4., просто велики. Что это означает более точно в применении к распределению sV: a, будет еще показано. Следует еще раз указать на предварительный характер нашях оценок. Возможно, что данное выше усиление требования относительно величины фазовых ячеек необходимо на самом деле для того, чтобы эргодическая теорема и /f-теорема были справедливы. Может ока- оказаться также, что оно вытекает лишь из неполноты наших методов оценки, так что в действительности достаточно уже условия sa^>l из 4.. Было бы интересно внести ясность в этот вопрос. III. Обсуждение результатов 1, Подведем итог достигнутому до сих пор. Мы показали: Пусть ф — некоторое состояние, tyt — состояние, вытекающее из него с течением времени tf= 0\ U^—его микроканонический ансамбль (ср. I. 3.), И—оператор энергии, W а — его собственные значения (а=1, 2, ...; р=1, ..., Sa\ макроскопически различимы лишь собственные состояния с различными а, ср. 1.2.),—как ф так и И являются точными (не макроскопическими!) выражениями. Относи- Относительно Н мы делаем допущение, что (при фиксированном а) все W а различны между собой, а также все разности W а — Wat a, т. е. что Н не обладает вырождением внутри макроскопически неразличной группы термов и резонансами с другими (виртуальными) такими же ?3 И. Нейман
354 ДОПОЛНЕНИЕ системами*). (Не слишком частые нарушения этого запрета допустимы.) Тогда для математического ожидания каждой макроскопически изме- измеримой величины А и для энтропии в среднем по времени имеют место v=l [Cp. II. 3.; достаточно образовывать Max лишь по тем а (макро- (макроскопические), энергетические поверхности которых входят в микро- микроканонический ансамбль ^(на = (Даф, ф) Ф 0)— на практике чаще всего это сводится к лишь одному а. гр является микроканоническим средним от А2, т. е. является мерой порядка его величины.] Эргодическая теорема и //-теорема справедливы, таким образом, Na без исключений (т. е. для всех ф), если эти V—— (М, a + N ) •"¦ si, a v=l малы. Относительно выполнимости этого условия, в которое помимо Sa, Na, sv> a (и Aa) входит также сох> v_ a (в MVi a и NVi a), можно сказать следующее: Если имеет место Na ! Na \ т. е. если фазовые ячейки ?v> a велики по отношению к их числу на энергетической поверхности Аа, то это условие выполняется для подавляющего большинства сох v а, т. е. среднее по сох v a от N ч=1 1 Итак, истинное условие справедливости обеих теорем может у нарушаться и при у. <SC—=—, т. е. даже и в этом случае ^" sv, a \l\Sa a = W?r> a то состояние а — W^ a = W?r> a Wa^ a, то состояние <fp> a а второй системы имеют ту же суммарную энергию, *) Именно, если первой и состояние у что и состояние <?.. а первой и tpOj a второй системы. **) Заметим: мы доказали не то, что для каждого данного ^ или А эргодическая теорема и //-теорема имеют место для большинства «Х) „, а, а то, что для большинства щ, v, a они вообще справедливы, т. е. для всех ф и А. Последнее, естественно, намного больше, чем первое.
ДОКАЗАТЕЛЬСТВО. ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 355 можно так искусно выбрать макроскопическую измерительную технику (шх v a), что обе теоремы не будут справедливы. Но для подавляю- подавляющего большинства макроскопических точек зрения обе теоремы справедливы без исключений (т. е. для всех ф и А). VI 1 1 2. Присмотримся внимательнее к условию V <^—=-. Если бы все s4i a (а фиксировано!) были примерно равны, то это Na I T условие означало бы, что -==-<^—=—, —-=^^>Na, т. е. немногим sa \usa lnsa больше, чем sa~^>Na, т. е. утверждение, что фазовые ячейки велики по сравнению с их числом на энергетической поверхности. Если же среди svi a попадаются существенно различные, то нужна максималь- максимальная осторожность: одно-единственное s4ia, которое не ^>1, уже приводит к тому, что V не "С'- т- е- к нарушению нашего •"¦ sv, а условия. С другой стороны, sVt a сильно отличаются друг от друга: ибо In sVi а надо считать энтропией смеси ?va, которая характе- ризует общую систему, находящуюся в фазовой ячейке ?Vi a *), — и достаточно представить себе соотношения из теории газов, чтобы понять, что на энергетической поверхности, вообще говоря, лежат фазовые ячейки с существенно различными энтропиями. (Как раз их наличие делает и» //-теоремы глубокое утверждение!) Если самая большая из встречающихся (макроскопически воспринимаемая!) разница энтропии равна а, то всегда |1п5^а — lnsSja|gia, так что 5^и- р д — a > -<г и_ •л. д ' Я • / 1 — » ввиду чего надо потребовать, чтобы —^— ~5>е°ЛЛ,. \nsa Впрочем, это соотношение показывает, что опасность оказывается только кажущейся: в силу малости Л, которое входит в левую часть (при Л—>0, sa—>oo, ср. введение, 6.), но не в правую, это соотно- соотношение при нормальных обстоятельствах выполняется. Нам кажется, что здесь нет нужды вдаваться в дальнейшие подробности. *) Это следует, с одной стороны, из приведенных выше рассуждений, а с другой — это ясно также и из смысла больцмановского определения энтропии: ведь фазовая ячейка ?,, а содержит sv, a состояний. 23»
356 ДОПОЛНЕНИЕ 3. Остается еще разобраться в смысле условий на собственные значения Н, приведя известные классические примеры и контрпримеры к эргодической теореме и //-теореме. Пусть К — ящик, в котором беспорядочно движутся N частиц ki kN, т. е. какой-то газ; примем альтернативно, что: а) между частицами нет никаких взаимодействий, так что даже соударений никогда не бывает (это значит, что они могут беспре- беспрепятственно проходить друг через друга); Р) имеются взаимодействия и соударения. В случае а) оба предложения, как известно, не справедливы (так как любое распределение скоростей, а не только максвелловское, может существовать произвольно долгое время), в случае {3) надеются, напротив, что они имеют место. (Совершенно аналогична ситуация в случае излучения в полости, в которой имеется лишь отражение.) Как следует понимать такое поведение с точки зрения наших условий? Поскольку в отношении Sa, Na, sVi а и ?Vi a едва ли имеется какое-нибудь различие между а) и $), то в качестве причины этого различия остается ^-условие. Будем рассматривать сначала каждую частицу в К саму по себе, тогда ее собственные значения энергии будут Sj, e2, ... *). Собственными значениями энергии всего К будут оо / сю \ тогда в случае л) все 2 гчв* ( гч — 0. 1. • • •. 2 z? = N ), в случае $) v=l \ v=l / они еще немного изменятся — тем меньше, чем слабее взаимодействие. В силу тождественности частиц здесь собственно возникает, вообще говоря, N 1-кратное «обменное вырождение» **), т. е. нарушение первого условия на собственные значения энергии. Поскольку, однако, имеет место или статистика Ферми — Дирака, и7ш же статистика Бозе — Эйнштейна, т. е. допустимы только антисимметричные, соответ- соответственно симметричные во всех частицах волновые функции ***), то Эти вырождения снова отпадают ****). Таким образом, здесь не возни- возникает трудностей. Напротив, в случае а) существует ряд соотношений вида, запрещенного вторым условием: (si + %-f----)-(s2+s3+ • • •)=(Si+s4+- • О-Ог+М- • • 0 и т. д. *) Мы считаем k^ kN тождественными и принципиально неразли- неразличимыми между собой. Если же они различны, то каждая частица kn (л = 1, ..., N) обладает своим собственным, отличным от других спектром термов гл1, гл2, ... Обсуждение остается тогда таким же, как в тексте, только не будет требующей рассмотрения опасности вырождения, а) снова будет противоречить второму условию на собственные значения Н, a g) не будет. **) В случае <х), в случае же 0) порядки вырождения совпадают с по- порядками неприводимых представлений симметрической группы из N элемен- элементов. Ср. Е. Wig пег, Zs. f. Phys. 40 и 43 A927). ***)Cp.W. Heisenberg, Zs. f. Phys. 41 A927), а также P. A. M. Dlrac, Proc. Roy. Soc. (A) 112 A926). ****) В случае статистики Ферми — Дирака допустимы, конечно, лишь Z-, = 0, 1, но это не вредит нашим соображениям.
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 357 В случае $) это невозможно, так как четыре заданных терма К возмущаются совершенно по-разному, причем это утверждение, очевидно, нисколько не зависит от абсолютной величины возмущения (т. е. взаимодействия). Таким образом, внутренняя причина различного характера слу- случаев а) и Р) лежит в поведении по отношению к условию Приложение 1. Надо вывести использованные в II. 4., 5. свойства распре- распределений |(?v,a<?p,a, <?a,a)|2 (рфо) и (?v> acpp, a,cpp, a). Сначала, однако, нам следует разъяснить, как здесь вообще можно говорить о стати- статистическом распределении. В II. 4. мы указывали на то, что все величины, зависящие от ?Vi a, зависят, в конце концов, от u>Xiva, а также на то, что под усреднением мы понимаем усреднение по этим сох v_ a: поскольку Sa, Na, s, а в Д. заданы, они подчиняются условию 2 2 'Ц „ а ~ ^а v=l Х=1 и, со своей стороны, определяют ?Vj а по формуле 2 ^ = ?,, а- Дальше мы упоминали, что все такие системы получаются из одной из них, скажем u>Xi Vi a, с помощью линейных унитарных преобразо- преобразований. Так что, избрав каким-то образом wlt v> a, можно с равным успехом сказать, что мы усредняем по множеству унитарных матриц пре- Г "а образования в 2 \, „ = 5а измерениях, они переводят coXi Vi a в сол v> a L v=l (с фиксировано!) . Следовало бы обозначать эти матрицы через {?х, v/X', v'}> используя для строк двойные индексы X, v, и равным обра- образом для столбцов \', V, в соответствии с системой индексов для сох v a ( Na 'у. а ведь должно быть сох = 2 2 &x,v/x',v'U>x',,'. X' = l v' = l но мы предпочитаем ввести один текущий индекс, т. е. писать 5р/Р' Ср. р'=1. •-., Sa). Теперь мы должны объяснить, как следует усреднять по множеству 5а-мерных унитарных матриц {$р/р-}. Мы желаем усреднять так, чтобы при этом ни одной из систем отсчета o)Xva не отдавалось предпочтения перед другими. Если те- теперь шХ| va означает какую-нибудь другую из таких систем отсчета
358 ДОПОЛНЕНИЕ _ Na 4^ = a))i.v,a==2j 2 &Х.»Л'»' w'-',v,a (запишем теперь также и |р/р- вместо X=l v = l h^fk',-,'), то между матрицами {?р,_р} и {^р,} (той же системы <вл_„(в) в отношении к u>Xi Vj а и соответственно шх_ v< a существует соотноше- соотношение {Sp/P'} = {SP/p'} {1Р/р'Ь т. е. p'=l Итак, метод усреднения должен быть таким, чтобы он был инва- инвариантным по отношению к преобразованиям указанной выше формы |? Л->{?'„,] (для любой фиксированной унитарной матрицы {«0/р'}). Но подобный метод усреднения по унитарной группе существует, причем он полностью определяется наложенным требованием; он был разработан Вейлем *). Мы, однако, не будем пользоваться здесь его общими формулами, единственное, что нам понадобится для достиже- достижения цели,— это свойства инвариантности этого метода усреднения. Упомянем еще, что (как показано в 1. с.) указанный метод усреднения инвариантен также по отношению к преобразованию {?,>}->{?*/,), которое определяется соотношением {?". Л = {? Л {? Л, т. е. f Во-вторых, сделаем еще несколько формальных упрощений. Так как порядок нумерации v=l, .... Na не имеет значения, то достаточно рассмотреть ?1; а. Заменой индексов X, v через р мы можем распо- распорядиться так, что X, 1 перейдет в р=1 sIa. Выберем затем систему отсчета wx_va: пусть это будет система <р а, чем одновре- одновременно достигается перенумерация. Имеем тогда x, a"??, 21 И, наконец, опустим излишние индексы v, а, так что Sa, Na, s1>a, Aa. Ег, a* ?P,a. M,,e. NI>e перейдут в S, N, s, A, ?, cpp, M, N. *) H. W e у 1, Math. Zs. 23 A925).
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 359 Итак, вот наша задача: исследовать с помощью очерченного выше метода усреднения распределения величин S 2 г т=1 где |?р/р'| пробегает все 5-мерные унитарные матрицы. 2. Прежде всего одно вспомогательное рассуждение. Установим S распределение значений ^] х2, когда вектор [xv ..., xs] пробегает р~ s поверхность единичной сферы 2 х2 = 1, причем сначала для веще- p=i p ственных х . То есть мы определим W (и), где W(u)du является s (геометрической) вероятностью для а< ^ д:2:< ц-}-^и@:<а< 1) *). Простое геометрическое рассмотрение, которое мы здесь не станем воспроизводить, показывает, что W (и) пропорционально выраже- нию и2 A —иJ , а не зависящий от и фактор пропорциональ- пропорциональности определяется из 1 jW(u)du=l. Если теперь xv .... xs могут быть комплексными и, следовательно, надо рассматривать p=i p=i то стоит лишь сообразить, что все остается по-старому, если дей- действительные и мнимые части х рассматривать как вещественные декартовы координаты. При этом нужно лишь s, S заменить на 2s, 25. Тогда W (и) будет пропорционально и*-1^—a)s~s~\ а фактор про- пропорциональности определяется из нормировки как —. ^,,о ^. E — 1)! (о — S — 1)! *) Речь идет об определении площади s-мерного сегмента на S-мерной единичной сфере.
360 ДОПОЛНЕНИЕ / s у Следовательно, среднее от ( Sl-^pl2) будет равно 1 [ E--1I uS-\ п _ и^-*-1 . „я . dti — J (s_i)!(S_s_i)! и С1 «> -и -йк — о (S—1I E + Я—1IE —S —1I __ SE + 1) ...E + Я — 1) E — 1)! (S —s —I)! (S-j-n—1I ~S(S-|-l)...(S-(-n — 1)" 3. Возвращаясь к унитарным {^Р/Р'}. запишем для краткости 2 /сг- В силу приведенных в 1. оснований, все ^р р,а2 Ср^/сг имеют одно и то же распределение вероятностей, а равным образом и все ер,р*)- В е — 21^т/р|2 входит лишь р-й столбец матрицы {$р/р'}, по Т= 1 нему можно усреднить так, как это было проделано в 2. по единич- единичной сфере (это легко следует из свойств инвариантности наших средних). Поэтому будет (через Ш мы обозначаем среднее) ~ S (S -f- 1) S2 ~ S2 (S -+- 1) ' Дальше из ?2 = ? выводим s s 5=1 "' P' P p, a=l *) Перестановка строк и столбцов принадлежит к введенным там пре- преобразованиям.
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОИ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 361 В силу равенства всех ffi,(\e \2) (рфа) будет поэтому \ _ S )— 5 S(S — S) _?_ _ ~S — \\S 5E+1) )— 5E2 — 1) * Тем самым использованные в II. 4. средние значения найдены, причем в согласии с данными там значениями. Теперь остается лишь исследовать распределения \е 0|2 (рфо\ (s \2 е ^ , чтобы определить средние М, N из II. б.. 4. Последнее проще всего: мы уже знаем, что и^е ^_u-\-du (O^SmssI) имеет вероятность W{u)du (ср. 2.). Пусть а — некото- рое число > 0, <^-р-, тогда вероятность, что \е ^-] >а (за- (заметим, что левая сторона заведомо ===1, так как О^е <1) будет равна -.)*-"*.. Логарифмическая производная подинтегрального выражения равна 'о 1 так что оно постоянно возрастает при приближении к и = -=—~ . О Л Это значение < -jr, причем на -^- — |_t + -^ /Г1_1ч ^-о-: поэтому если аШ-§г ' т0 оно лежит в интервале -j±Ya. В области инте- интегрирования подынтегральное выражение достигает поэтому своего С I максимума при и = -^- ± у а (мы не различаем где). Поэтому мы
362 ДОПОЛНЕНИЕ можем оценить все выражение, оно будет Воспользуемся теперь тем, что l<^s<^S, тогда первый множитель /~ / s \ — $ I s \S' —s _- __ j М _ , а второй /—' — |-р-±"|/а| fl g-q:yaj . Поэтому все выраже- выражение будет 5 —s S sln(l± — V a) + (S-s)la(l т -i- V a) Экспонента будет 2s2 ~° 3s3 _ S2a + 5 3s2 В силу „д <^ 1 второй член мал по сравнению с первым, так что О S -е— наше выражение <С . е 2s (в — какое-то число < 1). у 2ns / S \2 Это относилось к вероятности, что \е ^- Ц=^а для фикси- рованного р= 1, ..., S. Вероятность того, что это будет иметь место для произвольного р т. е. для N= max г |-j ^ а\\ , 52 е s'a в крайнем случае в 5 раз больше, таким образом .< -p. 2s , Среднее значение N мы оцениваем теперь в двух областях: для зна- значений =gO, 5=5 о- вероятность во всяком случае siil, для значе- значений же is a, :=? 1 имеет место указанная граница. Итак, о2 _в ^а 1 S2 В качестве а можно выбрать любое число ^ -^, <CI~ci • мы положим ' ¦. (Это дает все, если s^>lnS, что безусловно должно
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОИ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 363 выполняться в силу заключительного условия из II. б. *)•) Тогда наша верхняя граница будет 8s\nS , S2 _41ni<;_. jghbS , 1 ,_. 8s1nS в-S2 V2^s в-52 VnsS'z в-S2' Так что если предпосылки 1 <^.s<^S выполнены достаточно сильно, , 9slnS то указанное среднее будет заведомо ===—^—¦ б. Остается еще обсудить распределение |?piJ2 (рфя). Обозначим р-й и о-й столбцы {Хф'\ через $={$i/o ?s/P}. 7!=(^i/a 5s/o}. и пусть 1={$i/p, .... \sit, 0, ..., 0}. ( Воспользуемся для таких векто- s ров С = {Ср .... С5}, X = {Xi> • • • ¦ Is) также символами (С, у) — 2 ^д!. — т/Т "\ " ^)~ I/ 2jKt|2-J Будет: |ер>а|2=|(^, т])|2, причем век- векторы X, У] как столбцы унитарной матрицы подчиняются условиям |?|=1, |т}| = 1, (X, т)) = 0 (т. е. оба лежат на единичной сфере и ортогональны друг к другу). Разложим X на компоненты — параллельную X и ортогональ- ортогональную X' X =(?. ?)-^+^- Тогда равным образом будет: |е |2— |(|, tj) |2. При фиксированном ? (и f, |j мы имеем, таким образом, два вектора, ортогональные к X, а именно ? и tj, из которых первый фиксирован, а второй свободно меняется на поверхности (S—1)-мерной единич- единичной сферы. Введем какую-нибудь (S—1)-мерную декартову систему координат, и пусть т) = (у1, ..., ys_1). Из унитарной инвариантности нашего построения среднего следует, что усреднение (при фиксиро- фиксированном ?={?]/р ?s/p}) надо проводить в точности так, как если бы ц усреднялось в смысле 2. по (S—1)-мерной единичной сфере. Дальше, в силу унитарной инвариантности, среднее зависит лишь от длины, \Х\, вектора X, поэтому можно заменить его на 5={|$|> 0 0} ((S—1)-мерный!). В силу этого мы хотим S1 1 - <^—=— следует sv, a^>lnsa. Записанное иначе v-1 si, a In sa (ср. там): —2=;—-<С^1, °l L а <^Л, так что сначала верно =~^1, sa sasa s a sa^ V~Sa, 1 n sa ^ -к 1п5а. Тем самым должно быть sv, a ^>ln5e, т. е.
364 ДОПОЛНЕНИЕ определить сначала распределение |($, ^)|2== UP • l^il2 для ItqB == 51 — 2 |yj2 — !• То, чт0 эта величина >м. ^и || тс= 1 « , ,9 и , du , означает, что —^—'S§i|,yi| S==—^ 1—=— и обладает вероятностью |?|2 |?|2 |?12 W I if ) —~, где в W («) из 2. надо s, S заменить на 1, 5—1. \|?|2/ III2 ф III2 Итак, коэффициент при du будет Но до сих пор % было фиксировано, теперь надо усреднить его (конечно, тоже в смысле 2.) по E-мерной) единичной сфере. В выражение для распределения \е J2 при фиксированном $ входит лишь |^|2, а это равно (так как % ортогонально к \—\ и к \= = ?—(?.?)-О 1П2==(Г. Г)=а, Г). Поскольку ?={|i[p, ..., $s|p)} изменяется на единичной сфере, S ) 2 |/р|+ t=i обладает вероятностью -.— л.. 71 —-——- -ш5 A—wf~s~x dw. Для того чтобы получить полную плотность вероятности для |epjC,|2 в точке и, мы должны поэтому проинтегрировать _1)!(S —s—1)! W U X / /15~!45_1 (w(l — «О —вM (s —1)!E —s —1)! по всем •o»>0, ^1 с «^^(l—w). Вследствие этого надо учи- учитывать для и вообще лишь значения :=s -т-. Мы определим сейчас же I 19 / вероятность, что \е а\'^а I согласно только что сказанному j Для этого приведенное выражение надо проинтегриро-
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ И Н-ТЕОРЕМЫ 365 вать по всем и, w с а^и ^w(\ —w), т. е. по -^ 1/ X— а== "T — а> a^su^gw(l—w). Мы можем провести интегрирование по и: ~2+У Т~а ю A-ю) (S-l)l(S-l) /* Г (w(\-w)-uf-> !(S-s—1)! ( /* Г E — 1)! Г (w A — w) — af-2 (s __ 1\ I (S s IV / 5—5 /i у? Разложим интеграл на две части, | и I , и вве- 2 f дем в них новые переменные с помощью ~о~>1/~4Г — x = w и Y— 1/ ~т — x — w соответственно. В обоих случаях x — w(l —w), в обоих случаях х пробегает значения от о до -г. Складывая оба интеграла, получим X (s-l)!E-s-l)! T Г с 1 Г/1 X J (*-a)s-] [^ 4 \-(S-s) /P^' Наконец, введем новую переменную у = -т . которая про- 1-е бегает значения от 0 до 1.
366 ДОПОЛНЕНИЕ Тогда написанное выражение будет 2s (s —1)! (S —s— 1) Разделим эту вероятность на A—4aM, тогда от а будет еще зависеть лишь выражение [...]. Как мы покажем, оно возрастает при а—>0, а следовательно и введенная дробь. Но так как при а = 0 числитель (вероятность) = 1, а знаменатель (A —4аM) тоже, то тем самым доказано, что дробь всегда s| 1, т. е. что вероятность всегда =?A - Если а —>0, то |/"l — \а |/"l — у, возрастая, стремится к |/"l — у, поэтому достаточно показать, что при t > 0 возрастает. Действительно, его производная если (мы полагаем z = *_+ !> 1) z* (sz — E — s))+ г5"-5(E — s) z — s) > О, но это выражение, очевидно, >z*(s — (S — s))-\-zs-s((S — s)-s) = (zs-s — zs)((S—s)—s)>0- Тем самым приведенная оценка вероятности |epj0|2^a для фиксированной пары р Ф а, р, а—1 5 подтверждена. Ве- Вероятность того, что это случится для каких-то р, а [т. е. для М = = Мах (|е |2)^а], в крайнем случае в —^—=—- раз больше (так как е а = е*о, то достаточно рассмотреть р < а), т. е. :< »—'е-4а(*-!). Среднее значение М оценим снова в двух обла-
ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОИ ТЕОРЕМЫ И Я-ТЕОРЕМЫ 367 стях: для значений is О, ?S а вероятность во всяком случае <1, а для значений > a, Si-г- имеет место приведенная оценка. Итак, В качестве я можно взять любое число is 0, <^ 1, мы полагаем а = -т-—ё—. (Пригодное, так как 5^>1.) Тогда наша верхняя гра- граница будет 3 inS S(S-l) -ainsi^- 4 S "• 8 3 4 InS S h 8 e~ 3 4 3 1ns--: InS , S ' 1 HS 3 4 InS .S Таким образом, если предпосылка S^>> 1 выполнена достаточно сильно, то рассматриваемое среднее будет <-^—. О Тем самым желаемые оценки полностью проведены.