Текст
                    А.СХолево
ВВЕДЕНИЕ В КВАНТОВУЮ ТЕОРИЮ ИНФОРМАЦИИ
М.: МЦНМО, 2002. —128с.
Лекции посвящены изложению основных понятий и ряда строгих результатов
новой научной дисциплины - квантовой теории информации. Возможности
квантовых систем передачи и преобразования информации проиллюстрированы
на примерах сверхплотного кодирования, квантовой телепортации и квантовых
алгоритмов.
Рассматриваются энтропийные и информационные характеристики квантовых
систем. Подробно обсуждается понятие квантового канала связи, его классическая
и квантовая пропускные способности, а также передача классической
информации с помощью сцепленного состояния. Сформулировано несколько
принципиальных открытых проблем, решение которых явилось бы существенным
вкладом в квантовую теорию информации.
В лекциях приведены необходимые сведения из классической теории
информации и дается подробное введение в статистическую структуру квантовой
теории, поэтому для их понимания достаточно владения основными
общематематическими дисциплинами.
ОГЛАВЛЕНИЕ
Предисловие 7
Глава 1 Основные понятия классической теории информации 10
§ 1.1. Энтропия случайной величины и сжатие данных 10
§ 1.2. Пропускная способность канала с шумом 12
Глава 2. Состояния и наблюдаемые 18
§ 2.1. Соглашения и обозначения 18
§ 2.2. Квантовые состояния 19
§ 2.3. Квантовые наблюдаемые 21
§ 2.4. Составные квантовые системы 25
§ 2.5. Парадокс ЭПР. Неравенство Белла 28
Глава 3. Применения сцепленных состояний 32
§3.1. Квантовое состояние как информационный ресурс 32
§ 3.2. Сверхплотное кодирование 34
§ 3.3. Квантовая телепортация 35
§ 3.4. Квантовые алгоритмы 38
Глава 4. Оптимальное различение квантовых состояний 43
§4.1. Постановка задачи 43
§ 4.2. Различение по максимуму правдоподобия 44
§ 4.3. Максимум информации 49
Глава 5. Классическая пропускная способность квантового канала 54
связи
§5.1. Формулировка и обсуждение квантовой теоремы кодирования 54
§ 5.2. Квантовая энтропийная граница и доказательство обратной теоремы 58
§ 5.3. Доказательство прямой теоремы для канала с чистыми состояниями 60
§ 5.4. Сжатие квантовой информации 64


Глава 6. Квантовые каналы 67 §6.1. Эволюции квантовой системы 67 § 6.2. Вполне положительные отображения 71 § 6.3. Определение канала 74 § 6.4. Каналы в Н2 11 Глава 7. Энтропийные характеристики квантовых систем 80 §7.1. Квантовая относительная энтропия 80 § 7.2. Разложение Шмидта и очищение состояния 84 § 7.3. Энтропийная корреляция и условная энтропия 87 § 7.4. Обменная энтропия 88 § 7.5. Информационные количества 90 Глава 8. Передача классической информации с помощью сцепленного 94 состояния Глава 9. Квантовая пропускная способность и когерентная 103 информация § 9.1. Точность воспроизведения квантовой информации 103 § 9.2. Когерентная информация и обратимость канала 108 § 9.3. Квантовая пропускная способность 109 Глава 10. Квантовые коды, исправляющие ошибки 112 § 10.1. Постановка вопроса 112 § 10.2. Общая формулировка 114 § 10.3. Необходимые и достаточные условия исправления ошибок 115 § 10.4. Аддитивные (симплектические) коды 117 Приложение. Доказательство монотонности относительной энтропии 121 Литература 125
ПРЕДИСЛОВИЕ Недавно отмечалось 50-летие двух революционных научных от- открытий, которые по существу предопределили облик современного мира в той важнейшей его части, которая касается процессов хранения, обработки и передачи информации. Это — изобретение транзистора, открывшее путь к миниатюризации'' и радикальному снижению материальных и энергетических затрат при создании систем обработки информации, и создание математических ос- основ теории информации, заложивших принципы рационального и помехоустойчивого дизайна таких систем и обрабатываемых ими массивов данных2'. В настоящее время происходит создание теоретических и экспе- экспериментальных основ квантовой теории информации. Построены демонстрационные системы, основанные на принципах квантовой криптографии. Обсуждается идея квантового компьютера, сулящая в перспективе немыслимые ранее возможности3'. Независимо от того, как скоро могут быть практически реализованы подобные про- проекты, квантовая теория информации является новым направлением, дающим ключ к пониманию фундаментальных закономерностей Природы, до недавних пор остававшихся вне поля зрения иссле- исследователей. Она также стимулирует развитие экспериментальной физики, значительно расширяющее возможности манипулирования состояниями микросистем и потенциально важное для новых эф- эффективных приложений. Центральным результатом классической теории информации яв- являются теоремы кодирования, устанавливающие возможность по- помехоустойчивой передачи и обработки информации при скоростях, не превышающих некоторую вполне определенную величину, ха- характеризующую данную систему преобразования информации (для определенности обычно говорят про канал связи) и называемую пропускной способностью. Почти одновременно с появлением пионерских работ Шеннона и с созданием математических основ '' О степени миниатюризации в современных вычислительных устройствах говорит следующий факт: микрочип операционной памяти емкостью 16 Mb содержит 33 млн. транзисторов на площади менее 1 см2 (данные 1999 г.). 2' В качестве примеров эффективного применения идей теории информации можно привести коды Лемпеля — Зива, используемые для сжатия файлов в UNIX и PC, а также коды Рида — Соломона, применяемые для исправления ошибок при воспроизведении CD. 3' Практическая реализация этого проекта предполагает технологическую рево- революцию, по значимости сопоставимую по крайней мере с изобретением транзистора. Компетентное обсуждение возможных подходов см. в книге: Валиев К. А., Кокин А. А. Квантовые компьютеры: надежды и реальность.—М. — Ижевск: РХД, 2001.
ПРЕДИСЛОВИЕ теории информации встал вопрос о фундаментальных ограничениях на возможности передачи сообщений, накладываемых природой физического носителя информации. Проблема определения про- пропускной способности квантового канала связи сформировалась в 60-е годы и восходит к более ранним классическим трудам Га- бора и Бриллюэна, поставившим вопрос о квантово-механических пределах точности и скорости передачи информации. Эти работы заложили физические основы и подняли проблему адекватного ма- математического рассмотрения всего данного круга вопросов. Прин- Принципиальные шаги в этом направлении были сделаны в 70-е годы, когда была построена некоммутативная теория статистических решений, найдено первое доказательство квантовой энтропийной границы и обнаружена строгая супераддитивность шенноновскои информации в квантовом канале связи без памяти. Существенный прогресс был достигнут в последние годы, когда были доказаны прямые теоремы кодирования, устанавливающие достижимость квантовой энтропийной границы, и понято, что квантовый канал характеризуется целым набором пропускных способностей, в зависимости от рода передаваемой информации и специфики используемых ресурсов. В значительной мере этот прогресс стимулирован современным развитием идей квантовой теории информации и квантового компьютинга. С другой сторо- стороны, вопрос о пропускной способности квантового канала связи представляет большой интерес в связи с квантовыми кодами, исправляющими ошибки, исследованием эффективности и слож- сложности квантовых алгоритмов, и в целым рядом других вопросов. Настоящие лекции посвящены в основном систематическому изло- изложению строгих результатов, относящихся к понятию квантового канала связи и пропускных способностей. В них также дается подробное введение в статистическую структуру квантовой теории, составляющую базис для квантовой теории информации, однако их не следует рассматривать как всеобъемлющий курс по квантовой теории информации: так, здесь не затрагиваются проблемы кван- квантовой криптографии, а также получившая значительное развитие в последнее время количественная теория сцепленности квантовых состояний '>. Весьма фрагментарно рассматриваются и квантовые алгоритмы. ' Существуют определенные сложности при подборе адекватного перевода тер- терминов квантовой теории информации на русский язык. В частности, важнейшее понятие entanglement было переведено как перепутанность, что совершенно не отвечает существу дела. В настоящих лекциях мы делаем попытку исправить положение, используя, как нам кажется, более подходящий термин сцепленность.
ПРЕДИСЛОВИЕ Эти разделы читатель, освоивший вводные главы настоящих лекций, сможет изучить самостоятельно по другим источникам (см. список литературы '>). Доказательства целого ряда вспомога- вспомогательных результатов и следствий оставлены читателю в качестве полезных упражнений. С другой стороны, в лекциях сформули- сформулировано несколько принципиальных открытых проблем, решение которых явилось бы существенным вкладом в квантовую теорию информации. В основу настоящих лекций положен курс, прочитанный автором в Математическом институте им. В. А. Стеклова РАН для слушате- слушателей Колледжа математической физики Московского Независимого Университета. Автор благодарен слушателям лекций А. В. Бу- линскому и Е. Е. Дьяконовой за помощь с конспектом, а также М. М. Деминову и Д. М. Белову, осуществившим предварительный компьютерный набор. Работа частично поддержена грантом INTAS 00-738. 1' Одним из основных источников новейшей информации является Лос-Ала- мосский электронный архив по квантовой физике (quant-ph), представленный на сервере ИТЭФ: http://xxx.itep.ru. Ссылка quant-ph/9809023 означает электронный препринт № 023, опубликованный в сентябре 1998 г., и т. п.
ГЛАВА 1 ОСНОВНЫЕ ПОНЯТИЯ КЛАССИЧЕСКОЙ ТЕОРИИ ИНФОРМАЦИИ § 1.1. Энтропия случайной величины и сжатие данных Пусть X — дискретная случайная величина, принимающая зна- значения в конечном множестве Х = {\,..., \Х\}, и имеющая распреде- распределение вероятностей р — {рх}, так что значение х?Х появляется с вероятностью рх. Энтропия случайной величины X определяется соотношением ЩХ):= - ЕР>ёРх, A.1) с соглашением 01ogO = 0 (далее log, как правило, обозначает двоичный логарифм). ,ч< > .- Задача 1. Докажите, что 0 ^ Н(Х) ^ log|АГ|, причем мини- минимальное значение принимается на вырожденных распределениях, а максимальное — на равномерном. Обычно Н(Х) интерпретируется как мера неопределенности, изменчивости или информационного содержания случайной вели- величины X. Поясним последнее утверждение. В этом параграфе мы следуем в основном [9]. Рассмотрим случайный источник, который порождает последо- последовательность независимых одинаково распределенных случайных величин с распределением р. Последовательность w = (ж,,..., хп) букв алфавита X называется словом длины п. Общее количество таких слов 1^1" = 2"logl*l. Поэтому можно закодировать все эти слова, используя двоичные последовательности длины nlog|Af|, т. е. п log \X\ бит. Однако, используя то обстоятельство, что р в общем случае неравномерное распределение, можно предложить лучший способ кодирования. Возможность сжатия данных тесно связана со свойством асимптотической равнораспределенности, которое является прямым следствием закона больших чисел:
§ 1.1. ЭНТРОПИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ И СЖАТИЕ ДАННЫХ 11 ТЕОРЕМА 1. Если Хх,..., Хп,...—независимые и одинаково распределенные случайные величины с распределением р = {рх}, то — - J2 l°gPx —* Н(Х) по вероятности. A.2) Таким образом, для любых 8, е > 0 найдется такое т^, что для всех п > щ имеет место неравенство > 1-е. A.3) Замечая, что вероятность появления слова w = (ж,,..., хп) равна мы теперь можем использовать соотношение A.3) чтобы ввести понятие типичного слова: слово w, имеющее вероятность pw, называется 5-типичным, если <р <2 Непосредственно устанавливаются следующие свойства типичных слов: 1) существует не более 2"(Я(*)+*) типичных слов; 2) для достаточно больших п существует, по крайней мере, A - еJп(Н(Х)~6) типичных слов; 3) множество нетипичных слов имеет вероятность < е. Теперь можно осуществить эффективное сжатие данных, ис- используя все двоичные последовательности длины п(Н(Х) + 6), чтобы закодировать все <5-типичные слова и отбросить нетипичные (или кодировать их одним и тем же добавочным символом). Веро- Вероятность ошибки при таком кодировании будет меньше или равна е. Обратно, любой код, использующий двоичные последовательности длины п(Н(Х)— 6), имеет асимптотически неисчезающую вероят- вероятность ошибки, стремящуюся к единице при п —»оо. Задача 2. Докажите последнее утверждение. Поскольку эффективное кодирование требует асимптотически JV~2"if(;f) слов, энтропия Н(Х) может быть интерпретирована как мера количества информации (в битах на передаваемый символ) в случайном источнике. Ясно, что для равномерного распределения рх = 1/\Х\ энтропия Н(Х) = Hmax(X) — log \X\ и сжатие невозмож- невозможно.
12 Гл. 1. ОСНОВНЫЕ ПОНЯТИЯ КЛАССИЧЕСКОЙ ТЕОРИИ ИНФОРМАЦИИ § 1.2. Пропускная способность канала с шумом Канал связи с шумом описывается вероятностями переходов р(у\х) из входного алфавита X в выходной алфавит У, т. е. услов- условными вероятностями того, что принят символ у е.У, при условии, что был послан символ х б X. Соответствующее уменьшение ин- информационного содержания источника описывается шенноновским количеством информации: Y) = H(X)-H(X\Y), A.6) где Н(Х) = — ^2 рх logpx энтропия источника (входа), а Н(Х | У) х условная энтропия входа относительно выхода Y, которая описы- описывает потерю информации в канале связи: Здесь Н(Х, Y) совместная энтропия пары случайных вели- величин (X, Y), соответствующая совместному распределению рХ:У = = р(у\ х)рх. Подставляя эту формулу в определение шенноновского количества информации A.6), мы видим, что оно симметрично по X и Y, и поэтому может быть также названо взаимной информацией I(X; Y) = Н(Х) + H(Y) - Н(Х, Y) = H{Y) - H(Y \X), A.7) где в последней формуле уже H(Y) может быть интерпретиро- интерпретирована, как информационное содержание выхода, a H(Y \ X) как его бесполезная составляющая, обусловлен- обусловленная шумом. Взаимная информация все- всегда неотрицательна: тот факт, что Н(Х) ^ ^ H(X\Y) легко вытекает из вогнутости функции —х log х (задача 3). Отсюда также вытекает свойство субадди- субаддитивности энтропии: H(XY) ^ Н(Х) + H(Y). ДаЛее> 7(Х; У) =° Т°ГДа И Т0ЛЬК° Т°ГДа> К°" Рис 1 Двоичный симметричный канал гда X и Y независимые случайные величины: Рх, у ri Ру' Если посылается последовательность букв, и канал р(у \ х) дей- действует независимо на каждую посланную букву, то он называется
§ 1.2. ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА С ШУМОМ 13 каналом без памяти. Пропускная способность такого канала определяется как C = maxI(X;Y), A.8) W где максимум берется по всевозможным распределениям на входе {рЛ- В качестве примера рассмотрим двоичный симметричный ка- канал. В этом случае X и У состоят из двух букв 0, 1, которые передаются без ошибки с вероятностью р (см. рис. 1). Вводя двоичную энтропию Чр) = - ~ О - Р) 1°gA - Р)> A.9) взаимную информацию можно записать как I(X; Y) = Н(Х) — — h(p). Максимум этой величины, равный C = l-h(p), A.10) достигается на равномерном входном распределении: Ро^р, = 1/2. Применяя блочное кодирование для канала без памяти, когда канал используется для посылки п букв, получаем X" = < У2 = У" Сп >Уп где р(уп | х") = р(у{ | ж,) ¦ ... ¦ р(уп | хп). Пусть У" обозначает выход дискретного канала без памяти со входом Хп. Очевид- Очевидно, что последовательность С„ = maxJ(X"; У") супераддитивна: Сп + т ^ Сп + Ст. Более того, используя следующую лемму, можно доказать, что она аддитивна: Лемма. A.11) Доказательство. Имеет место цепное правило для услов- условной энтропии: ЩХ,, ...,XJ=± H(X{ A.12)
14 Гл. 1. ОСНОВНЫЕ ПОНЯТИЯ КЛАССИЧЕСКОЙ ТЕОРИИ ИНФОРМАЦИИ которое легко доказать по индукции, используя формулу: H(X,Y) = H(X) + H(Y\X). A.13) Тогда взаимная информация равна ЦХп; Yn) = H(Yn) - H(Yn | Xn) = = H{Y')-±H(Yi\Yl,...,Yi_l,Xn) = ± поскольку для канала без памяти Yt зависит только от Х{ и, таким образом, п п т( у». vn\ «^ Y~* I иi~v\ irivl v ^ Y~* тi v • v\ 1 (A , Y ) ^ 2_, ^-" (•'ij ~ •" l-*i I -^i/J Z-/ ¦* V-^-t > ¦';)¦ Взяв максимум выражения A.11), получаем аддитивность, в частности, Сп = пС Определение. Кодом (W, V) размера N для канала р(у | ж) называется совокупность 7V слов го(|),..., tu(N) длины тг вместе с разбиением множества Уп на N непересекающихся подмножеств Подмножества УA),..., У(ЛГ) интерпретируются как области при- принятия решения: если на выходе принято значение уп б V(i\ j = 1,..., TV, то принимается решение, что было послано слово ш(>); если же принято уп е У@), то никакого определенного решения не принимается. Таким образом, максимальная вероятность ошибки такого кода есть P(W,V)= max (I - p(V(j) \ w^)) , A.14) где p(VW | шй) = P{Yn e У<» | X" = to<j)}. Средняя вероятность ошибки равна и, как показывает следующая лемма, с точки зрения теории информации она асимптотически эквивалентна максимальной ве- вероятности ошибки Pe(W, V).
§ 1.2. ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА С ШУМОМ 15 ЛЕММА. Пусть код размера 2N имеет среднюю вероятность ошибки Pe(W, V) < е. Тогда найдется подкод размера N, име- имеющий максимальную вероятность ошибки Ре(Щ V) <2е. Доказательство. Предположим, что среди 27V слов име- имеется по крайней мере N + 1 слово с вероятностью ошибки p(V^ | ги(У)) ^ 2е, так что построить требуемый TV-подкод невоз- невозможно. Тогда средняя ошибка 27\Г-кода ограничена снизу величиной Ре(Щ V) ^ 2Af2eGV + 1) > е, что противоречит предположению. Задача 4. Показать, что максимальная вероятность ошибки удовлетворяет неравенствам: , V) ^ || 6jt - р(УО-) 1 WQ) ||, ^ 2Ре(W, V), A.16) где аа Ekl • AЛ7) Это дает аналитическую характеристику точности воспроизведе- воспроизведения, удобную для перехода к квантовым каналам. ЛЕММА (неравенство Фано). Пусть X, Y случайные величины и X = X(Y) — оценка случайной величины X с вероятностью ошибки Ре = P{X(Y) y^X}. Тогда Н(Х | Y) ^ h(Pe) + Pe log(|*| - 1) ^ 1 +Ре log|AT|. A.18) Доказательство. Пусть Е — индикатор ошибки оценива- оценивания, fo, x в f () 1_ 1, в противном случае. Аналогично соотношению Н(Е | X) — Н(Е, X) — Н(Х) получаем Н(Е \ X, Y) = Н(Е, X \ Y) - Н(Х \ Y) = 0, A.20) поскольку Е является функцией (X, X), и поэтому'имеет опреде- определенное значение при фиксированных значениях (X, Y). Поэтому Н(Х | Y) = Н(Е, X | Y) = Н(Е | Y) + Н(Х \E,Y)^ (X\E = O,Y) + peH(X\E = l,Y) = = h(Pe) + Pe log(|Af| - 1) ^ 1 +Pe log |ЛГ|,
16 Гл. 1. ОСНОВНЫЕ ПОНЯТИЯ КЛАССИЧЕСКОЙ ТЕОРИИ ИНФОРМАЦИИ где был использован тот факт, что Н(Х | Е —О, Y) также равно нулю, поскольку Е = 0 означает, что мы знаем X, если известно Y. ТЕОРЕМА (о кодировании для канала с шумом). Пусть Pe(n,N) = minPe(W,V) — минимальная средняя ошибка для всевозможных N-кодов со словами длины п. Тогда при п —* оо имеем {—> 0, если R < С (прямая теорема кодирования); т4 0, если R > С (слабое обращение); —> 1, если R > С (сильное обращение). Величина R = °^ называется скоростью передачи и равна числу передаваемых битов на символ для данного кода. Доказательство слабого обращения. Рассмотрим про- произвольный код размера N со словами ги(|),..., ui(N) длины п и разбиение множества У" на N + 1 область принятия решения V@), VA),..., V^N) с Yn. Обозначим Z случайную величину, при- принимающую значения 1,..., 7V с равными вероятностями -^ и пусть Z(Yn) такая оценка для Z, что Z(Yn) = j, если Y" e V^K Тогда согласно неравенству Фано имеем пС - Сп > I(Z; Y") - H(Z) - H(Z \ Yn) > ^ logiV - 1 -P{Z(Yn)^Z}logN = logN-l -Pe(W, V). Подставляя N = 2nR и оптимизируя по W, V, получаем пС ^ nR - 1 - ре(п, 2nR)nR, и в пределе п —> оо при R > С: lim inf Pe(n,2nR)^ 1 -#>0. Основная идея доказательства прямой теоремы кодирования, восходящая к работе Шеннона [15], состоит в использовании случайного кодирования. Рассмотрим N слов гоA),..., tw(N), вы- выбираемых случайным образом независимо с распределением веро- вероятностей P-O(J) = (хр ..., хп)} = р ¦... ¦ рх ,
§ 1.2. ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА С ШУМОМ 1 7 где однобуквенное распределение {рх} выбрано так, что оно макси- максимизирует I(X; Y). Заметим, что имеется примерно 2пН(Х) типичных слов на входе (и 2пЯ(У) на выходе), и в среднем 2nH{-Y^X) типичных слов на выходе для каждого входного слова w. Для того, чтобы ошибка различения слов на выходе стремилась к нулю, надо, чтобы множества типичных слов на выходе, соответст- соответствующие разным словам на входе, асимптотически не пересекались, поэтому размер кода не должен превосходить \ A.21) Таким образом, JV«2nC. Конечно, это рассуждение в высшей степени эвристично; строгое доказательство, реализующее эту идею, можно найти, например, в [9]. Теорема кодирования таким образом раскрывает операциональ- операциональный смысл понятия пропускной способности как максимальной ско- скорости асимптотически безошибочной передачи информации через данный канал связи.
ГЛАВА 2 СОСТОЯНИЯ И НАБЛЮДАЕМЫЕ § 2.1. Соглашения и обозначения Прежде чем перейти к квантовой теории информации, необ- необходимо изложить предварительные сведения о статистической структуре квантовой теории. Цель состоит не только в том, чтобы ввести определения и зафиксировать обозначения, но и в том, чтобы глубже разобраться в основах квантовой теории и ее вероятностной интерпретации (гораздо более полное изложение этих вопросов читатель найдет в [4; 11 ]). Мы будем иметь дело с квантово-механическими системами, ко- которые описываются конечномерными гильбертовыми пространства- пространствами. С одной стороны, уже в этом случае, причем наиболее наглядно, проявляются радикальные отличия квантовой статистики. С другой, именно системы с конечным числом уровней представляют интерес с точки зрения квантового компьютинга (впрочем, в квантовой теории передачи информации в последнее время большое внима- внимание привлекли «системы с непрерывными переменными», которые описываются бесконечномерными пространствами). Пусть Н — гильбертово (унитарное) пространство, dim H = d < < оо. Мы будем использовать дираковские обозначения: вектор ф из Н (который удобно представлять себе как вектор-столбец) часто будет обозначаться \ф); соответственно, (ф\ обозначает эр- митово-сопряженный вектор-строку. При этом (<р \ ф) естественно обозначает скалярное произведение. Эти обозначения позволяют удобно записывать и операторы, например, А — \ф){ф\ — оператор ранга 1, действующий на вектор |х) по формуле А\х) = \Ф)(<р\х)- Если (ф | ф) = 1, то IV'KV'I — проектор на единичный вектор |^>).
§ 2.2. КВАНТОВЫЕ СОСТОЯНИЯ 19 § 2.2. Квантовые состояния Состояние квантово-механической системы, представляющее на самом деле статистический ансамбль одинаково приготовленных экземпляров системы, описывается оператором плотности (матри- (матрицей плотности в фиксированном базисе), т. е. оператором S в Н, удовлетворяющим условиям 5^0, Тг S — 1. Пусть S(H) — выпук- выпуклое множество всех операторов плотности. Выпуклая комбинация операторов плотности описывает смешивание соответствующих статистических ансамблей. Смесь S = pSl +A - p)S2 получается, если взять ансамбли систем, приготовленных в состояниях 5, и S2 и смешать их в пропорции р и 1 — р. В выпуклых множествах особо важны крайние точки, не представимые в виде нетривиальной смеси других точек, т. е. S = pS{ + A - p)S2, 0 < р < 1, влечет S = 5, = 52. Крайние точ- точки множества квантовых состояний S(H), называемые чистыми состояниями, это в точности одномерные проекторы S^ — \ф)(ф\ (задача 5). В частности, спектральное разложение S = ?*<k)<eJ, О 0, ?а4 = 1, B.1) » = I i где S; — собственные числа, \е{) —собственные векторы операто- оператора 5, показывает, что всякое состояние является смесью не более чем d чистых состояний, где d = dim H. В квантовом статисти- статистическом ансамбле есть два вида стохастичности: во-первых, устра- устранимая в принципе стохастичность, обусловленная флуктуациями классических параметров процедуры приготовления, и во-вторых, неуничтожимая никакими усилиями квантовая стохастичность, присутствующая в любом чистом состоянии. Обозначим Ext (<S) множество крайних точек произвольного выпуклого множества <S. Отметим следующий общий результат: ТЕОРЕМА (Каратеодори). Пусть S — выпуклое компактное подмножество п-мерного векторного пространства. Тогда лю- любая точка S ? S может быть представлена в виде выпуклой комбинации (смеси) не более чем п + 1 крайних точек: 5=Е?Д, 5, е Ext (S). jl Задача 6. Доказать, что если dimW = d, то S(H) погружается в вещественное пространство размерности п = d2 — 1. Если же Н евклидово (вещественное) пространство, то п = d(d + 1)/2 — 1.
20 Гл. 2. СОСТОЯНИЯ И НАБЛЮДАЕМЫЕ Спектральное разложение B.1) показывает, что в случае множе- множества квантовых состояний (как и для других выпуклых множеств с гладкой границей) теорема Каратеодори дает завышенное значе- значение п. С другой стороны, для множества классических состояний (распределений вероятности на некотором фазовом пространстве), представляющего собой симплекс, эта теорема дает точное значе- значение. Это наводит на мысль интерпретировать квантовую теорию как классическую вероятностную модель, в статистической структуре которой зашифрованы некие неклассические ограничения (теорию со скрытыми параметрами). Для одиночной квантовой системы такая точка зрения возможна, но до сих пор не оказалась пло- плодотворной. При переходе же к составным системам она приводит к неустранимым противоречиям с физическими принципами локаль- локальности и причинности (см. далее § 2.5). Наиболее простым, но важным примером является q-бит — двухуровневая квантовая система, dim H = 2. Будем использовать канонический базис: q , L . Удобно ввести базис Паули в веще- вещественном пространстве эрмитовых матриц: т \1 01 ГО 1] [0 -г] [1 0 [О lJ'^U 0р*=[г 0К*=[0 -1 В частности, оператор плотности S G S(H) представляется как B.2) Условие det 5^0 накладывает следующее ограничение на параме- параметры Стокса а = (ах, ау, аг): Таким образом, S(H) как выпуклое множество изоморфно еди- единичному шару в R3. Чистые состояния характеризуются условием <?х + al + a2z = 1 и составляют сферу Блоха. Вводя углы Эйлера в и ц> так, что аг = cos в и ах + iay = sin 9eiv, имеем 5 = \i/>(a))(ip(a)\, кет В квантовых системах со спином 1/2 вектор ф(а) описывает ансамбль (пучок частиц) со спином в направлении о. Хаотическим
§ 2.3. КВАНТОВЫЕ НАБЛЮДАЕМЫЕ 21 называется смешанное состояние с ах = ау = а„=0 (все направле- направления спинов равновероятны), описываемое оператором плотности S = 1/2. Другим важным примером двухуровневой системы является поляризация поперечного фотона. § 2.3. Квантовые наблюдаемые Во всяком физическом эксперименте присутствуют две основ- основные стадии: приготовление состояния и измерение. Даже если приготовляется чистое квантовое состояние, где нет классической стохастичности, результат измерения в данном ансамбле все равно может быть случаен. Итак, мы измеряем случайную величину, распределение ц^(х) которой зависит от приготовления ансамб- ансамбля S и от измерительного прибора М. Естественно ожидать, что смешивание ансамблей приводит к такому же смешиванию распределений, т.е. если S = J2PjSj> т0 ^?(х) — ^2р^?(х)- i i ' Другими словами, вероятности исходов измерения должны быть аффинными функциями состояния. Этого на первый взгляд сла- слабого ограничения оказывается достаточно для вывода обобщенной статистической формулы Борна. ТЕОРЕМА 4 (см. [4]). Пусть S —> /% отображение множества квантовых состояний S(H) в вероятностные распределения на некотором конечном множестве исходов X. Если отображение аффинно, то существует такое семейство эрмитовых опера- операторов {Мх} в Н, что B.4) х€Х ) = Тг SMX. B.5) Семейство, обладающее свойствами B.4), называется разложе- разложением единицы в Н. Набросок доказательства. Эрмитов оператор А = А* в Н имеет (неединственное) представление А = t,5, - t2S2, где t{ ^ 0, a S{ e S(H). В самом деле, существование представления А = А+ — А_ (А± ^ 0) вытекает из спектрального разложения оператора А, а далее Л Л ' Тг А 2
22 Гл. 2. СОСТОЯНИЯ И НАБЛЮДАЕМЫЕ т. е. линейная оболочка Lin S(H) совпадает с вещественным ли- линейным пространством B(H)h всех эрмитовых операторов в Н. Пусть f(S) — аффинная функция на <S(W), продолжим ее на операторы А, полагая /(A) = tif(Si) — t2f(S2). Надо проверить, что благодаря аффинности, такое продолжение однозначно и ве- вещественно линейно (задача 7). Далее, / однозначно и комплексно линейно продолжается на алгебру всех операторов В(Н). Следовательно, если A=[atj] в некотором базисе, то f(A) = — ? mijai}= Tr AM, где М — некоторый оператор. Применяя это к функциям fis(x), получаем ns(x) = Тг SMX. Поскольку Тг SMX — распределение вероятностей для всех 5, то отсюда следуют соот- соотношения B.4). Определение. Квантовой наблюдаемой со значениями в X называется разложение единицы М = {MX}Z€X в гильбертовом пространстве системы Н. В стандартных учебниках по квантовой механике под наблюдае- наблюдаемой понимают ортогональное разложение единицы, т. е. разложе- разложение, для которого М! = МХ, МхМу = 0, хфу. Задача 8. Ортогональное разложение единицы характеризует- характеризуется тем, что все Мх — проекторы: Мх = M%. Будем называть стандартной наблюдаемой ортогональное раз- разложение единицы в Н. Пусть х е X вещественные числа. Всякая такая наблюдаемая однозначно определяется эрмитовым операто- оператором который также называется (вещественной) наблюдаемой. Среднее значение такой наблюдаемой дается обычной формулой Борна Чтобы прояснить значение неортогональных разложений едини- единицы, рассмотрим ортонормированный базис {|w)} в Н и операторы, диагональные в этом базисе. Оператор плотности
§ 2.3. КВАНТОВЫЕ НАБЛЮДАЕМЫЕ 23 задает классическое состояние — распределение вероятностей на «фазовом пространстве» ft = {и>}. Эрмитов оператор А = — Л хи\ш)(ш\ может быть записан в виде о/ A=Z*E,, где Ех= ? И(Ч х \ш \ хш = х} Классическим наблюдаемым А соответствуют случайные величи- величины х„ на п. Проекторам Ех отвечают индикаторы подмножеств п, а ортогональному разложению единицы — разбиение пространст- пространства п. Рассмотрим неортогональное разложение единицы с элементами Мх = Л М(х\ш)\ш)(ш\. Тогда собственные числа удовлетворяют условиям 0 ^ М(х\ш) ^ 1 и ?М(ж|ш) = 1, т. е. определяют пе- X реходные вероятности из п в X. Таким образом, в классическом случае разложения единицы описывают рандомизованные (нечет- (нечеткие) наблюдаемые, задающие только вероятности исходов х в каж- каждой точке ш фазового пространства. Для «четких» наблюдаемых, удовлетворяющих условию Мх2 = Мх, эти вероятности принимают значения 0 или 1. Множество всех переходных вероятностей является выпуклым. Задача 9. Показать, что крайние точки этого множества соответствуют в точности ортогональным разложениям единицы (см. [4]). Однако такая простая картина имеет место только в классике. Рассмотрим следующий пример. ОПРЕДЕЛЕНИЕ. Система векторов {\ф()}сН называется пе- переполненной, если Ш Тривиальным примером является всякий ортонормированный базис. В общем случае векторы могут быть ненормированными и линейно зависимыми. Тем не менее имеет место представление (вообще говоря, неоднозначное) векторов и операторов через пе- переполненную систему, именно
24 Гл. 2. СОСТОЯНИЯ И НАБЛЮДАЕМЫЕ Задача 10. Система {IV',)} является переполненной тогда и только тогда, когда 1) система полна, т. е. {|V>>)}"L={0}; 2) матрица Р — [{ф^ | фк)} идемпотентна, т. е. Р = Р2. Пусть Цф^)} — произвольная полная (не обязательно ортонорми- рованная) система векторов. Тогда оператор Грама невырожден. Система векторов \ф3) = G~i/2\^) является перепол- переполненной. С каждой переполненной системой связано разложение еди- единицы Mj = \фУ(ф;\. Это разложение единицы является крайней точкой выпуклого множества всех разложений единицы тогда и только тогда, когда операторы М}- линейно независимы (см. § 4.3). Переполненные неортогональные системы не имеют аналога в классической статистике. Математический смысл неортогональных разложений единицы проясняет теорема Наймарка. Теорема 5. Пусть {МХ}Х€Х — разложение единицы в гиль- гильбертовом пространстве Н, dim H = d, \X\ = п. Тогда существу- существует гильбертово пространство Н, dim'H^.n- d, изометрический оператор V: H—tTi и ортогональное разложение единицы {Ех} в Н, такие, что Изометрический оператор — это оператор, сохраняющий ска- скалярное произведение, и, следовательно, все углы, расстояния и объ- объем. Для любых |у>), \ф) G Н выполняется (ч>\У*У\ф) = (р\ф), т. е. V* V = 1. Изометрическое вложение ^позволяет отождествить Н с подпространством УН пространства Н и считать, что НСН. Тогда Мх можно рассматривать просто как ограничение Ех на Н: Заметим, что теорема имеет место и в случае общего разложения единицы в бесконечномерном гильбертовом пространстве.
§ 2.4. СОСТАВНЫЕ КВАНТОВЫЕ СИСТЕМЫ 25 Набросок доказательства. Рассмотрим векторную сумму Нп из п копий пространства Н, состоящую из векторов в которой определим псевдоскалярное произведение формулой Соответствующая квадратичная форма может быть вырож- вырождена. Обозначим Но = {Ф € Нп | (Ф | Ф) = 0} и рассмотрим факторпространство Нп/Н0. В нем определено настоящее скаляр- скалярное определение. Это и будет Н. (Заметим, что размерность п • d пространства Нп могла лишь уменьшиться при факторизации.) Определим У\ф): = \Ф) Задача 11. После факторизации эта формула корректно опре- определяет оператор V из Н в Н. Этот оператор изометричен так как {¦ф К | V) = (Ф | Ф), поскольку ]Р Мх = /. Теперь введем ортогональное разложение единицы, полагая в Нп г О При этом {ф\У'ЕУ\ф') = (ф\Му\ф'). § 2.4. Составные квантовые системы Своеобразие квантовой теории информации и возможности кван- квантового компьютинга в значительной мере обусловлены необычны- необычными свойствами составных квантовых систем. Пусть Hv г = 1,2, гильбертовы пространства двух квантовых систем со скалярными
26 Гл. 2. СОСТОЯНИЯ И НАБЛЮДАЕМЫЕ произведениями (¦ | -);. Их совокупность описывается тензорным произведением гильбертовых пространств, которое строится следу- следующим образом. Рассмотрим векторное пространство ? конечных формальных линейных комбинаций J^sV'i' x W- Введем псевдо- 3 скалярное произведение на ?, полагая на порождающих элементах и далее продолжая по линейности на С. Полученное псевдоскаляр- псевдоскалярное произведение будет вырожденным на подпространстве Со (за- (заведомо содержащем все элементы вида — с<р1 хф2 — c'ip[ хф2 + (ар1 + + c'ip[) х ф2). Тензорным произведением НХ®Н2 гильбертовых про- пространств называется факторпространство С/Со = Н со скалярным произведением, порожденным формой (• | •). Образы порождающих элементов фх x Фъ ПРИ этой факторизации обозначаются фх®ф2. Задача 12. Пусть {е/}, {е^} — ортонормированные базисы в НиН2, тогда {е/<8>е*} — ортонормированный базис в Нх <8> Н2 и dim Н = dim Hx -dim7t:2. Таким образом, реализуя Н12 как пространства ?2 числовых последовательностей {cj},{c|}, получим реализацию Н в виде пространства матриц [cjk]c величиной ^|с^| в качестве нормы. Заметим, что всякий вектор ф Е Hi <8> Н2 однозначно записывается в виде 4, так что в общем случае Нх ® Н2 изоморфно прямой сумме d^ = = dim Н2 слагаемых Нх ©... © W,. Для операторов Xi в пространствах Hj зададим их тензорное произведение в пространстве Н = Нх <8> Н2, полагая (X, О Х2)(ф, 0 ф2) = Х1ф1® Х2ф2, и продолжая по линейности. Задача 13. Если 5,- — операторы плотности в Ни то 5, <8> S2 — оператор плотности в Нх <8> H2. Пусть оператор Г действует в Н = "Нх <S> W2. Частичный след оператора Г (по второму сомножителю) обозначим Тгн Г; это оператор в Н,, ассоциированный с формой (^| Тгн Г|^> = E(V ® е*| Т\ф ® е*>, <р, ф € И. 2 *
§ 2.4. СОСТАВНЫЕ КВАНТОВЫЕ СИСТЕМЫ 27 Задача 14. Определение корректно (не зависит от выбо- выбора ортонормированного базиса {е^}). Если Г = Тх ® Т2, то Рассмотрим теперь важное следствие из теоремы Наймарка, дающее статистическую интерпретацию произвольного разложения единицы и устанавливающее согласованность обобщенного и стан- стандартного определений квантовой наблюдаемой. СЛЕДСТВИЕ. Пусть {М^} —разложение единицы в Н, тогда найдется гильбертово пространствоНо, единичный вектор ф0Е еК0 и ортогональное разложение единицы {Ej} в Н®Н0, такие, что Доказательство. Согласно теореме Наймарка, Mi = = V*EjV, где V:H—>H — изометрическое вложение. Отождествим Н с подпространством Н. Расширяя, если необходимо, пространст- пространство Н, можно считать, что dim H — dim H ¦ d^, и значит где Но = ?2 — гильбертово пространство размерности d^, причем Н отождествляется с первым слагаемым в прямой сумме, или с подпространством 7i® |V'o)(V'ol> гДе . О Имеем для (р,феК: ф) = (<р® Ф0\Е^ф ® ф0) = {<р\ Итак, всякую наблюдаемую можно реализовать в виде стан- стандартной наблюдаемой в составной системе за счет добавления вспомогательной системы, находящейся в фиксированном чистом состоянии 50 = |V'o)(V'ol- Такой способ реализации естественно назвать квантовой рандомизацией. В классической статистике рандомизация, т. е. добавление «ру- «рулетки», хотя и может оказаться полезным приемом (например, в теории игр), никогда не увеличивает информации о состоянии наблюдаемой системы. В главе 4 мы покажем, что в квантовой
28 Гл. 2. СОСТОЯНИЯ И НАБЛЮДАЕМЫЕ механике это уже не так: парадоксальным образом, квантовая рандомизация позволяет извлекать больше информации о наблю- наблюдаемой системе, нежели содержится в стандартных наблюдаемых, не использующих вспомогательной системы. § 2.5. Парадокс ЭПР. Неравенство Белла Ключевой пример необычного (с классической точки зрения) поведения составной квантовой системы рассмотрели Эйнштейн, Подольский и Розен (ЭПР) в 1935 г. В более отчетливой форме, использующей спиновые степени свободы, его представил Бом в 50-х, и полную ясность внес Белл в 60-х годах. Рассмотрим со- составную систему из двух g-битов, например, две частицы со спином 1/2, каждая из которых описывается гильбертовым пространством Н с dim H = 2. В начальный момент частицы взаимодействуют таким образом, что конечное состояние их спинов, называемое состоянием Белла, описывается вектором где векторы описывают состояния каждой частицы со спином, направленным, соответственно, в положительном и отрицательном направлении оси z. Обычно пишут а в квантовых вычислениях предпочитают обозначение Каждая из компонент описывает состояние с разнонаправленными спинами, а \ф) — их суперпозиция, которую невозможно пред- представить в виде произведения векторов состояний, относящимся к разным частицам. Состояние Белла — канонический пример сцепленного (entangled) состояния двух квантовых систем, т. е. состояния, не представимого в виде тензорного произведения чистых состояний.
§ 2.5. ПАРАДОКС ЭПР. НЕРАВЕНСТВО БЕЛЛА 29 Затем частицы разлетаются вдоль оси у на макроскопическое расстояние, а сцепленное спиновое состояние сохраняется. В част- частности, полный спин остается равным 0. Если теперь измере- измерением спина фиксировать состояние первой частицы, то вторая частица оказывается в определенном состоянии с противополож- противоположным направлением спина. Таким образом, интерпретируя понятие квантового состояния, приходится выбирать между следующими альтернативами: 1) как и в классической механике, (чистое) состояние описывает внутренние свойства системы. Тогда приходится допустить мгно- мгновенное дальнодействие, противоречащее принципу локальности; 2) вектор состояния — это лишь выражение информационного содержания процедуры приготовления системы. При таком пони- понимании никакого противоречия с локальностью или причинностью не возникает, и обстоятельство, что вторая частица «мгновенно» оказывается в состоянии с противоположным спином, не более уди- удивительно, чем то, что у наугад выбранной пары носков оказывается одинаковый цвет. Однако внимательное рассмотрение этого мысленного экспе- эксперимента приводит к более глубокому и неожиданному выводу, на который обратил внимание Белл: если пытаться описывать корреляции измерений спинов двух частиц классически и в соот- соответствии с принципом локальности, то оказывается невозможным достичь такого характера и уровня коррелированности, который соответствует предсказаниям квантовой механики. Более того, этот уровень коррелированности может быть количественно сформули- сформулирован и проверен экспериментально. Дадим точную формулировку. Пусть вектор а = (ах, ау, аг) задает некоторое направление, тогда а(а) = ахах + ауау + а2а2 — наблюдаемая спина в направлении а (с точностью до множителя h/2.) Оператор сг(а) имеет собственные значения ±1 (спин вдоль и против направления а). Таким образом а(а) = \ф(а))(ф(а)\-\ф(-а))(ф(-а)[. S(a) S(-3) Напомним, что а имеет углы Эйлера (в, р), при этом вектор B.3) отвечает чистому состоянию со спином в направлении а. Соответ- Соответствующий оператор плотности равен
30 Гл. 2. СОСТОЯНИЯ И НАБЛЮДАЕМЫЕ Рассмотрим эксперимент, в котором производятся совместные измерения наблюдаемой а (а) для одной системы и с(Ь) — для другой (см. рис. 2). Задача 15. Для состояния Белла двух g-битов корреляция спинов дается формулой {ф\сг(а) <8> сг(Ъ)\ф) = -а ¦ Ъ. B.6) Оказывается, что такая корреляция не может быть смоделирова- смоделирована никакой классической моделью составной системы, удовлетворяющей принципу локаль- локальности. Это вытекает из следующего неравен- неравенства Белла — Клаузера — Хорна — Шимони. Пусть Xv Yk, j, к = 1, 2, — случайные величи- величины на произвольном вероятностном простран- пространстве п, такие что \Xj\ ^ 1, |1^| ^ 1. Тогда для любого распределения вероятностей на п Рис. 2. Направления спинов корреляции этих величин удовлетворяют неравенству Yx { Y2 - EX2Y2\ ^ 2, B.7) где Е — соответствующее математическое ожидание. Доказательство получается усреднением элементарного неравен- неравенства Принцип локальности, или, лучше сказать, разделимости в данной модели заключается в том, что физическая наблюдаемая для первой системы описывается одной и той же случайной величиной (Хх в случае первых двух корреляций, Х2 в другом слу- случае) независимо от того, какая величина — 1^ или Y2 измеряется во второй системе. Это условие кажется настолько естественным, что оно даже трудно уловимо. Однако именно оно запрещает мгновенное влияние измерения, проводящегося в одной системе, на измерения Рис. 3. Выбор векторов а^ и Ьк в другой системе. Если от него отказаться, то интересующие нас четыре физические корреляции могут быть любыми величинами из отрезка [—1,1]. Вернемся теперь к системе из двух g-битов и рассмотрим четыре эксперимента, когда в первом g-бите измеряется наблюдаемая
§ 2.5. ПАРАДОКС ЭПР. НЕРАВЕНСТВО БЕЛЛА 31 спина cr{aj), j = 1, 2, а во втором cr(bk), к = 1, 2, где направления e,-> fy(., У, А; = 1, 2, образуют конфигурацию, изображенную на рис. 3. При этом система приготавливается в одном и том же состоянии Белла. Подстановка соответствующих значений корреляций из фор- формулы B.6) в левую часть формулы B.7) дает значение 2У^2, наруша- нарушающее неравенство. Отсюда следует, что либо квантовая механика дает неправильные выражения для корреляций, либо для данной составной системы не существует классического вероятностного описания, удовлетворяющего условию локальности. После первого эксперимента (Аспек, 1981-1982 гг.) был проделан целый ряд аналогичных экспериментов по измерению ЭПР-корреляций, ре- результаты которых с определенностью свидетельствуют в пользу квантовой механики.
ГЛАВА 3 ПРИМЕНЕНИЯ СЦЕПЛЕННЫХ СОСТОЯНИЙ § 3.1. Квантовое состояние как информационный ресурс В этом параграфе нам потребуются элементарные сведения об эволюциях квантовой системы. В дальнейшем, в главе 6 этот вопрос будет рассмотрен углубленно и с общих позиций теории открытых квантовых систем. Математически настроенному читателю мы советуем перейти к главе 4 и вернуться к этому материалу после главы 6. Пока же достаточно знать следующее: 1) Обратимые эволюции квантовой системы описываются уни- унитарными операторами U: вектор исходного чистого состояния ф преобразуется в результате такой эволюции в Цф. Соответственно, оператор плотности S преобразуется в USU*. 2) Важнейший пример необратимой эволюции — изменение со- состояния в результате измерения. Простейшее идеальное квантовое измерение связывается с ортонормированным базисом \ех), векторы которого индексированы возможными исходами измерения х. Если система перед измерением находится в состоянии 5, то в резуль- результате такого измерения она переходит с вероятностью {ех \ Sex) в состояние |eI)(ex|. Весь статистический ансамбль после измерения разбивается на подансамбли, соответствующие различным исходам х, и описывается состоянием S' = E\ex)(ex\Sex){ex\, C.1) X вообще говоря отличным от исходного. Таким образом, квантовое измерение включает неустранимое воздействие на наблюдаемую систему, которое изменяет ее состояние, даже если исходы на- наблюдения «не считываются». В этом принципиальное отличие квантовых «наблюдаемых» от классических случайных величин, наблюдение которых не изменяет статистический ансамбль, а сво- сводится к простому отбору его представителей.
§ 3.1. КВАНТОВОЕ СОСТОЯНИЕ КАК ИНФОРМАЦИОННЫЙ РЕСУРС 33 Квантовое состояние приготавливается макроскопическими уст- устройствами. Изменяя параметры устройства, мы изменяем параме- параметры состояния, и таким образом получаем возможность «записы- «записывать» классическую информацию в квантовом состоянии. Простей- Простейший квантовый канал связи математически задается семейством (выходных или сигнальных) состояний Sx, где параметр х пробегает входной алфавит. Отображение х —> Sx в сжатой форме содер- содержит описание физического процесса, порождающего состояние Sx. Например, пусть ж =0,1, причем 5; когерентное состояние поля излучения лазера, а 50 вакуумное состояние. В этом случае мы имеем канал с двумя чистыми неортогональными состояниями. Для того чтобы извлечь классическую информацию, содержащу- содержащуюся в квантовом состоянии, необходимо произвести измерение. В приведенном выше примере такую роль играет любой приемник лазерного излучения с возможной последующей обработкой ре- результатов измерения. Если измерение задается базисом \еу), то условная вероятность получить исход у, при условии, что был послан сигнал х, дается формулой P(y\x) = (ey\Sxet). C.2) Таким образом, для фиксированного измерения мы получаем обычный канал связи. Это дает возможность поставить вопрос о максимальном количестве классической информации, которое может быть передано по данному квантовому каналу связи и о его пропускной способности. Этот вопрос будет детально рассмотрен в главе 5. Отметим здесь лишь один факт, имеющий принципиальное значение: Пропускная способность любого квантового канала ограничена сверху величиной log dim Н, причем эта величина достигается для «идеального» канала, сигнальные состояния которого образованы векторами ортонормированного базиса в пространстве Н, а из- измерение задается этим же ортонормированным базисом. Таким образом, размерность гильбертова пространства является мерой максимального информационного ресурса квантовой системы. Рассмотрим теперь следующий вопрос. Нелокальный, с класси- классической точки зрения, характер ЭПР-корреляций наводит на мысль попытаться использовать их для мгновенной передачи информа- информации. Покажем, что этого невозможно достичь, находясь в рамках квантовой механики (с точки зрения которой ЭПР-корреляции не противоречат локальности). Рассмотрим две квантовые системы А
34 Гл. 3. ПРИМЕНЕНИЯ СЦЕПЛЕННЫХ СОСТОЯНИЙ и В, в пространствах НА и Нв соответственно, которые находятся в сцепленном состоянии SAB. В случае, представляющем интерес, системы пространственно разделены, хотя формально это ни в чем не выражается. Система А получает классическую информацию, содержащуюся в значениях параметра х, которая может быть использована для выполнения произвольных унитарных операций Ux в пространстве НА. При этом состояние системы А В переходит в Sx = (Ux<g>IB)SAB(Ux<g) 1ву, таким образом, классическая инфор- информация записывается в квантовом состоянии составной системы. В свою очередь, над системой В может быть произведено произ- произвольное измерение, описываемое ортонормированным базисом \еу) в Нв. Легко видеть, что результирующая переходная вероятность C.2) не зависит от х, а значит количество передаваемой информа- информации в самом деле равно нулю. § 3.2. Сверхплотное кодирование Хотя ЭПР-корреляции сами по себе не позволяют передавать информацию, оказывается, что наличие таких корреляций между системами позволяет увеличить максимальное количество клас- классической информации, передаваемой от А к В, вдвое, если между системами имеется идеальный квантовый канал связи, т. е. возможность безошибочно передать любое квантовое состояние. Таким образом, ЭПР-корреляции выступают как «катализатор» при передаче классической информации через квантовый канал связи, и с этот точки зрения, также представляют собой особого рода информационный ресурс. Рассмотрим системы А и В, каждая из которых представляет собой g-бит, между которыми имеется идеальный квантовый канал связи. Из того что было сказано выше в § 3.1, вытекает, что мак- максимальное количество классической информации, которое может быть передано от А к В, равно одному биту, и получается при кодировании бита в два ортогональных вектора, например, Протокол «сверхплотного кодирования», предложенный Висне- ром в 1992 г., имеет в своей основе простой математический факт: базис Белла |е+} = |00) + |11), |е_) = |00>
§ 3.3. КВАНТОВАЯ ТЕЛЕПОРТАЦИЯ 35 в системе из двух g-битов А В (мы используем канонический базис |0),|1) в пространстве одного g-бита и опускаем нормировочный множитель l/v2) может быть получен из одного вектора действием «локальных» унитарных операторов, т. е. операторов, действующих нетривиально только в пространстве g-бита А, например 1О = (<т,®7)|е+), 1М=К®/)|е+>, \h_)=-i(crv®I)\e+). Таким образом, если АВ изначально находится в состоянии |е+), А может закодировать 2 бита классической информации в 4 состо- состояния базиса Белла, производя только локальные операции, а затем (физически) послать свой g-бит В по идеальному квантовому каналу. Тогда, производя измерение в базисе Белла, В полу- получает 2 бита классической информации. Конструкции протоколов сверхплотного кодирования и телепортации допускают обобщение на случай пространства произвольной конечной размерности (ср. далее в главе 8). § 3.3. Квантовая телепортация До сих пор говорилось о передаче классической информации через квантовый канал связи. Такая информация может быть «записана» в квантовом состоянии и передана через физический канал. Однако квантовое состояние и само по себе является инфор- информационным ресурсом постольку, поскольку имеет статистическую неопределенность. Оказывается, что информация, содержащаяся в неизвестном квантовом состоянии, имеет качественные отличия от классической, и поэтому заслуживает специального термина квантовая информация. Наиболее ярким отличием квантовой информации является невозможность копирования (no cloning). Очевидно, что классическая информации может воспроизводиться в любом количестве. Но физический прибор, который бы выполнял аналогичную задачу для квантовой информации, противоречит принципам квантовой механики, так как преобразование является нелинейным, и не может быть осуществлено унитарным оператором. Конечно, это можно сделать каждый раз специальным прибором для данного конкретного состояния (и даже для фик- фиксированного набора ортогональных состояний), но не существует
36 Гл. 3. ПРИМЕНЕНИЯ СЦЕПЛЕННЫХ СОСТОЯНИЙ универсального прибора, который бы размножал произвольное квантовое состояние. Каким образом может быть передано квантовое состояние? Оче- Очевидно, что можно просто физически переслать саму систему. Го- Гораздо более интересный и нетривиальный способ — телепортация квантового состояния, при которой сама система физически не пе- передается, а передается лишь классическая информация ''. При этом существенным дополнительным ресурсом, который вновь играет роль «катализатора», является ЭПР-корреляция между входом и выходом канала связи. Заметим, что свести передачу произвольного квантового состояния к только передаче классической информации, не используя дополнительного квантового ресурса, невозможно: поскольку классическая информация копируема, это означало бы возможность копирования и квантовой информации. Пусть имеются две квантовые системы А и В, описывающие, соответственно, вход и выход канала связи. На вход А поступа- поступает произвольное состояние \ф); можно описать процедуру, при которой исходное состояние В перейдет в \ф), а входное \ф) с необходимостью разрушится (иначе мы имели бы копирование). В простейшей (и основной) версии системы А и В являются двухуровневыми (д-битами). 1) Перед началом передачи система А В приготовляется в состо- состоянии |00) + |11). 2) С посылает А произвольное чистое состояние Совокупность трех систем CAB описывается состоянием (а|0) 3) Затем а) А производит некоторое обратимое преобразование состо- состояния системы С А; б) А производит измерение (с 4 исходами, что составляет 2 бита классической информации). Преобразование и измерение будут описаны ниже. !) Bennett С. Н., Brassard G., Сгёреаи С, Jozsa R., Peres A., Wootters W. К. Teleporting an unknown quantum state via dual classical and Einstein-Podolsky-Rosen channel // Phys. Rev. Lett. — 1993. — V. 70. —P. 1895-1899.
§ 3.3. КВАНТОВАЯ ТЕЛЕПОРТАЦИЯ 37 4) А посылает результат измерения В по классическому каналу связи. 5) В зависимости от полученного результата измерения В произ- производит некоторое преобразование и получает это произвольное |^}. Производимые преобразования являются характерными примера- примерами логических операций, используемых в квантовом компьютинге. На 3-м шаге над системой СА производится операция CNOT (контролируемое «нет»): при которой состояние первого g-бита сохраняется, а состояние второго g-бита не изменяется, либо изменяется на противополож- противоположное, в зависимости от состояния первого g-бита. При этом базис переходит в базис, следовательно, в четырехмерном пространстве СА этому преобразованию соответствует унитарный оператор. Затем к g-биту А применяется операция Адамара Н с унитарной матрицей Тогда ^ |i)- т. е. базис поворачивается на угол тг/4. Начальное состояние всей системы CAB есть а|000) + Ь|100) + После действия CNOT на СА получаем Потом Н действует на С а(|000) + |100))+Ь(|010)- Выделяя состояние системы СА, получаем Теперь производится измерение в системе СА, проецирующее на один из четырех базисных векторов |00), ..., |11). Результат изме- измерения посылается от А к В по классическому (идеальному) каналу
38 Гл. 3. ПРИМЕНЕНИЯ СЦЕПЛЕННЫХ СОСТОЯНИЙ связи. В зависимости от полученного результата В применяет к своему состоянию один из унитарных операторов ° П Г 1 01 ГО -г \ о]' ^=1о-1 J' ау=[г о преобразующих состояние В в а|0) + Ь\\). Возможность телепортации состояния поляризации фотона была продемонстрирована экспериментально Целлингером в 1997 г. Одна из технически наиболее сложных проблем в таком экспери- эксперименте— совместные манипуляции с состояниями фотонов С и А. § 3.4. Квантовые алгоритмы Идея квантового компьютера была предложена Фейнманом для моделирования квантовомеханических систем. Впоследствии был поставлен вопрос: не может ли квантовый компьютер решать какие- либо задачи более эффективно, чем классический. Простейшие, но довольно искусственные примеры таких задач рассмотрели Дейч и Джоза. Их усовершенствованием является алгоритм Саймона, который лежит в основе и алгоритма Шора, эффективно решаю- решающего важную и практически интересную (по крайней мере, с точки зрения криптографии) задачу разложения большого натурального числа на простые множители. 3.4.1. Алгоритм Саймона. Обозначим В ={0,1}, Вп = В*п. Пусть задана функция /: Вп —> Вп. Известно, что функция / явля- является периодической, т. е. f(x) — f(y) <=^ у = хф?, где ? Е В" — двоичный (булев) вектор. Здесь ф обозначает покомпонентное двоичное сложение векторов. Требуется найти период ? за наименьшее возможное число шагов (принимая за шаг каждый акт вычисления функции /). Классическое решение задачи сводится к перебору и требует число шагов ОBп/2), растущее экспоненциально с п. (После вычисления s значений функции /, сравнивая значения в двух точках, мы можем исключить не более s(s — 1)/2 из 2" значений ?, откуда s ~ 2П'2.) Квантовый алгоритм требует всего О(п) шагов, если считать за шаг квантовое вычисление функции /. Для описания квантового алгоритма нам понадобится n-мерное обобщение операции Адамара Нп = Н <8>... ® Ну Рассмотрим квантовый регистр — физическую
§ 3.4. КВАНТОВЫЕ АЛГОРИТМЫ 39 систему из п g-битов; информация будет задаваться состоянием этой системы. Если х — набор нулей или единиц длины п, то уев" где х ¦ у — скалярное произведение векторов х е Вп, у € Вп по модулю 2, поскольку Алгоритм Саймона состоит из следующих шагов: 1) Сначала квантовый регистр приготовляется в основном состо- состоянии |00...), затем применяется операция Адамара: В результате получается суперпозиция всевозможных базисных состояний с одинаковыми коэффициентами. 2) Затем к этой суперпозиции применяется унитарный оператор, обратимо вычисляющий функцию /: (Е И ^ X И- Предполагается, что такой унитарный оператор дан «свыше» (по- (поэтому его принято называть «оракулом»). Отметим, что в алгоритме Шора соответствующее вычисление описывается эффективно. В принципе, он может быть составлен из некоторых элементарных операций, если известно, как сама / составлена из элементарных логических операций. Здесь \z) состояние вспомогательного реги- регистра, который введен, чтобы сделать операцию вычисления функ- функции обратимой. Если исходно этот регистр находится в основном состоянии, то 3) Вновь применяя операцию Адамара.получаем состояние пп / j / ^ \ *¦ ) хев„уевп
40 Гл. 3. ПРИМЕНЕНИЯ СЦЕПЛЕННЫХ СОСТОЯНИЙ 4) Измеряя оба регистра, получаем состояние |у)|/(ж)) с вероят- вероятностью [(-1)—+ (-1)(аь + «>-»]2, равной 2~Bп), если у ¦ ? —0, и 0 в противном случае. Таким образом, получается случайный равномерно распределен- распределенный вектор у(ш) из булевой «гиперплоскости» у • ? =0. Лемма. Пусть ух{ш),.. .,уп_1(ш) независимые, равномерно распределенные случайные векторы из гиперплоскости у-? —0. Тогда ),..., yn_\(uj) линейно независимы} ^ е~1. Доказательство. Вектор у(ш) принимает 2" равнове- равновероятных значений. Если у^со),..., ук_1(ш) линейно независимы, то имеется 2*~' их различных линейных комбинаций. Поэтому получаем следующие значения условных вероятностей: Р{ук(ы) линейно независим от Vi(uj), ..., yk_x(uj) | у,(ш),..., yk_i(u)} = 2"-'2*-' _,1 _ on — 1 пп — к ' И ),..., ук(и>) линейно независимы} = = Р{ук(и)) линейно независим от у^ш),..., ук_^си) \ У[(о;),..., уА._1(ш) линейно независимы} = — A — ¦^rrk-)P{yi(u),..., ук_х(ы) линейно независимы}. Следовательно Р{ух(и)),..., yn_i(w) линейно независимы} = 3-1 5) Повторяем всю процедуру т(п — 1) раз, где 1 — A — e~')m ^ е. Тогда с вероятностью 1 — е получим по крайней мере п - 1 линейно независимых булевых векторов, ортогональных ?, а значит, и сам вектор ?.
§ 3.4. КВАНТОВЫЕ АЛГОРИТМЫ 41 Квантовый алгоритм требует лишь О(п) применений оператора U{ вместо <9Bп/2) вычислений значения / для классического алгоритма. За счет чего достигается такое радикальное ускорение? Очевидно, за счет того, что однократное применение оператора Uf дает состояние, которое в латентной форме содержит все значения функции /, и из которого интересующая нас информация может быть извлечена посредством квантового измерения. Такой прием называют «квантовым параллелизмом». Важно, однако, подчерк- подчеркнуть, что в отличие от параллелизма в классическом компьютинге, речь отнюдь не идет об одновременном вычислении всех значений функции. 3.4.2. Замечания об алгоритме Шора. Алгоритм, предложен- предложенный Шором1', эффективно решает задачу нахождения множителя большого натурального числа JV ~ 2". Задача факторизации — разложения на множители — одна из фундаментальных проблем математики, имеющая далеко не только академический интерес: трудность решения этой задачи лежит в основе криптографии с открытым ключом. Наилучший из известных в настоящее время алгоритмов имеет экспоненциальную сложность (9Bc/3|og23"). Есть (но не доказано) предположение, что полиномиальное решение этой задачи не существует. Квантовый алгоритм Шора имеет полиномиальную сложность О(п2 logn log log n). Представление о его эффективности дает следующая грубая оценка: задача факторизации числа N ~ 2800 не решаема за разумное время на классическом компьютере, тогда как применение квантового алгоритма при частоте переклю- переключений 1 Мгц потребовало бы пару дней. Алгоритм использует сведение задачи факторизации к нахождению периода функции /(х) = ax(mod N), где а выбирается случайным образом. Можно показать, что в большинстве случаев период г является четным и число ar/2 ± 1 имеет общий множитель с N, который находится с помощью классического алгоритма Евклида. Алгоритм Шора включает детальное описание эффективного выполнения операции Uj. Нахождение периода /(ж) использует квантовую модификацию быстрого преобразования Фурье (роль которого в гораздо более простой задаче Саймона выполняло преобразование Адамара Нп). Подробнее об алгоритме Шора и квантовых вычислениях см. в [13, 16, 2]. '* См. Shor P. Introduction to quantum algorithms. — LANL Report no. quant- ph/OOO5OO3.
42 Гл. 3. ПРИМЕНЕНИЯ СЦЕПЛЕННЫХ СОСТОЯНИЙ 3.4.3. Алгоритм Гровера. Этот алгоритм решает задачу поиска. Более точно, предполагается, что задана булева функция F: Вп —> В, такая что F(xq)=1, F(x) = 0, хфх^. Требуется найти Xq, причем вычисление значения функции F в любой заданной точке принимается за один шаг. Классический алгоритм сводится к перебору значений х и проверки для них равенства F(x)= 1, что в наименее благоприятном случае требует N ~ 2" шагов. Квантовый алгоритм Гровера позволяет решить задачу за «\/iV = 2n/2 шагов. Предполагается, что в гильбертовом пространстве, натянутом на базис |х), х е В", задан унитарный оператор UF, такой что Алгоритм состоит из следующих шагов: 1) К основному состоянию применяется операция Адамара где введено обозначение 2) К полученному состоянию применяется унитарный оператор U = HnJHnUF, где J — оператор, действующий по формулам J|0... ...0) = |0...0), J|x) = -|x>, х^О. Задача 16. Проверьте, что где sin <р — 2\/N — 1/JV, т. е. U осуществляет поворот на угол у> в плоскости, натянутой на вектор | Хд) и вектор . Y1 I х)- После применения оператора U тп раз, где mwGr/4)\/iV, конеч- конечное состояние становится очень близким к искомому: \i>(9m)) &\xq), причем тем ближе, чем больше N. В этом алгоритме квантовый параллелизм проявляется в том, что вычисления функции F в отдельных точках заменяются действием унитарного оператора UF на суперпозицию базисных состояний, что и позволяет достичь полиномиального ускорения.
ГЛАВА 4 ОПТИМАЛЬНОЕ РАЗЛИЧЕНИЕ КВАНТОВЫХ СОСТОЯНИЙ § 4.1. Постановка задачи В этом параграфе мы рассмотрим статистическую задачу, кото- которая позволит в дальнейшем перейти к изучению квантовых каналов связи. Пусть квантовая система находится в одном из состояний Sy, j = 1,..., п. Над системой можно производить произвольное измерение. Требуется найти оптимальную процедуру измерения, позволяющую наилучшим образом выяснить, в каком из этих состояний находится система. Такая постановка задачи характерна для теории связи и для математической статистики. S, м Измерение (приемник) будет описываться наблюдаемой, т. е. разложением единицы М = {Мк}. Вероятность принять решение к, при условии, что был послан сигнал j, при этом равна pM(k \ j) =1т SjMk. Если был послан сигнал j, то вероятность того, что было принято правильное решение, есть pM(j \j)- Примем дополнительное предположение, что сигнал j появляется с вероят- вероятностью тгу (например, в случае равновероятных сигналов тг^ = 1/п). Тогда средняя вероятность правильного решения а средняя вероятность ошибки равна 1 — V{M}, и задача состоит в ее минимизации, или же в максимизации *Р{М}. В статистике
44 Гл. 4. ОПТИМАЛЬНОЕ РАЗЛИЧЕНИЕ КВАНТОВЫХ СОСТОЯНИЙ применяется и минимаксный критерий, когда минимизируется max pM(j | j), но мы его не будем здесь затрагивать. 3 Другой важный критерий, который мы рассмотрим позже, — шенноновская информация. Согласно формуле A.7) количество взаимной информации между входом J (j — номер входного состояния) и выходом К (к — номер решения) дается формулой J{M}:=H(K}- H(K\J) = энтропия условная энтропия (к |у)= * 3 § 4.2. Различение по максимуму правдоподобия Будем максимизировать вероятность правильного решения V{M] := ? тг, Тг 5,М. =Тг Множество наблюдаемых, по которым ведется оптимизация — выпуклое. Смесь (выпуклая комбинация) наблюдаемых описы- описывает статистику измерения, производимого прибором с флуктуиру- флуктуирующими параметрами. Функция V{M} аффинна, т. е. Оптимизация аффинной функции, заданной на выпуклом множест- множестве — типичная задача линейного программирования. ТЕОРЕМА 6. Средняя вероятность правильного решения V{M} достигает максимума в крайней точке множества 9Я„. Наблюдаемая М° оптимальна тогда и только тогда, когда найдется такой эрмитов оператор Л°, что l)(A°-Wh)MS=O; 2) A°^Wk.
§ 4.2. РАЗЛИЧЕНИЕ ПО МАКСИМУМУ ПРАВДОПОДОБИЯ 45 При этом имеет место соотношение двойственности: max{V{M} | М е 9ЛП} = min{TrA | Л > Wk, к = 1,..., п}. D.1) Доказательство. Докажем достаточность условий теоре- теоремы. Пусть наблюдаемая М° удовлетворяет этим условиям, М6DJln — произвольная наблюдаемая, тогда в силу 1) и 2) имеем V{M} = Тг J2 WkМк^ Тг ? А°Мк = к = Тг Л° = Тг X) WkM2 = V{M0}. Здесь был использован следующий простой факт: Задача 17. Для В ^ 0 в В(Н) и А,, А2, таких что А, ^ А2, имеет место Тг АХВ ^Тг А2Б, причем равенство имеет место тогда и только тогда, когда АХВ = А2В. Докажем необходимость условий теоремы. Положим Мк — Хк, где Хк эрмитовы операторы, удовлетворяю- удовлетворяющие условию J2 %к = I- Применяя метод Лагранжа, сводим задачу к максимизации Р{М} на множестве ЗЛП к нахождению максимума функции ТгЕ^Л-ТгЛО:^2-/), D.2) к к где Л — эрмитов оператор, по всевозможным наборам эрмито- эрмитовых операторов Хк. Пусть Хк оптимальный набор, положим Хк —Хк-{- eYk, и рассмотрим D.2) как функцию от е. Рассматривая коэффициенты при е и е2, получаем условия 7r[(Wk - Л)Х° + X°(Wk - A))Yk = 0, lr{Wk - Л)Y* ^ О для произвольных эрмитовых Yk, т. е. Второе неравенство есть условие 2) теоремы. Полагая Мк — (Xj?J, получаем из первого соотношения Тг(Л— Wk)Mk =0, что вместе со вторым неравенством влечет условие 1). Задача 18. Доказать, что операторный множитель Лагранжа Л является единственным решением двойственной задачи в правой части D.1).
46 Гл. 4. ОПТИМАЛЬНОЕ РАЗЛИЧЕНИЕ КВАНТОВЫХ СОСТОЯНИЙ Проиллюстрируем смысл и полезность этих условий на несколь- нескольких примерах. Рассмотрим сначала классический случай, когда операторы плотности состояний коммутируют. ПРИМЕР 1. Пусть операторы Wk (пропорциональные Sk) ком- коммутируют, тогда существует общий ортонормированныи базис, где они все диагонализуются, т. е. Тогда можно взять где max Wk(cu) — верхняя огибающая функций Wk(uj), к = 1,..., п; Мк — J2 ln (u))\u))(u)\; через 1П обозначен индикатор подмно- жества пк, а подмножества пк с {ш \ А°(и>) — Wk(u>)} образуют разбиение множества п — {и>}. Это приводит к принципу максимального правдо- правдоподобия в классической статистике: fc-e решение необходимо принимать для тех ш, для кото- которых Wk(uj) максимально. Таким Wr(ui) образом, в классическом случае оптимальная наблюдаемая всегда может быть выбрана нерандомизо- ванной. Это прямо связано с тем фактом, что в коммутативном слу- Рис. 4. Принцип чае Крайние точки множества ЗЛ максимального правдоподобия ^ " отвечают ортогональным разложе- разложениям единицы (см. задачу 7). Пример 2 (задача 19). Различение двух квантовых состо- состояний.. Произвольная наблюдаемая с двумя значениями имеет вид M — {M0,Ml}, Moj ^0, М{ = I — Мо, причем стандартные наблюдаемые характеризуются условием М02 — Мо, которое в точ- точности соответствует крайним точкам «некоммутативного отрезка» ЯЛ2 = {0 ^ Мо ^ 1} (задача 20). Таким образом, для различения двух состояний достаточно стандартных наблюдаемых. Приведем явное решение. Пусть 50, 5, произвольные операторы плотности. Оператор Лагранжа Л = тго5оМо + тг, 5, Мх = тг, 5, + (тго5о - тг, 5,)М0
§ 4.2. РАЗЛИЧЕНИЕ ПО МАКСИМУМУ ПРАВДОПОДОБИЯ 47 эрмитов, поэтому [Mq, тго5о —тг^] — 0. Неравенство Л ^ тг,5, влечет (тго5о — тг,S{)M0 > 0,а из Л ^ 7го5о вытекает (тго5о - тг, 5,)М0 > (тго5о - тг, 5,). Очевидным решением является MQ — 1{0]Оо)(тг050 — тг,^), т. е. про- проектор на собственное подпространство оператора Tr0S0 —тг, S,, отве- отвечающий положительным собственным значениям. При этом maxV{M} = (тго5о - Tr,S,)+] = где ||Т||, = Тг | Т11 — ядерная норма оператора Т. Здесь |Т\ = Т+ + + Т_, где Т+(Т_) положительная (отрицательная) часть эрмитова оператора Т, т. е. компонента его спектрального разложения, отвечающая положительной (отрицательной) части спектра. Пусть 50 = |Vb><Vbl, 31 = \ф1){ф1\. В этом слу- случае оптимум дается ортонормированным базисом {|eo).|ei>}. так что М0 = |е0)(е0|, М1 = \е1)(е1\. Век- Вектор |во) отвечает положительному собственному X числу Ао оператора тго|^о)(^о1 - ^ilV'iXV'il, при- причем max V{M} = щ + Ао. Диагонализуя оператор 7rolV'o)(V'ol •" 7rilV'i){V'il. можно дать явное решение задачи (см. [3]). Пусть для простоты тг0 = тг, = 1/2 , тогда оптимальный базис расположен симметрично ПО отношению К \ф0), \ф{) (см. рис. 5) И ° Рис. 5. Прин- Принцип максималь- максимального правдопо- правдоподобия Задача 21. Показать, что для различения п чистых состояний с линейно независимыми векторами \ф^, j = 1,..., п, достаточно стандартных наблюдаемых. В этом случае оптимальная наблюдае- наблюдаемая дается векторами некоторой ортонормированнои системы |еу), j = l,...,n(cM.[3]). Пример 3. На плоскости (рассматривае- (рассматриваемой как вещественное подпространство дву- двумерного унитарного пространства) рассмо- рассмотрим «равноугольную» конфигурацию трех векторов (см. рис. 6) Рис. 6. Векторы трех состояний j = 0,1,2. D.3)
48 Гл. 4. ОПТИМАЛЬНОЕ РАЗЛИЧЕНИЕ КВАНТОВЫХ СОСТОЯНИЙ Соответствующие операторы плотности Sj = \/ф^){/ф^\, описывают состояния двухуровневой системы, например, плоскополяризован- ного фотона или частицы со спином 1/2. Имеем cos 2 If cos Ш cos If sin sin2 ?f cos ^f D.4) Поскольку J2 e'~^ =0, то J2 si = l1, т- е- М*=25А/3 является разложением единицы. Покажем, что в случае равновероятных состояний, тг; = 1/3, {МА0} дает оптимальную наблюдаемую. Проверим условия теоремы. Поскольку 5? = Sy, то у = о у = о так что 7/3 = Л° ^ 5,-/3 (условие 2)) и Таким образом условие 1) также выполнено. Итак, max V{M} = ТгЛ° = 2/3. Найдем теперь максимум по всевозможным стандартным наблюдаемым с тремя значениями. Нетривиальное ортогональное разложение единицы с тремя ком- компонентами в двумерном пространстве имеет вид Мо = |е^)(е^,|, М1 = |е,)(е1|, М2 = 0, где Ю, |е,), — произвольный базис. Находя соответствующий максимум, получаем | = max V{M}. max V{M} = 1 M - стандартные l Таким образом, использование в квантовой статистике неорто- неортогональных разложений единицы в качестве наблюдаемых (т. е. использование квантовой рандомизации — дополнительной незави- независимой квантовой системы в фиксированном состоянии) может при- приводить к выигрышу при различении состояний исходной системы!
§ 4.3. МАКСИМУМ ИНФОРМАЦИИ 49 Подчеркнем, что в классическом случае никакая рандомизация не может улучшить качество процедуры различения состояний. С геометрической точки зрения, причина состоит в том, что в квантовом случае не все крайние точки множества наблюдаемых ЗЛ3 (среди которых и находится наиболее информативная наблюда- наблюдаемая), описываются ортогональными разложениями единицы. § 4.3. Максимум информации Пусть система находится в одном из т состояний 5,,..., Sm, и над системой производится измерение наблюдаемой М = {Мк}, к = 1,..., п, с целью получить максимальное количество информа- информации. Число исходов измерения п заранее не фиксировано. A priori нет оснований требовать совпадения пит. Множество всех наблюдаемых с конечным числом исходов обозначим 9Л. Таким образом, есть переходная вероятность рм{к \j) =Tr S5Mk, и шенноновское количество информации дается формулой M(k\l)v], D.5) J где тг;. — априорные вероятности состояний. Лемма 5. Функция J{M} выпукла на 9Л, т. е. В силу аффинной зависимости переходной вероятности от М, достаточно доказать, что J{M} является выпуклой функцией от переходной вероятности. Это вытекает из следующего общего свойства. Лемма 6. Шенноновское количество информации J{M} является выпуклой функцией от переходных вероятностей р(к | j) и вогнутой функцией от априорных вероятностей тгу. Ограничимся доказательством первого утверждения, а второе оставим в качестве упражнения. Доказательство. Рассмотрим множество переходных ве- вероятностей р(к | j) > 0, ^2р(к | j) = 1. Имеем
50 Гл. 4. ОПТИМАЛЬНОЕ РАЗЛИЧЕНИЕ КВАНТОВЫХ СОСТОЯНИЙ Достаточно доказать выпуклость по переменным х, для любого фиксированного к, следующих функций ] поскольку количество информации является суммой слагаемых вида /(*) = Е *& [ i°g ъ - !°g Еч*|]- 3 I Дифференцируя по х;, получаем Рис. 7. Максимум ЩЫ = ж.\ П +logx ) - П + log V х, 7Г,) 1 ВЫПуКЛОИ фуНКЦИИ <*Ву JL ° 3' v о ,?_/ I I / J (здесь для простоты log — натуральный логарифм) и .. tev»I 92f(x)_r *j *j*k > y E?i ft 3 у i ?i Согласно неравенству Коши — Буняковского имеем Е w = E ">v^^ < Е *,ч Е 5е'. что и доказывает выпуклость функции /, а значит, и шенноновской информации. Задача 22. Максимум непрерывной выпуклой функции на компактном выпуклом множестве достигается в крайней точке этого множества (см. рис. 7). Таким образом, надо исследовать крайние точки множества ЗЛ. Лемма 7. Если наблюдаемая М' получена укрупнением исходов наблюдаемой М, то J{M'} ^ J{M}. Доказательство. Достаточно показать, что если два исхода j\, 3~2 наблюдаемой М объединить в один, не трогая остальных (к таким операциям сводится последовательно любое укрупнение), то ii 10 [log Mil IО - log E Mi. 10 +Мл 10 [log Fm(j2 I») - log E Мл >{pmU\ IО + Мл 10}[log(ftf(ii IО + Мл I Oj - Отвечает одному исходу в М' -1огЕя-|(Мл10+МлЮ)]-
§ 4.3. МАКСИМУМ ИНФОРМАЦИИ 51 Введем множитель 1/2: !) |log L_J _ logE L_J и просуммируем по г. Теперь утверждение следует из выпуклости функции /. Теорема 71'. Пусть дан набор квантовых состояний Sx,.. .Sm с определенными вероятностями тт,,..., тгт, тогда су- существует наблюдаемая М°, для которой max J{М} = J'{М°\, и т такая, что ее компоненты — линейно независимые операторы ранга 1, т. е. М° = |^,-)(^-1у = 1 „. " число компонент п ^ d2, где d — dim H. Если все операторы Sj имеют вещественные матрицы в некотором базисе, то n ^ d(d + l)/2. Доказательство. Пусть М° — оптимальная наблюдаемая, М° = {М°,..., М°,...}. Поскольку ее компоненты — эрмитовы опе- операторы, согласно спектральной теореме каждый из них можно разложить по ортонормированному базису собственных векторов, оставляя только компоненты с положительными собственными числами: О ^ X = 2 х,|е,)(еу| = ? ^КЖ1^ = Е ШШ где \фЛ = у/хЛе^). Построим «разукрупненную» наблюдаемую М° = \|Vv)(Vvl/ -г (можем считать все ф3- различными после объединения одинаковых в одну компоненту.) Пользуясь леммой 7 об укрупнении, имеем J{M0} > J{M0}. Согласно лемме 6 и задаче 2, можно считать, что М° крайняя точка, имеющая компоненты М° = IV'jKV'jI (j' = 1> • • •> п)- Отсюда следует, что операторы |^)(^| линейно независимы. В самом деле, предположим, что 3 Для достаточно малого е > 0 имеем ') Davies Е. В. Information and quantum measurement // IEEE Trans. Inform. Theory. — 1978. — V. 24, №. 6. — P. 596-599.
52 Гл. 4. ОПТИМАЛЬНОЕ РАЗЛИЧЕНИЕ КВАНТОВЫХ СОСТОЯНИЙ плоскости Sj = Тогда М* являются наблюдаемыми и М° — ^М+ + -^М'. Следо- Следовательно М° = М^ — М}', поскольку М° экстремальна. Итак, из равенства D.6) следует, что с^ = О, т. е. компоненты наблюдаемой М° линейно независимы. Но максимальное число линейно незави- независимых эрмитовых операторов в d-мерном унитарном пространстве равно d2 (d(d + l)/2 в вещественном случае). Явное решение возможно в случаях, когда есть некоторая сим- симметрия. ПРИМЕР 1. Рассмотрим простейший случай—два вектора на J = 0, 1. Конфигурацию состояний полностью ха- рактеризует вещественный параметр е = — KVb I Ф\)\- Кроме того, имеется априорное распределение тг0, тг,. Согласно теореме, до- статочно взять п = 3 (d = 2, веществен- вещественный случай.) Специальными рассуждения- рассуждениями можно показать, что на самом деле мак- максимум достигается на ортонормированном базисе, оптимальном по максимуму правдо- подобия (т. е. минимуму средней ошибки), так что фактически п — 2 (Левитин, 1994). В этом Рис. 8. Информационный оптимум для трех равноу- равноугольных состояний Интересен симметричный случай, когда тг0 — тг, = случае max J{M} = \ - м 1 ' D.7) и максимум информации достигается на базисе, расположенном симметрично по отношению к векторам ф0, ф1 (рис. 5), оптимальном по критерию максимального правдоподобия. ПРИМЕР 2. Случай трех равновероятных «равноугольных» чис- чистых состояний D.4) с углами 2тг/3 между направлениями спи- спинов. Согласно теореме, т ^ d(d + l)/2 = 3. Используя симметрию задачи, можно доказать, что информационно-оптимальная наблю- наблюдаемая имеет вид Мк = ^\ек)(ек\к=012, где ек±фк (см. рис. 8; задача 23). Таким образом, она не совпадает с наблюдаемой, оптимальной по максимуму правдоподобия, для которой ек = фк. Более того, можно показать, что последняя является наихудшей с точки зрения информационного критерия. Максимум информации по всевозможным наблюдаемым: max J{M} « 0, 585, тогда как max J"(M)«0,428. М-стандартные
§ 4.3. МАКСИМУМ ИНФОРМАЦИИ 53 Пример 3. Пусть имеется п чистых состояний с линейно независимыми векторами. «Естественное» предположение, что су- существует информационно-оптимальная наблюдаемая с т = п исхо- исходами, оказывается неверным. Это было недавно показано в работе Шора 1), который рассмотрел конфигурацию из трех равноугольных векторов в трехмерном вещественном пространстве. Согласно те- теореме 7, число исходов информационно-оптимальной наблюдаемой ограничено величиной d(d + \)/2 = b и именно такое число исходов оказывается необходимым (хотя выигрыш по сравнению с тремя исходами настолько мал, что его трудно заметить при численной оптимизации). Однако, как показал Дэвис, если состояния получены действием неприводимого представления некоторой группы симметрии, то су- существует ковариантная информационно-оптимальная наблюдаемая с числом исходов т — п. В случае трех равноугольных векторов на плоскости имеется вращательная симметрия, которая действу- действует неприводимо над полем вещественных чисел (хотя, конечно, приводимо над полем комплексных чисел). Но в трех измерениях вращения вокруг оси приводимы даже над полем вещественных чисел, и упомянутый результат оказывается неприменим. ') Shor P. W. On the number of elements needed in a POVM attaining the accessible information // LANL Report no. quant-ph/0009077.
ГЛАВА 5 КЛАССИЧЕСКАЯ ПРОПУСКНАЯ СПОСОБНОСТЬ КВАНТОВОГО КАНАЛА СВЯЗИ § 5.1. Формулировка и обсуждение квантовой теоремы кодирования Теорема Шеннона дает основу для введения такого понятия, как пропускная способность классического канала с шумом (мак- (максимальная скорость асимптотически безошибочной передачи ин- информации через канал). Простейшая модель квантового канала предполагает, что есть классический параметр х, пробегающий (конечный) входной алфавит и отображение х —* Sx в квантовые состояния на выходе канала. Например, двоичный оптический квантовый канал может быть реализован следующим образом: если х = 0, то поле излучения находится в вакуумном состоянии; если х=1, то лазер генерирует когерентное состояние. Роль квантовой степени свободы может также играть поляризация или направление спина. Теперь рассмотрим передачу слова — последовательности букв w = {хх,..., хп}, которому сопоставляется состояние Sw: w = = 5,„ в Предположение о том, что w кодируется в тензорное произведение состояний Sx , соответствует определению канала без памяти в классическом' случае. На выходе производится измерение некоторой наблюдаемой М = {Min)} в пространстве Н®п (получив исход измерения w, считаем, что было послано и>). В итоге приемник выдает ответ
§ 5.1. ОБСУЖДЕНИЕ КВАНТОВОЙ ТЕОРЕМЫ КОДИРОВАНИЯ 55 о принятом решении; таким образом, разложение единицы в про- пространстве Н®п описывает статистику всей решающей процедуры, которая включает в себя физическое измерение и последующую классическую обработку его результатов. Выбор наблюдаемой М формально аналогичен выбору решающей процедуры в класси- классическом случае, но как мы увидим, играет здесь гораздо более важную роль. После того, как М выбрана, мы получаем клас- классический канал рм(у \ х) = Tr SxMy в однобуквенном случае, и рмМ(ги | ги) = Тг SWM№ — в п-буквенном. Определим шенноновскую взаимную информацию между входом и выходом. Если есть априорное распределение вероятностей тг на X и выбрана процедура измерения М на выходе, то шенноновская информация между входом и выходом дается формулой /,Gг, М) = J2 % Е Рм(У I z) [ bgpM(y I z) - bgE РмЬ I * X у *• Z а максимальное количество информации, допустимое законами квантовой механики, равно max I, (тг, М) = С,. Аналогично, если для n-й степени канала задано априорное распре- распределение тг(п> на словах длины п и измерение М(п) в гильбертовом пространстве Н®п, то соответствующие информационные количест- количества равны max 7вGг<"»,АГ<п>) = Сп. Имеет место удивительный факт: если для классического канала без памяти всегда Сп = пСх, то в квантовом случае уже для d = 2 (двоичный канал) возможно строгое неравенство Сп > пС1 (строгая суперадцитивность классической информации в квантовом канале). Причина этого в том, что для n-й степени квантового канала существуют коллективные (сцепленные) наблюдаемые, которые ни в каком смысле не сводятся к разделимым наблюдаемым, даже с последующей классической обработкой результатов их измерений. Можно сказать, что это есть двойственное проявление корре- корреляций Эйнштейна — Подольского — Розена. Последние возникают,
56 Гл. 5. ПРОПУСКНАЯ СПОСОБНОСТЬ КВАНТОВОГО КАНАЛА СВЯЗИ когда рассматривается сцепленное (т. е. неразделимое) состояние составной квантовой системы, а измерения разделимы. Строгая супераддитивность информации имеет место для разделимых состо- состояний и обусловлена существованием коллективных (сцепленных) измерений. Перейдем к формулировке теоремы кодирования, из которой, в частности, будет следовать свойство супераддитивности. Определение. Кодом размера N называется набор слов w{1\ ..., wiN) вместе с разложением единицы М — {AfJ в Н®п с исходами j = 0,1,..., N; исход 0 означает уклонение от принятия решения. Средняя ошибка кода равна вероятность правильного решения Обозначим minPe(W, М) = ре(п, N) минимальную среднюю ошиб- ку по всем кодам размера N, использующим слова длины п. Чтобы сформулировать теорему кодирования и понятие классической про- пропускной способности для квантового канала С, введем следующие величины: для оператора плотности 5 = ]С3у1е,-)(еу| рассмотрим энтропию фон Неймана H(S) = - !>, log s. = - Tr 5 log 5 i В главе 8 мы подробно рассмотрим квантовые энтропийные коли- количества, а пока нам понадобятся элементарные свойства квантовой энтропии: 1) 0 ^ H(S) ^ logd, причем минимум достигается на чистых состояниях_(и только на них), а максимум — на хаотическом состоянии 5 = I/d. 2) H(USU*) = H(S), где U унитарный оператор (сохранение энтропии при обратимых преобразованиях). 3) H(S{ ® S2) = H{St) + H(S2) (аддитивность). Введем обозначение:
§ 5.1. ОБСУЖДЕНИЕ КВАНТОВОЙ ТЕОРЕМЫ КОДИРОВАНИЯ 57 ТЕОРЕМА 8 (квантовая теорема кодирования). При п —* сю имеем: 1) ре(п, 2"*) -+ 0, если R < С; 2) Ре(п, 2я*) -л 0, если Л > С Эта теорема оправдывает название классическая пропускная способность для величины С. В самом деле, определим С^ как lim С„/п, где С„ = тах/п(тг, М). Из классической теоремы п кодирования (теорема 2) вытекает, что утверждение теоремы 8 выполняется с заменой С на Сж. Таким образом, утверждение теоремы 8 состоит в том, что С^ = С. Задача 24. Рассмотрим двоичный квантовый канал с чистыми состояниями ф0, ф\. Докажите, что С = , а максимум информации по измерениям и априорным распределе- распределениям за один шаг max/,(тг, М) — С, ж, М ' ' дается формулой D.7). Поскольку С, < С при 0< е < 1, отсюда следует свойство супераддитивности пСх < Сп для достаточно больших п. Если состояния 8х = \-фх){фх\ чистые, то Из свойства 1 энтропии следует, что всегда С ^logd. Таким образом, несмотря на то, что в унитарном пространстве имеется бесконечно много разных чистых состояний, это обстоятельст- обстоятельство не может быть использовано для передачи неограниченного количества информации. Грубо говоря, чем гуще расположены векторы, тем труднее становится их различить. Верхняя граница и максимум информации достигаются, если выходные состояния являются ортогональными |eI)(ex|, х = \,..., d, u nx = -j. Заметим, что такие выходные состояния, как правило, не могут быть по- получены на выходе реального канала связи. Замечательно, однако, что, как показывает следующий пример, ортогональность выходных состояний не является необходимой для достижения пропускной способности идеального канала.
58 Гл. 5. ПРОПУСКНАЯ СПОСОБНОСТЬ КВАНТОВОГО КАНАЛА СВЯЗИ Рассмотрим конфигурацию D.3) из трех равновероятных «равно- «равноугольных» векторов ф0, г/}и ф2. Тогда и, как следует из теоремы кодирования, пропускная способность такого канала имеет то же максимальное значение С = 1 бит, что и для ортогональных состояний. Заметим, что это достигается только благодаря использованию оптимального кода, включающего коллективное измерение. Задача 25. Величина С, « 0, 645 достигается для неравно- неравномерного распределения жо = ж1 = 1/2, тг2 = 0 и соответствующего оптимального измерения для двух равновероятных состояний (см. пример 1 в § 4.3). Это еще раз иллюстрирует феномен супераддитивности класси- классической информации в квантовом канале связи. § 5.2. Квантовая энтропийная граница и доказательство обратной теоремы ТЕОРЕМА 9 (квантовая энтропийная граница). , . E.1) причем имеет место строгое неравенство, если операторы nxSx не коммутируют. Первое, прямое доказательство этого неравенства (А. С. Холево, 1973), опирающееся на исследование свойств выпуклости кван- квантовой энтропии, достаточно сложно, однако его можно довольно просто получить из полученного позднее свойства монотонности относительной энтропии (доказательство которого, однако, по край- крайней мере, столь же сложно), см. далее § 7.2 и Приложение. Докажем слабое обращение теоремы кодирования, используя классическое неравенство Фано и квантовую энтропийную грани- границу. Возьмем N — 2nR, R > С, и рассмотрим произвольный набор кодовых слов гуA),..., w^ на входе, а на выходе — произволь- произвольное разложение единицы М = {Мя j = 0, 1,..., N}. Рассмотрим классическую случайную величину X со значениями \,...,N (номер посланного слова), которые имеют равные вероятности
§ 5.2. КВАНТОВАЯ ЭНТРОПИЙНАЯ ГРАНИЦА 59 1/N. На выходе после измерения получим классическую случайную величину Y со значениями О, I,..., N. Взаимная информация равна I(X;Y) = H(X)-H(X\Y), где Н(Х) = logN = nR —энтропия равномерного распределения. Условная энтропия оценивается с помощью неравенства Фано: Н(Х | Y) ^ 1 +Р(Х Ф Y) logN. Таким образом, тахЦХ, Y) ^ nR(\ — ре(п, 2пД)) - 1 (это повторение до- доказательства слабого обращения классической теоремы Шеннона). Из квантовой энтропийной границы E.1) вытекает неравенство Лемма 8. Последовательность Сп аддитивна: Сп — пСх = еепС. Доказательство. Достаточно рассмотреть случай п — 2, когда Н = НХ ®Н2, i -* 5/, j —> Sf. Надо доказать, что тах ах[я(Е 7Г..5' ® Sf) - ? тг,;.ЯE' ® 5/)] = ) Очевидно, что max ^ max , тогда в силу свойства аддитивности квантовой энтропии откуда С„ Обратное неравенство вытекает из свойства субаддитивности квантовой энтропии (см. § 7.2), из которого вытекает где тг/ = ? тг{у, тг? = ? тг;у — маргинальные распределения. 3 3 Окончательно, пС ^ пД[1 - ре(п, 2"я)] — 1, и если R > С, то не может быть ре(п, 2"я) —> 0 при п-юо.
60 Гл. 5. ПРОПУСКНАЯ СПОСОБНОСТЬ КВАНТОВОГО КАНАЛА СВЯЗИ § 5.3. Доказательство прямой теоремы для канала с чистыми состояниями Доказательство прямого утверждения теоремы кодирования да- дадим в простейшем случае чистых состояний Sx = \i/}x}{ipx\. В этом случае классическая пропускная способность квантового канала х —> Sx дается выражением Доказательство. Пусть R < С. Докажем, что ре(п, 2nR) —> 0. Рассмотрим среднюю вероятность ошибки кода w ? 0 - (Ф^ IЩФ*»)) =paw, м), которая зависит от выбора слов W и наблюдаемой М. Для ее ми- минимизации желательно выбрать Mj как можно ближе к \фтт)('ф1Ои)\- С этой целью введем переполненную систему N л где G= J2 \Ф*и>){фши>\ — оператор Грама, G-1/2|^o>) = \Ф*м>)- Оператор G имеет областью значений подпространство supp G = = С, порожденное кодовыми векторами \фти>)', G~l — это обоб- обобщенный обратный, равный 0 на ортогональном дополнении к С. Обозначим Р проектор на подпространство С, тогда J^ M^ — P ^.1. i Если V№w — линейно зависимы, то получится действительно «пе- «переполненная» система V\»<>>, если же независимы — то ортонор- мированная система. Оператор Грама всегда можно обратить на подпространстве С. Подставляя такую наблюдаемую М, получим: Используя неравенство 1 — а2 = A — а)A + а) ^ 2A — а), получим Pe(W; MК ? ? A - <?»|GI/2|f««» = 3 = 1 = ?{N - Tr G'/2) = ? Tr(G - G1'2).
§ 5.3. ПРЯМАЯ ТЕОРЕМА ДЛЯ КАНАЛА С ЧИСТЫМИ СОСТОЯНИЯМИ 61 Получим теперь удобную оценку для Gl/2. Имеем Отсюда следует, что 2(G-G1/2)< G2 — G. Теперь применим метод случайных кодов. Надо доказать существование кода, для которого вероятность ошибки стремится к нулю. Идея, предложенная Шен- Шенноном, состоит в том, чтобы рассмотреть случайное распределение на всевозможных словах, тогда минимальная ошибка оценивается сверху средним по ансамблю случайных слов. Пусть слова и/1',..., w^N) — независимы, и каждое из них имеет распределение (буквы берутся также независимо с одинаковым распределением на алфавите тг. ) Усреднение по такому случайному ансамблю слов будет обозначаться через (( )). Отметим, что Тогда Тг(Е |1Ы<1Ы Е IV>>XV»I - Е 3 * 3 = (N-i)Tv( где 5. = 1Iг,|^,>Ш- Итак (Pe(W, M))) ^ (N - l)TrH^(s;nJ = (N- l)[TrKE,2)]". Так как N — 1 ^ 2пВ, и абсолютный минимум не превосходит среднего по ансамблю, то — n(max(— 1оеТг5 J — R) 2 ) .E.2) Итак, ре(п, 2"") -* 0 при R < С = тах(- logTr 5^).
62 Гл. 5. ПРОПУСКНАЯ СПОСОБНОСТЬ КВАНТОВОГО КАНАЛА СВЯЗИ В ряде случаев величину можно вычислить. Так, для двоичного канала связи при 0< е < 1 (см. рис. 9). Если С > R > С,, то ошибка стремится к 0. Эта оценка доказывает, что С^ ^ С > Сх, так что в этом примере имеет место строгая супераддитивность: Сп > пСх. bits 1 0,8 0,6 0,4 0,2 0 0,2 0,4 0,6 0,8 Рис. 9. Информационные характеристики двоичного канала как функции ? = 1(^1^) Однако эта часть доказательства, известная с 1979 г., не по- позволяет еще доказать, что С^ ^ С, а в этом и состоит прямое утверждение теоремы кодирования. Только в 1996 г. прямая те- теорема кодирования была доказана для квантового канала в случае чистых состояний!). Улучшить оценку E.2) удалось, используя метод проекции на типичное подпространство оператора 5Т" (см. следующий параграф). На случай произвольных состояний доказательство обобщили Холево в 1996 г., а также Шумахер !) Hausladen P., Jozsa R., Schumacher В Westmoreland M., Wootters UP. Classical information capacity of a quantum channel // Phys. Rev. A. — 1996. — V. 54, № 3. — P. 1869-1876.
§ 5.3. ПРЯМАЯ ТЕОРЕМА ДЛЯ КАНАЛА С ЧИСТЫМИ СОСТОЯНИЯМИ 63 и Вестморленд в 1997 г. (подробно об истории доказательства теоремы кодирования см. в [6]). Здесь мы приведем другое доказа- доказательство, не использующее проекции на типичное подпространство и позволяющее получить значительно более точную оценку. Оно является обобщением на квантовый случай известного метода Галлагера [1], основанного на некотором точном неравенстве для вероятности ошибки. Имеем Рассмотрим спектральное разложение 5^" = ^ ^j\ej){ej\i тогда <e,|«G - G^))\ej) < A, minB, (N - 1)А Д Используем неравенство min(a, b)^cfbl~',Q^s^\. Тогда получим откуда Pe(W,M))) s Окончательно, —n[max(— logTrti?^) Osjs< 1 Заметим теперь (см. рис. 10), что d_ ds r = 0 Возьмем 7г, которое максимизирует H{S1S), Рис. 10. График функ- ЦИи -logTr5^'+' и й т. е. H{S1,) = С. Тогда при R < С и достаточно прямой с угловым ко- малых s коэффициент при п в показателе экс- эФФичиентом < поненты будет положительным, откуда следует, что ре(п, 2"л)—»0 при п-+оо с экспоненциальной скоростью. Более подробное рас- рассмотрение этого показателя позволяет количественно оценить эту скорость, т. е. функцию надежности квантового канала [6].
64 Гл. 5. ПРОПУСКНАЯ СПОСОБНОСТЬ КВАНТОВОГО КАНАЛА СВЯЗИ Одной из интересных открытых проблем является обобщение этого доказательства на случай каналов со смешанными состоя- состояниями. Существующее доказательство квантовой теоремы кодиро- кодирования, которое опирается на метод типичного подпространства, лишь устанавливает, что ре{п, 2пД)—+0 при R < С, но не позволяет оценить функцию надежности. § 5.4. Сжатие квантовой информации Выше уже было отмечено, что квантовая информация — это новый вид информации, который можно передавать, но нельзя размножать. Пусть имеется источник, производящий чистые со- состояния |V»i),..., \4>а) с вероятностями ри ..., ра (аналог классиче- классического алфавита). Могут посылаться длинные последовательности букв (слова), т. е. каждое слово задается последовательностью w = (x1,...,xn), xye{l,...,a}. Источник посылает сигнал \фш) = \фх )<8>.. •<8>|V'I) с вероятностью Pw — Px.'---'Px • Кодирование — это сопоставление чистому состоя- состоянию IV'wKV'J оператора плотности Sw в гильбертовом пространстве Hd аН®п. Проблема состоит в том, чтобы кодирующие состояния не слишком сильно отличались от исходных, и в то же время нахо- находились в подпространстве по возможности минимальной размерно- размерности. Точность воспроизведения исходных состояний кодирующими измеряется величиной чем ближе она к единице, тем точнее воспроизведение. ТЕОРЕМА 101'. Пусть ~Sp = ? Р*ЮШ- Тогда 1) для любых е, 6 > 0 и для достаточно больших п сущест- существует подпространство Hd С Н%п размерности d ^ 2п(ЯE') + *) и такие кодирующие состояния Sw в Hd, что Fn > 1 — е; 2) для любого подпространства Hd с d ^ 2n(J/(S») ~S) и любого выбора Sw в Hd имеет место Fn< e для достаточно больших п. ') lozsa R., Schumacher В. A new proof of the quantum noiseless coding theo- theorem // J. Modern Optics. — 1994. — V. 41, № 12. —P. 2343-2349.
§ 5.4. СЖАТИЕ КВАНТОВОЙ ИНФОРМАЦИИ 65 ЗАМЕЧАНИЕ. Это утверждение раскрывает информационный смысл квантовой энтропии, подобно тому как идея сжатия дан- данных раскрывала смысл классической энтропии. Для смеси чис- а тых квантовых состояний Е Рх\Фх)(Фх\ = Sp энтропия оператора х-\ плотности Sp является мерой квантовой информации, содержа- содержащейся в ансамбле, поскольку 2пЯ<5') есть критическое значение размерности гильбертова пространства. (Напомним классический результат: пусть имеется источник, посылающий символы 1, ..., а с вероятностями Pi,...,pa, тогда количество слов, асимптотиче- асимптотически безошибочно пересылаемых источником, есть JV ~ 2"Я(р), где Доказательство. 1) В однобуквенном пространстве Н рассмотрим спектральное разложение оператора Пусть J = О,,..., jn), Х} = А,. ... \L, \еа) = \ejx) ® ... ® |е^), тогда спектральное разложение тензорной степени оператора Sр имеет вид ^Г = ?А,Ю<е7|. j Выделим в множестве всевозможных значений J подмножество и обозначим Е проектор на собственное подпространство, состоя- состоящее из векторов \ej), XjG J^s. Подпространство ЕН®п называется типичным подпространством. Оценим его размерность: dim ЕПШ = Tr E ^ Tr i ^ Возьмем подпространство Hd = ЕИ®п, а кодирование зададим правилом _ Е\фш){фт\Е w~ (Фт\Е\Фт) • Тогда точность воспроизведения равна
66 Гл. 5. ПРОПУСКНАЯ СПОСОБНОСТЬ КВАНТОВОГО КАНАЛА СВЯЗИ Пусть Xj — {Xj ... Х^ } — классическое распределение вероятно- вероятностей. Тогда сумма в правой части равна вероятности = P{\-±±log\it-H(S,)\<6}, а где Е{—logA()} = — J2 Хх logAx = H(Sp). Согласно закону боль- is 1 ших чисел Fn —> 1 при п —» оо. 2) Пусть Sm произвольные операторы плотности в произвольном подпространстве Hd размерности d, и пусть Pd проектор на Hd. Тогда Sw ^ Pd и Выберем теперь Е как проектор на типичное подпространство, отвечающее е/2, 6/2. Тогда правая часть оценивается как для достаточно больших п. Задача 26. Дайте другое доказательство прямой теоремы коди- кодирования для канала с чистыми состояниями, используя проекцию на типичное подпространство. Указание. Используйте «сжатые» векторы и соответствующую переполненную систему как субоптимальную наблюдаемую для получения е— 5-оценки для вероятности ошибки. До сих пор не решена проблема обобщения квантового сжатия данных на источники, производящие произвольные (смешанные) состояния Su...,Sa. Имеется предположение, что в этом случае n(H(E*A)-E*.H<s,>) критическая размерность равна 2
ГЛАВА 6 КВАНТОВЫЕ КАНАЛЫ § 6.1. Эволюции квантовой системы В этом параграфе понятие квантового канала будет рассмотрено с общей точки зрения. Это позволит исследовать более точные и изощренные модели, для которых возникают и более интересные вопросы. Каковы минимальные требования к теоретическому описанию квантового канала связи? Всякий канал должен преобразовывать квантовые состояния из <S(H,) в квантовые состояния (вообще говоря, в другом пространстве S(H2) ). Необходимое требование для согласованности со статистической интерпретацией квантовой механики состоит в том, чтобы смеси входных состояний перехо- переходили в такие же смеси выходных состояний, т. е. канал должен задаваться аффинным отображением Лемма 9. Аффинное отображение Ф: <S(H,)^5(H2) одно- однозначно продолжается до отображения В(Н{)—»В(И2), облада- обладающего следующими свойствами: 1) Ф(?с,.2}) =5>,-ФB;) (линейность); 2) Т ^ 0 =>¦ Ф (Т) ^ 0 (положительность); 3) ТгФ(Т) = Tr Т (сохранение следа). Эти свойства следуют из того, что выпуклое множество S(H) порождает В(Н), отсюда с помощью аффинности доказывается линейность, а тот факт, что состояния переходят в состояния, влечет свойства 2 и 3 (см. доказательство теоремы 4 в § 2.3.). Описание квантовой эволюции в терминах состояний соответ- соответствует картине Шредингера, двойственная ей картина Гейзенберга дает описание в терминах наблюдаемых. Рассмотрим сопряженное
68 Гл. 6. КВАНТОВЫЕ КАНАЛЫ отображение Ф* из В(Н2) в ^(^i)i определяемое с помощью формы двойственности Tr ТХ: ТтФ[Т)Х=ТгТФ*[Х], тогда отображение Ф* имеет свойства: 1) линейность; 2) положительность; 3) сохранение единицы: Ф*[/] = /. Здесь имеется прямая аналогия с марковскими (переходными) отображениями в теории вероятностей. В рассматриваемых далее примерах Hl—Ti.2 = "H. ПРИМЕР 1 (обратимая эволюция). Рассмотрим отображение Ф[5] = USU*, где U — унитарный оператор в Н. Имеем 7гФ[Т]Х = Tr (UTU*)X =Tr T(U*XU), так что Ф*[Х] = и*ХИ Теорема 11 (Вигнер). Если Ф— аффинное взаимно одно- однозначное отображение S(H) на S(H), то Ф[5] = USU*, где U — унитарный или антиунитарный оператор. Для антиунитарного оператора U выполняется \\Цф\\ = \\ф\\, но Ui^c^j) =^T1^jUijjj. Примером антиунитарного оператора является комплексное сопряжение в каком-либо фиксированном базисе. В физике такие операторы связаны с обращением времени. Линейное продолжение на В(Н) в этом случае дается формулой ПРИМЕР 2 (релаксация к состоянию 5fin). Рассмотрим отоб- отображение, переводящее любое состояние в фиксированное ко- конечное S —* Siin. Продолжая по линейности на В(Н), получаем Ф[Т] = 5fin Tr Т. Сопряженное отображение действует на наблюда- наблюдаемые по формуле Ф*[Х] = (Tr SriaX)I. ПРИМЕР 3 (условное ожидание, связанное с идеальным изме- измерением). Пусть {Е{} — ортогональное разложение единицы в Н, т. е. EiEj = SyEj, J2 Е3 = /. Рассмотрим отображение i Е^Жу- F.1)
§ 6.1. ЭВОЛЮЦИИ КВАНТОВОЙ СИСТЕМЫ 69 Это аффинное отображение, переводящее состояния в состояния. Оно возникает в связи с проекционным постулатом Людерса — фон Неймана: идеальное измерение описыва- описывается ортогональным разложением единицы {Е}}, так что после из- измерения получается один из исходов j, с вероятностью р}- =Tr SE}-, а состояние той доли статистического ансамбля, в которой получен этот исход (апостериорное состояние), описывается оператором В частности, полное идеальное измерение соответствует случаю Еъ = |е,-)(е,-|, где {е,} — ортонормированный базис в Н. Тогда т. е. после измерения система оказывается в состоянии |е,.)(е,-| с ве- вероятностью (е;|5|ей). При чистом начальном состоянии S = \ip){xjj\ эта вероятность равна |(е, | ф)\2- Если смешать подансамбли, полученные после измерения, то получится новое состояние ансамбля которое, вообще говоря, отличается от исходного состояния S. Таким образом, в квантовой механике, в отличие от классической, идеальное измерение не сводится к простому считыванию значения наблюдаемой величины, а всегда предполагает воздействие на наблюдаемую систему, изменяющее ее состояние. Отображение Ф*[Х] = ^2 EjXE^ обладает свойствами: = Ф*[Х], Ф*[ХФ*[У]] - Ф'[Х]Ф*[У], характеризующими условное ожидание в теории вероятностей. Идеальное измерение обладает свойством воспроизводимости: повторив измерение сразу после получения исхода j, мы должны с достоверностью получить исход j. Ряд парадоксов и тупиков в стандартной формулировке квантовой механики связан с тем, что в качестве математической модели измерений рассматриваются только описанные выше идеальные процедуры, удовлетворяющие условию воспроизводимости. Эти трудности в значительной мере снимаются в обобщенной формулировке (см. ниже), позволяющей
70 Гл. 6. КВАНТОВЫЕ КАНАЛЫ охватить «приближенные» измерения, воздействие которых на систему может быть произвольно слабым. ПРИМЕР 4 (эволюция открытой квантовой системы, взаимодей- взаимодействующей с окружением). Пусть Н — гильбертово пространст- пространство системы, Но — пространство окружения. Эволюция составной системы является об- обратимой и описывается унитарным операто- оператором U. В начальный момент система и окружение Рис. 11. Открытая находятся в состоянии S <g> So, затем вза- квантовая система имодействие «подкручивает» состояние (см. рис. 11). Усредняя по окружению, получаем необратимую эволю- эволюцию самой системы ТгНо 17E ® S0)U*, F.2) или Ф*[Х] = ТЧ(/ ® S0)U*(X ® I0)U Рассмотрим процесс косвенного измерения, когда система вза- взаимодействует с пробной системой Но, а затем над пробной си- системой производится идеальное измерение наблюдаемой {-Б°}. Тогда согласно примеру 3, вероятность получить исход j равна Pj — Tr U(S(8> S0)U*(I ® Ej), а состояние той доли статистического ансамбля, в которой получен этот исход, описывается оператором плотности 5j, таким что Таким образом, формула F.2) может быть записана как Пусть для простоты состояние So — \фо){'Фо\ чистое, а из- измерение полное, т. е. Ei — |е°)(е?|, где ej — ортонормирован- ный базис в TCq. Вводя операторы V., определяемые формулой (<р | Vj.-ф) = {tp<8> е9 | Щ ® ф0), ip, ф е Н, получаем p. = TTVjSV;, 5, = ^, F.3) так что
§ 6.2. ВПОЛНЕ ПОЛОЖИТЕЛЬНЫЕ ОТОБРАЖЕНИЯ 71 Эта формула обобщает соотношение F.1) для идеального измере- измерения, и описывает статистику (вероятности исходов и апостериор- апостериорные состояния) более общего процесса, включающего измерения, не удовлетворяющие требованию воспроизводимости (в частности, приближенные измерения). Подробное обсуждение понятия кван- квантового измерения с этих позиций см. в [10, 5, 11]. § 6.2. Вполне положительные отображения Оказывается, что во всех четырех примерах отображение Ф обла- обладает очень важным свойством, помимо линейности, положительно- положительности и сохранения следа. (В картине Гейзенберга отображение Ф* линейно, положительно и сохраняет /.) ОПРЕДЕЛЕНИЕ. Отображение Ф* называется вполне положи- положительным, если выполняется условие: 1) для любого т = 1, 2,..., отображение Ф* <Е> Idm, где Idm — тождественное отображение в S(H0), dim Ho = т, положительно. Дадим другую формулировку, используя изоморфизм где X{j — операторы в Н. Тогда условие 1) можно переформулировать в виде: 1') если матрица [Хг]] ^ 0, то [Ф*[^у]] ^ 0. Задача 27. Доказать, что условие 1) равносильно условию: 2) для любых конечных наборов {^} С Hv {Х}.} с BGi2) выпол- выполнено неравенство: Преимущество условия 2) в простой проверяемости. Скажем, в примере 4 для проверки надо рассмотреть E<v,lTr W ® so)u*(x;xk ® 10)и\фк). Достаточно доказать положительность для чистого So = \-ф0){фо\ и применить спектральное разложение в общем случае. Для
72 Гл. 6. КВАНТОВЫЕ КАНАЛЫ = \A)(A\ имеем л* ПРИМЕР. Не все положительные отображения вполне положи- положительны. Фиксируем базис в Н, тогда всякий оператор X задает- задается матрицей [Х{]]. Рассмотрим преобразование транспонирования Ф[Х] = Хт, которое совпадает с комплексным сопряжением на эрмитовых матрицах. Задача 28. Доказать, что условие 1 нарушается уже при тп = 2. Физический смысл нарушения условия 1: в одной системе происходит обращение времени, в другой — нет, таким образом получаем нефизическое преобразование составной системы. Свойство полной положительности было введено Стайнспрингом, который доказал теорему, обобщающую теорему Наймарка. Мы рассмотрим теорему Стаинспринга в важном частном случае. Теорема 12. Пусть Ф*—вполне положительное отобра- отображение из В(Н2) в В(Н{), сохраняющее единицу. Существует представление Ф*[Х] = Уtt[X]V, где V —изометрическое отображение из Нх в Н, а тг является * -представлением алгебры{) В(Н2) в Н. В нашем случае Ф*: В(Н2) -* В{НХ). Если же отображение Ф* действует из алгебры В2 в алгебру Ви причем хотя бы одна из алгебр Sj или В2 коммутативна, то свойство полной положительно- положительности следует из положительности. Таким образом, свойство полной положительности существенно некоммутативно (задача 29). Доказательство. В качестве заготовки для ТС рассмотрим алгебраическое тензорное произведение линейных пространств ? — = Н\®В(Н2). Оно порождается элементами вида Ъ = ф®Х, ф еИ,, X б В(Н2). Скалярное произведение вводится согласно формуле для квадрата нормы: ') «-Представлением называется линейное отображение, сохраняющее алгебраи- алгебраические операции и инволюцию: 7г[ХУ] = 7г[Х]тг[К], ?г[Х*] = 7г[Л^*.
§ 6.2. ВПОЛНЕ ПОЛОЖИТЕЛЬНЫЕ ОТОБРАЖЕНИЯ 73 которая неотрицательна. После факторизации по подпространству ?0 нулевой нормы, получим Н — С/Со. Введем Уф =^®7 и тг[Г]Ф = тг[У](ф <g> X) = ф <g> YX. Задача 30. Проверить, что требуемое представление имеет мес- место для данной конструкции. Изометричность V следует из сохранения единицы. Обратно, условие 2 выполнено, если есть такое представление, так как Уп[Х;]-*[хкш z о. Такого типа рассуждения, когда по некоторому объекту, обладаю- обладающему каким-либо свойством положительности, строится гильберто- гильбертово пространство и конкретное представление в этом пространстве, называется конструкцией Гельфанда — Наймарка — Сигала (ГНС). Аналогичная теорема верна для отображений более общих *-алгебр. В нашем случае можно получить более конкретное представление. СЛЕДСТВИЕ 1 (представление Крауса). Отображение Ф*: В(Н2) —>В(Н{) является вполне положительным и сохраняющим единицу тогда и только тогда, когда ;щ F.4) или ^/ F-5) у где V3- операторы из BGi,) в В(Н2), такие что J2 V/V}- = I. 3 Это представление удобно тем, что не использует вспомогатель- вспомогательного пространства Но. Доказательство. Любое ^представление алгебры В(Н.) унитарно эквивалентно кратному тождественного представления 7г[Х] = X <g> 10, где /0 — единица в Но, т. е. можно считать, что Н = Н2®Н0 [10, разд. 9.2]. Записывая /0 = Е1еуХеЛ' где ei~°P" тонормированный базис в Но, введем операторы Vp определяемые формулой {(р | Vj-ф) = (<р <8> е° | Уф), ip б Н2, ф Е Нг Представле- Представление F.4) следует из теоремы Стайнспринга. Обращаем внимание на аналогию с рассуждениями в примере 4. На самом деле, как показывает следующий результат, этот пример является порождающим.
74 Гл. 6. КВАНТОВЫЕ КАНАЛЫ Следствие 2. Всякое вполне положительное отображение Ф* алгебры В(Н), сохраняющее единицу, можно продолжить до обратимой эволюции составной системы в Н®Н0, где вторая система (окружение) находится в чистом состоянии \Фо)(Фо\- Доказательство. Исходя из представления Стайнспринга, рассмотрим действие изометрического оператора V на ф 6 Н. Имеем У\ф) eH^Hq. Зафиксируем в Н ортонормированный базис {е^}. Тогда У\ф) = ^ Н/^)(^ | ф), где ф^ = Ve^ Поскольку V i изометрично, имеем {ф^ \ фк) = 6^, но система ф^ может быть неполна. Дополним ее до ортонормированного базиса; пусть ф^ — такой ортонормированный базис в W®H0,, что ф^ — фу Тогда оператор U = Y1 \Ф^){^\ ® (е(°| унитарный, так как он переводит ортонормированный базис в ортонормированный базис. Полагаем IV'o) = Ю' т0ГДа получаем Ф'[Х] = V*(X ® I0)V = ТгИо(/ ® |^о)(^о!)^*(^ ® 10)Ц т. е. приходим к ситуации примера 4. В самом деле, (Уф\(Х ® 10)\Уф) = (ф\ ® (фо\и*(Х® так как § 6.3. Определение канала Предыдущее обсуждение показывает, что в определение канала следует включить свойство полной положительности. Определение. Каналом (в пространстве состояний) назы- называется линейное отображение Ф из B(HX) в В(Н2), сохраняющее след и такое, что Ф* — вполне положительное отображение. Кана- Каналом в пространстве наблюдаемых называется линейное вполне положительное отображение из В(Н2) в B(T-LX), переводящее еди- единицу в единицу. Рассмотрим два примера, позволяющие установить связь этого определения с теми каналами, которые рассматривались при опре- определении классической пропускной способности.
§ 6.3. ОПРЕДЕЛЕНИЕ КАНАЛА 75 Определение. Канал Ф называется классически-кванто- классически-квантовым (c-q), если где Sj —состояния в В(Н2), ej — ортонормированный базис в Н1. Если S — состояние на входе, то (еу|5|еу) = pj — распределение вероятностей на наборе состояний 5; и Ф[5]=52 PjSj- Если Pj = Sk], 3 то получим на выходе состояние St) а в общем случае — смесь. Такой канал переводит классическое состояние {р{} в квантовое состояние (можно рассматривать это также как отображение диаго- диагональных матриц в произвольные матрицы плотности. Фактически, именно такие каналы рассматривались в гл. 5, где для них была доказана теорема кодирования. Определение. Канал Ф называется квантово-классиче- ским (q-c), если где {е^} — ортонормированный базис в В(Н2), а {М,} — наблю- наблюдаемая в В(НХ). При произвольном входном квантовом состоянии получаем классический выход (диагональную матрицу плотности). Простейший нетривиальный пример канала, не являющегося c-q или q-c, дает деполяризующий канал (Н, —Н2=Н, dim 7^ = d): Ф[5] = A-;рM + .р^Тг5. F.6) При 0 ^ р ^ 1 он представляет собой смесь идеального и полностью деполяризующего каналов. Последний просто отображает любое состояние в хаотическое S — I/d. Задача 31. Покажите, что деполяризующий канал может быть охарактеризован свойством унитарной ковариантности: Ф[С/"<5С/"*] = = 11Ф[5]и* для произвольного унитарного оператора U в ~Н. Канал Ф называется бистохастическим, если он переводит хаотическое состояние в хаотическое, т. е. единицу в единицу. Таким образом, как Ф, так и Ф* являются каналами в обеих картинах. Деполяризующий канал является бистохастическим. Задача 32. Доказать полную положительность и найти пред- представление Крауса для c-q, q-c и деполяризующего каналов. Сформулируем теперь важную нерешенную проблему. Она на- называется проблемой аддитивности. Пусть задан канал
76 Гл. 6. КВАНТОВЫЕ КАНАЛЫ Ф: В(Н) —* В(Н). Процесс передачи классической информации по такому квантовому каналу описывается диаграммой ф м i —> S —» S' —» j. Для передачи классической информации используется блочное кодирование, т. е. рассматривается составной канал Ф®п = Ф<8>- • <8>Ф в пространстве Н®п, на выходе которого производится измерение М(п). Пусть w слово (последовательность символов), тогда переда- передача классической информации через составной канал описывается новой диаграммой При этом переходная вероятность равна Если задано распределение на входных словах, то можно найти совместное распределение входа и выхода и взаимную информа- информацию /(n)Gri"\ Sln\ M(n)), причем оптимизации подлежит не только наблюдаемая М(п) и распределение тг^"', но и сами состояния S^ на входе канала Ф. Согласно теореме кодирования для c-q каналов, классическая пропускная способность канала Ф равна С = lim - max /(п)(тг<п), 5<">, М<">) = = lim I max [Н(? тгш Вопрос заключается в следующем: верно ли, что С = max [Я(Е *ДО,]) - Е т*Я(Ф[54])] . F.7) Или, более общим образом, верно ли, что величина С" — С"(Ф), определенная правой частью формулы F.7), является аддитивной, т. е. выполняется ли равенство
§ 6.4. КАНАЛЫ В Щ 77 Очевидно, что С" супераддитивна. Если бы нашелся пример, в котором С" строго супераддитивна, то это означало бы, что не только коллективные измерения на выходе, но и использование сцепленных состояний на входе позволяет увеличить количество классической информации при передаче по квантовым каналам. Несмотря на интенсивный численный поиск, такого примера пока найти не удалось. В то же время, не удается найти и сколь-нибудь общее аналитическое доказательство аддитивности. Обзор частич- частичных результатов см. в работе Амосова, Холево и Вернера1'. Для некоторого класса бистохастических каналов в Н2, включающего деполяризующий канал, доказательство дано в работе Кинга2). Задача 33. Покажите, что для деполяризующего канала F.6) величина С =\ogd + {\-р^г) log (l - р^) +^logf, F.8) достигается для ансамбля равновероятных чистых состояний, отве- отвечающих ортонормированному базису в Н. § 6.4. Каналы в Н2 Рассмотрим каналы в пространстве q-бита Н2, т. е. аффинные отображения единичного шара в пространстве К3 в себя, которые удовлетворяют некоторым дополнительным ограничениям, вытека- вытекающим из условия полной положительности. Используя полярное разложение, можно доказать3', что всякий канал в Н2 допускает представление где Uu U2 унитарные операторы, а Л имеет канонический вид Л[/] = /+ Е *7*7, ЛК]=А7<Т7' 7=3,tt*, F.10) 1 = *, У, * где А7, <7 вещественные числа. ') Amosov G. G., HolevoA. S., Werner R. F. On some additivity problems in quantum information theory // Probl. Inform. Transm. — 2000. —- V. 36, № 4. LANL report math-ph/0003002. 2* King С Aditivity for a class of unital qubit channels // LANL e-print quant- ph/0103156. 3* Cm. Ruskai M. В., Szarek S., Werner E. A characterization of completely-positive trace-preserving maps on M2 // quant-ph/0005004.
78 Гл. 6. КВАНТОВЫЕ КАНАЛЫ Задача 34. Докажите возможность представления F.9). По- Покажите, что унитарные эволюции в ТС2 соответствуют вращениям единичного шара в К3. Сосредоточим наше внимание на каналах вида F.10). Разумеет- Разумеется, полная положительность налагает нетривиальные ограничения на параметры Ху, ty !). Наиболее прост случай, когда ty = О, т. е. отображение представляет собой сжатие единичного шара вдоль осей х, у, z с коэффициентами А^., А^, Аг. Это имеет место тогда и только тогда, когда канал Ф, и следовательно Л, бистохастичен. Задача 35. Покажите, что Л[5]= ? W7Sa7, 7 = 0, х, у, г где /*» = ? О-*. + *,-*.), /*, = iA-A--A. + A-). и что неотрицательность этих чисел необходима и достаточна для полной положительности отображения Л, а значит, и Ф. В частности, отображение F.6) вполне положительно тогда и только тогда, когда 0 ^ р ^ 4/3. Вычислим величину С1 = С"(Ф) для произвольного бистохасти- ческого канала. Лемма 10. Пусть Ф бистохастический канал в Н2, тогда С"(Ф) = 1- min Я(ФE)). F.11) See(W) Доказательство. Неравенство ^ в F.11) вытекает из того, что для любого канала H- min Я(ФE)), F.12) S G ©(Н) так что остается доказать неравенство ^. Поскольку энтропия — вогнутая функция состояния, минимум достигается на чистом со- состоянии S. Беря равновероятно чистые состояния S0 = S, Si=I — S, получаем С'(Ф) ^ #Aф(/)) - 5[Я(ФE)) + Я(Ф(/ - '' См. там же.
§ 6.4. КАНАЛЫ В Щ 79 Поскольку канал бистохастический, правая часть равна — 2[#(ФE)) + Н{1 — ФE))], а в силу двумерности пространства, это равно правой части в F.11). При вычислении min БГ(ФE))) в силу унитарной инвариант- инвариантности энтропии достаточно рассмотреть случай Ф = Л. Отметим также, что собственные значения оператора плотности B.2) в Н2 равны A ± \а\)/2, а значит, энтропия равна F.13) Поскольку единичный шар отображается каналом Л в эллипсоид с полуосями \Ху\, j = x, у, z, минимум энтропии достигается на конце самой длинной полуоси, соответствующем оператору плотности с собственными значениями A ± max |Ат|)/2. Отсюда получаем l-max|A
ГЛАВА 7 ЭНТРОПИЙНЫЕ ХАРАКТЕРИСТИКИ КВАНТОВЫХ СИСТЕМ § 7.1. Квантовая относительная энтропия В классической статистике часто используется относительная энтропия двух распределений вероятностей Р — {р3}, Q = {д.,}: {?Р,0°ёРз ~ log9;)> если из qj = О =» р,- = 0; + оо, в противном случае. В классической статистике Н(Р; Q) играет роль (асимметричного) расстояния между распределениями [9]. В квантовом случае относительная энтропия вводится следу- следующим образом: пусть S, Т — операторы плотности, тогда тпс тп / TrS(logS-logT), если supp S С supp T, ^ + оо, в остальных случаях. Более общим образом, для любых положительных операторов S, Т с собственными значениями Ау, fj,k и собственными векторами еу, hk положим H(S; Т) = Е \(е3. | hk)\2(\j log Ау - Ау log/x, + цк - А,). G.1) л* Отметим, что слагаемое \ik — \i можно опустить в случае операто- операторов плотности. Рассмотрим ряд свойств относительной энтропии в квантовом случае. Лемма 11. ЯE; Т) > J ТгE - ГJ.
§7.1. КВАНТОВАЯ ОТНОСИТЕЛЬНАЯ ЭНТРОПИЯ 81 Доказательство. Используя формулу где ? —число между А и /х, получаем неравенство A log А - A log/x + /x - А ^ ^{ц - АJ, подставляя которое в G.1), мы и получаем результат. Таким образом, относительная энтропия мажорируется снизу среднеквадратичным отклонением, в частности, она положительна, если S фТ. СЛЕДСТВИЕ 1 (субаддитивность квантовой энтропии). Пусть 5]2 — оператор плотности в Нх <8>К2, 5, =TiH 512, S2 = ТгИ) 512. Тогда H(Sn) ^ H(S{) + H(S2), причем равенство имеет место тогда и только тогда, когда S12 = 5, <Е> S2. Доказательство. ЯE,) + H(S2) - H(Sl2) = H(Sl2; 5, ® S2) ^ 0. Весьма важным является следующее свойство монотонности относительной энтропии (Линдблад, 1975; Ульманн, 1976). Теорема 13. Пусть Ф — произвольный канал, тогда ЯE; Г) >Я(Ф[5]; Ф[Г]). Иногда это свойство называют «обобщенной Н-теоремой». Заме- Заметим, что при унитарном (обратимом) преобразовании относитель- относительная энтропия не меняется. СЛЕДСТВИЕ 2 (il-теорема). Если канал Ф оставляет инва- инвариантным хаотическое состояние S = I/d, т. е. Ф[7] = /, то для всех состояний S имеет место Я(Ф[5]) ^ H(S). Таким образом, Я-теорема справедлива для динамик, сохраняю- сохраняющих хаотическое состояние. Доказательство. Имеем H(S; 5) = Tr 5(log 5 - log ±1) = -H(S) + log d. G.2) Тогда в силу монотонности Я(Ф[5]; Ф[5]) ^ ЯE; S) => -H[S] + log d > -Я(Ф[5]) + log d.
82 Гл. 7. ЭНТРОПИЙНЫЕ ХАРАКТЕРИСТИКИ КВАНТОВЫХ СИСТЕМ СЛЕДСТВИЕ 3 (квантовая энтропийная граница). Пусть задан c-q-канал i—*S{, распределение вероятностей 7г = {7г?} на входе и наблюдаемая М = {Щ} на выходе канала. Обозначим /,(тг, М) шенноновскую взаимную информацию между переменными г и j. Тогда /.(тг, Доказательство. Обозначим S% = '%2iriSi, тогда правая часть равна где ЯE,; SJ = Tr 5,-(log S{ — S%), поскольку суммирование по i с коэффициентами жг дает: Сконструируем q-c-канал Ф[5] = J^Tr 5М;|е^.)(еу|, тогда 3 = diag fc ^ (Базис {еу} произвольный и его выбор роли не играет.) При этом квантовая относительная энтропия переходит в классическую, и применяя теорему к каналу Ф, получаем требуемое неравенство. Все известные доказательства свойства монотонности достаточно сложны. В Приложении мы приводим недавнее доказательство Лесьневского и Рускаи, которое представляется наиболее прямым. Свойство монотонности связано также с фундаментальной теоре- теоремой выпуклости (Либ, 1973), и со следующим свойством сильной субаддитивности (Либ, Рускаи, 1974) в теории квантовой энтропии, см. [17, 14]. Пусть имеются три квантовые системы в гильбертовом про- пространстве Н\ <8> Н2 <8> Н3, находящиеся в совместном состоянии 5123. Символ S с каким-либо набором индексов будет обозначать соответствующее частичное состояние. Тогда H(Sm) + H(S2) ^ H(Si2) + H(S23). Теорема 14. Следующие свойства эквивалентны:
§ 7.1. КВАНТОВАЯ ОТНОСИТЕЛЬНАЯ ЭНТРОПИЯ 83 1) монотонность относительной квантовой энтропии; 2) сильная субаддитивность квантовой энтропии; 3) совместная выпуклость относительной квантовой энтро- энтропии по аргументам 5,, S2. Доказательство. 1) =>• 2). Обозначая Sa = (dim'Ha)'lIa хаотическое состояние в пространстве На, имеем H(S23; 523) = ЯE23; S2 ® 53) + H(S2; 52), H(Sm; Si23) ¦= H(Sl23; Si2 <E> S3) + H(Sl2; Sl2). Вычитая и используя G.2), получаем ЯE12)+ЯE23)-ЯE12з)-ЯE2) = ЯE123; 512®53)-ЯE23; Рассмотрим канал Ф[5123] = 5, ® 523. Применяя теорему 13, получаем, что правая часть неотрицательна, т. е. свойство сильной субадцитивности. 2)=>3). Рассмотрим положительный оператор в /H1<g>/H2<g>'H3 вида где {е4} — ортонормированный базис в Нх, {ht} — ортонормиро- ванный базис в Н3, Аы —положительные операторы в Н2, который при подходящей нормировке является оператором плотности. Тогда и свойство сильной субаддитивности влечет следующее неравенст- неравенство: где Я(А) = — Tr A log А для положительного ненормированного оператора А. В частности, для любых положительных операторов А,, А2, В„ 52, + А2 + В, + В2) - Я(А, + А2) - Я(Б, + В2) ^ что равносильно совместной выпуклости функции Д(А, В) = Н(А + В)- Н(А) - Н(В)
84 Гл. 7. ЭНТРОПИЙНЫЕ ХАРАКТЕРИСТИКИ КВАНТОВЫХ СИСТЕМ по аргументам А и В. С другой стороны, для операторов плотности А я В имеет место формула Я(А; Я) = sup А-'[Д(А А, A - Л)Я) + Л(Л)] А>0 (задача 36), из которой видно, что Н(А; В) выпукла, как верхняя грань семейства выпуклых функций. 3)=И). Рассмотрим состояние 5J в пространстве Н^<Е>Н2. Имеет место формула Sx ® 52 = ( (J, ® U2*)Sl2(Ix ® где dZ72 — нормированная инвариантная мера на группе унитарных операторов в Н2 (задача 37). Совместная выпуклость (вместе с непрерывностью) относительной энтропии тогда влечет т. е. монотонность относительно взятия частичного следа. Но согласно следствию 2 теоремы 12, всякий канал можно представить как суперпозицию обратимого преобразования (сохраняющего от- относительную энтропию) с последующим взятием частичного следа. § 7.2. Разложение Шмидта и очищение состояния Рассмотрим состояние 512 в пространстве составной системы Н{ ® Ti.2- Мы будем часто использовать следующий простой, но неожиданный результат '>: Лемма 12. Пусть 312 = \ф){ф\, тогда частичные состояния 5, и S2 имеют одинаковые ненулевые собственные значения (с учетом кратности), а следовательно, и одинаковую энтропию. Доказательство. Предположим без ограничения общно- общности, что dimH, ^ dim 74. Рассмотрим спектральное разложение '' См., например, Lindblad G. Quantum entropy and quantum measure- measurements // Quantum Aspects of Optical Communication. Ed. by C. Benjaballah, O. Hirota, S. Reynaud. —Lect. Notes Phys. — 1991 —V. 378. —P. 71-80.
§ 7.2. РАЗЛОЖЕНИЕ ШМИДТА И ОЧИЩЕНИЕ СОСТОЯНИЯ 85 Разложим вектор \tp) по базису |ej), №> = ЕК>®|л»>, где |Л?) некоторые векторы из Н2. Взяв частичный след, получаем Следовательно, (Л?|Л|) = А;-Й^. Для Ал.^0 положим \ej) — Xjl/2\hf), и дополним до ортонормированного базиса в /Н2. Для вектора -ф имеем разложение Шмидта Отсюда следует, что А^ являются также собственными значениями для S2. Более того, из этих рассуждений вытекает, что для любого смешанного состояния 5, в Нх всегда существует чистое состояние в Н = НХ ®Н2 (Нх «W2), для которого 5, =Тгн \ф)(ф\. Подобное расширение произвольного состояния до чистого называется очи- очищением. Задача 38. Докажите, что очищение квантового состояния в существенном единственно: любые два очищения с пространствами 7i2, W!2, такими, что dim "Н2 ^ dim Щ, связаны изометрическим вложением Н2 в Ti'2. Рассмотрим состояние 5 и неидеальное измерение F.3), опи- описываемое семейством операторов Vk, удовлетворяющим усло- условию Е^**^4 — -^ так чт0 исход к получается с вероятностью к рк =Tr SVk*Vk, приводя к апостериорному состоянию системы Sk = VkSVk / рк. Имеет место следующее неравенство Гроневоль- да — Линдблада — Озава, связывающее энтропии априорного и апостериорных состояний'' Для доказательства положим 'Н — 'Н^та рассмотрим очищение \ф) состояния S в "Нх ®Ti2. Тогда '* Ozawa M. On information gain by quantum measurement of continuous observ- observable // J. Math. Phys. — 1986. -V. 27. — P. 759-763.
86 Гл. 7. ЭНТРОПИЙНЫЕ ХАРАКТЕРИСТИКИ КВАНТОВЫХ СИСТЕМ и S2 = TrH S = ^2PkS2k, где Используя лемму 12, а также вогнутость энтропии, получаем Частным случаем является следующее полезное неравенство для составной системы. Пусть SAB состояние системы АВ и пусть {lejf)} ортонормированный базис вНв. Полагая Vk = IA ®\ек)(ек |, имеем {Sfi, G.3) где рк SA = (ек | SAB | ef). Это неравенство может быть использова- использовано ]) для доказательства следующего частного случая гипотезы аддитивности (см. § 6.3), именно С" {ФА ® IdB) = С1 (Фл) + С1 (Ив) = С (Фл) + log dim Пв G.4) для произвольного канала ФА в НА. В самом деле, для произволь- произвольных вероятностей 7г, и сигнальных состояний SjB имеем ®IdB) [5ДВ]) - Е ^Я ((Фл ® IdB) [5iB]) ^ ®IdB) [5iB]) +Я(Е тг,5в г i i в силу субаддитивности первого слагаемого в левой части. Послед- Последнее слагаемое в правой части не превосходит log dim 7iB. Применяя неравенство G.3) к каждому члену во втором слагаемом, получаем, что сумма первых двух слагаемых в правой части не превосходит [5*]) -Е где Vik^A — {ек\^Ав\ек)- Теперь мы имеем сигнальные состояния Sf с вероятностями щр±к на входе канала ФА, так что последнее выражение не превосходит С (ФА) ¦ ') Schumacher В., Westmoreland M. D. Optimal signal ensembles // LANL Report quant-ph/9912122.
§ 7.3. ЭНТРОПИЙНАЯ КОРРЕЛЯЦИЯ И УСЛОВНАЯ ЭНТРОПИЯ 87 § 7.3. Энтропийная корреляция и условная энтропия В классике количество информации, передаваемое каналом X^Y, измеряется величиной I(X, Y) = H(X) + H(Y)-H(X, Y). Рассмотрим сначала формальный квантовый аналог этой величины. В квантовой статистике далеко не всегда можно говорить о совмест- совместном распределении. Поэтому рассмотрим ситуацию, в которой оно заведомо существует. Пусть имеются две системы в гильбертовом пространстве Н — 'НХ®'Н2 в совместном состоянии 5,2, и пусть 5, = Тг2 512, 52 = Тг, 512 частичные состояния. Определим энтро- энтропийную корреляцию между подсистемами как ЛЕММА 13. Энтропийная корреляция неотрицательна, с12 ^ ^ 0. Причем с,2 =0 тогда и только тогда, когда 512 = 5, <g> 52. Доказательство. Имеем Н^) + H(S2) - H(Sn) = H(Sl2; 5, ® 52) ^ 0, где Н(-; ¦) — относительная энтропия. Рассмотрим случай, когда совместное состояние — чистое, 512 = = \ф){ф\. Поскольку Д"E12) = 0, то в силу леммы 12 имеем Величина #E,) является естественной мерой сцепленности чи- чистого состояния 512 = \tp)(ip\. Вопрос о мерах сцепленности сме- смешанного состояния является куда более сложным и его изучению посвящена обширная и быстро растущая литература (см. [13]). Скажем только, что для смешанного состояния можно определить разные меры сцепленности, соотношение между которыми еще не вполне изучено. Кроме того, для смешанных состояний существуют качественно различные степени сцепленности (появляется так называемая связанная сцепленность (bound entanglement), отсут- отсутствующая для чистых состояний). Заметим, что в классической статистике частичное (марги- (маргинальное) состояние для любого чистого состояния обязатель- обязательно чистое, так что очищение не имеет классического анало- аналога. С этим обстоятельством связано необычное свойство кван- квантовой условной энтропии. Классическая условная энтропия
88 Гл. 7. ЭНТРОПИЙНЫЕ ХАРАКТЕРИСТИКИ КВАНТОВЫХ СИСТЕМ H{X\Y) = H(XY) - H(Y) всегда неотрицательна, т.е. расши- расширение классической системы не может привести к уменьшению энтропии состояния системы. Квантовый аналог условной энтропии Н(А | В) = H(SAB) — H(SB), где SAB — совместное состояние квантовых систем А, В, a SB —частичное состояние системы В, может принимать отрицательные значения, поскольку при очище- очищении энтропия составной системы может быть меньше энтропии подсистемы. Заметим, однако, что квантовая условная энтропия, как и классическая, обладает важным свойством монотонности Н(А\ВС)^Н(А\В), которое, очевидно, эквивалентно сильной субаддитивности энтро- энтропии (задача 39). ЛЕММА 14. Условная энтропия Н(А\В) является вогнутой функцией совместного состояния SAB. Доказательство. Имеем ЩА | B) = -H(SAB;dxlIA ® SB) + \ogdA. Утверждение теперь следует из совместной выпуклости относи- относительной энтропии. Эти свойства делают квантовую условную энтропию полезным аналитическим инструментом, несмотря на отсутствие удовлетво- удовлетворительной статистической интерпретации. § 7.4. Обменная энтропия Пусть "Н — гильбертово пространство, 5 — состояние. Рассмо- Рассмотрим квантовый канал в 7i, т. е. вполне положительное отобра- отображение, сохраняющее след. Индексом Q будем обозначать входные состояния, а значком Q, выходные состояния системы, так что Введем еще одну систему — окружение (environment), обозна- обозначаемую значком Е, находящуюся в исходном чистом состоянии \ipB)(ipE\- Канал Ф всегда можно предоставить в виде
§ 7.4. ОБМЕННАЯ ЭНТРОПИЯ 89 где U унитарный оператор, описывающий эволюцию составной системы. Обменной энтропией называется величина H(SE,), равная при- приращению энтропии окружения в результате взаимодействия с системой. Здесь SE, состояние окружения после взаимодействия, SE.=TrHQU(SQ®SE)U\ G.5) Можно показать, что это определение зависит лишь от SQ и Ф, но не зависит от способа представления канала. Введем еще эталонную систему (reference system), обозначаемую индексом я, с пространством HR ^"Hq- Эта система нужна для очищения состояния SQ: По определению, эталонная система не изменяется в ходе эво- эволюции, так что SR, = 5Д. Рассмотрим SQR как входное состояние канала Ф <8> Ыд, и обозначим выходное состояние этого канала SQ,R, = {<?>®ldR)[SQR]. ТЕОРЕМА 15. Обменная энтропия дается соотношениями H(SB.) = H(S(yR.) = H([TrSQV;Vi]ik), G.6) где Vj операторы из разложения Крауса Доказательство. Рассмотрим исходное чистое состояние SQRE = \%r)(%R\® \Фе){'Фе\- В результате действия канала вновь получим чистое состояние По лемме 12 получаем, что H(SQIRI) — H(SE,). Отсюда видно также, что обменная энтропия не зависит от способа унитарного расширения канала. Для доказательства второго равенства заметим, что
90 Гл. 7. ЭНТРОПИЙНЫЕ ХАРАКТЕРИСТИКИ КВАНТОВЫХ СИСТЕМ Рассмотрим матрицу [(^®4)lVW<V^I(K®'*)V Это матрица плотности чистого состояния \ф)(ф\ с вектором где НЕ — гильбертово пространство размерности N. Тогда можно считать.что SQIR, =TrH |^)(^1- Следовательно, согласно лемме 12, получаем н^ \ф){ф\) = § 7.5. Информационные количества В классической теории информации взаимная информация между входом и выходом дается формулой Шеннона где N = H(Y | X) — шум, L — Н(Х \ Y) — потери в канале связи (см. рис. 12). В частности, сумма шума 1{Х, Y) и потерь всегда равна энтропии источника, I + L = Н(Х). В квантовом случае определить прямой аналог величины I не представляется возможным, поскольку не определено совмест- совместное состояние входа-выхода. Однако, если мы ЩХ) ЩУ) введем эталонную систему, которая не изменя- изменяет своего состояния в течение эволюции, ее Рис 12 Классическая можно рассматривать как некоторый замени- диаграмма Венна тель входа в классическом случае. Напомним, что H(SR,) = H(SR) = H(SQ). Кроме того, пред- предполагая, что начальное состояние окружения чистое, получаем, что состояние системы QRE остается чистым в ходе эволюции и поэтому H(SQ,R,) = H(SE,), H(SQ,E,) = H(SRI), H(SE,R,) = H(SQ,).
§ 7.5. ИНФОРМАЦИОННЫЕ КОЛИЧЕСТВА 91 Формальный аналог взаимной информации дается энтропийной корреляцией между выходом и эталонной системой: I(Q'; R>) = H(SQ,) + H(SR.) - H(SQ,R,) = = H(SQ,) + H(SQ)-H(SB,). G.7) Естественно рассмотреть также энтропийные корреляции между выходом и окружением и между окружением и эталонной системой E>) = H{SQ.) + H{SE,) - H(SQ,E.) = '; E') = H(SR.) + H(SE,) - H(SR,E.) = + H(SE.)-H(SQ.) = L, которые по своему физическому смыслу естественно ассоциировать с «шумом» и «потерями», соответственно. В квантовом случае их сумма равна удвоенной энтропии источника, I + L =2H(SQ). Отметим, что начальные значения этих трех корреляций суть ; E) = H(SQ) + H(SE) - H(SQE) = O, ;E) = H(SR) + H(SE)-H(SRE) = O. Таким образом, все эти информационные количества выра- I Q R R'=R жаются через входную H(SQ), выходную H(Sq,) и обменную H(SE,) энтропии, и вследст- вследствие этого являются функциями только канала Ф и начально- начального состояния S — SQ. Поэто- Поэтому мы вправе ввести обозна- обозначения I = 7E, Ф), L = L (S, Ф), N = N(S, Ф). Поскольку эти ве- величины неотрицательны, входная, выходная и обменная энтропии удовлетворяют неравенствам для сторон треугольника: ), G.8) Рис. 13. Квантовая диаграмма Венна и т. д. Графическое представление всех этих величин дается квантовы- квантовыми диаграммами Венна (см. рис. 13), которые, однако, отличаются
92 Гл. 7. ЭНТРОПИЙНЫЕ ХАРАКТЕРИСТИКИ КВАНТОВЫХ СИСТЕМ от классических тем, что области, отвечающие условным энтропи- ям, например H(Q\R) = H(SQR)-H(SQ) могут иметь отрицательную площадь. Взаимная информация 7E, Ф) обладает целым рядом хороших свойств, аналогичных свойствам шенноновской информации: 1) вогнутость по 5; 2) выпуклость по Ф; 3) субаддитивность: 7E12,Ф, <8>Ф2) ^ I(SU Ф,) + I(S2, Ф2); 4) цепные свойства: а) б) Доказательства этих свойств основываются, главным образом, на лемме 12 и свойстве сильной субаддитивности квантовой энтро- энтропии ''. 1) Используя определение G.7) и лемму 12, имеем I(S, Ф) - H(SQIE.) + H(SQ.) - H(SE.) = H(SQ.) + H(Q'\E'). G.9) Отображение SQ —> SQ. аффинно, а энтропия H(SQ.) вогнута как функция SQf. С другой стороны, отображение SQ, —> SQ,E, аффинно, а условная энтропия H(Q'\E') вогнута согласно лемме 14. 2) С другой стороны, - H(SQ) + H(SQ.) - H(SQ,R,) - H(SQ) - H(R' | Q'). Здесь первое слагаемое вообще не зависит от Ф, а второе, согласно той же лемме, является выпуклой функцией от состояния SQIR,, которое аффинно зависит от Ф. 3) Для доказательства субаддитивности вновь используем пред- представление G.9). Тогда нам надо доказать, что H(S{2) + H{Q[Q> | E[Ei) ^ H(S() + H(Q{ | E[) + ЯE2') + Я(Q2' | E'). Но это вытекает из субаддитивности энтропии и условной энтро- энтропии. Последнее означает, что 11 Е[Е1) ^ H(Q[ | Е[) '> Adami С, Cerf N. I Capacity of noisy quantum channels // Phys. Rev. A — 1997. —V. A56. — P. 3470-3485; LANL Report no. quant-ph/9609024.
§ 7.5. ИНФОРМАЦИОННЫЕ КОЛИЧЕСТВА 93 и доказывается путем двойного использования свойства сильной субаддитивности (задача 40). 4) Доказательства цепных свойств оставляются в качестве упражнений. Они основываются на свойстве монотонности услов- условной энтропии: Н{А\ВС)^Н(А\В), которое также вытекает из сильной субаддитивности квантовой энтропии.
ГЛАВА 8 ПЕРЕДАЧА КЛАССИЧЕСКОЙ ИНФОРМАЦИИ С ПОМОЩЬЮ СЦЕПЛЕННОГО СОСТОЯНИЯ Изложенный выше феноменологический подход не раскрывает операциональный смысл величины /E, Ф) и ей подобных, как теорема кодирования раскрывала смысл шенноновской информа- информации. Замечательно, что эта величина действительно асимптоти- асимптотически характеризует некоторый протокол передачи информации через квантовый канал связи. Этот протокол, называемый переда- передачей классической информации с помощью сцепленного состояния (entanglement-assisted classical communication) является прямым обобщением идеи сверхплотного кодирования на случай произволь- произвольного канала с шумом. Пусть имеется система связи с передающим концом А и прием- приемным концом В. (Предполагается, что ИД«НВ.) Таким образом, А В описывается гильбертовым пространством 'НА®'НВ. Перед началом связи с помощью некоторой процедуры типа ЭПР система А В приготовляется в некотором чистом состоянии SAB. Система А получает классическую информацию, содержащуюся в значениях параметра х, которая кодируется произвольными преобразования- преобразованиями Фх в пространстве ?{А. В случае сверхплотного кодирования мы ограничились унитарными преобразованиями, но обобщение на произвольные преобразования очевидно. При этом состояние системы АВ преобразуется в (Фх <g> ldB)[SAB]. После этого А посылает свою часть состояния по данному каналу Ф, в результате чего на конце В становится доступной измерению система АВ в состоянии (Ф-Фх(8Iс1в)[54В]. Классическая информация извлекает- извлекается путем измерения некоторой наблюдаемой в пространстве НАВ. Разрешается блочное кодирование, так что на самом деле, все это описание относится к n-й тензорной степени пространства НАВ. Это аналогично сверхплотному кодированию (см. § 3.2), но вместо идеального канала, А использует канал Ф. Нас интересу- интересует классическая пропускная способность этого протокола, кото- которая называется пропускной способностью протокола передачи
Гл. 8. ПЕРЕДАЧА КЛАССИЧЕСКОЙ ИНФОРМАЦИИ 95 классической информации с помощью сцепленного состояния (entanglement-assisted classical capacity или ЕАСС). Максимум по измерениям В может быть оценен с помощью теоремы кодирования для классической пропускной способности из гл. 5. Сначала введем величину = max Используя канал п раз и коллективные измерения в системе В, получаем величину ЕАСС тогда равна См(Ф)=ига 1- ТЕОРЕМА 161}. Пропускная способность протокола переда- передачи классической информации с помощью сцепленного состояния дается формулой Сеа = тах7E,Ф). Очевидно, что всегда Сеа ^ С, причем Сеа = 2С1 = 2С для идеального канала (случай сверхплотного кодирования, см. § 3.2). Величину Сеа естественно сравнивать с классической пропускной способностью канала С, однако, поскольку гипотеза С — С1 оста- остается открытой (см. § 6.3), приходится рассматривать С". Вычислим величину Сеа для деполяризующего канала F.6). Используя унитарную ковариантность деполяризующего канала и вогнутость функции S —> I(S, Ф), получаем, что ее максимум достигается на хаотическом состоянии S = I/d. Имеем H(S) = Н(Ф[Щ) = log d. Обменная энтропия ЯE,Ф) может быть вычислена по формуле G.6) (задача 41), откуда получаем ') Этот результат был анонсирован в работе Bennett С. Н., Shor P. W., Smolin J. A., Thapliyal A. V. Entanglement-assisted classical capacity of noisy quantum channel // Phys. Rev. Lett. — 1999. — V. 83. — P. 3081; LANL Report quant-ph/9904023. Мы приводим усовершенствованную и дополненную версию доказательства из неопубликованной работы: Bennett С. #., Shor P. W., Smolin J. A., Thapliyal A. V. Entanglement-assisted capacity and the reverse Shannon theorem. — 2000.
96 Гл. 8. ПЕРЕДАЧА КЛАССИЧЕСКОЙ ИНФОРМАЦИИ Сравнивая с величиной С, которая дается формулой F.8), полу- получаем, что Сеа/С —> d + 1 при р —> 1 (когда обе пропускные способ- способности стремятся к нулю!) Таким образом, сцепленные состояния вновь выступают как «катализатор» при передаче классической информации — они могут в принципе неограниченно увеличить классическую пропускную способность существующего канала, хотя сами по себе не могут эту информацию передавать. Доказательство теоремы. Докажем неравенство Сеа(Ф)^тах/E,Ф). (8.1) Сначала построим обобщение протокола сверхплотного кодирова- кодирования (§ 3.2), которое позволит установить неравенство (8-2) для произвольного проектора Р в W|". Пусть Р — ^Г, 1е*Ке*1> гДе * = i {ek;k = l,...,m = dim P} ортонормированная система. Определим унитарные операторы в ЙА, действующие по формулам на подпространстве, порожденном векторами {ек} , и как единич- единичный оператор — на ортогональном дополнении. Пусть Задача 42. Система векторов является ортонормированной в 'НА®'НВ\ в частности, если ш = = длтН.А, то эта система — базис. Докажите также, что Е [Wa,®IB)\^AB){^AB\{Wa,®IBY ^ЮР(8.3) а,/3 = 1 Таким образом, операторы {И^; а, /3 = 1,..., т} играют роль, аналогичную матрицам Паули в протоколе сверхплотного кодиро- кодирования для g-бита. Пусть теперь классический сигнал принимает
Гл. 8. ПЕРЕДАЧА КЛАССИЧЕСКОЙ ИНФОРМАЦИИ 97 значения х = (а, /?) с равными вероятностями 1/т2. В качестве сцепленного состояния возьмем \/Фав)('Фав\' а в качестве кодирую- кодирующих отображений — ?'А [S] = WapSW*fi. Тогда получим ) где S«J = [Woe®IB) \ФАВ)(ФАВ\ {Wa3®IB)'. Тогда согласно (8.3) первое слагаемое в правой части равно Поскольку состояние 5j| очищает смешанное состояние — в Нв, все энтропии во втором слагаемом одинаковы и равны Д"(—,Ф). Учитывая выражение для квантовой взаимной информации I(SA, Ф) = H(SA) + Я(ФEЛ)) - ЯEЛ; Ф), получаем (8.2). Напомним, что последнее слагаемое — обменная энтропия — равно энтропии окружения H(S^) = Н(ФЕ [SA]), где ФЕ канал из пространства системы НА в пространство окружения Лв, задаваемый формулой G.5). Пусть теперь SA = S произвольное состояние в НА, и пусть Рщ6 проектор на типичное подпространство оператора плотности 5®" в W|n. В работе Беннета и др. '* было высказано предположение, что для произвольного канала Ф выполнено равенство откуда, согласно выражениям для взаимной информации и обмен- обменной энтропии, следовало бы ^))' <8-4> а значит, согласно (8.2), и доказываемое неравенство (8.1). Мы докажем, что соотношение (8.4) действительно имеет место, если под ?"•' понимать проектор на сильно типичное подпространст- подпространство состояния 5е". Зафиксируем положительное 8, и обозначим через А. собствен- собственные числа, |е.) собственные векторы оператора плотности 5. Тогда '' См. там же.
98 Гл. 8. ПЕРЕДАЧА КЛАССИЧЕСКОЙ ИНФОРМАЦИИ собственные числа и собственные векторы оператора плотности S®" суть А/ = Ал-...-А>>1 |e/) = |eJ,)®...®|e>iiI где J = (j,,..., jn). Последовательность J "называется сильно "типичной [9], если числа N(j | J) появлений символов j в последовательности J удовлетворяют условию N(j\J) и -\ S, причем N(j | J) = 0, если А3 = 0. Обозначим совокупность всех сильно типичных последовательностей Вщ6, и пусть Р™ — рас- распределение вероятностей, задаваемое собственными числами \j. Согласно закону больших чисел, Р" (Вщ6) —> 1 при п —> схз. Извест- Известно [9], что размер множества В^6 оценивается как d где H(S) = — J2 A, log А,., и lim lim An(S) — 0. j^\ 6 —>0 n—> oo Для произвольной функции /(j), j = 1,..., d, и последовательно- последовательности J = (j{, ..., jn) e Вщ8 имеем _ ^ A 1 max;. (8<6) В частности, любая сильно типичная последовательность яв- является типичной в обычном (энтропийном) смысле: полагая /O') = -1ogAy, имеем n[H(S) - 6{) < - log Xj < n[H(S) + $,], (8.7) где Sl = 6 max(— log Ay). Обратное неверно — не всякая типичная последовательность сильно типична. Проектор на сильно типичное подпространство определим фор- формулой Е Обозначим d^s =dimPn's = |В"-*| и 5* = 4—. и докажем, что lim lim -Я(Фв" E">*)) = Я(ФE)) (8.8) 4-»0 n->oo n для произвольного канала Ф.
Гл. 8. ПЕРЕДАЧА КЛАССИЧЕСКОЙ ИНФОРМАЦИИ 99 Имеем n (Ф®п (?"•*) - ФE)*в) , (о.У) где Я (¦; •) относительная энтропия. Строго говоря, это преобразо- преобразование имеет смысл, если оператор плотности ФE)®" невырожден, что мы сначала и предположим. Для первого слагаемого, используя свойство монотонности отно- относительной энтропии, имеем Я (ф®- En's) ;ф®"E®")) ^ Я EП'Й; 5®"), где правая часть согласно (8.7), (8.5) оценивается величиной п E, + ДпE)), стре- стремящейся к нулю при п —юо, й —> 0. Используя соотношение и вводя оператор F =Ф*(logФE)), мы можем переписать второе слагаемое в виде п Tr -5~7 2- I п Z. Aj/UJJ. "' 'l 1 j где /(j) = (е^Е\е^, что оценивается величиной пйтах/ в силу (8.6). Это доказывает соотношение (8.8) в случае невырожденного ад- В общем случае обозначим JF^ проектор на носитель оператора ФE). Тогда соответствующий проектор оператора ФE)®п есть Р^п, и носитель оператора Ф®" E"**) содержится в носителе ФE)®"=Ф®"E'®П), поскольку носитель 5"'* содержится в носителе 5®". Поэтому второе слагаемое в (8.9) следует понимать как Тг Рф®" log [P$®^E)®"P/n] Рф®п (Ф®п E"-*) -ФE)вп) ,
100 Гл. 8. ПЕРЕДАЧА КЛАССИЧЕСКОЙ ИНФОРМАЦИИ где логарифм берется от невырожденного оператора в подпростран- подпространстве Р^"Н®п. Теперь можно повторить рассуждения, определив F как Ф*(.?ф [logPSl4!(S)PSl\ Py). Это завершает доказательство соотношения (8.4), откуда вытекает (8.1). Теперь докажем неравенство (8.10) Докажем сначала, что (8.11) S Обозначим состояние системы А В (соотв. А) после кодирования ^В = (Ф1®ИВ)[5АВ], соответственно 5; = ФЯ[5А]. (8.12) Заметим, что частичное состояние В не изменяется после кодиро- кодирования, SB — SB. Докажем, что я (ЕтгЛФд ®idB)[szB]) -Е 7Г.Я {(ФА ®uB)[s:B]) ^ V х ' х )- (8-13) Согласно квантовой теореме кодирования, максимум левой части по всем пх,Фх есть С^(Ф), откуда будет следовать (8.11). Используя субаддитивность квантовой энтропии, мы можем оце- оценить первое слагаемое в левой части (8.13) как н (е 7г,фд[5;]) + H(sB) = н (фа [е тг.5;]) + Е *,H(sB). Первый член уже дает выходную энтропию из / I Е 'яхЗ%;ФА 1 . Оценим остальные члены Е^ [H(SB)-H ((ФА ®Ida)[54'B])] . х Покажем сначала, что слагаемое в квадратных скобках не превос- превосходит где Rx эталонная система для очищения SA, и 5дД, соответст- соответствующее чистое состояние. С этой целью рассмотрим унитарное
Гл. 8. ПЕРЕДАЧА КЛАССИЧЕСКОЙ ИНФОРМАЦИИ 101 расширение кодирования Фг с окружением Ех, которое находится в начальном чистом состоянии, в соответствии со следствием 2 теоремы 12. Из (8.12) видно, что можно считать Rz — ВЕХ (после взаимодействия, которое затрагивает только АЕХ). Тогда, обозна- обозначая штрихом состояния после применения канала ФА, получаем ) = -HX{A'\B), (8.14) где нижний индекс х условной энтропии указывает на состояние 5д,в. Аналогично - Н ((ФА ® ldR.)[SXa.]) = H(S?.) - Н что больше или равно (8.14), согласно монотонности условной энтропии. Используя вогнутость функции SA-^H(SA)—H [(ФА <8> ldR)[SAR]), которая будет установлена ниже, получаем Е тг, [H(s-) - н ((Фд ® ida.)[s:R.])] ^ -н где 5дЯ — состояние, очищающее 52 тг*^ с эталонной системой R. X Для доказательства вогнутости обозначим Е окружение для канала ФА, тогда получим H(SA)-H ((ФА®МЛ)[5АД]) =H(SR)-H {SA,R) = = H(SA.S.)-H(SS.) = H(A'\E'). Условная энтропия Н(А'\Е') вогнутая функция состояния SA,E,, a отображение SA —* SA,E, аффинно, поэтому Н(А' \ Е') — вогнутая функция состояния SA . Применяя это рассуждение к каналу Ф®п, получаем Согласно субаддитивности квантовой взаимной информации (свой- (свойство 3)), имеем maxI(Sl2, Ф; <8)Ф2) = max 7E,, Ф,) + max I(S2, Ф2), 5 S 5
102 Гл. 8. ПЕРЕДАЧА КЛАССИЧЕСКОЙ ИНФОРМАЦИИ откуда вытекает замечательное свойство аддитивности max I(SA, Ф®") = п max I(SA, Ф). Окончательно, Ф). (8.15)
ГЛАВА 9 КВАНТОВАЯ ПРОПУСКНАЯ СПОСОБНОСТЬ И КОГЕРЕНТНАЯ ИНФОРМАЦИЯ Пусть S — входное состояние, на которое действует фиксирован- фиксированный канал Ф: 5 —>ФГЗ']. Теперь наша цель состоит в том, чтобы используя блочное кодирование, т. е. n-е степени канала Ф®", добиться (асимптотически при п —¦ оо) точной передачи квантовых состояний с максимально высокой скоростью. Таким образом, речь идет об аналоге шенноновскои теоремы кодирования для квантовой информации 1). § 9.1. Точность воспроизведения квантовой информации В качестве меры точности воспроизведения состояния можно было бы использовать, например, величину max || S — Ф[5]|| ,, где S || А|| , = Tr j А|, и \А\ — VA'A, показывающую, насколько выход канала Ф отличается от выхода идеального канала (ср. с A.16) в классическом случае). Однако в квантовой теории информации и компьютинге традиционно используются другие меры точности. Да- Дадим их описание и рассмотрим взаимосвязи между ними. Докажем полезный вспомогательный результат. ЛЕММА 15. Пусть ф единичный вектор, S произвольное состояние, тогда имеют место неравенства 2[\-{ф\3\ф)]^\\\ф)(ф\- ') В этой главе мы кратко излагаем некоторые результаты работ: Barnum H., Nielsen M. A., Schumacher В. Information transmission through noisy quantum channels // Phys. Rev. A. — 1998. — V. 57. — P. 4153-4175; LANL Report no. quant- ph/97O2O49, Feb. 1997; Barnum H., Knill ?., Nielsen M. A. On quantum fidelities and channel capacities // IEEE Trans. Inform. Theory. — 2000. — V. 46. —P. 1317-1329; LANL Report no. quant-ph/9809010, Sep. 1998.
104 Гл. 9. КВАНТОВАЯ ПРОПУСКНАЯ СПОСОБНОСТЬ Если S = \ip)(p\—чистое состояние, то второе неравенство обращается в равенство, т. е. ^/-|(Vk)|2. (9.1) Величина ) (9.2) называется точностью воспроизведения (fidelity). Это понятие мож- можно обобщить на случай, когда оба сравниваемые состояния — смешанные, при этом точность воспроизведения выражается через так называемое расстояние Бюреса, однако это нам здесь не понадобится. Доказательство. Имеем где максимум берется по всем унитарным операторам U. Полагая U = 2|'0)('0| — I, получаем первое неравенство. Доказательство соотношения (9.1) предлагается в качестве упражнения. Для вычисления левой части достаточно найти соб- собственные значения оператора IV'XV'I ~ 1уХИ> который имеет ранг 2 (см. задачу 12). Пусть теперь S произвольный оператор плотности, рассмотрим его спектральное разложение 5 = ^А;5,-. Используя выпуклость нормы, вогнутость функции ^у, а также (9.1), получаем Заметим, что когда мы рассматривали вопрос о сжатии квантовой информации, мы фактически использовали меру точности (9.2). Если состояние I^XV'J возникает с вероятностью р,;, то средняя точность воспроизведения равна F =YlPi(iJi\ ^A^Pi)- г В связи с кодами, исправляющими ошибки (см. гл. 10), есте- естественная мера точности определяется следующим образом. Пусть задано подпространство СсН. Точностью воспроизведения этого подпространства каналом Ф называется величина F,(C, Ф) = ^mm _^|Ф[ | V-XV-I ]| ФУ
§9.1. ТОЧНОСТЬ ВОСПРОИЗВЕДЕНИЯ КВАНТОВОЙ ИНФОРМАЦИИ 105 В этом случае мы хотим как можно точнее передавать все чистые состояния из подпространства С. В силу доказанной леммы, имеет место оценка 2[1 - i?(A Ф)] ^ max HI VXV'I - Ф[| V'XV'llll , ^ ). (9.3) Эта оценка подобна неравенствам A.16) в классическом случае. Весьма важной является величина Fe(S, Ф), называемая точ- точностью воспроизведения сцепленности (entanglement fidelity), кото- которая определяется следующим образом. Расширим состояние S = SQ до чистого состояния \tpQR)(ipQR\ в гильбертовом пространстве ~HQ®'HR и рассмотрим точность воспроизведения этого чистого состояния тривиальным расширением канала: ВДФ) := {фт\ (Ф® Ил)[| фт){фяк\]\ фт). Имеется удобное выражение для величины Fe(S, Ф), которое также показывает независимость данного выше определения от способа очищения состояния. Пусть канал имеет представление: тогда В самом деле, Задача 43. Доказать, что величина Fe(S,Ф) не зависит от способа представления канала Ф в виде (9.4). Важность характеристики Fe(S, Ф) в значительной мере обуслов- обусловлена следующим результатом. ЛЕММА 16 (квантовое неравенство Фано). Для любого состояния S выполнено неравенство H(S, Ф) < h(Fe(S, Ф)) + A - Fe(S, Ф)) log(d2 - 1) < < 1+2A-Fe(SiФ))logd.
106 Гл. 9. КВАНТОВАЯ ПРОПУСКНАЯ СПОСОБНОСТЬ Доказательство. Пусть SQR ?= \ ipQR)(ipQR\ чистое состо- состояние в TiQ®'HR, продолжающее S. Выберем ортонормирован- ный базис (le,)} в /Hq®'HR, так что | е,) = | tpQR). Обозначая Pi ~(ei\ sq'w\ ei)' имеем В самом деле, правую часть этого неравенства можно запи- записать как H(%SQ,RI)), где Ф[5] = ? | е,)(е,\ S\ е{)(е{\, так что Я(Ф[5]) ^ ЯE) согласно следствию 2 теоремы 13. Заметим, что р, = Fe(S, Ф), поскольку SQIR, = Ф ® Ид[| %R){ipQR\]. Далее, -p.)- 1 = 1 d1 i = 2 ' ^ >)) + (l-Fe(S^))\og(d2-l), так как максимум классической энтропии достигается на равномер- равномерном распределении. Между различными мерами точности существует ряд соотноше- соотношений. Докажем важное неравенство1'. ЛЕММА 17. Для любого состояния S выполнено неравенство 1 - Fe(S, Ф) Таким образом, Ft является более чувствительной мерой точно- точности воспроизведения, нежели F€. Доказательство. Не ограничивая общности, будем счи- считать, что supp S = Н. Имеем Представляя '» Werner R. F. Unpublished notes. 1999.
§9.1. ТОЧНОСТЬ ВОСПРОИЗВЕДЕНИЯ КВАНТОВОЙ ИНФОРМАЦИИ 107 где | е}) — ортонормированный базис вИд,^ IIV'jII2 = 1. получаем, что это равно ... ,, ]|%К || idQ-Ф|| = max • у* где максимум берется по всевозможным ненулевым операторам Г. Разлагая Т = Т, + гТ2, где 7]* = Г,, Т2* = Т2, и учитывая, что ||Tli2||,< ^ || Г ||,, а также неравенство треугольника, получаем, что это не превосходит 2maxJI^pii = 2max||5. Т- = Т II' 111 StS(H) 11*11 = 1 Последнее равенство следует из выпуклости нормы и того факта, что максимум выпуклой функции достигается на крайних точках выпуклого множества. Используя второе неравенство в (9.3), получаем, что это выражение не превосходит 4\/1 — Fs. СЛЕДСТВИЕ. Следующие условия эквивалентны: 2) |§ 3) Ф[5] = 5 для любого состояния S с носителем supp 5 с csupp S. Доказательство. Согласно определению Ft, условие 2 эквивалентно условию 3 для чистых, а значит, и для смешанных состояний 5. Из леммы 15 вытекает, что 2)=Ф-3). Покажем, что 1)=*>2). Пусть \ф) е supp 5, тогда где р > 0 и 5' некоторый оператор плотности. Функция 5 —> -РД5, Ф) положительная и квадратичная, а значит, выпуклая. Поэтому следовательно ^^(j-0) {-01, Ф) = 1. Но это означает, что A>\Щ\Ф)(Ф\ ]IV>> = 1 для всех |-0) е supp 5, и поэтому i^(supp 5, Ф) = 1.
108 Гл. 9. КВАНТОВАЯ ПРОПУСКНАЯ СПОСОБНОСТЬ § 9.2. Когерентная информация и обратимость канала Важной составной частью квантовой взаимной информации /Eд,Ф) является когерентная информация Как мы увидим в следующем параграфе, она связана с верхней гра- границей скорости передачи чисто квантовой информации по каналу Ф. Когерентная информация не обладает рядом «естест- «естественных» свойств, таких как: вогнутость по SQ; субаддитивность; цепное свойство 2). Более того, она может принимать отрицательные значения. Заметим, что ее классический аналог вообще неположителен, H(Y) - H(XY) = -Н(Х\ Y) ^ 0. Однако, Ie(S, Ф) вогнута по Ф и обладает цепным свойством 1): адФгоФ^адФ,), (9.5) которое следует из соотношения /сE, Ф) = I(S, Ф) — ЯE), и соот- соответствующего свойства квантовой взаимной информации I(S, Ф). Следующий идеальный случай позволяет прояснить соотношение между возможностью безошибочной передачи квантовой информа- информации, исправлением ошибок и когерентной информацией. Канал Ф называется обратимым на состоянии S, если найдется такой ка- канал Т>, что Fe(S, ?>оф) = 1. Согласно следствию из леммы 17, в этом случае V о Ф[5] = 5 для всех S с носителем supp S С supp S. Как мы увидим в следующей главе, это означает, что подпространство С = supp S «исправляет ошибку Ф». ТЕОРЕМА 17. Канал Ф обратим на состоянии S тогда и только тогда, когда /е(ЗФ) = ЯE). (9.6) Доказательство. Используем стандартные обозначения Q, R, Е для основной системы, эталонной системы и окружения, так что S — SQ. Имеем H(S) - ias, Ф) = H(sQ) + H(sE.) - H(sQ.) = = H(SR.) + H(SB.) - H(SR.B.) = I(R'; E>) > 0,
§ 9.3. КВАНТОВАЯ ПРОПУСКНАЯ СПОСОБНОСТЬ 109 где равенство достигается тогда и только тогда, когда I(R'\ E') = 0, то есть SWE, — SR, ® SE,. Отсюда можно получить достаточность условия (9.6), см. [13, п. 12.4.2]. Для доказательства необходимости используем цепное свойство когерентной информации. Имеем ЯE)^/Д5,Ф)^/сE,Х>оФ) = Я(Х>оФ[5])-ЯE,Х>оф). (9.7) Если канал Ф обратим на S, то V о Ф[5] = S. Более того, -^E,?>оф)= 1. Используя квантовое неравенство Фано, получаем H(S,Vоф) = 0. Поэтому правая часть (9.7) равна H(S), что и доказывает необходимость условия (9.6). § 9.3. Квантовая пропускная способность Перейдем к вопросу о квантовой пропускной способности. В принципе, эта величина может зависеть от выбора меры точности воспроизведения. Замечательно однако, что, как можно показать, квантовая пропускная способность канала нечувствительна к этому выбору, именно, она одинакова для Fe и F3. Для того, чтобы сформулировать определение квантовой пропускной способности, рассмотрим канал Ф®" в пространстве "№п — Н <%>... <8> ~Н. ОПРЕДЕЛЕНИЕ. Скорость R является достижимой при пе- передаче подпространств через канал Ф, если существует такая последовательность подпространств Н(п), что lim log dim H(n)/n = R, п—юо и последовательности каналов ?(п) из Н{п) в Wn (кодирования) и ?>(п) из Н®п в 7i(n) (декодирования), такие что Fs{VSn\ ?>(п) о ф®" о ?(")) -> 1, при п —> со. Точную верхнюю грань таких скоростей передачи обозначим <Э,(Ф). Определение. Скорость R достижима при передаче сцеп- ленности через канал Ф, если существует источник с энтропией R, т. е. такая последовательность состояний 5<п) в гильбертовых пространствах Wn\ что -ЯE<п)) R= lim n—» оо
110 Гл. 9. КВАНТОВАЯ ПРОПУСКНАЯ СПОСОБНОСТЬ и последовательности кодирований V{n) и декодирований ?(п), такие, что -Fe(S<n>, Х><") о Ф®" о ?<">) -> 1 при п —>оо. Точную верхнюю грань таких скоростей обозначим Из соотношения между мерами точности (лемма 17) вытекает, что <9,(Ф) ^ <Эе(Ф); в самом деле, предположим, что скорость R достижима при передаче подпространств и рассмотрим опера- оператор плотности 5(n) = /„(„/dim 7i(n). Тогда согласно лемме 17 R удовлетворяет и второму определению, и значит, достижима при передаче сцепленности. Труднее доказывается обратное неравен- неравенство <9е(Ф) ^ <9«(Ф)- Доказательство использует квантовый аналог леммы 2 об эквивалентности минимальной и средней ошибок при определении классической пропускной способности '\ Величина QA&) — Qe($) — Q№) и называется квантовой пропускной спо- способностью канала Ф. Получим принципиальную верхнюю границу для квантовой про- пропускной способности в терминах когерентной информации. Лемма 18. Для любого входного состояния S канала Ф и любого канала V справедливо неравенство H(S) ^ IC(S, Ф) + 2 + 4A - Fe(S, РоФ)) log d. Доказательство. Используя цепное неравенство для коге- когерентной информации и неравенство треугольника G.8), получаем H(S) - да Ф) ^ H(S) - ш v о ф) = Согласно квантовому неравенству Фано имеем Я(Х>оФ[5])^ \ + 2A - Fe(S,V о Ф)) log d. Комбинируя эти неравенства, получаем утверждение леммы. С помощью этой леммы можно доказать следующее утверждение. Теорема 18. = lim ^- '' Ватит Н., КпШ Е., Nielsen M. A. On quantum fidelities and channel capaci- capacities II IEEE Trans. Inform. Theory. — 2000. — V. 46. —P. 1317-1329; LANL Report no. quant-ph/9809010, Sep. 1998.
§ 9.3. КВАНТОВАЯ ПРОПУСКНАЯ СПОСОБНОСТЬ 111 Доказательство. Мы ограничимся доказательством более слабого утверждения: <2(ФК Km -maxIe{S,&noS). (9.8) п-*сю п s,e Заметим, что поскольку когерентная информация не удовлетворяет второму цепному неравенству, теорема не вытекает непосредствен- непосредственно из (9.8). Применяя лемму к n-кратному каналу, получим , 1><»>оФ<»>о?<»>)) log <Г. Пусть найдутся кодирования и декодирования ?(п), ?>(п), такие, что lim Fe(Si"\ ТХп> о Ф®" о ?(»)) = 1, 71 —» ОО тогда поделив это неравенство на п и взяв предел, с учетом того, что Fe —> 1, получим (9.8). Существует предположение, что квантовая пропускная способ- способность на самом деле равна верхней границе ??(Ф). Это еще одна из интересных и важных открытых проблем квантовой теории информации.
ГЛАВА 10 КВАНТОВЫЕ КОДЫ, ИСПРАВЛЯЮЩИЕ ОШИБКИ § 10.1. Постановка вопроса При передаче информации по каналу с шумом желательно иметь код, который был бы устойчив относительно ошибок. В классиче- классическом случае принципиальная возможность такого кодирования при скоростях передачи, меньших пропускной способности, вытекает из теоремы Шеннона. Однако эта теорема не дает конструктивного способа построения помехоустойчивого кода, и практическому ре- решению этой проблемы посвящена значительная часть исследований по теории информации. Самый прямой способ застраховаться от ошибок состоит в повторении сообщений (что, конечно, снижает скорость передачи). Пусть в алфавите есть всего два символа 0, 1. Предположим, что вероятность изменения одного бита в процессе передачи равна малой величине р, так что вероятность изменения двух битов р2 — пренебрежимо малая величина. Рассмотрим код 0 -* 00, 1 —> 11. Хотя этот код и исправляет некоторые ошибки, он имеет существенный недостаток: например, в ситуации 00—>01, 11 —>¦ 01 мы не можем сказать, какое сообщение было закодировано. Но от этого недостатка легко избавиться, если добавить еще один разряд: 0 —> 000, 1 —> 111. Такой код будет уже помехоустойчивым по отношению к любой ошибке в одном бите. Прямолинейное обобщение этого рецепта на квантовый случай наталкивается на трудность — квантовую информацию невозможно размножить. Кроме того, по самому существу квантовой инфор- информации, при передаче через канал с шумом безошибочно должны приниматься не только базисные состояния, но и всевозможные их суперпозиции. На первый взгляд, такая задача кажется неразреши- неразрешимой. Однако квантовый код, исправляющий ошибки, был построен независимо в работах Шора и Стина (см. [7, 16]). Многие авторы
§ 10.1. ПОСТАНОВКА ВОПРОСА 113 сделали вклад в последующее развитие теории, фрагменты которой представлены в этой главе, см. обзор в [13]. Следуя классической аналогии, рассмотрим сначала код Такой код исправляет «переворот бита», т. е. переход | 0)<-> | 1) в любом одном g-бите. Нас интересует произвольное состояние а\ 0) + Ь\ 1), которое при выбранном способе кодирования переходит в а\ 000) + Ь\ 111) . Пусть, например, произошла ошибка в первом д-бите: Состояния aj ООО)Ч-Ь| lll),a| 100)-hfe| 011) ортогональны, следова- следовательно их можно безошибочно различить. Однако такой код не исправляет «переворот фазы» типа 10)«-» <->| 0), | 1)<->—|1).В самом деле, в результате такой фазовой ошибки в одном бите получим а\ 000) — Ь\ 111) вместо а\ 000) + Ь\ 111), и эти состояния не ортогональны, т. е. безошибочно не различимы. Теперь заметим, что преобразование Адамара отображает переворот фазы в переворот бита и наоборот. Преоб- Преобразуя соответствующим образом код A0.1), получим код A0.2) который исправляет переворот фазы в любом одном g-бите, но не исправляет переворот бита. Код Шора, который исправляет как переворот бита, так и переворот фазы в одном д-бите, получается комбинированием кодов A0.1), A0.2) и требует 9 g-битов I 0)-»-ij(| 000)+ |111»(| 000)+ |111))(| 000)+ |111» A0.3) I 1> - фгЛ\ 000) - | Ш))(| 000) - 1111»(| 000) - 1111)) Оказывается, что этот код исправляет не только битовую и фа- фазовую, но любую ошибку, возникающую в результате применения произвольного канала в одном (любом) из g-битов. Прямая провер- проверка этого факта является трудоемким упражнением, см. [13], § 10.2.
114 Гл. 10. КВАНТОВЫЕ КОДЫ, ИСПРАВЛЯЮЩИЕ ОШИБКИ § 10.2. Общая формулировка Пусть S — произвольное состояние в гильбертовом пространстве Л4. Кодом называется изометрическое отображение V: A4—>Af, переводящее состояния S в кодирующие состояния VSV* в гиль- гильбертовом пространстве ЛГ. Система Л/" может быть подвержена ошибкам, которые описываются вполне положительными отобра- отображениями Ф в М удовлетворяющими условию Ф(/) ^ /, образую- образующими в каждой конкретной задаче некий класс ?. Итак, преобразования квантовой информации описываются диа- диаграммой S —» VSV* —> Ф(У5У*), Фе?. Определение. Код V называется кодом, исправляющим ошибки из ?, если существует такой восстанавливающий канал Ф, что A0.4) для любого состояния S и любого Ф е ?, где с(Ф) — некоторая постоянная, зависящая только от Ф. Замечания. l.Ha самом деле код можно задавать подпро- подпространством С — VМ. С Л/", не вводя явно Л4, V. 2. Множество ошибок обычно имеет следующую структуру: ФE) = ? visvi' ™e vi e Lin(B,,..., Вр), a Bj — операторы эле- 3 ментарных ошибок. Пример. Хранение квантовой информации в памяти квантового компьютера. Пусть N = Hfn — квантовый регистр, в котором предполагается хранить информацию из М. Рассмотрим ошибки, при которых изменению может подвергнуться не более т д-битов регистра. Соответствующее множество ?(п, т) состоит из отоб- отображений Ф = Ф, ® ... ® Фп, где количество отображений Ф^ ф Id не превышает т, причем ошибка в fc-м q-бите Фк может быть произвольным вполне положительным отображением. Оператора- Операторами элементарных ошибок в каждом q-бите могут служить матрицы Паули, причем ах описывает переворот бита, az переворот фазы, а ау — icrxaz — их комбинацию. Вместе с единичным оператором I, который соответствует отсутствию ошибки, они образуют базис в алгебре наблюдаемых д-бита.
§ 10.3. НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ 115 Пример Шора демонстрирует возможность исправления ошибок из ?(п, 1), если п достаточно велико (можно доказать, что наимень- наименьшее значение п для кода, исправляющего одну ошибку, равно 5). Возможность исправления только одной ошибки является, конечно, серьезным ограничением. Однако удалось показать, что существу- существуют коды, исправляющие ошибки из ?(п, т), где т может быть сколь угодно большим для достаточно больших размеров регистра п. Более того, была предложена принципиальная схема кванто- квантового компьютера, исправляющего ошибки не только в квантовой памяти, но и в самой схеме, исправляющей ошибки, при условии, что вероятность ошибки не превосходит некоторого порогового значения (fault-tolerant quantum computing) [2; 16]. Грубые оценки показывают, что квантовое устройство, способное решать задачи, недоступные классическому компьютеру, должно иметь регистр, насчитывающий 2000-3000 д-бит и порядка 10ю элементарных логических операторов, которые должны иметь уровень надежности порядка 10~13. Более реалистический уровень надежности 10~4 достаточен при использовании исправления ошибок, влекущем увеличение вычислительных ресурсов в и 100 раз [16]. В насто- настоящее время имеются экспериментальные установки, позволяющие оперировать с состояниями 2-3 д-битов. Это красноречиво свиде- свидетельствует о том, какой сложный и длинный путь предстоит пройти до практической реализации квантового компьютера. Однако не следует при этом забывать, что все многообразие современных средств обработки информации, в корне преобразившее мир, в котором мы живем, возникло в течение последнего столетия, а лежащие в его основе фундаментальные открытия были сделаны не ранее XIX-го века. § 10.3. Необходимые и достаточные условия исправления ошибок Пусть ? класс ошибок, имеющий структуру, описанную в заме- замечании 2. Теорема 191'. Следующие утверждения эквивалентны: 1) код С исправляет ошибки класса ?; '' Ср. Knill E., Laflamme R. Theory of quantum error-correcting codes // Phys. Rev. Д. —1997. —V. 55.—P. 900-911.
116 Гл. 10. КВАНТОВЫЕ КОДЫ, ИСПРАВЛЯЮЩИЕ ОШИБКИ р 2) код С исправляет ошибку Ф[5]= J2 BjSB3*> i = i 3) для р,фе? таких, что (<р\ф) — 0, имеет место (^\В'В^ф)=0 для всех г, j = 1,.. .,р; 4) для любого ортонормированного базиса {\ к)} в ? выпол- выполняются равенства (k\B'Bj\k) = (l\B;Bj\l), для всех к, I, (к\В;В;\1) = 0, длякф1- 5) Р^В^ = btjPc, где Рс—проектор на С. Доказательство. 1)=»2) очевидно. 2) =ф» 3). Пусть существует восстанавливающий канал Ф[5] = = J2RrSR* для ошибки Ф. Рассмотрим чистое входное состояние , \ф)еС. Тогда Но это возможно, лишь если ЯГВ^ ф) = cjT\ -ф) ( с = J2 Y11 ср\2)- т 3 Пусть | у>), | г/;) е ? два ортогональных вектора. Поскольку вос- восстанавливающий канал сохраняет след, то / = ]С^*^г! и значит 3) =ф> 4). Второе равенство очевидно, а первое получается из рассмотрения ортогональных векторов \p) = \k + l), | ^) = I ^ — 0- 4)=»5). Обозначая Ь(]. = (к\ В*В^\ к) мы можем записать условие 4 в виде {к\в;в,\1) = 8иЪу, что эквивалентно условию 5. 5)=Ф-1). Матрица \Ь^\ эрмитова положительна, поэтому найдется такая унитарная матрица [u{j], что где Аг ^ 0. Полагая В, = J2 и-,Вг имеем Ф[5] = ? Д.5В; и i
§ 10.4. АДДИТИВНЫЕ (СИМПЛЕКТИЧЕСКИЕ) КОДЫ 117 Таким образом, при As > 0 имеем где Us частично изометрические операторы, отображающие С на взаимно ортогональные подпространства Cs с Н. Пусть Ря — проектор на подпространство Сй, и обозначим Определим канал и покажем, что он является восстанавливающим для всех ошибок из ?. Поскольку линейная комбинация элементарных ошибок Bi является также линейной комбинацией операторов Вг, то, прини- принимая во внимание, что U*PsBrPc ~ АУ25ЯГР^, мы получаем A0.4) для произвольного Фе?. Задача 44. Проверьте выполнение условий 4) для кода Шора A0.3) и операторов элементарных ошибок, задаваемыми матрицами Паули в произвольном д-бите. § 10.4. Аддитивные (симплектические) коды Рассмотрим поле В = {0, 1} с обычными бинарными операциями сложения и умножения. Заметим, что правила умножения для матриц Паули 1 О О 1 0 1 1 О ст.. = О -» * О о. = 1 О О -1 могут быть записаны в форме канонических коммутационных соотношений Вейля на аддитивной группе В2 из 4-х элементов О = @,0), ж = A,0), у = A, 1), z = @, 1) с таблицей сложения + 0 X У z 0 0 X У z X X 0 Z У У У z 0 X z z У X 0
118 Гл. 10. КВАНТОВЫЕ КОДЫ, ИСПРАВЛЯЮЩИЕ ОШИБКИ Именно, вводя кососимметричную функцию Д с значениями д 0 X У z 0 0 0 0 0 X 0 0 -1 1 У 0 1 0 -1 Z 0 -1 1 0 имеем = /_,ЛДG.7') <W = l" (Ю.5) Отметим, что В2 может также рассматриваться как двумерное векторное пространство над полем В. Задача 45. Покажите, что форма A(f, 7') (mod 2) является билинейной и невырожденной на В2. Для системы из п g-битов положим f — (^х,...,-уп) & В2п и введем эрмитовы операторы сг(/) = а^ <8>.. .®сг", удовлетворяющие каноническим коммутационным соотношениям" °(д)сг(П, f,ge в2", где Д(/, 5) = AGi, 7i')+- • -+АG». 7,J) если 5 = Gi'i • • ¦» In)- Таким об- образом, В2" становится 2п—мерным векторным пространством над полем В, снабженным невырожденной симплектической формой Д(Л 9) (mod 2). Заметим, что операторы cr(g), cr(f) коммутируют (антикоммутируют) тогда и только тогда, когда Д(/, 5) = 0(mod 2), (соответственно Д(/, д)фО(mod 2)). Пусть ди...,дп-к—такие линейно независимые векторы из В2п, что Д(&, йу) = 0 (mod 2) для всех i, j. Тогда операторы а(д\)> "'(й'г)) • • ч а(9п-к) коммутируют между собой. Аддитивным кодом с проверочным операторами cr(g){,..., cr(g)n_k называется линейное подпространство ? = cr(9i)i> - У = 1, • •., п - к}. Легко видеть, что dim ? = 2*. Обозначим G (п — &)-мерное подпро- подпространство пространства В2п, порожденное векторами дх,..., дп_к. Отметим, что Д(/, д) = 0 (mod 2), f,geG.
§ 10.4. АДДИТИВНЫЕ (СИМПЛЕКТИЧЕСКИЕ) КОДЫ 119 Пусть ? — класс ошибок, порождаемый элементарными ошибка- ошибками <т(/), / € Е, где Е — некоторое подмножество В2п. В случае, когда ? = ?(п, тп) имеем Е — Е(п, m) = {g? В2п | wt(#) ^ m} , где вес wt(g) равен числу ненулевых компонент вектора д. Из кано- канонических коммутационных соотношений следует, что для любого вектора ф е С и ошибки ст(/), вектор ст(/)ф является собственным вектором проверочных операторов сг(<7,) с собственными значе- значениями (-1)Аа9'\ Совокупность этих значений образует синдром ошибки. Ошибки ст(/|), сг(/2) неразличимы, если их синдромы совпадают, т. е. Д(/п^.) = Д(/2, с/,) (mod 2), или /, - /2 € G1 = {/ G В2п | Д(/ 5) (mod 2) = 0, д е G} . Отметим, что в силу двоичной природы операций в В2п, fx — /2 со- совпадает с/i+/2- Ошибки эквивалентны, если fx-f2?G. Поскольку G с G1, эквивалентные ошибки неразличимы, но обратное, вообще говоря, неверно. Теорема 201'. Аддитивный код С исправляет ошибки клас- класса ?, если для любых двух ошибок ст(/,), сг(/2) либо 1) ошибки различимы, т. е. /, — /2 ^ G1, « в этом случае оператор cr(fl)a(f2) антикомму тир у em no крайней мере с одним проверочным оператором; либо 2) ошибки эквивалентны, т. е. /, - /2 € G, ив этсш случае оператор о"(/,)а(/2) пропорционален произведению проверочных операторов. Заметим, что условие теоремы может быть компактно записано как (E-E)r\(G1\G) = 0. Поскольку Е(п, т) — Е(п, т) = Е(п, 2т), отсюда следует, что если d — min {wt(g) | g G G1 \ G} , то данный код исправляет любые ошибки в т = Г из п д-битов. Доказательство. Проверим выполнение условия 3) теоре- теоремы 19. Пусть ф, ip — ортогональные векторы из С, и /,, /2 € Е. Если ошибки различимы, то векторы о-(/{)ф, cr(f2)tp являются собствен- собственными векторами проверочных операторов с различными наборами !) Ср. Calderbank A. R., Rains E. M., Shor P. W., Sloane N. J. A. Quantum error correction and orthogonal geometry // Phys. Rev. Lett. — 1997. — V. 78. — P. 404- 408.
120 Гл. 10. КВАНТОВЫЕ КОДЫ, ИСПРАВЛЯЮЩИЕ ОШИБКИ собственных значений и, следовательно, они ортогональны. Если они неразличимы, то по условию, должно выполняться /, — /2 е G, и в этом случае, используя канонические коммутационные соотно- соотношения, получаем = tAW-A>(V.k(/, - ДМ = хд<Л-'.>М?>> =0, поскольку <т(/, - /2) является произведением проверочных опера- операторов. Процедура исправления ошибок состоит из двух этапов: сначала производится измерение проверочных операторов, в результате чего находится синдром ошибки; после этого ошибка определятся с точностью до эквивалентности; применяя оператор ошибки, получаем исходное состояние. Задача 46. Убедитесь, что код Шора является аддитивным кодом с проверочными операторами ду = (z z 0 0 0 0 0 0 0) д2 = @ z z О 0 0 0 0 0) 9з = @ 0 0 z z 0 0 0 0) д4 = @ 0 0 0 z z 0 0 0) дъ = @ 0 0 0 0 0 z z 0) д6 = @ 0 0 0 0 0 0 г г) д7 — (х х х х х х 0 0 0) дь = @ 0 0 х х х х х х) Первые шесть операторов обнаруживают переворот бита, а по- последние два — переворот фазы в любом из блоков. Проверьте выполнение условий теоремы.
ПРИЛОЖЕНИЕ ДОКАЗАТЕЛЬСТВО МОНОТОННОСТИ ОТНОСИТЕЛЬНОЙ ЭНТРОПИИ Существует несколько доказательств монотонности относитель- относительной энтропии, и все они достаточно сложны. В серии работ1' Линдблад получил ряд последовательных обобщений свойства монотонности и в заключение показал, что это свойство равно- равносильно сильной субаддитивности квантовой энтропии, установ- установленной ранее Либом и Рускаи. В основе этого подхода лежат фундаментальные «теоремы вогнутости» Либа. Позднее Ульман дал другое доказательство, основанное на методе интерполяции (см. обзоры в [17; 14]). Ниже приводится новое доказательство, данное Лесьневским и Рускаи2), которое на наш взгляд, является наиболее прямым, и в конечном итоге, основано на некотором обобщении неравенства Коши — Буняковского. Это доказательство позволяет установить монотонность целого класса инвариантов пары состояний в квантовой геометростатистике, изучение которой было начато Морозовой и Ченцовым3). Пусть 5: и S2 невырожденные операторы плотности. Отно- Относительный модулярный оператор, ассоциированный с «S,,^, определяется соотношением A; q — L о Re , где L S2 и RSi операторы левого и правого умножения, соответствен- соответственно, так что As S(A) = S2ASli. Легко проверяется, что As s является положительным эрмитовым оператором в пространстве операторов Гильберта — Шмидта. ОПРЕДЕЛЕНИЕ. Пусть g операторно-выпуклая функция (см. [8]) на @, оо), такая что g(l) = O. Относительная g-энтропия опера- ') Lindblad G. Entropy, information and quantum measurements // Commun. Math. Phys. — 1973. — V. 33. — P. 305-322; Expectations and entropy inequalities for finite quantum systems // Commun. Math. Phys. — 1974. — V. 39. — P. 111-119; Completely positive maps and entropy inequalities // Commun. Math. Phys. — 1975. — V. 40. —P. 147-151. 2' Lesniewski A., Ruskai M. B. Monotone Riemannian metrics and relative entropy on non-commutative probability spaces // J. Math. Phys. — 1999. — V. 40. — P. 5702- 5724. 3* Морозова Е. А., Чениов Н. Н. Марковская инвариантная геометрия на многообразиях состояний // Итоги науки и техники. Современные проблемы математики. Новейшие достижения. — М.: ВИНИТИ, 1990. Т. 36. С. 69-102.
122 ДОКАЗАТЕЛЬСТВО МОНОТОННОСТИ ОТНОСИТЕЛЬНОЙ ЭНТРОПИИ торов 5,, 52 определяется соотношением Обозначим Q множество операторно-выпуклых функций, удов- удовлетворяющих этим условиям. Используя стандартные результаты из теории операторно-выпуклых и операторно-монотонных функ- функций [8], можно показать, что класс Q состоит из функций вида ^^, A1.1) о где b ^ 0 и v положительная мера на [0, оо), такая что На самом деле, для наших целей важно только то, что рассма- рассматриваемая функция g(w) допускает такое представление, и что функция g(w) = — log w, которой соответствует обычная относи- относительная энтропия Л,огE]; S2) = //"E,; 52), входит в этот класс. Легко проверяется, что ds. 9 1)» Теорема 21. Для любой функции g?Q имеет место соот- соотношение ,; 52) = ТгE2 - 5.) [bSr1] (S2 - 5,) + Tr [(S2-Sl)[LS2 + sRsXl(S2-Sl)) du(s). A1.2) о Доказательство. Заметим, что (Д^ - /)E,1/2) = (S2 - 5,Mf1/2 - RS,4S2 - St), A1.3) так что [^ 5,M,-'/2] =0,
ДОКАЗАТЕЛЬСТВО МОНОТОННОСТИ ОТНОСИТЕЛЬНОЙ ЭНТГОПИИ 123 так что линейный член в A1.1) не дает вклада. Для д = — (w— lJ/(ui + s), используя A1.3), находим ,; 52) = Sj,,_ (^ [ S, + si) - Полагая s = О, получаем Подставляя эти соотношения в A1.1), получаем A1.2). ТЕОРЕМА 22. Для любой функции д & Q относительная д-энтропия Hg(Sx\ S2) монотонна, т. е. для любого канала Ф. Доказательство вытекает из интегрального представления A1.2) и следующей теоремы Теорема 23. Для любого канала Ф и s ^ 0 выполнено неравенство Тг A*[RSi + sLsyA =ТгФ {[8i sJ^ ^ A1.4) Доказательство. Если 5,^0, то TrA*S]A ^ 0 и Тг A*ASX ^0, так что Ls и i?s являются положительными опера- операторами в пространстве операторов Гильберта — Шмидта. Поэтому, поскольку S2 ^0, оператор Rs +sLs также является положитель- положительным. Положим где В = [Дф^, + зЬф{32)]-1Ф(А). Тогда ТгХ*Х ^ 0, так что 1tA*[RSx + sLsy А -Тт А*Ф*(В) -ТтФ*(В*)А + 0. A1.5)
124 ДОКАЗАТЕЛЬСТВО МОНОТОННОСТИ ОТНОСИТЕЛЬНОЙ ЭНТРОПИИ Нетрудно проверить, что - Тг А'Ф'(В) - ТгФ'{В-)А = -2ТгФ(А*)[ДфE1) + зЬф{3г))-1Ф(А), поэтому утверждение будет доказано, если мы покажем, что последний член в A1.5) меньше или равен, чем правая часть A1.4). Имеем где неравенство следует из положительности S, и S2 и оператор- операторного неравенства которое имеет место для любого В, поскольку сохранение следа отображением Ф влечет Ф*(/2) =/,. Тогда, используя, например, соотношение ТгФ(В*ВM, —ТтВ*ВФC1), мы находим = Тг В*[ВФE,) + йФE2)В] = Тг В* = Тг В*
ЛИТЕРАТУРА 1. Галлагер Р. Теория информации и надежная связь. — М.: Сов. Радио, 1974. 2. К и т а е в А. Ю. Квантовые вычисления: алгоритмы и исправление ошибок // УМН. — 1997. —Т. 52, № 6.— С. 53-112. 3. Хелстром К. Квантовая теория проверки гипотез и оценивания. — М.: Мир, 1978. 4. X о л е в о А. С. Вероятностные и статистические аспекты квантовой теории. — М.: Наука, 1980. 5. X о л е в о А. С. Квантовая вероятность и квантовая статистика // Итоги науки и техники. Современные проблемы математики. Фундаментальные направления. — М.: ВИНИТИ 1991. 6. X о л е в о А. С. Квантовые теоремы кодирования // УМН. — 1998. —Т. 53, № 6. —С. 193-230. 7. Bennett С. Н., S h о г P. W. Quantum information theory // IEEE Trans. Inform. Theory. — 1998. — V. 44, № 6. — P. 2724-2742. 8. В h a t i a R. Matrix analysis. — New York: Springer-Verlag, 1997. 9. Cover Т. М., Thomas J. A. Elements of Information Theory. — New York: J. Wiley & Sons, 1991. 10. D a v i e s E. B. Quantum theory of open systems. — London: Academic Press, 1976. 11. Holevo A. S. Statistical Structure of Quantum Theory.— Berlin: Springer-Verlag, 2001. 12. Kraus K. States, Effects and Operations. — Berlin: Springer 1983. 13. Nielsen M. A., Chuang I. I. Quantum Computation and Quantum Information. — Cambridge University Press, 2000. 14. Ohya M., Petz D. Quantum Entropy and Its Use. — Berlin: Springer-Verlag, 1993. 14. Shannon С. Е., Weaver W. The mathematical theory of communication. — Univ. Illinois Press, Urbana 111., 1949;
126 ЛИТЕРАТУРА Имеется сокращенный перевод: Шеннон К. Статистическая теория передачи электрических сигналов // В кн.: Теория передачи электрических сигналов при наличии помех. — М.: ИЛ, 1953. С. 7- 87. 15. Steane A. Quantum computing // Rept. Progr. Phys.— 1978. —V. 61. —P. 117-173; LANL Report no. quant-ph/9708022, Sep. 1997. 16. W e h г 1 A. General properties of entropy // Rev. Mod. Phys. — 1978. —V. 50, № . 2. —P. 221-260.
НЕЗАВИСИМЫЙ МОСКОВСКИЙ УНИВЕРСИТЕТ ВЫСШИЙ КОЛЛЕДЖ МАТЕМАТИЧЕСКОЙ ФИЗИКИ СОВРЕМЕННАЯ МАТЕМАТИЧЕСКАЯ ФИЗИКА ПРОБЛЕМЫ И МЕТОДЫ Под редакцией А. И. Кириллова ВЫПУСК 5
НЕЗАВИСИМЫЙ МОСКОВСКИЙ УНИВЕРСИТЕТ ВЫСШИЙ КОЛЛЕДЖ МАТЕМАТИЧЕСКОЙ ФИЗИКИ А. С. ХОЛЕВО ВВЕДЕНИЕ В КВАНТОВУЮ ТЕОРИЮ ИНФОРМАЦИИ мцнмо МОСКВА • 2002
Холево А. С. 1 Введение в квантовую теорию информации. — М.: МЦНМО, 2002. —128 с. ISBN 5-94057-017-8. Пятый выпуск серии «Современная математическая физика. Проблемы и методы» посвящен изложению основных понятий и строгих результатов новой научной дисцип- дисциплины — квантовой теории информации. Возможности квантовых систем передачи и пре- преобразования информации проиллюстрированы на примерах сверхплотного кодирования, квантовой телепортации и квантовых алгоритмов. Рассматриваются энтропийные и ин- информационные характеристики квантовых систем. Подробно обсуждается понятие кван- квантового канала связи, его классическая и квантовая пропускные способности, а также пе- передача классической информации с помощью сцепленного состояния. Сформулировано несколько принципиальных открытых проблем, решение которых явилось бы существен- существенным вкладом в квантовую теорию информации. В лекциях приведены необходимые сведения из классической теории информации и дано подробное введение в статистическую структуру квантовой теории, поэтому для понимания лекций достаточно владения основными общематематическими дисциплина- дисциплинами.
ОГЛАВЛЕНИЕ Предисловие 7 Глава 1. Основные понятия классической теории информации . . 10 § 1.1. Энтропия случайной величины и сжатие данных 10 § 1.2. Пропускная способность канала с шумом 12 Глава 2. Состояния и наблюдаемые 18 § 2.1. Соглашения и обозначения 18 § 2.2. Квантовые состояния 19 § 2.3. Квантовые наблюдаемые 21 § 2.4. Составные квантовые системы 25 § 2.5. Парадокс ЭПР. Неравенство Белла 28 Глава 3. Применения сцепленных состояний 32 § 3.1. Квантовое состояние как информационный ресурс 32 § 3.2. Сверхплотное кодирование 34 § 3.3. Квантовая телепортация 35 § 3.4. Квантовые алгоритмы 38 Глава 4. Оптимальное различение квантовых состояний 43 § 4.1. Постановка задачи 43 § 4.2. Различение по максимуму правдоподобия 44 § 4.3. Максимум информации 49 Глава 5. Классическая пропускная способность квантового кана- канала связи 54 § 5.1. Формулировка и обсуждение квантовой теоремы кодирования . . 54 § 5.2. Квантовая энтропийная граница и доказательство обратной тео- теоремы 58 § 5.3. Доказательство прямой теоремы для канала с чистыми состояни- состояниями 60 § 5.4. Сжатие квантовой информации 64 Глава 6. Квантовые каналы 67 §6.1. Эволюции квантовой системы 67 § 6.2. Вполне положительные отображения 71 § 6.3. Определение канала 74 § 6.4. Каналы в Щ 77 Глава 7. Энтропийные характеристики квантовых систем .... 80 § 7.1. Квантовая относительная энтропия 80 § 7.2. Разложение Шмидта и очищение состояния 84
ОГЛАВЛЕНИЕ § 7.3. Энтропийная корреляция и условная энтропия 87 § 7.4. Обменная энтропия 88 § 7.5. Информационные количества 90 Глава 8. Передача классической информации с помощью сцеп- сцепленного состояния 94 Глава 9. Квантовая пропускная способность и когерентная ин- информация 103 § 9.1. Точность воспроизведения квантовой информации 103 § 9.2. Когерентная информация и обратимость канала 108 § 9.3. Квантовая пропускная способность 109 Глава 10. Квантовые коды, исправляющие ошибки 112 § 10.1. Постановка вопроса 112 § 10.2. Общая формулировка 114 § 10.3. Необходимые и достаточные условия исправления ошибок ... 115 § 10.4. Аддитивные (симплектические) коды 117 Приложение. Доказательство монотонности относительной энтропии . . 121 Литература 125