Текст
                    Дж. Прескилл
Квантовая информация
и квантовые вычисления
Том 1
Перевод с ашлийского
Нечаевой Т С
Под научной редакцией
Епифанова С С и Новокшонова С Г
Москва ♦ Ижевск
2008

УДК 22.314.1 ББК 517.958:530.145.6 П73 Издание осуществлено при финансовой поддержке Рос- сийского фонда фундаментальных исследований по про- екту №01-02-30013. Прескилл Дж. Квантовая информация и квантовые вычисления. Том 1. — М-Ижевск; НИЦ «Регулярная и хаотическая динамика»; Институт компьютерных ис- следований, 2008. — 464 с. Книга Дж. Прескилла, известного специалиста в области квантовых вычис- лений и квантовой информации, написана па базе одноименного курса, читаемого автором в КАЛТЕХе, и представляет собой подробное и всестороннее введение в эту новую, быстро развивающуюся область науки. На русском языке книга издается в двух томах. В нервом из них излагают- ся основы теории квантовой информации и квантовых вычислений: свойства, от- личающие квантовую информацию от классической; использование этих свойств для разработки систем безопасной передачи информации, квантовой телепортации, быстрых квантовых алгоритмов и другие вопросы. Ясный физический характер изложения делает книгу доступной для новичка в этой области, находящейся на стыке физики, математики, информатики и техно- логии. Она содержит необходимые для цонимавия основного материала сведения из квантовой механики, классической теории информации и основные понятия из классических теорий вычислений и сложности. Каждая глава завершается неболь- шой подборкой задач разного уровня, способствующих более глубокому усвоению материала. Для студентов, аспирантов, преподавателей и исследователей в области физи- ки, математики и информатики, интересующихся квантовой теорией информации и вычислений. ISBN 978-5-93972-651-1 ББК 22.314.1 © Дж. Прескилл, 1998 © Перевод на русский язык: НИЦ «Регулярная и хаотическая динамика», 2008 http://shop.rcd.ru http://ics.org.ru
Оглавление Предисловие к русскому изданию ............................... ю ЧАСТЫ. ЛЕКЦИИ 13 Глава 1 Введение и обзор........................... 15 1.1 Физика информации . ................15 1.2 Квантовая информация................. . . . 18 1.3. Эффективные квантовые алгоритмы. . ................20 1.4. Квантовая сложность .................................21 1.5. Квантовый параллелизм................ ... 25 1.6. Новая классификация сложности ... . . .28 1 7 Как насчет ошибок*’................... ... зо 1.8. Квантовые коды, корректирующие ошибки 35 1.9 Квантовое «железо»...................................40 1.9.1. Ионная ловушка................................ 41 1.9.2. КЭД-резонатор..................................43 1.9.3. ЯМР............................................44 1.10. Резюме............................................ 46 jif^AJBA 2. Основы I: Состояния и ансамбли.................. 47 2.1. Аксиомы квантовой механики.......................... 47 2-2. Кубит............................................... 50 2.2.1. Спнн-1/2...................................... 51 2.2.2. Поляризации фотона............................ 5g 2.3. Матрица плотности.......................... , 60 2.3.1. Бинарная квантовая система.....................60 2.3.2. Сфера Блоха................................... 65 2.3.3. Теорема Глизона ...............................67 2.3.4, Эволюция оператора плотности ... ... 69 2.4. Разложение Шмидта.................................. .70 2.4 1. Запутанность . . 73 2.5. Неоднозначноеib интерпретации ансамблей..............74
6 Оглавление 2.5 1. Выпуклость..................................... 74 2.5 2. Приготовление ансамбля..........................75 2.5.3. Быстрее света? .................................78 2.5.4, Квантовое удаление (информации).................80 2.5.5. Теорема ЖХЙВ .................................. 83 2.6 Резюме ............................................. 86 2.7 . Упражнения..........................................87 Глава 3 Основы П: Измерение и эволюция....................... 89 3.1. За пределами ортогональных измерений..................89 3.1.1. Ортогональные измерения.........................89 3.1.2. Обобщенные измерения............................93 3.1.3. Однокубитовая ПОЗМ..............................95 3.1.4. Теорема Наймарка................................96 3.1.5. Ортогональное измерение на тензорном произведении 98 3 1.6. ЖХЙВ с ПОЗМ...............................103 3.2. Супероператоры.......................................104 3.2.1. Представление операторной суммы..............104 3.2.2. Линейность.....................................108 3.2.3. Полная положительность..........................НО 3.2.4. ПОЗМ как супероиерагор ........................111 3.3 Теорема о представлении Крауса.......................113 3.4. Три квантовых канала.................................117 3.4.1. Деполяризующий канал...........................118 3 4.2. Канал затухания фазы...........................122 3.4.3. Канал затухания амплитуды......................125 3 5. Основное уравнение ................................. 128 3.5.1. Марковская эволюция............................128 3.5.2. Линдбладиан....................................131 3.5.3. Затухающий гармонический осциллятор........... 133 3.5.4. Затухание фазы.................................135 3.6. В чем проблема? (Здесь есть проблема?)...............138 3.7 Резюме ..............................................148 3 8. Упражнения...........................................149 Глава 4. Квантовое запутывание...............................153 4.1. Несепарабельность ЭПР-пар .......................... 153 4.1.1 Скрытая квантовая информация ...................153 4.1.2. Эйнштейновская локальность и скрытые переменные . 158 4.2, Неравенство Белла....................................160 4.2.1. Три квантовые монеты...........................160
Оглавление 7 4.2.2. Квантовое запутывание против эйнштейновской ло- кальности ...........................................164 4.3. Еще неравенства Бешй....................................168 Неравенство КГ1ПХ................................ .168 '4':Х2. Максимальное нарушение ......................169 4:3.3. Квантовые стратегии действуют лучше классических 171 4.3.4. Все запутанные чистые состояния нарушают неравен- ства Бедла...........................................174 4.3.5. Фотоны............................................175 4.3.6. Эксперименты и лазейки . 177 4.4. Использование запутывания ..............................179 4.4.1. Плотное кодирование............................. .180 4.4.2 Квантовая телепортация ... 182 4.4.3. Квантовая телепортация и максимальное запутывание 185 4.4 4. Квантовый программный продукт.....................188 4.5. Квантовая криптография..................................189 4.5.1. Распределение квантового ЭПР-ключа . . .189 4.5 2. Невозможностъкпонирования . 193 4.6. Многокомпонентное запутывание ... 195 4.6 1 Три квантовых ящика............................... 195 4.7. Упражнения..............................................202 Глава 5. Теория квантовой информации 214 5.1. Шеннон для «чайников».................................. 215 5.1.1. Энтропия Шеннона и сжатие данных..................215 5.1.2. Взаимная информация...............................218 5.1.3. Теорема о иодировании для канала с шумом . ... 220 5-2. Энтропия фон Неймана................................... 227 5.2.1. Математические свойства S(p) ... 229 5.2.2. Энтропия и термодинамика......................... 232 ‘5.3. Сжатие квантовых данных . . ......... ... 234 5.3.1. Сжатие квантовых данных: пример.................. 235 5.3.2. Кодирование Шумахера в общем......................239 5.3.3. Кодирование смешанного состояния информация Хо- лево ............................................ ... 243 5.4. Доступная информация ... .......................247 5.4.1. Граница Холево................................... 251 5.4 2. Улучшение различимости, метод Переса - Вутерса . 254 5.4.3. Достижимость границы Холево. чистые состояния . . 259 5.4 4, Достижимость границы Холево: смешанные состояния 262
8 Оглавление 5 4.5. Емкость канала связи...........................264 5.5. Плотность запутывания................................267 5.5.1. Запутывание смешанного состояния...............273 5.6. Резюме...............................................274 5.7. Упражнения...........................................276 Глава 6. Квантовые вычисления .... ..................280 6.1. Классические (вычислительные) схемы..................280 6 1.1. Универсальные вентили..........................280 6.1.2. Сложность схем.................................283 6.1.3. Обратимые вычисления...........................290 6.1.4. Компьютер бильярдных шаров.....................296 6.1.5. Экономия пространства..........................298 6.2. Квантовые схемы......................................302 6.2.1. Точность.......................................306 6.2.2. BQP С PSPACE ..................................309 6 2.3. Универсальные квантовые вентили..........311 6.3. Некоторые квантовые алгоритмы .......................320 6.4. Квантовый поиск в базе данных........................328 6.4.1. Оракул.........................................330 6.4.2. Итерация Гровера...............................331 6.4.3. Поиск одного из четырех........................332 6.4 4. Поиск одного из N..........................334 6.4 5. Множество решений .........................335 6.4.6. Осуществление отражения........................336 6.5. Оптимальность алгоритма Гровера......................337 6.6. Обобщенный поиск и структурированный поиск...........341 6.7 Некоторые задачи не допускают ускорения..............343 6 8 Поиск в распределенной базе данных...............347 6.8.1. Сложность квантовой связи .....................349 6.9. Периодичность....................................... 350 6.9.1. Отыскание периода..............................352 6.9 2. От FFT к QFT...................................356 6.10. Факторизация .......................................359 6.10.1. Факторизация как отыскание периода............359 6.10.2. RSA........................................’ ’ 364 6 11. Определение фазы....................................368 6.12. Резюме..............................................373 6.13. Упражнения......................................... 374
ОI ДАВЛЕНИЕ 9 ЧАСТЬ П. РЕШЕНИЕ УПРАЖНЕНИЙ 377 Решения упражнений к главе 2 . . . .......... 379 Решения упражнений к главе 3 388 Решения упражнений к главе 4 .......... 4Q6 Решения упражнений к главе 5..................... 434 Решения упражнений к главе 6 447
Предисловие к русскому изданию Физика квантовой информации и квантовых вычислений — новая, стремительно развивающаяся область науки, возникшая на ci ыке квантовой механики, современной математической физики и информатики Огромный интерес к ней во многом стимулируется захватывающими перспективами, которые обещает открыть реализация ее идей практически во всех областях человеческой деятельности, связанных с передачей, хранением и обработ- кой информации. За последние десять лет на русском языке было издано довольно мно- го книг, посвященных данной теме (см , например, [1-7]). Несмотря на это, ощущается некоторый дефицит учебной литературы по теории квантовых вычислений и квантовой информации, адресованной в первую очередь чи- тателю не математику в строгом смысле этого слова. Мы надеемся, что этот пробел может восполнить предлагаемый вашему вниманию курс лек- ций Дж. Прескилла, на протяжении более чем десяти лет читаемый авто- ром в Калифорнийском Технологическом Институте (КАЛГЕХе), одном из крупнейших мировых исследовательских и образовательных центров в об- ласти квантовых информационных технологий На русском языке khhi а вы- ходит в двух томах; второй том в настоящее время готовится к изданию Большая часть этого курса лекций была написана в конце 90-х юдов. Для столь бурно развивающейся отрасли науки это очень большой срок. Тем не менее книга Дж, Прескилла не утратила своего значения и по ряду причин до сих пор остается одним из базовых учебников по теории кван- товых вычислений и квантовой информации. Во-первых, автор постоянно работал над совершенствованием содержания этого курса лекций. В част- ности, по сравнению с иходным вариантом была серьезно переработана и дополнена четвертая глава, посвященная квантовому запутыванию. До- бавлена новая глава, посвященная квантовым топологическим вычислени- ям (войдет во второй том этой книги), теме, которой читатель не найдет ни в одной из вышедших до 2007 г. книг. Таким образом, курс Дж. Прескилла до сих пор остается одним из наиболее полных, отражающим практиче- ски все актуальные в настоящее время темы Во-вторых, автор довольно подробно и математически строго рассматривает рещение конкретных за-
Предисловии к русскому изданию 11 дач, но при доказательстве математических теорем и утверждений он, как правило, переходит на качественный язык, справедливо полагая, что физи- ку и инженеру гораздо важнее не уметь доказывать тонкие математические Теоремы, а правильно пользоваться ими. Это делает книгу привлекательной для читателя, не имеющего специальной математической подготовки Нако- нец, каждая глава данной книги сопровождается небольшим, но тщательно подобранным комплектом задач. Многие из них фактически представляют дальнейшее развитие теоретического материала. С исследованиями в области квантовых вычислений и квантовой ин- формации тесно связано возрождение интереса к старым принципиальным проблемам, таким как интерпретация квантовой механики, квантовая тео- рия измерений, корреляции в запутанных квантовых состояниях и другие В свое время по этим проблемам в физическом сообществе сформирова- лась FAPP-пригодная1 точка зрения и, хотя проблемы остались, научный интерес к ним стал угасать. Как следствие, в современных учебниках по квантовой механике, преследующих более прагматические цели, этим во- просам уделяется незаслуженно мало внимания. В этом отношении книг а Дж. Прескилла представляет приятное ис- ключение. Три ее главы (2-4) посвящены основаниям квантовой механики. После краткого введения в ее математический аппарат, автор детально об- суждает понятия и вопросы, имеющие непосредственное отношение к глав- ной теме книги. При этом в большинстве случаев его подход оригинален и открывает перед читателем новые аспекты казалось бы хорошо знако- мых проблем. Например, в стандартных курсах квантовой механики поня- тие матрицы плотности вводится аксиоматически. Дж. Прескилл выбирает физически более естественный путь. На простом примере он показывает, что к понятию матрицы плотности мы неизбежно приходим, пытаясь опи- ')ЙЙ|^'4Й&товомёханическое состояние доступной наблюдению части более широкой системы. Большое внимание в книге уделено теории квантовьгх измерений, как ортогональных (измерения фон Неймана), так и обобщенных. При этом ав- тор широко пользуется разложением единицы в гильбертовом пространстве физической системы (или ПОЗМ, положительной операторно-значной ме- рой), описывающим статистику результатов измерения В настоящее время ПОЗМ является одним из эффективных инструментов теории квантовых измерений, хотя в русскоязычной учебной литературе это еще не нашло достаточного отражения. Отдельная глава посвящена квантовому запутыванию несепарабель- ных двух- и многочастичных состояний, анализу возникающих в этих со- lFAPP — For All Practical Purposes, то есть для всех практических целей (Дж Белл).
12 ПР!.. IHCTOHHF К BV( ( КОМУ И i.l', Hili'- сгояииях квантовых корреляций, нарушающих леравенста Белла. и лру- 1нм связанным с зрим вопросам Интерес к ним возобновился в последние юлы. поскольку выяснилось, ню именно использование запутывание как ресурса позволяет хранить и передавать квантовую информацию, а также оперировать ею и обеспечивать зато iy or ошибок С 'ной точки зрения киша Дж. Прескилла может послужить прекрас- ным дополнением к любому стан, tap гному курсу квантовой механики. Все что позволяе! сказать, что книга Дж. Иреекилла представляет со- бой современный, оршинальный и досгагочпо полный курс лекций и будет полезна любому читателю, стремящемуся получить систематические зна- ния в области квантовых вычислений и квантовой информации. 1) Фишка квантовой информации, под ре,- Д Боумейстера, А. Экерта и А. Цайлим1сра. М.: Постмаркет (2002). 2', К.А. Валиев, А.А. Кокин. Квантовые компьютеры: надежда и реаль- ность. — Москва Ижевск: РХД (2004). 3i А .А. Кокни. Твердотельные квантовые компьютеры на ядерных спи- нах Москва-Ижевск: ИКИ-РХД (2004). 1; Г.П Берман. Г.Д. Дулей. Р Майньери. В.И. Цмфринович. Beeoemte в квантовые компьютеры. Москва Ижевск: ИКИ-РХД (2004). 5) М. Нильсен, И Чанг, Квантовые вычисления и квантовая информа- ция. - М.. Мир (2006). 6) А. Китаев, А. Шеяъ, М. Вялый. Классические и квинтовые, вычисле- ния. - М; МЦНМО ЧеРо (1999). 7) А.С. Холево, Введение в квантовую теорию информации. - М.: МИД МО (2002) С. i’ Новокшонов
Часть I Лекции
Глава 1 Введение и обзор Курс имеет свою web-страницу; http://www.theory.caltech.edu/people/preskill/ph219/ Здесь можно найти общую информацию, в том числе краткое содержа- ние курса и важные ссылки. К нашему предмету можно подойти с разных позиций, однако в этих лекциях будет принята точка зрения физика-теоретика (то есть моя точка зрения как физика-теоретика). Ввиду междисциплинарною характера пред- мета я осознаю, что студенты могут иметь самый разный уровень предвари- тельной подго говки, и буду стараться учитывать это в лекциях. Пожалуйста, сообщайте мне, если я буду пользоваться неизвестными вам понятиями. 1.1. Физика информации Почему физик преподаст курс информации? Дело в том, что по мень- шей мере несколько десятилетий физика информации и вычислений являет- ся общепризнанной дисциплиной. Это естественно. В конце концов, инфор- мация представляет собой нечто закодированное в состоянии физической системы; вычисление — нечто, что может быть выполнено реальным фи- зически осуществимым устройством. Поэтому изучение информации и вы- числений стоит связать с изучением лежащих в их основе физических про- цессов. Конечно, с технической точки зрения, владение принципами физики и материаловедения необходимо для совершенствования существующего вычислительного «железа» (Карвер Мид называет труппой «физики вычис- лений» свою исследовательскую группу в КАЛТЕХс, которая занимается разработкой чипов). С более абеграктной теоретической точки зрения, имеется несколько важных э тапов в развитии нашею понимания тою, как физика ограничива- ет возможность использовать информацию и оперировать ею. Например:
16 ГЛАВА 1 • Принцип Ландауэра. В 1961 году Рольф Лапдауэр показал. что уни- чтожение информации — это непременно диссипативный процесс1. В его представлении уничтожение всегда влечет за собой сокращение фазового объема и. следовательно, необратимо. Например, я могу хранить один бит информации, поместив единствен- ную молекулу в ящик слева или справа от разделяющей его перегород- ки. Уничтожение означает, что мы перемещаем молекулу, скажем, в левую часть, независимо от того, где она находилась сначала - слева или справа. Я могу внезапно удалить перегородку, а затем с помощью поршня медлен- но сжимать состоящий из одной молекулы «газ» до тех пор, пока молекула действительно не окажется на левой стороне. Эта процедура уменьшает эн- тропию газа на AS — к In 2 и сопровождается отводом соответствующею количества тепла из ящика в окружающее пространство. Исли этот процесс является изотермическим при температуре Т, то выполненная над ящиком работа VV = AT In 2 — эго работа, которую совершил я. Если я должен уничтожить информацию, то за это придется расплатиться энергией. • Обратимые вычисления. Логические элементы (вентили), исполь- зуемые для выполнения вычислений, обычно необратимы, например, ло- гический элемент NAND (НЕ И) (а, Ь) —> ->(« А 6) (1.1) имеет два входящих бита и один выходящий бит, по которому мы не мо- жем однозначно восстановить информацию на входе. Поскольку логиче- ским элементом уничтожается около (в среднем по его возможным входам) одного бита информации, то, в соответствии с принципом Ландауэра, для его функционирования необходимо затратить работу, как минимум равную И’ — AT In 2. Если мы имеем ограниченный запас энергии, возникает тео- ретический предел продолжительности выполнения вычислений. Однако в 1973 году Чарльз Беннет установил, что любые вычисления могут быть выполнены с помощью одних лишь обратимых операций, и. таким образом, в принципе нет необходимости ни в диссипации, ни в за- тратах энергии2. Фактически, мы можем создать обратимую версию логи- lR. Landaucr, Inevcrstbility and Heat Generation in the Computing Process, IBM J. Res. Develop., 3, 183, (1961): русский перевод в сборнике статей Квантовый компьютер и кван- товые вычислении под ред. li.A. Садовничего, Ижевск, РХД (1999), - Прим рва. гС.Н. BeaneO, Logical Reversibility of Computation, IBM J. Res Develop., 17, 525, (1973); русский перевод в сборнике шагей Квантовый компьютер и квантовые вычислении под ред. В.А. Садовничего, Ижевск, РХД (1999). Популярное обсуждение физических ограничений, накладываемых на процессы вычислений, а также реализации обратимых вычислений см. в статье Шарль Г. Бенне (он же Ча]1льз Г. Ьеннет), Рольф Ландауэр, Физические пределы вычислений, В мире науки №9. 24 (1985), перевод журнала Scientific American. — Прин. paJ
1.1. ФИЗИКА ИНФОРМАЦИИ 17 чесюго элемента NAND, который сохраняет всю входящую информацию, например, элемент Тоффоли (а,Ь,с) —» (а, Ь, сфаЛб) (1-2) является обратимым трехбитовым элементом, который «инвертирует» тре- тий бит, если первые дна принимают значение 1, и ничего не меняет в остальных случаях. Если с -= 1, то третий выходящий бит принимает логическое значение НЕ а И Ь. Заменяя логические элементы NAND эле- ментами Тоффоли, мы можем превратить необратимые вычисления в обра- тимые. В принципе эти вычисления могут быть выполнены с ничтожной диссипацией. Однако в этом процессе мы производим мною лишней информации Возникает вопрос: может быть, мы всего лишь отложили энергетические затраты и нам придется расплатиться, когда потребуется уничтожить весь этот хлам. Обращаясь к этой проблеме, Беннет указал, что обратимый ком- пьютер может выполнить вычисления до конца, распечатан, otbci (логиче- ски обратимая операция), а затем совершить все шаги в обратном направ- лении, чтобы вернуться к начальному состоянию. Эта процедура удаляет избыточную информацию без каких-либо энергетических затрат. Тогда в принципе нам не нужно тратить энергию для выполнения вы- числений На практике, используемые в настоящее время (необратимые) компьютеры рассеивают энергию, во всяком случае на порядки большую, чем кТ In 2 на один элемент, поэтому с технической точки зрения предел Ландауэра не существенен. Но, поскольку вычислительное «железо» про- должает сокращаться в размерах, преодоление предела Ландауэра может оказаться важным для предотвращения плавления деталей, и тогда обрати- мые вычисления могут' оказаться единственной альтернативой. • Демой Максвелла. Идеи Ландауэра и Беннета привели последнего в 1982 году к примирению демона Максвелла со вторым началом термоди- намики. Максвелл рассматривал газ в ящике, разделенном перегородкой на две части. Л и В В перегородке имеется заслонка, коюрой управляет де- мон Наблюдая за молекулами, приближающимися к заслонке, он пропуска- ет быстрые молекулы из А в В, а медленные — из В в А. Следовательно, А охлаждается, а В нагревается с пренебрежимо малыми затратами работы. Тепло без затрат переходит из холодной области в горячую, явно нарушая второе начало термодинамики. Решение Беннета состоит в том, что демон должен собирать и хра- нить информацию о молекулах. Если объем памяти демона ограничен, то он не может бесконечно продолжать охлаждение газа; в конце концов эта
18 ГЛАВА 1 информация должна быть удалена. В этот момент мы и рассчитываем- ся энергией за достигнутое охлаждение. (Если же демон не уничтожает свою запись или мы хотим сделать термодинамический расчет до ее уда- ления, то с записанной информацией следует связывать некоторую энтро- пию,)1 Во многом эти идеи были предвосхищены еще в 1929 году Лео Сци- лардом — настоящим пионером физики информации2, В своем анализе де- мона Максвелла Сцилард предложил понятие бита информации (само сло- во «бит» было введено позднее Тьюки) и связал энтропию AS — fc!n2 с приобретением одного бита (по-видимому, Сцилард не осознавал до конца принцип Ландауэра, согласно которому неизбежных затрат требует именно уничтожение бита информации). Эти примеры показывают; что работа на стыке физики и информации породила замечательные результаты, представляющие интерес как для фи- зиков, так и для исследователей в области вычислений, 1.2. Квантовая информация Итак, мы выяснили, что «информация материальна»3, поэтому поучи- тельно посмотреть, что говорит физика об информации, В своей основе Вселенная является квантово-механической. Как квантовая теория освеща- ет природу информации? Уже на заре квантовой теории должно было стать ясно, что в све- те повой физики классические идеи об информации требуют пересмот- ра. Например, щелчки, регистрируемые детектором, который следит за радиоактивным источником, описываются истинно случайным пуассо- новским процессом. Напротив, в детерминистской классической динами- ке нет места истинной случайности [хотя, конечно, поведение сложной Популярное изложение идей Беннета можно найти в статье Чарльз Г. Беннет, Демоны, двигатели и второе начало термодинамики, В мире науки №1, 52 (1988), перевод журнала Scientific American. Всестороннее обсуждение этих вопросов см. также в книге Б.Б. Кадомцев, Динамика и информация, редакция журнала УФН, М. (1999). — Прим, ред ^Классическая работа Сцилларда опубликована на немецком языке: L. Szilard, Uber die Entropieverminderung m Einem Thermodynamiscken System bei Etngriffen Intelligenter JVesen, Zeitschnft fur Physik, 53,840-856 (1929); на английском языке статья: L. Szilard, On the Decrease of Entropy in a Thermodynamic System by the Intervention of Intelligent Beings пубаиковалась по меныпей мере трижды (1964, 1983, 2003гг.) см., например, Maxwells Demon 2 Entropy. Classical and Quantum Information, Computing, Ed. by H.S. Leff and A.F. Rex, loP Publishing, Bristol, Philadelphia, (2003) pp. 110-119. — Прим, ped ’'Этот очень емкий тезис фактически представляет собой название статьи Р. Ландауэра: R. Landaucr, Information is physical, Phys. Today, May, 23- 29 (1991). — Прим. ped.
1.2. Квантовая информация 19 (хаотической) системы может быть практически неотличимо от случай- ного]. Болес того, в квантовой теории некоммутирующие наблюдаемые не могут одновременно иметь точно определенные значения (принцип неопре- деленности). Фактически измерение одной наблюдаемой А неизбежно вли- яет на результат последующего измерения наблюдаемой В, если А и В не коммутируют. Следовательно, процесс получения информации о физиче- ской системе неизбежно возмущает ее состояние. В классической физике не существует подобного ограничения. Компромисс между получением информации и возмущением состоя- ния системы тесно связан с квантовой случайностью. Поскольку результат измерения несет в себе элемент случайности, мы не можем извлечь из него информацию о начальном состоянии системы. То, что получение информации является причиной возмущения, также связано с другим существенным различием между квантовой и классиче- ской информацией: квантовую информацию нельзя воспроизвести с абсо- лютной точностью (принцип невозможности клонирования, анонсирован- ный Вутерсом и Зуреком, а также Диксом в 1982 году). Если бы мы могли сделать точную копию квантового состояния, то мы могли бы измерить наблюдаемую данной копии, не нарушая состояние оригинала и отменяя тем самым принцип возмущения. С другой стороны, ничто не мешает нам точно копировать классическую информацию (прия тное свойство, дающее возможность засорять жесткие диски). Эти свойства квантовой информации существенны, но особенно се- рьезный аспект, отличающий квантовую информацию от классической, вы- яснен в работе Джона Белла в 1964 году. Он показал, что никакая локальная теория скрытых параметров не может воспроизвести предсказания кванто- вой механики. Согласно Беллу, квантовая информация может быть зако- дирована (и фактически закодирована) в нелокальных корреляциях меж- ду различными частями физической системы, в корреляциях, не имеющих классического аналога. Я еще вернусь к теореме Белла в этой лекции, но детально мы обсудим ее позднее. Изучение квантовой информации как последовательной дисциплины началось в 1980-х и достигло расцвета в 1990-х гг. Многие из основных результатов теории классической информации имеют квантовые аналоги, которые были обнаружены и разработаны в последнее время. Некоторые из них мы обсудим в этом курсе, включая сжатие квантовой информации, пределы классической информации, закодированной в квантовых системах, пределы квантовой информации, надежно пересылаемой по квантовому ка- налу с помехами (шумом).
20 Глава 1 1.3. Эффективные квантовые алгоритмы Учитывая то, что квантовая информация обладает множеством необыч- ных свойств, можно было ожидать, что квантовая теория окажет глубокое влияние на наше понимание вычислений Но то, что это действительно так, для многих из нас явилось как гром среди ясного неба, произведенный Пи- тером Шором в апреле 1994 года [специалист по вычислительной технике AT&T (Американ Телефон энд Телеграф) и выпускник КАЛТЕХа]. Шор показал, что, по крайней мере в принципе, квантовый компьютер может эффективно факторизовать большое число 1. Факторизация (поиск простых множителей составного числа) является примером трудно разрешимой задачи, обладающей следующими свойства- ми — Найденное решение можно легко проверить. — Но найти это решение сложно То есть, если р и q — большие простые числа, произведение п — pq может быть вычислено быстро (необходимое число элементарных опера- ций примерно равно log2 р log2 q). Но при заданном п найти р и q очень сложно. Время, необходимое для поиска множителей, твердо считается (хо- тя эго никогда не было доказано) суперполиномиальным по logn. То есть с ростом п необходимое время растет, как минимум, быстрее любой степе- ни logn. Наиболее известный алгоритм факторизации («решето числового поля») требует time ~ exp [cQnnj'^flnlnn)2^3], (1.3) где с = (64/9)V3 ~ 1,9. Текущее состояние дел таково, что 65-разрядные множители 130-разрядного числа могут быть найдены в течение одного месяца сетью сотен процессоров. Используя это для оценки префакгора в уравнении (1.3), мы найдем, что факторизация 400-разрядного числа по- гребовала бы 1О10 лет, что равно возрасту Вселенной. Итак, даже с учетом существенного развития технологии, факторизация 400-разрядного числа в ближайшее время останется недоступной. Проблема факторизации интересна с точки зрения теории сложности, как пример задачи, которая считается трудно разрешимой; то есть задачи, Полная версия статьи: Р. Shor, Pohnomial-Time Algorithms for Pnme Factorization and Discrete Logarithms on a Quantum Computer, SIAM 1 on Computing, 26, 1484 (1997); русский перевод в сборнике статей Квантовый компьютер и квантовые вычисления под ред, В.А. Садовничего, Ижевск, РХД (1999). — Прим ред
1,4, Квантовая сложность 21 которая не может быть решена за время, полиномиально зависящее от дай- ны входящею сигнала, в данном случае от log п. Она также имеет и прак- тическое значение, поскольку сложность факторизации лежит в основе си- стем шифрования с открытым ключом, например, широко используемой схемы RSA1. Новый волнующий результат, полученный Шором, состоит в том, что квантовый компьютер может выполнять факторизацию за полиномиальное время, например, за время тг)3(. Таким образом, если бы у нас был квантовый компьютер, который мог бы факторизовать 130-разрядное число за один месяц (конечно, у нас его нет, пока по крайней мере!), то, следуя ал- горитму Шора, оп смог бы факторизовать 400-разрядное число менее, чем за три года. Чем сложнее задача, тем большим преимуществом обладает квантовый компьютер. Результат Шора пробудил мой собственный интерес к квантовой ин- формации (если бы не Шор, не думаю, что я преподавал бы этот курс). Очень приятно размышлять о проблемах, требующих знания теории слож- ности, квантовой теории и прикладных наук. 1.4. Квантовая сложность Конечно, работа Шора имела серьезную предысторию. На то, что кван- товая система может выполнять вычисления, было впервые явно указано Полем Бениоффом и независимо Ричардом Фейнманом в 1982 году2. В из- вестном смысле интерес к этой проблеме был понятен, принимая во внима- ние неуклонную тенденцию миниатюризации в микросхемотехнике. Если эта тенденция будет продолжаться, мы неизбежно приблизимся к режи- му, в котором квантовая теория исключительно важна для функциониро- вания вычислительных устройств. Возможно, это наблюдение обеспечило некоторую мотивацию после работы Бениоффа. Однако главная мотивация Фейнмана была совершенно иной и весьма ин гересной. Чтобы понять точ- ку зрения Фейнмана, необходимо более точное математическое описание квантовой информации и квантовых вычислений. Неделимой единицей классической информации является бит: объект, который может принимать любое из двух значений: 0 или 1. Соответству- 'R. Rivest, A. Shamir, L. Adleman. — Прим, ред ‘>Р. Benioff, Quantum-Mechanical Hamiltonian Models of Turing Machines, J. StaL Phys., 29, 515, (1982); R.P. Feynman, Simulation Physics with Computers Ini. J. Theor. Phys., 21, 4f>7 (1982): русские переводы в сборнике статей Квантовый компьютер и квантовые вычисления под ред. В,А. Садовничего, Ижевск, РХД (1999). Впервые идея квантовых вычислений была выдвинута Ю.И, Маниным именно в связи с большей информационной емкостью квантовых систем См. Ю.И. Манин Вычислимое и Невы числимое, Сов Радио, М., 1980, Прим. ред.
Глава 1 ющая единица квантовой информации квантовый бит или кубит Кубит представляет собой вектор в двумерном комплексном векторном простран- стве со скалярным (внутренним) произведением; из уважения к классиче- скому биту будем называть элементы ортонормированного базиса в этом пространстве 10) и |1). Тогда нормированный вектор может быть представ- лен в виде; Ф — аЮ) + ф), |а|2 + |b[2 = 1, (1.4) где и. b е С, Мы можем выполнить измерение, которое проецирует на базис j0), (1), Результат такого измерения не детерминирован — вероят- ность гою, что в итоге мы получим (0), равна |п|2, а вероятность того, что мы получим |1), равна |ф. Квантовое состояние Аг кубитов можно изобразить вектором в 2л’-мер- ном пространстве, В качестве ортонормированного базиса в этом простран- стве можно выбрать состояния, в которых каждый кубит имеет' определен- ное значение |0) или |1). Их можно обозначить двоичными последователь- ностями чисел, такими как; 101110010...1001). (1.5) Произвольный нормированный вектор разлагается в данном базисе как 2>-_. ас~О где каждой двоичной последовательности сопоставяется номер, равный со- ответствующему ей числу в двоичной системе счисления и изменяющийся в пределах от 0 до 2N — 1. Здесь величины а, комплексные числа, удо- влетворяющие условию = 1. Если мы измеряем все N кубитов, (К проецируя каждый из них на базис {|0), |1)}, то вероятность получения результата |г) равна |<ф2. Итак, квантовое вычисление можно описать следующим образом. Мы собираем N кубитов и готовим их в стандартном начальном состоя- нии, таком как |0) |0) |0) ф0) или [ж 0), Затем применяем к ним уни- тарное преобразование U. (Преобразование U сконструировано как произ- ведение стандартных квантовых логических вентилей, унитарных преоб- разований, которые действуют лишь на несколько кубитов одновременно). После применения U мы измеряем все кубиты путем проецирования на базис {|0>, |1)}. Итогом измерения является результат вычисления. Таким образом, окончательным результатом является классическая информация, которая может быть распечатана на листе бумаги и опубликована в журна- ле «Физики Ревью» (Physical Review).
1,4. KBAH'I <> ПАЯ сложи о стъ 23 Обратите внимание па го, что реализованный квантовым компьюте- ром алгоритм является вероятностным. То есть мы можем выполнить одну и iy же операцию дважды и, вследствие случайности процесса квантового измерения, получить разные результаты. Фактически, квантовый алгоритм порождает распределение вероятностей возможных результатов. (В дей- ствительности алгоритм факторизации Шора не гарантирует успеха в полу- чении простых множителей: он достигает цели лишь с определенной веро- ятностью. Однако этопг достаточно. поскольку легко проверить, верны ли найденные множители). Из данного описания должно быть ясно, что квантовый компьютер, в отличие от классического, должен будет работать в соответствии с дру- гими физическими принципами. Тем не менее он не сможет сделать ни- чего сверх того, что может делать классический компьютер. Классические компьютеры могут хранит!, векторы, вращать их и моделировать процесс квантового измерения, проецируя векторы па взаимно ортогональные оси. То есть классический компьютер, несомненно, может сколь угодно точно имитировать (моделировать) квантовый компьютер. Паше представление о том, что является вычислимым, не зависит от того, пользуемся мы клас- сическим или квантовым компьютером. Но мы должны считаться с тем, как много времени занимае т это моде- лирование. Предположим, у нас есть компьютер, который оперирует с уме- ренным количеством кубитов, например, N — 100. Тогда, чтобы предста- вить типичное квантовое состояние компьютера, нам пришлось бы запи- сать 2Л = 210С Ю30 комплексных чисел! Ни один из существующих или будущих цифровых компьютеров не сможет сделать этого. А выполнение произвольного поворота вектора в пространстве размерности Ю30 находит- ся далеко за пределами вычислительных способностей любого мыслимого классического компькмера. (Конечно, N классических битов тоже мотут принимать 2N возмож- ных значений. Но полное описание конфигурации каждого из них очень просто это двоичная последовательность длиной N. Квантовая информа- ция отличается тем, что полное описание даже одной типичной конфигура- ции N кубитов очень сложно). Итак, классический компьютер действительно может имитировать квантовый, но с ростом числа кубитов N имитация становится крайне неэффективной. Квантовая механика сложна (с точки зрения вычисле- ний), потому что мы должны работать с огромными матрицами — гиль- бертово пространство слишком велико. Это наблюдение привело Фейнмана к предположению, что квантовый компьютер может оказаться способным выполнять определенные задания, недосятасмые для любого возможного
24 Глава 1 классического компьютера (квантовому компьютеру не нужно моделиро- вать самого себя!). Похоже, что результат Шора поддерживает эту точку зрения. Так ли неизбежен этот вывод? В конце концов, моделирование должно предоставить способ определения вероятностей всех возможных результа- тов окончательного измерения. При классическом моделировании совсем нс обязательно следовать полному описанию квантового состояния N ку- битов. Нас вполне устроил бы классический вероятностный алгоритм, ре- зультаты которого не определяются однозначно входом, а возникают в соот- ветствии с тем распределением вероятностей, которое генерируется кванто- вым вычислением. Мы могли бы рассчитывать на выполнение локального моделирования, при котором каждый кубит в каждый момент времени име- ет определенное значение, а каждый квантовый вентиль может действовать на кубиты различными возможными способами, которые определяются ге- нератором (псевдо-) случайных чисел. Такое моделирование было бы го- раздо проще, чем описание эволюции вектора в экспоненциально огромном пространстве. Однако вывод теоремы Джона Белла однозначно говорит о том, что такое моделирование осуществить невозможно: не существует локального вероятностного алгоритма, способного воспроизводить результаты кван- товой механики. Таким образом, хотя доказательство этого отсутствует, ка- жется весьма правдоподобным, что моделирование квантовою компьютера является очень сложной задачей для любого классическою компьютера. Чтобы лучше понять, почему математическое описание квантовой ин- формации с необходимостью такое сложное, представим квантовую систе- му ЗА’ кубитов (A > 1), состоящую из трех подсистем по N кубитов каждая (называемых подсистемами (1), (2) и (3)) Мы случайным образом выбираем квантовое состояние ЗА кубитов, а затем разделяем три подси- стемы, отравляя (1) в Санта-Барбару, (3) - в Сан-Диего, в то время как (2) остается в Пасадене. Теперь мы бы хотели произвести некоторые измере- ния, чтобы как можно больше узнагь о квантовом состоянии. Чтобы облег- чить себе задачу, представим, что мы имеем огромное количество копий состояния системы, поэтому мы можем измерить любую из них, а так- же какие угодно наблюдаемые’. Но при одном условии: нам разрешено выполнять измерения лишь внутри одной из подсистем — коллективные измерения, снимающие границы между подсистемами, запрещены. Тогда для типичного состояния системы ЗА кубитов наши измерения почти ни- ]Мы не можем сделать копии неизвестного квантового состояния сами, но можем попро- сигь приятеля приготовить множество идентичных копий состояния (он эго может, потому чго знает, что делать) и не сообщать нам о том, что он сделал.
1.5. Квантовый параллелизм 25 чего о нем не скажут. Почти вся информация, отличающая одно состо- яние от другого, содержится в нелокальных корреляциях между результа- тами измерений в подсистемах (1), (2) и (3). Это и есть те самые нело- кальные корреляции, которые Белл считал важнейшей частью физического описания. Мы увидим, что объем информации можно определить количественно с помощью энтропии (большая энтропия подразумевает незначительную информацию). Если мы.выбираем состояние 3JV кубитов случайно, то по- чти всегда находим, что энтропия каждой подсистемы очень близка к (1.7) результат, полученный Доном Пейджем. Здесь N максимально возмож- ное значение энтропии, соответствующее случаю, в котором подсистема во- обще ис несет доступной информации. Таким образом, рассматривая каж- дую подсистему независимо, при большом N мы можем иметь доступ лишь к экспоненциально малому количеству информации. То есть измерения дают очень мало информации, если мы не учитываем корреляции результатов, полученных в Сан-Диего, Пасадене и Санта-Барбаре. В терминологии, которой я пользуюсь, измерение кор- реляции считается «коллективным» измерением (даже если бы фактически оно было выполнено экспериментаторами, которые наблюдали разные ча- сти одной и той же копии состояния, а затем созвонились, чтобы сравнить свои результаты). Измеряя корреляции, мы можем узнать намного больше; в принципе мы можем полностью реконструировать состояние. Любое удовлетворительное описание состояния 3jV кубитов должно характеризовать эти исключительно сложные нелокальные корреляции. Вот почему классическое моделирование большой квантовой системы требует тройных ресурсов. (Когда подобные нелокальные корреляции существуют между частями системы, мы говорим, что части «запутаны», имея в виду то, что мы не можем полностью расшифровать состояние системы путем ее деления и изучения отдельных частей). 1.5. Квантовый параллелизм В 1985 году Дэвид Дойч придал идее Фейнмана более конкретную форму. Дойч подчеркнул, что квантовый компьютер может лучше всего ре- ализовать свой вычислительный потенциал, осуществляя то, что он назвал «квантовым параллелизмом»1. Чтобы понять, что это означает, лучше всего рассмотреть пример. 'D. Deutsch, Quantum Theory, the Church-Turing Principle and the Universal Quantum Computer, Proc. Roy Soc., London, A400, 97 (1985), русский перевод в сборнике статей Кван-
26 ГЛАВА 1 Следуя Дойчу, представим черный ящик, вычисляющий функцию, ко- торая преобразует один бит х в один бит f(x). Мы нс знаем, что проис- ходит внутри ящика, но это должно быть нечто сложное, потому чго вы- числение занимает 24 часа. Существует четыре возможные функции f(x) [поскольку каждая из /(0) и /(1) может принять одно из двух возможных значений], и мы бы хотели знать, что вычисляет ящик. Вычисление обеих функций /(0) и /(1) заняло бы 48 часов. Но мы не располагаем таким временем; нам нужен ответ через 24 часа, а не через 48. И пусть нас даже устроило бы знание того, является f(x) постоянной [/(0) — /(1)] или сбалансированной [/(0) / /(!)]'. Но даже в этом случае получение ответа займет 48 часов. Теперь представим квантовый черный ящик, вычисляющий f(r) Ко- нечно, fix) может быть необратимой, в то время как действие квантовою компьютера унитарно и должно быть обратимым, поэтому нам понадобится преобразование Uf, трансформирующее два кубита в два: и! |я}|р) “» |^>|у©7(я))- (1.8) (Этот механизм инвертирует второй кубит, если действие f на первый ку- бит дает 1, и ничего пе делает, если действие f на первый кубит дает 0.) Мы можем определить, является ли f(x) постоянной или сбалансирован- ной, использовав квантовый черный ящик дважды. Но получение одного результата по-прежнему занимает сутки, поэтому такой способ не годится. Можем ли мы подучить ответ (за 24 часа), воспользовавшись квантовым черным ящиком лишь раз? (Это так называемая «Задача Дойча»). Так как черный ящик является квантовым компьютером, мы можем вы- брать в качестве входящего состояния суперпозицию |0) и |1). Если второй кубит приготовлен в начальном состоянии -^=(|0) — |1}), то (7/:|х)-^(|0)Я1)) ^|х)-Ь(]/(ж))-|1Ф/(а;))) = (1.9) то есть функция f оказывается локализованной в зависящей от х фазе. лювый компьютер и квантовые вычисления под ред. ВЛ. Садовничего, Ижевск, РХД (1999), Прим. per). '’Эгот несколько необычный термин обозначает, чго два различных значении функ- ции /(ж) сбалансированы, то есть каждое из них соответствует ровно половине значений аргумента х.. - Прим ред
1.5. Квантовый параллелизм 27 Теперь предположим, что первый кубит приготовлен в начальном состоя- нии 4 IV)- Тогда черный ящик действует следующим образом: u}. 4=(i«>+ii»^o°> -11» ХГ(_1)Л°)|0Н (~i/w|i)]^(|o>-|i))- (1.Ю) v 21 v 2 Наконец, мы можем выполнить измерение, проецирующее первый кубит на базис 1±> = -^(|0>±|1». (1.11) V “ Очевидно, что мы всегда будем получать |—), если функция /(а?) сбаланси- рованная, и — |+), если она постоянна1 Итак, мы решили задачу Дойча, а также нашли разницу между тем, что доступно классическому компьютеру, а что квантовому Классическому компьютеру придется воспользоваться черным ящиком дважды, чтобы от- личить сбалансированную функцию от постоянной, а квантовый компьютер выполняет это задание за один раз! Это возможно, потому что квантовый компьютер не ограничивается вычислением только /(0) или /(1). Он может действовать на суперпози- цию (0) и |1), извлекая таким образом «глобальную» информацию о функ- ции, информацию, которая зависит и от /(0), и от /(1). Это и есть кванто- вый параллелизм. Теперь предположим, что нас интересуют глобальные свойства функ- ции, которая действует на N битов, функции, зависящей от 2Л' возможных аргументов. Чтобы вычислить полную таблицу значений /(ж), нам при- шлось бы считать / 2,v раз, что совершенно невозможно при Лт >> 1 (например, Ю30 раз для N — 100). Но с квантовым компьютером, действу- ющим в соответствии с I/, : |х)|0) -» |х)|/(я:)), (1.12) мы могли бы выбрать следующее состояние входного регистра: W 2n-1 'В предыдущем описании квантовых вычислений мы говорили, что окончательное изме- рение проецирует каждый кубит на базис {|0), |1)}, но здесь мы допускаем возможность измерения в другом базисе. Чтобы описать эту процедуру в старом базисе, необходимо перед окончательным измерением применить к каждому кубиту подходящее унитарное преобразо- вание.
28 Глава 1 и, вычислив /(ж) только один раз, генерировать состояние: 2N-1 £ НЖ (1.14) В этом состоянии закодированы глобальные свойства /, и мы могли бы извлечь некоторые из них, если бы только смогли придумать для этого эф- фективный способ. Это квантовое вычисление демонстрирует «массовый квантовый па- раллелизм», имитация подготовки такого состояния на классическом ком- пьютере потребовала бы от нас вычислять f невообразимо огромное коли- чество раз (для N >> 1). Тем нс менее с помощью квантового компьютера мы сделали это в одип заход. Это именно тот тип массового параллелизма, который был осуществлен Шором в его алгоритме факторизации. Как было отмечено ранее, характерной чертой квантовой информации является то, что она может быть закодирована в нелокальных корреляциях между разными частями физической системы. Действительно, этот случай отображен в уравнении (1.14); свойства функции f хранятся в корреляциях между «входным регистром» и «выходным регистром» квантового компью- тера. Однако не так просто расшифровать эту нелокальную информацию. Например, если бы я измерил входной регистр, то получил бы резуль- тат |ж0), где ж0 совершенно случайным образом выбрано из 2N возможных значений. Такая процедура приготовила бы состояние Ы|Л>о))- (1-15) Мы могли бы перейти к измерению выходного регистра, чтобы получить значение /(ж0). Но у нас нет возможности определить /(у0) для любого У о 7 посредством дальнейших измерений, поскольку уравнение (1.14) разрушено предыдущим измерением и сложные корреляции между реги- страми утеряны. Следовательно, в этом случае квантовое вычисление не дает преимущества перед классическим Урок, полученный при решении задачи Дойча, состоит в том, что ис- пользование закодированных в уравнении (1.14) корреляций иногда гребует изобретательности Искусство создания квантовых алгоритмов во многом заключается в поиске способов эффективного использования нелокальных корреляций. 1.6. Новая классификация сложности Компьютер на вашем рабочем столе не является квантовым, по все же это замечательное устройство: в принципе, он способен выполнить любое мыслимое вычисление. Но в действительности существуют вычисления,
1.6. Новая классификация сложности 29 которые вы не можете выполнить, вам не хватает либо времени, либо па- мяти. Но если объем вашей памяти неограничен и вы согласны ждать столь- ко, сколько потребуется, тогда все, что достойно называться вычислением, может быть выполнено вашим маленьким ПК. Поэтому мы называем его «универсальным компьютером». Классическая теория сложности изучает, какие задачи являются слож- ными, а какие простыми. Обычно понятия «сложная» и «простая» опреде- ляются количеством необходимых времени и/или памяти. Но как придать смысл различию между простым и сложным, не описав аппаратные сред- ства, которые мы будем использовать? Задача может быть сложной для ПК, но, наверное, я смог бы разработать устройство специального назначения, которое смогло бы решить ее горазда быстрее. А может быть в будущем по- явится более совершенный универсальный компьютер, способный решить эту задачу гораздо эффективнее. Действительно имеющие смысл различия между сложным и простым должны быть универсальными — они не долж- ны зависеть от того, какое устройство мы используем. Теория сложности главным образом обращает внимание на различие между алгоритмами, выполняемыми за «полиномиальное время» и за «экс- поненциальное время». С любым алгоритмом А, действующим на вход пе- ременной длины, можно сопоставить функцию сложности ТА(ЛГ), где N — длина входа в битах. ТА(1^} представляет собой максимальное «время» (то есть количество элементарных операций), необходимое для полного вы- полнения алгоритма для любого входа из N битов. [Например, если Л — алгоритм факторизации, то ТЛ(ЛТ) — время, необходимое для факториза- ции Х-битового числа в худшем случае.] Мы говорим, что А выполняется за полиномиальное время, если Ta(N) < Ро1у(ЛГ), (1.16) где Poly(TV) обозначает полином от переменной N. Следовательно, поли- номиальное время означает, что необходимое для решения задачи время растет не быстрее степени количества входящих битов. Если задача выполняется не за полиномиальное время, то мы гово- рим, что ее решение требует экспоненциального времени (хотя на самом деле терминологически это не совсем верно, поскольку, конечно, существу- ют суперполиномиальные функции типа .VIogJV, которые на самом деле возрастают гораздо медленнее экспоненциальных). Это рациональный кри- терий определения грани между простым и сложным. Но действительно решающим доводом в пользу этого различия служит его независимость от того, какой компьютер мы используем. Универсальность различия между полиномиальным и экспоненциальным следует из одного из главных ре- зультатов теории вычислительных систем: универсальный (классический)
30 Глава 1 компьютер может моделировать другой в худшем случае с «полиномиаль- ным превышением» (времени). Это значит, что если на вашем компьютере алгоритм выполняется за полиномиальное время, та я всегда могу выпол- нить его на своем компьютере за полиномиальное время. Если я не могу придумать лучший способ сделать это, то я всегда могу эмулировать рабо- ту вашего компьютера на своем; ценой эмуляции является лишь полиноми- альное время. Так же ваш компьютер может эмулировать мой, то есть мы всегда будем единодушны в том, какие алгоритмы выполняю тся за полино- миальное время1. Итак, истина в том, что информация и вычисления в физическом мире в основе своей квантово-механические. Но это мнение, каким бы дорогим оно ни было для физиков, не представляло бы особого интереса (по край- ней мере, с точки зрения теории сложности), если бы было возможно моде- лирование квантового компьютера классическим с полиномиальным превы- шением времени. Тогда квантовые алгоритмы представляли бы лишь техни- ческий (специальный) интерес, возможно, не больший, чем будущие успехи классических алгоритмов, способных ускорить решение некоторых задач. Но если, как показывает (но не доказывает!) алгоритм Шора, никакое моделирование квантовою компьютера за полиномиальное время невоз- можно, то это меняет все. Результаты тридцатилетних исследований в тео- рии сложности по-прежнему останутся математическими истинами, как, например, теоремы, характеризующие возможности классических компью- теров. Но они не устоят как физические истины, поскольку классическая машина Тьюринга - неподходящая модель вычислений, которые действи- тельно могут быть выполнены в физическом мире. Если квантовая классификация сложности действительно отличается от классической (как подозревается, но не доказано), тогда этот результат перевернет основы информатики. В долгосрочном плане это также может сильно повлиять на технологию. Однако какое значение это имеет для фи- зики? Я не уверен. Но, наверное, это говорит о том, что ни одно мысли- мое классическое вычисление не может точно предсказать поведение даже скромного числа кубитов (порядка 100). Это наводит на мысль, что сравни- тельно небольшие кваггговые системы имеют больший потенциал, чем мы можем себе представить дай® в самых смелых мечтах. 1.7. Как насчет ошибок? Существует другое, недавно обнаруженное, свойство квантовой ин- формации, такое же важное, каким может оказаться алгоритм факториза- 1 Чтобы сделать это утверждение точным, мы должны соблюдать некоторую осторожность. Например, следует исклютнть некоторые виды «неуместных» машин, как, например, парал- лельная сеть компьютеров с неограниченным числом станции.
1.7, Как насчет ошибок? 31 ции Шора’ открытие коррекции квантовых ошибок. Действительно, если бы не этот результат, перспективы квантовых вычислитешшых технологий не казались бы такими радужными. Как мы уже отмечали, основным свойством квантовой информации которую использует квантовый компьютер, является наличие нелокальных корреляций между разными частями физической системы. Если я наблю- даю лишь часть системы за раз, то я могу извлечь только очень малую долю закодированной в ней информации К сожалению, эти нелокальные корреляции крайне хрупкие и на прак- тике склонны очень быстро распадаться. Проблема в том, что наша кванто- вая система неизбежно контактирует с намного большей системой с окру- жающей ее средой. Полностью изолировать большую квантовую систему от ее окружения практически невозможно, даже если для этого мы пред- примем героические усилия. Взаимодействия между квантовым устрой- ством и окружающей средой устанавливают нелокальные корреляции меж- ду ними. В итоге квантовая информация, изначально закодированная нами в устройстве, вместо этого оказывается закодированной в корреляциях меж- ду устройством и окружающей средой На этой стадии мы уже не можем получить доступ к информации, наблюдая только за устройством. На прак- тике информация безвозвратно потеряна. С макроскопическим устройством это происходит очень быстро, даже если его связь с окружением достаточно слабая. Эрвин Шредингер критиковал сторонников основного направления ин- терпретации квантовой механики, обращая внимание на то, что теория до- пускает квантовое состояние кота в форме |cat) — -^((dead) + | alive)). (1.17) В возможности таких состояний Шредингер видел дефект теории, пото- му что каждый встречавшийся ему кот был либо живым, либо мертвым, а не полуживым-полумертвым. Одно из наиболее важных достижений квантовой теории за послед- ние 15 лет состоит в том, что мы узнали, как аргументированно ответить Шредингеру. Состояние |cat) в принципе возможно, но редко наблюдается вследствие его крайней нестабильности. Встречавшиеся Шредингеру ко- ты никогда не были достаточно изолированы от окружающей среды. Если бы кто-нибудь приготовил состояние |cat), то квантовая информация, за- кодированная в суперпозиции |dead) и |alive), немедленно переместилась бы в корреляции между котом и окружающей средой, став тем самым пол- ностью недоступной. В действительности окружающая среда постоянно из- меряет кота, проецируя его на состояние jahve) или jdead) Этот процесс
32 Глава 1 называется декогерентизацией. Мы еще вернемся к изучению декогеренти- зации в этом курсе. Итак, чтобы выполнить сложное квантовое вычисление, мы долж- ны приготовить хрупкую суперпозицию состояний относительно большой квантовой системы (хотя, возможно, и не такой большой, как кот) К сожа- лению, эту систему нельзя полностью изолировать от окружающей среды, поэтому эта суперпозиция, как состояние |cat), очень быстро распадается. Закодированная квантовая информация быстро теряется и наш квантовый компьютер терпит банкротство. Другими словами, контакт компьютера с окружающей средой (декоге- рентизация) служит причиной ошибок, разрушающих квантовую информа- цию. Для того чтобы обеспечить надежную работу квантового компьютера, необходимо найти какой-нибудь способ предотвращения или исправления этих ошибок. На самом деле декогерентизация — не единственная проблема. Мы не могли бы ожидать безупречно точной работы квантовою компьютера, да- же если бы добились его полной изоляции от окружающей среды. Реа- лизованные в машине квантовые вентили представляют собой унитарные преобразования, которые одновременно оперируют несколькими кубитами, скажем, унитарные 4 х 4-матрицы, действующие на два кубита. Конечно, эти унитарные матрицы образуют континуум. Мы можем иметь протокол применения к двум кубитам, но его выполнение не будет безупречным, поэтому фактическое преобразование U - t70(l + О(е)) (1.18) будет сниматься от запланированного Уо на некоторую величину поряд- ка е Накопление этих ошибок после применения около 1/е вентилей при- ведет к серьезной неудаче. Подобные трудности испытывают и классиче- ские аналоговые приборы, тогда как для устройств, работающих на основе дискретной логики, малые ошибки создают гораздо меньше проблем. В действительности современные цифровые цепи удивительно надеж- ны. Стать высокой точности они достигают, благодаря диссипации. Мы мо- жем представить классический вентиль, действующий на бит, который изображается мячом, находящимся в одном из минимумов двухьямного по- тенциала Вентиль может перебросить мяч через промежуточный барьер на другую сторону потенциала. Конечно, действие вентиля не будет иде- альным; он может ударить по мячу чуть сильнее. Со временем эти несо- вершенства могут накопиться и явиться причиной ошибки. Чтобы исправить положение, мы охлаждаем бит (в буквальном смысле этого слова) после каждого вентиля. Это диссипативный процесс, при кото-
1.7. Как насчет ошибок? зч ром высвобождается тепло в окружающую среду и сокращается доступный мячу фазовый объем, приближая его к локальному минимуму потенциала. Поэтому малые ошибки, которые мы можем совершить, скорее ликвидиру- ются путем выброса тепла в окружающую среду, нежели подвергнут риску работу устройства. Но мы не можем подобным образом охлаждать квантовый компью- тер. Контакт с окружающей средой может повысить достоверность клас- сической информации, но закодированную квантовую информацию он раз- рушит. В более широком смысле аккумуляция ошибок будет проблемой и для обратимых классических вычислений. Чтобы предотвратить накоп- ление ошибок, нужно избавляться от несущей их информации, а удаление информации — всегда диссипативный процесс. И все же, не будем сдаваться раньше времени Дня борьбы с ошиб- ками в классической информации был разработан изощренный аппарат — теория кодов, исправляющих ошибки. В какой степени можно воспользо- ваться этим опытом, чтобы также защитить и квантовую информацию? Как работает классическая коррекция ошибок? Простейшим примером классического кода, исправляющего ошибки, является код повторения: мы заменяем бит, который хотим защитить, его тремя копиями: О -> (ООО), 1 —>(111). (1.19) Теперь пусто может возникнуть ошибка, которая инвертирует один из трех битов, если это, скажем, первый бит, то (ООО) (100), (111) -4 (011). (1.20) Несмотря на эту ошибку, мы по-прежнему можем правильно декодировать бит путем подсчета простого большинства голосов. Конечно, если вероятность ошибки в каждом бите равна р, то возмож- но инвертирование двух битов из трех или даже всех трех битов. Двойное инвертирование может произойти в трех разных случаях, таким образом, ею вероятность равна Зр2{1 — р), в го время как вероятность тройного инвертирования равна р3. Тогда в целом вероятность того, что подсчет про- стого большинства потерпит неудачу, равна Зр2(1 —р)+р3 - Зр2 - 2р3. Но при , - Зр2 - 2р3 < р, или р < (1.21) код увеличивает достоверность информации. Мы можем еще больше увеличить достоверность, используя более длинный код Один такой код (хотя и далеко не самый эффективный) —
34 Глава 1 код повторения ТУ-битов Согласно центральной предельной теореме, при —» оо распределение вероятностей для среднего значения бита стремится к гауссовскому с шириной 1/V1V. Если Р — | + е — вероятность того, что каждый бит имеет истинное значение, тогда вероятность того, что подсчет простого большинства потерпит неудачу (для большого N), определяется хвостом распределения Гаусса и равна Ретгог~е-^. (1.22) Таким образом, для любого к > 0, вводя достаточное количество вспомо- гательных битов, можно достичь сколь угодно высокой надежности Все в порядке будет даже при е < 0, если учитывать, что в этом случае боль- шинство голосов отдается ошибочному результату. Лишь при Р = | эта схема нс обоснована, ибо тогда блок из N битов будет случайным и не будет содержать никакой информации. В 1950-х гг. Джон Фон Нейман показал, что классический компьютер с шумящими элементами может надежно работать, используя достаточное количество вспомогательных битов. Он обратил внимание на то, что при необходимости каждую логическую операцию можно выполнить много- кратно и получить мажоритарный результат. (Фон Нейману было особенно интересно, почему его мозг так хорошо функционировал, несмотря на нена- дежность нейронов. Думаю, что ему было приятно найти объяснение своей сообразительности). Но теперь мы хотим использовать коррекцию ошибок для того, чтобы сохранить работоспособность квантового компьютера. Нетрудно видеть связанные с этим трудности: 1. Фазовые ошибки. Квантовая информация более подвержена ошибкам. В дополнение к ошибкам инвертирования битов |0>-|1), |1) - |0) в ней также могут появляться и фазовые ошибки: |0) |0>, (1-23) (1-24) Фазовая ошибка влечет за собой серьезные последствия, потому что она превращает состояние -А=[|0) + |1)] в ортогональное ему состоя- ние - |1)]. Однако классическое кодирование не обеспечивает защиты от фазовых ошибок.
1.8, Квантовые коды, корректирующие ошибки 35 2. Малые ошибки. Как уже отмечалось, квантовая информация непрерыв- на. Если кубит находится в состоянии а|0) 4- 6J1), (1.25) то ошибка может изменить а и b на величину порядка е. Со време- нем эти малые ошибки могут накапливаться. Классические же методы предназначены для исправления больших ошибок (ошибок инвертиро- вания битов). 3. Измерение — причина возмущения. Согласно схеме подсчета просто- го большинства голосов, для обнаружения и исправления ощибок нуж- но было измерять биты в годе. Однако нельзя измерять кубиты, не возмущая закодированную в них’ииформацию. 4. Невозможность клонирования. При классическом кодировании инфор- мация защищалась путем создания ее дополнительных копий. Однако известно, что квантовую информацию нельзя воспроизвести с абсо- лютной точностью. 1. 8. Квантовые коды, корректирующие ошибки Несмотря па эти трудности, оказывается, что квантовая коррекция ошибок действительно возможна. Первый пример квантового кода, исправ- ляющего ошибки, был построен около двух лет назад (угадайте, кем!) Пи- тером Шором Это открытие привело к возникновению новой, удивительно быстро развившейся, дисциплины -- теории квантовых годов коррекции ошибок. Мы рассмотрим ее позже в этом курсе. По-видимому, проще всего понять принцип работы квантовой коррек- ции ошибок, рассматривая оригинальный год Шора. Это наиболее простое квантовое обобщение классического трехбитового года повторения. Давайте еще раз рассмотрим этот трехбитовый год, но на этот раз учи- тывая требование, что в случае с квантовым годом мы должны быть в со- стоянии исправлять ошибки без измерения какой бы то ни было закодиро- ванной информации. Предположим, что мы кодируем один кубит тремя кубитами: |0) (0) -- |000), |1)-|1) = |111), другими словами, мы кодируем суперпозицию а|0) + 6|1) а|0)-|-Ь|1) =а|000) |-6|И1). (1.26) (1.27)
Глава 1 Мы хотели бы суметь исправить ошибку инвертирования бита, не разрушая эту суперпозицию. Конечно, нельзя измерять значение одного кубита. Если я измерил пер- вый кубит- и получил результат |0), то это значит, что я приютовил состо- яние [б) для всех трех кубитов, и мы потеряли квантовую информацию, закодированную в коэффициентах а и Ь. Но нет никакой необходимости ограничиваться измерением одного ку- бита. Я мог бы также выполнить коллективное измерение на двух кубитах сразу, и этого достаточно для диагностики ошибки инвертирования бита. Для трехкубитового состояния \х,у, z\ я мог бы измерить, скажем, двух- кубитовые наблюдаемые у ф z или х © z (где Ф обозначает сложение по модулю два). Как для [х, y.z) — |000), так и для |яг, у, г) = |111) резуль- тат был бы равен пулю, но если какой-нибудь бит инвертируется, то еда по крайней мере одна из этих величин будет равна единице. Фактически, если инвертируется один бит, то два бита (г/фг,жфг) (1-28) непосредственно определяют в двоичной записи позицию (1. 2 или 3) ин- вертированного бита, Эти два бита составляют синдром, диагностирующий появившуюся ошибку. Например, если инвертировался первый бит я|000) + Ь|Ш) -> а|100) + Ь|011), (1.29) тогда измерение (у ® г, х ф г) дает результат (0,1), информирующий нас о необходимости инвертировать первый бит; это действительно исправляет ошибку. Конечно, вместо (большой ошибки) инвертирования бита, возможна малая ошибка; |000) |000> + е(100); |Ш) fill) - £|011). (1.30) Но даже в этом случае вышеописанная процедура будет прекрасно ра- ботать. Измеряя {у Ф z,x G z), мы восстанавливаем собственное состоя- ние этой наблюдаемой. В большинстве случаев (с вероятностью 1 — |t j2) мы получаем результат (0,0) и проецируем поврежденное состояние на исходное, исправляя таким образом ошибку. Иногда (с вероятностью |г|2) мы получаем результат (0,1) и проецируем состояние на уравнение (1.29). Но 101 да синдром приказывает нам инвертировать первый бит, что восста- навливает исходное состояние. Аналогично, если амплитуда вероятности инвертирования каждого из трех кубитов имеет порядок г, тогда измере- ние синдрома с вероятностью порядка |£р спроецирует состояние на то,
1.8. Кван i овые коды, корректирующие ошибки $7 в котором один из трех битов инвертирован, а синдром укажет - какой из них. Итак, мы преодолели три из четырех ранее упомянутых трудностей. Мы видим, что без ущерба для информации можно выполнить диагности- рующее ошибку измерение [ответ на пункт (3)]. Квантовое измерение мо- жет проецировать состояние с малой ошибкой на состояние без ошибки или на состояние с большой дискретной ошибкой, способ исправления ко- торой нам известен [ответ на пункт (2)], Что касается пункта (4), то эта проблема вообще не возникла, поскольку состояние а|б) 1 Ь|1) получено не клонированием — оно не совпадает с (а|0) -| то есть не образовано тремя копиями незакодироваиного состояния. Остается только одна проблема: (1) фазовые ошибки. Наш код пока не обеспечивает никакой защиты от них. Если в любом одном из трех кубитов возникнет фазовая ошибка, тогда наше закодированное состояние а|0) I Ь)1) преобразуется в <х|0) - 6|1) и закодированная квантовая информация разру- шится. В действительности использование кода троекратного повторения втрое увеличивает частоту возникновения фазовых ошибок. Но, располагая методами, преодолевшими проблемы (2)-(4), мы можем с уверенностью подойти и к первой проблеме. Введя вспомогательные (дополнительные) биты, мы защитились от ошибок инвертирования битов. Это подсказывает как защититься от фазовых ошибок с помощью кодирования вспомогатель- ных (дополнительных) фаз. Следуя Шору, закодируем один кубит девятью 1°) - iOooo) 1- 11»(|000) + 1111»((000) + |111)), (1.31) I1) |Т> = ^О000) -l111»^000) -1111»(!000)- |1И». |б) и 11) состоят из трех кластеров, в каждом из которых но три кубита, при- чем каждый кластер приготовлен в одном и том же квантовом состоянии. Каждый из кластеров имеет три вспомогательных бита, поэтому мы можем исправить инвертирование одного бита в любом кластере описанным выше методом. Предположим, что в одном из кластеров происходит обращение фазы Ошибка изменяет относительный знак |000) и (111} в этом кластере так, что (ООО) ь|111) —* |000) - |111), (ООО) - |Ш) - • |000) f- |Ш). (1.32)
38 Глава 1 Это значит, что относительная фаза поврежденного кластера отличается от фаз двух других кластеров Таким образом, как и при исправлении инверти- рованного бита, мы можем определить поврежденный кластер, не измеряя относительные фазы в каждом из них (что вызвало бы возмущение закоди- рованной информации), а сравнивая фазы пар кластеров. В этом случае для проведения сравнения нам необходимо измерить шсстикубитовую наблю- даемую, например, наблюдаемую, которая инвертирует от одного до шести кубитов. Поскольку двукратное инвертирование является тождественным преобразованием, квадрат этой наблюдаемой равен единице, а ее собствен- ные значения ±1. Пара кластеров с одинаковым знаком представляет собой собственное состояние с собственным значением +1, а пара кластеров с противоположными знаками — собственное состояние с собственным зна- чением — 1. Измерив шестикубитовую наблюдаемую для второй пары кла- стеров, мы можем определить, какой из кластеров имеет отличный от дру- гих знак. Тогда мы применяем унитарное фазовое преобразование к одному из кубитов в этом кластере, чтобы обратить знак и исправить ошибку. Предположим, что унитарная ошибка U — 1+О(е) возникает в каждом из девяти кубитов. Наиболее общее однокубитовое унитарное преобразова- ние (с точностью до физически несущественной общей фазы) может быть разложено в первом порядке по ст г 1 з (0 1 A L (0 -» А , (1 ° А /1 «ч =1 + I j 0 j + ( г 0 Н г£Ц о -1 J Три слагаемых порядка е в этом разложении можно интерпретировать как операюр инвертирования бига, оператор обращения фазы и операюр, со- вершающий обе эти операции. Если мы приготовим закодированное состоя- ние а|б) 1 Ь| 1), в котором появление унитарных ошибок возможно в каждом кубите, а затем измерим синдромы инвертирования бита и обращения фа- зы, тогда в большинстве случаев мы вернем состоянию его первоначальный вид. Но с вероятностью порядка is |2 в одном из кубитов возникает большая ошибка: инвертирование бита, обращение фазы или и то и другое. Благо- даря синдрому, мы узнаем, какой из битов инвертировался и в каком из кластеров появилась фазовая ошибка, тогда для исправления ошибки мож- но применить соответствующее однокубитовое унитарное преобразование. Исправление ошибки не удастся, если, согласно измерению синдрома, в каждом из двух кластеров имеется две ошибки инвертирования бита (что влечет за собой фазовую ошибку в закодированной информации) или если фазовые ошибки возникнут в двух разных кластерах (что сводится к ошиб- ке инвертирования бита в закодированной информации). Но вероятность
1.8. Квантовые колы, корректирующие ошибки 39 такой двойной фазовой ошибки имеет порядок |е|4. Поэтому при достаточ- но малой |с| кодирование увеличивает надежность квантовой информации. Код также защищает от декогерентизации. Восстанавливая квантовое состояние, независимо от природы ошибки, наша процедура устраняет лю- бое запутывание между квантовым состоянием и его окружением. Как обычно, коррекция ошибок представляет диссипативный процесс, поскольку информация о природе ошибок изгоняется из квантовой систе- мы. В этом случае, когда информация является неотъемлемой частью за- писанных результатов наших измерений, при удалении этой записи будет выделяться тепло. Позднее в этом курсе мы обсудим дальнейшие результаты в области коррекции квантовых ошибок, включая такие как; • Как и в случае классического кодирования, оказывается, что существуют «хорошие» квантовые коды, позволяющие добиться сколь угодно высо- кой надежности, пока доля ошибок на один кубит достаточно мала. • Мы предположили, что процедура исправления ошибок сама по себе выполняется безупречно. Но измерение синдрома оказалось сложным - для выявления ошибок нам было необходимо измерить двухкубитовую и шестикубитовую коллективные наблюдаемые — так что, пытаясь ис- править информацию, фактически мы могли нанести ей еще больший ущерб. Однако мы покажем, что коррекция ошибок может быть вы- полнена так, что она будет эффективно работать даже при появлении случайных ошибок в самом процессе восстановления. • Чтобы оперировать с квантовым компьютером, мы хотим не только на- дежно хранить информацию, но также и обрабатывать ее. Мы покажем, что возможно применение квантовых вентилей к закодированной ин- формации. Подытожим важнейшие идеи, которые лежат в основе квантовой схемы коррекции ошибок: 1) Мы перевели ошибки в цифровую форму. Даже если ошибки в кван- товой информации были малыми, мы выполнили измерение, которое проецировало наше состояние на состояние без ошибок либо на состо- яние с одной из дискретного множества ошибок, способ исправления которой известен 2) Мы измеряли ошибки, не измеряя информацию. Наши измерения вскрывали природу ошибки, не вскрывая при этом (и, следовательно, не возмущая) закодированную информацию
40 Глава 1 3) Ошибки локальны, а закодированная информация нелокальна Необхо- димо подчеркнуть основное предположение, лежащее в основе стро- ения кода — ошибки, повреждающие разные кубиты, в хорошем при- ближении не коррелирован ы. Мы неявно предположили, что событие, вызывающее ошибку в двух кубитах, гораздо менее вероятно, чем со- бытие, вызывающее ошибку' в одном кубите. Конечно, это вопрос фи- зики, обоснованно это предположение или нет — нетрудно представить себе процесс, который станет причиной возникновения ошибок в двух кубитах сразу. Если подобные коррелированные ошибки окажу гея до- статочно распространенными, то кодирование потерпит неудачу в по- вышении надежности. Код пользуется предполагаемой локальной природой ошибок, коди- руя информацию нелокальным способом, то есть информация хранится в корреляциях, охватывающих несколько кубитов. Невозможно отличить |0) от |1), измеряя один кубит из девяти. Если мы измерим один кубиг, то с вероятностью 1/2 получим |0) или Ц), независимо от значения за- кодированного кубита. Чтобы получить доступ к закодированной инфор- мации, нам необходимо измерить трехкубитовую наблюдаемую (оператор, инвертирующий все три кубита в кластере, может отличить |000) + |111) от |000> - |111)). Окружающая среда может случайно повлиять на один из кубитов, на самом деле «измеряя» его. Но закодированная информация не может быть повреждена возмущением одного кубита, потому что сам по себе одиноч- ный кубиг фактически вообще не несет информации. Нелокально закодиро- ванная информация невосприимчива к локальным воздействиям — это ос- новной принцип, на котором основаны квантовые коды коррекции ошибок. 1.9. Квантовое «железо» Теоретические разработки в области квантовой сложности и квантовой коррекции ошибок сопровождались первыми экспериментальными попыт- ками обработки когерентной квантовой информации. Здесь я кратко опишу некоторые из этих опытов1. Чтобы создать аппаратное обеспечение для квантового компьютера, необходима технология, позволяющая управлять кубитами. «Железу» при- дется столкнуться с некоторыми жесткими техническими требованиями. 'Это единственный раздел, в котором очень кратко говорится об аппаратном обеспечении и физических реализациях квантовых вычислений. Читателям, интересующимся этими во- дросами, можно порекомендовать книги [1—5J из списка литературы к предисловию, а также цитированную в них литературу, , — Прим, ред
1.9. Квантовое «железо» 41 1. Хранение: Необходимо хранить кубиты в течение длительного времени, достаточного для выполнения интересующих нас вычислений. 2. Изоляция: Необходима надежная изоляция кубитов от окружения, что- бы минимизировать ошибки, возникающие вследствие декотерентиза- ции. 3. Считывание: Необходимо эффективно и достоверно измерять кубиты. 4. Вентили: Необходимо управлять квантовыми состояниями отдельных кубитов и индуцировать контролируемые взаимодействия между ни- ми так, чтобы можно было выполнять квантовые операции. 5. Точность: Для надежности работы устройства необходима высокая точ- ность выполнения квантовых операций. 1.9.1. Ионная ловушка Один из возможных путей достижения этих целей был предложен Игнасио Цираком и Питером Целлером; его дальнейшей разработкой за- нялась группа Дэвида Вайнленда из национального института стандартов и технологий (XTST), а также и другие группы. В этой схеме каждый ку- бит переносится одним ионом, удерживаемым в линейной ловушке Пауля. Квантовое состояние каждого иона - это линейная комбинация основного состояния |<7/ (интерпретируемого как |0>) и особого долгоживущего ме- тастабилыюго возбужденного состояния |е) (интерпретируемого как |1)). Когерентная линейная комбинация двух уровней, a|fl} (1.34) может существовать в течение времени, сравнимого со временем жизни возбужденного состояния (хотя, конечно, относительная фаза осциллирует вследствие расщепления энергии hu между уровнями). Ионы настолько хорошо изолированы, что доминирующей формой декогерентизации может быть спонтанный распад. Нетрудно считать информацию о состоянии ионов с помощью измере- ния, проецирующего на базис {|<у), je)}. Пусть лазер настроен на переход из состояния \д) в короткоживущее возбужденное состояние |е'). Когда ла- зер освстцает ионы, каждый кубит со значением |0) многократно поглощает и снова излучает свет лазера и таким образом становится видимым (флуо- ресценция). Кубиты со значением |1) остаются невидимыми.
42 Глава 1 Вследствие их взаимного кулоновского отталкивания, ионы достаточно хорошо изолированы и на каждый из них можно индивидуально направить импульсы лазеров. Если лазер настроен на частоту перехода ш и сфокусиро- ван на n-ом ионе, то между состояниями |0) и 11) возбуждаются осцилляции Раби. При подходящем выборе продолжительности и фазы лазерного им- пульса мы сможем реализовать любое однокубитовое унитарное преобразо- вание. В частности, действуя на |0), лазерный импульс может приготовить любую желаемую линейную комбинацию |0) и |1). Но наиболее сложной частью разработки и создания аппаратного обес- печения квантовых вычислений является организация взаимодействия двух кубитов между собой. В ионной ловушке взаимодействия обусловлены ку- лоновским отталкиванием между ионами, вследствие чего возникает спектр связанных нормальных мод колебаний захваченных ионов. Когда ион по- глощает или излучает лазерный фотон, его центр масс смещается. Но если лазер настроен подходящим образом, то при поглощении или излучении одним ионом произойдет когерентное смещение множества вовлеченных в нормальную моду ионов (эффект Мёссбауэра). Наиболее низкочастотной колебательной модой (частота г7) является мода центра масс (ст), в которой ионы синхронно колеблются в гармо- нических ямах ловушек. Ионы можно охладить лазером до температур юраздо меньших v, так что каждая колебательная мода с большой ве- роятностью находится в своем основном квантово-механическом состоя- нии, Теперь представим, что настроенный на частоту ш — v лазер светит на n-ый ион. При должной длительности импульса состояние |е)п перей- дет в |.g)n, в то время как cm-осциллятор совершит переход из его ос- новного состояния |0)ст в первое возбужденное jl)^ (рождение ^-«фо- нона»). В то же время состояние |«z)„|0)пт не находится в резонансе для любою перехода и поэтому не меняется под влиянием лазерною импульса. Таким образом, лазерный импульс совершает унитарное преобразование, действующее как ШО)™ — ШФст. Эта операция удаляет бит информации, первоначально хранившийся во внутреннем состоянии n-го иона, и помещает его в коллективное состоя- ние движения всех ионов. Это означает, что внутреннее состояние n-го иона оказало влияние на состояние движения m-го иона (т п). В этом смысле нам удалось индуцировать взаимодействие между ионами. Для завершения квантовой операции мы должны переместить квантовую информацию от стп-фоно-
1.9. Квантовое «железо» 43 на обратно во внутреннее состояние одного из ионов. Процедура должна быть построена таким образом, чтобы после выполнения операции ст-мо- да возвращалась в ее основное состояние [0)ст. Например, Цирак и Цоллер показали, что квантовый XOR-вентиль (исключающее ИЛИ, или контроли- руемое НЬ) -* (1.36) может быть выполнен в ионной ловушке всего пятью лазерными импуль- сами. Обусловленное этим возбуждение фонона (1 35) для одного захвачен- ного в ловушку иона было продемонстрировано экспериментально группой из NIST. Серьезным недостатком компьютера на ионных ловушках является то, что по своей природе это медленно работающее устройство. Очевидно, его быстродействие ограничено соотношением неопределенности энергия- время. Поскольку неопределенность энергии лазерного фотона должна быть мала по сравнению с характерной колебательной энергией и, про- должительность каждого лазерного импульса должна быть велика по срав- нению с у'1 На практике и, как правило, имеет порядок 100 кГц. 1.9.2. КЭД-резонатор Другое направление разработки аппаратного обеспечения (предложен- ное Псллицари, Гардинером, Цираком и Цоллером) поддерживает группа Джефа Кимбла здесь, в КАЛТЕХе. Идея состоит в том, чтобы захватить несколько нейтральных атомов в маленький с высокой точностью изготов- ленный оптический резонатор1. Вновь квантовая информация может хра- ниться во внутренних состояниях атомов. Но здесь атомы взаимодейству- ют, благодаря связи с нормальными модами электромагнитного поля в ре- зонаторе (вместо колебательных мод ионной ловушки). Снова, возбуждая переходы импульсами лазеров, мы можем вызвать в одном атоме переход, обусловленный внутренним состоянием другого атома. Другая возможность храпения кубита - использование поляризации фотона вместо внутреннего состояния иона. Тогда захваченный атом мо- жет использоваться как посредник, обеспечивающий взаимодействие одно- го фотона с другим (вместо фотона, использовавшегося для связи одного атома с другим). Эти эксперименты с «летающим кубитом» продолжаются уже два года. Группа Кимбла продемонстрировала действие двухфотонно- го квантового вентиля, в котором циркулярная поляризация одного фотона 1 Квангово-электродинамический (КЭД) резонатор Прим ред
44 Глава 1 влияет на фазу другого фотона: Ю11^2’ 1^1^2-1^11^2- (1'37) |Я>г|/г).2 — е’д|Л>1|/?>2, где ]L), |2?) обозначают состояния фотонов с левой и правой циркулярной поляризацией. Чтобы добиться этого взаимодействия, один фотон хранится в резонаторе, где он, находясь в состоянии с поляризацией |L), нс взаимо- действует с атомом и, напротив, сильно связан с ним, будучи в состоянии с поляризацией |Я). Второй фотон пересекает резонатор, и он также пре- имущественно взаимодействует с атомом, находясь в состоянии с одной определенной поляризацией. Волновой пакет второго фотона приобретает некоторый фазовый сдвиг eli, если только оба фотона имеют |й) поляриза- цию. Так как фазовый сдвиг обусловлен поляризацией обоих фотонов, это нетривиальный двухкубитовый квантовый вентиль. 1.93, ЯМР Третья схема аппаратного обеспечения (темная лошадка) появилась в прошлом году и обошла ионную ловушку и КЭД-рсзонатор, захватив ли- дерство в когерентной квантовой обработке. Новая схема использует техни- ку ядерного магнитного резонанса (ЯМР). Здесь носителями кубитов слу- жат ядерные спины определенного типа молекул. Каждый спин может быть ориентирован по (| Т) — |0)) или против (| () — |1)) направления приложен- ного постоянного магнитного поля Спины имеют большое время релакса- ции или декогерентизации, поэтому кубиты могут сохраняться в течение приемлемого времени. Мы можем также включить импульсное вращающееся магнитное по- ле с частотой ш (где и - расщепление энергии между состояниями спин вверх и спин вниз) и возбудить осцилляции Раби между двумя спиновыми состояниями. При подходящей длительности импульса, мы можем выпол- нить желаемое унитарное преобразование на отдельном спине (точно так же, как в случае ионной ловушки). Все спины в молекуле испытывают воз- действие вращающегося магнитного поля, но отзываются на него лишь те, которые находятся в резонансе. Более того, между спинами существуют диполь-дипольные взаимодей- ствия, и эта связь может использоваться для выполнения операций. Расщеп- ление между | () и | J) для одного спина фактически зависит от состояния
1.9. Квантовое «железо» 45 соседних спинов. Следовательно, находится или нет управляющий импульс в резонансе, чтобы опрокинуть спин, обусловлено состоянием другого спи- на. Все это уже давно было известно химикам. Тем не менее лишь в про- шлом году Нгршенфельд и Чанг и независимо Кори, Фами и Гавел указали, что ЯМР предоставляет полезную реализацию квантовых вычислений. Это не было очевидным по ряду причин. Наиболее важная: ЯМР-системы очень горячие. Типичная спиновая температура (скажем, комнатная температу- ра) по порядку может быть в миллионы раз больше энергии расщепления между |0) и jl) Это означает, что квантовое состояние нашего компьюте- ра (спинов в отдельной молекуле) существует на фоне очень интенсивно- го шума оно испытывает очень сильные термические флуктуации. Этот шум будет искажать квантовую информацию Более того, мы фактически выполняем нашу процедуру не па одной молекуле, а на макроскопическом образце, содержащем порядка ТО23 «компьютеров», а считываемый нами сигнал в действительности усреднен по этому ансамблю. Но вероятност- ный характер квантовых алгоритмов обусловлен случайностью квантовых измерений. Следовательно, усреднение по ансамблю не эквивалентно вы- полнению вычислений на одном приборе; усреднение может скрыть ре- зультат. Гершенфельд и Чанг, а также Кори, Фами и Гавел объяснили, как пре- одолеть эти трудности. Они описали, как можно готовить, управлять и кон- тролировать «эффективно чистые состояния», выполняя соответствующие операции на термическом ансамбле. Идея состоит в том, чтобы обеспе- чить усреднение флуктуирующих свойств молекулы во время детектирова- ния сигнала, так чтобы измерялись только интересующие нас когерентные свойства. Они также отметили, что некоторые квантовые алгоритмы (в том числе алгоритм факторизации Шора) можно разработать в детерминист- ской форме (так что, по крайней мере большая часть компьютеров будет давать один и тот же результат); тогда усреднение по многим вычислениям не нанесет ущерба результату. Совсем недавно методы ЯМР были использованы для приготовления максимально запутанного состояния трех кубитов, чего не удавалось до- биться раньше. Очевидно, разработки квантового вычислительного «железа» находят- ся в младенческом состоянии. Необходимо на много порядков величины (как по количеству хранящихся кубитов, гак и по количеству операций, которые могут быть применены) увеличить возможности существующего аппаратного обеспечения, прежде чем можно будет пыгагься реализовать вычислительные амбиции. В случае метода ЯМР существует особенно се-
46 Глава 1 рьезное ограничение, которое возникает как принципиальный вопрос, по- скольку отношение когерентного сигнала к фону экспоненциально спадает с ростом количества спинов, приходящихся на одну молекулу. На практике было бы очень заманчиво выполнить квантовое ЯМР-вычисление с более чем десятью кубитами. Возможно, для того чтобы квантовые компьюте- ры в конце концов стали реальными приборами, потребуются новые идеи в разработке квантового аппаратного обеспечения, 1.10. Резюме Этим завершается наш вводный обзор квантовых вычислений. Мы увидели, что здесь соединились три фактора, сделавшие захватывающим этот предмет. 1) Квантовые компьютеры могут решать сложные задачи. Представим, что построена новая классификация сложности, лучше опирающаяся на фундаментальные законы физики, чем традиционная теория слож- ности. (Тогда остается более строго охарактеризовать класс задач, в ко- торых квантовые компьютеры имеют большое преимущество перед классическими компьютерами ) 2) Квантовые ошибки можно корректировать. С помощью подходящих методов кодирования мы можем защитить сложную квантовую систе- му от разрушительного действия декогерентизации. Мы никогда не сможем увидеть настоящего полуживого-полумертвого кота, но, веро- ятно, сможем приготовить и сохранить в таком состоянии закодиро- ванного кота. 3) Квантовое аппаратное обеспечение можно сконструировать. У нас есть привилегия быть свидетелями начала эпохи когерентных манипуляций С квантовой информацией в лаборатории. Целью этого курса будет углубление нашего понимания пунктов (1), (2)и(3).
Глава 2 Основы I: Состояния и ансамбли 2.1, Аксиомы квантовой механики В предыдущих лекциях я говорил то одно, то другое о квантовом, хотя нигде не давал определения, что такое квантовая теория. Пришло время восполнить этот пробел. Квантовая теория это математическая модель физического мира. Чтобы охарактеризовать модель, необходимо определить, как она будет представлять состояния, наблюдаемые, измерения и динамику. 1. Состояния. Состояния представляют полное описание физической си- стемы. В квантовой механике состояниями являются лучи в гильбер- товом пространстве. Что такое гильбертово пространство? 1) Это векторное пространство над полем комплексных чисел С В дальнейшем векторы будут обозначаться как \ф} (кет-вектор Ди- рака). 2) В нем определено внутреннее произведение (уф?) Оно пред- ставляет собой отображение упорядоченной пары векторов на С, определяемое свойствами: а) положительность: (V’|^) >0 для любого \ф) / 0; б) линейность: <у?|(а|’01) + = «(y’lV'i) + ^№2)', в) эрмитовская симметрия: = (^|у’)’. 3) Оно полно по норме j|^|j = у/ (В бесконечномерных функциональных пространствах полнота является важным условием, обеспечивающим сходимость разло- жений ио определенным базисам собственных функций, напри- мер, рядов Фурье. Однако, как правило, нас вполне удовлетво- рит работа с внутренними произведениями в конечномерных про- странствах.)
48 Глава 2 Что такое луч? Это класс эквивалентности векторов, отличающихся друг от друга ненулевым комплексным скалярным множителем. В ка- честве представителя такого класса (для любого ненулевого вектора) можно выбрать вектор, нормированный на единицу №) - 1- (2.1) Будем также говорить, что |V') и €га|т/>), где |с'" | = 1, описывают одно и то же физическое состяние. [Заметим, что каждый луч соответствует возможному состоянию, то есть из двух данных состояний |у?) и |тр) можно сформировать другое состояние а\ф} + fr|?i>) («принцип суперпозиции»). Физический смысл в этой суперпозиции имеет- относительная фаза', мы отождествляем а|у>) + Ь|-ф) с е’°(а[у?) + b|w)), но отличаем его от а|у>) + etafr|V>).] 2. Наблюдаемые. Наблюдаемой является свойство физической системы, которое в принципе может быть измерено. В квантовой механике на- блюдаемая представляется самосопряженным оператором. Оператор определяет линейное отображение одною вектора в друюй А : |w) —» А|у), А(а|^) + Ь|^)) — аА|^>) + />В|<^). (2.2) Оператор, сопряженный к А, определяется соотношением (v|AV>) - <А*9?|^> (2.3) для любой пары векторов |у?) и \ф) (здесь я обозначил А|^) симво- лом |Ач/'’)). Оператор А самосопряжен, если А — At. Если А и В самосопряженные операторы, то А + В — тоже самосо- пряжен [поскольку (A+B)t = At + EJt], но (AB)t — BfAt и поэтому АВ — самосопряженный оператор только в том случае, когда А и В коммутируют. Заметим, что АВ + В А и г (АВ — ВА) всегда самосо- пряженные, если таковыми являются А и В. Для самосопряженного оператора в гильбертовом пространстве Н су- ществует спектральное представление — его собственные состояния образуют полный, ортонормированный базис в Н. Мы можем предста- вить самосопряженный оператор А в виде А-^лкРп. (2.4)
2.1 . АКСИОМЫ КВАНТОВОЙ МЕХАНИКИ 49 Здесь каждое ап — собственное значение оператора А, а Р„ — со- ответствующий ортогональный проектор (проекционный оператор) на пространство собственных векторов, отвечающих собственному значе- нию ап. (Если ап пе вырождено, то Pri — - проектор на соответ- ствующий собственный вектор.) Проекторы Рп обладают свойствами Р Р = <5 Р Pf = Р . (2 51 (Определение самосопряженности и формулировка спектральной тео- ремы для неограниченных операторов в бесконечномерном простран- стве более тонкие, ио здесь это не должно нас беспокоит)..) 3. Измерение. В квантовой механике численным результатом измерения наблюдаемой А является одно из ее собственных значений; сразу по- сле измерения квантовым состоянием является собственное состоя- ние А, соответствующее измеренному собственному значению ап. Ес- ли непосредственно перед измерением квантовое состояние описыва- лось вектором \ ф), то результат ап получается с вероятностью РгоЬЮ = ||Р„М)|3 ^|PJ< (2.6) Если полученным результатом является то (нормированным) кван- товым состоянием становится (2.7) (Заметим, что если тотчас повторить измерение, тогда согласно этому правилу вновь, с вероятностью едипица, будет получен тот же самый результат) 4, Динамика. Эволюция во времени квантовою состояния унитарна; она порождается самосопряженным оператором, называемым гамильтони- аном системы. В шредингеровской картине динамики вектор, описы- вающий систему, изменяется во времени согласно уравнению Шредин- гера -iH^(l)}, (2.8) 1дс Н гамильтониан. Мы можем переписать это уравнение в нервом порядке по бесконечно малой величине dt: |tf(i + dt)} - (1 - iHdt)\$(t)}. (2.9)
50 Глава 2 Оператор U(dt) — 1 — iHdt унитарен, поскольку Н самосопряжен; в линейном порядке по dt он удовлетворяет соотношению U^U = 1. Поскольку произведение унитарных операторов унитарно, эволюция в конечном интервале времени также унитарна: |^(£)> = и(Л)|^(О)>. (2.10) Если гамильтониан Н не зависит от времени, то можно записать U(i) = Этим завершается математическая формулировка квантовой механики. Мы непосредственно замечаем ее некоторые необычные черты. Одна ее странность состоит в том, что уравнение Шредингера линейно, тогда как мы привыкли к нелинейным динамическим уравнениям классической фи- зики. Очевидно, это свойство требует объяснения. Однако гораздо более странным представляется таинственный дуализм; два совершенно разных способа изменения квантовых состояний. С одной стороны, существует де- терминистская унитарная эволюция. Если мы точно определили то теория предсказывает состояние в любой более поздний момент вре- мени. С другой стороны, имеется вероятностное измерение. Теория не да- ет определенных предсказаний относительно результатов измерения; она лишь приписывает вероятности различным альтернативам Это вызывае т беспокойство, поскольку неясно, почему, в отличие от других процессов, измерение должно управляться иными физическими законами. Начинающие изучать квантовую механику, впервые столкнувшись с этими правилами, редко спрашивают «почему?». В этом есть определен- ная мудрость. Но я надеюсь, что может быть полезно спросить, почему? В будущих лекциях мы вернемся к этому вызывающему замешательство ду- ализму между унитарной эволюцией и измерением и найдем его разреше- ние. 2.2. Кубит Неделимой единицей классической информации является бит, при- нимающий одно из двух возможных значений {0.1}. Соответствующую единицу квантовой информации называют «квантовый бит» или кубит. Он описывает состояние простейшей квантовой системы. Минимальное нетривиальное гильбертово пространство двумерно. Бу- дем обозначить ортогональный базис в двумерном векторном пространстве
2.2. Кубит 51 как {JO), | J)}, Тогда наиболее общее нормированное состояние может быть представлено в виде а|0) t-bjl), (2.11) где а, Ъ — комплексные числа, удовлетворяющие условию |а|2 + |Ь|2 — = 1, а общая фаза физически несущественна. Кубитом является состояние в двумерном г ильбертовом пространстве, которое может принимать любое значение, описываемое уравнением(2.11). Мы можем выполнить измере- ние, проецирующее кубит на базис {|0), |1)}. Тогда с вероятностью |а|2 мы получим результат |0), а с вероятностью |Ь|2 — результат |1). Более то- го, за исключением случаев а = 0 и b =- 0 измерение неизбежно ведет к возмущению состояния. Если начальное значение кубита неизвестно, то- гда нет способа определить а и Ь'с помощью одного такого или любого другого мыслимого измерения. Однако после измерения кубит оказывается в известном состоянии — |0) или |1) — отличающемся (вообще говоря) от его предыдущего состояния. В этом отношении кубит отличается от классического бита; мы можем измерить классический бит, не возмущая его, и расшифровать всю закоди- рованную в нем информацию. Допустим, мы имеем классический бит, кото- рый в действительности имеет определенное, но неизвестное нам значение (О или 1) Опираясь па доступную информацию, мы можем только сказать, что с вероятностью р0 би г имеет значение 0, а с вероятностью — зна- чение 1, причем Ро = 1- Измеряя бит, мы получаем дополнительную информацию, позволяющую узнать сто значение со 100% уверенностью. Важный вопрос: в чем суть различия между кубитом и вероятност- ным классическим битом? По разным причипам, которые мы с вами изу- чим, это действительно не одно и то же. 2.2.1. Спин-1/2 Прежде всего заметим, что коэффициенты а и Ъ в уравнении (2.11) содержат нечто большее, чем просто вероятности результатов измерения в базисе {|0). |1)}. В частности, относительная фаза а и b также имеет физическое значение. Для физика естественно интерпретировать уравнение (2.11) как спино- вое состояние объекта со спином-1/2 (типа электрона) Тогда состояния |0) и |1) представляют собой состояния спин вверх | и спин вниз | |) вдоль некоторой оси, например, оси z. Два вещественных числа, характеризую- щих кубит (комплексные числа а и Ь, без учета их общей фазы и нор- мы), описывают ориентацию спина в трехмерном пространстве (полярный угол 0 и азимутальный угол р).
52 Глава 2 Мы не имеем возможности углубляться здесь в теорию симметрии в квантовой механике, напомним лишь кратко ее некоторые элементы, ко- торые окажутся полезными в дальнейшем. Симметрия представляет собой преобразование, действие которого на состояние системы оставляет низ- менными все наблюдаемые свойства системы. В квантовой механике на- блюдениями являются измерения самосопряженных операторов. Если А измеряется в состоянии \-ф}, то с вероятностью |(a|^}|2 будет получен ре- зультат |а) (собственный вектор оператора А). Симметрия должна остав- лять неизменными эти вероятности (если мы «поворачиваем» систему вме- сте с приборами). Операция симметрии предс тавляет собой отображение векторов в гиль- бертовом пространстве IV’) - Ю- (2.12) сохраняющее абсолютные значения внутренних произведений = К/Ю1 (2.13) для любых |у?) и |ф). Согласно знаменитой теореме Вигнера, отображение с таким свойством всегда может быть выбрано (принимая соответствую- щее соглашение относительно фазы) унитарным или антиунитарным Важ- ная для дискретных симметрий аптиуиитарная югьтернагива может быть исключена в случае непрерывных симметрий. Тогда преобразование сим- метрии действует как |ф) _> |^') = (2 14) где U - унитарный оператор (и, в частности, линейный). Симметрии образуют группу: преобразование симметрии можно обра- тить, а произведение двух симметрий, в свою очередь, является симметри- ей Каждой операции симметрии R, действующей на нашу систему, соот- ветствует унитарное преобразование U(R). Перемножение этих унитарных операторов должно соответствовать групповому закону перемножения сим- метрий — применение Rx о R,2 должно быть эквивалентно последователь- ному применению сначала R2, а затем Rx. Таким образом, мы требуем UfRJUff^) = Phasc(Rl} R2)U(/?1 о /?2). (2.15) В уравнении (2.15) допускается фазовый множитель, поскольку кванто- выми состояниями являются лучи', нам нужно требовать лишь того, что- бы U(Rj о J^) действовал так же, как и UfRjUfRj), на лучи, а не на векторы. U(R) обеспечивает унитарное (с точностью до фазы) представле- ние группы симметрии.
2.2. Кубит 53 До сих пор паше понятие симметрии не имело связи с динамикой. Обычно мы требуем от симметрии, чтобы она сохраняла динамическую эволюцию системы Это означает, что не должно иметь значения, преобра- зуем ли мы сначала систему, а затем она эволюционирует, или наоборот, сначала происходит эволюция системы, а затем мы преобразуем ее. Други- ми словами, диаграмма коммуташвна. Это означает, что оператор эволюции во времени должен коммутировать с преобразованиями симметрии U(J?) U(/?)e~itH=e (2.16) Pamai ая это уравнение до линейного порядка no получаем U(K)H - Ни(Я). (2.17) В случае непрерывной симметрии операция R может быть выбрана сколь угодно близкой к единице R = 1 + сТ, тогда U также близок к единичному оператору 1: и(Д) - 1 -«eQ + Ofc3). (2.18) Из унитарности (в линейном порядке по с) U следует, что Q является на- блюдаемой Q = Qt Разлагая уравнение (2.17) до линейных по с слагае- мых, находим [Q,H]-0; (2.19) наблюдаемая Q коммутирует с гамильтонианом. Уравнение (2,19) представляет собой закон сохранения. Он говорит, например, что если мы приготовили собственное состояние оператора Q, то управляемая уравнением Шредингера эволюция во времени будет со- хранять это собственное состояние. Таким образом, симметрии влекут за
54 ГЛАВА 2 собой законы сохранения. И наоборот, по заданной сохраняющейся вели- чине Q, удовлетворяющей уравнению (2.19), можно построить соотве гству- ющее преобразование симметрии. Конечное преобразование может быть построено как произведение множества ифинитезимальных преобразова- ний / -..V , R^h + ~T) =4>U(fl) = (l + »yQj ei<?Q (2.20) (в пределе N —> оо). Выяснив, как выглядит унитарное представление ин- финитезимальных преобразований, мы тем самым определили представле- ние конечных преобразований; они могут быть построены как произведе- ния инфинитезимальных преобразований Мы говорим, что Q - генератор симметрии Кратко напомним, как эта общая теория применяется к пространствен- ным поворотам и моменту количества движения (импульса). Бесконечно малый поворот на угол df) вокруг оси, определяемой единичным векто- ром п — (л.,, может быть представлен в виде U(n, = 1 — iddn • J, (2.21) где (J1; J2, J3) — компоненты момента импульса. Конечный поворот выра- жается как U(n, (?) = ехр(- iOn J). (2.22) Повороты вокруг разных осей не коммутируют между собой. Из их элемен- тарных свойств вытекают коммутационные соотношения [Jfc-— (2.23) где £kim — полностью антисимметричный единичный псевдотензор (£123 = 1), а по повторяющимся индексам предполагается суммирование. Чтобы совершать повороты квантовой системы, найдем удовлетворяющие коммутационным соотношениям (2.23) самосопряженные операторы JP J2, J3 в гильбертовом пространстве. «Определяющее» представление группы поворотов трехмерно, однако простейшее нетривиальное неприводимое представление является двумер- ным и задается генераторами А - (2.24)
2.2. Кубит 55 где Л 0 1 Л ( 0 —г \ ( 1 о \ О )' a*=[i о )> -1 J <2.25) — матрицы Паули. С точностью до унитарной) преобразования базиса это единственное двумерное неприводимое представление. Поскольку соб- ственные числа операторов Jfc равны ± 1 /2, мы называем его представлени- ем спина-1/2. (Отождествляя J с моментом импульса, мы неявно выбрали единицы, в которых h — 1). Матрицы Паули также обладают свойствами взаимной антикоммутации и идемпотентности <т*хг( + а,о-*--25wl. (2.26) Таким образом, (п - а)2 = nkniakat ~ nknk^- — Разлагая экспоненту в ряд, мы видим, что конечный поворот представляется как U(n, 0) — схр Г =1 cos - — i(n <т) sin (2.27) В такой форме можно представить наиболее общую унитарную 2 х 2-матри- цу с единичным определителем. Это позволяет думать о кубите как о состо- янии объекта со спином-1/2, а о произвольном унитарном преобразовании (кроме возможного поворота общей фазы), действующем на это состояние (кубит), — как о повороте спина. Необычным свойством представления U(n, д) является его двузнач- ность В частности, нетривиально представляется поворот на угол 2тг во- круг любой оси: U(H,0= 2тг) - -1 (2.28) Наше представление группы вращений в действительности является пред- ставлением «с точностью до знака» - ±U(Bj О (2.29) Но, как уже отмечалось, это вполне приемлемо, поскольку групповое умно- жение относится к лучам, а не к векторам. Эти двузначные представления группы вращений называются спинорными представлениями. (Существова- ние спиноров следует из топологического свойства труппы — она не одно- связна ) Несмотря на то, что поворот на угол 2тг действительно не ведет к на- блюдаемому изменению состояния объекта со спином-1/2, было бы ошиб- кой считать, что спинорное свойство не имеет наблюдаемых следствий.
56 Глава 2 Допустим, у меня есть машина, которая действует на пару спинов. Если первый спин направлен вверх, то она ничего не меняет, но если первый спин направлен вниз, она поворачивает второй спин на угол 2л. Пусть те- перь эта машина действует на состояние, в котором первый спин находится в суперпозиции состояний «вверх» и «вниз». Тогда -Ml Th i 11>1)I Th -> 4=(l Th - I lh)l Th- (2.30) Несмотря на отсутствие наблюдаемого влияния на состояние второго спи- на, состояние первого спина стало ортогональным сю исходному состоя- нию, что очень даже наблюдаемо. В повернутой системе отсчета поворот R(n, в) превращается в поворот на тот же самый угол, по вокруг повернутой оси. Отсюда следует, что три компоненты момента количества движения при поворотах преобразуются как вектор и(адиЬй) - Rkl^. (2.31) Таким образом, если состояние |ш) является собственным состоянием опе- ратора .Е( = ntjm), (2.32) тогда U(Z?)|r») является собственным состоянием оператора /?Л3 с тем же самым собственным значением: RJ3U(B)|m) - UiB'iJ.UhR'jLOiim) -U(/?)J3|m) - (2.33) Следовательно, мы можем построить собственные состояния оператора проекции момента импульса на ось п — (sin в cosyrsin 0 sin у?, cos 0), при- меняя поворот' на угол 0 вокруг оси п' — ( — sin cos 0) к собственному состоянию оператора J3. Для нашего представления спина-1/2 таким пово- ротом является 0 - >/ — г-п • о 1 ехр ехр 0 ( 0 Y 2 \ е* о ) / cos ~ I -Fe+’^sin | -е- ^sin| (2.34)
2.2. Кубит 57 Применяя его к — собственному состоянию оператора J3 с собствен- ным значением -Н, получим (с точностью до общей фазы) v?)> - e-’^2cos| е' M2sjn | (2.35) Мы можем непосредственно проверить, что этот вектор является собствен- ным состоянием оператора’ _ I cos в е t¥? sin в П <Т \ е',:р sin 6* — cos в (2.36) с собственным значением +1. Итак, мы видим, что уравнение (2.11) с а - е-ир/2 соз _ <=+^/2 sin | может интерпретироваться как состояние спина, ориентированного вдоль направления (0, ^). Мы уже отмечали, что невозможно определить а и b с помощью одного измерения. Болес того, даже имея множество идентичных копий данного состояния, мы не можем полностью его определить, измеряя каждую копию только вдоль оси z Это могло бы позволить нам оценить |а| и |6|, но нс дало бы возможности получить информацию об относительной фазе а и Ь. Эквивалентно мы могли бы найти значение проекции спина па ось z (v(0,<')1сгзЬ'(А‘rO) — cos2 | sih2 | — cos0, (2.31) но ничего не смогли бы узнать о его компонентах в плоскости ху. Проблема определения |у) путем измерения спина аналогична проблеме определения единичного вектора п путем измерения его компонент вдоль различных осей. В общем необходимы измерения вдоль трех различных осей. Напри- мер, из (<т3) и (<rj) мы можем определить гы и п19 по знак я2 останет- ся неопределенным. Измерение (<т2) могло бы устранить эту двусмыслен- ное гь. Конечно, если мы позволили поворачивать спин, тогда будет достаточ- но измерений только вдоль оси z. То есть измерение спина вдоль оси п эк- вивалентно предварительному совершению поворота, совмещающего ось п с осью г, а затем - измерению вдоль оси z. В частном случае в = тг/2, ip — 0 (ось :с) наше спиновое состояние имеет вид | тг) = -L(| TJ+ I JJ), (2.38)
58 Глава 2 («спин вверх вдоль оси х»), Ортогональным ему состоянием («спин вниз вдоль оси т») является (2.39) Для этих обоих состояний, измеряя СПИН ВДОЛЬ ОСИ Z, мы получим | 'Гг) с вероятностью 1/2 и | J.2) с вероятностью 1/2 Рассмотрим теперь комбинацию ^=(Ш + Ю)- (2.40) Это состояние обладает тем свойством, что если мы измеряем спин вдоль оси х, то с вероятностями, равными 1/2, получаем | |т) или [ 1г). Можно спросить, что мы получим, измеряя состояние (2.40) вдоль оси г? Если бы э то были классические вероятностные биты, то ответ был бы очевиден. Состояние (2,40) представляет собой одно из двух состояний, и для каждого из них вероятность направления вверх или вниз вдоль оси г равна 1/2. Таким образом, измеряя состояние (2.40) вдоль оси z, мы, конеч- но, должны с вероятностью 1/2 обнаружить спин, направленным вверх. Но для кубитов это не так! Складывая уравнения (2.38) и (2.39), мы об- наруживаем, что в состоянии, описываемом уравнением (2.40), в действи- тельности замаскировано состояние [ |2). Измеряя его вдоль оси z, мы все- гда будем получать ) t2) и никогда — | (2). Таким образом, для кубитов, в противоположность классическим веро- ятностным битам, вероятности могут складываться довольно неожиданным образом. В этом и состоит (в его простейшей форме) явление, называемое «квантовой интерференцией», важная особенность квантовой информации. Следует подчеркнуть, что, хота формальная эквивалентность объекту со спином-1/2 применима к любой двухуровневой квантовой системе, ко- нечно, не каждая двухуровневая система преобразуется при поворотах как спинор. 2.2.2. Поляризации фотона Другую важную систему, имеющую два состояния, представляет фо- тон, который может иметь одну из двух независимых поляризаций. Со- стояния поляризации фотона тоже преобразуются при поворотах, однако фотоны отличаются от объектов со спином-1/2 в двух важных отношениях:
2.2. Кубит 59 (1) Фотоны являются безмассовыми частицами. (2) Фотоны имеют спин-1 (это не спинорные частицы). Мы не располагаем временем для детального обсуждения унитарных представлений 1руппы Пуанкаре. Достаточно сказать, что спин частицы определяет, как преобразуется ее состояние под действием преобразований малой ipynnu — сохраняющей импульс частицы подгруппы группы Лорен- ца. В случае массивной частицы мы всегда можем перейти в ее систему покоя и тогда малой группой является группа вращений. Для безмассовых частиц не существует системы покоя. Конечномер- ные унитарные представления малой группы превращаются в представле- ния группы вращений в двумерном пространстве, вращений вокруг направ- ления импульса. Конечно, в случае с фотоном это соответствует знакомому свойству классического света - волны поляризованы перпендикулярно на- правлению распространения. При повороте вокруг направления распространения два состояния ли- нейной поляризации (|ж) и \у) для горизонтальной и вертикальной поляри- зации) преобразуются как (гс) —> + cos 0 |гг) + sin 6 \у), 11/) -+ - sin в |аг) + cos 011/). (2.41) Это двумерное представление в действительности пригюдимо. Матрица COS0 - sin 0 fiind cos 6 (2.42) имеет собственные состояния (2.43) отвечающие собственным значениям е"!‘,е и е* ‘0, состояния правой и левой циркулярной поляризации. То есть они являются собственными состояния- ми генератора поворотов м °. V + г V (2.44) с собственными значениями ±1 Поскольку собственные значения рав- ны ±1 (а не ±1/2), мы говорим, что фотон имеет спин-1.
60 Глава 2 В этом контексте явление квантовой интерференции может быть опи- сано следующим образом. Предположим, что мы имеем анализатор поляри- зации, который позволяет пройти через нею фотону только с одной из двух линейных поляризаций. Тогда вероятность прохождения х- иди г/-поляри- зованного фотона через повернутый на 45° анализатор равна 1/2; 1/2-ой равна и вероятность прохождения поляризованного под углом 45е фотона через х- или «/-анализатор. Однако ж-фотон никогда не пройдет через «/-ана- лизатор. Если мы поместим повернутый на 45° анализатор между х- и у- анализаторами, тогда через каждый анализатор пройдет половина падаю- щих на него фотонов. Но если мы удалим промежуточный анализатор, го ни один фотон не пройдет через «/-анализатор. Очевидно, можно сконструировать прибор, который поворачивает плоскость поляризации фотона и, следовательно, применяет преобразова- ние (2.41) к нашему кубиту. Как уже отмечалось, это не самое общее уни- тарное преобразование. Но если мы имеем также и прибор, который из- меняет относительную фазу двух ортогональных, линейно поляризованных состояний |х) е+“/‘2|ж), (2-45) то эти два прибора моожно использовать вместе, чтобы совершить произ- вольное 2x2 унитарное преобразование (с определителем, равным едини- це) состояния поляризации фотона. 2.3. Матрица плотности 2.3.1. Бинарная квантовая система Последняя лекция была об одном кубите. Эта лекция — о двух кубитах. (Догадайтесь, о чем будет следующая лекция!) Переход от одного кубита к двум — более серьезный шаг, чем вы могли бы ожидать. Многое из то- го, что есть странного и чудесного в квантовой механике, можно понять, рассматривая свойства квантовых состояний двух кубитов. Аксиомы § 2.1 дают вполне приемлемую общую формулировку кван- товой теории. Тем пе менее при многих обстоятельствах мы обнаруживаем, что они кажутся нарушенными. Беда в том, что наши аксиомы нацелены на то, чтобы характеризовать поведение всей Вселенной. Но, как правило, у нас нет таких амбиций, как пытаться понять физику всей Вселенной; мы довольствуемся изучением только нашего маленькою уголка. На практи-
2.3. Матрица плотности 61 ке наши исследования все1да ограничены малой частью гораздо большей квантовой системы. В следующих нескольких лекциях мы увидим, что если мы ограничи- ваем наше внимание только на части большой системы, то (в противопо- ложность аксиомам §2.1): 1) состояния не являются лучами. 2) измерения не являются ортогональными проекторами. 3) эволюция не унитарна. Мы сможем лучше понять эти моменты, рассматривая простейший пример: мир двух кубитов, в котором мы наблюдаем только один из них. Итак, рассмотрим систему двух кубитов. Кубит А находится здесь, в комнате вместе с нами, и мы вольны наблюдать сю или манипулиро- вать им по своему усмотрению. Но кубит В заперт в подвале, где мы не можем до него добраться. Имея некоторое состояние двух кубитов, мы хо- тели бы найти простой способ описания наблюдений, которые мы можем делать только на кубите А. Будем использовать {jO)A, |1)д) и {|0)в, |1)в} для обозначения орто- нормированных базисов для кубитов А и В соответственно. Рассмотрим следующее квантовое состояние двухкубитовой Вселенной: Ндв - «|0>л ® 1°>в + Ь| 1)А ® |1)в- (2.46) В этом состоянии кубиты А и В корре/шрованы. Допустим, мы измеряем кубит А, проецируя его на базис {|0) А, 11) А}. Тогда с вероятностью |а|2 мы получим результат [0)А, а измерение приготовит состояние |0)А®|0)в; (2.47) с вероятностью |6|2 мы получим результат [1)А, а измерение приготовит состояние |1)д®|1)в. (2.48) В каждом случае, в результате измерения выбирается определенное состоя- ние кубита В. Если мы сразу за этим измерим кубит В, то наверняка (с ве- роятностью единица) обнаружим его в состоянии |0)в, если перед этим было получено |0)А, и — в состоянии |1)д, если предыдущим результатом было |1)А. В этом смысле результаты измерений {|0)д, |1Ы и {|0)в, |1)й} полностью скоррелированы в состоянии |^>) 4В.
62 Глава 2 Теперь я хотел бь! рассмотреть более общие наблюдаемые, действу- ющие на кубит А, и я хотел бы характеризовать результаты измерения только А (независимо от результатов любых измерений недоступного куби- та В}. Наблюдаемую, действующую только на кубит Л, можно представить в виде МА®1В, (2.49) где Мл - действующий на А самосопряженный оператор, а 1в дей- ствующий на В единичный оператор. Ожидаемое значение наблюдаемой в состоянии |V’)АВ равно ® ~ ® в(0| +- ® В(1 |)МЛ ® 1д (а|О)А®|О)е+Ь|1)л® |1)в) = - 1«|2а(0|Мл|0)л + W2 А (1|МЛ|1)Л (2.50) (где мы воспользовались ортогональностью [0)в и |1)в). Это выражение можно переписать в форме (Мл) - tr(MApA), (2.51) Ра - ИЖ А (01 (2.52) a tr обозначает след. Оператор рЛ называет ся оператора» плотности (или матрицей плотности) кубита А. Он самосопряжен, положителен (его соб- ственные значения неотрицательны) и имеет единичный след (посколь- ку |^’) являются нормированными состояниями). Поскольку (Мл) имеет вид (2.51) для любой наблюдаемой МА, дей- ствующей на кубит А, та логично интерпретировать рА как ансамбль воз- можных квантовых состояний, каждое из которых возникает с определен- ной вероятностью. Другими словами, мы получили бы для (МА) тот же самый результат, если бы предположили, что кубит А находится в одном из двух квантовых состоянии. Причем с вероятностью р0 - |а|2 он находится в состоянии |0)А, а с вероятностью pL = [i>(2 — в состоянии |1}А. Если нас интересует результат любого возможного измерения, мы можем рассмат- ривать в качестве Мл проектор Ел(а) на соответствующее собственное пространство наблюдаемой. Тогда Prob(a) -?оА<О(ЕА(а)|О)А+Р1 А<1|ЕЛ(«)|1)А, (2.53) что представляет собой вероятность результата а, взвешенную вероятно- стью каждого квантового состояния и просуммированную по всему ан- самблю.
2.3. Матрица плотности 63 Мы уже обращали внимание на существенное различие между коге- рентной суперпозицией состояний |0)А и |1)А и вероятностным ансамблем, в котором каждое из состояний |0)А и |1)А может появляться с конкретной вероятностью. Например, для объекта со спином-1/2 мы видели, что если мы измеряем <7, в состоянии ^=(Мг) + I IJX т0 с единичной вероятно- стью получим результат | f г) Но ансамбль, в котором каждое из состояний | Тг) и | 1г) появляется с вероятностью 1/2, представляется оператором плотности Р - |(i Тг)(Ъ I t- I h>(k I) - |1, (2.54) тогда проекция на j j,.) имеет ожидаемое значение (2.55) & Фактически мы видели, что любое представляемое лучом состояние одного кубита можно интерпретировать как спин, ориентированный вдоль некото- рого определенного направления. Но, поскольку левая часть (2.55) не изме- няется при унитарном преобразовании базиса, а состояние [ф(0, у?)) можно получить унитарным преобразованием состояния | fz), мы видим, что для р, определяемого уравнением (2.54), (2.56) Следовательно, если приготовлено состояние |^)AJ3 (2.46) с |а|2 — |(>|2 - — 1 /2, то при измерении спина А вдоль любой оси мы получим совершенно случайный результат; каждая из ориентаций спина, вверх или вниз, может появиться с вероятностью 1/2. Это обсуждение корре.тированного двухкубитового состояния |^)АВ очевидным образом распространяется на произвольное состояние любой бинарной квантовой системы (системы, состоящей из двух частей). Гиль- бертовым пространством бинарной системы является НА®НВ, где НА в — 1ильбертово пространство одной из составляющих систему частей. Это означает, что если {|г)А} — ортонормированный базис в НА, а {|/з)в} — ортонормированный базис в Нв, то {|г}л— ортонормированный ба- зис в НА®НВ. Таким образом, произвольное чистое состояние в НА®НВ может быть представлено в виде разложения К'Ьв = (2 57)
64 Глава 2 где 52 iai1Ml2 1- Ожидаемое значение наблюдаемой Мл ® 1в, действую- щей только на подсистему А, равно (Мд) — дв(^’!Мл ® IrI^ab — "" У A(J i & я(ИМА ® гВ У а».д1»>А® I/O В = 3,и i,n = У <МЙ»,М а0'|Мд|0а = -Гг(Млрд), (2.58) где Ра = tr2,(|y>)AS АВШ = У й,,д<мЮаа0'1- (2.59) i,3,U Мы говорим, что оператор плотности рА подсистемы А получается взя- тием частичного следа от матрицы плотности (в рассматриваемом случае от чистого состояния) составной системы АВ по переменным подсисте- мы В. Из определяющего уравнения (2.59) непосредственно следует, что рА обладает следующими свойствами: 1) рА — самосопряженый оператор: рА = рА; 2) рА положительный оператор: для любого |^)л aW’IPaIV’Ja = - Е IE^aWJaP > °; м « 3) trpA = 1: мы имеем tr — 52 = 1, поскольку состояние |V0ab г,/, нормировано. Отсюда следует, что рА может быть диагонализован, что все его собствен- ные значения вещественны и неотрицательны и что сумма его собственных значений равна единице. Если мы наблюдаем подсистему большей системы, то, даже если состоянием большей системы является луч, состояние подсистемы тако- вым не будет; в общем случае оно описывается оператором плотности. В том случае, когда состоянием подсистемы является луч, мы называ- ем его чистым. В противном случае — состояние является смешанным.
2.3. Матрица плотности 65 Если состоянием является чистое состояние |^)д, то матрица плотно- сти Ра = К'>а Л(у| представляет собой проектор на одномерное про- странство, натянутое на |#)д. Следовательно, матрица плотности чисто- го состояния обладает свойством р*А = рА. В общем случае матри- ца плотности, разложенная в базисе, в котором она диатональна, име- ет вид . = (2-6°) а те 0 1 и — 1- Если состояние нс является чистым, то <2 эта сумма состоит из двух или большею числа слагаемых и рА / рА: фактически trp^ — Р2а < 52 Ра ~ Е Мы говорим, что р пред- ставляет некогерентную суперпозицию состояний {|wa)}; некоюрентность означает, что относительные фазы |^'а) экспериментально ненабпюдае- мы. Поскольку ожидаемое значение наблюдаемой М, дейст вующей на под- систему, может быть представлено в виде (М) - irMp -(2.61) А мы, как и прежде, видим, что р можно интерпретировать как ансамбль чистых квантовых состояний, в котором состояние \фа) появляется с веро- ятностью ра Таким образом, мы прошли большую часть пути к понима- нию того, как в квантовой механике возникают вероятности, когда кван- товая система А взаимодействует с другой системой Я. Состояния А и Н становя гея запутанными, та есть коррелированными. Запутывание разру- шает когерентность суперпозиции состояний, так что некоторые фазы становятся ненаблюдаемыми, если мы следим за одной только Л. Мы мо- жем описывать эту ситуацию, говоря, что происходит коллапс (редукция) состояния системы А она находится в одном из множества альтерна- тивных состояний, каждому из которых может быть приписана вероят- ность, 2.3.2. Сфера Блоха Вернемся к случаю, в котором системой А является один кубит, и рас- смотрим общую форму матрицы плотности. Наиболее общая самосопря- женная 2 х 2-матрица зависит от четырех вещественных параметров и мо- жет быть разложена в базисе {1, <71; o-.J. Поскольку каждая из мат- риц cri является бссследовой, коэффициент перед 1 в разложении матрицы
66 Глава 2 плотности р должен быть равен 1/2 (так чтобы trp - 1), а р может быть разложена как р(РН 1(1+ £.<?) = & = 1(1 + Pj<TL + P2cr2 + Рjcr3) — _ X ( 1 + А А — *А А 2 \ Pt + iP2 1 - Рз J ' (2,62) Мы можем вычислить detp — 1(1 — Р2). Следовательно, необходимым условием неотрицательности собственных значений р является неравен- ство detp 0 или Р2 < 1. Это условие также и достаточно; поскольку trp — 1 и р не может иметь два отрицательных собственных значения. Таким образом, имеется взаимно однозначное соответствие между возмож- ными матрицами плотности одиночного кубита и точками единичного трех- мерного шара 0 < |Р| 1. Этот шар обычно называют сферой Блоха (хотя, конечно, э го в действительности шар, а не сфера). Граница (|Р[ - I) шара (которая как раз и является сферой) содержит матрицы плотности с нулевым детерминантом. Поскольку trp — 1, эти матрицы плотности должны иметь собственные значения 0 и 1. Они пред- ставляют собой одномерные проекторы и, следовательно, чистые состоя- ния. Мы уже видели, что каждое чистое состояние одного кубита имеет вид и может рассматриваться как ориентация спина в (б, ^-на- правлении. Действительно, используя свойство (п-<?)2 = 1, (2.63) где п — единичный вектор, мы можем легко убедиться в том, что матрица плотности чистого состояния р(п) 1(1 + h (?) (2.64) обладает свойством (h-cr)p(h) ^p(n)(n-<?) = р(п) (2.65) и, следовательно, является проектором р(п) ~ |^(Й)){>(п)| ; (2.66)
2.3. Матрица плотности 67 то есть п представляет собой направление, вдоль которого ориентируется спин И наоборот, из выражения 1Ж ¥>)) = е-»<^/2 cos | e+’^sin^ (2-67) можно непосредственно найти, что / cos2 | cos | sin \ I cos sin |e+’* sin2 | / li.l/ cos# fi_,9?sin# A 1Z1 , » -21+Це+-^„« -<».« )“ 2(1 + »'ff>’ <2-68’ где n - (sin# cos(/5,sin# siny?. cos#). Приятным свойством блоховской па- раметризации чистых состояний является то, что, хотя |^(#, у)) имеет фи- зически несущественную произвольную общую фазу, в матрице плотно- сти р(#, у?) — l^f#, <р))(0(#, </?)| этой неоднозначности нет; все параметры в р имеют физический смысл. Из свойства | tr (2.69) следует, что (n-<f)p = tr (n - = n- P. (2.70) Таким образом, вектор в уравнении (2.62) параметризует поляризацию спина. Если в нашем распоряжении имеется множество идентично приго- товленных систем, мы можем определить Р [и, следовательно, полностью матрицу плотности р(^)], измеряя (п • <?) вдоль каждой из трех линейно независимых осей. 2.3.3. Теорема Глизоаа Отправляясь от аксиом квантовой механики и рассматривая описание части большей квантовой системы, мы пришли к понятию матрицы плотно- сти р и выражению tr(Mp) для ожидаемого значения наблюдаемой М. Тем более приятно узнать, что формализм матрицы плотности является очень
68 Глава 2 общим и применим в гораздо более широких пределах. В этом состоит содержание теоремы Глизона (1957). Теорема Глизона исходит из предпосылки, что задачей квантовой тео- рии является сопоставление соответствующих вероятностей всем возмож- ным ортогональным проекциям в гильбертовом пространстве (другими сло- вами, всем возможным измерениям наблюдаемых). Тогда состоянием квантовой системы является отображение, которое каждой проекции (Е2 — Е и Е — Е^) ставит в соответствие неотрицатель- ное вещественное число, не превосходящее единицу: Е —» р(Е), 0О(Е)«И. (2.71) Это отображение должно обладать свойствами: (1) р(0) = 0. (2) (3) Если ExE2 — 0, то p(Ej + Е2) = р(Ех) +р(Е2). Решающим здесь является постулат (3). Он утверждает, что (поскольку про- екции на взаимно ортогональные пространства могут рассматриваться как взаимно исключающие альтернативы) вероятности, приписываемые взаим- но ортогональным проекциям, должны быть аддитивными. Это очень силь- ное предположение, поскольку существует мною различных способов вы- бора Ех и Е2. Грубо говоря, первые два предположения утверждают, что, какое бы измерение мы ни делали: (1) всегда есть его результат; (2) ве- роятность суммы всех возможных (взаимно ортогональных) исходов равна единице. В этих предположениях Глизон показал, что если размерность гиль- бертова пространства больше двух, то для любого такого отображения су- ществует эрмитовский, положительный оператор р с единичным следом tr р = 1 такой, что р(Е) = 1г(рЕ). (2.72) Таким образом, формализм матрицы njtoi пости действительно является необходимым, если мы представляем наблюдаемые самосопряженными операторами в гильбертовом пространстве и приписываем определенные вероятности каждому возможному результату измерения. Грубо говоря, тре- бование аддитивности вероятностей взаимно исключающих результатов на- столько сильно, что мы с необходимостью приходим к линейному выраже- нию (2.72).
2.3. Матрица плотности 69 Случай двумерного гильбертова пространства является особым, по- скольку именно в двух измерениях оказывается недостаточным взаимно исключающих проекций. Все нетривиальные проекции имеют вид Е(п) = |(1 + й-<т), (2.73) но E(n)E(m) — 0 (2.74) только при т -- —ft; следовательно, любая определенная на двумерной сфере функция /(й) такая, что f(n) + /(-й) = 1, удовлетворяет условиям теоремы Глизона, а таких функций существует много. Но в трех измерени- ях может быть больше альтернативных способов разбиения единицы, так что предположения Глизона гораздо сильнее. Мы не приводим здесь дока- зательства теоремы. (Для обсуждения см. книгу Переса, стр. 190)1. 2.3.4. Эволюция оператора плотности До сих пор мы пе обсуждали эволюцию во времени смешанных состоя- ний. В случае бинарной системы, подчиняющейся обычным аксиомам кван- товой теории, предположим, что ее гамильтониан в пространстве 77 л ® Нв имеет вид Нлв -- -Ид & ® Нв. (2.75) В этом прс/щоложении подсистемы А и В не связаны между собой, так что каждая из них эволюционирует независимо. Оператор эволюции комбини- рованной системы илв(«)-ил(^)®ив(^ (2.76) расцепляется на отдельные унитарные операторы эволюции, действующие каждый на свою систему. Тогда в шредингеровской картине динамики начальное чистое состоя- ние |р(0))дВ бинарной системы, заданное уравнением (2.57), эволюциони- рует как (2.77) где Ша = ил^))*(0))А, (2.7 о J _______________________1МФв - Un(f)|M(O))А ’A. Peres, Quantum Theory: Concepts and Methods, Kluwer Academic Publishers, New York et al (2002).
70 Глава 2 определяют новый ортогональный базис в НА и Т(в [так как ил (<) и UB(i) унитарны]. Вычисляя, как и раньше, частичный след, находим РаЮ - £ = UA(t)pA(0)UV*). (2.79) Таким образом, UA(t) определяет эволюцию матрицы плотности. В частности, в базисе, в котором рА(0) диагональна, имеем PaW = Ep0Ua(Wo(0)>a AK(oM(i). (2.80) а Уравнение (2.80) говорит о том, что эволюция рА полностью согласуется с интерпретацией ансамбля. Эволюция во времени каждого состояния в ан- самбле управляется оператором Uд(/). Если состояние )<ув(0))А с вероят- ностью ра возникает в момент времени I — 0, то с той же вероятностью ра состояние |^o(t))A возникает в последующий момент времени t. С другой стороны, должно быть ясным, что уравнение (2.80) справед- ливо только в предположении о том, что системы А и В динамически не связаны между собой. Ниже мы исследуем, как эволюционирует матрица плотности при более общих условиях. 2.4. Разложение Шмидта Чистое двухкубитовое состояние может быть представлено в стандарт- ной форме (разложение Шмидта), которая часто оказывается полезной. Чтобы прийти к этой форме, заметим, что произвольный вектор из ® Нв может был, разложен как №)ав Еа>м1^л|м)в = Е 1*>аЮв. (2«1) Здесь {|г)д } и {|р)в} — ортогональные базисы в НА и 1iB соответственно. Чтобы получить второе равенство в (2.81), мы положили по определению ~ (2.82) м Заметим, что векторы |i)B не обязаны быть взаимно ортогональными или нормированными.
2.4. Разложение Шмидта 71 Предположим теперь, что {| i} А} — базис, в котором рл диагональна Рл = £2р,10аа(*1- (2.83) г Мы можем также вычислить рА, выполняя операцию взятия частичного следа Ра = tre (Млл abW’I) = = trB ® 10в в 6l) = 52b6'I0b(I0aa(jI)- (2-84) Последнее равенство в (2.84) получено с учетом того, что trB (1г)вв 6'1) ~ к ~ У?вб1^)вв(^1г)в = вОЮв’ (2.85) k где {|А:)£} - ортонормированный базис в Т-(в. Сравнивая уравнения (2.83) и (2.84), мы видим, что в(Мв=Р&,- (2-86) Следовательно, в конце концов оказалось, что {|г)в} взаимно ортогональ- ны. Соответствующим изменением масштаба мы получаем ортонормиро- ванные векторы Юв-рГ1/2|0в (2.87) [мы можем полагать рг / 0, поскольку уравнение (2.87) необходимо только для фигурирующих в сумме (2.83) слагаемых] и, следовательно, разложение Ж АВ = ^2у/р№а\1}в (2.88) в специальных ортонормированных базисах в 7/^ и . Уравнение (2.88) представляет собой разложение Шмидта чистого двухкубитового состояния 1С.-/ДД* 1 Любое чистое двухкубитовое состояние может быть представлено в этой форме, но, естественно, используемые при 'Разложение Шмидта было получено задолго до появления квантовой механики: Е. Schmidt, Zur lheorie tier linearen and nichtlinearen integralgleichungen, Math. Aunalen, 63, 433-476 (1906). — Прим pet)
72 Глава 2 этом базисы зависят от разлагаемого состояния. В общем случае мы не мо- жем одновременно разложить |ф)лс и |^)АВ € НА ® Нв в виде (2.88), используя /VIM этого одни и те же ортонормированные базисы в TiA и Нв. Используя уравнение (2.88), мы можем также вычислить частичный след по НА и получить Рв — tr.4 AB М) = Ю В В (И- (2.89) г Мы видим, что р А и рв имеют одинаковые ненулевые собственные числа. Конечно, при этом совсем не обязательно, чтобы 'НА и имели одина- ковые размерности, гак что количество нулевых собственных значений рА и может различаться. Если рА (и, следовательно, рв) не имеет других вырожденных соб- ственных значений, кроме нулевых, тогда разложение Шмидта состояния |v) существенно однозначно определяется матрицами плотности рА и рв. Мы можем диаюнализовать рА и рв, чтобы найти векторы |г)л и |«')в. После этого мы объединим в пары собственные состояния рА и рв, отвечающие одинаковым собственным значениям, чтобы получиib (2.88). Мы выбрали фазы наших базисных состояний так, чтобы они не возника- ли в коэффициентах в суммах; сохранилась лишь свобода переопределе- ния векторов |г)д и {г')в путем умножения их на противоположные фазы (что, конечно, оставляет неизменным выражение (2,88)). По если рА имеет вырожденные ненулевые собственные значения, то- гда нам необходимо больше информации, чем та, которая позволила опре- делить разложение Шмидта состояния |ф)лв по рА и рв ; нам нужно знать, какое состояние |?)в объединяется в пару с |i)A. Например, если НА и Нв Лг-мерны, a U4 произвольная унитарная N х N-матрица, то N Мав - -7= £ (2.90) будет давать рЛ — рв — после вычисления парциальных частичных следов. Более того, мы можем выполнить одновременно унитарные преоб- разования в НА и Нв: Пав - ~=£ЮаН% - 7=£u;jj)AUlfc|fc% ; (2.91) г VJV это сохраняет состояние но иллюстрирует имеющуюся здесь неоднозначность базиса, используемого в разложении Шмидта состоя- ния |^)АВ.
2.4 Разложение Шмидта 73 2.4.1. Запутанность Каждому чистому двухкубитовому состоянию можно сопоста- вить положительное целое число, число Шмидта, представляющее собой количество ненулевых собственных значений рЛ (или рв) и, следователь- но, —число слагаемых в разложении Шмидта состояния С помощью этой величины мы можем определить, что значит быть запутанным для чистого двухкубитового состояния: \ф)АВ запутано (или несепарабельно) если его число Шмидта больше единицы; в противном случае оно сепара- бельно (или не запутано). Таким образом, сепарабельное чистое состояние двух кубитов представляет собой прямое произведение чистых состояний из7^иН«; (2.92) тогда и приведенные матрицы плотности рА = |у~)л л(^|, рв - |х)в являются чистыми. Любое состояние, которое не может быть представлено в виде такого прямого произведения, является запутанным; тогда рА и рв представляют собой смешанные состояния. Одна из наших главных целей э того семестра — лучше понять смысл запутанности. Иногда не совсем строго и корректно говорят, что подси- стемы А и 13 не коррелированы, если состояние |v)ab сепарабельно; в конце концов, два спина в сепарабельном состоянии I ПаI Пн. (2.93) несомненно, коррелированы оба они ориентированы в одном направле- нии. Однако характер корреляций между А и В в запутанном и сепарабель- ном состояниях различен. Вероятно, решающим различием является то, что запутанность неюкальна. Едино венным способом запутать Ак В являет- ся для двух подсистем их непосредственное взаимодействие друг с другом. Мы можем приготовить состояние (2.93), не приводя спины А и В в контакт друг с другом. Нам нужно только послать сообщение (классиче- ское!) двум ассистентам (Алисе и Бобу1), чтобы оба они приготовили спин в состоянии, ориентированном вдоль оси z. Но едиственным способом пре- вратить (2.93) в запутанное состояние, типа -^(|1>а1Т>в I ШМ (2-94) является применение к нему коллективного унитарного преобразования. Локальные унитарные преобразования вида ил и выполненные Али- сой и Бобом локальные измерения не могут увеличить число Шмидта 1 Алиса и Боб (А и В) традиционные персонажи теории квантовой информации. - Прим ред
74 Глава 2 двухкубитового состояния, независимо от того, как долго Алиса и Боб об- суждали свои действия. Чтобы запутать два кубита, мы должны собрать их вместе и позволить им взаимодействовать. Как мы обсудим позже, можно также определить различие между за- путанным и сепарабельным двухкубитовыми смешанными состояниями. Мы также обсудим различные способы, которыми локальные операции мо- гут модифицировать форму запутанности, а также некоторые возможности использования запутанности. 2.5. Неоднозначность интерпретации ансамблей 2.5.1. Выпуклость Напомним, что оператор р, действующий в гильбертовом простран- стве 7Т, может рассматриваться как оператор плотности, если он обладает тремя свойствами: (1) р самосопряжен; (2) р неотрицателен; (3) tr(p) = 1. Отсюда непосредственно следует, что из двух данных матриц плотно- сти р} и р2 мы всегда можем построить другую матрицу плотности как выпуклую линейную комбинацию: при любом вещественном А, удовлетво- ряющем 0 й А < 1, р(А) — Apt 4 (1 — А)р2 (2.95) представляет собой матрицу плотности. Легко видеть, что р(А) удовлетво- ряет свойствам (1) и (3), если ими обладают рг и р2. Чтобы проверить (2), вычислим (^Ip(A)|Vj) = a(V'IpiI^) г (1 - aXV'IpsIV') > °; (2 96) неотрицательность р(А) обеспечивается тем, что таковыми являются рг и р2 Таким образом, мы показали, что в гильбертовом пространстве Н раз- мерности N операторы плотности образуют выпуклое подмножество ве- щественного векторного пространства эрмитовых N х .V-матриц. (Подмно- жество векторного пространства называется выпуклым, если оно содержит отрезки прямых линий, соединяющие любые две его точки.)
2.5. Неоднозначность интерпретации ансамблей 75 Большинство операторов плотности могут быть многими различными способами представлены в виде сумм других операторов плотности. В этом отношении чистые состояния занимают особое положение — невозможно выразить чистое состояние как выпуклую сумму двух других чистых со- стояний. Рассмотрим чистое состояние р = |^){^|; пусть |^L) обозначает вектор, ортогональный \ф), \ф} — 0. Предположим, что р можно разло- жить, как в уравнении (2.95); тогда = 0 - Wj IpJV'J + (1 - A)(i/>JP2NM- (2.97) Так как правая часть является суммой двух неотрицательных слагаемых, оба они должны быть одновременно равны нулю. Если А нс нуль и не еди- ница, то отсюда следует, что и р/ортогональны |^±). Но поскольку |^±) может быть любым вектором, ортогональным [ф), мы приходим к выводу, ЧТО Р! = Р2 - р. Векторы выпуклого множества, которые не могут быть представлены в виде линейной комбинации других векторов этого множества, называются крайними точками множества Мы только что показали, что чистые состоя- ния являются крайними точками множества матриц плотности. Более того, только чистые состояния являются крайними, поскольку любое смешанное состояние может быть записано как р -- J2pJi)(*| в базисе, в котором оно диагонально, что является выпуклой суммой чистых состояний. Мы уже встречались с этой структурой в обсуждении частного случая сферы Блоха. Мы говорили, что операторы плотности заполняют (единич- ный) шар в трехмерном множестве эрмитовых 2 х 2-матриц с единичным следом. Шар является выпуклым, а его крайними точками являются точки на поверхности. Аналогично, N х ;У-операторы плотности образуют выпук- лое подмножество (№ — 1)-мерного множества эрмитовых N х ^матриц с единичным следом, крайними точками которого являются чистые состоя- ния. Однако в одном отношении 2 х 2-случай нетипичен: при N >2 точки на границе множества матриц плотности не обязательно являются чистыми состояниями. Границу множества образуют все матрицы плотности, име- ющие хотя бы одно нулевое собственное значение (поскольку существу- ют сколь угодно близкие к ним матрицы с отрицательными собственными значениями). Такая матрица плотности при .V > 2 не является чистой, по- скольку число ее ненулевых собственных чисел может превышать единицу. 2.5.2. Приготовление ансамбля Выпуклость множества матриц плотности имеет простую, проясняю- щую суть дела, физическую интерпретацию. Допустим, что ассистент со-
76 Глава 2 глассн । (риготовить одно из двух возможных состоянии; состояние ру го- товится с вероятностью А, а состояние р2 с вероятностью 1 - А. (Мож- но воспользоваться генератором случайных чисел, чтобы осуществить э тот выбор.) Чтобы вычислить ожидаемое значение любой наблюдаемой М, мы усредняем ее по обоим выборам приготовления, а результат квантового измерения есть (М) — А(М)Х 4-(1 — А)(М)2 = ^AtrfMpJ |- (1 — A)tr(Mp2) — = tr(Mp(A)). (2.98) Таким образом, все ожидаемые значения не отличимы от чех, что мы полу- чили бы, если бы вместо этою было приготовлено состояние р(А) Таким образом, мы имеем операционную процедуру, данные методы приготовле- ния состояний pj и р2 для приготовления произвольной выпуклой комби- нации. Действительно, для любою сметанного состояния р существует бес- конечное множество способов его предст авления в виде выпуклой комби- нации других состояний и, следовательно, бесконечное разнообразие про- цедур, которые мы могли бы применить для приготовления р. И каждая из этих процедур ведет к одним и тем же следствиям для любой мыслимой наблюдаемой рассмазривасмой системы. Ио чистое состояние совсем дру- гое оно может быть приготовлено одним единственным способом, (То есть оно «чистое» относительно чистых состояний.) Каждое чистое состоя- ние является собственным состоянием некоторой наблюдаемой, например, для состояния р — |^Ж'| измерение проекции Е — гарантирует результат 1. (В качестве примера вспомним, что каждое чистое сос тояние одного кубита представляет собой состояние типа «спин вверх» вдоль неко- торой оси). Поскольку р является состоянием, для которого результат из- мерения Е со 100% вероятностью равен единице, нет никакой возможно- сти воспроизвести это наблюдаемое свойство, выбирая один из несколь- ких возможных способов его приготовления. Таким образом, приготовле- ние чистого состояния совершенно однозначно (мы можем установить этот единственный способ его приготовления, если имеем множество копий со- стояния, чтобы поэкспериментировать с ними), тогда как в приготовлении смешанного состояния всегда возможны варианты. Как велика эта неоднозначность? Так как любое р можно предста- вить в виде суммы чистых состояний, задержим наше внимание на следу- ющем вопросе: насколько большим числом способов может быть представ-
2.5. Неоднозначность ин терпретации ансамблей 77 лен оператор плотности как выпуклая сумма чистых состояний? Математи- чески этот вопрос звучит так: насколько большим числом способов можно записать р в виде суммы крайних состояний! В качестве первого примера рассмотрим «максимально смешанное» состояние одного кубита: Р = |1- (2-99) Такое состояние действительно может быть приготовлено бесконечным числом способов как ансамбль чистых состояний. Например, Р= || ТЖ I I ||1ЖЬ (2.100) такое р мы получим, если приготовим состояния или | j2), или | 1г), появ- ляющиеся с вероятностью каждое. Но также мы имеем р=||ТЖ1 + |ЦЖ1, (2.101) такое р мы получим, если приютовим состояния или | |л), или | по- являющиеся с вероятност ью А каждое. Эта процедура приготовления, бес- спорно, другая, Тем не менее, наблюдая за одним спином, разницу между ними обнаружить невозможно. И вообще, центральная точка шара Блоха является суммой любых двух диаметрально противоположных точек на сфере, поэтому, приготовив или | Тл), или | )л), появляющиеся с вероятностью А каждое, мы тем самым приготовим состояние р — А 1. Различные способы приготовления риз ансамбля взаимно ортогональ- ных чистых состояний существуют только тогда, когда р имеет два (или более) вырожденных собственных значения. Однако у нас нет серьезных оснований ограничивать наше внимание этими ансамблях. Мы можем рас- смотреть точку внутри шара Блоха р(Р)-|(1 (2.102) с 0 < |Pj < 1; это состояние также можно выразить как Р(Р) = Ap(nJ 4 (1 - А)р(п2), (2.103)
78 Глава 2 если р = Xhx + (1 - А)п2 (или, другими словами, Р лежит где-нибудь на отрезке прямой, соединяющей точки сферы hL и й2). Очевидно, что для любого Р существует такое решение, связанное с любой хордой сферы, проходящей через точку Р; все такие хорды образуют двухпараметрическое семейство. Эта высокая степень неоднозначности приготовления смешанного квантового состояния является одной из характерных особенностей кванто- вой информации, которая резко контрастирует с классическими вероятност- ными распределениями. Рассмотрим в качестве примера распределение ве- роятностей одного классического бита. Существует два крайних распреде- ления таких, в которых 0 или 1 возникают со 100% вероятностью. Любое распределение вероятностей для бита является выпуклой суммой этих двух крайних точек. Аналогично, если имеется W возможных состояний, то су- ществует N крайних распределений, а любое распределение вероятностей имеет единственное разложение по этим крайним распределениям (выпук- лое множество распределений вероятностей образует симплекс). Если 0 по- является с вероятностью 21%, 1-е вероятностью 33%, а 2 — с вероятно- стью 46%, то существует единственная процедура приготовления, которая дает эго распределение вероятностей! 2.5.3. Быстрее света? Вернемся теперь к нашей ранней точке зрения - смешанное состоя- ние системы А возникает вследствие запутывания А с системой В — что- бы продолжить рассмотрение последствий неоднозначности приготовления смешанных состояний. Если кубит имеет матрицу плотности РА-|| Uaa'X l + |l WaaUJ, (2.104) эта матрица плотности моша бы возникнуть в результате запутывания двух- кубитового чистого состояния |ф)АВ, представимого в виде разложения Шмидта: \Ф>АВ - "7=0 TJb + I Ш IJb). (2.105) Следовательно, интерпретация ансамбля рА, в котором приготовлено или состояние | Тг)д, или состояние | {г)А (каждое с вероятностью р — 1/2), может быть реализована выполнением измерения кубита В. Мы измеря- ем кубит В в базисе {| fz)£, | J.Jв}; если подучается результат | ]г)в> то приготовлено состояние | |г)л, если же получается результат | 1г)в, то приготовлено | 1г)А.
2.5. Неоднозначность интерпретации ансамблей 79 Но, как уже отмечалось, в этом случае базис Шмидта не единстве- нен, поскольку рА имеет вырожденные собственные значения. Мы можем одновременно применить унитарные преобразования к кубитам А и В (ес- ли мы применяем U к А, то к В мы должны применить U*), не меняя при этом двухкубитовое чистое состояние |V>)АБ. Следовательно, для лю- бого единичного трехмерного вектора п состояние \v) Ав имеет разложение Шмидта вида I1/1)АВ = "^=(1 Tft)д| Тй')в + I -к)д1(2,106) Отсюда видно, что, измеряя кубит В в подходящем базисе, мы можем реа- лизовать любую интерпретацию рА как ансамбля двух чистых состояний. Вдумчивые студенты после знакомства с этим свойством иногда за- гораются идеей предложить механизм сверхсветовой системы связи. Гото- вится много копий состояния IV’) дв- Алиса забирает кубиты А с собой на туманность Андромеды, а Боб оставляет все кубиты В на Земле. Когда Боб хочет послать Алисе однобитовое сообщение, он выбирает, измерить ли ему <т1 или <т3 на всех своих спинах, приготовив таким образом спины Алисы в одном из двух ансамблей: {| |г.)л, | 1^} или {| ]Z)A, | )Z)A}? Чтобы прочитать сообщение, Алиса сразу вслед за этим измеряет свои спи- ны, чтобы увидеть, какой ансамбль был приготовлен. Но еще более вдумчивые студенты (или студенты, слышавшие преды- дущую лекцию) могут разглядеть изъян в этой схеме. Несмотря на то, что оба метода приготовления несомненно различны, оба ансамбля описыва- ются в точности одной и тай же матрицей плотности рА. Таким образом, Алиса не может сделать никакого мыслимого измерения, чтобы различить эти два ансамбля, и нет возможности сообщить ей, какое действие совер- шил Боб. Сообщение «нечитабельно». Почему тогда мы так уверенно утверждаем, что «оба метода приго- товления несомненно различны»? Чтобы развеять любые сомнения относи- тельно этого, представим, что Боб: (1) измеряет все свои спины вдоль оси £ или (2) измеряет все свои спины вдоль оси z, а затем вызывает Алису по межгалактическому телефону. Он не говорит Алисе, какое измерение он выполнил, (1) или (2), но сообщает ей все их результаты: «первый спин направлен вверх, второй вниз» и т.д.. Теперь Алиса выполняет изме- рения (1) или (2) со своими спинами. Если они оба измеряли вдоль одной и той же оси, то Алиса обнаружит, что каждый из результатов ее измерений согласуется с тем, что нашел Боб. Но если Алиса и Боб выполняли измере- ния вдоль разных (ортогональных) осей, то Алиса не обнаружит никаких ' В э(ом случае U вещественно, поэтому U — U*,а п — п'.
80 Глава 2 корреляций между их результатами. Примерно половина результатов ее из- мерений будет согласоваться с результатами Боба, примерно половина — противоречить им. Если Боб обещает выполнить (1) или (2) и предпола- гается отсутствие ошибок в приготовлении или измерении, тогда Алиса будет знать, что их действия были различными (даже если Боб не сообщал ей этой информаций), сразу, как только результат одною из ее измерений вступит в противоречие с тем, что нашел Боб. Если же результаты всех их измерений сотласуются, тогда, если было проведено достаточно много из- мерений, с очень высоким уровнем значимости Алиса будет считать, что она и Боб выполняли измерения вдоль одной и той же оси. (Даже с учетом возможных ошибок измерения этот статистический тест будет оставать- ся надежным, если частота появления ошибок достаточно низка). Таким образом, Алиса имеет возможность различить два использованных Бобом метода приготовления, однако в этом случае нет сверхсветовой связи, по- скольку прежде чем Алиса смогла выполнить свою проверку, ею получен телефонный вызов от Боба. 2,5.4. Квантовое удаление (информации) Мы говорили, что матрица плотности рЛ — описывает спин в некогерентной суперпозиции чистых состояний | ('г)л и | |г)л. Оно от- личимо от когерентной суперпозиции этих состояний, такой как IL4J = |(1Тг)±Ш; (2.107) £ в этом случае относительная фаза двух состояний имеет наблюдаемые след- ствия (отличает | Тж) от | |л,)). В случае некогерентной суперпозиции отно- сительная фаза полностью ненаблюдаема. Суперпозиция становится неко- герентной, если спин А запутывается с другим спином В, недоступным для наблюдения. С эвристической точки зрения состояния | Тг)д и | могут ин- терферировать (может быть наблюдаемой относительная фаза этих состо- яний) только тогда, когда мы не имеем информации о том, находится ли спин в состоянии | 1'я)л или в состоянии | (г)л. Даже более того, интер- ференция может наблюдаться только тогда, когда в принципе нет никакой возможности определить, находится ли спин в состоянии вверх или вниз вдоль оси z. Запутывание спина А со спином В разрушает интерференцию (по причине декогер ентизации А), поскольку у нас появляется принципи- альная возможность определить, находится ли спин А в состоянии вверх или вниз вдоль оси z, выполняя соответствующее измерение спина В.
2.5. Неоднозначность интерпретации ансамблей 81 Но сейчас мы увидим, что утверждение о том, что запутывание яв- ляется причиной декогерентизации, требует оговорки. Допустим, что Боб измеряет спин В вдоль оси х, получая в качестве результата или | или | и посылает результат своего измерения Алисе. Теперь спин Алисы находится в чистом состоянии (или в | Гж)л, или в | (.д.)^), а факти- чески в когерентной суперпозиции | '\г)А и | |г)л. Мы сумели восстановить чистоту состояния спина Алисы, прежде чем ее скрыло облако декогерен- тизации! Предположим, что Боб позволил своему спину пройти через прибор Штерна-Герлаха, ориентированный вдоль оси г. Ну, конечно, спин Али- сы не может вести себя, как в состоянии когерентной суперпозиции | [2)л и | lz)A; всего лишь проследив за тем, по какому пути прошел его спин, Боб будет знать, ориентирован ли спин Алисы вверх или вниз вдоль оси z. Но допустим, что Боб не производит наблюдений. Вместо этого он вновь тщательно фокусирует два пучка, не делая никакой записи о том, вверх или вниз переместился его спин, после чего позволяет пройти спину че- рез второй прибор Штерна-Герлаха, ориентированный вдоль оси х. На этот раз он производит наблюдение и сообщает Алисе результат своего измерения o-j. Теперь когерентность состояния спина Алисы восстанов- лена! Эта ситуация была названа квантовым ластиком. Запутывание двух спинов создаст «ситуацию измерения», в котором теряется когерент- ность | (г)л и | вследствие чего, наблюдая за спином В, мы можем выяснить, ориентирован спин А вверх или вниз вдоль оси z. Но когда мы (вслед за этим) измеряем спин В вдоль оси х, эта информация «стирается». Ни результат | ни I Ов ~ ничего не сообщают нам о том, ориенти- рован ли спин А вверх или вниз вдоль оси z, поскольку Боб не позаботился сохранить информацию «какой путь», что можно было сделать, наблюдая за движением спина в первом приборе Штерна -Герлаха1. Следовательно, для спина А вновь возможно поведение типа когерентной суперпозиции I Тг)д и I (и эта после того, как Ашса узнает о результате Боба). Мы можем лучше понять квантовый ластик с точки зрения ансамбля. Алиса имеет множество спинов, выбранных из ансамбля рА = |1л, и у нее пет возможности наблюдать интерференцию между состояниями | и | Когда Боб выполняет свое измерение вдоль оси х, реализуется конкретно приготовленный ансамбль. Однако это не дает эффекта, который может почувствовать Алиса, — состояние ее спинов, как и прежде, описы- 1 Часто говорят, что была стерта «welcher ^姻-инг|юрчация, поскольку по-немецки это звучит более изысканно [«wclcher weg» (яем.) — «какой путь» (перев.)].
82 Глава 2 вается ансамблем рА = 11А. Но когда Алиса получает телефонное сооб- щение от Боба, она может отобрать субансамбль из тех своих спинов, кото- рые находятся в чистом состоянии ( Сообщенная Бобом информация позволяет Алисе отделить чистые состояния от максимально смешанных, Другой намек на квантовый ластик иногда называют отложенным вы- борам. Это значит; что описанная нами ситуация в действительное™ полно- стью симметрична относительно Алисы и Боба, то есть невозможно опре- делить, кто первым произвел измерение. (Действительно, если измерения Алисы и Боба являются событиями, разделенными пространственно-подоб- ным интервалом, то их следование друг за другом во времени неинвариант- но, оно зависит от системы отсчета, используемой наблюдателем.) Алиса моша бы измерить все свои спины сегодня (скажем, вдоль оси £'), прежде чем Боб решит, как он будет измерять свои спины. На следующей неделе Боб решает «приготовить» спины Алисы в состояниях | fft)A и | |й)д (это и есть «отложенный выбор») После этого он сообщает Алисе о том, какие спины были в состоянии | ТЛ)А, а она может проконтролировать запись его измерения, чтобы убедиться, что - п х. (2.108) Результат будет один и тот же независимо от того, «приготовил» Боб спины до или после измерения Алисы. Мы утверждали, что матрица плотности представляет полное физиче- ское описание подсистемы А, поскольку она характеризует все возможные измерения, которые на ней могут быть выполнены. Иногда раздаются воз- ражения1 , что явление квантового ластика демонстрирует обратаое. Так как полученная от Боба информация даст Алисе возможность извлечь чистое состояние из смеси, то как можно утверждать, что в рА закодировано все, что Алиса может узнать об А? Я не считаю это правильным выводом. Скорее я хочу сказать, что кван- товый ластик предоставляет еще одну возможность повторить наше закли- нание: «Информация материальна». Состояние рА системы А и состоя- ние рА, дополненное информацией, полученной Алисой от Боба, не одно и то же. Эта информация (которая снабжает метками субансамбди) изменя- ет физическое описание. Чтобы выразить это математически, мы должны включить в наше описание «знание Алисы о состоянии». Ансамбль спинов, о котором Алиса не имеет информации, вверх или вниз направлен каждый 'Например, в книге: Roger Penrose, Shadows of the Mind A Search for the Missing Science of Consciousness, Oxford University Press, New York, et al, 1994; перевод Роджер Пенроуз, Теки разума В поисках науки о сознании. Москва Ижевск: ИКИ (2003)
2.5. Неоднозначность интерпретации ансамблей 83 спин, представляет собой другое состояние, нежели ансамбль, в котором Алисе известно состояние каждого спина1. 2.5.5. Теорема ЖХЙВ До сих пор мы рассматривали квантовый ластик только в связи с оди- ночным кубитом, описываемым ансамблем равновероятных, взаимно орто- гональных состояний (то. есть рА — |1А). Это обсуждение можно суще- ственно обобщить Мы уже видели, что смешанное состояние любой квантовой системы можно бесконечным числом различных способов реализовать как ансамбль чистых состояний. Рассмотрим одну такую реализацию для матрицы плот- ности рА Ра - = L (2-109) i t Здесь все состояния {|у\)А} являются нормированными, но не обязательно взаимно ортогональными векторами. Тем не менее рА можно понимать как ансамбль, в котором каждое чистое состояние возникает с ве- роятностью р,. Конечно, для любого такого рА мы можем построить его «очищение», двухкубитовое чистое состояние Ав, которое дает рл при вычислении частичного следа в пространстве 'Нв. Такое очищение имеет вид |Фт> ав = (2.И0) где векторы € Нв взаимно ортогональны и нормированы: в{°ч\аз)в = (2-111) Очевидно, что (1^1) Ан Ав (^*11) “ Рл- (2.112) Более того, мы можем представить выполнение ортогонального измерения в системе В, проецирующее на базис |at) в.? С вероятностью получит- ся результат |а,)в и приготовит чистое состояние А A(^t| системы А, 1 Это «знание состояния» не должно быть действительно состоянием человеческого разу- ма; достаточной будет любая (неодушевленная) запись, помечающая субаясамбль. 2 Пространство Цд может быть и нс натянутым на векторы однако в состоя- нии I'l’-, i' aii никогда не появляются результаты измерения, ортогональные всем |‘>г)
84 1 ЛАВА 2 Таким образом, для данного очищения }АБ состояния существует такое измерение в системе В, при выполнении которого реализуется со- стояние ансамбля р4. По известному результату измерения в В мы успешно выделили одно из чистых состояний смеси рА Только что описанное представляет собой обобщение процедуры при- ютавления состояния | )2)д путем измерения спина В вдоль оси z (в па- шем обсуждении двух запутанных кубитов). Но чтобы обобщить понятие квантового ластика, мы хотим видеть, что, выполняя разные измерения В в состоянии |Ф])ЛВ, можно реализовать разные ишерпрстации ансам- бля рА. Пусть Pa'-Y/iMJaa1^ (2.НЗ) м - другая реализация той же самой матрицы плотности рА как ансамбля чистых состояний. Для этого ансамбля тоже существует соответствующее очищение = У^ (2.114) л где вновь {|ДМ}} — ортонормированные векторы из Итак, в состоя- нии |Ф2) лв мы можем реализовать ансамбль, выполняя в ‘Нв измерение, проецирующее на базис {|/Зц) и}. Как связаны состояния (Ф^ Afj и 1Ф2)ав? Фактически мы можем ле» ко показать, что (2.115) два состояния отличаются унитарным изменением базиса, действующим только в 7iB, или |Ф1)ав ~ У? (2.116) где Юв-и£|Дм)в (2.117) — другой оргонормировапный базис в Н.в. Итак, мы видим, что существует единственное очищение смешанного состояния рл такое что, вы- бирая измерение соответствующей наблюдаемой в системе В, мы можем реализовать либо {|^))-ансамбль, либо {|г!’м)}-ансамбль! Аналогично мы можем рассмотреть множество ансамблей, реализу- ющих смешанное состояние рА, где максимальное число чистых состо- яний, возникающих в любом из этих ансамблей, равно и. Тогда мы мо-
2,5. Неоднозначность интерпретации ансамблей 85 жем выбрать 1ильбергово пространство 'Цв размерности п и чистое со- стояние |Ф)ЛВ £ В.А ® такое, что любой из ансамблей может быть реализован путем измерения соответствующей наблюдаемой в Нв. В этом и состоит теорема ЖХЙВ1. Она выражает явление квантового ластика в его наиболее обшей форме. Фактически теорема ЖХЙВ является почти тривиальным следствием разложения Шмидта. Оба состояния, |$i)ab и имеют разложение Шмидта, а поскольку при вычислении частичною следа по В оба они дают одно и то же смешанное состояние рА, эти разложения должны иметь вид к (2.118) fc где собственные значения, а |&)А — соответствующие им собственные векторы рА. Но поскольку {|fcJ)B} и {|^)в} — ортонормированные базисы в Нв, существует такое унитарное преобразование UB, что Юв - (2.119) откуда непосредственно следует уравнение (2 115). В ансамбле чистых состояний, описываемом уравнением (2.109), мы хотели бы сказать, что чистые состояния |<р4)А образуют в нем неко- герентную суперпозицию наблюдатель в системе А не может детекти- ровать относительные фазы этих состояний. С эвристической точки зрения причина того, что эти состояния не могут интерферировать, состоит в том, что, выполняя в системе В измерение, проецирующее на ортонормирован- ный базис {|аг)в}, в принципе мы имеем возможность обнаружить, какой представитель ансамбля реализован на самом деле. Однако проецируя вме- сто этого на базис в} к передавая в систему А информацию о резуль- тате измерения, мы можем выделить из ансамбля одно из чистых состоя- ний |^М)А, Дажс если оно может быть когерентной суперпозицией состоя- ний \рг}А. В сущности, измерение В в базисе {|7Д)В} «стирает» «welcher з«е§»-информацию (состоянием А является либо |^t) А, либо |<^) 4). В этом смысле теорема ЖХЙВ характеризует обобщенный квантовый «ластик». Еще раз повторим мораль, что информация материальна — информация, полученная в системе В, после ее передачи в А изменяет физическое опи- сание состояния А. 'ЖХДжВ. Жизаи, Хастон, Джоаса, Вутери
86 Глава 2 2.6. Резюме Аксиомы. Ареной квантовой механики служит гильбертово простран- ство Н. Основными предположениями являются: (1) Состояние представляет собой луч в Ti. (2) Наблюдаемая представляется самосопряженным оператором в Н. (3) Измерением является ортогональная проекция. (4) Эволюция во времени унитарна. Оператор плотности. Если мы ограничиваем наше внимание только на ча- сти большей квантовой системы, предположения (1) -(4) не выполня- ются. В частности, квантовое состояние описывается не лучом, а опе- ратором плотности р, неотрицательным оператором с единичным сле- дом. Оператор плотности описывает чистое состояние (состояние мо- жет быть описано лучом), если р2 — р; в противном случае состояние является смешанным. В этом состоянии наблюдаемая М имеет ожида- емое значение tr(Mp). Кубит. Квантовая система, определенная в двумерном хильбертовом про- странстве, называется кубитом. Наиболее общая матрица плотности кубита имеет вид р(Р)= + (2.120) где Р — трехкомпонентный вектор длины |Р| < 1 В чистом состоя- нии |Р| -- I. Разложение Шмидта. Для любой квантовой системы, состоящей из двух частей А и В (бинарная система), гильбертово пространство являет- ся тензорным произведением rHA ® Для любого чистого состоя- ния |^)лв бинарной системы существуют ортонормированиые базисы {|г)А} в TiA и {|г')в} в Н.в такие, что Wab - (2.121) Уравнение (2.121) называется разложением Шмидта состояния \ц>}Ав. В двухкубитовом чистом состоянии подсистемы А и В по отдельности описываются операторами плотности рА и рв> из уравнения (2.121)
2.7. Упражнения 87 следует; что рА и рв имеют одинаковые ненулевые собственные зна- чения (рг) Количество ненулевых собственных значений называется числом Шмидта состояния Двухкубитовое чистое состояние называется запутанным, если его число Шмидта больше единицы Ансамбля. Операторы плотности в гильбертовом пространстве образуют выпуклое множество, а чистые состояния представляют собой край- ние точки этого множества. Смешанное состояние системы А может быть приготовлено как ансамбль чистых состояний многими различ- ными способами, неразличимыми экспериментально, если мы наблю- даем только систему А. Для любого смешанного состояния рА си- стемы А любое приготовление рА как ансамбля чистых состояний, в принципе можно реализовать, выполняя измерение в другой систе- ме В, с которой запутана система А. Фактически для множества таких приготовлений смешанного состояния рА существует единственное за- путанное состояние Л и В такое, что любое из этих приготовлений может быть реализовано путем измерения соответствующей наблюда- емой в В (теорема ЖХЙВ). Выполняя измерение в системе В и сооб- щая его результат в систему А, мы можем выделить из смеси чистое состояние, выбранное из одного из ансамблей. 2.7. Упражнения 2.1. Точность воспроизведения вероятностной гипотезы. Один кубит (объект со спином-1) находится в неизвестном чистом состоянии [ф], случайно выбранном из равномерно распределенного по сфере Блоха ансамбля. Мы наугад считаем, что этим состоянием является |ф). Чему в среднем равна определяемая соотношением Р=\(ф\ф)\2 (2.122) точность воспроизведения нашей гипотезы? 2.2. Точность воспроизведения после измерения. После случайною вы- бора одиокубитового чистого состояния, как в предыдущей задаче, мы выполняем измерение спина вдоль оси z. Это измерение приготавли- вает состояние, описываемое матрицей плотности р = Рг(#Рт|^ + Р1ШШ> (2.123)
88 Глава 2 (где i обозначает проектор на состояние спин-вверх или спин-вниз вдоль оси 2). С какой в среднем точностью (2.124) эта матрица плотности воспроизводит начальное состояние \-ф)? (Улуч- шение F по сравнению с ответом к предыдущей задаче является гру- бой мерой тото, как мною мы узнаем, выполнив измерение). 2.3. Разложение Шмидта. Для двухкубитового состояния - 4|Г;'л (I1 М 1 > ^=М>А^1Т>е + |Ц)вУ (2.125) 1) Вычислите рА = trB(|Ф)ЛВ АВ(Ф|) и рв 1гл(|Ф) лв ЛВ(Ф|). 2) Найдите разложение Шмидта состояния |Ф)ЛВ. 2.4. Трехкубитовое чистое состояние. Существует ли разложение Шмид- та произвольного трехкубитового чистого состояния? То есть ес- ли |^)лвс произвольный вектор в НА ®НВ® Нс, то можем ли мы найти ортогональные базисы {Н)л}, {(()в} и {|«)с}, такие что |У)двс — ^2 VKK)а ® {'0в & 10с (2.126) ? Истолкуйте ваш ответ. 2.5. Квантовые корреляции в смешанном состоянии. Рассмотрим мат- рицу плотности двух кубитов: р |1 + ||^ |. (2.127) О Z где 1 обозначает единичную 4 х 4-матрицу, а Ю^(1ШНО) (2.128) Пусть мы измеряем первый спин вдоль оси п, а второй — вдоль оси т, где h т = cos#. Какова вероятность тою, что оба спина находятся в состоянии «спин-вверх» вдоль соот ветствующих осей?
Глава 3 Основы II: Измерение и эволюция 3.1. За пределами ортогональных измерений 3.1.1. Ортогональные измерения Мы хотели бы исследовать свойства обобщенных измерений, кото- рые можно реализовать в системе А, выполняя ортогональные измерения в большей системе, содержащей А. Но сначала, следуя классической трак- товке фон Неймана, кратко обсудим, как в принципе могут быть выполнены ортогональные измерения произвольной наблюдаемой. Чюбы измерить наблюдаемую М, мы модифицируем гамильтониан Вселенной, включая в нею связь между этой наблюдаемой и «перемен- ной-указателем» («pointer» variable), которая будет играть роль прибора. Связь запутывает собственные состояния наблюдаемой с различимыми со- стояниями прибора, так что, «наблюдая» за прибором, мы можем пригото- вить собственное состояние наблюдаемой. Конечно, это не вполне удовлетворительная модель измерения, по- скольку мы не объяснили, как можно измерить «переменную-указатель». Как можно видеть, позиция фон Неймана состояла в том, что в принципе возможно скоррелировать состояния микроскопической квантовой системы со значениями макроскопической классической переменной, которые, са- мо собой разумеется, мы способны различать. Конечно, возможно и жела- тельно более обстоятельное объяснение: мы еще вернемся к этой проблеме ниже. Мы можем прсдс гавлятъ себе прибор как пробную частицу, распро- страняющуюся свободно, за исключением ее регулируемой связи с изме- ряемой квантовой системой Вели мы намерены измерять положение этой пробной частицы, то в начальном состоянии должен быть приготовлен до- статочно узкий волновой пакет, но не слишком, поскольку очень узкий вол- новой пакет будет слишком быстро расплываться. Если начальная ширина волнового пакета равна Да-, неопределенность его скорости будет иметь
90 Глава 3 порядок Дг> = Ар/т ~ ti/m&x, так что, спустя время t, паке'1 расползется до ширины Дд^) = Ат + (3.1) тДх минимальное значение которой имеет прядок [Дя(4)]2 ~ [Дж]2 ~ М/тп. Следовательно, если эксперимент продолжается в течение времени t, то разрешение, которою мы можем добиться в определении конечного положения пробной частицы, ограничено «стандартным квантовым преде- лом»; /Т7 Ах > ~ у m~ (3-2) Будем считать нашу пробную частицу достаточно тяжелой, чтобы это огра- ничение было несущественным. Гамильтониан, описывающий взаимодействие квантовой системы с пробной частицей, имеет вид: Н = Но + ^Р2 + АМР, (3.3) 2m где Р2/2т — гамильтониан свободной пробной частицы (который в даль- нейшем будет игнорироваться, поскольку пробная частица настолько тя- жела, что расплыванием ее волнового пакета можно пренебречь), Но невозмущенный гамильтониан измеряемой системы, А - константа связи, которую мы можем менять по своему усмотрению. Измеряемая наблюдае- мая М связана с импульсом Р пробной частицы. Если М не коммутирует с Но, то нас будет беспокоить, как эта наблю- даемая изменяется в процессе измерения. Чтобы упростить анализ, пред- положим, что или [М, Но] — 0, или же измерение выполняется настоль- ко быстро, что в ходе его можно пренебречь свободной эволюцией систе- мы. Тохда гамильтониан (3.3) можно аппроксимировать одним слагаемым Н ~ АМР (где, конечно же, [М, Р] = 0, так как М — наблюдаемая систе- мы, а Р — наблюдаемая пробной частицы), а оператор эволюции во време- ни - U(t) =? exp [ — iAtMP]. (3.4) Разлагая в базисе, в котором наблюдаемая М диагональна М = £>Ж(«|, (3.5) а представим U(t) в виде U(t) (36)
3.1. ЗА ПРЕДЕЛАМИ ОРТОГОНАЛЬНЫХ ИЗМЕРЕНИЙ 91 Вспомним теперь, что Р генерирует параллельные переносы положения пробной частицы: в координатном представлении Р = так что ах ехр(—iu0P) = ехр и разложение в ряд Тейлора дает ехр(-— ib(x - xq). (3.7) Другими словами, оператор ехр(—гя0Р), действуя на волновой пакет, пере- мещает его на ;с0. Отсюда видно, что если наша квантовая система начинает эволюцию из суперпозиции собственных состояний оператора М, перво- начально не запутанной с пространственным волновым пакетом пробной частицы то по истечении времени t ее квантовое состояние эволю- ционирует в ® = J3«a|a) ® (3.8) \ <2 /а Теперь положение пробной частицы коррелирует со значениями наблюдае- мой М, Если волновой пакет достаточно узок, чтобы мы могли разрешить все значения Ма (что имеет место при |Дж| < |AiMj), тогда всякий раз, измеряя (неважно как!) положение пробной частицы, мы будем готовить собственное состояние наблюдаемой Ма. С вероятностью jaj2 мы обна- ружим, чго положение пробной частицы сместилось на величину XtMa, и, следовательно, приготовим собственное состояние |а) оператора М. Таким образом, мы приходим к выводу, что начальное состояние [у?) квантовой системы проецируется на |а) с вероятностью |{а|у?)р. Это и есть модель ортогонального измерения фон Неймана. Классическим примером служит прибор Штерна-Герлаха. Чтобы из- мерить <т3 объекта со спином-1/2, мы пропускаем его через область неод- нородного магнитного поля В3=Аг. (3.9) Магнитный момент объекта равен д<т, а индуцируемая магнитным полем связь — Н — —ХцгсТо. (ЗЮ) В этом случае а3 является измеряемой наблюдаемой, связанной с положе- нием z, а не с импульсом пробной частицы. В этом нет ничего страшно- го, поскольку z генерирует трансляции импульса Ру- и, следовательно, эта
92 Глава J связь сообщает импульс пробной частице. Мы можем различить, сдвинул- ся объект вверх или вниз и таким образом определить спиновое состояние | U или | |г). Конечно, поворачивая магнит, можно измерить наблюдае- мую п ст. Как показало обсуждение квантового ластика, одного только факта воз- никновения запутанного состояния (3.8) еще не достаточно для объясне- ния, почему процедура измерения готовит собственное состояние операто- ра М. В принципе измерение пробной частицы могло бы спроецировазъ ее состояние на некоторую специфическую суперпозицию собственных состо- яний оператора положения, и таким образом приготовить квантовую систе- му в суперпозиции собственных состояний оператора М Чтобы достичь более глубокого понимания процесса измерения, нужно объяснить, почему базис собственных состояний положения пробной частицы имеет особый статус среди других возможных базисов. Гели мы действительно можем, как это только что было описано, свя- зать любую наблюдаемую с измеримой «перемешюй-указателем», тогда мы в состоянии выполнить любую мыслимую ортогональную проекцию в гильбертовом пространстве. Для данного набора операторов {Е(Г} таких, что Еа---Ef, ЕаЕь = dobErt, = (3.11) Q мы можем выполнить процедуру измерения, которое с вероятностью Prob(a) - (^1ЕаМ (3-12) преобразует чистое состояние |^)(^| в E0|<j)(^|E0 Результаты такого измерения можно описать матрицей плотности, которая получается суммированием всех возможных результатов (3.13) (а не вы- бором одного частного результата), взвешенных вероятностями их появле- ния (3.12). В таком случае измерение преобразует начальное чистое состо- яние в соответствии с IV№I - £Х^|Е0. (3.14) а Это ансамбль чистых состояний, описывающих результаты измерения Он описывает состояние, в котором известно выполненное в системе из- мерение, но неизвестен его результат. Следовательно, начальное чистое со- стояние превращается в смешанное, за исключением гсх случаев, когда оно
3.1. Зл ПРЕДЕЛАМИ ОРТОГОНАЛЬНЫХ ИЗМЕРЕНИЙ 93 оказывается собственным состоянием измеряемой наблюдаемой. Если же начальным состоянием перед измерением было смешанное состояние, опи- сываемое матрицей плотно сти р, тогда, представляя р как ансамбль чистых состояний, мы обнаружим, что в результате измерения Р Е'Е.рЕ»- (3.15) а 3.1.2. Обобщенные измерения Теперь мы хотели бы обобщить понятие измерения, выйдя за пределы рассмотренных фон Нейманом ортогональных измерений. Путь, ведущий к идее обобщенною измерения, состоит в предположении, что наша систе- ма А расширена до тензорного произведения НА х Нк и мы выполняем в нем ортогональные измерения, которые в самой системе А уже не обяза- тельно ортогональны. Сначала мы пойдем несколько другим путем, кото- рый, хотя и не имеет физической мотивации, выглядит более естественно и просто с математической точки зрения. Предположим, что гильбертово пространство НА является частью бо- лее широкого пространства, имеющего структуру прямой суммы: Н--НЛ^Н[ (3.16) Нашим наблюдателям, «живущим» в НА, доступны только наблюдае- мые с носителем в НА, то есть такие наблюдаемые МА, что для любо- го |^' > е Hi -0=(^|МА. (3.17) Папример, в двухкубитовом мире мы можем представить, что наши наблю- даемые имеют носители только в той части пространства, в которой второй кубит находится в состоянии |0)2. Тогда НА - - 7^ ® |0)2, а НА — Нх 0|1)2, |дс Н{ - гильбертово пространство первою кубита. (Эта ситуация может показаться несколько искусственной, что я и подразумевал, говоря о пемо- тивированности такого разложения пространства на прямую сумму.) Вся- кий раз, когда мы выполняем ортогональное измерение в Н, приготавли- вая в нем одпо из множества взаимно ортогональных состояний, наш на- блюдатель будет знат ь только о компоненте состояния, принадлежащей его пространству НА. Поскольку в НА эти компоненты не обязательно орто- гональны, он придет к выводу, что измерение готовит одно из множества неортогональных состояний. Пусть {|г)} обозначает базис в НА, а {|р)} - базис в НА. Допустим, что начальная матрица плотности рА имеет носитель в НА и что мы вы- полняем ортогональное измерение в Н. Рассмотрим случай, когда каждый
94 Глава 3 оператор Ео является одномерным проектором, что, вообще говоря, доста- точно для наших целей. Таким образом, Еа = |ио)(«о|, где |wo) — нор- мированный вектор в Н. Этот вектор имеет единственное ортогональное разложение ю = (з.18) где j-0Q) и |^а ) (ненормированные) векторы из НА и "НА соответствен- но. После измерения новой матрицей плотности будет |t*a)(uo| с вероятно- стью (uo\рАjwo) = (поскольку рА не имеет носителя в W^). Но для нашего наблюдателя, не подозревающего о существовании Ti.A, нет физической разницы между |ио) и |^о) (за исключением нормировки). Если записать |-0о) = x/AJV'a), где |^о) нормированное состояние, то- гда вдобавок к этому можно сказать., что для ограниченного пространством НА наблюдателя с вероятностью (V’uIPaI’A»/ результатом измерения явля- ется ЮЛ Определим оператор Fa ЕдЕаЕд \МШ (319) (где Ел ортогональный проектор, проецирующий Н па НА). Тогда мы можем сказать, что результат а имеет вероятность trFopA. Очевидно, что каждый оператор Fa эрмитов и неотрицателен, но Fo не является проекто- ром. за исключением случая, когда Ха — 1. Более того У? Ео = (УЗ Ео j Ед — Ед = 1А ; (3.20) а \ а / сумма всех Fq равна единичному оператору в TiA. Разложение единицы на сумму неотрицательных операторов называ- ется положительной операторно-значной мерой (ПОЗМ)1. (Термин мера несколько неуклюж в нашем конечномерном случае; он более уместен, ко- гда индекс а может меняться непрерывным образом). В этом обсуждении мы пришли к частному случаю ПОЗМ, построенной из одномерных опе- раторов (операторов с одним отличным от нуля собственным значением). 1 Строгое определение ПОЗМ или, как ее чаще называют а русской литературе, разло- жения единицы в гильбертовом пространстве напоминает определение вероятностной меры (имеющей, однако, не числовые, а операторные значения). См. в книге: А. С. Холево. Веро- ятностные и статистические аспекты квантовой теории, Москва-Ижевск, ИКИ (2003). Прим ред ]
3.1. ЗА ПРЕДЕЛАМИ ОРТОГОНАЛЬНЫХ ИЗМЕРЕНИЙ 95 В обобщенной теории измерений каждый результат имеет вероятность, ко- торую можно представить в виде РтоЪ(а) - tr рА¥а (3.21) Положительность Еа и равенство EFa = 1д необходимы, чтобы обеспе- a чить положительность вероятностей и равенство единице их суммы. Как ПОЗМ общего вида влияет на квантовое состояние? Простого об- щего ответа на этот чрезвычайно важный вопрос нет; но в случае (только что обсуждавшемся) ПОЗМ, построенной из одномерных операторов, ко- гда результат hAa)(^’J возникает с вероятностью trpAFa, суммирование по всем исходам дает Ра Ра = 1^вИ^а|(Аа(^а|рд1^а)) а а (3.22) а [что обобщает неймановское Е ЕарЕа (3.15) на случай, когда Fa не явля- a ются проекторами]. Заметим, что tr рА — tr рА = 1, поскольку Е Fn = 1А. a 3.1.3. ОднокубнговаяПОЗМ В качестве примера рассмотрим один кубит и предположим, что {йа} - N единичных трехмерных векторов, удовлетворяющих условию Ел<а=о, <3-23) а где Аа - положительные вещественные числа 0 < Аа < 1 такие, что Е\=1 Пусть Fa = Aa(l + na-<?)=2AaE(na) (3.24) [где Е(па) • проектор | |]. Тогда = ID" <325) a \ а / \ a / следовательно, Fa определяют ПОЗМ.
96 Глава 3 В случае N - 2 имеем й] + п2 - О,1 следовательно, ПОЗМ является ортогональным измерением вдоль оси п1. При Л - Зв симметричном случае А; - А2 - Ад = имеем Тп2 + п3 = 0 и = + (3.26) 3.1.4. Теорема Най марка Мы пришли к понятию ПОЗМ, рассматривая ортотональпые измере- ния и более широком, чем НА. пространстве. Теперь обратим наши рас- суждения и покажем, что таким образом может быть реализована любая позм. Рассмотрим произвольную ПОЗМ с п одномерными положительными операторами Fo, удовлетворяющими условию $2 Fu — 1. Покажем, что а=1 эту ПОЗМ всегда можно реализовать путем расширения гильбертова про- странства и выполнения ортогонального измерения в этом более широком пространстве. Это утверждение называется теоремой Наймарка2. Чтобы доказать это, рассмотрим гильбертово пространство 11 с ~ N и ПОЗМ {Fa}, а ~ 1. 2,..., п с п N. Каждый одномерный положи- тельный оператор может быть записан в виде Fa - ШШ, (3.27) где вектор \-фа} не нормирован. Выписывая в явном виде матричные эле- менты равенства 52 F„ =- 1, получим: а =1 а —1 al Теперь изменим точку зрения на уравнение (3.28). Будем интерпретиро- вать не как п N векторов в Лг-мерпом пространстве, а как Л’ S? п 'Конечно, это районе гео справедливо лишь в симметричном случае А; — А2 — - кото- рый здесь по-видимому подразумевается. Прим. ред. 2Обсужление ПОЗМ и теоремы Наймарка можно найти в книге: A. Peres. Quantum theory: Concepts and Methods, Kluwer Academic Publishers, New York et al (2002) (На русском языке см.: Н.И. Ахиезер, И.М. Глазман, Теория операторов в гильбертовом пространстве, Наука, М.: (1966). Прим, ред J
3.1. За ПРЕДЕЛАМИ ОРТОГОНАЛЬНЫХ ИЗМЕРЕНИЙ 97 векторов (^F)o в «-мерном пространстве. Тогда уравнение (3.28) утвер- ждает, что эти Лг векторов образуют ортогональный набор. Естественно, что он может быть расширен до ортогонального базиса в «-мерном про- странстве. Другими словами, существует п х о-матрица иог с '«о, = при а = 1,2...., Л' такая, что У" uaiuw> = (3.29) t S J '•'J •'J ' ' i a или, в матричной форме, U*U — 1. Отсюда следует, что UU1 — 1, по- скольку для любого вектора U(Utu)|V) = (UUt)Ul^) - U|v>), (3.30) а областью действия U (по крайней мерс для конечномерных матриц) яв- ляется все «-мерное пространство. Возвращаясь к компонентной записи, имеем V— 22*4%- = Sab. (3.31) J Следовательно, («a)i образуют полный ортонормированный набор векто- ров1. Пусть теперь в пространстве размерности п /V выполняется ортого- нальное измерение: VWW (3.32) Мы построили векторы |«о) так, чтобы каждый из них имел ортогональное разложение Ю - Ю + Й-), (3-33) где |^о) € И, а |^) € TY1. Тогда ортогональным проецированием этого базиса на Н мы воспроизводим ПОЗМ {Fa}. Этим завершается доказатель- ство теоремы Наймарка. Чтобы проиллюстрировать теорему Наймарка в действии, рассмотрим еще раз однокубитовую ПОЗМ I, (3.34) а = 1,2,3, где н1 + ??2 + й3 = 0. Согласно теореме ПОЗМ может быть реализована как ортогональное измерение «кутрита» — квантовой системы в трехмерном гильбертовом пространстве. 'Друг ими словами, мы показали, что если строки п х «-матрицы ортонормированье го та- ковыми же будут их столбцы.
98 Глава 3 Пусть nx — (0,0,1), n2 = (0/2,0,-1/2), n3 = (-0/2,0,-1/2), тогда, вспоминая что (3.35) мы можем записать три вектора |^а) — 02/3|£?,р — 0) (где = 0,2тг/3,4тг/3) как (3.36) Теперь мы можем интерпретировать эти три двумерных вектора, как 2 х 3-матрицу, а теорема Наймарка гарантирует, что две ее строки ортонорми- рованы. Следовательно, мы можем добавить еще одну ортонормированную строку: / v/2/r3 \ / 00 \ /~07в\ |0,|w>),|u3) = 0 , 0/2 , 00 . (3.37) \ ^/Т/З / \ -0/3 / \ 00 / Мы видим, что (как и утверждает теорема) столбцы |«о) также ортонор- мированы. Если мы выполним ортогональное измерение в базисе векто- ров |«о), то живущий в двумерном подпространстве наблюдатель придет к выводу, что мы реализовали ПОЗМ {F1,F2,F3}, Мы показали, что если наш кубит фактически является двумя компонентами кутрита, то ПОЗМ может быть реализована как ортогональное измерение этою кутрита. 3.1.5. Ортогональное измерение ня тензорном произведении Тем не менее типичный кубит не скрывает никакого секрета. Чтобы выполнить обобщенное измерение, нам необходимо запастись дополни- тельными куби гами и выполнить совместные ортогональные измерения на нескольких кубитах сразу. Рассмотрим случай двух (изолированных) систем Л и В, описываемых тензорным произведением Нв. Предположим, что на этом тензорном произведении мы выполняем ортогональное измерение, характеризуемое полным набором взаимно ортогональных проекторов Еа: £в. = 1. (3.38)
3.1. За пределами ОРТОГОНАЛЬНЫХ измерений 99 Представим, что начальным состоянием квантовой системы является «некоррелированное» тензорное произведение состояний Рав—Ра^Рв- <3-39) Тогда с вероятностью РгоЬ(а) = trAjB [Ео (рА ® рв)] (3.40) результатом измерения будет а. В этом случае новая матрица плотности будет равна1 (3.41) ' __ ® Рв№а РАВ trAB [Еа(рА®Рв)] Для наблюдателя, имеющего доступ только к системе А, ее новую матрицу плопюсти дает частичный след только что записанной матрицы плотности, или , = [Ея(рА®Рн)Еа] trАВ [Еа(РА ® Рв)] (3.42) Выражение (3.40) для вероятности результата а также может быть записано Prob(a) = trA [trB (Ва(рА ®Рв))] = trA (FapA); (3.43) если ввести ортогональные базисы {|*)А} в WA, а {|р)в} в то 52 (Еа)^,1д(РА)1,(Рв)^ 52 (Fa)ji(pA)l3 (344) ИЛИ (Fa)Jt ~ 52 (Еа)^,1(4(Рв)рр- (3.45) pv Из уравнения (3.45) следует, что каждый оператор обладает Fo свой- ствами: (1) Эрмитовость: 52 52 (Eo)ju,-„(pB)»/tt — (Fa)JT> поскольку эрмитовы Еа и рв. 11акой вид матрица плотности будет иметь после измерения, результат которого зафик- сирован и имеет значение а. Если же результат не был «записан», то при таком измерении матрица плотности эволюционирует в соответствии с уравнением (3.15). — Прим, ред
100 Глава 3 (2) Положительность: В базисе, диагонализующем рв - и ® о <м1)Ео(^)А 9) Ыв) > °-. м поскольку положителен Еа. (3) Полнота: 6* £>• >ч = н. Л МВ'® / В поскольку £Еа - 1АВ, atrpB 1. а Однако операторы F„ не обязательно взаимно ортогональны. Факти- чески количество Fa ограничено только размерностью HA ® Нв, большей (и, возможно, гораздо большей) чем размерность TiA. В общем случае нет простого способа выразить конечную матрицу плотности р'А через рА и Fo. Не будем, однако, обращать внимание на то, как ПОЗМ изменяет матрицу плотности, а вместо этого зададимся вопро- сом, Допустим, что НА имеет размерность N, и рассмотрим ПОЗМ, состоя- щую из п одномерных неотрицательных операторов Fa, удовлетворяющих п условию 32 Fo - 1А. Можем ли мы выбрать пространство матрицу а 1 плотности рв в TiB и проекционные операторы Еа в HA ® НБ (где коли- чество Ео может превосходить количество Fa) такие, чтобы вероятность результата а ортогонального измерения удовлетворяла условию' ^Ea(pA<g>pB) - tr(FapA)? (3.46) (Неважно, как ортогональная проекция модифицирует рА!). Мы будем счи- тать это «реализацией» ПОЗМ с помощью ортогонального измерения, по- скольку пас не интересует, какова р'л для каждого результата измерения; мы только требуем, чтобы вероятности результатов согласовались с опре- деленной таким образом ПОЗМ. Такая реализация ПОЗМ действительно возможна; чтобы показать э го, еще раз обратимся к теореме Наймарка. Каждый одномерный оператор Fa, 'Если количество Еа больше, чем Еа, то почти все п резулыатов имеют вероятность, равную нулю.
3.1. Зл ПРЕДЕЛАМИ ОРТОГОНАЛЬНЫХ ИЗМЕРЕНИЙ 101 а = 1,2. может быть представлен в виде Еа — |^о)(^а|. Соглас- но Наймарку существуют п ортонормированных п-компонентных векто- ров |ч.а) таких, что К) - Ш -I (3.47) Начнем с того, что рассмотрим частный случай п = rN, где г — по- ложительное целое число. Тогда удобно разложить \ч1>а ) на прямую сум- му /У-комноненпндх векторов Ю = IVvJ Ф\^а) Ф • • Ф 1^-uJ. (3.48) Здесь |vfa) обозначает первые .V компонент вектора |Ра )> l^f.a) обознача- ет следующие N компонент и 1ак далее. Тогда ортонормированность век- торов |иа) означает, что 7 1 tab = <Wa|«fr) - (V’al^b) + (3-49) ;i=L Выберем теперь Нв имеющим размерность г и обозначим ортонормиро- ванный базис в Нв: {\р)в}, /х = 0.1,2,... ,г - 1. (3.50) То1да из уравнения (3.49) следует, что т — 1 l(h>AH = 1^а{0>в 1,2,(3.51) л -1 - ортонормированный базис в НА <8 Нв. Предположим теперь, что состоянием в НА Нв является Рав — Ра & в Ж (3.52) и мы выполняем ортогональное проецирование на базис {|Фо)ав} в 7/л У? 'Hjj. Тогда, поскольку при / 0 в (0|р)в 0, результат |Фа)лв лоявляося с вероятностью ав = (3.53) и, следовательно, AB^JPabI^JaH = (*>а)- <3-54>
102 Глава 3 Мы действительно успешно «реализовали» ПОЗМ, выполняя ортогональ- ное измерение в Т-(.А ® Т1В. Эта конструкция так же эффективна, как и опи- санная выше конструкция «прямой суммы»; мы выполнили ортогональное измерение в пространстве размерности п - rN\ Если появился результат а, тоща с помощью измерения приготовлено состояние р'лв — \Юав авШ (3.55) Матрица плотности, видимая налюдателю, которому доступна только си- стема А, получается взятием частичного следа по 7(я; Ра — trB (|Фа)лВ Ab(^oI) — г — 1 = Ша аШ + W^A А<^,а\, (3.56) р=1 что не совсем го же самое, что было получено в нашей конструкции «пря- мой суммы». Во всяком случае существует множество способов реализо- вать ПОЗМ с помощью ортогональных измерений, и уравнение (3.56) при- менимо только к выбранной здесь частной конструкции. Тем нс менее в действительности о га конструкция идеально подходит для реализации ПОЗМ, в которой состояние |^’а)д д(^о| приготавливается в результате появления исхода а. Трудным моментом осуществления ПОЗМ является обеспечение того, что результат а появляется с требуемой вероят- ностью. После этого уже легко прийти к соглашению о том, что следствием появления результата а является состояние если Угодно, сразу как только измерение выполнено и результат а получен, мы можем просто отбросить рА и приступить к приготовлению требуемого состояния! Факти- чески, в случае проекции на базис |Фа) мы можем полностью построить ПОЗМ, проецируя систему В на базис {|^}в} и сообщая результат в си- стему А. Если результатом является |0)в, тоща не нужно предпринимать никаких действий, Если же результатом является |ц/й, р > 0, тогда было приготовлено состояние которое затем может быть преобразовано В Ма- До сих пор мы обсуждали частный случай п = г N. Если в действи- тельности п = г N - с, 0 < с < Лг, то нам нужно лить выбран, рав- ными нулю последние с компонент вектора |^_j а)д и состояния [Ф)дв по-прежнему будут взаимно ортогональными, Чтобы получить полный ба- зис, мы можем добавить с состояний: |'\)д!т — 1; i ~ rN - с+X,rN — с + 2,... ,rN; (3.57)
3 1.3а пределами ортогональных ИЗМЕРЕНИЙ 103 здесь |ег)л — вектор, у которого отлична от нуля только одна s-ая компо- нента, так что [ег)л гарантированно ортогонален вектору |^Lj а)А. В этом случае ПОЗМ реализуется как ортогональное измерение в пространстве размерности rN — п | с. В качестве примера конструкции тензорного произведения мы вновь можем рассмотреть однокубитовую ПОЗМ с jllnja A<TnJ, « 1,2,3. (3.58) Мы можем реализовать эту ПОЗМ, вводя второй кубит В. В двухкуби говом гильбертовом пространстве мы можем проецировать на оргонормирован- ный базис 1 ДШПВ, а = 1,2,3, (3 59) 1<*о> - |1)а|1>в- Если начальным состоянием является рлв — рл ® |0}^ в (0|, то мы име- ем (S-JpABЮ - 1а<Ч \Ра\ к)а, (3.60) следовательно, эта проекция осуществляет ПОЗМ в Т(.л. (Здесь мы выпол- нили ортогональные измерения в четырехмерном пространстве; в предыду- щей конструкции «прямой суммы» мы нуждались только в трех измерени- ях). 3.1.6. ЖХЙВсПОЗМ Обсуждая теорему ЖХЙВ, мы говорили, что, приготовив состоя- ние и (3.61) 1 Здесь фала |^а) = д/2/^l 1* отличается на —1 от соответствующей фазы в урав- нении (3.36), она выбрана 1аким образом, чтобы 4(f. | Jft )А — при а Ь. Мы сделали этот выбор затем, чтобы коэффициент перед |0) , 111 и был положителен во всех трех |ФТ>. |Ф3>, |Ф3>.
104 Глава 3 мы можем реализовать ансамбль Ра = 52 а а (‘ФцI. (3-62) и выполняя ортогональные измерения в Более того, если dim~ п, то, измеряя подходящие наблюдаемые в Нв, мы можем с Э1им одним чи- стым состоянием |ФО)ЛВ реализовать любое приготовление рА как ансам- бля, содержащего вплоть до п чистых состояний. Теперь можно видеть, что если мы готовы допустить в Нв ПОЗ Мы, а не только ортогональные измерения, то даже при dim?/B = Л’ можно ре- ализовать любое приготовление рА с помощью подходящего выбора ПОЗМ в 'Нв. Суп, в том, что рв имеет носитель в пространстве размерности са- мое большее N. Следовательно, можно переписать |ФХв - Е (3.63) м где ортогональная проекция вектора на носитель матри- цы плотности рв. Мы можем выполнить ПОЗМ на носителе рв с Fo _ - |#м)/г и таким образом приготовить состояние |^я)4 с вероятно- стью Й„. 3.2. Супероператоры 3.2.1. Представление операторной суммы Перейдем к следующему этапу нашей программы понимания пове- дения части бинарной системы. Мы видели, что чисгое состояние бинар- ной системы может вести себя подобно смешанному состоянию, когда мы наблюдаем только одну ее подсистему Л, а ортогональное измерение би- нарной системы внутри ее подсистемы .4 может быть (нсоргогональной) ПОЗМ. Зададимся вопросом: если состояние бинарной системы соверша- ет унитарную эволюцию, то как тогда описать эволюцию одной только ее подсистемы А? Пусть начальная матрица плотности бинарной системы представляет собой тензорное произведение состояний вида Ра & |б)н в <0| ' (3.64)
3.2. Супероператоры 105 система А имеет матрицу плотности рА, а система В предполагается нахо- дящейся в чистом состоянии, которое мы обозначили |0)в. Бинарная систе- ма эволюционирует в течение конечного промежутка времени, управляемая унитарным оператором эволюции идл(Рл ® hWUab. (3.65) Выполним вычисление частичного следа в 'Нв, чтобы найти конечную мат- рицу плотности системы А: Ра — (рА ® |0)в b(0|)Uab) = Е в WЩв !^в Ра в («Кв И в , 0.66) л где ортонормированный базис в Нв, а в (/r|UAj£i |0)в — опера- тор, действующий в НА. ^Если {|«)а ® 1м)в) — ортонормированный базис в 71л 0 Нв, то в |j/)B обозначает оператор, матричные элементы которого равны А Мп (m|Uaв Iv)в Юд = (д(г1 ® (10 в ® Ь)д)-] (3.67) Если обозначить мд - b(m|Uab|0)B! (3.68) то рА можно представить в виде $(Ра) = Ра - Е М^аМ* - (3 69) м Из унитарности UAB следует, что М,; обладает свойством Ем*Мм — Ев(^|иА£|м)вв(м|иАВ|О)в = = в WUabUAb|0)b = ^-л- (3.70) Уравнение (3.69) определяет линейное отображение $, преобразующее один линейный оператор в друюй. Если выполняется свойство (3.70), то та- кое отображение называется супероператором, а уравнение (3.69) назы-
106 Глава 3 вается представлением супероператора операторной суммой (или представ- лением Крауса). Супероператор можно рассматривать как линейное отоб- ражение, преобразующее операторы плотности в операторы плотности, по- скольку из (3 69) и (3,70) следует, что р'А оператор плотности, если им является рА ; (1) р'А эрмитов: р'А] = = Ра- м м (2) р'А имеет единичный след: trp^ — 52 tr (рлМ*Мм) = trp4 = 1. м (3) р'А положительно определен: лЖН)а = £ (аММ>л(М1 |<4) о. м Мы показали, что представление операторной суммы (3,69) следует из «унитарного представления» (3,66) Более того, по данному представлению су।тероператора в виде операторной суммы всегда можно построить соот- ветствующее унитарное представление. Выберем в качестве 'Н.Ё гильбер- тово пространство, размерность которого, по крайней мере, больше числа слагаемых в операторной сумме. Если |^)д - произвольный вектор в 'НА, {|д)в} — ортонормированный базис в 7iB, а |0)в — некоторое нормирован- ное состояние в "Нд, то определим действие UAfl соотношением Uab(|¥>)a ® 4 (3-71) Это действие сохраняет внутреннее произведение в(и| j |д)в I = \ Г / \ « / = \^2 £МнМм ^1/ = ('ЛМ)а- (3-72) А \ Н / д следовательно, может быть расширен до унитарного оператора, дей- ствующего на всем НА ® Нв- Взяв частичный след, мы найдем ^в (идВ(|^д®|о>в)(А^^(0|)и^)-£;мД|^А А<йМ (3.73)
3.2. Супероператоры 107 Поскольку любая матрица плотности рА может быть представлена как ан- самбль чистых состояний, мы воспроизводим представление операторной суммы, действующей на произвольную рд. Очевидно, что представление операторной суммы данного суперопера- тора $ не единственно. Мы можем вычислить частичный след в любом ба- зисе, в каком пожелаем. Если мы используем базис то получим представление *(рА) - (3.74) где N„ = U„ Мд. Вскоре мы увидим, что так связаны любые два пред- ставления операторных сумм одного супероператора. Супсроператоры важны, поскольку они обеспечивают нас формализ- мом для обсуждения общей теории декогерентизации, эволюции чистых состояний в смешанные. Унитарная эволюция рА является частным слу- чаем, когда в операторной сумме имеется только одно с. iai аемое. Если в ней присутствуют два или более слагаемых, тогда в ходе эволюции, управляе- мой оператором UAB, чистые начальные состояния из 'НА запутывают- ся с Лв. То есть если возникающие в операторной сумме операторы Мх и М2 линейно независимы, то существует такой вектор А, что векторы = М1|у?)Л и = М2|<^)л линейно независимы, следовательно, состояние |yh)A|l)B F Ыд|2)в + имеет число Шмидта больше еди- ницы. Следовательно, чистое состояние |у>) А А(у>| эволюционирует к сме- шанному конечному состоянию р'А. Из двух супероператоров и $2 можно построить композицию, пред- ставляющую собой другой еупероператор о $2; если описывает эво- люцию от вчерашнего дня до сегодняшнего, а $ > от сегодняшнего дня до завтрашнего, то о $2 описывает эволюцию от вчерашнего дня до завтрашнего. Но является ли обратный супероператор также сунеропера- тором? То есть существует ли еупероператор, описывающий эволюцию из сегодняшнего дня во вчерашний? Вы покажете в домашнем упражнении, что на самом деле еупероператор обратим только тогда, когда он унитарен. Операторы унитарной эволюции образуют группу, а супероператоры определяют динамическую полугруппу. Когда возникает декогерентизации, существует стрела времени; даже на микроскопическом уровне можно го- ворить о различии между движением вперед и назад во времени. Декоге- рентизация вызывает пеизбеж!гую потерю квантовой информации - одна- жды вынув (мерного) кота из ящика, мы не можем вернусь его в исходное состояние
108 Глав*. 3 3.2.2. Линейность Теперь посмотрим на эту проблему немного шире и обсудим основные свойства, которым должен удовлетворять любой «разумный» закон эволю- ции матрицы плотности. Мы увидим, что любой такой закон допускает представление операторной суммы, то есть, в известном смысле, выделен- ное нами динамическое поведение рассматриваемой части бинарной систе- мы действительно является наиболее общим. Отображение $ : р —> р1, преобразующее исходную матрицу плотно- сти р в конечную р', представляет собой отображение операторов в опера- торы, обладающее следующими свойствами. (1) $ сохраняет эрмитовость: р‘ эрмитова, если таковой является р. (2) $ сохраняет след: 1г р' = 1, если trp = 1. (3) $ положителен: р‘ неотрицательна, если таковой является р. Обычно также предполагают, что (0) $ линейный оператор. В то время как условия (1), (2) и (3) действительно необходимы для того, чтобы р’ оставалась матрицей плотности, (0) остается открытым вопросом. Почему линейность? Возможный ответ состоит в том, что нелинейную эволюцию матрицы плотности было бы сложно согласовать с любой интерпретацией ансамбля Если S[р(А)] = $[АР1 + (1 - А)Рг] - А$[Р1] + (1 - А)$[Р2], (3.75) тогда временная эволюция сощасуется с вероятностной интерпретаци- ей Р(А). или (с вероятностью А) было приготовлено начальное состоя- ние Р1, которое эволюционировало в состояние $[Р1], или (с вероятно- стью 1 — А) было приготовлено начальное состояние р2, которое эволюци- онировало в состояние $[Р2]. Нелинейный еупероператор $, по-видимому, ведет к парадоксальным следствиям, В качестве примера рассмотрим один кубит, эволюционирующий со- гласно $(Р) -- ехр [гтго-! tr(<rlp)]pexp [ - iircr1 tr(cr1P)]. (3.76)
3.2. Супероператоры 109 Нетрудно проверить, что $ — положительный и сохраняющий след опера- тор. Предположим, что начальной матрицей плотности является р = реализованная как ансамбль ₽ = siu<Tj + liua.. I- £ & (3.77) Поскольку tr(cTj р) — 0, эволюция р тривиальна и оба представителя ансам- бля остаются неизменными. Если спин был приготовлен в состоянии | J ), то в нем он и останется. Теперь представим, что непосредственно после приготовления ансам- бля мы ничего не делаем, если было приготовлено состояние | |а), но если оказалось, что приготовлено | |а), мы поворачиваем сю в состояние | Jт). Теперь матрица плотности равна p' = |lD(LI + |l WJ, (3 78) так что tr(<Ttp') ~ В результате эволюции, управ.1ясмой оператором $, она преобразуется в $(р') — tr1pcrl. Тогда если спин был приготовлен в состоянии | Ja), то он эволюционирует в ортогональное состояние [ Следуя этим двум сценариям, первоначально приготовленное состоя- ние | Т2) эволюционирует различным образом. Но в чем разница между этими двумя случаями? Разница в том, что если приготовлено начальное состояние спина j j.2), то мы совершаем различные действия; ничего не де- лаем в случае (1), но поворачиваем спин в случае (2). Тем не менее, мы об- наружили, что в этих двух случаях спин ведет себя по-разному, даже если первоначально было приготовлено состояние | |а)! Мы привыкли говорить, что р описывает две (или более) различные альтернативы приготовления чистого состояния, только одна из которых действительно реализуется всякий раз, когда мы готовим кубит. Но мы об- наружили, что если мы готовим | Тг), то происходящее действительно за- висит от того, что мы были бы должны сделать, если бы вместо этого было приготовлено | Ц}. По-видимому, становится неразумно рассматри- вать два возможных приготовления как взаимно исключающие альтернати- вы. Эволюция альтернатив действительно зависит от других альтернатив, которые пред,положительно не были реализованы. Джо Полчннски назвал это явление «телефоном Эверетта», поскольку различные «ветви волновой функции» выглядя т способными «общаться» между собой. Тогда нелинейная эволюция матрицы плотности имела бы странные, возможно, даже абсурдные следствия. И все-таки это не факт, что нели-
no Глава 3 нейная эволюция должна быть исключена. Действительно, Джим Хартл доказывал, что существуют варианты «обобщенных квантовых механик», в которых допустима нелинейная эволюция, но тем не менее можно сохра- нить последовательную вероятностную интерпретацию. Несмотря на это, здесь мы будем следовать традиции и требовать, чтобы $ был линейным оператором. 3,23. Полная положительность Было бы приятно прийти к выводу, что любой $, удовлетворяющий условиям (0)—(3), имеет представление операторной суммы и, следователь- но, может быть реализован унитарной эволюцией подходящей бинарной системы. К сожалению, это не всегда возможно. И все же, к счастью, оказы- вается, что, добавив одно достаточно безобидно звучащее предположение, можно показать, что $ имеет представление операторной суммы. Необходимым нам дополнительным предположением [в действитель- ности более сильной версией (3)] является: (3') $ вполне положителен. Полная положительность определяется следующим образом. Рас- смотрим любое возможное расширение Ид до тензорного произведения НА ®%в', тогда $ вполне положителен в НА, если & 1в является поло- жительным для любого такого расширения. Полная положительность, несомненно, является разумным свойством, чтобы нуждаться в физических основаниях, Если мы изучаем эволюцию системы А, то никогда нельзя быть уверенным в том, что нет взаимодей- ствующей с ней системы В, о существовании которой мы не подозрева- ем. Полная положительность (в комбинации с другими предположениями) утверждает лишь то, что если система А эволюционирует, а система В — нет, то любая начальная матрица плотности составной системы эволюцио- нирует в другую матрицу плотности. Докажем, что предположений (0), (1), (2) и (3') достаточно для то- го, чтобы $ был супероператором (имел представление операторной сум- мы). [Действительно, свойства (О)-(З') могут рассматриваться как альтер- нативное определение супероператора.] Однако, прежде чем приступать к доказательству, попробуем пояснить понятие полной положительности на примере положительного, но не вполне положительного оператора. Таким примером служит оператор транспонирования Т : р- рг (3.79)
3.2. Супероператоры 111 Т сохраняет собственные значения оператора р и, следовательно, очевидно положителен. Но является ли Т вполне положительным (положителен ли любой оператор Тл® 1В)? Выберем dimWA — dirnWe = N и рассмотрим максимально запутанное состояние N 1Ф)лв = 4=5>>а®К>в. (3.80) где {Юд} и {|i')B} - ортонормированные базисы в TiA и Hs соответствен- но. Тогда Та ® 1в : ав (Ф| = £ (|()д а01) ® (Юв в 0'1) - м Р' 52 aOI) ® (Юв н0'1). (3.81) м Мы видим, что оператор Np' действует как (52^)* )®(52^м> сз.«2) \ 1 / х 3 / \ £ / \ з / ИЛИ лгр'(1‘Р)а®1,а,)в) ^Ма®Ыв- (3-83) Следовательно, Np1 - оператор перестановки (квадрат которого являет- ся тождественным оператором). Собственными состояниями .Vp' являются симметричные относительно A «-> В состояния, которым отвечает соб- ственное значение +1, и антисимметричные состояния, которым отвечает собственное значение —1. Поскольку р' имеет отрицательные собственные значения, он не является положительным и (поскольку р несомненно поло- жителен), следовательно, Тл <8 1В не сохраняет положительность. Таким образом, Тл — положительный оператор, но он не является вполне поло- жительным. 3.2.4. ПОЗМ как еупероператор Унитарное преобразование, запутывающее А с В, после ортогональ- ного измерения В может бьыь описано как ПОЗМ в А. Фактически по- ложительные операторы, включая ПОЗМ, можно построить из операторов Крауса. Если |<р)л эволюционирует как Ма|0>и - 52м»л|р)в, (3.84)
112 Глава з тогда измерение в В, проецирующее на базис {|/*)в}, с вероятностью Ргоад = лмм'м>ь (3 85) дает результат ц. Выражая рА как ансамбль чистых состояний, мы находим вероятность РгоЬ(д) - tr (FMpA), FM = (3.86) результата р; очевидно, что Fp положителен, а равенство VF(1 -1 сле- м дует из нормировки операторов Крауса. Следовательно, это действительно реализация ПОЗМ, В частности, ПОЗМ, модифицирующая матрицу плотности согласно (3.87) и является частным случаем супероператора. Так как каждый эрмитов, требование EFm=1 <3.88) л в точности совпадает с условием нормировки операторной суммы Следо- вательно. ПОЗМ имеет «унитарное представление»; существует унитарный оператор UAB, действующий как : [<^)а®|0>в -> ® (389) Ji где |у>)А — чистое состояние в А. Очевидно, что, выполняя ортогональное измерение в системе В, проецирующее на базис {|ц;в}, мы можем реали- зовать ПОЗМ, которая готовит состояние Ра " tr (FmPa) (3.90) с вероятностью РгоЬЫ -tr(FMpA). (3.91) Эта реализация ПОЗМ, возможно, не самая эффективная (мы требуем, что- бы гильбертово пространство 'НА ® Цв имело размерность N п, если ПОЗМ имеет п возможных результатов), но в некоторых отношениях опа наиболее удобна. ПОЗМ представляет собой наиболее общее измерение, которое мы можем выполнить в системе А, сначала запутывая ее с систе- мой В, а затем выполняя ортогональное измерение в системе В.
3.3. Теорема о представлении Крауса ИЗ 3.3. Теорема о представлении Крауса Теперь мы практически готовы доказать, что любой $, удовлетворяю- щий условиям (0), (1), (2) и (3'), имеет представление операторной сум- мы (теорема о представлении Крауса)1. Но сначала мы обсудим полезный трюк, который будет использован в доказательстве. Поскольку этот прием широко применяется, имеет смысл описать ею отдельно. Этот трюк (который мы будем называть «методом соответственного состояния») позволяет полностью охарактеризовать оператор М4, действу- ющий в Нл, описывая действие оператора МА ® 1в на единственное чистое максимально запутанное состояние2 в НА <S> Нв (где dimWB dint?/., = Л'). Рассмотрим' состояние N Йлв = (3-92) ;=1 где {|’)А} и {|г')в} — ортонормированные базисы в и Нв. (Мы вы- брали нормированным таким образом, чтобы авМ'Ф) ав = N; это избавляет нас от необходимое го писать множители y/N в формулах ниже.) Заметим, что любой вектор 1^)а - (3-93) г в TiA может быть представлен в виде «частичного» внутреннего произве- дения к)д = в^‘|^дв, (3.94) 1де = (3.95) Мы говорим, что |у?)л является «соответственным состоянием» «состоя- ния-указателя» (ip*) в. Отображение Ma I'd*)/?, (3.96) 'Приводимое здесь доказательство следует работе В. W. Schumacher, Sending Entanglement Through Noisy Quantum Channels, Phys. Rev., A54, 2614 2628 (1996); quaut-ph/9604023 (cm. Appendix А в этой работе). 2Мы говорим, что сосгояние максимально запутано, если 4-
114 Глава 3 очевидно, является антилинейным и фактически антиунитарным отоб- ражением из "HA в подпространство Нв. Оператор МА ® 1В, действуя на И Ав, дает (Мл ® 1в)1^АВ = ЕмаЮа ® Юв- (3.97) Из этого состояния мы можем выделить МА|у)А в качестве соответствен- ного состояния В(</|МА ® 1В|Ф>АВ = М»л. (3.98) Мы можем интерпретировать формализм соответственного состояния, го- воря что можно реализовать ансамбль чистых состояний в 77 А, выполняя измерения в Нв на запутанном состоянии — если измерение в Нв дает результат то приготовленным состоянием является |у?)А. Если мы намерены применить некоторый линейный оператор в НА, то обнаружим, что результат не зависит от того, было ли сначала приготовлено состоя- ние, а затем на него подействовали оператором, или сначала был применен оператор, а затем приготовлено состояние. Конечно, этот вывод имеет фи- зический смысл. Можно даже представить, что приготовление и действие оператора являются событиями, разделенными пространственно-подобным интервалом, так что временное упорядочение становится нековариантным (зависящим от наблюдателя). Мы покажем, что $А имеет представление операторной суммы, при- меняя метод соответственного состояния не к операторам, а к суперопера- торам. Поскольку мы предполагаем, что $А вполне положителен, мы знаем, что $А ® положителен. Следовательно, если мы применяем $А ® 1В к Рдв ~ Юав ав (V-’j, то результатом будет положительный оператор, (ненормированная) матрица плотности р'АВ в НА ® Нв. Подобно любой матрице плотности, р'АВ может быть представлена как ансамбль чистых состояний. Следовательно, ($А ® 1ц)(|Ф)ал авМ) — 9/, I Фд) а в а в (Фд I (3.99) м где Чц > О, — 1, а каждый вектор |ФД)АВ> подобно |т0АВ, нормиро- ван таким образом, что ав(Фм|Фм)Ад “ Применяя метод соответствен- ного состояния, имеем (I'T’^A a('PI) 13 |(®А ® 1в)(|^)дд Ав(1^1)1(1С*)в ~' ав(Ф>%- (3.W0)
3.3. Теорема о представлении Крауса 115 Мы почти у цели; определим оператор Мм в Т1А соотношением Мм : На (3.101) Можно проверить, что 1) Оператор Мд линеен, поскольку отображение |^)л —» антили- нейно. 2) §а(М.4а(^() -12 Мм(|у?)АЛ(^|)М1 для любого чистого состояния Ма € 'НА 3) $д(рл) = 52 М/хрлМ]( для любой матрицы плотности рА, посколь- м ку рА может быть предел авлена как ансамбль чистых состояний, а $л линеен. 4) £МмМ1 = 1Л, поскольку $л сохраняет след ыи любого рА. н Таким образом, мы построили представление операторной суммы для $л. Вкратце, доказательство состоит в следующем. Поскольку $л вполне положителен, то $л ® 1в преобразует максимально запутанную матрицу плотности в НА ® Нв в другую матрицу плотности. Эта матрица плот- ности может быть выражена, как ансамбль чистых состояний. Каждому из этих чистых состояний в 7i.A ® ?iB можно сопоставить (с помощью метода соответственных состояний) слагаемое операторной суммы. Рассматривая таким образом представление операторной суммы, мож- но легко установить два важных следствия: Как много операторов Крауса? Каждый оператор Мм связан с со- стоянием |ФМ) в представлении ансамбля р'АВ. Так как максимальный ранг Рав равен № (где N — сйшИл), $л всегда имеет представление опера- торной суммы с максимальным числом операторов Крауса, равным №. Какова неоднозначность? Выше мы отмечали, что операторы Крауса ^-Мдимо (3.102) (U^a - унитарное преобразование) представляют тот же, что и Мд, суперо- ператор $л. Теперь можно сказать, что любые два представления Крауса должны быть связаны таким образом. (Если число операторов Na оказы- вается больше, чем М тогда набору Мм, очевидно, нужно добавить со- ответствующее количество нулевых операторов, так чтобы эти два набора
116 I ЛАВА 3 операторов имели одинаковую мощность.) Эго свойство можно рассматри- вать как следствие теоремы ЖХЙВ. Описанная выше конструкция соответственного состояния устанавли- вает взаимно однозначное соответствие между представлениями ансамблей (ненормированной) матрицы плотности л * 1 £,)("< .ыИг'';1) [Т пред- ставлениями операторных сумм $л (Мы явно описали, как перейти от представления ансамбля к представлению операторной суммы, по. очевид- но, можно пойти и другим путем. 1-хли М10ддС/|) -EnU^aOImJ. (3.103) то (Ъ л 1 в) ( Iлв АВ’Л'О — Е, )нНа(Йн:Э !М[ (3.104) где - ЕМДЬ1'%.) (3.105) i Рассмотрим теперь дна таких ансамбля (тин соответственно два представ- ления $д операторными суммами) {уД/^|Фр) Afi} и Для каж- дого ансамбля и НАЬ S 'Нс существует соответствующее «очищение»: Е V (h‘ ДД тДад)г’ \ . (3.106) У? VPn |Гв/..1лР,Э(-. (I те и ММ Два ратных ортог нормированных набора из Нс. Теорема ЖХЙВ утверждает, что эти два «очищения» связаны между собой действующим в Нс унитарным преобразованием 14В <>• U'.. Следователь- но, Е VKIТ J ДН И ) с: £ у% А Р U'; hp ) с: <’ 1‘ (3.107)
3.4. Три квантовых канала 117 Здесь второе равенство мы получили, заметив что ортонормированные ба- зисы {}с} и Щ,)с} связаны между собой ушиарным преобразованием, а произведение преобразований, в свою очередь, унитарно. Мы приходим К ВЫВОДУ', что VPZltJnn - Е (3.108) м (где — унитарное преобразование), откуда следует, что No=EMAr (3.109) Замечание. Поскольку мы уже установили, что можем перейти от представления операторной суммы для к унитарному представлению, мы нашли, чю любой «разумный» закон эволюции оператора плотности в НА может быть реализован унитарным преобразованием U4B, действу- ющим в Н 4 Я как и4в : (3.110) и Является ли этот результат неожиданным'? Возможно, да. Мы можем ин- терпретировать еупероператор как описывающий эволюцию системы (Л), взаимодействующей с окружением (Я). В общем случае состояния систе- мы запутаны с се окружением. По в (3.110) предполагается, что началь- ное состояние не запутано. Несмотря на то что реальная система всегда связана запутыванием с ее окружением, при описании эволюции ее матри- цы плотности без потери общности можно представлять, что в момент, когда мы начинаем ее наблюдать, предварительное запутывание отсут- ci вует! Замечание. Представление операторной суммы даст очень удобный способ выражения любою вполне положительного $. Но положительный $ не допускает такого представления, если не является вполне положитель- ным. Насколько мне известно, не существует удобного, сопоставимого с представлением Крауса, способа выразить наиболее общий положитель- ный $. 3.4. Три квантовых канала Лучше всего познакомиться с понятием суперопсрагора, изучив несколь- ко примеров. Мы рассмотрим зри примера (все они интересны и по-
118 Глава 3 лезны) супероиераторов для одного кубита. Из уважения к традици- онной терминологии (классической) теории связи я буду ссылаться на эти супероператоры как на квантовые каналы. Мы можем представлять, что $ описывает судьбу квантовой информации, которая с некоторой по- терей точности воспроизведения посылается от передатчика к прием- нику. Или, если угодно, можно считать (в духе предыдущего обсужде- ния), что передача идет во времени, а не в пространстве, то есть $ описывает эволюцию квантовой системы, взаимодействующей с ее окру- жением. 3.4.1. Деполяризующий канал Деполяризующий канал представляет собой модель декогеренгизации кубита, имеющую особенно тонкие свойства симметрии. Мы можем опи- сать его, говоря что с вероятностью 1 - р кубит остается неповрежден- ным, тогда как с вероятностью р возникает ошибка. Она может быть лю- бой из трех типов, причем все три типа ошибок равновероятны. Если {(0), |1)} — ортонормированный базис кубита, их можно описать следу- ющим образом: 1. Ошибка инвертирования бита _ ( 0 i А \ 1 0 /’ или •’’l = 2. Ошибка обращения фазы |0) - |0) 1 0 0 -1 J' ID - -10 ИЛИ |ф) СГ3|-0), (73 - Обе ошибки |0) +х|1) 10 -г|0> или [ф} ^2\Ф}, <^2 = При появлении ошибки |ty) превращается в ансамбль трех равноверо- ятных СОСТОЯНИЙ. ОцМ, СТ 2 |И (73|^). Унитарное представление Деполяризующий капал может быть представлен унитарным операто- ром, действующим в НА ® НЕ, где размерность пространства НЕ равна четырем (Я обозначаю здесь это пространство НЕ, чтобы подтолкнуть вас
3.4. Три квантовых канала 119 к мысли о вспомогательной системе как окружении.) Унитарный опера- тор ил£ действует как U4B : |^)А & |0)в -> ^/1 ® |0)в I + ® Юе + о'2^)а® |2)я 1-о-3|^>а® |3>в]. (З.Ш) (Поскольку UAB сохраняет внутреннее произведение, он имеет унитарное расширение на все пространство НА ® НЕ.) Окружение эволюциониру- ет к одному из четырех взаимно ортогональных состояний, «хранящих за- пись» о том, что произошло; если бы мы могли измерить окружение в ба- зисе {|/т)в. р — 0,1,2,3}, мы узнали бы, какого сорта ошибка возникла (тогда мы были бы в состоянии вмешаться и устранить ошибку). Представление Крауса Чтобы получить представление канала в виде операторной суммы, вы- числим частичный след по окружению в базисе {|^)в}. Тогда Мм-ЕЯиАЕ|0)в, (3.112) где мо~ V1 -pl. M1 = j|o-1, (3.113) Используя — 1, можно непосредственно проверить условие нормиров- ки; £мХ= (1-р) + 3-| 1 = 1. м L J (3.114) Произвольная начальная матрица плотности кубита рА преобразуется как Ра Ра “ (1 ~.р)Ра + 1 о^Ра^й + ^зРл^з/ (3.115) где мы суммируем по четырем (в принципе различимым) путям, по кото- рым могло бы эволюционировать окружение. Представление соответственного состояния Канал можно также охарактеризовать, описывая как в нем преобразу- ется максимально запутанное состояние двух кубитов, если канал действует
120 Глава 3 только на первый кубит. Существует четыре взаимно ортогональных мак- симально запутанных состояния, которые можно записать в виде 1Ф+)ав — (|0°)ав Н I1 0ав)> )лв = ~7=(100}аЯ ~ V А (3.116) I^aB-^(|oi)ab + |loW iv )ав (|01)лв ~ |Ю)ан)- Если начальным состояние является |д~) 4в, то, когда деполяризующий ка- нал действует на первый кубит, запутанное состояние эволюционирует как \Ф^)аВ Ав(Ф^\ (1 -Р>+)аВА5<<?+1 + + ?^{\Ф+)ав ЛвФ'' I + 1Ф )лВАВ^ I НФ }лвлв(Ф D- (3.117) В «наихудшем» квантовом канале р = 3/4, в этом случае начальное запутанное состояние эволюционирует в \Ф ^)а.в ав(Ф н| | + |Ф )лвлв(Ф 1+ + 1Ф1 )лв лв (Ф+1 I- |Ф )авав(Ф I) “ (3.118) Оно становится полностью случайной матрицей плотности в 'НА & Tip, Тогда, применяя метод соответственною состояния, можно увидеть, что чистое состояние одного кубита А эволюционирует как 1^ааМ~> ^*2^1лвПЛ Ц1л; (3.119) в \ V / / в оно становится случайной матрицей в независимо от значения началь- ного состояния Как если бы канал выбросил начальное состояние и заменил его совершенно случайным мусором.
3.4. Три квантовых канала 121 Альтернативным представлением эволюции максимально запуганного состояния является И' )ав ав(<>+1 (1 - (3.120) Таким образом, вместо того, чтобы говорить о трех типах равновероятных ошибок, появляющихся с вероятностью р каждая, мы могли бы говорить, что с вероят!юстыо 4р/3 возникает ошибка, полностью «рандомизирую- щая» состояние (мы можем так говорить по крайней мере при р 3/4). Наличие двух естественных способов определения «вероятности ошибки» в этом канале иногда может приводить к путанице и недоразумениям. Полезной мерой того, насколько хорошо канал сохраняет исходную квантовую информацию, является так называемая «точность воспроизведе- ния запутанное ги» Fe. Она количественно определяет, насколько конечная матрица плотности «близка» к исходному максимально запутанному состо- янию Fe = {ф+\р'\^}. (3.121) Для деполяризующего канала мы имеем Fe - 1 -р и, следовательно, можем интерпретировать Fe как вероятность отсутствия ошибки Представление сферы Блоха Также поучительно рассмотреть, как деполяризующий канал действу- ет на сфере Блоха. Произвольная матрица плотности одного кубита может быть записана в виде Р= + (3.122) где Р — «спиновая поляризация» кубита. Повернем оси таким образом, чтобы Р = Р3ё3, а р ~ ^(1 + Рз^з)- Тогда, поскольку <т3<т3<т3 = гг3, а ст)<т3(71 -- - а3 — сг2(г3сг.2, найдем, что Р- (1-Р I |(И Р3а3) + ^1(1-Раа3) (3.123) \ о / * ох или Р3 - (1 - 4p/3)F3. С учетом симметрии относительно поворотов видно, что независимо от ориентации Р P'^(i-ip}P- (3-124)
122 I'ЛАВА 3 Следовательно, под действием деполяризующего канала происходит одно- родное сжатие сферы Блоха; спиновая поляризация уменьшается на мно- житель (1 — 4р/3) (вот почему мы называем этот канал деполяризующим). Этот результат следовало ожидать в связи со сделанным ранее заключением о том, что с вероятностью 4р/3 в канале происходит полная «рандомиза- ция» спина. Обратимость? Почему мы говорим, что супероператор необратим? Очевидно, мы можем обратить однородное сжатие сферы однородным же раздуванием. По беда в том, что раздувание сферы Блоха не положительно и потому не является супероператором. Раздувание преобразует Р длины |Р| 1 в век- тор длины |Р| > 1, преобразуя таким образом оператор плотности в опе- ратор с отрицательным собственным значением. Декогерентизация может сжать шар, но нет физического процесса, способного снова надуть его! Су- пероператор, бегущий назад во времени, не является супсроператором. 3.4.2. Капал затухания фазы Нашим следующим примером является канал затухания фазы. Этот случай интересен с практической точки зрения, поскольку представляет го- лую, свободную от несущественных математических деталей, карикатуру декогерентизации в реальной физической ситуации. Унитарное представление Унитарным представлением канала является |о)д|о)в УГ^|О)А|0)Е + 7р|о)а|1)й. |1)д|о)й^УГ=7Юл|о)в f Vp|iJaI2>£- ‘ } В этом случае, в отличие от деполяризующего канала, кубит Л не соверша- ет никаких переходов. Вместо этого он время от времени (с вероятностью р) «рассеивает» окружение, толкая его в состояние |1)в, если А находится в состоянии |0)л, и — в состояние |2}£, если А находится в состоянии |1)д. Более того, также в отличие от деполяризующего канала, этот канал выде- ляет предпочтительный базис для кубита А; только в базисе {|0)А |1) 4} не происходит опрокидывание спина кубита А.
3.4. Три квантовых канала 123 Предо явление Крауса Вычисляя частичный след по НЕ в базисе {|0)в, 11)|2)е}, получим операторы Крауса м0 = у^1, Mj-W J о)’ = 1)- <3126> Нетрудно проверить, что М2 + М2+М| — 1. В этом случае не обязательно иметь три оператора Крауса; как вы покажете в домашнем упражнении, возможно представление двумя операторами Крауса. Начальная матрица плотности р эволюционирует к $(р) - М0рМ0 + МгрМг + М?рМ2 = = (1 - Р)Р + Р ( Pq° ° \ и Pii / Роо (1 -p)jP10 t1 - Рп (3.127) таким образом, диагональные элементы р остаются неизменными, тогда как недиагональные — затухают. Предположим, что отнесенная к единице времени вероятность акта рассеяния Г такова, ч ю вероятность рассеяния за время ДА гораздо меньше единицы (р — Г ДА 1). Эволюция в течение времени t — nbt управ- ляется супсронсратором $п, так что недиагональные элементы матрицы плотности подавлякпея но загону (1 - р)п — (1 - ГДА)*/Л* —» ехр(—ГА) (при ДА —> 0). Таким образом, если мы приготовили начальное чистое со- стояние а|0) + &| 1), то спустя время А Г-1 оно распадается в некогерент- ную суперпозицию р' = ja|2|0)(0| + |&|2|1)(1|, Декогерентизация возникает в выделенном базисе {|0), |1)}. Представление сферы Блоха Эту задачу вы исследуете в домашнем упражнении. Интерпретация Канал затухания фазы можно интерпретировать как описывающий тя- желую «классическую» частицу (например, частицу межзвездной пыли), взаимодействующую с фоновым газом легких частиц (например, с фотона- ми реликтового микроволнового излучения). Можно представить, что пер- воначально пылинка была приготовлена в суперпозиции собственных со-
124 Глава 3 стояний оператора координаты |ф) — + I - х‘>) (или в более общей суперпозиции слабо перекрывающихся, нрострапственно-локализованпых во.шовых пакетов). Можно контролировать поведение частички пыли, но безнадежно пытаться следить за квантовым состоянием всех фотонов, рас- сеиваемых этой частицей; для наших целей ее квантовое состояние опи- сывается матрицей плотности р, полученной после вычисления следа по фотонным степеням свободы. Наш анализ канала затухания фазы показывает, что если фотоны рас- сеиваются частицей с частотой Г, то недиагональные элементы матрицы плотности р затухают как ехр(—Г£) и становятся полностью пренебрежи- мыми при О Г Начиная с этого момента, когерентная суперпозиция собственных состояний оператора положения полностью разрушена — нет никакой возможности восстановить волновые пакеты и заставить их интер- ферировать. (Если мы пытаемся получить с помощью частиц пыли картину интерференции на двух щелях, то мы не увидим ее, если пылинкам необ- ходимо время t Г-1, чтобы пройти путь от источника до экрана.) Частицы пыли тяжелы. Вследствие большой инерции, их состояние движения мало подвержено влиянию со стороны рассеиваемых фотонов. Таким образом, имеется два несоизмеримых временных масштаба, име- ющих отношение к динамике частиц пыли. С одной стороны, это время затухания, то есть время, за которое значительная часть импульса частиц передается фотонам: это большое время, если частицы достаточно тяже- лы. С другой стороны, существует временной масштаб декогерентизации. В этой модели он имеет порядок Г 1 — времени, в точение которою на ча- стице пыли происходит рассеяние одного фотона и которое юраздо короче временного масштаба затухания. В макроскопическом объекте декогерен- тизация протекает быстро. Как мы уже отмечали, канал затухания фазы выделяет предпочтитель- ный базис для декогерентизации, в нашей «интерпретации» мы предпо- ложили, что им является базис собственных состояний оператора положе- ния. С физической точки зрения декогерептизация выделяет просгранствен- но локализованные состояния частиц пыли, поскольку их взаимодействие с фотонами локализовано в пространстве. Частицы, находящися в различи- мых пространственных положениях, стремятся рассеивать фотоны во вза- имно ортогональные состояния. Даже если «частицы» разделены настолько мало, что они не разреша- ются рассеиваемыми фотонами, процесс декогерентизации все еще работа- ет подобным образом. Возможно, фотоны, рассеянные частицами, находя- щимися в точках Ча: и —х, не являются взаимно ортогональными, а вместо
3.4, Три квантовых канала 125 этого имеют ненулевое перекрытие {7 + I7—) — 1 — f. (3.128) Тем нс менее канал .затухания фазы описывает эту ситуацию, но теперь с р, замененным на sp (если р - по-прежнему вероятность акта рассеяния). Таким образом, темп декогерентизации становится равным rdec — £.Tstat, где Гжа(. — частота рассеяния (см. домашнее задание). Интуитивное понимание, извлекаемое из этой простой модели, приме- нимо к 01 ром ному множеству физических ситуаций. Распад которентной суперпозиции макроскопически различимых состояний «тяжелых» объек- тов происходит гораздо быстрее их затухания, Пространственная локали- зация взаимодействия системы с ее окружением делает предпочтительным для декогерентизации «локальный» базис. По-видимому, подобные прин- ципы можно применить к декогерентизации «состояния кота» -^(|dead) + -t- (alive)), поскольку состояния «мертвый» и «живой» можно различить локальными испытаниями. 3.43. Канал затухания амплитуды Капал затухания амплитуды представляет собой схематическую мо- дель распада возбужденного состояния (двухуровневого) атома вследствие спонтанного излучения фотона. Регистрируя излучаемый фотон («наблюдая за окружением»), мы можем выполнить ПОЗМ, которая дает информацию о начальном состоянии атома. Унитарное представление Обозначим как |0)л основное состояние атома, а интересующее нас возбужденное состояние - |1)л. Роль «окружения» щ-рает электромагнит- ное поле, начальным состоянием которого предполагается основное |0)Е Существует' вероятность р того, что некоторое время спустя возбужденное состояние распадается в основное |0)л, что сопровождается излучением фотона и, следовательно, переходом окружения из состояния |0)в («нет- фо гонов») в состояние |1)Е («один фотон»). Эта эволюция описывается унитарным преобразованием, действующим на атом и окружение как |0)д|0)£ - |0)А|0)£: - 'Л^Й1)Л|О)Е + ^|0)л|1)£. (3.129)
126 Глава 3 (Естественно, если начальным состоянием атома является основное, а окру- жение находится при нулевой температуре, то никакие переходы не проис- ходят). Операторы Крауса Вычисляя частичный след по окружению в базисе {|0)£, |1)в}, най- дем операторы Крауса лМ’ м,=(««7 (злда Нетрудно проверить, что MjM0 +М}МХ = ( J t ° р ) 4 ( ° °р } - 1. (3.131) Оператор М; индуцирует «квантовый скачок» — распад состояния |1}л в |0)А, а Мо описывает эволюцию состояния в отсутствии скачков. Матри- ца плотности изменяется как р -> i м1Рм*- _ ( Poo v/] ~PPoi \ PPn 0 \ t/T^PPio (1-p)Pu / \ 0 0 J = / PooH PPn ~ PPoi A V V^-PPw (1-p)Pn )' (3.132) Если мы применим канал п раз подряд, то матричный элемент рп умень- шится согласно Ры - (1-рГРн- (3.133) Следовательно, если вероятность перехода в течение времени Д£ рав- на ГАС то вероятность того, что возбужденное состояние проживет в тече- ние времени t равна (1 — ГДг)^л* —► е-Гг, ожидаемый экспоненциальный закон затухания. При t —> оо вероятность затухания стремится к единице, следователь- но: адт^«> + й' оу (3.134)
3.4- Три квантовых канала 127 Атом всегда сваливается в свое основное состояние. Этот пример покаты- вает, что иногда оказывается возможным, что еупероператор преобразует начальное смешанное состояние, например: ) <3-135’ в чистое конечное состояние. Контроль окружения В случае распада возбужденною атомного состояния, сопровождающе- юся излучением фотона, полезно следить за состоянием окружения с по- мощью детектора фотонов. Измерение окружения готовит чистое состояние атома и, в сущности, предотвращаает процесс декогерентизации. Возвращаясь к унитарному представлению капала затухания амплиту- ды, мы видим, что когерентная суперпозиция основного и возбужденного атомных состояний эволюционирует как (Л)0)л+г>р)7у)]0)в^(а|0)л + бУТ^|1}в)^л.+^|0}Аг1)Е. (3.136) Регистрируя фотон и, следовательно, проецируя окружение на состоя- ние 11 )Ё, мы готовим атомное состояние |0)л. Фактически мы приготовили состояние, относительно которого нам точно известно, что оно было по- рождено начальным возбужденным атомным состоянием }1)л, — основное состояние не раснадаегся. С другой стороны, если мы не зарегистрировали фотон, а наш детектор обладает идеальной чувствительностью, то мы спроецировали окружение на состояние |0)ь. и, следовательно, приготовили атомное состояние а|0)А I ЬУТ^|1)5. (3.137) Ввиду неудачи в регистрации фотона становится более вероятным, что на- чальным атомным состоянием было основное! Как уже отмечалось, унитарное преобразование, которое запутывает А с Е вслед за ортогональным измерением Е, может быть описано как ПОЗМ в А. Если )/>)л изменяется как (3.138)
128 ГЛАВА 3 то ортогональное измерение в Е, которое проецирует на базис {|/т)в}, для каждого результата р реализует ПОЗМ с Prob(p) = tr (ГрРл), F^MX- (3.139) В случае канала затухания амплитуды находим: F о 1 0 \ О 1 -р )' (3.140) где Fo определяет вероятность успешного детектирования фотона, a F, — дополнительную к ней вероятность того, что фотон не зарегистрирован. Если мы ожидаем в течение времени t 1 “1, так что р стремится к единице, наша ПОЗМ приближается к ортогональному измерению, из- мерению начального атомного состояния в базисе {|0)д. |1)д}. Необычной чертой этого измерения является то, что мы можем проецировать на со- стояние |0)л, не регистрируя фотон. Это пример того, что Дикке называл «измерением без взаимодействия» - наблюдая отсутствие изменения в со- стоянии окружения, мы делаем вывод, каким должно было быть атомное состояние. Термин «измерение без взаимодействия» является общеупотре- бительным, хотя он в некоторой степени вводит в заблуждение; очевидно, что если бы гамильтониан Вселенной не включал связь атома с электромаг- нитным полем, то измерение было бы невозможно. 3.5. Основное уравнение 3.5.1. Марковская эволюция Формализм супероператоров предоставляет общее описание эволюции матрицы плотности, в том числе эволюции чистого состояния в смешанное (декогерентизация). В том же смысле, в каком унитарное преобразование дает’ общее описание когерентной квантовой эволюции. В последнем слу- чае динамику квантовой системы удобно характеризовать гамильтонианом, описывающим эволюцию в бесконечно малом интервале времени. Тогда динамика описывается дифференциальным уравнением, уравнением Шре- дингера. Итерируя это уравнение или, иначе говоря, складывая эволюции на множестве инфинитезимальных интервалов, мы можем рассчитать эво- люцию в течение конечного интервала времени. Часто, по крайней мере в хорошем приближении, оказывается возмож- ным описание эволюции (не обязательно когерентной) матрицы плотности
3.5. Основное уравнение 129 дифференциальным уравнением. Это так называемое основное уравнение (master equation) будет нашей следующей темой. В самом деле, непонятно, почему для описания декогерентизации необходимо дифференциальное уравнение. Такое описание возможно, ес- ли только эволюция квантовой системы является «марковской» или, дру- гими словами, локальной во времени. Если эволюция во времени t опера- тора плотности p(t) управляется дифференциальным уравнением (первого порядка), то это значиз, что оператор p(t + dt) полностью определяется оператором р(£). Мы видели, что всегда можем описать эволюцию оператора плотности рл н гильбертовом пространстве 'НА, если предположить, что в расширен- ном гильбертовом пространстве 'НД®'НВ она в действительности является унитарной. Но, даже если эволюция в НА A %в управляется уравнением Шредингера, этого не достаточно, чтобы обеспечить локальность во вре- мени эволюции pA(t). Действительно, если мы знаем только pA(t), мы не имеем полной системы начальных условий для уравнения Шрединге- ра; кроме этого нам необходимо знать состояние «окружения». Так как из общей теории супероператоров известно, что мы вправе потребовать, что в момент времени t ~ 0 квантовым состоянием в пространен вс ЦА ® 7 (ь является Ра® We£(0|, (3.141) то наиболее ярким выражением этой трудности является то, что оператор плотности pA(t + dt) зависит не только от pA(t), но также и от рА в более ранние моменты времени, поскольку резервуар Е1 некоторое время сохра- няет намять об этой информации и может вернуть ее обратно в систему А. Это затруднение возникает вследствие тою, что информация течет по улице с двухсторонним движением. Открытая система (классическая или квантовая) является диссипативной, поскольку информация может перете- кать из системы в резервуар Но это значит, что информация может также течь обратно из резервуара в систему, приводя к немарковским флуктуаци- ям в системе2 Таким образом, за исключением случая когерентной (унитарной) эво- люции, флуктуации неизбежны, а строго марковское описание квантовой динамики невозможно Тем не менее во многих отношениях марковское описание является хорошим приб.шжением, К. нолевая идея здесь в том, что возможно разделение между типичным корреляционным временем флукту- 1 Обсуждая основное уравнение, окружение обычно называют резервуаром в знак уваже- ния к глубоко укоренившейся терминологии статистической физики, 2Эга неизбежная связь лежит в основе флуктуационно-диссипациоаной теоремы, мощно- го инструмента статистической физики.
130 Глава 3 аций и временным масштабом набщодаемой нами эволюции. Грубо гово- ря, мы можем обозначить через (z\t)res время, которое требуется резерву- ару, чтобы «забыть» полученную от системы информацию, — спустя вре- мя (At)res мы можем считать, что информация навсегда потеряна, и пре- небрегать возможностью того, что она вновь вернется, чтобы повлиять на дальнейшую эволюцию системы Наше описание эволюции системы будет включать в себя «сглажива- ние» («coarse graining») во времени: мы воспринимаем динамику сквозь фильтр, скрывающий высокочастотную часть движения с сл >> (A^)cLin»- Тогда марковское описание должно быть приближенно справедливым, ес- ли (At)res (At)coarse; мы можем пренебречь памятью резервуара, по- скольку не в состоянии обнаружить ее влияние. Это «марковское прибли- жение» полезно, если временной масштаб наблюдаемой нами динамики ве- лик по сравнению с (Д£)соагье, например, если временной масштаб затуха- ния (A/)darnp удовлетворяет неравенству (A/)damp » (A«)CMrse » (Af)res (3.142) Это условие часто выполняется на практике, например, в атомной физике, где (At)res ~ Ъ,/кТ ~ 10-14с (Т - температура) по порядку величины больше типичного времени жизни возбужденного состояния. Поучительным примером является случай, в котором система Л пред- ставляет собой один гармонический осциллятор (Нл = <ла^а), а ре- зервуар R состоит из множества гармонических осцилляторов (Ня = — 52 слабо связанных с рассматриваемой системой возмущением Н' - А, (аь| + а%). (3.143) i Гамильтониан резервуара может, например, представлять (свободное) элек- тромагнитное поле, тогда Н' в низшем нетривиальном порядке теории воз- мущений индуцирует переходы, в которых осциллятор излучает или погло- щает один фотон, при этом уменьшая или соответственно увеличивая свое число заполнения и = а4а. Мы могли бы подойти к основному уравнению, анализируя систему с помощью зависящей от времени теории возмущений, аккуратно вводя ко- нечную обрезающую частоту Детали этого анализа можно найти в книге Говарда Кармайкла' Однако здесь я хотел бы обойтись без него и пере- прыгнуть к основному уравнению более эвристическим путем. 1 Howard Carmichael, Open Systems Approach to Quantum Optics, Springer Veriag, Berlin et al 1993. На русском языке см. Ю. Л. Климентович Статистическая теория открытых систем, тт. 1-3, Яиус-К М„ 1995-2001; Ю. Л. Климонтович Введение в физику открытых систем, Янус-К М., 2002. — Прим ред
3.5. Основное уравнение 131 3.5.2. Линдбладиап При унитарной эволюции изменение матрицы плотности во времени управляется уравнением Шредингера1 р=-»[Н,р], (3.144) которое, при не зависящем от времени Н, можно формально решить и най- ти p(t)-e *Hfp(0)e1Ht. (3.145) Нашей целью является обобщение этого уравнения на случай марковской, но не унитарной, эволюции, в котором мы будем иметь P--ZM (3.146) Линейный оператор С., порождающий конечный супероператор в том же смысле, в каком гамильтониан Н порождает унитарную эволюцию во вре- мени, будет называться линдбладианом. Если С не зависит от времени, то формальное решение уравнения (3.146) имеет вид p(t) = еар(0). (3.147) Чтобы вычислить линдбдадиан, мы начинаем с уравнения Шредингера для системы, связанной с резервуаром Ра ~ (.Par) — trR ([Над, Рая] ) > (3.148) но, как уже отмечалось, мы не ожидаем, что эта формула для рА может быть выражена лишь через рА. Чтобы найти линдбладиан, необходимо яв- но воспользоваться марковским приближением (как это делает Кармайкл). С другой стороны, предположим, чго марковское приближение применимо. Мы уже знаем, что наиболее общий супероператор можно записать в пред- ставлении Крауса: Ра (С - [Р(О)] = £Мд(*)р(0)М* (*)> 0-149) в причем ${_ii = 1. Если пролетевшее время является инфинитезимальным интервалом dt и p(dt) --р(0)+О(<й), (3.150) 1В статистической физике это уравнение принято называть квантовым уравнением Ли- увилля, хотя, конечно, оно непосредственно выводится из уравнения Шредингера. — Прим, ред
132 Глава 3 тогда одним из операторов Крауса будет Мо - 1 I O(dt), а все остальные будут иметь порядок Vdt. Операторы Мя (р > 0) описывают «кванто- вые скачки», которые с вероятностью порядка dt может совершать система. Следовательно, мы можем записать р — 1,2,3,..., мо =- 1+ Н’Щ K)dt, (3.151) где Н и К эрмитовы, причем L^, Н и К имеют нулевой порядок по di. Фактически, оператор К можно определить, используя условие нормиров- ки Крауса 1 = £»1м-11 <Й[2К I £LtlA (3.152) н \ р>о J или (3.153) Z д>0 Подставляя это в уравнение (3.149), выражая p(df) = р(0) + p(O)dt и срав- нивая слагаемые порядка dt, получим уравнение Линдблада*: Р - £[р| - -’[Н,р] + “ |ЦЬдР ~ |рЦч) (3.154) Первый член в £|р] представляет собой обычное слатаемос Шрсдинте- ра, генерирующее унитарную эволюцию. Остальные слагаемые описыва- ют возможные переходы, которые может испытывать система, вследствие ее взаимодействия с резервуаром. Операторы LM называются операторами Линдблада или операторами квантовых скачков. Каждое слагаемое L/xpL^ индуцирует один из возможных квантовых скачков, тогда как слагаемые — — необходимы для корректного описания тех случаев, когда скачки не возникают. Уравнение Линдблада (3.154) и есть то, что мы искали, общая фор- ма (вполне положительной) марковской эволюции матрицы плотности: то есть основное уравнение. Из представления Крауса, с которого мы на- чинали, следует, что уравнение Линдблада сохраняет матрицу плотно- сти: p(t f-dt) матрица плотности, если таковой является p(t). Действи- тельно, используя уравнение (3.154), можно непосредственно проверить. 'Уравнение Линдблада, описывающее марковскую эволюцию матрицы плотности от- крытой системы, получено в работе G. Lindblad, On the Generators oj Quantum Dynamical Semigroups, Commun. Math. Phys., 48, 119 -130 (1976). - Прим. ped.
3.5. Основное уравнение 133 что р эрмитов, a tr р = 0. То, что сохраняет положительность, несколь- ко менее очевидно, но, как уже отмечалось, следует из представления Крауса. Если мы вспомним связь между представлением Крауса и унитарным представлением супероператора, то интерпретацию основного уравнения можно сделать более прозрачной. Представим, что мы непрерывно контро- лируем резервуар, проецируя его в каждый момепт времени на базис |р)д, С вероятностью 1 — O(dt) резервуар остается в состоянии |0)н, а с вероят- ностью порядка dt он совершает скачок в одно из состояний |р)д (р > 0). Говоря, что резервуар «забыл» информацию, полученную от системы (так что применимо марковское приближение), мы считаем, что эти переходы происходят с вероятностями, линейно растущими со временем. Напомним, что это не следует автоматически из зависящей от времени теории воз- мущений. На малых временах t вероятности отдельных переходов пропор- циональны £2; мы получаем темп (дифференцируя «золотое правило Фер- ми») только после суммирования по непрерывному континууму возможных конечных состояний. Поскольку количество доступных состояний в дей- ствительности убывает как 1/Л просуммированная по конечным состояни- ям вероятность перехода пропорциональна t. Используя марковское опи- сание динамики, мы явно предполагали, что масштаб времени (Ai)coarse настолько велик, что мы можем приписать часто™ различным возможным переходам, которые могут быть обнаружены, пока мы контролируем окру- жение системы (резервуар). В действительности это следует из требова- ния (AfJeoarsc » (Acres’ 3.53. Затухающий гармонический осциллятор В качестве примера, иллюстрирующего основное уравнение, рассмот- рим взаимодействующий с электромагнитным полем гармонический осцил- лятор Н'-£л,(аЬ* + аЧ<|. (3.155) 11рсдположим, что температура резервуара равна нулю; тогда будет наблю- даться падение уровня возбуждения осциллятора, сопровождающееся по- следовательным излучением фотонов, но поглощения фотонов происходить не будет. Следовательно, имеется только один оператор скачка: L,- УГа. (3.156) Здесь Г' представляет собой темп распада первого возбужденного (п = 1) состояния осциллятора в основное (п — 0) состояние; в соответствии со
134 Глава 3 структурой гамильтониана Н' темп затухания в результате перехода с п-го уровня на (п — 1)-й равен пГ.1 Основное уравнение в форме Линдблада приобретает вид -i (3.157) где Но = — гами.тыониан осциллятора. Это то же самое уравне- ние, что и полученное Кармайклом с помощью более изощренного анализа. (Мы не учли здесь только лэмбовский сдвиг, или радиационную перенор- мировку частоты осциллятора, имеющую тот же порядок, что и слагаемые скачков в £[pj.) Слагаемые скачков в основном уравнении описывают затухание ос- циллятора вследствие излучения им фотонов2 *. Чтобы исследовать влияние скачков, удобно перейти к представлению взаимодействия; определим опе- раторы pi и а7 в предс 1авлении взаимодействия p(i) = е-*н°*рг (*)е‘н< a(t) (3.158) так что Pi = г ^атР1а; - |агЧРг ~ , (3.159) где фактически а7(() — следовательно, в правой части уравне- ния (3.159) можно заменить а7 на а. В отсутствии затухания переменная а — е 1Но4ае1Но« — ае«“‘ остается постоянной. При наличии затухания а изменяется в соответствии с уравнением 4(а) - -^tr(ap;) = trap, (tv U'V' (3.160) а из (3.159) мы имеем trap — 1’tr ^а2р/а^ — |аа^ар, — ^ар7а^а^ — = rtr(|[at,a|aPH =-Jtr(apr) = ~7j(a). (3.161) 'гг-с возбужденное состояние осциллятора может интерпретироваться как состояние гг невзаимодействующих частиц; его темп затухания равен пГ, поскольку исчезнуть при этом может любая из п частиц (квантов). 2 Эта модель распространяет наше обсуждение канала затухания амплитуды, скорее на затухающий осциллятор, а не на затухающий кубит.
3.5. Основное уравнение 135 Интегрируя это уравнение, получим (a(t)> = e-rt/2(a(0)). (3.162) Аналогично, число заполнения осциллятора nata — а1а затухает со- гласно — Г tr f a^a2pja^ — - ^a^apja^a = Ttra1 [af, а] ар у ~ -Г1га*ар, — - Г(п), (3.163) что после интегрирования дает (n(t))=e rt(n(0)). (3.164) Таким образом, Г представляет собой темп затухания осциллятора. Мы мо- жем интерпретировать п-е возбужденное состояние осциллятора как со- стояние п невзаимодействующих частиц, каждая из которых распадается с отнесенной к единице времени верой люстью Г; следовательно, уравне- ние (3.164) и есть тот самый экспоненциальный закон, которому удовлетво- ряет численность популяции распадающихся частиц. Более интересно то, что говорит основное уравнение о декогерентиза- ции. Детали этого анализа будут в домашнем задании. Л здесь мы проана- лизируем более простую задачу осциллятор, испытывающий затухание фазы. 3.5.4. Затухание фазы Чтобы смоделировать затухание фазы гармонического осциллятора, возьмем другую связь осциллятора с резервуаром: Н' = afa. \ ♦ / (3.165) Таким образом, существует только один оператор Линдблада, а основное уравнение в представлении взаимодействия имеет вид Pi “ г fatap/ata- |(ata)2p/ - ^Pi(*fa)21 (3.166)
i 36 Глава 3 Здесь Г может интерпретироваться как частота (отнесенная к единице вре- мени вероятность), с которой фотоны резервуара рассеиваются осциллято- ром, находящимся в первом возбужденном состоянии. Если число заполне- ния равно п, то частота рассеяния становится равной п2Г. Причина появле- ния множителя п2 состоит в том, что все вклады в амплитуду рассеяния от каждой из п осцилляторпых «частиц» складываются когерентно; амплитуда пропорциональна п. а частота (темп) — и2. Уравнение для (3.166) легко решить в базисе чисел заполнения. Разлагая Pi •- (3.167) (где ata|n) — n|n)), запишем основное уравнение в виде • f 1 9 1 9 X Рпт = г ( пт - -п - -т } р71т -т)2р„т. (3,168) Его итерирование даст P,imW) = рпт(0)схр -|П(« - т)2 (3.169) Если мы приготовим подобную «кот-состоянию» суперпозицию соб- ственных состояний оператора чисел заполнения с большой разницей зна- чений п |cat) -^(|0) 1 |п)), п» 1, (3.170) то псдиагопальные элементы матрицы плотности будут затухать как ехр ( - Гп2(/2). Фактически это точно такой же тип поведения, что и об- наруженный нами при анализе затухания фазы одного кубита. Темп декоге- рентизации равен п3Г, так как он равен частоте рассеяния фотонов резер- вуара осциллятором, возбужденным в состояние |«). Как и ранее, мы ви- дим также, что декогерентизация фазы выбирает предпочтительный базис. Она возникает в базисе собственных состояний оператора чисел заполне- ния, поскольку это именно тот оператор, который входит в связь осцилля- тора с резервуаром Н'. Вернемся к затуханию амплитуды. Поскольку в нашей модели зату- хания амплитуды в связь осциллятора с резервуаром Н' входит оператор уничтожения а (и сопряженный ему оператор рождения af), то можно пред- положить, что декогерентизация возникает в базисе собственных состояний
3.5. Основное уравнение 137 оператора а. Когерентное состояние ОО п |а) = e-'“,2/2eQa1 [0) - е '“|2/2 -7=!») (3.171) n=o V п! представляет собой собственное состояние оператора а, отвечающее соб- ственному значению а. Два когерентных состояния с разными собственны- ми значениями aL и а2 не ортогональны друг другу: e-a'^-’alh2Re^“'’) = exp(-|a1 -o2|2)f (3.172) следовательно, перекрытие очень мало при большой величине |ог — о2|2. Представим, что мы приготовили «кот-состояние» [cal) ---UM + M; (3-173) V •“ суперпозицию когерентных состояний с |at - о2| 1. Вы покажете (в до- машнем упражнении), что недиагональные элементы матрицы плотности р затухают как expf-^loj-о2|2) (3.174) (при П с 1). Таким образом, темп декогерентизации 1 dec — - а2 |2Гаатр (3.175) о1ромен по сравнению с темпом затухания. Такое поведение также легко интерпретируется. В когерентном состоянии ожидаемое значение числа за- полнения равно (а|а*а|а) — |а(2. Следовательно, если а, 2 сравнимы но модулю, но имеют существенно разные фазы (как в суперпозиции волно- вых пакетов с минимальной неопределенностью, центрированных в точках 1 х и — .г), темп декогерентизации имеет порядок темпа эмиссии одного фотона. Он очень велик по сравнению с темпом диссипации значительной части энергии осциллятора. Аналогично можно рассмотреть осциллятор, связанный с резервуаром, находящимся при конечной температуре. Вновь темп декогерентизации бу- дет иметь порядок частоты излучения или поглощения одного фотона, но теперь опа гораздо выше, чем при нулевой температуре. Поскольку фотон- ные моды с частотой, сравнимой с частотой осциллятора со, имеют терми- чески равновесное число заполнения (3.176)
138 Глава з (при Т » ftw), то интенсивность взаимодействия увеличивается множите- лем ny. Тогда мы имеем rdec _ ~ Е~Т_ Т .1тр X2 I 'd amp °9С 7 Ъшбш 1гш Иш /г2 ’ (3.177) где х амплитуда осцилляций, а Ат тепловая длина волны де Бройля. Декогерентизация протекает очень быстро. 3.6. В чем проблема? (Здесь есть проблема?) Наш обзор оснований квантовой теории почти завершен, Ио прежде чем мы займемся своим главным делом, кратко проанализируем состояние этих оснований. Находится ли квантовая теория в «хорошей форме» или в ее корнях имеются фундаментальные проблемы, до сих пор требующие своего решения? Одпой такой потенциально серьезной проблемой, впервые упомяну- той в § 2.1, является проблема измерения. Мы отмечали странный дуализм, присущий аксиомам квантовой теории Существует два способа измене- ния квантовою состояния: детерминистская унитарная эволюция и веро- ятностное измерение. Но почему измерение должно принципиально от- личаться от любого другою физического процесса? Этот дуализм вселяет в некоторых людей подозрение, что современная формулировка квантовой теории все еще не полна. В этой главе мы многое узнали об измерениях В §31.1 мы обсуди- ли, как унитарная эволюция может привести к появлению корреляций (за- путывания) между системой и «переменной-указателем» измерительного прибора. Таким образом, чистое состояние системы может эволюциониро- вать в смешанное (после взятия следа по состояниям «указателя»), которое допускает интерпретацию как ансамбля взаимно ортогональных чистых со- стояний (собственных состояний оператора плотности рассматриваемой си- стемы), каждое из которых возникает с вполне определенной вероятностью. Таким образом, уже в этом простом высказывании заложены зерна более глубокого понимания того, как исключительно в рамках унитарной эволю- ции может возникнуть «коллапс» (редукция) вектора состояния. С другой стороны, в § 2.5 мы говорили о том, что интерпретация матрицы плотно- сти как ансамбля неоднозначна. В §2.5.5 мы особенно ясно видели, что если мы способны измерить «указатель» в любом понравившемся нам ба- зисе, то мы можем приготовить систему в любом из множества «экзотиче- ских» состояний, суперпозиций собственных состояний системы р (георе-
3.6. В ЧЕМ ПРОБЛЕМА9 (ЗДЕСЬ ЕСТЬ ПРОБЛЕМА?) 139 ма ЖХЙВ). Следовательно, редукция (разрушающая относительные фазы состояний в суперпозиции) не может быть объяснена одним только запуты- ванием. В § 3.4 и § 3.5 мы изучали другой важный аспект процесса измерения — декогерентизацию. Главная идея состоит в том, что в случае макроскопи- ческих систем мы не можем надеяться уследить за всеми микроскопиче- скими степенями свободы. Нам приходится довольствоваться сглаженным (coarse-grained) описанием, получающимся в результате взятия следа по множеству ненаблюдаемых переменных. В случае макроскопического из- мерительного прибора мы должны взять след по степеням свободы окруже- ния, с которым прибор неизбежно взаимодействует. Тогда мы обнаружим, что прибор исключительно быстро релаксирует в некоторый предпочти- тельный базис, определяемый природой связи прибора с его окружением. Похоже, что особенностью гамильтониана Вселенной является то, что фун- даментальные взаимодействия хорошо локализованы в пространстве, сле- довательно, избираемый в процессе декогерентизации базис также хорошо локализован в пространстве. Кот или жив или мертв, а не в суперпозиции состояний 1/V2(|alive) + jdead)). Вычисляя след по степеням свободы окружения, мы получаем более полную картину процесса измерения, «редукции». Наша система запуты- вается с прибором, который, в свою очередь, запутан с окружением. Если мы рассматриваем микросостояние окружения, как недоступное в любой момент времени, то мы вправе говорить, что измерение состоялось. Отно- сительные фазы базисных состояний системы безвозвратно потеряны — ее вектор состояния коллапсировал. Конечно, с принципиальной точки зрения никакой реальной потери ин- формации о фазах пет. Эволюция системы+прибора+окружепия является унитарной и детерминистской. В принципе мы, вероятно, могли бы выпол- нить в высшей степени нелокальное измерение окружающей среды и вос- становить якобы разрушенную фазовую информацию о системе. В этом смысле наше объяснение коллапса, по выражению Белла, годится только «для всех практических целей» (FAPP: «for all practical purposes»). После «измерения» когерентность системы базисных состояний в принципе мог- ла бы быть восстановлена (мы могли бы обратить измерение с помощью «квантового удаления»), но осуществление такого измерения в высшей сте- пени невероятно В самом деле, коллапс имеет место только «для всех прак- тических целей» (хотя, вероятно, мы могли бы доказать в космологическом смысле, что некоторые измерения действительно принципиально необра- тимы), по существует ли то, что достойно быть нс «для всех практических целей»?
140 Глава 3 Нашей целью в физике является объяснение наблюдаемых, явлений на основе как можно более простых моделей. Не нужно постулировать два фундаментальных процесса (унитарная эволюция и измерение), если суще- ственным является только один из них (унитарная эволюция). Тогда при- мем, ио крайней мере временно, такую гипотезу: Эволюция замкнутой квантовой системы всегда унитарна. Конечно, мы видели, что нс все супероператоры унитарны, суть ги- потезы в том, что неунитарная эволюция открытой системы, в том числе и происходящая в процессе измерения редукция, всегда возникает в резуль- тате игнорирования некоторых степеней свободы большей системы. Эта точка зрения была провозглашена Хьюго Эвереттом в 1957г1. Согласно ей эволюция квантового состояния Вселенной является действительно детер- министской! Но даже если мы согласимся с тем, что редукция объясняется деко- герептизацией в системе, то есть на самом деле является детерминирован- ной, мы не избавимся от всех загадок квантовой теории. Для волновой функции Вселенной фактически существует суперпозиция состояния, в ко- тором кот мертв, и состояния, в котором кот жив. Несмотря на это, всякий раз, когда я наблюдаю за котом, он либо жив, либо мертв. Оба исхода воз- можны, но только один из них реализуется в действительности. Почему это так? Ваш ответ на этот вопрос может зависеть от вашего понимания квап- товон теории. Существует (по меньшей мере) два приемлемых направления рассуждений. Платоник: Физика описывает реальность. В квантовой теории «волновая функция Вселенной» представляет полное описание физической ре- альности. Позитивист: Физика описывает наши ощущения Волновая функция коди- рует состояние наших знаний, а задача квантовой теории - дать по возможности наилучшие предсказания относительно будущего на ос- нове текущего уровня наших знаний. Я верю в реальность. Я думаю, что мои доводы прагматичны. Как фи- зик, я стремлюсь к наиболее экономичной модели, «объясняющей» то, что я воспринимаю. По крайней мере д,и физика, простейшим предположени- ем является то, что мои (и ваши) ощущения скоррелированы с лежащей в их fH. Everett, П1 "Relative State" Formulation <ij Quantum Mechanics, Rev. Mod. Phys , 29, 454-462 (1957). - Прилс ped.
3.6. В ЧЕМ ПРОБЛЕМА? (ЗДЕСЬ ЕСТЬ ПРОБЛЕМА?) 141 основе внешней по отношению ко мне реальностью. Серьезному философу эта онтология может показаться безнадежно наивной. Однако я предпочи- таю верить в реальность, поскольку это предположение выглядит простей- шим из тех, что могли бы успешно объяснить мои ощущения. (В подобном же духе я предпочитаю верить, что наука представляет нечто большее, чем просто консенсус. Я верю, что наука способствует прогрессу и прибли- жает нас к удовлетворительному пониманию Природы — законы физики открыты, а не придуманы. Я верю в это, потому что это наиболее простое объяснение тою, почему ученые так легко приходят к взаимопониманию.) Те, кто придерживается другой точки зрения (даже если существует объективная реальность, вектор состояния описывает не ее, а всего лишь уровень наших знаний о ней), склонны считать, что современная форму- лировка квантовой теории не вполне удовлетворительна, что существует более глубокое описание, все еще ждущее своего открытия. Пока вы ле сможете убедить меля в обратном, мне представляется более разумным предполагать, что волновая функция дает описание реальности. Если мы полагаем, что волновая функция описывает реальность, и если принимаем точку зрения Эверетта, что вся эволюция является унитарной, то мы обязаны признать, что вес возможные исходы измерения имеют оди- наковое правд быть «реальными». Как тогда понять, почему в эксперименте реализуется только один результат — кот или жив или мергв. Па самом деле здесь нет никакого парадокса, если только мы (в ду- хе интерпретации Эверетта) готовы включить и себя в квантовую систе- му, описываемую волновой функцией. Эта волновая функция описывает все возможные корреляции между подсистемами, в том числе между котом и состоянием моего сознания. Если мы приготовили «кот-состояние», а за- тем наблюдаем за ним, то оператор плотности (после взятия следа по всем внешним степеням свободы) приобретает вид Idecay) atom |dead) cat | know it/s dead) me, ( Prob - i 1, z ( (3.178) |no decay) aU>m| alive) caL| know it's alive)me, ( Prob ± ). Эта матрица плотности p описывает две альтернативы, но в обоих случа- ях я имею точное знание о состоянии здоровья юта. Я никогда не вижу его полуживым-полумертвым. (В соответствии с опытом, я нахожусь в соб- ственном состоянии «оператора определенности».) Допуская, что волновая функция описывает реальность и что вся эво- люция является унитарной, мы приходим к интерпретации квантовой тео- рии па основе «множественности миров». В этой картине всякий раз, когда
142 Глава 3 совершается «измерение», волновая функция Вселенной «расщепляется» на две ветви, соответствующие двум возможным исходам. После множе- ства измерений существует множество ветвей (множество миров), каждая из которых с одинаковым правом может описывать реальность. Это размно- жение миров выглядит насмешкой над нашим намерением разработать наи- более экономичное описание. Но мы следуем одной конкретной ветви и д.гя предсказания того, что мы увидим в следующий момент, множество других миров не имеет значения. Размножение миров ничего нам не стоит. «Мно- жественность миров» может показаться странной, но стоит ли удивляться тому, что полное описание реальности — нечто находящегося полностью за пределами нашего опыта, кажется нам странным? Включив себя в реальность, описываемую волновой функцией, мы поняли, почему мы воспринимаем определенный результат измерения, но по-прежнему стоит следующий вопрос: «Каким образом в этот (детерми- нистский) формализм входит понятие вероятности*» Этот вопрос продол- жает беспокоить, для ответа на него мы должны быть готовы точно сфор- мулировать, что значит «с вероятностью»? Слово «вероятность» используется в двух различных смыслах. Иногда вероятность означает частоту. Мы говорим, что вероятность того, что монета выпадет орлом вверх равна 1/2, если мы ожидаем, что при много- кратном подбрасывании монеты число выпадений орла, деленное на полное число подбрасываний, сходится к 1/2. (Это, однако, ненадежное понятие; даже если вероятность равна 1/2, монета все равно может выпасть орлом триллион раз подряд) При строгом математическом обсуждении теория ве- роятностей часто формулируется как раздел теории меры — она занимается свойствами бесконечных последовательностей. Но в повседневной практике, а также в квантовой теории, вероятно- сти обычно не являются частотами. Когда мы выполняем измерение, мы не можем повторить его бесконечное число раз на идентично приготовленных системах. С точки зрения Эверетта, или с космологической, существует только одпа Вселенная, а не множество одинаково приготовленных ее ко- пий. Так что же такое вероятность"? На практике это число, которое да- ет количественное определение достоверности утверждения при данном состоянии знаний. Возможно, это удивительно, что такое представление можно положить в основу хорошо определенной математической теории, иногда называемой «бейесовским» подходом к вероятности. Термин «бейе- совский» отражает теоретико-вероятностный метод, обычно используемый (в науке и в повседневной практике) для проверки гипотезы при наличии некоторых peayjibTaroB наблюдения. Проверка гипотезы выполняется с ис-
3.6. В ЧЕМ ПРОБЛЕМА? (ЗДЕСЬ ЕСТЬ ПРОБЛЕМА?) 143 пользованием правила Бейеса для условной вероятности: Р(Л0|Я) = Р(В|Л0)Р(Д,)/Р(В). (3.179) Предположим, например, что Ло — приготовление частного квантового со- стояния, а В частный результат измерения состояния. Мы выполнили измерение (получение В) и теперь хотим сделать заключение о том, ка- кое состояние было приготовлено (вычислить P(/IJB)). Квантовая ме- ханика позволяет нам вычислить P(Bjj40), но она ничего не говорит о Р(Д0) (или Р(В)). Мы делаем предположение относительно Р(А0), что возможно, если принять «принцип безразличия»: если неизвестно,' что бо- лее или менее вероятно, Д или Л^, то предполагается, что Р(Лг) = Р(Ау). Как толы® множество приготовлений определено, мы можем вычислить Р(В) = 52Р(В|А)Р(А) (3.180) i и, следовательно, применяя правило Бейеса, получить Р(Л0|Р). Но если мы будем считать, что теория вероятностей дает количествен- ное определение достоверности при данном состоянии знаний, то мы обя- заны спросить «при состоянии чьих знаний»? Чтобы построить объектив- ную теорию, мы должны интерпретировать вероятность в квантовой тео- рии не как предсказание, основанное на пашем текущем состоянии знаний, а скорее как предсказание, основанное на самом полном возможном знании о квантовом состоянии. Если мы готовим состояние | Тж), а измеряем <т3, то мы говорим, что с вероятностью 1/2 результатом является | (г), не по- тому, что это лучшее предсказание, которое можно сделать, опираясь на то, что нам известно, а потому, что это лучшее предсказание, которое кто-ли- бо может сделать, независимо от того, как много он знает. В этом смысле результат истинно случайный', его невозможно предсказать с уверенностью, даже если наше знание является полным (в противоположность псевдо- случайности, возникающей в классической физике вследствие неполноты наших знаний). Как же теперь нам извлечь вероятности из детерминистской Вселен- ной Эверетта? Вероятности возникают, потому что мы (часть системы) не можем с уверенностью предсказать наше будущее. Я знаю формализм, мне известны гамильтониан и волновая функция Вселенной, я знаю свою ветвь волновой функции Теперь я собираюсь следить за котом. Мгновение спу- стя я буду определенно знать, что кот мертв, или я буду уверен в том, что он жив. Даже со всеми своими знаниями я не могу предсказать будущее Даже имея полное знание о настоящем, невозможно сказать, каким будет состо- яние моего знания после того, как я понаблюдаю за котом. Самое лучшее,
144 Главаз что я могу, это приписать вероятности результатом Итак, несмотря на то, что волновая функция Вселенной детерминистская, я, как часть системы, не способен на большее, чем делать вероятностные предсказания Конечно, главным героем этой истории является декогерентизация. Мы можем последовательно приписать вероятности альтернативам Dead и Alive, если только интерференция между ними невозможна (или по крайней мере пренебрежима). Вероятности имеют смысл, только тогда мы можем исчерпывающим образом идентифицировать множества взаим- но исключающих альтернатив. Постольку это сложный вопрос, реально ли возникновение интерференции в более позднее время, мы нс можем ре- шить, приемлема ли теория вероятностей, рассматривая квантовое состо- яние в данный момент времени; мы должны проверить множество взаим- но исключающих (сглаженных) историй или последовательностей событий. Существует утонченная техника («функционалы декогерентизации») опре- деления того, являются ли различные истории в достаточной степени нею- герентными, чтобы им можно было корректно приписать вероятности. Итак, позицию Эверетта можно примирить с наблюдаемым квантовым индетерминизмом, однако, настолько я понимаю, в этой картине остается тревожащее белое пятно. Я собираюсь наблюдать за котом, и я знаю, что мгновение спустя матрица плотности примет вид |dead)cat |know it's dead)me, lalive)catlkn«w it's alive)me, Prob = pdead, Pr°b Palive- (3.181) По как я узнаю, что pdead и pilive действительно являются теми вероят- ностями, которые я (в моей бейесовстой картине) могу приписать своим будущим ощущениям? Мне по-прежнему необходимо правило преобразо- вания этого оператора плотности в приписываемые альтернативам вероят- ное™. Предположение о тагом правиле выглядит противоречащим фило- софии Эверетта: мы предпочли бы сказать, что единственным правилом, необходимым для формулировки теории, является уравнение Шредингера (и, возможно, предписание, указывающее начальную волновую функцию). Постулирование формулы вероятности находится в опасной близости к до- пущению, что, в конце концов, существует недетерминированный процесс измерения. Это сложная, касающаяся фундамента теории, проблема, пол- ностью удовлетворительного решения которой я не знаю. Поскольку, касаясь природы вероятности в квантовой теории, мы пс в состоянии полностью избавиться от замешательства, может быть, полезно прокомментировать интересное предложение Хартла. Чтобы осуществить его предложение, мы должны вернуться (возможно, с сожалением) к ча-
3.6. В ЧЕМ ПРОБЛЕМА? (ЗДЕСЬ ЕСТЬ ПРОБЛЕМА?) 145 статной интерпретации вероятности. Идея Хартла состоит в том, что нам не нужно считать интерпретацию вероятности как часть постулата об из- мерении. На самом деле достаточно сделать более слабое предположение: Если мы готовим квантовое состояние |а) такое, что А|а) =- н|а), и сразу вслед за этим измеряем А, то результатом изме- рения является а. Это выглядит как предположение о том, что во Вселенной Эверетта дей- ствует бейесовский подход. Я собираюсь измерить наблюдаемую, и волно- вая функция будет ветвиться, но если наблюдаемая имеет одно и то же значение в каждой ветви, то я могу предсказать результат. Чтобы реализовать частотную интерпретацию вероятности, нам сле- дует, строго говоря, рассмотреть бесконечное множество испытаний. Допу- стим, мы хотим сделать утверждение относительно вероятности получения результата j f г) при измерении <т3 в состоянии М = а| TJ t IJ. (3.182) Тогда мы должны представить, что приготовлено бесконечное число копий, то есть состояние имеет вид |v(oo)) = (рф))00 = |^) ® ® |Ф) ® , (3.183) и мы мысленно представляем измерение а3 в каждой из копий. Формаль- но случай бесконечного числа испытаний можно сформулировать как N испытаний в пределе Лг —» ос. Идея Хартла состоит в том, чтобы рассматривать оператор «среднею спина» N (3JS4> и доказывать, что (1^)^ при N ос стремится к собственному состо- янию оператора а3 с собственным значением |а|2 - |6|2. Тогда мы можем, ссылаясь на слабый постучат измерения, сделать вывод, что измерение наверняка даст результат (о.|2 - |6|2, и, следовательно, |а|2 равно той части наших спинов, которые ориентированы вверх. В этом смысле, |а|2 является вероятностью того, что измерение <т3 дает результат | Рассмотрим в качестве примера частный случай N 1ФП s (I тЖ ~(l О t Ю) (3.185)
146 Глава 3 Мы можем вычислить W™l»3ie’) - °. »<" W<N>) = = <3|В6’ Формально переходя к пределу при N —* оо, мы приходим к выводу, что ст< имеет исчезающую дисперсию вокруг его среднего значения (ст3) = 0, сле- довательно, по крайней мере в этом смысле, |^°°^) является «собственным состоянием» оператора <т3 с пулевым собственным значением. Коулмен и Леснисвски отметили, что в доказательстве Хартла можно пойти дальше и показать, что результат измерения | Тг) не только появ- ляется с правильной частотой, но что результаты | случайным обра- зом распределены. Чтобы придать смысл этому утверждению, мы должны сформулировать определение случайности. Мы говорим, что бесконечная последовательность битов случайна, если она несжимаема; пет проще спо- соба генерировать первые W битов, чем просто выписать их. Мы формали- зуем эту идею, рассматривая длину кратчайшей компьютерной программы (для некоторого компьютера), генерирующей первые N битов последова- тельности. Тогда для случайного ряда длина кратчайшей программы > N - const. (3.187) где константа может зависеть от конкретною используемого компьютера или от конкретной последовательности, но не от 2V. Коулмен и Лесниевски рассмотрели ортогональный проекционный оператор Erandoin, действие которого на \ф} — собственное состояние опе- (<) ратора <т3 удовлетворяет условиям ® random М - (3.188) если последовательность собственных значений сг^ '1 случайна, и Erandom W (3-189) если эта последовательность не случайна. Одного этого свойства недо- статочно для определения того, как Erandoni действует на всем простран- стве (W2)°°, но с учетом дополнительного, имеющею технический харак- тер, предположения они нашли, что Erandon3 существует, единственный
3.6. В чем проблема? (Здесь есть проблема?) 147 и обладает свойством Erandom|^)> - |ф(=»>). (3.190) Таким образом, мы «также можем сказать», что |v4°°'') является случайным, чю касается измерений <т3, процедура, отличающая случайные состоя- ния от неслучайных, которая прекрасно работает для последовательности собственных значений оператора <т3, столь же надежно будет идентифици- ровать как случайный вектор. Эти аргументы интересны, но они не приносят мне полного удовлетво- рения. Больше всего беспокоит необходимость рассматривать бесконечные последовательности (общая черта любой частотной интерпретации веро- ятности). При любом конечном N мы не можем применить ослабленный постулат измерения Хартла, и даже в пределе N —> со применение это- го постулата содержит некоторые тонкости. Желательно было бы иметь усиленный слабый постулат измерения, применимый к конечному Л’, но я не знаю, как сформулировать такой постулат или как его объяснить. В заключение: Физика должна описывать объективный физический мир, и лучшим из известных нам представлений физической реальности является квантово-механическая волновая функция. Физика должна стре- миться объяснять все наблюдаемые явления как можно более экономично, в частности, не апеллируя к постулату, что процесс измерения управляется иными динамическими принципами, нежели другие процессы. К счастью, все, что мы знаем о физике, совместимо с гипотезой о том, что все физиче- ские процессы (в том числе измерения) могут быть точно смоделированы унитарной эволюцией волновой функции (или матрицы плотности). Если микроскопическая квантовая система взаимодействует с макроскопическим прибором, то «для всех практических целей» декогерентизация вызывает «коллапс» волновой функции. Если мы избегаем рассматривать измерение как некий таинственный процесс и принимаем волновую функцию в качестве описания физиче- ской реальности, то это ведет нас к Эверетту или интерпретации квантовой теории с позиции «множественности миров». Согласно этой точке зрения все возможные исходы любого «измерения» рассматриваются как «реаль- ные» — но я воспринимаю только один результат, поскольку состояние мо- его мозта (как части квантовой системы) сильно скоррелировано с ним. Несмотря на то, что эволюция волновой функции в интерпретации Эверетта является детерминистской, у меня нет возможности однозначно предсказать результат выполняемого в будущем эксперимен га — я не знаю, в какой ветви волновой функции окажусь после него, следовательно, я не в состоянии предсказать будущее состояние моего разума. Таким образом,
148 Глава 3 хотя «глобальная» картина в известной степени детерминистская, из моего собственного локального вида изнутри системы я ощущаю квантово-меха- ническую случайность. Мой личный взгляд состоит в том, что эвереттовская интерпретация кван товой теории дает удовлетворительное объяснение измерения и приро- ды случайности, но все еще не дает полного объяснения квантово-механи- ческих правил вычисления вероятностей. Для полного объяснения следует выйти за рамки частотной интерпретации вероятности — в идеале хотелось бы поставить бейесовский взгляд па вероятность па падежное объективное основание. 3.7. Резюме ПОЗМ. Если мы ограничиваем наше внимание подпространством бо- лее широкого гильбертова пространства, то ортогональное измерение (из- мерение фон Неймана), выполненное в более широком пространстве, вооб- ще говоря, не может быть описано как ортогональное измерение в подпро- странстве. Это скорее обобщенное измерение или ПОЗМ, результат которого появляется с вероятностью Prob(a) — tr (Fop), (3.191) где р — матрица плотности подсистемы, F. — положительные эрмитовы операторы, удовлетворяющие условию £Х = 1. (3.192) а ПОЗМ в Нл может быть реализована как унитарное преобразование на тен- зорном произведении НА ф после ортогонального измерения в Нв. Суиероператор. Унитарная в 'НА ® эволюция в общем случае не будет выглядеть унитарной, если мы ограничим свое внимание только пространством НА. Скорее эволюция в НА будет описываться суперопера- тором (который обратим только тогда, когда он унитарен). Произвольный супероператор $ имеет представление операторной суммы (представление Крауса) $ . р $(р) - м^м1' (3.193) м где = 1 (3.194)
3.8. Упражнения 149 Фактически любое разумное (линейное и вполне положительное) отобра- жение матриц плотности в матрицы плотности имеет унитарное представ- ление и представление операторной суммы. Декогерентизация. Декогерентизация - разрушение квантовой ин- формации вследствие взаимодействия системы с ее окружением - может быть описана суперопсратором. Если окружение часто «рассеивает» систе- му и его состояние не контролируется, тогда в некотором выделенном бази- се (обычно, в соответствии с природой связи системы с окружением, выби- рается пространственно-локал изо ванный базис) недиагональныс элементы матрицы плотности системы быстро затухают. Временной масштаб декоге- рентизации определяется частотой рассеяния, которая может быть гораздо бо.тьше темпа затухания состояния. Основное уравнение. Когда соответствующий динамический времен- ной масштаб открытой квантовой системы велик по сравнению со време- нем, в течение которого окружение «забывает» квантовую информацию, эволюция системы эффективно локальна во времени (марковское прибли- жение). Подобно тому как общая унитарная эволюция генерируется га- мильтонианом, общая марковская эволюция генерируется супероператором Линдблада С, как э го описывается основным уравнением р Ср- +-£(LMpLt -IbtL^-lpL+lA (3.195) л 4 7 Здесь каждый оператор Линдблада (или оператор квантового скачка) представляет «квантовый скачок», который в принципе можно регистри- ровать, если достаточно тщательно контролировать окружение. Решая ос- новное уравнение, мы можем вычислить темп декогерентизации открытой системы. 3.8. Упражнения 3.1. Реализация ПОЗМ. Рассмотрим ПОЗМ, определенную четырьмя по- ложительными операторами Pi - Il 1, /,2--4iuclj; . ; (3.196) Покажите, каким образом эту ПОЗМ можно реализовать как ортого- нальное измерение в двухкубитовом гильбертовом пространстве, если введен один вспомогательный (ancilla) спин.
150 ГЛАВА 3 3.2. Обратимость супероператоров. Цель этого упражнения — показать, что супероператор обратим только тогда, когда он унитарен. Напом- ним, что любой супероператор может быыть представлен в виде опе- раторной суммы; он действует на чистое состояние как = (3.197) и где Ml Мм = 1. Другой супероператор N называется обратным по I* отношению к М, если Л" ° .М — 1, или £NttMM|^(V>|M^Nt \ф)&\ (3.198) р, а для любого (V) Отсюда следует, что £|^|NaM>>|2-l. (3.199) И,а а) Используя условия нормировки, которым удовлетворяют Na и М , покажите, что ЛГ о Л4 = 1 влечет за собой = Аод1 (3.200) для всех аир, другими словами, каждое произведение NaMM пропорционально тождественному (единичному) оператору. Ь) Используя результат (а), покажите, что для всех /х и v про- порционально тождественному оператору с) Покажите, что из (Ъ) следует унитарность М. 3.3. Как много супероператоров? Сколько вещественных параметров не- обходимо для параметризации супероператора общего вида $ : р р', (3.201) если р — оператор плотности в Д?-мерном гильбертовом простран- стве? [Указание: Сколько вещественных чисел параметризует эрми- тову N х Лг-матрицу? Как много линейных отображений эрмитовых матриц на эрмитовы матрицы? Как много сохраняющих след отобра- жений эрмитовых матриц па эрмитовы матрицы?]
3.8, Упражнения 151 3.4. Насколько быстра декогерентизации? Очень хороший маятник с мас- сой т — 1 г и круговой часготой w = 1с-1 имеет добротность Q — — 109. Маятник приготовлен в состоянии «кот-суперпозиции» |cat> = -1=(|т} + I -^)) (3.202) волновых пакетов с минимальной неопределенностью, первоначально покоящихся в положениях ±г, где х = 1 см. Оценить по порядку вели- чины, как быстро произойдет декогерентизация этого «кот-состояния», если окружение находится а) при нулевой температуре; Ь) при комнатной температуре. 3.5. Затухание фазы. На лекции мы получили представление операторной суммы канала затухания фазы для одного кубита с операторами Крауса М2-^|(1-<т3). (3.203) а) Найдите альтернативное представление, используя только два опе- ратора Крауса No, Nt 1>) Найдите унитарную 3 х 3-матрицу U^a такую, что полученные вами в (а) операторы Крауса (дополненные третьим N2 = 0) связаны с Мо j 2 соотношением Мм = ^aNo. (3.204) с) Рассмотрите унитарное представление однокубитового канала 1°>а1°>Е -* + VWaWe- где 17о)е и 17г) е; — ортогональные |0)Б нормированные состоя- ния, удовлетворяющие условию = 0 < е < 1. (3.206) Покажите, что это тоже канал затухания фазы, и найдите его пред- ставление операторной суммы с двумя операторами Крауса. d) Допустим, что канал из (с) описывает то, что происходит с куби- том, когда на нем рассеивается один фотон. Выразите темп деко- герентизации rdecoh через темп рассеяния rsC3tt.
152 Гланд 3 3.6. Декогерентизация па сфере Блоха. Параметризуйте матрицу плотно- сти одного кубита следующим образом: р=1(1|-/>•<?). (3.207) а) Опишите, что происходит с Р под действием капала затухания фа- зы. Ь) Опишите, что происходит с Р под действием канала затухания ам- плитуды, определяемого операторами Крауса = <з2О8> с) Проделайте то же самое ддя «двойного капала Паули»; Мо-УГЧи, = М^-у^з- (3.209) 3.7. Декогерентизация затухающего осциллятора. На лекции мы гово- рили, что в представлении взаимодействия матрица плотности рДО осциллятора, который может излучать кванты в находящийся при ну- левой температуре резервуар, подчиняется основному уравнению Pi ' I" (apJ-at ^afapz ^p^aY (3.210) где а — осцилляторный оператор уничтожения. а) Рассмотрите величину %(A,t) -tr [p7(f)eAate~A'a], (3.211) где А — комплексное число. Используя основное уравнение, вы- ведите и решите дифференциальное уравнение для X(A, t). Най- ДИТС Х(А,/)=Х(А',0), (3.212) где А' является функцией or А, Г и t. Что это за функция А'(А, Г, 0? Ь) Предположим, что при t = 0 приготовлено «кот-состояние» осцил- лятора . |cat) — । 1«2»- (3.213) где |а) обозначает когерентное состояние |a) = e-W2/2e-i|0j_ ^214) Используйте результат (а), чтобы получить матрицу плотности в более поздний момент времени t. Каков теми затухания недиа- гональных элементов р (в этом когерентном базисе) при П < 1 ?
Глава 4 Квантовое запутывание 4Л. Несепарабелыюсть ЭПР-пар 4.1.1. Скрытая квантовая информация 1лубокие аспекты, отличающие квантовую информацию от классиче- ской, включают в себя свойства, привлечение и использование квантового запутывания. Вспомним, что, согласно §2.4.1, бинарное состояние запу- тано, если его число Шмидта больше единицы. Запуганные состояния ин- тересны тем, что в них проявляются не имеющие' классических аналогов корреляции. В качестве примера напомним определенное в §3.4.1 максимально за- путанное состояние двух кубитов (или ЭПР-пара{): 1^+)дв — у=(|00)дл! + (4-0 «Максимально запутанный» означает, что если мы вычислим след по состо- яниям кубита В, чтобы найти оператор плотности рл кубита А, то получим оператор, пропорциональный единичному: Ра =^гв(\Ф+')auab^ I) = (4-2) (и анало[ично рв — ^1Я). Это значит, что результат измерения спи- на А вдоль любой оси будет полностью случайным: с вероятностью I /2 мы найдем его ориентированным вверх, и с вероятностью 1 /2 вниз. Следовательно, если мы выполним любое локальное измерение А или В, то не получим никакой информации о приготовленном состоянии, лишь 1ЭПР — Эйнштейн, Подольский, Розен — Прим, перге
154 Глава 4 породив вместо этого случайный бит. Эта ситуация резко контрастирует со случаем одного кубита в чистом состоянии. Приготовив, скажем, | jft) или I 1ft)’ мы можем хранить в этом состоянии один бит и достоверно извлекать его, выполняя измерение вдоль оси п. В случае двух кубитов нам следовало бы уметь хранить два бита, но в состоянии |ф+)АВ эта ин- формация скрыта; по крайней мере, мы не можем извлечь ее, измеряя А или R Фактически является одним из представителей введенного в § 3.4.1 базиса четырех взаимно ортогональных состояний двух кубитов, каждый из которых также максимально запутан. 1^>лв = ^0оо)ав±|11)а4 IV’1)АВ — Ц=(101)ав ± |10)АВ). V — (4.3) Представим, что Алиса и Боб играют с Чарли. Чарли готовит одно из этих четырех состояний, кодируя таким образом два бита в состоянии двух- кубитовой системы Один из них представляет собой бит четности (|<i) или jti')). параллельны или антинараллельны состояния двух спинов? Дру- гой — бит фазы (| или —): какой четности выбрана суперпозиция двух состояний? Затем Чарли посылает кубит А Алисе, а кубит В Бобу. Чтобы выиграть, Алиса (или Боб) должна определить, какое из четырех состояний приготовил Чарли. Конечно, если бы Алиса и Боб соединили свои кубиты вместе, то они смогли бы идентифицировать состояние, выполняя ортогональное измере- ние, проецирующее на базис {|Ф+), |Ф“), IV; )}• Но представим, что они находятся в разных городах и вообще не мо1ут связаться друг с другом. Действуя локально, ни Алиса, ни Боб не могут извлечь никакой информа- ции о состоянии. Все, что они могут делать локально, это манипулировать этой инфор- мацией. Алиса может применить преобразование <г3 к своему кубиту А, изменяя относительную фазу |0)А и |1)А. Это действие обращает бит фазы, хранящийся в запутанном состоянии: 1Ф1-) |ф“). (4.4) С другой стороны, она может применить преобразование о-], которое опро- кидывает ее спин (|0) А +-> |1) 4) и таким образом инвертирует бит четности
4.1. НЬСЕПАРАБЕЛЬНОСЗЪ ЭПР-ПАР 155 запутанною состояния: 1-Л «-НИ, Ю -W )- (4.5) Аналогично и Боб может манипулировать запутанным состоянием. Фак- тически, как мы обсуждали в §2.4, или Алиса, или Боб могут выпол- нить локальное унитарное преобразование, заменяющее одно максималь- но запутанное состояние на ’любое другое максимально запутанное состо- яние1 . Поскольку их локальные унитарные преобразования не могут изме- нить рА - рв = “1, информация, которой они манипулируют, ни одним из них не может быть прочитана. Предположим теперь, что Алиса и Боб могут обмениваться (классиче- скими) сообщениями о результатах своих измерений; тогда вместе они мо- jyr узнагь о том, как скоррелированы их измерения. Запутанные состояния базиса удобно характеризовать одновременными собственными значениями двух коммутирующих наблюдаемых erf 0 erf, о-з ® erf; (4.6) собственное значение оператора сг^ ® erf является битом четности, а соб- ственное значение erf & erf — битом фазы. Так как эти операторы ком- мутируют, они в принципе могут быть измерены одновременно. Но это невозможно, пока Алиса и Боб выполняют локальные измерения. Они мог- ли бы оба решить измерить свои спины вдоль оси z, приготовив одновре- менно собственные состояния операторов erf и . Поскольку of и erf коммутируют с оператором четности erf erf, их ортогональные измере- ния не возмущают бит четности, а их результаты можно скомбинировать так, чтобы получить значение этого бита. Однако операторы erf и erf не коммутируют с оператором erf ® erf, поэтому выполненное таким спо- собом измерение бита четности возмущает бит фазы. С другой стороны, Алиса и Боб могли бы решить измерить свои спины вдоль оси тогда они моши бы узнагь бит фазы ценой возмущения бита четности Но они не могут одновременно выполни ть оба этих измерения. Чтобы можно бы- ло надеяться получить бит четности без возмущения бита фазы, Алисе и Бобу нужно получить информацию о произведении of ® erf, не изме- 1 Но, конечно, этого недостаточно для того, чтобы выполнить произвольное унитарное преобразование в четырехмерном пространстве НА ® Нв, содержащее также н не макси- мально запутанные состояния. Максимально запутанные состояния не образуют подпростран- ства их суперпозиция обычно не является максимально запутанной.
156 Глава 4 ряя отдельно ни а*, ни erf, что не может быть выполнено локальным образом. Пусть теперь Алиса и Боб соберутся вместе, так чтобы они могли опе- рировать своими кубитами сообща Как они могут узнать бит четности и бит фазы их пары? Применив подходящее унитарное преобразование, они могут повернуть запутанный базис |^)} таким образом, что он перейдет в незапуганный базис {{00), |01), |10), Тогда Алиса и Боб могут измерить кубиты А и В, чтобы получить искомые ими биты. Как строится это преобразование? Воспользуемся удобным моментом, чтобы ввести обозначение, которое буде т широко использоваться далее в этом курсе, обозначение квантовой схемы. Кубиты изображаются горизонтальными линиями, а однокубитовое унитарное преобразование U ------ U --------- В частности, ниже нам очень пригодится однокубитовое унитарное преоб- разование Адамара H=-W; «л которое обладает свойствами Н2 - 1, (4.8) И Нсг.Н -= <т3, (4-9) Hcr3H = <7j. |мы можем рассматривать Н (с точностью до общей фазы) как поворот на угол 6* - тс вокруг оси п = + й3), который переводит друг в друга оси £ и z; мы имеем U(«, 0) = lcos~ |- in & sin 4 <r3) = iH.j (4.10) Также полезно двухкубитовое преобразование, известное как обратимое ХОК или контролируемое НЕ (CNOT) преобразование; оно действует как CNOT : |а, М —> |п, о. фЬ) (4.11)
4.1. Hl-СЕПАРАБЕЛЬНОСТЬ ЭПР-ПАР 157 на базисных состояниях а, b = 0.1, где а Ф Ъ обозначает сумму по модулю два. CNOT изображается диафаммой а -------•------- а а Ф b Таким образом, это преобразование инвертирует второй бит, если первый имеет значение 1, и действует зривиально, если первый бит имеет значе- ние 0; оно обладает свойством (CNOT)2 -1®1, (4.12) Мы называем а контролирующим битом (или источником) операции CNOT, а b - контролируемым битом (или целью). Комбинируя эти «примитивные» преобразования, или квантовые вен- тили, мы можем построить другие унитарные преобразования. Например, «схема» (читается слева направо) Н представляет произведение примененной к первому кубиту операции Н и следующей за ней CNOT с первым кубитом в качестве контролирую- щею и вторым в качестве контролируемого. Непосредственно видно, что эта схема преобразует стандартный базис в запутанный: |oo)^_L((o) и |1»|0> - 1 (4 13) - ^=(|о> ЧШ - \Ф-), V “ Ц1) - -L(|0) - [1»|1> -ч \ф >, так что первый бит становится битом фазы в запутанном базисе, а второй — битом четности.
158 Глава 4 Аналогично мы можем обратить преобразование, проходя схему в об- ратном направлении (поскольку и CNOT, и Н идемпотентны); если мы применим обращенную схему к запутанному состоянию, а затем измерим оба бита, то мы узнаем значения бита фазы и бита четности Конечно, Н действует только на один из кубитов; «нелокальной» ча- стью нашей схемы является операция контролируемого НЕ (CNOT) — это операция, устанавливающая или устраняющая запутывание. Если бы толь- ко мы могли выполнить «межзвездную CNOT», то были бы в состоянии запутывать пространственно-разделенные пары или извлекать закодирован- ную в них информацию. Однако мы не можем этого сделать. Чтобы выпол- нить эту работу, вентиль CNOT должен действовать на цель, не открывая значения источника. Локальных операций и классической связи для этого недостаточно 4.1.2. Эйнштейновская локальность и скрытые переменные Эйнштейна смущало квантовое запутывание. В конце концов он сов- местно с Подольским и Розеном (ЭПР) выразил это беспокойство в том, что они рассматривали как парадокс1. Согласно более поздней интерпре- тации Бома, описанная ими ситуация в действительности та же самая, что и обсуждавшаяся в § 2.5.3. Данное максимально запутанное состояние двух кубитов поделено между Алисой и Бобом, Алиса может выбрать одно из нескольких возможных измерений, чтобы выполнить его на своем спине, реализуя тем самым различные возможные интерпретации ансамблей мат- рицы плотности Боба; например, она может приготовить собственные со- стояния: или (7j, или <r?. Мы видели, что Алиса и Боб не могут использовать это явление для сверхсветовой связи, Эйнштейн знал это, но оставался неудовлетворенным. Он считал, что теория, дающая полное описание физической реальности, должна удовлетворять более строгому критерию, который можно назвать эйнштейновской локальностью (иногда известный как локальный реализм). Предположим, что А и В — разделенные пространственно-по- добным интервалом системы. Тогда в полном описании физи- ческой реальности действие, совершенное над сисгемой А, не должно изменять описание системы В. 1 A.. Einstein, В. Podolsky, N Rosen, Can Quantum-mechanical Description of Physical Reality Be Considered Complete?, Phys. Rev., 47, 777-780 (1935); современная интерпретация мыслен- ного эксперимента ЭПР, использующая максимально запутанное состояние спинов, предло- жена Д. Бомом. D. Bohm, Quantum Theory, Prentice-Hall, Englewood Cliffs< New Jersey (1951); перевод: Д. Бом, Квантовая теория, М., Наука (1965). — Прим, ред
4.1. Несепарабельность ЭПР-пар 159 Но если А и В запутаны, измерение А выполнено и конкретный по- лученный результат известен, то матрица плотности В обязательно изме- нится. Следовательно, согласно критерию Эйнштейна описание квантовой системы с помощью волновой функции или оператора плотности не может считаться полным. Эйнштейн пытался представить более полное описание, которое устра- нило бы индетерминизм квантовой механики. Теории такого рода называ- ются теориями локальных скрытых переменных. В теории скрытых пере- менных измерение в действительности является детерминистским, но вы- глядит вероятностным, поскольку некоторые степени свободы точно неиз- вестны. Например, возможно, что для описания приготовленного спинового состояния, которое в квантовой теории рассматривается как чистое состоя- ние ] ]£}, в действительности существует более глубокая теория, в которой оно параметризуется как (z, А), где А (О А < 1) — скрытая переменная. Допустим, что при современном уровне экспериментальной техники мы не контролируем А, следовательно, когда мы готовим спиновое состояние, А может принять любое значение - распределение вероятностей, управля- ющее ее значениями, является однородным на единичном интервале. Теперь предположим, что при измерении спина вдоль оси й, поверну- той на угол О относительно оси z, будет получен результат | Тг) при 0 А cos2 д 2 (4.14) 1 при cos2^<A^1. ti Если мы знаем А, то результат является детерминистским, но если А пол- ностью неизвестна, тогда управляющее измерением распределение веро- ятностей будет согласоваться с предсказаниями квантовой теории. В тео- рии скрытых переменных случайность результата измерения не является ее внутренним свойством; скорее она является следствием невежества — наше описание системы не является максимально возможным полным описанием. Теперь как насчет запутанных состояний? Когда мы говорим, что тео- рия скрытых переменных является локальной, мы подразумеваем, что она удовлетворяет эйнштейновскому требованию локальности. Измерение А не изменяет значения переменных, определяющих измерения В. Когда Алиса измеряет свою половину запутанною состояния, которое она делит с Бо- бом, она получает информацию о значениях скрытых переменных, увели- чивая возможность предсказать, что получит Боб после измерения своей половины. Это кажется похожим на то, что имел в виду Эйнштейн, говоря о более помом описании.
160 Глава 4 4.2. Неравенство Белла 4.2.1. Три квантовые монеты Является ди теория скрытых переменных просто переформулировкой квантовой теории, или она представляет собой допускаюпгую проверку ги- потезу? Плодотворная идея Джона Белла состояла в том, чтобы прове- рить эйнштейновскую локальность, рассматривая количественные свойства корреляций между результатами, полученными двумя экспериментаторами, Алисой и Бобом, измерявшими разные части системы, находящейся в запу- танном состоянии. Рассмотрим пример корреляций, которые Алиса и Боб хотели бы объясни гь. Изучаемая Алисой и Бобом система могла бы быть описана следую- щим образом: Алиса в Пасадене имеет в своем распоряжении три выло- женные на стол монеты, помеченные как 1,2,3. Каждая монета выиадае г «орлом» (О) или «решкой» (Р), но они закрыты непрозрачными крышками, гак что Алиса не может сказать, что на них выпало. Опа может открыть лю- бую одну из трех монет и таким образом узнать ее значение (О или Р) Но как только одна монета оказывается открытой, две другие закрытые моне- ты мгновенно исчезают облачком дыма и Алиса уже не имеет возможности открыть их. В ее распоряжении множество копий трехмонетпого набора и в конце концов она понимает, что, независимо от тога, какая монета открыва- ется. вероятности обнаружить О или Р одинаковы. Боб в Чикаго имеет ана- логичный набор монет, также помеченных I, 2 и 3. Он тоже обнаруживает, что каждая из его монет, когда открывается, с одинаковой вероятностью показывает или О, или Р. Фактически Алиса и Боб имеют множество идентичных копий поде- ленных между ними наборов монет; они проводят обширную серию экс- периментов, чтобы исследовать, как их наборы моне! коррелируют меж- ду собой. Они быстро делают замечательное о ткры тие; всякий раз, когда Алиса и Боб открывают монеты с одинаковыми метками (1,2 или 3), они всегда находя-i их в одинаковом состоянии обе показываю! или О, или Р. Они проводят миллион испытаний, чтобы быть точно уверенными, что это происходит всегда! Их наборы монет идеально скоррелированы Алиса и Боб догадываются, что обнаружили нечто важное, и часто разговаривают по телефону, обсуждая внезапные идеи о смысле своих ре- зультатов. Однажды Алиса находилась в особенно задумчивом настроении. Алиса: Ты знаешь, Боб, мне иногда трудно решить, какую из трех монет открыть. Я знаю, что если я открою, скажем, монету 1, то монеты 2 и 3 исчезнут, и у меня нс будет возможности узнать, что выпало па
4 2 Неравенство Белла 161 них. Хотя бы раз мне удалось открыть две из трех монет и узнать, что на них выпало: «орел» (О) или «решка» (Р). Я пыталась, но это дей- ствительно невозможно - нет способа увидеть одну монету и не дать исчезнуть другим! Боб: [Долгая пауза] Эй! ... подожди минутку, Алиса, у меня появилась идея.... Смотри, я думаю, что у тебя есть способ в конце концов узнать, что выпало на двух твоих монетах! Допустим, ты хотела бы от- крыть монеты 1 и 2. Ну, тогда я открою свою монету 2 здесь, в Чикаго, и сообщу тебе, что я обнаружил, пусть, к примеру, на ней выпало О. Тогда мы знаем, что если ты тоже откроешь монету 2, то наверняка найдешь О. В этом нет никаких сомнений, так как мы проверяли это миллион раз. Верно? Алиса: Верно.... Боб: Но теперь тебе пи к чему открывать твою монету 2; ты же точно знаешь, что на ней обнаружишь. Вместо этого ты можешь открыть монету 1 Тогда ты узнаешь, что выпало на обеих монетах Алиса: Гмм ..., да, может быть. Да, я имею в виду, что раньше, когда мы открывали одни и те же монеты, это всегда срабатывало, но теперь ты открыл свою монету 2 и твои монеты 1 и 3 исчезли, а я открыла свою монету 1, и мои монеты 2 и 3 исчезли. Нет возможности даже попы- таться еще раз проверить, что случилось бы, если бы мы оба открыли монету 2. Боб: Не надо проверять это еще раз, Алиса; мы уже миллион раз проверя- ли это. Смотри, твои монеты в Пасадене, а мои — в Чикаго. Очевидно, что просто нет способа, которым мое решение открыть мою монету 2 может повлиять на то, что ты обнаружишь, когда откроешь свою моне- ту 2. То есть это невозможно. Просто когда я открываю мою монету 2, мы получаем информацию, необходимую нам, чтобы с уверенностью предсказать, что произойдет, когда ты откроешь свою монету 2. Так как мы уже уверены в этом, зачем заботиться о проверке! Алиса: Хорошо, Боб, я понимаю, что ты имеешь в виду. Почему мы не мо- жем выполнить эксперимент, чтобы увидеть, что действительно про- исходит, когда ты и я открываем разные монеты? Боб: Я не знаю, Алиса. Было бы невероятно получить хоть какое-то финан- сирование такого «глупого» эксперимента. Я имею в виду, интересует
162 Глава 4 ли кого-нибудь на самом деле, что происходит, когда я открываю мо- нету 2, а гы - монету 1? Алиса: Я не уверена. По я слышала о теоретике по имени Белл. Говорят, что у него интересные идеи относительно монет. Возможно, у него есть теория, которая делает предсказание относительно того, что мы обнаружим. Может быть, нам стоит поговорить с ним? Боб: Хорошая мысль! И даже неважно, имеет его теория смысл или нет. Мы можем тем не менее предложить эксперимент, чтобы проверить его предсказание, и тогда пас, возможно, спонсируют. Итак, Алиса и Боб отправляются в ЦЕРН1, чтобы побеседовать с Бел- лом Они рассказывают ему об эксперименте, который они предла: ают вы- полнить. Белл внимательно слушает их. но некоторое время с отрешенным видом хранит молчание. Алису и Боба не очень это беспокоит, так как они не много понимают из того, что говорят теоретики. Но наконец Белл го- ворит: Белл: Я думаю, что у меня есть идея .... Когда Боб открывает свою моне- ту в Чикаго, он не может оказать никакого влияния на монету Алисы в Пасадене. Вместо этого то, что обнаруживает Боб, открывая свою монету, дает некоторую информацию о том, что случится, когда Алиса откроет свою монету. Боб: Ну, то есть что я и говорил .... Белл: Правильно. Звучит разумно. Итак, допустим, что Боб в этом прав. Теперь Боб может открыть любую одну из его монет и узнать навер- няка, что найдет Алиса, когда она откроет соответствующую монету. Он никак не затронул ее монеты; он просто получил информацию о ней, Нам придется сделать вывод, что должны существовать некото- рые скрытые переменные, которые определяют состояние монет Али- сы. И если эти переменные полностью известны, тогда состояние каж- дой из монет Алисы может быть однозначно предсказано. Боб: [Раздраженный всей этой абстрактной чепухой]. Да, ну и что? Белл: Когда ваши коррелированные наборы монет были приготовлены, значения скрытых переменных не были полностью определены, вот ’CERN — Европейский центр ядерных исследований. Прим, перев.
4.2. Неравенство Белла 163 почему на любой одной монете с равной вероятностью может вы- пасть О, а может и Р. Однако должно существовать некоторое рас- пределение вероятностей Р(х. у, z) (с x,y,z € {О,Р}), которое харак- теризует приготовление и управляет тремя монетами Алисы. Эти ве- роятности должны быть неотрицательны и в сумме равны единице: 52 P(x,y,z)= I. (4.15) ,2 £{О,Р} Алиса не может открыть все гри ее монеты, следовательно, она не может непосредственно измерить Р(х, y,z). Однако с помощью Боба она в действительности может открыть любые две монеты из своею набора. Обозначим как Psame(i,j)'вероятность того, что монеты i и j (t,j =- 1.2,3) показывают одно и то же: или обе О, или обе Р. Тогда мы видим, чю Fsame(l, 2) - Р(ООО) + Р(ООР) + Р(РРО) + Р(РРР), Psame(2,3) = Р(ООО) + Р(РОО) + Р(ОРР) -1 Р(РРР), (4.16) Psame(l, 3) - Р(ООО) + Р(ОРО) + Р(РОР) + Р(РРР). Из уравнения (4 15) непосредственно следует, что PSime(l, 2) Psame(2,3) + Psame(l, 3) -- - 1 + 2Р(ООО) + 2Р(РРР) 1. (4.17) Это и ec'i ь мое предсказание: Psame должны подчиняться неравенству1 ^same(l, 2) -b Р5ате(2, 3) 4-Psame(l , 3) 1. (4.18) Вы можете проверить мой вывод в вашем эксперименте, в котором «открываются» две монеты сразу. Боб: Пу, я допускаю, что математика выглядит правильной. Но на самом деле я не понимаю этого Почему это работает? Алиса: Мне кажегся, что я поняла ... Белл говорит, что если на столе ле- жат три монеты и на каждой из них либо О, либо Р, тогда по крайней мере на двух из трех выпадает одно и то же', или на обеих О, или на обеих Р. Не так ли, Белл? Неравенства таково типа получены в работе J.S. Bell, On the Einstein-Podolsky--Rosen Paradox, Physics, 1, 195-200 (1964); см. также J.S. Bell, On the Problem of Hidden Variables in Quantum Mechanics, Rev Mod. Phys., 38, 447-452 (1966). — Прим рей
164 Глава 4 Белл с изумлением смотрит на Алису. Его глаза блестят, на некоторое время он теряет дар речи. Наконец он говорит. Белл: Да. Итак, Алиса и Боб были счастливы узнать, что Белл, как редкий зверь, — теоретик, от которого есть толк. Благодаря Беллу, их предложе- ние получило одобрение и они выполняют эксперимент, получая обескура- живающий результат. После множества тщательных проверок они с очень высокий статистической надежностью делают вывод, что ^вте(2,3) F.ame(l, 3) 1 (4.19) и, следоватетельно, Лате(1,2) + Ряагпе(2(3) + Рмте(1,3)~3 | = | < 1- (4 20) Обнаруженные Алисой и Бобом корреляции вопиюще нарушают неравен- ство Белла! Ашса и Боб — хорошие экспериментаторы, но они не решаются пуб- ликовать столь возмутительный резульга! до тех пор, пока не смогут найти ему правдоподобное теоретическое истолкование. Наконец, дойдя до пол- ного отчаяния, они идут в библиотеку, чтобы узнать, может лн принести хоть какое-то утешение квантовая механика .... 4.2.2. Квантовое запутывание против эйнштейновской локальности Там Ашса и Боб читают о квантовом запутывании. В конце концов, они узнают; что их волшебные монеты управляются максимально запутан- ным состоянием двух кубитов. Алиса и Боб в действительности делят мно- жество копий состояния IV’').1 Когда Алиса открывает монету, она измеря- ет свой кубит вдоль одной из трех возможных осей, не перпендикулярных между собой. Поскольку измерения не коммутируют, Алиса может открыть только одну из ее трех монет. Анало1ично, когда Боб открывает свою мо- нету, он измеряет свою часть запутанной пары вдоль любой одной из трех осей, следовательно, он тоже имеет возможность открыть то.шко одну из 'Судя по тому, что, открывая монет с одинаковыми номерами, Алиса и Боб всегда обна- руживали их в одинаковом состоянии (см. §4.2.1), их трех-монетные наборы должны управ- ляться максимально запутанным состоянием ЭПР-типа (см. уравнение (4.3)). Однако дальнейшие вычисления в этом параграфе выполняются для состояния ~-Црим, ред
4.2. Неравенство Белла 165 его трех монет. Но поскольку измерения Алисы коммутируют е измерения- ми Боба, каждый из них может открыть одну монету и исследовать, как их монеты коррелируют между собой. Чтобы помочь Алисе и Бобу интерпретировать их эксперимент, по- смотрим, что говорит квантовая механика об этих корреляциях. Состояние ) обладает полезным свойством: оно остается неизменным, если Алиса и Боб применяют одно и то же унитарное преобразование (2.27) U®U|^T) = for). (4.21) В случае бесконечно малого унитарного преобразования оно превращается в свойство 1- ств>~) - 0 (4.22) (состояние с равным нулю полным моментом импульса, в чем вы можете легко убедиться с помощью явных вычислений). Рассмотрим ожидаемое значение , „ „ (о?А - а)(сгв - ), (4.23) где а и b — единичные трехмерные векторы. Действуя на [1Д“), мы можем заменить ав на -стА; следовательно, ожидаемое значение (4.23) может быть представлено как свойство системы Алисы, которая имеет оператор плотности рА — |1: = tr _= -ат.^дъ. -а b - cosfl, (4.24) где 6 угол между осями а и Ь. Таким образом, мы напши, что результаты измерения всегда идеально аитикоррелированы, когда оба спина измеря- ются вдоль одной и той же оси а, но мы также получили и более общий результат, применимый к случаю, когда две оси различны. Проекционный оператор на состояние спии-вверх (спин-впиз) вдоль оси б имеет вид Е(п, ±) — |(1 ± п ст); следовательно, мы получаем Pi I ' |Ea[m, hEb(L^)|k<) - |(1 -eos0), 4. Р(-~) = (ф |Еа(«, -)Eb(S, -)|tT) = i(l - COS0), 1 0-2$) Р( I -) - ^-|ЕА(а,-1 )ЕВ(Б, -)|<Г) - ±(1 + COS0), Р(- + )- ^-|EA(a,-)EB(S,+)p-) - 1(1 +cos0);
166 Глава 4 здесь Р(++) — вероятность того, что Алиса и Боб, оба получают в резуль- тате спин-вверх, когда Алиса выполняет измерение вдоль оси а, а Боб — вдоль оси Ь, и так далее. Вероятность того, что их результаты совпадают, равна ^same ^(++) 4 Р(—) = (1 - COS0), (4,26) а вероятность того, что их результаты различны, Opposite = Р(+-) 4 Р(- + ) = |(1 +COS0). (4.27) Теперь предположим, что Алиса измеряет свои спины вдоль одной из трех, симметрично ориентированных в плоскости OXZ, осей <4 = (0,0,1), «2-^,0,-^. a3=^-^,0.-iy (4.28) так что Предположим также, что Боб выполняет измерение вдоль одной из трех осей, диаметрально противоположных осям Алисы: — —а1( Ь2 — —а2, Ь3 — — а3. (4.30) Если Алиса и Боб выбирают противоположные оси, той — 180г' и Рчап1е = = 1. В противном случае 0 = ±60°, так что соей - 1/2 и Psame = 1/4, Это именно то нарушающее предсказание Белла поведение, которое Алиса и Боб обнаружили в своем эксперименте Логика Белла выглядит безупречной, но кое-что встало с ног на голо- ву, поэтому мы вынуждены пересмотреть молчаливо подразумеваемые им предположения. Во-первых, Белл предполагает, что существует совместное распределение вероятностей, управляющее возможными исходами всех из- мерений, которые могут выполнить Алиса и Боб. Эго является гипотезой о скрытых переменных. Белл представляет, что если значения скрытых пе- ременных точно известны, то можно с уверенностью предсказать результат любого измерения — результаты измерения описываются вероятностным образом, поскольку значения скрытых переменных извлекаются из неко- торого ансамбля возможных значений. Во-вторых, Белл полагает, что ре- шение Боба, какое выполнять измерение в Чикаго, не влияет на скрытые
4.2. Неравенство Белла 167 переменные, управляющие измерением Алисы в Пасадене. Это представ- ляет собой предположение о локальности скрытых переменных. Если мы принимаем эти два предположения, то с неизбежностью приходим к вы- воду Белла. Мы обнаружили, что корреляции, предсказываемые квантовой теорией, несовместимы с этими предположениями. Что отсюда следует? Вероятно, урок этой истории в том, что может быть опасно рассуждать о том, что могло бы случиться, но на самом де- ле не происходит — что иногда называют контрфактом. Конечно, в на- шей повседневной жизни мы постоянно этим занимаемся и обычно выхо- дим сухими из воды; рассуждения о контрфактах выглядят приемлемыми в классическом мире, но в квантовом мире с ними иногда можно попасть впросак. Мы утверждали, что, поскольку Боб выполнил измерение вдоль оси dlf Алиса знала, что произошло бы, если бы она провела измерение вдоль оси а1; и сколько бы мы ни проверяли, их результаты всегда иде- ально скоррелированы. Однако Алиса не стала измерять вдоль аг‘, вместо этого она выполнила измерение вдоль а2. Мы столкнулись с трудностями, пытаясь приписать вероятности результатам измерений вдоль а2 и а3, несмотря на то, что Алиса может выполнить только одно из них. Предполо- жение о существовании распределения вероятностей, управляющего исхо- дами всех трех измерений, каждое из которых, но только одно, Алиса моыа бы выполнить, в квантовой теории ведет к математическим противоречиям, так что нам лучше его не делать. Мы подтвердили принцип дополнительно- сти Бора — запрещено одновременно рассматривать исходы двух взаимно исключающих экспериментов. Тот, КТО отвергает принцип дополнительности, может, предпочтет ска- зать, что (экспериментально подтверженные) нарушения неравенств Белла продемонстрировали существенную нелокальность, присущую квантовому описанию Природы. Если мы действительно настаиваем на законности об- суждения результатов взаимно исключающих экспериментов, то неизбеж- но приходим к выводу, что выбор измерения Боба действительно оказывает тонкое влияние на результат измерения Алисы. Таким образом, сторонники этой точки зрения говорят о «квантовой нелокальное™». Исключив локальные скрытые переменные, Белл разбил мечту Эйн- штейна о том, что индетерминизм квантовой теории мог бы быть устранен более полным, но все же локальным, описанием Природы. Если мы прини- маем локальность как нерушимый принцип, мы вынуждены принять слу- чайность не как следствие неполного знания, а как неизбежное внутреннее свойство квантовою измерения. Некоторые считают, что раскрытые неравенствами Белла специфиче- ские корреляции требуют более глубокого объяснения, чем способна дать
168 Глава 4 квантовая механика. Они рассматривают явление ЭПР как предтечу ожи- дающей своего открытия новой физики. Но они могут и ошибаться. После ЭПР мы ждали больше 65-ти лет, а новой физики так и нет. Похоже, человеческий разум плохо подготовлен к тому, чтобы по- стичь корреляции, демонстрируемые запутанными квантовыми состояни- ями, и поэтому мы говорим о таинственности квантовой теории. Но какой бы ни была ваша позиция, эксперимент вынуждает вас согласиться с нали- чием странных корреляций между результатами измерений. Нет большой тайны в том, как эти корреляции были установлены мы видели, что Али- се и Бобу было необходимо вместе в некоторой точке пространства создать запутывание между их кубитами. Необычность состоит в том, что даже когда А и В пространственно разделены, мы не можем строго рассматри- вать А и В как два отдельных кубита и использовать классическую ин- формацию для характеристики того, как они коррелируют Они более, чем просто коррелированы, они представляют собой нечто единое и неделимое. Они запутаны. 4.3. Еще неравенства Белла 4.3.1. Неравенство КГШХ Экспериментальные проверки эйнштейновской локальности обычно основываются на другой форме неравенства Белла, применяемого к ситу- ации, в которой Алиса может измерить одну из двух наблюдаемых а и а', в то время как Боб может измерить или Ь, или Ь'. Предположим, что на- блюдаемые а, а'.Ь, Ъ' принимают- значения {±1} и являются функциями скрытых случайных переменных. Если а. а' = ±1, то отсюда следует, что или а + а' = 0, тогда а — а' — = ±2, или же а — а' = 0, тогда а + а' — ±2; следовательно: C = (a + a')b f-(а - а')Ь'- ±2. (4.31) (Здесь тайком введено предположение о локальных скрытых переменных — мы представили, что Значения {±1} могут быть приписаны одновременно всем четырем наблюдаемым, даже если невозможно одновременное изме- рение а и а' или b и Ь'.) Очевидно |(СЖ(|С|)-2, (4.32) так что |<аЬ> + (а'Ь) + (ah') - (а'Ъ')| 2. (4.33)
4.3. Еще неравенства Белла 169 Этот результат называется неравенством КГШХ (Клаузер-Горн-Шимо- ни Хольт). Оно справедливо для любых случайных переменных а, а', Ь, Ь', принимающих значения {±1}, которые управляются совместным распреде- лением вероятностей. Чтобы увидеть, что квантовая механика нарушает неравенство КГШХ, доггустим, что а, а' обозначают эрмитовы Операторы а — сг^А^ • а, я' - а. (4.34) действующие на кубит Алисы, где а, а1 — трехмерные единичные векторы. Аналогично Ь, Ь' обозначают операторы ъ = ь, Ь' - а{в}. Ъ1, (4.35) действующие на кубит Боба. Каждая наблюдаемая имеет собственные зна- чения ±1, то есть результатами их измерения являются значения ±1. Напомним, что если Алиса и Боб делят максимально запутанное со- стояние |v“), то | (&А • а) (а11 6) — —а Ь — — cos 6, (4.36) где В — угол между а и Ь. Рассмотрим случай, когда а', Ь, а, Ь’ компланарны и располагаю! си последовательно через 45°, так чзо квантовая механика предсказывает: (ab) = (a'b) — <ab') - cos • —^=, (a'b')- -cos^--Ь. (4.37) Тогда неравенство КГШХ 4 • -^= 2\/2 < 2 (4.38) очевидно нарушается предсказанием квантовой механики. 4.3.2. Максимальное нарушение Фактически, как мы увидим из следующих аргументов, только что рас- смотренный случай представляет максимально возможное квантово-меха- ническое нарушение неравенства КГШХ. Предположим, что а, а'. Ь, Ь'
170 ГЛАВА 4 эрмитовы операторы с собственными значениями ±1, так что а2 = а'2 — Ь2 =-- b'2 = 1; (4.39) допустим также, что «наблюдаемые Алисы» а, а' коммутируют с «наблю- даемыми Боба» Ь, Ь': [a,b] — [а,Ь'] — [a',b] - [а',Ь'] — 0. (4.40) Определяя С = ab + a'b + ab' — а'Ь' (4-41) и учитывая (4.39), вычислим 1 haa' 1 bb' -aa'bb' с‘2 - +а'а +Ъ'Ь 1-1 -baa'b'b -ba'abb' U -bb' -aa' (4-42) -a'ab'b -b'b —a'a U Все квадратичные члены попарно сокращаются, так что мы остаемся с С2 — 4 1 — aa'bb' a'abb' h aa'b'b - a'ab'b = 4-l-[a,a'][b,b']. (4.43) Теперь вспомним, что норма ||М|| ограниченною оператора М опре- деляется как’ (4-44) то есть нормой М является максимальное собственное значение оператора yWM. Нетрудно проверить, что норма оператора обладает свойствами С ||М|| • ||Nj[, ||М + №|^;|М|| -HR. (4-45) 1В оригинале используется обозначение || • ||4ilp и термин sup norm, который можно было бы перевести как супремум-норма, или верхняя норма. На самом деле (4.44) дает опреде- ление обычной нормы ограниченного оператора, которая в русской литературе обозначается как || • ||. См., например, М. Рид, Б. Саймон, Методы современной математической физики. Т. 1. Функциональный анализ, Мнр, М., 1977, стр. 21. - Прим, ред
4.3. Еще неравенства Белла 171 Эрмитовский оператор с собственными значениями ±1 имеет единичную норму, так что ||С2|| С4 + 4||а|| -||а'|| ||b|| ||Ь'|| = 8. (4.46) Поскольку оператор С эрмитов, ||С2|Ы|С||2 (4.47) и, следовательно, ||С|| С 2у/2, (4.48) что известно как неравенство Цирельсона. Неравенство КГШХ утверждает, что |(С)| 2. В квантовой механике абсолютная величина ожидаемого значения эрмитовского оператора С не может быть больше его максимального собственного значения |(СЖ ЦСК2У2. (4.49) Мы видим, что верхняя 1рань достигается в случае, когда а', Ь, а, Ь' ком- планарны и располагаются последовательно через углы 45°. Таким обра- зом, найденное нами нарушение неравенства КГШХ является наибольшим допустимым в квантовой теории. 4.3.3. Квантовые стратегии действуют лучше классических Неравенство КГШХ представляет собой ограничение на величину кор- реляций между двумя частями бинарной классической системы, а нера- венство Цирельсона - ограничение на величину корреляций между дву- мя частями бинарной квантовой системы. Мы можем углубить наше по- нимание того, чем квантовые корреляции отличаются от классических, рассматрев игру, в которой квантовые стратегии работают лучше класси- ческих Алиса и Боб играют с Чарли. Чарли готовит два бита т, у € {0,1}; затем он посылает х Алисе, а у Бобу. Получив входящий бит х, Алиса производит выходящий бит а € {0,1}, точно так же, получив у, Боб произ- водит выходящий бит b € {0,1}. Но им запрещено общаться друг с другом, так что Алиса не знает у, а Боб не знает х. Алиса и Боб побеждают в игре, если их выходящие биты окажутся связанными с входящими соотношением аф b — х Л у, (4.50)
172 Глава 4 где ф обозначает сложение по модулю два (вентиль XOR), а Л обознача- ет произведение (вентиль AND). Могут ли Алиса и Боб найти стратегию, позволяющую им всегда выигрывать, независимо от того, какие входящие биты выбирает Чарли? Нет; очевидно, что такой страгии здесь нет. Пусть а0, а, обозначают значения выходящих битов Алисы, если входящими были х = 0.1, и пусть Ъ0,Ь1 — выходящие биты Боба, соответствующие его входящим битам у = — 0,1. Чтобы Алиса и Боб выиграли при всех возможных входах, их выхо- дящие биты должны удовлетворять аоф(>о — 0, О, ^фЬо— О, а>фЬ1 — 1. (4.51) Однако это невозможно, так как, складывая эти четыре равенства, мы по- лучим 0-1, Предположим, что Чарли генерирует входящие биты случайным обра- зом. Тогда существует очень простая стратегия, позволяющая Алисе и Бобу вьппрывать в трех случаях из четырех: они всегда выбирают выходящие биты а — b — 0, гак что они проигрывают, если только входящие биты х = = у — 1. Неравенство КГШХ может рассматриваться как утверждение того, что если Алиса и Боб делят не квантовое запутанное состояние, то лучшей стратегии нет. Чтобы связать это утверждение с нашей предыдущей формулировкой неравенства KI ШХ, определим случайные переменные, принимающие зна- чения ±1; а-(-!)“% а' = (-1)аГ , , * (4-52) Ь = (-1)\ b'-(-l)1- Тогда неравенство КГШХ говорит, что при любом совместном распределе- нии вероятностей, управляющем переменными а, а', Ь, Ь' € {0,1}, ожида- емые значения удовлетворяют неравенству (ab) + (ab') I (а'Ь) - (а'Ь') < 2. (4.53) Более того, если мы обозначим рху вероятность того, что уравнения (4.51) удовлетворяются, когда входящие биты равны (х.у), то (аЬ) = 2РоО - 1, (ah') = 2р01 - 1, (а'Ь) = 2р10 - I, (a'b') -- J - 2рп ; Например, (ab) = р00 — (1 - р00) = 2р0(1 - 1. поскольку значение ab равно +1, когда Алиса и Боб выигрывают, и -1, когда они проигрывают.
4.3. Еще неравенства Белла 173 Неравенство КГШХ (4.53) приобретает вид 2(роо 4 Poi +Pio +Рц) '4 < 2 (4-55) ИЛИ М = |(Роо 4"Poi Шо + т>11) (4.56) где (р) обозначает вероятность выигрыша, усредненную по однородному ансамблю входящих битов. Таким образом, если входящие биты сучай- ны, то Алиса и Боб нс могут достичь вероятности выигрыша, превосхо- дящей 3/4. Имеет смысл рассмотреть, как предположение о том, что Алиса и Боб действуют под управлением «локальных скрытых переменных», ограничи- вает их успех в игре. Несмотря на то, что Алиса и Боб пс делят квантовое запутанное состояние, им разрешено разделить таблицу случайных чисел, в соответствии с которой они могут генерировать их выходящие биты. Та- ким образом, мы можем представить, что Алиса и Боб принимают коррели- рованные решения, руководствуясь скрытыми переменными, извлекаемыми из ансамбля возможных значений, Эти корреляции ограничены локально- стью — Алиса не знает входящих битов Боба, а Боб — входящих битов Алисы, Но если Алиса и Боб делят квантовое запуганное состояние, то они могут изобрести стратегию получше. В зависимости от значения своею входящего бита, Алиса решает измерить одну из двух эрмитовых наблю- даемых с собственными значениями ±1; а, если х = 0, и а', если х = 1. Аналогично, Боб измеряет Ь, если у = 0, и Ь', если у — 1. Тогда кван- тово-механические ожидаемые значения этих наблюдаемых удовлетворяют неравенству Цирельсона (ab) + (ab') Е (а'Ь) - (а'Ь') < (4.57) а вероятность того, что Алиса и Боб выиграют гейм, ограничена условием 2(?со 4'T’oi 4 Рю + Рп) ~ 4 < (4-58) или (р) = |(Роо 4-Рог 4-Рю 4'7’11) < | 1 9^~0,853, (4‘59) Более того, мы видели, что это неравенство может перейти в равенство, если Алиса и Боб делят максимально запутанное состояние двух кубитов, а наблюдаемые а,а',Ь,Ь' выбраны подходящим образом,
174 Глава 4 Итак, мы обнаружили, что Алиса и Боб могут играть более успеш- но при наличии квантового запутывания, чем в его отсутствие. По край- ней мере для этих целей, разделенное квантовое запутывание является бо- лее мощным средством, чем разделенная классическая случайность. Но да- же ресурс квантового запутывания имеет свои пределы, устанавливаемые неравенством Цирельсона. 4.3.4. Все запутанные чистые состояния нарушают неравенства Белла Сепарабельные состояния не нарушают неравества Белла, Например, если а является наблюдаемой, действующей на кубит Алисы, а Ь наблю- даемой, действующей на кубит Боба, то в случае сепарабельного чистого состояния <ab) = <а)(Ь). (4,60) Никакого нарушения неравеств Белла не может был,, поскольку, как мы уже видели, действительно существует (локальная) теория скрытых пе- ременных, которая корректно воспроизводит предсказания квантовой тео- рии для чистого состояния одного кубита. Общее сепарабельное состояние представляет просто вероятностную смесь сепарабельных чистых состоя- ний, так что корреляции между подсистемами являются полностью класси- ческими и неравенства Белла применимы. С другой стороны, мы видели, что максимально запутанное состоя- ние, такое как \ф~), нарушает неравенства Белла. Но что можно сказать относительно чистого состояния, запутанного лишь частично, такого как \Ф) - а|00) (4.61) Любое чистое состояние двух кубитов может быть выражено таким спо- собом в базисе Шмидта; при подходящем соглашении относительно фаз а и 0 вещественные и неотрицательные. Предположим, что Алиса и Боб выполняю! измерение вдоль оси, ле- жащей в плоскости OXZ, так что их наблюдаемыми являются (4) л , (А) - л а — er3 ' cos ffA Г er) sin ffA, fP1 ' 62) b — er3’ costfp + er) ' sin6B. Состояние \ф) обладает свойствами (<£jer3 ® ег3|ф) = 1, (c^lerj ® erj<£) — 2ав, (<£|ег3 ® <гг\ф) = (ф\аг ® ег3|ф) - 0, >
4.3, Еще неравенства Белла 175 так что квантово-механическое ожидаемое значение переменной ab равно (ab) = (<э|аЬ|ф) = eosOAcos0B + 2a/3sinf)AsinGB (4.64) [и мы воспроизводим cos(0A — ffB) в максимально запутанном случае а — = [5 — 1/\/2]. Теперь для простоты рассмотрим частный (не оптимальный!) случай Й.т-О: 0д = |, О'в = ~0в, (4.65) так что квантовые предсказания равны (ab) = cosOB = (ah'), (4.66) (а'Ь) 2a/3sin0B = -(a'b'). Подставляя в неравенство КГШХ, получаем Icos^g — 2а/?зш#в| С 1, (4.67) что очевидно нарушается при значениях f)B, близких к 0 и тг. Разлагая ле- вую часть в линейном порядке по 0в, имеем ~l-2a06s, (4.68) что, конечно же, превосходит единицу при а/З > 0 и малом отрицатель- ном 0в. Мы показали, что любое запутанное чистое состояние двух кубитов нарушает некоторое неравенство Белла. Это доказательство нетрудно обоб- щить на произвольное бинарное чистое состояние. То есть для бинарных чистых состояний «запутывание» эквивалентно «нарушению неравенства Белла». Однако, как мы увидим ниже, для бинарных смешанных состояний ситуация более тонкая 4.3.5. Фотоны Эксперименты по проверке неравенства Белла обычно выполняются на запутанных фотонах, а не на объектах со спином-1/2, Каковы квантово-ме- ханические предсказания для фотонов? Вспомним из §2.2,2, что в случае фотонов, распространяющихся в на- правлении z, мы используем обозначения |аг). [у) для состояний, линейно поляризованных вдоль осей ОХ и OY соответственно. На языке этих базис- ных состояний, поляризованных вдоль «горизонтальной» и «вертикальной»
176 [ ЛАВА 4 осей, состояния, повернутые на угол О относительно ОХ и OY осей, могут быть выражены как т>-С“пЛ 14 й'" \ sin (? у \ cost) } Мы можем построить 2 х 2-матрицу, собственными состояниями которой являются и |V(0)} с соответствующими собственными значения- ми ±1; она имеет вид ।я(0»(я(0)ытит1 - (хй -Sj- (470) Генератором поворотов вокруг оси z является J — <т2, а собственными состояниями оператора J с собственными значениями ±1 циркулярно поляризованные состояния 1+1=М')' <“-7') Предположим, что возбужденный атом излучает два фотона, которые выле- тают в противоположных направлениях в состоянии с равным нулю сум- марным угловым моментом и положительной четностью. Двухфотонные состояния )в, (4.72) инвариантны относительно поворотов вокруг оси z. Фотоны имеют проти- воположные значения J,, но одинаковые спиральности (угловые моменты вдоль направления распространения), так как они распространяются в про- тивоположных направлениях. При отражении в плоскости OYZ поляризо- ванные состояния преобразуются согласно k) -М, |у) (4.73) или 1+) +*H, I-) - -г|-0; (4.74) следовательно, собственными состояниями четности являются запутанные состояния ^=(|-ОлНв±НаЮв)- (4.75) Тогда состояние с Jz — 0 и положительной четностью, выраженное через линейно поляризованные состояния, имеет вид “7^0 + I -+>,12?) - 4= (Мая + Ылн) = Юдв- (4.76)
4.3. Еще неравенства Белла 177 Вследствие инвариантности относительно поворотов вокруг оси z, оно име- ет такой вид независимо о г того, как мы ориентируем ОХ и OY оси. Алиса и Боб могут использовать анализатор поляризации, чтобы спро- ецировать состояния поляризации фотона на базис {|Я(#)), |V(0))J и, сле- довательно, измерить т(0). Для двух фотонов в состоянии \ф1), если Алиса ориентирует свой анализатор под углом 0А, а Боб под углом 0в, тогда корреляции результатов их измерений закодированы в ожидаемом значении ^Чт(А)(Ял)т<в)(МП- (4.77) С учетом вращательной симметрии. = (<Ят<л - = - <?л)|у> - = cos2(0B-0А). (4.78) Напомним, что в случае измерения кубитов на сфере Блоха мы находили подобное выражение cos 0, где 0 — угол между направлениями поляризации у Алисы и Боба. Здесь вместо этого мы имеем cos2£, поскольку фотоны имеют сини-!, а не спин-1/2. Если Алиса измеряет одну из двух наблюдаемых а — или а' = т<-4>(0А), а Боб измеряет или b — т(в)(0в), или Ь' = то в предположении о существовании локальных скрытых переменных при- менимо неравенство КГШХ. Если мы подставляем квантовые предсказания для ожидаемых значений, то получим |cos2(0B-0A)+cos2(0B-0^) l-cos2{0'в-0л)-со82(0'в-0^)| <2. (4.79) Максимальное нарушение этого неравенства, при котором неравенство Ци- рельсона превращается в равенство, — левая часть равна 2V2 возникает, когда 0А, 0в, 0А и О'в последовательно разделены углами 22Г , так что -~= = cos2(0B - оА) = COS2(0B - О'А) = = cos2(0'B - 0А) = -cos2(0'B-^). (4.80) 4.3.6. Эксперименты и лазейки Лазейка локальности. Экспериментами с запутанными парами фото- нов было проверено неравенство КГШХ в форме (4.79). Эксперименты
178 Глава 4 подтвердили квантовые предсказания и убедительно продемонстрировали, что неравенство КГШХ нарушается. Следовательно, эти эксперименты, по всей видимости, показывают, что Природа не может корректно описываться теорией локальных скрытых переменных Но так ли это? Скептик может выдвинуть возражения Например, при выводе неравенства КГШХ мы предполагали, что после того как Алиса ре- шит, что измерять: а или а', Боб не получает информации о ее решении прежде, чем он выполнит свои измерения (а также, если первым измерения выполняет Боб, то мы предполагаем, что информация о его решении не до- ходит до Алисы прежде, чем она выполнит свои измерения). С другой сто- роны, маргинальное распределение вероятностей для результатов измере- ний Боба может быть дополнено после измерений Алисы, но до измерений Боба, так что неравенство КГШХ становится неприменимым. Предположе- ние о невозможности такого дополнения подтверждается релятивистской причинностью, если решение и измерение Алисы, как события, отделены от решения и измерения Боба пространственно-подобными интервалами Скептик упорно настаивает, чтобы эксперимент удовлетворял этому усло- вию, которое называется лазейкой локальности. В 1982 г. Аспек с сотрудниками выполнили эксперимент с целью про- верки лазейки локальности. Два запутанных фотона рождаются в резуль- тате распада возбужденного состояния атома кальция и поляризация каж- дого фотона ориентируется включением одного из двух псевдо-случайно выбранного анализатора поляризации. Фотоны регистрируются на удале- нии около 12 м от источника, что соответствует времени распространения света около 40 нс. Это время гораздо больше времени включения или раз- ности времен прибытия обоих фотонов. Следовательно, «решение» о том, какую наблюдаемую измерять, принимается, тогда фотоны уже находятся в полете, а события, состоящие в выборе осей для измерения поляризации фотонов А и В, разделены пространственно-подобным интервалом. Резуль- таты согласуются с квантовыми предсказаниями и нарушают неравенство КГШХ на пять стандартных отклонений. После Аспека этот результат был подтвержден в других экспериментах, включая те, в которых детекторы А и В были удалены на километры. Лазейка детектирования. Другое возражение, которое может выдви- нуть скептик, называется лазейкой детектирования. В экспериментах с фо- тонами эффективность детектирования исключительно низкая Большин- ство запутанных фотонных пар не регистрируются обоими детекторами А и В. Среди событий, ведущих к ошибке' фотои может быть поглощен, прежде чем он достигнет детектора, фотон может пролететь мимо детек- тора, или фотон может достичь детектора, но не быть им зарегистрирован-
4.4. Использование запутывания 179 ным. В эксперименте принимаются только те данные, которые получены при совпадении регистрации двух фотонов, поскольку, проверяя неравен- ство КГШХ, мы должны предполагать, что полученные данные представ- ляют объективную выборку из всех запутанных пар. Но что если локальные скрытые переменные управляют не толы© тем, какое состояние поляризации детектируется, но также и тем, сработает ли вообще детектор? Тогда полученные нами данные могут быть необъектив- ной (смещенной) выборкой, а неравенство КГШХ - - неприменимым. В упражнении 4.2 мы покажем, что лазейку детектирования можно за- крыть, если фотоны регистрируются с эффективностью около 82,84%. Со- временные эксперименты с фотонами далеки от требуемой эффективности. В экспериментах с ионными ловушками неравенство КГШХ было провере- но с эффективностью детектирования, близкой к 100%, однако в этих экспе- риментах открыта (для скрытых переменных (перев.)) лазейка локальности. До сих пор не поставлено эксперимента, в котором одновременно были бы закрыты обе лазейки — локальности и детектирования. Лазейка свободы воли. Предположим, что выполнен эксперимент, в ко- тором фотоны регистрируются с идеальной эффективностью, а реше- ния, принимаемые Алисой и Бобом, выглядят разделенными простран- ственно-подобным интервалом. Но скептик может продолжать сопротив- ляться выводу о том, что теории локальных скрытых переменных исключе- ны, обращаясь к лазейке свободы воли. Предполагается, что принимаемые Алисой и Бобом решения о том, что измерять, сами управляются скрытыми переменными. Тогда их решения могут коррелировать со значениями скры- тых переменных, которые определяют результаты измерения, следователь- но, они не в состоянии получить объективную выборку из распределения скрытых переменных, а неравенство КГШХ может быть нарушено. Каждый из нас сам решает для себя, насколько серьезно относиться к этому возражению. 4.4. Использование запутывания После работы Белла квантовое запутывание стало предметом интен- сивных исследований среди тех, кто интересуется основаниями кванто- вой теории. Постепенно сформировалась новая точка зрения: запутывание не то.тько уникальный инструмент для демонстрации странностей кванто- вой механики, но и потенциально полезный ресурс. Используя запутывание квантовых состояний, мы можем решить задачи, сложные или неразреши- мые при других подходах.
180 Гллвл4 4.4.1, Плотное кодирование Нашим первым примером является использование запутывания для связи. Алиса хочет послать сообщение Бобу. Она может послать класси- ческие биты (типа точек и тире азбуки Морзе), но предположим, что Алиса и Боб связаны квантовым каналом связи. Например, Алиса может прию- товить кубиты (фотоны) в любом состоянии поляризации, в каком поже- лает, и послать их Бобу, который измеряет поляризацию вдоль выбранной им оси. Существует ли какое-нибудь преимущество в отправлении кубитов вместо классических битов? В принципе, если их квантовый канал имеет идеальную точность вос- произведения, а Алиса и Боб выполняют приготовление и измерение с иде- альной эффективностью, тогда они не будут испытывать затруднений, используя кубиты вместо классических битов. Скажем, Ашса может при- готовить или | Тг), или | (г), а Боб может измерить вдоль z, чтобы опреде- лить сделанный ей выбор. Таким образом, с каждым кубитом Алиса может послать один классический бит. По фактически это максимум того, что она может сделать. Посылая по одному кубиту независимо от того, как она их готовит, и независимо от того, как Боб их измеряет, с каждым кубитом можно передать не более одного классического бита (даже если кубиты запутаны между собой) Это утверждение, частный случай предела Холе- во способности квантового канала пропускать классическую информацию, будет доказано в главе 5. Теперь немного изменим правила предположим, что Алиса и Боб делят запутанную пару кубитов в состоянии |<р + )лв. Пара была приготов- лена в прошлом году; один кубит был отправлен Алисе, а другой Бобу в надежде, что разделенное запутывание однажды пригодится. Использо- вание квантового канала весьма дорого, так что Алиса может позволить себе послать Бобу только один кубит. Тем Eie менее для нее крайне важно сообщить Бобу дна классических бита информации. К счастью, Алиса помнит о запутанном состоянии которое она делит с Бобом, и выполняет протокол, который они с Бобом пригото- вили как риз для такою случая. На своей части запуганной пары она может выполним, одно из четырех возможных унитарных преобразований: 1) 1 (она ничего нс делает). 2) crt (поворот на 180" вокруг оси Т). 3) <т2 (поворот на 180° вокруг оси у), 4) <т, (поворот на 1Н0' вокруг оси z).
4.4. Использование запутывания 181 Как мы видели, делая это, она преобразует \ФГ}ЛВ к одному из четырех взаимно ортогональных состояний; п к+)лв- 2) 3) (с точностью до фазы), 4) »-}АВ Теперь она посылает свой кубит Бобу, который получает его и выполняет ортогональное коллективное измерение на паре, проецируя ее на макси- мально запутанный базис. Результат измерения недвусмысленно различает четыре возможных действия, которые Алиса могла выполнить. Следова- тельно, один кубит, посланный Алисой Бобу, успешно переносит два бита классической информации! Поэтому такая процедра называется «плотным кодированием». Приятной особенностью этого протокола является то, что если сооб- щение строго конфиденциальное, io Алиса может нс беспокоиться о том, что пересылаемый кубит перехватят враги и расшифруют ее сообщение. Перехваченный кубит имеет матрицу плотности рА — ±1А и не несет ин- формации вообще. Вся информация в корреляциях между кубитами А и В, а она недоступна, до тех пор пока враг нс заполучит обе част и запутанной пары. (По, конечно, он может «перекрыть» канал, препятствуя получению информации Бобом.) С одной точки зрения Алисе и Бобу в действительности нужно дважды воспользоваться каналом для обмена двумя битами информации. Например, мы можем представить, что Алиса сама приготовила состояние )АВ. В прошлом толу она послала Бобу половину состояния, а теперь посылает вторую. То есть на самом деле Алиса посылала два кубита Бобу в одном из четырех взаимно ортогональных состояний, чтобы передать ему два клас- сических бита информации, что допускает предел Холсво, I Бтотное кодирование является странным но ряду причин. Во-первых, Алиса послала Бобу первый кубит заголю до того, как узнала, каким бу- дет ее сообщение. Во-вторых, каждый кубит сам по себе не несет никакой информации; она целиком закодирована в корреляциях между кубитами. В-третьих, это сработало бы с тем же успехом, если бы запутанную пару приготовил Боб и половину ее послал Алисе: тогда два классических би- та передаются от Алисы к Бобу путем пересылки одного кубита от Боба к Алисе и обратно.
182 Глава 4 Так или иначе, если бы возникла необходимость и понадобилось немедленно послать два бита, в то время как каналом связи можно вос- пользоваться только один раз, Алиса и Боб мох ли бы использовать предва- рительно приготовленное запутывание для более эффективной связи. Они использовали бы запутывание как ресурс. 4.4.2. Квантовая телепортация В плотном кодировании квантовая информация может быть использо- вана для увеличения передачи классической информации. В частности, ес- ли Алиса и Боб делят запутанное состояние, то для передачи двух классиче- ских битов достаточно послать один кубит. Интересно обратное утвержде- ние. Если Алиса и Боб делят запутанное состояние, то достаточно ли по- слать два классических бита, чтобы передать один кубит? Представим, что Чарли приготовил для Алисы кубит в состоянии \ф), но Алиса ничего не знает о том, какое состояние приготовил Чарли. Бобу отчаянно нужен этот кубит; и Алиса хочет помочь ему. Но проклятый кван- товый канал снова закрыт! Алиса может послать Бобу только классическую информацию. Она могла бы попытаться измерить «г п, проецируя свой кубит или на | Tft), или на | и послать однобитовый результат измерения Бобу, который тогда мог бы приступить к приготовлению обнаруженного Алисой состояния. Но, как вы покажете в упражнении 4.7, состояние Боба не будет идеальной копией состояния Алисы; в среднем он будет соответствовать кубиту Алисы с точностью воспроизведения = (4.81) Эта точность воспроизведения выше той, которой Боб мог бы добиться просто случайным образом выбирая состояние ^F = но она далека ог той, что ему требуется. Более того, как мы увидим в главе 5, не существует алгоритма, позволяющего таким способом (Алиса измеряет кубит и посы- лает классическую информацию Бобу) достичь точности воспроизведения выше, чем 2/3. К счастью, Алиса и Боб помнят, что они делят максимально запутанное состояние | ф+) АВ, которое они приготовили в прошлом году. Почему бы им не использовать запутывание как ресурс! Если они готовы израсходовать разделенное запутанное состояние и общаться классическим образом, то может ли Алиса послать свой кубит Бобу с точностью воспроизведения выше, чем 2/3?
4.4. Использование запутывания 183 Па самом деле они могут добиться точности воспроизведения F — 1, выполняя следующий протокол: Алиса соединяет незвестный кубит |^)с» который она хочет послать Бобу, с ее половиной |<£+)лв-пары, которую она делит с Бобом. Она измеряет две коммутирующие наблюдаемые (4.82) выполняя таким образом измерение Белла — проекцию двух кубитов на од- но из четырех максимально запутанных состояний I^Jca, I^Jca- Затем она посылает результаты своих измерений (два бита классической инфор- мации) Бобу по классическому каналу. Получив эту информацию, Боб вы- полняет одну из четырех операций над своим кубитом: Алиса измеряет |<^+)сл -> Боб применяет 1А Алиса измеряет \ф b)cA —* Боб применяет Алиса измеряет |^~)ол —> Боб применяет а^В\ Алиса измеряет —> Боб применяет сг.93'1. Это действие преобразует кубит Боба (его часть запутанной пары, предва- рительно поделенной с Алисой) в идеальную копию г^тот магический трюк называется квантовой телепортацией. Как она работает? Заметим, что для 'v) = а|0) 4- Ь| 1) мы можем запи- сать Кй)с!^+)аВ = (а|б)с Б^|1)с)^=(|00)дв + |11)ав) = - "у=(а|000)слв + а|011)с,АВ + ^100}слв + ^[11 ОсАв) ~ - |О0+)СА + )га)|0)в + |(ИИса + IV1 >са)|1)в + Ь 2 А + }сА - 1^ )сд)|0)в + |(1^+)са “ \Ф )са)Юв - - \ф+) СА (а|0) В + Ь| 1)й) + \Ф+) сл(а11)В + №)в) + + rjl^ )са(о|1)в - Wb) + 2 (а|0}в - 6Ц}.в) =- ||<А^слМв + j|V’+)cA<rllV’)H + + ^ЬПсаН^Мв + ^ЮсдстзЮв. (4.84)
184 I'ЛАВА 4 Таким образом, мы видим, что, когда Алиса выполняет измерение Бел га на кубитах С и А, все четыре исхода равновероятны. Как только Боб узнает результат ее измерения, он получает в свое распоряжение чистое состо- яние o'lV’). где о- — известный оператор Паули, один из {1, ст2, <т3}. Действие, предписываемое уравнением (4.83), восстанавливает кубит Боба в начальном состоянии Квантовая телепортация — любопытная процедура. Первоначально ку- бит Боба полностью некоррелирован с неизвестным кубитом |^)с, ио вы- полненное Алисой измерение Белла устанавливает корреляцию между А и С. Результат ее измерения фактически совершенно случаен, следователь- но, выполняя это измерение, Алиса (и Боб) в действительности не полу- чают никакой информации относительно |у>), Это особенно приятно. Ведь как известно, сели бы они получили любую информацию о состоянии, то неизбежно внесли бы в него возмущение. Как же в таком случае квантовому состоянию удается перейти от Али- сы к Бобу? Это довольно загадочно, С одной стороны, мы едва ли мо- жем уверенно сказать, что два отправленых классических бита несли э гу информацию, поскольку они были случайными. Следовательно, невольно хочется сказать, что разделенная запутанная пара сделала возможной те- лепортацию. Вспомним, однако, что запутанная пара в действительности была приготовлена еще в прошлом году, когда Алисе даже не снилось, что она будет посылать кубит Бобу ... Следует также заметить, что процесс телепортации полностью согла- суется с принципом невозможности клонирования, В самом деле, в руках Боба оказалась копия состояния |^)в. Но прежде, чем она могла возник- нуть, оригинал |у>)с был разрушен измерением Алисы. Наши сведения о плотном кодировании и квантовой телепортации можно подытожить как утверждения о том, как ресурс одною типа мо- жет моделировать другой. Введем термины забит для разделенной на две части запуганной пары кубитов1 и с-бит для классического бита (с от сло- ва classical классический). Мы телепортируем один кубит от Алисы к Бобу, расходуя один .забит и посылая два с-бита, а с помощью плотною ко- дирования мы посылаем два с-бита от Алисы к Бобу, расходуя один забит и транспортируя один кубит. Таким образом, можно сказать, что 1 забит f 2 с-бита —> 1 кубит, (забит | I кубит —* 2с-бита (4-85) означает, что ресурсов левых частей достаточно для копирования правых частей. В этих алгоритмах существенно запутывание. Без забитов кубит 1В оригинале ebit (е от слова entangled — запутанный). — Прим перее
4.4. Использование запутывания 185 стоит не больше одного с-бита и без них же «телепортируемый» кубит имеет точность воспроизведения F С 2/3. 4.4.3. Квантовая телепортация и максимальное запутывание Идея телепортации выглядит довольно таинственно. Хотелось бы глуб- же разобраться, почему она работает. Полезным ключом к разгадке является то, что для телепортации с точностью воспроизведения F — 1 расходуе- мое запутанное состояние согласно протоколу должно быть максимально запутанным. А основной особенностью бинарных максимально запутан- ных состояний является то, что или Алиса, или Боб могут преобразовывать одно такое состояние в другое, применяя локальное унитарное преобразо- вание. Чтобы лучше увидел., как работает квантовая телепортация, рассмот- рим телепортирование iV-мерной системы, используя максимально запу- танное N х TV-состояние вида JV-1 1Ф) ~7= £ IW)- (4.86) vAT не- полезным свойством этого состояния является саЖав - Ж>А® Юв) - 1V Гв—* = У? Юв с(*1 " (4.87) I Здесь мы определили трансфер-оператор (или оператор переноса) Твс, который обладает свойством = Твс [ j = ~ : (4.88) \ » Z * он отображает состояние из С на идентичное состояние в В. Это свойство не имеет инвариантною смысла, независимою от выбора базиса в В и С; скорее Твс просто описывает произвольный способ связать ортонормиро- ванные базисы двух систем. Конечно, Алисе и Бобу придется определен- ным образом ориентировать свои базисы, чтобы проверить, что телепорта- ция действительно состоялась.
186 Глава 4 Теперь вспомним, что любое другое максимально запутанное jV х Аг-состояние имеет разложение Шмидта вида м -1 -7= Е 1Г>0 vn t_0 и может быть выражено как |$(U)> = U ® 1!Ф>, (4.90) где з Записывая |Ф(и))лв - «> (4.92) ъз можно легко проверить, что сд(Ф(и)|Ф(У'^))лв ±(VU-%TBC, (4.93) где VT обозначает транспонированную матрицу V в стандартом бази- се (V^ - Vjt); тогда, в частности, для любой унитарной матрицы U транс- фер-оператор может быть представлен в виде ^Твс = сл(Ф(и)|Ф(ит))лв. (4.94) Предположим теперь, что Алиса и Боб делят |Ф)АБ, а Чарли пригото- вил состояние |V->) с и оставил ею на хранение в лаборатории Алисы. Алиса выполняет измерение, которое проецирует С А на базис максимально запу- танных состояний, получая результат- |$(Ua))CA для некоторого унитар- ного преобразования Ua. Тогда из уравнения (4.94) известно, что если бы Алиса и Боб вместо |Ф)ДВ поделили состояние |Ф(иа))сд, то измерение Алисы приготовило бы в лаборатории Боба идеальную копию (реплику) состояния jV')- К сожалению, они не догадались с самого начала поделить подходящее состояние. Но еще не все потеряно! Боб понимает, что 1^))лв-1А®(иа)в|Ф)дв, (4.95)
4.4. Использование запутывания 187 и, конечно, (UO)B коммутирует с измерением Алисы. Следовательно, когда Боб узнает у Алисы, что результатом ее измерения было |Ф(иа'))дв, он применит (Ua)£ к своей половине поделенного с Алисой состояния. Тогда протокол станет эквивалентным тому, в котором они с самого начала делили именно то, какое нужно, максимально запутанное состояние, а состояние Боба преобразуется в [^) g! Этот подход к телепортации имеет некоторые концептуальные преиму- щества. Во-первых, можно легко убедиться в том, что Алисе не требу- ется выполнять ортогональное измерение. Чтобы осуществить телепорта- цию е точностью воспроизведения F = 1, ей достаточно выполнить ПОЗМ с операторами Ма, где каждый Ма обладает свойством М1МО <х |Ф(и„)){Ф(иа)| (4.96) для некоторого унитарного преобразования Ua. Так же легко можно уви- деть, как должен быть модифицирован протокол телепортации, если на- чальным максимально запутанным состоянием, которое делят Алиса и Боб, является не |Ф)ДВ, а - 1д $ УВ!Ф)ЛВ. (4.97) Если результатом измерения Алисы является |Ф(иа))сА> то Уравне- ние (4.93) говорит нам, что состояние Боба принимает вид VUa'|^)B. (4.98) Чтобы воспроизвести |^)в, Боб должен применить преобразование UaV-1. Порядок следования операторов в уравнении (4.98) на первый взгляд может показаться интуитивно непонятным — он выглядит так, как если бы измерение Алисы (Ua) предшествовало приготовлению разделяемо- го запутанного состояния (V) Однако это «обращение времени» имеет непосредственное толкование. Если результатом измерения Алисы является СА, то Боб получил бы идеальную копию |^), если бы начальным состоянием было 1А <$) (Uo)в |Ф) А в. Чтобы смоделировать ситуацию, в ко- торой сразу было подходящим образом выбрано запутанное состояние, Боб сначала применяет V-1, чтобы скомпенсировать «поворот» в |Ф(УТ))ДВ и восстановить |Ф)ДВ, а затем применяет Uo, чтобы преобразовать запу- танное состояние к требуемому виду.
188 Глава 4 Существует более фантастическая интерпретация уравнения (4.98), ко- торая хотя и необязательна, но тем не менее неопровержима Мы можем «объяснить», как квантовая информация переносится от Алисы к Бобу, сле- дуя движению кубита вдоль мировой линии в пространстве-времени. Ку- бит движется вперед во времени от его приготовления Чарли до измерения Алисой, затем - назад от измерения до первоначального приготовления запутанной пары и, наконец, снова вперед во времени от приготовления пары до лаборатории Боба. Поскольку эта мировая линия посещает изме- рение Алисы прежде чем добирается до приготовления запутанной пары, Ua 1 действует «первым», а V •- «позднее». 4.4,4. Квантовый программный продукт Телепортация имеет некоторые интересные приложения. Представим, например, что Алиса и Боб хотят применить «квантовый вентиль» V к неизвестному состоянию применение V требует сложного обо- рудования, которое они себе не Moiyr позволить Более экономичная альтернатива — приобрести квантовый программ- ный продукт бинарное состояние, которым, как уверяет продавец, явля- еТСИ WVT))xe . 1„ ® (4.99) Аппаратное обеспечение Алисы достаточно мощное, чтобы выполнить из- мерение, проецирующее на базис {|Ф(иа))сл}; коль скоро результат а из- вестен, состояние VU"1 - приготовлено. Тосда ]юб может завершить выполнение V на |?£)в, применяя преобразование VU.jV '1. Эта процедура может показаться неразумной - почему мы считаем, что Боб может применить преобразование VU(1V’:. но не способен при- менить V? В действительности это не так глупо, а имеет важные примене- ния к отказоустойчивым квантовым вычислениям, которые мы будем изу- чать позднее в главе 8’. В некоторых случаях выполнение VUa V-1 в дей- ствительности несколько проще, нежели применение V. Более того, вместо того, чтобы приобретать квантовое про>раммное обеспечение, Алиса и Боб мотут сами приготовить его, даже несмотря на то, что они не могут на- дежно применить V Это возможно, поскольку проще проверить, что было должным образом приготовлено известное квантовое состояние, чем про- верять, что известное унитарное преобразование было успешно применено 1В это издание вошли первые шесть |лав лекций Прескилла. Редакция РХД предполага- ет издание второй части, которая будет посвящена теории квантовых кодов, исправляющих ошибки, отказоустойчивых вычислений, тоцолотчсских квантовых вычислений и дру1им во- просам, - Прим ред
4.5, Квантовая криптография [89 к неизвестному состоянию. Если нельзя положиться на применяющее V ап- паратное обеспечение, то мы предпочтем использовать его автономно для подготовки компьютерной программы, чтобы применить ее с гарантирован- ной надежностью, нежели рисковать нанести неустранимое повреждение нашему неизвестному состоянию вследствие ошибочного выполнения V. С каждым применением V расходуется одна копия квантового про- граммною обеспечения, Таким образом, протокол выполнения преобразо- вания V с его помощью использует запутывание как ресурс, 4.5. Квантовая криптография 4.6.1, Распределение квантового ЭПР-ключа У каждого есть свои секреты, Алиса и Боб не исключение Алисе нуж- но передать Бобу очень личное сообщение, но у них есть очень любопытная подружка, Ева, которая наверняка попытается их подслушать Могут ли они связаться, будучи уверенными, что Еве это не удастся? Очевидно, им нужно воспользоваться каким-то кодом. Но беда в том, что Ева не только очень любопытна, по и весьма ловка Алиса и Боб не уверены, что им хватит ума придумать такой код, который Ева не сможет взломать, за исключением одной схемы кодирования, которая абсолютно надежна. Если Алиса и Боб поделят тайный ключ, известную только им случайную последовательность бигов, тоща Алиса может конвертировать свое письмо в кодах ASCII (ряд битов не длиннее ключа), сложив (по мо- дулю два) каждый бит своего сообщения с соответствующим битом ключа, и послать результат Бобу Получив этот ряд, Боб может добавить ключ, чтобы извлечь сообщение Алисы. Эта схема надежна, гак как, даже если Ева перехватит сообщение, опа ничего не сможет узнать, поскольку передаваемая последовательность сама ио себе не несет никакой информации - сообщение закодировано в корре- ляции между передаваемой строкой и ключом (который Ева не знает). Тем не менее проблема все еще остается, поскольку Алисе и Бобу необходимо установить общий случайный ключ и они должны быть уве- рены, что Ева не сможет его узнать. Они могли бы встретиться, чтобы обменяться ключом, но эго может оказаться невыполнимо. Они могли бы доверить третьему лицу передать этот ключ, но что если оно состоит в тай- ном сговоре с Евой? Они moi ли бы использовать протоколы распределе- ния «открытых ключей», но их надежность опирается на предположения относительно вычислительных ресурсов, доступных потенциальному про- тивнику. Действительно, в главе 6 мы увидим, что протогаэлы открытых
190 Глава 4 ключей беззащитны перед атакой хакера, располагающего квантовым ком- пьютером. Могут ли Алиса и Боб использовать квантовую информацию (и осо- бенно запутывание) для решения проблемы передачи ключа? Могут! Мож- но придумать протоколы распределения квантовых ключей, которые будут неуязвимы ддя любой, допустимой законами физики, атаки. Предположим, что Алиса и Боб делят запас запутанных пар, приготов- ленных в состоянии |Ф+). Чтобы приготовить известный только им тайный ключ, они должны выполнить следующий протокол. Для каждого находящегося в их распоряжении кубита Алиса и Боб ре- шают измерять или сг1, или а3. Это решение является псевдо-случайным, каждый выбор реализуется с вероятностью 1 /2. Затем, после того как изме- рения выполнены, они открыто объявляют о том, какие наблюдаемые были измерены, но не открывают полученные ими результаты. В тех случаях (примерно в половине), в которых они измерили свои кубиты вдоль разных осей, их результаты отбрасываются (поскольку в них получены нсскоррели- рованные результаты). В тех же случаях, в которых они выполнили измере- ния вдоль одних и тех же осей, их результаты хотя и случайны, но идеально скоррелированы. Следовательно, они установили между собой случайный ключ. Но действительно ли этот протокол неуязвим перед коварной атакой Евы? В частности, еще раньше Ева могла тайком исказить пары. Тогда пары, которыми располагают Алиса и Боб, могут и не находиться в иде- альных |<£+)-состояниях, а скорее они будут запутаны с кубитами Евы (без ведома Алисы и Боба). Тогда Ева может подождать до тех пор, пока Али- са и Боб не сделают своего заявления, чтобы соответствующим образом выполнить измерение своих кубитов и получить максимальную информа- цию о полученных ими результатах. Алиса и Боб должны защититься от подобной атаки. Если Ева действительно исказила пары Алисы и Боба, тогда наиболее общее возможное состояние АВ-пары и множества Е-кубитов имеет вид I'Oa.B.E — |00) АВ 1е0о)д + 1^1)Ав1е01?Е + + 1еп^’ (4.100) где состояния кубитов Евы \е^)Е ни нормированы, ни взаимно ортого- нальны, Вспомним теперь, что оиреде.гяющим свойством |ф+) является то, что оно представляет собой собственное состояние как <7jA'1 ® так и г//1-1 ® а\В1 с собственным значением + 1. Предположим, что Алиса и Боб
4.5. Квантовая криптография 191 могут проверить, обладают ли этим свойством имеющиеся у них кубиты. Чтобы удовлетворялось сг^ ® сг^1 — 1, мы должны иметь ПОдВЕ — ^О)лвкоо)Е i (4.101) а чтобы выполнялось <т^л' ® <7^- = 1, мы должны иметь 1^)аве — + IWabJI^e = 1^+) ав 1с)е- (4.102) Мы видим, что ЛВ-пары могут быть собственными состояниями операто- ров и о’зЛ'?®о’зВ\ если только они полностью незапуганы с ку- битами Евы, Следовательно, измеряя свои кубиты, она не сможет что-либо узнать о результатах измерений Алисы и Боба. Случайный ключ надежен. Чтобы проверить свойства <Т]Л' ® — 1 = о^л> <§ Алиса и Боб могут пожертвовать частью своего общего ключа и открыто сравнить результаты своих измерений. Они должны обнаружить, что их результаты действительно идеально скоррелированы. Если это так, то с высокой стати- стической надежностью они будут уверены в том, что Ева не в состоянии перехватить ключ Если нет, то они зарегистрировали гнусную деятель- ность Евы. Тогда они могут выбросить этот ключ и сделать новую попытку установить надежный ключ. Как я только что это представил, протокол распределения квантового ключа, казалось бы, требует наличия разделенных между Алисой и Бобом запутанных пар, но на самом деле это не так. Мы можем представить, что Алиса сама готовит нары ^+), а затем измеряет один кубит в каждой па- ре, прежде чем послать другой Бобу. Это полностью эквивалентно схеме, в которой Алиса готовит одно из четырех состояний IU, Ш> 1ТД Ш (4.103) (выбираемое случайным образом, каждое из них возникает с вероятностью 1 /4) и посылает кубит Бобу. Тогда измерение Боба и проверка выполняют- ся, как и раньше. Эта схема (известная как протокол распределения кван- тового ключа ВВ84 ’) так же надежна, как и схема, основанная на запуты- вании2 * * * . предложен Беннетом и Брассаром в 1984 к: С.Н. Bennett, G, Brassard, ш Proc IEEE Int. Conf on Computers, Systems and Signal Processing, TEEE, New York (1984). Эксперименталь- но реализован в экспериментах с поляризованными фотонами. Де гальное обсуждение можно найти в книге Фишка квантовой информации, под ред. Д. Боумейстера, А. Экерта и А. Цай- лингера, Постмаркет, М.: (2002). — Прим ред. 2 За исключением тою, что в ЭПР-схеме Алиса и Боб могут подождать с созданием ключа до тех пор, пока им не понадобится поговорить, сокращая таким образом риск того, что в ка- кой-то моменг Ева може'1 соверши гь взлом, чтобы узнать, какие состояния приготовила Алиса (и таким образом извлечь ключ).
192 Глава 4 Другой интригующий вариант называется «обращенной во времени ЭПР» схемой. Здесь и Алиса и Боб готовят по одному из четырех состоя- ний (4 103) и отсылают свои кубиты Чарли. Тогда Чарли выполняет измере- ние Белла на паре, то есть он измеряе-i и совершая ортогональную проекцию на одно из состояний | и открыто объ- являет о результате. Поскольку все четыре из этих состояний одновременно с (4)^ (В) (А)~ (В) являются собственными состояниями операторов <7^ и сг^ , когда Алиса и Боб приготовили свои спины ориентированными вдоль од- ной и той же оси (что они делают примерно в половине случаев), они делят один бит1 Конечно. Чарли может оказаться в союзе с Евой, но, как и преж- де, путем сравнения части своих кодов, Алиса и Боб могут проверить, что те не имели доступа к информации. Эта схема имеет то преимущество, что Чарли мог бы заведовать центральной коммутаторной станцией, храня ку- биты, полученные от многих людей, и выполняя измерение Белла, когда двое из абонентов запросят установить безопасную связь. (Здесь мы пред- полагаем, что Чарди имеет устойчивую квантовую память, в которой кубит может храниться надежно и сколь угодно долго.) Безопасный ключ может быть установлен даже при временно закрытой линии квантовой связи, если оба абонента догадались послать свои кубиты Чарли раньше (когда кван го- вый канал был открыт) До сих пор мы делали нереалистичное предположение о том, что кван- товый канал связи идеален, но, конечно, в реальном мире будут возникать ошибки. Следовательно, даже если Ева не причинила никакого ущерба, Алиса и Боб иногда будут обнаруживать, что их проверочный тест терпит неудачу. Но как им отличить ошибки, возникающие из-за дефектов канала, от ошибок, возникающих в результате в торжения Евы? Обращаясь к этой проблеме, Алиса и Боб могут усовершенствовать их протокол в двух отношениях. Во-первых, они могут осуществить (клас- сическую) коррекцию ошибок, чтобы сократить эффективную частоту' их появления. Например, чтобы установить каждый бит их общего ключа, они могут в действительности заменить его блоком трех случайных бигов. Ес- ли среди трех бигов не все одинаковые, то Алиса может сообщить Бобу, какой из них отличается от двух других; Боб может инвертировать этот бит в своем блоке, а затем использовать подсчет большинства голосов для определения значения бита для блока. Таким способом Алиса и Боб раз- делят одинаковый бит ключа, даже если для одного бита в блоке из трех возникла ошибка. 'Пока Чарли не выполнил свое измерение, состояния, приготовленные Алисой и Бобом, полностью некоррелироваиы. Определенная корреляция (или антикорреляцня) устанавливает- ся после того, как Чарли выполнит свое измерение.
4.5. Квантовая криптография 193 Однако одной лишь коррекции ошибок недостаточно для уверенности в том, что Ева не получила информацию о ключе — коррекция ошибок должна быть дополнена (классическим) секретным усилением. Например, после выполнения коррекции ошибок, когда Алиса и Боб уже уверены, что располагают одинаковыми ключами, они могут выделить бит «суперклю- ча», например, четность п битов ключа. Чтобы узнать что-нибудь о четно- сти п битов, Еве нужно хотя бы что-нибудь узнать о каждом бите. Следо- вательно, бит четности в среднем существенно более надежен, чем каждый из отдельных битов ключа. Если частота ошибок в канале достаточно низка, то можно показать, что распределение квантового ключа, дополненное коррекцией ошибок и секретным усилением, неуязвимо для любой атаки, которую может пред- принять Ева (в том смысле, что можно гарантировать, что полученная ею информация будет сколь угодно мала). Мы вернемся к проблеме обеспече- ния безопасности распределения квантового ключа в главе 7. 4.5.2. Невозможность клонирования Безопасность распределения квантового ключа основана на существен- ном различии между квантовой и классической информацией. Невозможно получить информацию, определяющую различие между псортогональиыми квантовыми состояниями, не внося возмущение в эти состояния. Например, в протоколе ВВ84 Алиса посылает Бобу любое из четырех состояний, | fz). | |г), | Тд.), j Хх): и они имеют возможность проверить, что ни одно из этих состояний не возмущено попыткой подслушивания со стороны Евы. В более общем виде предположим, что |у) и |-0) два тгеортогональных состояния в И / 0) и что в Н ® НЕ (где — доступное Еве гильбертово пространство) применяется унитарное преоб- разование U, не возмущающее |у) и IV1). Тогда Г \ф} ® |0)д — \ф} ® |e)R, I И8|0)ь. -> |^)8 \f}E, а унитарность предполагает, что (в(0| 8 ИЫ ® |0)е) - = 8 |/>е) - (4.105) Таким образом, при (wl^) / 0 мы имеем (е)/) 1 и, поскольку состоя- ния нормированы, |е) — ff). Это означает, что ни одно измерение в НЕ не
194 Глава 4 может дать информацию, отличающую |^>) от |^>). В случае ВВ84 это до- казательство показывает, что если Ева не вносит возмущения в состояния, посланные Алисой, то состояния в остаются неизменными, независимо от того, какое из четырех состояний | ]z), | J.J, I Т j, | было посла- но, и, следовательно, Ева ничего не узнает о разделенном Алисой и Бобом ключе. С другой стороны, если Алиса посылает Бобу одно из двух ортого- нальных состояний | ?2) или | |г), то ничто не мешает Еве получить копию информации (как в случае с классическими битами). Раисе мы отмечали, что если у нас есть множество идентичных копий кубита, то можно измерить средние значения некоммутирующих наблю- даемых типа <7|, а2 и <т3, чтобы полностью определить матрицу плотно- сти кубита. Неотъемлемым в выводе о том, что неортогональные состоя- ния нельзя различить не возмутив их, является неявное утверждение, что невозможно сделать идеальную копию кубита. (Если бы мы моши, мы сде- лали бы столько копий, сколько их необходимо для определения (<т2) и (ст3) с любой наперед заданной точностью.) Сформулируем это в явном виде: не существует квантового ксерокса. Ортогональные квантовые состояния (подобные классической инфор- мации) могут надежно копироваться. Например, унитарное преобразова- ние, действующее как U: |1)а|0>Е - (4.106) копирует первый кубит на второй, если первый является одним из двух состояний: |0)л или |1)А. Но если вместо этого первый кубит находится в состоянии \-ф) — а^0)л + 6| 1)А, то (7: (а|0>л + 6|1>л)|0}Е -» а|0)А|0)Е + 6|])А|1)Ь. (4.107) Это не состояние \i/>) ® \ф} (тензорное произведение исходною состояния и его копии); скорее это нечто совершенно отличное — запутанное состоя- ние двух кубитов. Чтобы рассмотреть наиболее общий квантовый ксерокс, допустим, что полное гильбертово пространство шире тензорного произведения исходно- го пространства и пространства копий. Тогда наиболее общее «копирую- щее» унитарное преобразование действует как lv)а|6)е|0)р —> |^?)А|^}в|е)F, Iv’Ja|о)л|б)Е |<^)А|/)F- (4.108)
4.6. Многокомпонентное запутывание 195 Тогда унитарность предполагает, что лШл аШлеШеЖЦ)р ; (4.109) следовательно, если 0, то 1 = е^^е f(c\/}e- (4.110) Поскольку состояния нормированы, мы приходим к выводу, что • = (4.111) то есть [^) и (уз) в действительности представляют один и тот же луч. Ни одна унитарная машина не может сделать копии и |^з), если они являются различными неортогональными состояниями. Этот результат на- зывается теоремой о невозможности клонирования. 4.6. Многокомпонентное запутывание 4.6.1. Три квантовых ящика После безумно успешного эксперимента с тремя монетами на столе Алиса и Боб стали всемирно известными. Они стали профессорами, Алиса в КАЛТЕХе, а Боб в Чикаго. Они слишком занятые, чтобы проводить много времени в лабораториях, но у них достаточно аспирантов и они продолжа- ют активно заниматься наукой. Их лучший студент, Чарли, который выполнял всю черновую рабо- ту в эксперименте с монетами, закончил образование и теперь он доцент в Принстоне. Алиса и Боб хотели бы содействовать карьере Чарли и по- мочь ему занять постоянную должность. Однажды они болтали по теле- фону. Алиса: Знаешь, Боб, мы, конечно, должны помочь Чарли. Ты можешь при- думать подходящий эксперимент, который мы можем выполнить втро- ем? Боб: Ну, я не знаю, Алиса. Есть множество экспериментов, которые я хотел бы выполнить с нашими запутанными парами кубитов. Но в каждом эксперименте есть один кубит для меня, а другой — для тебя. Похоже, что Чарли — третий лишний. Алиса: [Длинная пауза]. Боб... А ты когда-нибудь думал о постановке экс- перимента с тремя кубитами?
196 Глава 4 У Боба отвисла челюсть и подскочил пульс. Во внезапном прозрении он словно увидел перед собой всю свою будущую карьеру. Но правде говоря, Боб уже начинал задумываться о том, что их эксперименты с двумя куби- тами порядком устарели. Теперь он знает, что в ближайшие пять лет он всецело посвятит себя выполнению полного трехкубитового эксперимента. К тому времени он, Алиса и Чарли обучат другого блестящего студента и будут готовы подступиться к четырем кубитам. Затем еще один студент и еще один кубит. И так до самой пенсии. Вот как выглядит эксперимент с тремя кубитами, который Алиса и Боб решили попробовать осуществить: Алиса поручает сотруднику своей ла- боратории в КАЛТЕХе тщательно приготовить состояние трех квантовых ящиков. (Но Алиса не знает точно, как он это сделает.) Она оставляет один ящик у себя, а два других отг[равняет срочной квантовой почтой Бобу и Чар- ли. В каждом ящике находится шар, который может быть или черным, или белым, но яшик плотно закрыт. Единственная возможность узнать, что на- ходится внутри, - это открыть ящик, но открыть его можно двумя различ- ными способами — ящик имеет две дверцы, промаркированные как X и У Определить цвет шара можно, когда открывается одна из двух дверок. Но невозможно открыть обе дверцы сразу. Алиса, Боб и Чарли собираются исследовать, как скоррелированы ящи- ки. Они проводят множество тщательно контролируемых испытаний. Каж- дый раз один из них, выбранный жребием, открывает дверцу X, тогда как двое других открывают дверцу У. Удачливые, как всегда, Алиса, Боб и Чар- ли делают удивительное о ткрытие. Они обнаруживают, что всякий раз, ко- гда они открывают ящики в таком порядке, они находят нечетное количе- ство черных шаров. То есть Алиса, Боб и Чарли обнаружили, что когда они открывают дверцу X па одном ящике и дверцы ¥ на двух друс их, то гарантированно наблюдают одно из сочетаний цветов. ОаМс, 0а1В0<7, 1аШ IaIbIc «112) (О обозначает белый, 1 — черный). Они ни разу нс наблюдали ни одного сочетания из 1a^b0g’> 1д0в1сп Оа^в^С: 0а0В0с- (4.113) независимо от того, у какого из трех ящиков была открыта дверца X. Некоторое время спустя Алиса, Боб и Чарли понимают; что после от- крытия двух ящиков они всегда могут предсказать, что произойдет, когда
4.6. Многокомпонентное запутывание 197 будет открыт третий ящик. Если первые два шара одного цвета, то тре- тий шар, разумеется, будет черным, а если первые два — разных цветов, то последний шар обязательно будет белым. Они проверяли это несметное количество раз, но так происходило всегда! Даже после признания эксперимента с тремя монетами Алиса, Боб и Чарли не усомнились в своей приверженности к эйнштейновской локаль- ности. Однажды между ними состоялся трехсторонний разговор. Алиса: Знасге, парни, иногда я просто не могу решиться открыть ли двер- цу X или дверцу Y своего ящика. Я знаю, я должна выбирать аккурат- но ... . Если я открою дверцу А', то я несомненно внесу возмущение в ящик; следовательно, я никогда не узнаю, что случилось бы, если бы вместо этого я открыла дверцу У. А если я открою дверцу У, я никогда не узнаю, что наптла бы, если бы открыла дверцу X. Это так огорчает! Боб: Алиса, ты ие права! Наш эксперимент показываез, что ты можешь знать оба эти случая. Неужели ты не видишь? Допустим, что ты хо- чешь знать, что произойдет, когда ты откроешь дверцу X. Тогда ты просто просишь Чарли и меня открыть дверцы У наших ящиков и со- общить тебе, что мы обнаружили. Ты будешь знать абсолютно точно, без сомнения, что случится, если ты откроешь дверцу X. Мы прове- ряли это много раз, и это всегда работает. Так зачем же беспокоиться и открывать дверцу X? Ты можешь пойти дальше и вместо этого от- крыть дверцу У и узнать, что ты найдешь. Таким образом ты реально узнаешь результаты открывания обеих дверок! Чарли: Но как можно быть в этом уверенным? Если Алиса открывает дверцу У, она теряет возможность открыть дверцу X. Она же не мо- жет реально получить оба этих случая. После того, как она открывает дверцу У, мы не можем проверить, произойдет ли ожидаемый резуль- тат при открывании дверцы X. Боб: Да ну, как может случиться другое? Смотри, ты же на самом деле не думаешь, что ты со своим ящиком в Принстоне, а я со своим — в Чи- каго можем оказать какое-то влияние па то, что найде т Алиса, когда она откроет свой ящик в Пасадене, не гак ;ш? Когда мы открываем паши япщки, мы ничего не можем изменить в ящике Алисы; мы толь- ко узнаем информацию, необходимую для того, чтобы с уверенностью предсказать, что обнаружит Алиса. Чарли: Ну, может быть, нам следовало бы выполнить несколько больше экспериментов, чтобы выяснить, что вы в этом правы.
198 Глава 4 Действительно, открытие корреляции грех ящиков сделало Алису и Боба даже более знаменитыми, чем раньше, но Чарли еще не получил той репутации, которой заслуживает, — он все еще без должности. Не уди- вительно, что он хочет выполнить больше экспериментов! Он продолжает: Чарли: Здесь есть нечто такое, что мы можем проверить. Во всех выпол- ненных до сих пор экспериментах мы всегда открывали дверцу У па двух ящиках и дверцу X на одном Может быть, нам нужно проверить нечто другое. Например, может быть, нам стоит посмотреть, что про- изойдет, если мы откроем одни и те же дверцы на всех грех ящиках. Мы могли бы [гроверить открытие трех X-дверок Бов: Да ну! Мне надоели эти три ящика. Мы уже все о них знаем. Пора двигаться дальше, и, я думаю, Диана уже готова нам помогать Давайте перейдем к четырем ящикам! Алиса: Нет, я считаю, что Чарли прав. Мы действительно не можем ска- зать, что мы все знаем о трех ящиках, пока не поэкспериментируем с другими способами открывания дверок. Боб: Забудьте об этом! Нас ни за что не финансируют. После того как мы вложили столько усилий в открывание двух У-ов и одной X, мы ска- жем, что теперь мы хотим открывать три X. Нам скажут, что сначала вы занимались ерундой, а теперь вы предлагаете заняться чепухой. Да нас просто поднимут на смех. Алиев: Боб прав. Я думаю, что только одним способом мы сможем по- лучить финансирование этого эксперимента, если мы сможем сде- лать предсказание относительно его исхода. Тогда мы сможем ска- зать, что выполняем эксперимент для проверки предсказания. Я слы- шала о неких теоретиках, Гринбер1ере, Горне, Цайлингере и Мермине (ГГЦМ). Они мною размышляли о наших экспериментах с тремя ящи- ками; может, они смогут что-нибудь предложить. Боб: Ну, в этих ящиках вся моя жизнь, а они просто банда теоретиков. Сомневаюсь, что они скажут что-нибудь интересное или полезное. Но на самом деле не важно, имеет ли их теория какой-нибудь смысл, я поддерживаю это предложение. Если мы сможем проверить ее, то я даже соглашусь с тем, что есть смысл выполнить новый экспери- мент с тремя ящиками.
4.6. Многокомпонентное запутывание 199 Итак, Алиса, Боб и Чарли совершают путешествие, чтобы познако- миться с ГГЦМ. И, несмотря на глубокий скептицизм Боба, IГЦМ дей- ствительно делают очень интересное предложение. ГГЦМ: Боб говорит, что, открывая ящики в Принстоне и в Чикаго, никак не возможно повлиять на то, что происходит, когда Алиса открывает ящик в Пасадене Ну, допустим, что он прав. Теперь вы, парни, отправ- ляетесь выполнять эксперимент, в котором вы все открываете X-двер- цы. Никто не может сказать, что из этого получится, но мы можем рассуждать следующим образом: предположим, что если бы вы откры- ли три У-дверцы, то обнаружили бы три белых шара. Тогда можно использовать аргументы Боба, чтобы понять, что если вместо этого вы откроете три X-дверцы, то найдете три черных шара. Это аналогич- но такому рассуждению: если Алиса открывает X, а Боб и Чарли от- крывают У, тогда вы знаете наверняка, что количесгво черных шаров будет нечетным. Следовательно, если вы знаете, что Боб и Чарли, от- крыв дверцы У, нашли по белому шару, то Алиса найдет черный, когда откроет дверцу X. Аналогично, если Алиса и Чарли, О1крыв дверцы У, нашли по белому шару, то Боб найдет черный, когда откроет двер- цу X. Наконец, если Алиса и Боб, открыв дверцы У, нашли по белому шару, то Чарли должен найти черный, когда откроет дверцу X. Итак, мы видим, что1 УаУвУс = ООО ХАХВХС = Ш. (4.114) Не так ли? Боб: Ну, возможно, это достаточно логично, но насколько это полезно? Мы не знаем, что обнаружим внутри ящика, пока не откроем его. Вы предположили, что УдУ^Ус — ООО, но мы никогда не знаем это зара- нее. ГГЦМ: Безусловно, но подождите. Да, вы правы, что мы не можем знать заранее, что мы найдем, если откроем дверцу У на каждом ящике. Но для трех ящиков имеется только восемь возможностей, и мы можем легко их все перечислить. А для каждой из этих восьми возможностей для УАУВУС мы можем использовать те же рассуждения, что и рань- ше, чтобы сделать вывод о значении ХАХВХС. Мы получаем таблицу 'Здесь 0 обозначает белый шар, а 1 — черный, УА означает то, что находи г Алиса, когда открывает дверцу У на своем ящике, и так далее.
200 Глава 4 типа этой: YAYBYC = 000 XAXBXC = 111 Ya^bYc 001 —* XAXBX^; = 001 ^AYbYc — 010 —> XAXBXC = 010 УдУвУс = 100 -> xAxBxc = 100 yaybyc. = 011-’ XAXBXC = 100 YaYbYc = 101 -> XAXBXC = 010 УдУвУс 110-> xAxBxc = 001 yaybyc -\ll-+XAXBXc - Ill (4.115) Боб: Хорошо, ну и что? ГГЦМ: Есть нечто замечательное в этой таблице, Боб! Взгляни на значе- ния ХАХВХС... Каждое из них имеет нечетное количество единиц. Это и есть наше предсказание. Когда вы все будете открывать двер- цу X на ваших ящиках, вы всегда будете находить нечетное количество черных шаров! Может быть один, может быть три, но всегда нечетное количество. Конечно же, Алиса, Боб и Чарли восхищены проницательностью ГГЦМ. Они предложили продолжить эксперимент, который был одобрен и щедро профинансирован. Наконец, наступает долгожданный день, когда они в первый раз выполняют эксперимент И когда Алиса, Боб и Чарли, каждый, открывает дверцу X па своем ящике, можете ли вы угадать, что они обнаруживают? Три белых шара. Вах!!! Подозревая ошибку, Алиса, Боб и Чарли очень тщательно повторяют эксперимент, снова и снова, и снова... Но в каждом испытании, всякий раз, они находят четное количество черных шаров, когда они открывают двер- цу X на всех трех ящиках. Иногда — ни одного, иногда — два, но нико- гда один, и никогда — три. То, что они обнаруживали, всегда было прямо противоположно тому, что предсказывали ГГЦМ, исходя из принципа эйн- штейновской локальности! Снова отчаяние приводит жаждущих просвещения Алису, Боба и Чар- ли в библиотеку. После некоторого изучения учебника по квантовой меха- нике и основательного допроса сотрудника лаборатории Алисы они пони- мают, что их три ящика были приготовлены в квантовом ГГЦМ-состоянии: \^)авс = ~U(|000)abg' + две-)’ (4.116) V £
4,6. Многокомпонентное запутывание 201 ян.1яющемся одновременно собственным состоянием трех наблюдаемых Z^ Zjj с*? 1^, cg> Zg ® Z^-, Хд ® Хд ® Хс (4.117) с единичным собсгвенным значением. А так как ZX = z'Y, они понимаю!, что это состояние обладает свойствами:1 Уд» YB ®ХС - -1, X^^YpijjY^ — —1, Y ®x\y - 1 (4-П8) хл ® Х^ "^С ~~ • Открывая ящик с помощью дверцы X или дверцы У, Алиса, Боб и Чар- ли выполняют измерение наблюдаемых X' или Y, результат которого +1 означает белый шар, а результат —1 — черный шар. Таким образом, если приготовлено трехкубитовое состояние (4.116), то уравнение (4 118) гово- рит, что нечетное количество черных шаров буди обнаруживаться, если дверца Y открывается на двух ящиках, а дверца X — на третьем, в то вре- мя как четное количество черных шаров будет обнаруживаться, если на всех грех ящиках открывается дверца X. Это поведение, недвусмыслен- но предсказываемое кван товой механикой, именно то, что казалось таким обескураживающим Алисе, Бобу и Чарли и их консервативным собратьям, приверженцам эйнштейновской локальности. После дополнительного шубокого изучения учебника по квантовой ме- ханике Алиса, Боб и Чарли постепенно приходят к пониманию изъяна в их рассуждениях. Они знакомя гея с принципом дополнительности Бора, прин- ципом непримиримой несовместимости некоммутирующих наблюдаемых. Они поняли, что для тою чтобы прийти к своему предсказанию, они долж- ны были постулировать результат измерения YYY, а затем делать заклю- чение о результатах измерения XXX. Пренебрегая требующими серьезно- го отношения предостережениями Нильса Бора, они пали жертвой самого пагубного заблуждения. Как они и надеялись, эксперимент с тремя ящиками принес дальней- шее признание Алисе и Бобу, а также должность Чарли. Конечно, экспе- римент с тремя монетами уже убедительно опроверз эйнштейновскую ло- кальность; несмотря на это, эксперимент с тремя ящиками имел другой характер. В эксперименте с монетами Алиса и Боб могли открыть только 'Здесь используются обозначения Хл — сг1Л\ YB = <7gB1 и так далее. Равенства в уравнении (4.118) следует понимагь как символические. Они обозначают, что (4.116) яв- ляется собсгвенным состоянием соответствующих наблюдаемых с собственными значения- ми — Прим. ред.
202 Глава 4 две из трех монет, обнаруживая любую из четырех возможных конфигу- раций: 00, OP, РО, РР. Лишь выполнив множество испытаний, они смогли накопить убедительные статистические доказательства нарушения неравен- ства Белла. В противоположность этому в эксперименте с тремя ящиками Алиса, Боб и Чарли нашли результат, не согласующийся с эйнштейновской локальностью в каждом отдельном испытании, в котором они открывали дверцу X на всех трех ящиках! 4.7. Упражнения 4.1. Теорема Харди. Боб (в Бостоне) и Клер (в Чикаго) делят множество идентично приготовленных копий двухкубитового состояния |V) 71 - 2х |00) + у/х |01) 4 v^|10), (4.119) где х — вещественное число, лежащее между 0 и 1/2. Они проводят множество испытаний, в которых каждый измеряет свой кубит в ба- зисе {|0), |1)}, и узнают, что если результатом Боба является |1), то результат Клер всегда |0), а если результатом Клер является |1), тогда у Боба всегда [О). Боб и Клер проводят дальнейшие эксперименты, в которых Боб вы- полняет измерение в базисе {|0), ]1)}, а Клер — в ортонормированием базисе {|^)5 Они обнаруживают, что если результат Боба |0), то результатом Клер всегда является |<р) и никогда - Аналогично, если Клер измеряет в базисе {|0), 11)}, а Боб - в базисе {|<р), |/^)}, тогда если результат Клер |0), то результатом Боба всегда является |</?) и никогда — |у7). а) Выразить базис {|<^), |<дх)} через {|0>. |1)}. Теперь Боб и Клер интересуются, что произойдет, если они оба бу- дут измерять в базисе {|v)> Их друг Альберт, ярый сторонник локального реализма, предсказывает, что невозможно обоим получить результат |</А) (предсказание известное как теорема Харди). Альберт аргументирует это следующим образом. Когда Боб и Клер выполняют измерение в базисе {\р), имеет смысл рассмотреть, что могло бы случиться, если бы вместо этого кто-то один из них выполнил измерение в бази- се {|о>, |!)}.
4.7. Упражнения 203 Итак, предположим, что Боб и Клер оба измеряют в базисе {|</?), /} и что они оба получают результат I9?-1-). Теперь, если бы Боб вместо этого измерял в базисе {|О), |1)}, то мы могли бы быть уверены в том, что его результат — 1так как эксперимент показывает, что если бы Боб получил |0), то Клер нс могла бы получить ). Аналогично, если бы Клер измеряла в базисе {|0), |1)}, то она наверняка получила бы результат |1). Мы приходим к выводу, что если бы Боб и Клер оба измеряли в базисе {|0}, (1)}, то они оба получили бы ре- зультат |1). Но это противоречит эксперименту, который пока- зывает, что если Боб и Клер оба выполняют измерение в бази- се {|0>, 11)то невозможно им обоим получить результат 11). Следовательно, мы вынуждены сделать вывод, что если Боб и Клер измеряют в базисе {1^ |уА)}, то они не могут одно- временно получить результат | Несмотря на впечатляющую аргументацию Альберта, Боб и Клер ре- шают исследовать, какое предсказание может быть получено из кван- товой механики. а) Если Боб и Клер оба измеряют в базисе {|у>), |у>х)}, каково кван- тово-механическое предсказание для вероятности Р(х) того, что они оба получат результат |у^)? Ь) Найдите «максимальное нарушение» теоремы Харди: покажите, что максимальным значением Р(х) является — лД>)/2] = = (5у/5-11)/2» 0,0902. с) Боб и Клер проводят эксперимент; подтверждающий предсказание квантовой механики. Что ошибочно в рассуждениях Альберта? 4.2. Закрытие лазейки детектирования. Напомним, что неравенство КГШХ + {a'b} + {ab1} - 2 (4.120) справедливо, если случайные переменные а, а', Ь1 принимают зна- чения ±1 и подчиняются совместному распределению вероятностей. Максимальное нарушение этого неравенства квантово-механическими предсказаниями имеет место, когда левая часть равна 2-/2, что до- стигается, когда Алиса и Боб делят максимально запутанное состоя- ние \Фfа, а1 — результаты измерения кубита Алисы вдоль осей х
204 Глава 4 и z, а Ь, Ь1 — результаты измерения кубита Боба вдоль осей (г £)/V2 и (i - г)/з/2. Алиса и Боб выполнили замечательный эксперимент, измерив поля- ризацию запутанной фотонной пары и подтвердили предсказываемое квантовой механикой нарушение неравенства КГШХ Альбер г настро- ен скептически. Он обращает внимание на то, что используемые в их эксперименте детекторы не очень эффективны. По большей части, ес- ли Алиса регистрирует фотон, то Боб — нет, а если Боб регистри- рует фотон, то Алиса - нет. Следовательно, они отбрасывают дан- ные для большинства фотонных пар и оставляют результаты толь- ко при совпадении детектирования двух фотонов. В своем анализе данных Алиса и Боб предполагают, что их результаты основаны на репрезентативной выборке измеряемых наблюдаемых, подчиняющих- ся некоторому распределению вероятностей. Однако Альбер ! доказы- вает, что их выводы могут оказаться недостоверными, если состоя- ние детектируемого фотона скоррелировало с результатом измерения поляризации. Алиса и Боб интересуются, насколько им необходимо поднять эффек- тивность детекторов, чтобы выполнить эксперимент, который убелит Альберта. Алиса может ориентировать свой детектор вдоль любой оси, и если она направила ею вдоль оси а, то в идеале ее детектор будет щел- кать, когда спин ес кубита направлен вверх вдоль оси а, но ввиду неэффективности детектора ищи да он не срабатывает, даже если ку- бит ориентирован вверх. Пусть теперь для каждого номера i фотон- ной пары. гсг е {0,1} - переменная, обозначающая сработал ли де- тектор Алисы, ориентированный вдоль оси а, а именно, если щелчок был, то х, - i, а если ист, то хг = 0. Поскольку детектор неидеаль- ный, то хг может быть равно нулю, даже если кубит ориентирован вверх вдоль а. Аналогично г' € {0,1} обозначает, сработал ли де- тектор Алисы, ориентированный вдоль оси а!, уг е {0,1} обозначает, сработал ли детектор Боба, ориентированный вдоль b, a y't € {0,1} обозначает, сработал ли детектор Боба, ориентированный вдоль о. В предположении локального реализма каждой паре можно сопоста- вить значения х, х1, у, у', определяемые локальными скрытыми пере- менными. Алиса и Боб свободны в выборе ориентации своих детекторов в каж- дом измерении; следовательно, их выборка значений х, х', у, у' рспре-
4.7. Упражнения 205 зентагивяа и они выводят из своих измерений следующие значения: N » =- jV 13^’ 1=1 JV p.^) ‘ *T <4J21> P4 I №') i.-l i= 1 где .V полное количество испытанных пар. Здесь, например, Р4 4 (ab) - вероятность того, что оба детек юра сработают, когда Али- са и Боб ориентируют их вдоль осей а и Ь, соответственно (с учетом влияния несовершенства детекторов). а) Покажите, что если х, х',у. у' С {0,1}, то ху + ху’ 4- х'у — х'у* S1- х f- у. (4.122) Ь) Покажите, что Р^+(аЬ) 4- Р_+(«'£>) + Р_ , («И — ~Л4(аТ/)<.Р+.(а) + Р+(Ь); (4J 23) здесь /4.(а’| обозначает вероятность того, что детектор Алисы щелкнет, если он ориентирован вдоль оси а, а ^.+(Ь) обозначает вероятность того, что детектор Боба щелкнет, если он ориентиро- ван вдоль оси Ь. с) Теперь сравним это с предсказаниями квантовой механики, где де- тектор Алисы имеет эффективность ул, а детектор Боба — т?в. Это означает, что детектор Алисы щелкает с вероятностью Р = - r/APperf> ’’4е -Рре1:Г — вероятность щелчка идеального детекто- ра, и аналогично для детектора Боба. Выбирая а, Ъ, а',Ь' макси- мально нарушающими неравенство КГШХ, покажите, что пред- сказания квантовой механики нарушают неравенство (4.123), если только > —1—. (4.124) 1 + У?
206 Глава 4 Таким образом, если т/л = т/н, то Алисе и Бобу необходимы де- текторы с эффективностью выше 82.84%, чтобы преодолеть воз- ражения Альберта. 4.3. Телепортация с помощью непрерывных переменных. Один полный ортонормированный базис в гильбертовом пространстве двух частиц на вещественной прямой представляет собой базис (сепарабельных) собственных состояний оператора положения {|д2) ® 1<7з)}- ДРУГОЙ - запутанный базис {Q, Р)}, где |Q,P) = -4= [dq PPq\q)®\q + Q); (4 125) они являются одновременными собственными состояниями оператора омюситсльного положения Q = — Qi и оператора полного импуль- са Р = Pt 1 р2. а) Проверьте, что (Q'; P'|Q, Р) = - Q)6(P' - Р). (4.126) b) Поскольку состояния {|Q, /’)} образуют базис, мы можем разло- жить собственные состояния положений как dQdP\Q!P){Q,P\{\q1)^\q7}). (4.127) ВьЕчислите коэффициенты разложения (Q, P|(|?i) ® - с) Алиса и Боб приготовили запутанное состояние |Q, Р}Лц двух ча- стиц А и В; Алиса оставила себе частицу .4, а Боб — частицу В, Алиса получила неизвестный волновой пакет |^)с = с(д|^)с’ который она намерена телепортировать Бобу. Составь- те протокол, который они могут выполнить, чтобы осуществить телепортацию. Что должна измерить Алиса? Какую информа- цию она должна послать Бобу? Что должен сделать Боб, получив эту информацию, чтобы частица В была приготовлена в состоя- нии |^)в? 4.4. Телепортация со смешанными состояниями. Операциональный спо- соб определения запутанного состояния заключается в том, что оно мо- жет быть использовано для телепортации неизвестного квантового со- стояния с лучшей точностью воспроизведения, чем этого можно было бы добиться с помощью одних только локальных операций и классиче- ской связи. В этом упражнении вы покажете, что существуют смешан- ные состояния, в этом смысле запутанные, но тем не менее не нару- шающие никакого неравенства Белла. Следовательно, для смешанных
4.7. Упражнения 207 состояний (в противоположность чистым состояниям) понятия «запу- танный» и «нарушающий неравенство Белла» не эквивалентны. Рассмотри ie «шумящую» запутанную пару с матрицей плотности р(А) = (1 - А^Ж | + |1. (4.128) а) Найдите точность воспроизведения F, которой можно достичь, ес- ли состояние р(А) используется для телепортации одного кубита от Алисы к Бобу. [Указание. Вспомните, что вы показали в од- ном из предыдущих упражнений, что «случайное гадание» имеет точность воспроизведения F — 1/2.] Ь) При каких значениях А найденная в (а) точность воспоизведе- ния лучше той, которой можно добиться, если Алиса измеряет свой кубит и посылает Бобу классическое сообщение? [Указа- ние. Раньше вы показали, что можно достичь значения F - 2/3, если Алиса измеряет свой кубит. Фактически это наилучшее воз- можное значение F, достижимое в классической связи.] с) Вычислите Prob( ) = tr (EA(n)EB(m)p(A)), (4.129) где ЕЛ(п) — проекция кубита Алисы на состояние f fft), a — проекция кубита Боба на состояние | ( d) Рассмотрите случай А = 1/2. Покажите, что в этом случае состоя- ние р(А) не нарушает неравенства Белла. [Указание. Достаточно построить модель локальных скрытых переменных, которая при А = 1/2 корректно воспроизводит найденные в (с) спиновые кор- реляции.] Предположите, что скрытая переменная d однородно распределена на единичной сфере и что существуют функции fA и fB такие, что prob.,i j<j = Л(о'й)-. РгоЬв(]Л )-/в(а-т). (4.130) Задача состоит в том, чтобы найти /А и fB (где 0 fA в С 1), обладающие свойствами & & У fA(& m) Prob( )• (4 131)
208 Глава 4 4.5. Распределение квантового ключа. Алиса и Боб хотят выполнить протокол распределения квантового ключа Алиса имеет все необходи- мое, чтобы приготовить любое из двух состояний. |w) или |о). В под- ходящем базисе эти два состояния могут быть представлены как , , zcosax , , (sina\ )’ v b <4-I32> \sina/ ^cosa / где 0 < о < тг/4. Алиса выбирает наугад, что послать Бобу, |и) или ]г>}, а Боб должен выполнить измерение, чтобы определить, что она посла- ла. Так как эти два состояния не ортогональны, Боб не может разли- чить их с абсолютной точностью. а) Боб понимает, что он не может рассчитывать на то, что всякий раз он сможет идентифицировать кубит Алисы, поэтому он доволь- ствуется процедурой, которая лишь иногда обеспечивает успех. Он выполняет ПОЗМ с тремя возможными исходами. -,[«), ши НЕ ЗНАЮ Если он получает результат ->|м), он уверен, что было послано [и), а если он получает результат -i|n), он уверен, что было послано |и). Если получен результат НЕ ЗНАЮ, тхида его измерение неубедительно (не позволяет сделать определенно- го вывода). Эта ПОЗМ определяется операторами F - А(1 - ММ), F -= 4(1 - |#|), FDK = (i-2A)i + A(MM + MH) (DK - Don’t Know - НЕ ЗНАЮ), где А -- положительное ве- щественное число. Какое значение А должен выбрать Боб, чтобы минимизировать вероятность результата НЕ ЗНАЮ, и чему равна эта минимальная вероятность НЕ ЗНАЮ (при условии, что Алиса выбирает М или1и) с равной вероятностью)? [Указание. Если А слишком велико, то FDK будет иметь отрицательные собственные значения, а уравнения (4.133) не будут представлять ПОЗМ.] Ь) Разработайте протокол распределения квантового ключа, используя исходные данные Алисы и ПОЗМ Боба. с) Конечно, Ева тоже хочет знать, что Алиса посылает Бобу. Надеясь на то, что Алиса и Боб не заметят, она перехватывает каждой посылаемый Алисой кубит, выполняя ортогональное измерение, проецирующее его па базис {(J) , (°)}. Если она получает ре- зультат (о), то она пересылает Бобу |w), а если - (j), то пересы- лает ему |н) Следовательно, всякий раз, когда ПОЗМ Боба имеет
4.7. Упражнения 209 убедительный результат. Ева знает, каков он. Но вмешательство вызывает обнаруживаемые ошибки; иногда Боб получает «убеди- тельный» результат, который на самом деле отличается от того, что посылала Алиса. Какова вероятность такой ошибки? 4.6. Минимальное возмущение. В упражнении 2.1 вы исследовали игру, в которой Алиса решает наудачу (равновероятно), какое чистое состо- яние одного кубита при, отопить из двух возможных: ... /еобол /sina\ W) - ( . 1 или v) = I I, (4.134) V sin а ) \ cos а/ и посылает это состояние Бобу. Выполняя ортогональное измерение в базисе {|0)„ |1)}, Боб может идентифицировать состояние с мини- мальной вероятностью ошибки (terror Optimal —Sin2 О -= |(1 - 8Ш 0), (4.135) где мы определили в соотношением (V’lv) — cost? - sin(2a). (4 136) Но допустим теперь, что Ева хочет перехватить это состояние, пока оно движется от Алисы к Бобу. Как и Боб, она желает извлечь опти- мальную информацию, отличающую |ф) от \ф), и при этом миними- зировать вносимое ее вмешательством возмущение, гак чтобы Алисе и Бобу было невозможно заметить, что здесь что-то не так. Ева понимает, что оптимальную ПОЗМ можно осуществить с помо- щью операторов измерений Мо—|<эо)(О|, = 1^(11 (4.137) с произвольными векторами |<р0) и |00. Если Ева выполняет это изме- рение, то Боб получает состояние р' = со82«|Ф0)(Ф0| +sin2a|<p1)(^1|, (4.138) если Алиса послала |^), и состояние р' = sin2 о.|ф0)(<р0|-f-cos2 (4.139) если Алиса послала |с’).
210 Глава 4 Ева хочет, чтобы средняя точность воспроизведения получаемого Бо- бом состояния была как можно больше. Величина, которую она хочет минимизировать, называемая в дальнейшем «возмущением» D, изме- ряет; насколько близка к единице эта средняя точность воспроизведе- ния 1 Z>=l-i(F + F), (4.140) где _ (4.141) Целью этого упражнения является проверить, насколько эффективно Ева можеть сократить возмущение с помощью подходящего выбора своих измерительных операторов. а) Покажите, что F + F может быть представлено в виде F + F- {ф0\А\ф0} у ШВ|М (4.142) где . ( 1 — 2 cos2 a sin2 a cos a sin а \ А — I . л 9 . > , V cos a sin а 2 cos” si п о I /„2.2 - X (4Л43> D [2 cos a sin а cos a sm а \ тГ5 - ( . < г-» 9 * 2 1 - у cos a sin а 1 — 2 cos"1 a sin а у Ь) Покажите, что если |<^0) и 1^) выбраны оптимально, то минималь- ное возмущение, которое может быть достигнуто, равно Dmin(cos2 в) = - (1 - \/1 - cos2 в + cos4 й). (4.144) [Указание. Мы можем выбрать |</>0) и 1^), чтобы независимо максимизировать два слагаемых в уравнении (4.142). Максималь- ным значением является максимальное собственное значение опе- ратора А, которое может быть выражено как Атах — |(1 | + х/1 — 4det Л), поскольку сумма собственных значений равна единице.] Конечно, Ева могла бы сделать возмущение еще мень- шим, если ее устроит меньшая, чем оптимальная, вероятность правильного определения сообщения Алисы. с) Изобразите график функции Dmin(cos20). Истолкуйте ее значения при cos 0 = 1 и cos в = 0. При каком значении 0 максималь- на? Найдите FTriir, и (perror)op[imai для этого значения в.
4.7. Упражнения 211 4.7. Приближенное клонирование. Теорема о невозможности клонирова- ния показывает, что невозможно построить унитарную машину, кото- рая будет делать идеальные копии неизвестного квантового состояния. Но допустим, что пас устроит неидеалъная копия — какой точности воспроизведения мы можем добиться? Рассмотрим машину, действующую на трехкубитовое состояние в со- ответствии с |000) лвс -* 1]°0)аВС АВ |0)с- (4.145) а) Является ли такой прибор в принципе физически реализуемым? Если машина действует на начальное состояние \ф}А |00)вс, то она производит чистое запутанное состояние трех куби- тов |Ф)авс- Н° если МЬ[ наблюдаем один только кубит Л, то его конечным состоянием является оператор плотности р'А — — trBC (I^Jabc abcC^I)- Аналогично конечным состоянием от- дельно наблюдаемого кубита В является р'в. Нетрудно видеть, что р'А — р'в - идентичные, но не идеальные копии исходного чистого состояния |^)А. Ь) Отображение начального состояния |-0)л А{ф\ кубита А на конеч- ное состояние р'л определяет супероператор $. Найдите его пред- ставление операторной суммы. с) Найдите р'А для |^)А = а|0)л + (>|1)А и вычислите его точность воспроизведения F = А МРаМа- 4.8. Прости нас, дядюшка Альберт. Рассмотрим n-ку битовое «кот-состо- яние» -1(|000...0> + 1111...1)). (4.146) Это состояние можно охарактеризовать как одновременное собствен- ное состояние (с единичным собственным значением) п операторов сг3 ® сг3 + 1 ® 1 + • • ® 1 ® 1 ® 1, 1®СТз®ст3®1®---®1®1®1, (4.147) <т3, О’ 1 ® <7 ® CTj ® ® СТ-J ® <Tj ® <7l.
212 Глава 4 а) Покажите, что |^)п является собственным состоянием оператора (<7Х 4- гст2)^п ь (o-j - гст2)®п, (4.148) и вычислите его собственное значение. Ь) Нели мы верим в локальные скрытые переменные, тогда мы ве- рим, что для каждого из n-кубитов ert и сг2 имеют определенные значения, коль скоро скрытые переменные определены. Если что гак, то что можно сказан» относительно модулей (aj + i<r2)Sn или (crL - предполагая определенные значения скры тых переменных? с) Из (Ь) выведите верхнюю границу для 11^4 мг2)®”4 (4.149) следующую из гипотезы о локальных скрытых переменных. d) Сравните это с (а). Что сказал бы Эйнштейн? 4.9. Манипулирование запутыванием, а) Двадцать пять игроков коман- ды Янки из Нью-Йорка и двадцать пять игроков комады Святых Отцов из Сан-Диего хотят разделить пятьдесят кубитов «кот-со- стояния». Янки готовят 26-кубитовос «кот-состояние» и дают один из кубитов Алисе; то же делают и Святые Отцы. Теперь Алиса должна соединить эти и приготовить 50-кубитовос состоя- ние. Как ей это сделать? [Указание. Подумайте о стабилизаторе.] Ь) Присоединившись к Янки, Алиса приняла на хранение один из ку- битов их 25-кубитового «кот-состояния» Но се подкупили! Алисе поручено извлечь имеющийся у ней кубит из «кот-состояиия», со- хранив неповрежденным 24-кубитовое состояние остальных иг- роков. Как ей это сделать? [Указание. Подумайте о стабилизато- ре.] 4.10. Критерий Переса — Городецки в d измерениях. Напомним, что со- стояние Вернера пары кубитов может быть представлено как р(А)-А|<Ж^+!+1(] — А)1 (4.150) и что частичное транспонирование pAg парного оператора плотно- сти рА)) определяется как Рав = (1д Тв)рлв, (4.151)
4.7. УПРАЖНЕНИЯ 213 где Т - операция транспонирования, действующая в базисе {|г}} как T(WO'I) = М- (4-152) На лекции мы видели, что частичное транспонирование состояния Верпсра р(А) отрицательно при А > 1/3; следовательно, соглас- но критерию Переса-Город ецки состояние Вернера несепарабельно при А > 1/3. а) Естественный способ обобщения состояния Вернера на пару d-мер- ных систем — рассмотреть Рф(А)-А|Ф)(Ф|-Ь (4.153) где |Ф) - максимально запутанное состояние d 1ф> - -Т=ЕЮ®10- (4.154) V^.i Покажите, что (|Ф)(Ф1)рт-1(1-2Еаг;Шут), (4.155) где Eantlsym — проектор на пространство, антисимметричное от- носительно перестановки двух систем: А и В. Ь) При каких значениях А частичное транспонирование рф(А) отрица- тельно? с) Если состояние Вернера двух кубитов выбрано в виде p(A)-A|V> >(^“| + 1(1 - А)1, (4.156) тогда другой естественный способ обобщить состояние Вернера на пару d-мерных систем — рассмотреть PantlW “ d(frй+ ' А)г <4-157> При каких значениях А частичное транспонирование pantl(А) от- рицательно?
Глава 5 Теория квантовой информации Теория квантовой информации настолько обширный предмет, что вполне могла бы занимать пас весь семестр. Но вследствие недостатка времени (мне не терпится перейти к квантовым вычислениям) я не смогу осветить этот предмет так глубоко, как мне бы этого хотелось. Мы удоволь- ствуемся отрывочным введением в некоторые основные идеи и результа- ты. Возможно, лекции будут носить более описательный характер, нежели в первом семестре, с более частыми рассуждениями на пальцах и с боль- шим количеством деталей, оставленных для домашних упражнений, Веро- ятно, эту главу следовало бы назвать: «Теория квантовой информации для нетерпеливых» *. Теория квантовой информации имеет дело с четырьмя главными тема- ми. (1) Передача классической информации по квантовым каналам связи (бу- дет обсуждаться). (2) Компромисс между получением информации о квантовом состоянии и его возмущением (этот вопрос мы кратко обсуждали в главе 4 в связи с квантовой криптографией, но здесь разберемся с ним основательно). (3) Количественная характеристика квантового запутывания (которой мы кратко коснемся). (4) Передача квантовой информации по квантовым каналам связи. (Мы об- судим случай канала без помех, отложив обсуждение капала с помеха- ми до тех пор, пока не познакомимся с квантовыми корректирующими кодами.) Эти темы объединяет часто повторяющийся лейтмотив: интерпретация и применения энтропии фон Неймана. 1Читателю, интересующемуся более строгим математическим изложением основных ре- зультатов квантовой теории информации, можно порекомендовать книгу А.С. Холево, Beetle иие в квантовую теорию информации, МЦНМО, М.: 2002; более подробное изложение теории классической и квантовой информации иа физическом уровне строгости можно найти в книге М.А. Nielsen, l.L. Chuang, Quantum Computation and Quantum Information, Cambridge University Press, 2001; перевод нерусский язык M. Нильсен, И. Чанг, Квантовые вычисления и квантовая информация, М.: Мир, 200(1. — Прим реп
5.1. Шеннон для «чайников» 215 5.1. Шеннон для «чайников» Прежде чем мы сможем понять энтропию фон Неймана и ее значение для квантовой информации, мы должны обсудить энтропию Шеннона и ее значение для информации классической. В своей основополагающей статье 1948 г. Клод Шеннон установил два основных результата теории классической информации. Им были решены две центральных проблемы. (1) Насколько можно сжать сообщение, то есть насколько избыточна ин- формация? («Теорема кодирования без помех») (2) С какой скоростью мы можем надежно передавать сообщения по ка- налу с помехами; то есть насколько избыточным должно быть содер- жание сообщения, чтобы быть защищенным от ошибок? («Теорема ко- дирования для канала с помехами (шумом)».) Оба вопроса касаются избыточности — насколько, в среднем, неожи- данна следующая буква сообщения. Согласно одной из ключевых идей Шеннона, удобную количественную меру избыточности предоставляет эн- тропия Я назвал этот раздел «Шеннон для чайников», поскольку я попытаюсь быстро объяснить основные идеи Шеннона с минимальным количеством е-ов и <)'. Таким образом, я смогу втиснуть теорию классической информа- ции примерно в двенадцать страниц. 5.1.1. Энтропия Шеннона и сжатие данных Сообщением называется строка из букв, выбранных из содержащего к букв алфавита {а1} (5.1) Предположим, что буквы ах в сообщении статистически независимы и каждая из них появляется с заданной a priori вероятностью р(аж), где 52*=t = 1. Простейшим примером служит двоичный алфавит, в котором 0 появляется с вероятностью 1 — р, а 1 — с вероятностью р (где 0 < р sj 1) Рассмо1рим длинные, содержащие п букв (п 1), сообщения. Нас интересует, можно ли сжать сообщение до более короткой строки, несущей, по существу, ту же информацию?
216 Глава 5 Согласно закону больших чисел при очень больших п типичные стро- ки содержат (в двоичном случае) примерно п(1 —р) нулей и примерно пр единиц. Количество различных строк такого типа (типичных строк) по по- рядку величины равно биномиальному коэффициенту ) и из формулы Стирлинга log n! ~ nlogn — п + O(logn) мы получаем f п \ / Л-1 1 log = log -— ----------------гтт zzlog/z - п - упру \\пру.\п{1 — р)\\ I — [nplognp — пр + п(1 — р) logrt(l - р) — п(1 — р)] = = пЯ(р), (5.2) где Я(р) = -plogp- (1 -p)log(l -р) (5.3) - функция, называемая энтропией. Следовательно, количество типичных строк имеет порядок 2пН^р\ (Лотарифмы здесь понимаются по основанию два, если не оговаривается иное.) Чтобы передать, по существу, всю информацию, переносимую стро- кой из п битов, достаточно выбрать блоковый код, присваивающий поло- жительное целое число каждой типичной строке. Этот блоковый код имеет около 2п11''р> слов (появляющихся с a priori одинаковой вероятностью), так что любое из них мы можем идентифицировать, используя двоичную стро- ку длиной пН (р) Поскольку 0 II (р) 1 при О^р^1и/Г(р) — 1 только при р - 1/2, блоковый код сокращаег сообщение при любом р~/1/2 (когда О и 1 не равновероятны). Это результат Шеннона. Главная идея заключа- ется в том, что нам не нужно кодовое слово для каждой последовательно- сти букв, а только для типичных последовательностей. Вероятность тою, что действительное сообщение атипично, асимптотически (то есть в преде- ле п —» оо) мала. Это рассуждение очевидным образом обобщается на случай к букв, когда буква х появляется с вероятностью р(г).1 В строке, содержащей п букв, х обычно возникает приблизительно пр(х) раз, а количество типич- ных строк имеет порядок ______________о«н(.Х) 1 Ансамбль, в котором каждая из п букв извлекается из распределения X, будет обозна- чаться как Л’1.
5.1. IUl hhoh для «чайников» 217 где мы вновь воспользовались асимптотической формулой Стирлинга, а Н(Х) = - logp(x) (5.5) Ж - энтропия Шеннона (или просто энтропия) ансамбля X — {х, р(х)}. Вы- бирая блоковый код, присваивающий целые числа типичным последова- тельностям, можно сжать до пН(Х'\ битов информацию, содержащуюся в строке из п букв, В этом смысле выбранная из ансамбля буква х несет в среднем Н(Х) битов информации. Это рассуждение полезно переформулировать на несколько ином язы- ке. Отдельное n-буквенное сообщение Х1 х2 ... хп (5.6) возникает с вероятностью, a priori равной РО1 х2 ... хп) = р(х^р{х<2) -р(хп), (5.7) logP^! х2 .., хп) = logp(xt), (5.8) г=1 Применяя к этой сумме центральную предельную теорему, мы приходим к выводу, что для «большинства последовательностей» -^logP(x, х2 ... xn) ~ (-logp(x)} = Н(Х), (5.9) где угловые скобки обозначают среднее значение по распределению веро- ятностей, управляющему случайной переменной х. Конечно, на языке s-ов и <5 можно дать точную формулировку этого утверждения. Для любых f. J > 0 и для достаточно больших п каждая «типичная последовательность» имеет вероятность Р, удовлетворяющую неравенству Н(Х) -ё<-± logP^ х2 ... хп) < ЩХ) I б, (5.10) а суммарная вероятность всех типичных последовательностей превышает 1 - г.’ Или, другими словами, каждая из последовательностей букв, воз- никающих с превосходящей 1 — £ суммарной вероятностью («типичные ^Фактически это один из вариантов закона больших чисел. Его строгую математиче- скую формулировку можно найти в любом учебнике но теории вероятностей или в книю А. С. Холево, Введение в квантовую теорию информации, МЦНМО, М.: 2002. — Прим ред
218 Глава 5 последовательности»), появляется с вероятностью Р такой, что 9- п(Л р 2 (5.11) Из уравнения (5.11) можно вывести верхнюю и нижнюю грани для количе- ства N(s} 6) типичных последовательностей (так как сумма вероятностей всех типичных последовательностей должна лежать между 1 - г и едини- цей): (1 - e)2n<H-s'> N(e., <5) «г 2п(Нтй\ (5.12) С помощью блокового кода длиной пЩ | <5) битов мы можем зако- дировать все типичные последовательности. Тогда, независимо от того, как закодированы атипичные последовательности, вероятность ошибки (деко- дирования) будет меньпте, чем д. И наоборот, если мы попытаемся сжать сообщение до меньшего, чем Н—S', количества би гов на одну букву, то не сможем добиться малой частоты ошибок при п —» оо, так как будем не в состоянии однозначно при- своить кодовые слова всем типичным последовательностям. Вероятность успешного декодирования сообщения Раиссевв будет ограничена сверху FstIccess +£' = 2~п(-6'-^ f £Г. (5.13) Мы можем корректно декодировать только 2п(ы~6) типичных сообщений, каждое из которых возникает с вероятностью, меньшей чем 2 П|Эг- й) (р добавлена, чтобы учесть вероятность того, что нам удается корректно де- кодировать атипичные сообщения). А так как 6 может быть выбрана сксыь угодно малой, го при п -» оо малой становится и эта вероятность успеха. Таким образом, оптимальный код асимптотически сжимает каждую букву до Н (А) битов. Это и есть теорема Шеннона о кодировании в от- сутствии шума. 5.1.2. Взаимная информация Энтропия Шеннона Н{Х) количественно определяет, сколько в сред- нем информации передается буквой, извлеченной из ансамбля X. То есть сообщает, сколько (асимптотически при п —» оо, где п — количество извле- ченных букв) необходимо би гов, чтобы закодировать эту информацию. Взаимная информация 1(Х; У) количественно определяет степень кор- реляции двух сообщений. Как много мы узнаем о сообщении, извлеченном из Хп, прочитав сообщение, извлеченное из Уп? Допустим, например, что мы хотим послать сообщение от отправите- ля к получателю. Однако в канале связи имеется шум, так что полученное
5.1. Шеннон для «чайников» 219 сообщение (у) может отличаться от посланного (а;). Канал с шумом мож- но характеризовать условной вероятностью р(у|т) -- вероятностью того, что будет получено у, если послано х. Предположим, что буква х посы- лается с a priori известной вероятностью р(х). Мы хотим количественно определить, что мы узнаем об х, получив у; кавой объем информации мы приобретаем? Как уже говорилось, энтропия Н(Х) дает отнесенную к одной букве количественную меру моего априорного незнания сообщения до его по- лучения; то есть вам необходимо передать мне (без искажений) пИ би- тов, чтобы (асимптотически) точно определить конкретное сообщение из п букв. Но после ознакомления с сообщением у, я Moiy использовать теорему Бейеса, чтобы скорректировать распределение вероятностей для х: р у = —йу)—' 5'14 [Мне известны р[у|ж), если я знаком со свойствами канала, и р(х), ес- ли я знаю априорные вероятности появления букв; таким образом, я могу вычислить р(у) — 52р(у|.т)р(ж).] Благодаря приобретенному новому зна- нию я стал более осведомлен относительно х, чем ранее С полученными мной у-ми, используя оптимальный код, вы можете полностью определить конкретную строку из п букв, посылая мне Л(Х|У) = (-logp^ly)) (5.15) битов на каждую букву1. /¥(А"|У) называется «условной энтропией», Из p(xfy) = Р(&,У)/р(у) МЫ видим, что Д(Х|У) = (-logp(x,y) +logp(y)) - Н(X, У) - H(Y) (5.16) ‘Вряд ли следует понимать это утверждение в буквальном смысле. Для того, чтобы от- правитель мог восстановить посылаемую им «року из п букв X, он должен получать по параллельному каналу без шума информацию о каждой букве выходящею сообщения К и по нему же отправлять исправления, если произошла ощибка передачи. [См. С. Shannon, A mathemathical theory of communication, Bell System Techn. J., 27, №3, 379 423; №4, 623- 656 (1948). Русский перевод: К. Шеннон, Математическая теория связи, в книге К. Шеннон, Работы по теории информации и кибернетике, ИЛ, Москва (1063), стр. 243-332.] Скорее условную энтропию Н(Х|У) следует интерпретировать как количество информации, теряе- мой при передаче сообщения X через капал с шумом. Кроме этого, обратим внимание на то, что в (5-15), а также в уравнениях (5.16), (5.17) и (5.19), угловые скобки обозначают усреднение по совместному распределению вероятно- стей р(х, у). Следовательно все эти величины определяют информационные характеристики не конкретных «-буквенных строк, а всего совместного ансамбля входящих и выходящих со- общений. — Прим. ред.
220 Глава 5 и аналогично : /-log^\ ~ H(X,Y} - II(X). (5.17) \ PW / Таким образом, Н(Х|У) можно интерпретировать как количество дополни- тельных битов на одну букву, необходимых для полного определения .г и у при известном у. Очевидно, что эта величина не может быть отрицатель- ной. Информация об X, приобретаемая при знакомстве с У, измеряется тем, насколько сокращается отнесенное к одной букве количество битов, необ- ходимое для идентификации X при извсстпом Y. Таким образом; T(X;Y) = H(X)-H(X\Y) - - Н(Х) + Н(У) - Н(Х, У) = Н(У)-Я(У|Х). (5.18) Z(JV; У) называется взаимной информацией. Она, очевидно, симметрична относительно перестановки X и У; количество информации об X, полу- чаемое при знакомстве с У, равно количеству информации об У, получае- мому при знакомстве с X. Знакомство с У не может уменьшить мое зна- ние об X, следовательно, 1(X;Y) очевидно неотрицательна. (Неравенства Н(Х) H(X\Y) 0 легко доказываются с учетом свойства выпуклости логарифмической функции1.) Конечно, если X и Y полностью некоррелированы, то мы имеем р(аду) ^р(х)р(у) и /(Х;У) = /1ой4^^-\ = 0; (5.19) \ р(х)р(у} / естественно, что, знакомясь с У, мы ничего не можем узнать об X, если между ними пет корреляции! 5Л.З. Теорема о кодировании для капала с шумом Если мы хотим установить связь через канал с шумом, то мы, оче- видно, можем повысить надежность передачи посредством избыточности ]См., например, Т. М. Cover, and J. A. Thomas, Elements of Information Theory, J. Wiley & Sons, New York, 1991.
5.1. Шеннон для «чайников» 221 информации. Например, я могу многократно посылать каждый бит, а по- лучатель - прислушиваться к голосу большинства, чтобы его декодиро- вать. Но всегда ли для данного капала можно найти код, гарантирующий сколь угодно высокую надежность (при п —» оо)? А что можно сказать о быстродействии таких кодов; сколько битов потребуется для каждой бук- вы сообщения7 Фактически Шеннон показал, что любой канал может быть использо- ван для сколь угодно падежной связи с конечной (ненулевой) скоростью, пока существует хоть какая-нибудь корреляция между его входом и выхо- дом. Более того, он пашет полезное выражение для оптимальной скорости коммуникации, которая может быть достигнута. Эти результаты составляют содержание «теоремы о кодировании для канала связи с шумом». Предположим для определенности, что мы пользуемся двоичным ал- фавитом, каждая буква которого (0 и 1) появляется с априорной вероятно- стью 1/2. Предположим также, что канал является «двоичным симметрич- ным каналом» — он действует на каждый бит независимо, с вероятностью р инвертируя его значение и оставляя невредимым с вероятностью 1 - р. То есть условные вероятности равны р(0|0) - 1 - р, р(0|1)=--р, P(1|OW, р(1Щ- 1-р. 1 J Мы хотим построить семейство кодов растущего блочного разме- ра п такого, чтобы вероятность ошибки декодирования стремилась к нулю при п —» оо. Если количество закодированных в блоке битов равно k, то код заключается в выборе 2к «кодовых слов» из 2” возможных п-битовых строк. Определим быстродействие кода R (число битов информации, при- ходящихся на один передаваемый бит) как (5.21) Нам нужно разработать такой код, чтобы кодовые строки находились как можно «дальше друг от друга». Другими словами, для данного быстро- действия R мы хотим максимизировать количество битов, которые должны инвертироваться, чтобы одно кодовое слово заменилось другим (это коли- чество называется «расстоянием Хэмминга» между двумя кодовыми слова- ми). Для любой вхо/(ящей строки длиной п битов, ошибки, как правило, будут вызывать инвертирование примерно пр битов - следовательно, вход
222 Глава 5 обычно рассеивается в одну из примерно 2пН^ типичных выходящих строк (заполняющих «сферу радиуса Хэмминга» пр, окружающую вхо- дящую строку). Для надежного декодирования, входящие кодовые слова следует выбирать таким образом, чтобы было маловероятным перекрытие сфер ошибок двух разных кодовых слов. В противном случае два разных входа иногда будут давать один и тот же выход, что с неизбежностью при- ведет к ошибкам декодирования. Если мы хотим избавиться от таких дву- смысленностей декодирования, полное число строк, содержащихся во всех 2ПЙ сферах ошибок, не должно превышать полного количества битов 2П в выходящем сообщении; мы требуем выполнения < 2П (5-22) R $ 1 - Н(р) = ОД. (5.23) Если надежность передачи достаточно высока, мы не можем ожидать, что быстродействие кода превзойдет С(р). Но достижимо ли на самом деле быстродействие R — С(р) (асимптотически)? Фактически возможна передача с R, сколь угодно близким к С'(р) и сколь угодно малой вероятностью ошибки По-видимому, самой остро- умной из идей Шеннона была демонстрация того, что С(р) может быть достигнуто учетом среднего по «случайным кодам». [Очевидно, что слу- чайный выбор кода — не самый разумный способ, но, возможно это по- кажется удивительным, оказывается, что случайное кодирование достигает такого же высокого быстродействия (асимптотически при больших п), как и любая другая схема кодирования.] Поскольку С представляет собой оп- тимальное быстродействие при надежной передаче данных по каналу с шу- мом, она называется емкостью канала связи или пропускной способностью канала связи. Предположим, что 2nR кодовых слов представляют собой случайную выборку из ансамбля Хп. Сообщение (одно из кодовых слов) послано. Чтобы его декодировать, изобразим вокруг полученного сообщения «сферу Хэмминга», содержащую 2гг[т/(г)+<Я (5 24) строк. Сообщение декодируется содержащимся в этой сфере кодовым сло- вом в предположении, что оно существует и единственно Если такое ко- довое слово не существует или оно не единственно, то будем считать, что произошла ошибка декодирования. Насколько вероятна ошибка декодирования? Мы выбрали сферу деко- дирования достаточно большой, так что отсутствие достоверного кодового
5.1. Шеннон для «чайников» 223 слова внутри сферы атипично, следовательно, мы должны беспокоиться лишь о том, что ее займут более одного достоверного кодового слова. По- скольку всего имеется 2П возможных строк, то окружающая выходящую строку сфера Хэмминга содержит долю 0п[Я(р)+<5] ----_----2-n[G(p)-<s] {5 25) от общего количества строк. Таким образом, вероятность того, что одно из 2пй случайно выбранных кодовых слов «по несчастью» займет эту сфе- ру, равна 2-п|С(р)-Л-6] (5.26) А так как <5 мы можем выбрать сколь угодно малым, то R можно взять настолько близким к С(р) [но все же меньшим, чем С(р)], насколько это необходимо, чтобы вероятность такой ошибки оставалась экспоненциально малой при п -а оо. Пока мы показали, что мала средняя вероятность ошибки, которую мы усредняем по выбору случайного кода, а для каждого конкретного ко- да — еще и по всем кодовым словам. Таким образом, должен существовать один частный код со средней (усредненной по кодовым словам) вероятно- стью ошибки, меньшей чем г. Но нам хотелось бы иметь более сильный результат — вероятность ошибки мала для каждого кодовою слова. Чтобы установить этот более сильный результат, обозначим через Рг вероятность ошибки декодирования г-го посланного кодового слова. Мы продемонстрировали существование кода такого, что 2"r (5.27) Пусть N2s обозначает количество кодовых слов с Pi > 2е. Тогда мы прихо- дим к выводу, что ^№е)2£<£ или (5.28) то есть можно отбросить максимум половину кодовых слов, чтобы добить- ся Pt < 2к для каждого кодового слова. Быстродействие сконструирован- ного нами новою кода равно Rate R- (5.29) что стремится к R при п ос.
224 Глава 5 Таким образом, С(р) - 1 - Н(р) представляет собой максимальное быстродействие, которое может быть достигнуто асимптотически со сколь угодно малой вероятностью ошибки. Рассмотрим теперь, как обобщить эти доказательства на более общие алфавиты и каналы. Пусть имеется канал связи, характеризуемый набо- ром р(у\х), и определенное распределение вероятностей X = {т, р(х)} для входящих букв. Мы посылаем строки из п букв и предполагаем, что канал действует на каждую букву независимо. (О действующем таким образом ка- нале говорят как о «канале без памяти».) Конечно, как только заданы р(у|д-) и X - так сразу определеныр(х|у) и У = {</,р(у)}. Чтобы установить достижимое быстродействие, вновь рассмотрим усреднение по случайным кодам, где кодовые слова выбираются с апри- орной вероятностью, определяемой ансамблем Хп. Таким образом, с вы- сокой вероятностью они будут выбраны из типичного набора строк букв, содержащего около 2nfl(X‘! таких типичных строк. Для типичного, принадлежащего У11, получаемого сообщения суще- ствует около сообщений, которые моши бы быть посланы. Мы можем декодировать полученное сообщение, сопоставляя ему «сферу», со- держащую 2nro^xl возможных входов. Если внутри этой сферы име- ется единственное кодовое слово, то им декодируется полученное сооб- щение. Как и раньше, маловероятно, что внутри сферы не окажется ни одного кодового слова, однако мы должны исключить возможность того, что их там больше одного. Каждая сфера декодирования содержи! долю 9п\Н(Х У)+#1 2 У) -<5’ _ 2«н(А') = 2~"1НЛ’:Г)-д] (5.30) от общего числа типичных входов. Если имеется 2'iR годовых слов, то вероятность того, что одно из них случайно окажется внутри сферы деко- дирования, равна 2»й2-«Р(Х;У)-(5| = 2-»[Г(Х;У)-Н- <5]. Поскольку ё может быть выбрана сколь угодно малой, то R можно взять настолько близким к Г (ио все же меньшим, чем I), насколько это необходи- мо, чтобы вероятность ошибки декодирования оставалась экспоненциально малой при п оо.
5.1. Шеннон для «чайников» 225 Это доказательство показывает, что, когда мы усредняем по случайным кодам и по кодовым словам, вероятность ошибки остается малой при лю- бом быстродействии R < f. Тогда те же самые рассуждения, что и выше, показывают существование особого кода с вероятностью ошибки < г для каждого кодового слова. Это приемлемый результат, поскольку он согласу- егся с нашей интерпретацией 7, как информации, которую мы приобретаем о входящем X, получая сигнал У'. То есть I представляет собой отнесен- ную к одной букве информацию, которую мы можем послать по данному каналу связи. Взаимная информация ](X,Y) зависит не только от условных веро- ятностей р(у|т), характеризующих канал связи, но также и от априорных всрояпюстсй р(х) появления букв. Приведенное выше доказательство слу- чайного кодирования применимо при любом выборе вероятностей ;>(ж), следовательно, мы показали, что безошибочная передача возможна при лю- бом быстродействии R, меньшем чем С- шах ДХ;Г). (5.32) {р(я)} С называется емкостью канала или пропускной способностью канала и за- висит только от условных вероятностей, определяюпщх данный канал. Мы показали, что достижимо любое быстродействие R < С, но мо- жет ли R превзойти С (при условии, что по-прежнему вероятность ошибки стремится к пулю при п —> оо)? Доказательство того, что С является верх- ней границей быстродействия, в общем случае может показаться более тон- ким, чем для двоичною симметричного капала — вероятности ошибок для разных букв различны, и мы свободны в использовании этого при создании кода. Булем, однако, рассуждать следующим образом: Допустим, что мы выбрали 2пЯ строк из п букв в качестве кодовых слов. Рассмотрим ансамбль (обозначаемый как Х’“), в котором каждое ко- довое слово возникает с одинаковой всроялюстью (=~ 2~nR). Тогда очевид- но, что H(Xn) = nR. (5.33) Посылая кодовые слова через канал связи, мы получаем ансамбль К" вы- ходящих состояний Поскольку мы предполагаем, чю канал действует па каждую букву независимо, условная вероятность для строки из и букв факторизуется: Р(.У\Уч yjzyb • • P&i1^1 'POJpJ, (5.34)
226 Глава 5 а отсюда следует, что условная энтропия удовлетворяет условию = (- logp(jH*n)> = ^(-logp^k)) i (5-35) где X и К, частные (маргинальные) распределения вероятностей для г-ой буквы, определяемые нашим распределением по кодовым словам. Напом- ним, что нам также известно, что ЩХ, У) <. Н(Х) + Я(У) или Я(У”К£Н(Уг). (5.36) Отсюда следует; что I(Yn-,Xn) = Я(У") - Щ¥п\Хп) V [#(К) - Я(У<|Хг)] = -^/(yi;XJ<nC; (5 37) i взаимная информация посланного и полученного сообщений ограничена сверху суммой отнесенных к каждой букве взаимных информаций, а вза- имная информация для каждой буквы ограничена сверху емкостью канала связи [поскольку С определяется как максимум Т(Х\ У)]. Вспоминая о симметрии взаимной информации, мы имеем ДХП;УП) = ЩХп) - Н(Хп\¥п) - - пЛ - Н(Х”1У”) < пС. (5.38) Теперь если мы в состоянии надежно декодировать при п ос, то это означает, что входящее кодовое слово полностью определяется получае- мым сигналом или что условная энтропия входа (в расчете на одну букву) должна стать малой: |ДРИУП) 0. (5.39) Если безошибочность передачи возможна, то в пределе п —> ос уравне- ние (5.38) принимает вид R С. (5.40)
5.2. Энтропия фон Неймана 227 Быстродействие не может превзойти емкость канала связи. [Вспомним, что условная энтропия, в отличие ог взаимной информации, не симметрична. Действительно, H(Yn\Xn)/n не становится малым, поскольку канал вно- сит неопределенность в то, какое сообщение будет получено. Но если мы можем декодировать точно, то, коль скоро сигнал получен, исчезает неопре- деленность в том, какое кодовое слово было послано.] Мы показали, что емкость С представляет собой максимальное дости- жимое быстродействие связи через канал с шумом, при котором вероят- ность ошибки декодирования стремится к нулю при стремящемся к беско- нечности количестве букв в сообщении. В этом состоит теорема Шеннона о кодировании для канала связи с шумом. Конечно, использованный нами метод (усредение по случайным ко- дам) доказательства того, что равенство R — С асимптотически достижи- мо, не очень конструктивен. Так как случайный код не имеет структуры или схемы, то иодирование и декодирование будут довольно громоздкими (нам нужна экспоненциально большая книга кодов). Тем не менее эта теорема важна и полезна, поскольку она i о норит о том, что в принципе достижимо и, более того, что недостижимо, даже в принципе К тому же, поскольку /(Х;У) является вогнутой функцией от X - {т, р(х)} (при фиксирован- ном {р(у|т)}), то она имеет' единственный локальный максимум, а С для интересуемого канала связи часто может быть вычислена (по крайней мере численно). 5.2. Энтропия фон Неймана В теории классической информации мы часто рассматриваем источ- ник, который готовит сообщения из п букв (п 1), причем каждая буква независимо извлекается из ансамбля X = {ж,р(т}}. Мы видели, что ин- формационная энтропия Шеннона Н(Х) (асимптотически при п —> сю) представляет собой количество приходящихся на одну букву несжимаемых битов информации. Нас также могут интересовать корреляции между сообщениями. Кор- реляции между двумя ансамблями букв X и Y характеризуются условными вероятностями р(#| я). Мы видели, что взаимная информация 2(Х;У) - ЩХ) - Я(Х]У) - Я(У) - Я(У]Х) (5.41) представляет собой приходящееся на одну букву количество битов инфор- мации об X, которую мы можем получить, читая У (и наоборот). Если условные вероятности р(^|х) характеризуют канал с шумом, то 1(Х; У) —
228 Глава 5 приходящееся на одну букву количество информации, которое может быть передано через канал связи (при a priori заданном распределении вероят- ностей для Х-ов). Мы хотели бы распространить эти понятия на квантовую информа- цию. Представим источник, который готовит сообщения из п букв, но те- перь каждая буква выбирается из ансамбля квантовых состояний. Алфавит сигналов представляет собой множество квантовых состояний рТ, каждое из которых появляется с определенной априорной вероятностью Как мы уже подробно обсуждали, если наблюдателю неизвестно, какая буква приготовлена, то вероятность любого результата любого измерения буквы, выбранной из этого ансамбля, можно полностью охарактеризовать матрицей плотности Р - (5-42) X для ПОЗМ {Fa} мы имеем Prob(a) -- tr (Fap). (5.43) Для этой (или любой другой) матрицы плотности можно определить энтро- лию фон Неймана 5’(р) -tr(plogp). (5.44) Конечно, если мы выберем ортопормированный базис диагонализу- щий р: (5-45> а ТО S(p) = П(А), (5.46) где Н(Л) энтропия Шеннона ансамбля А — {а, Ао). В том случае, когда алфавит сигналов состоит из взаимно ортогональ- ных чистых состояний, квантовый источник сводится к классическому; все сигнальные состояния идеально различимы и S(p) -- Н(А). Более инте- ресен квантовый источник, сигнальные состояния которого р взаимно нс коммутируют. Мы докажем, что энтропия фон Пеймана является количе- ственной мерой несжимаемой информации, содержащейся в квантовом ис- точнике (в том случае, когда сигнальные состояния являются чистыми), почти как энтропия Шеннона является количественной мерой информации, содержащейся в классическом источнике.
5.2. Энтропия фон Неймана 229 На самом деле мы обнаружим, что энтропия фон Неймана играет двой- сгвснную роль. Она является количественной мерой не только квантовой информации, содержащейся в одной букве ансамбля (минимальное количе- ство приходящихся на одну букву кубитов, необходимое для надежного ко- дирования информации), но и содержащейся в ней классической информа- ции (максимальное количество приходящейся на одну букву информации в битах, а не в кубитах — которое можно получить с помощью наилучшего измерения). Мы увидим, что энтропия фон Неймана входит в квантовую информацию еще одним, третьим способом, количественно определяя за- путывание бинарного чистого состояния. Таким образом, теория квантовой информации в значительной мере занимается интерпретацией и примене- ниями энтропии фон Неймана, подобно тому как классическая теория ин- формации главным образом занимается интерпретацией и применениями энтропии Шеннона. Фактически необходимый для развития квантовой теории информа- ции математический аппарат очень похож на математику Шеннона (типич- ные последовательности, случайное кодирование,...); похож настолько, что временами скрывается то, что в концептуальном плане они на самом де- ле весьма различны. Центральной проблемой квантовой теории информа- ции является то, что неоргогональные чистые квантовые состояния нель- зя идеально различить особенность, не имеющая классического аиа- ло! а. 5.2.1. Математические свойства S(p) Имеется несколько часто используемых свойств S(p) [многие из кото- рых являются близкими аналогами свойств Н (X)]. Ниже я привожу список некоторых из этих свойств. Большей частью их доказательства не сложны (заметным исключением является доказательство сильной субаддитивно- сти) и включены в упражнения в конце главы1. (I) Чистота. Чистое состояние р — имеет S(p) — 0. (2) Инвариантность. Энтропия не изменяется при унитарных преобразо- ваниях базиса WJ-’Mfp). (5.47) 'Некоторые доказательства можно также найти в обзоре A. Wehrl, General Properties of Entropy, Rev Mod. Phys. 50, 221 (1978); или s главе 9 книга A. Peres, Quantum Theory: Concept and Methods, Kluwer Academic Publishers, New York el al 2002. [Подробное обсуждение ма- тематических CBoiieiB энтропии фон Неймана можно найти в книге М. Нильсен, И. Чанг, Квантовые вычисления и квантовая информация, М.: Мир, 2006. — Прим ред.}
230 Глава 5 Это очевидно, поскольку 3(р) зависит только от собственных значе- ний р. (3) Максимум. Если р имеет D ненулевых собственных значений, го 5(p)<logR (5.48) где равенство достигается, когда все ненулевые собственные значения равны между собой. (Энтропия максимальна, когда квантовые состоя- ния равновероятны} (4) Вогнутость. Для А1? Л2:... Л„ > 0 и At + Л2 -f-... | Л?£ — 1 S(AiPi + A2p2 + .. -+A„pn) > A]S'(p1)+A2S(p2) |-... AnS(pn). (5.49) То есть энтропия фон Неймана тем больше, чем нам меньше известно о том, как было приготовлено состояние. Это свойство является след- ствием выпуклости логарифмической функции. (5) Энтропия измерения. Предположим, что в состоянии р измеряется наблюдаемая А = (5.50) У так что результат ау появляется с вероятностью р(ау) (5.51) To t да энтропия Шеннона ансамбля всех исходов измерения У = = {вг р(ау)} удовлетворяет Н(У)^ЭД, (5 52) где равенство достигается для коммутирующих Аир. Математически это утверждение означает, чго в любом базисе S(p) возрастает при замене нулями всех недиагональных матричных элементов р. Физиче- ски это означает, что случайность результата измерения минимизуется, если выбирается измерение наблюдаемой, коммутирующей с матрицей плотности. Но если мы измеряем «плохую» наблюдаемую, то результат будет менее предсказуем. (6) Энтропия приготовления. Если чистое состояние случайным обра- зом извлекается из ансамбля р1;}, так что матрица плотности равна (5-53)
5.2. Энтропия фон Неймана 231 то Я(У) > $(р), (5.54) где равенство достигается, если сигнальные состояния lyrj взаим- но ортогональны. Это утверждение указывает на то, что перемеши- вание неортогональных чистых состояний ведет' к потере различимо- сти. [Мы не можем полностью восстановить информацию о том, какое состояние было приготовлено, поскольку, как мы обсудим позже, до- стижимый при выполнении измерения прирост информации не может превзойти S(p).] (7) Субаддитивность. Рассмотрим бинарную систему Л В в состоянии рАВ. Тогда S(pAbUS(Pa)+SM, (5 55) где рА - tre рАВ, Рв trA рАВ, а равенство достигается при рАВ = — рА ® рв. Таким образом, энтропия аддитивна для некоррелиро- ванных систем, в противном случае энтропия всей системы меньше суммы энтропий ее частей. Это свойство является аналогом свойства энтропии Шеннона (5.56) (или 1{Х; У) 0); оно имеет место, поскольку некоторая информация в ХУ (или АВ) закодирована в корреляциях между X и У (А и В). (8) Сильная субаддитввность. Для любого состояния рАВС трехкомпо- нентной системы S(.Pabc) + s(.Pb) S(Pab') + (5 57) Это свойство называется «сильной» субаддитивностью, постольку оно сводится к (обычной) субаддитивности в случае одномерной В. До- казательство соответствующего свойства энтропии Шеннона довольно просто, однако для энтропии фон Неймана оно оказывается на удив- ление трудным’. Свойство сильной субаддитивности легче запомнить, если интерпретировать его следующим образом: АВ и ВС можно рас- сматривать как две перекрывающиеся подсистемы. Энтропия их объ- единения (ЛВС) плюс энтропия их пересечения (В) не превышает 'Набросок доказательства сильной субаддитявностн энтропии фон Неймана приведен в статье A. Wehrl, General Properties of Entropy, Rev. Mod. Phys. 50, 221 (1978); [На русском языке см M. Нильсен, И. Чанг, Квантовые вычисления и квантовая информация, М.- Мир, 2000. - Прим ред ]
232 Глава 5 сумму энтропий подсистем (АВ и ВС). Мы увидим, что сильная суб- аддитивность имеет глубокие и важные следствия (9) Неравенство треугольника (Неравенство Араки -Либа). Для бинар- ной системы 8(РаВ)^ \S(pA)~SM (5.58) Неравенство треугольника резко кон граетирует с аналогичным свой- ством энтропии Шеннона H(X.Y) > H(X),H(Y) (5.59) или H(X\Y),H(Y\X) >0. (5.60) Энтропия Шеннона классической бинарной системы превосходит эн- тропию Шеннона любой ее части - во всей системе содержится боль- ше информации о ней, нежели в ее части’ Но это не так для энтро- пии фон Неймана. В предельном случае бинарного чистого квантовою состояния мы имеем 5(рл) = S(pB) (нс равные нулю, если состоя- ние запутано), в то время как S(pAR) = 0. Бинарное состояние опре- деленным образом приготовлено, но если мы измеряем наблюдаемые различных подсистем, то результаты измерений с неизбежностью ста- новятся случайными и непредсказуемыми. Мы не можем различить, как было приготовлено состояние, наблюдая две подсистемы отдель- но, поскольку информация закодирована скорее в нелокальных кван- товых корреляциях. Сопоставление положительности условной энтро- пии Шеннона (в классическом случае) с неравенством треугольника (в квантовом случае) замечательно характеризует ключевое различие между квантовой и классической информацией. 5.2.2. Энтропия и термодинамика Конечно, понятие энтропии впервые было введено в науку в термо- динамике. Здесь я ненадолго отвлекусь на некоторые термодинамические приложения математических свойств S(p). Существует два различных (но связанных между собой) возможных подхода к основаниям квантовой статистической физики. В нервом мы рассматриваем эволюцию изолированной (замкнутой) квантовой системы, но производим некоторое сглаживание (coarse graining), чтобы опреде- лить термодинамические переменные. Во втором подходе, который, воз- можно, физически более мотивирован, мы рассматриваем открытую снеге-
5.2. Энтропия фон Неймана 233 му, квантовую систему в контакте с окружением, и следим за ее эволюцией, не контролируя окружение. Для открытой системы определяющим математическим свойством эн- тропии фон Неймана является ее субаддитивность. Если система (А) и окружение (Е) первоначально нс корродированы друг с другом Рае~Ра®Ре-, (5.61) то энтропия аддитивна ^Рае) - А’(Рд) I S(pE). (5.62) Предположим теперь, что открытая система эволюционирует в течение некоторою времени. Эволюция описывается унитарным оператором UAB, действующим на комбинированную систему А + Е: Рае * Рае — ^аеРае^ае> (5.63) а поскольку унитарная эволюция сохраняет S. то $(.Рае) -- $(.PaeY (5.64) Наконец, применим свойство субаддигивиосги к состоянию ^(рдЕ), полу- чая в результате S(pA) + S(pE) = S(p^) S(p'A) + S(p'B), (5.65) где равенс тво имеет место в случае, когда Л и Е остаются некоррелирован- ными. Если мы определим «полную» энтропию Вселенной как сумму эн- тропии системы и энтропии окружения, то придем к выводу, что энтропия Вселенной не может убывать. Это одна из формулировок второго закона гермодинамики. Заметим, однако, чтобы вывести этот «закон», мы предпо- ложили, что в начальном состоянии система и окружение были некоррели- рованы. Обычно взаимодействие системы и окружения будет генерировать корреляции, так что (в предположении отсутствия начальных корреляций) энтропия действительно будет нарастать. Вспомните из нашего обсужде- ния основного уравнения в § 3.5, что обычно окружение быстро «забывает», так что, если наше время разрешения достаточно велико, то в каждый мо- мент времени систему и окружение (фактически) можно рассматривать как
234 Глава 5 «первоначально» некоррелированные (марковское приближение). В этом предположении «полная» энтропия будет монотонно возрастать, асимпто- тически приближаясь к своему теоретическому максимуму, максимальному достижимому значению, согласующемуся со всеми законами сохранения (энергии, заряда, барионного числа и т. д.). Действительно, обычное предположение, лежащее в основании кван- товой статистической физики, состоит в том, что система и окруже- ние находятся в «наиболее вероятной конфигурации», максимизирующей S'(Pa) + S{pE). В этой конфигурации все «доступные» состояния равнове- роятны. С микроскопической точки зрения первоначально закодированная в си- стеме информация (наша способность отличать одно начальное состояние от другого, первоначально ортогонального, состояния) теряется; она ока- зывается закодированной в квантовом запутывании системы и окружения. В принципе эта информация могла бы быть восстановлена, но па практике локальным наблюдателям это совершенно недоступно. Следовательно, мы наблюдаем термодинамическую необратимость Конечно, мы можем применить эти рассуждения к большой замкну- той системе (всей Вселенной?). Мы можем разделить систему на малую ее часть и остаток (окружение малой части). Тогда сумма эпгропий этих частей будет неубывающей. Это частный тип сглаживания. Эта часть за- мкнутой системы ведет себя подобно открытой системе, поэтому для боль- ших систем микрокапонический и канонический ансамбли статистической механики дают одинаковые предсказания. 5.3. Сжатие квантовых данных Что является квантовым аналогом теоремы о кодировании без шума? Рассмотрим длинное сообщение, состоящее из п букв, где каждая бук- ва случайным образом выбирается из ансамбля чистых состояний {Ы.РхЬ (5.66) а сами не обязательно ортогональны. (Например, 1^) может представ- лять собой состояние поляризации одного фотона.) Таким образом, каждая буква описывается матрицей плотности <56?)
5.3. Сжатие квантовых данных 235 а вес сообщение целиком - матрицей плотности р" — р® р® ••'® р. (5.68) Зададим вопрос: насколько избыточна эта квантовая информация? Мы хотели бы придумать квантовый код, который позволит сжать сооб- щение в более узкое гильбертово пространство без потери точности ею воспроизведения. Например, допустим, что у нас есть устройство кванто- вой памяти (жесткий диск квантовою компьютера?), и нам известны ста- тистические свойства записанных данных (то есть мы знаем р). Сжимая данные, мы хотим сэкономить объем памяти. Оптимальное сжатие, которое может быть достигнуто, было найдено Бепом Шумахером. Можете ли вы угадать ответ? Наилучшим возможным сжатием, совместимым со сколь угодно высокой точностью воспроизведе- ния при п —> ос является сжатие в гильбертово пространство Л с logfdim Л)-~ nS(p). (5.69) В этом отношении энтропия фон Неймана представляет собой количество кубитов квантовой информации, переносимых одной буквой сообщения. Например, если сообщение состоит из п фотонных состояний поляризации, то мы можем сжать сю до т — r>S(p) фотонов - сжатие всетда возможно, за исключением случая р - |1. (Мы не можем сжать случайные кубиты точно гак же, как не можем сжать случайные биты) Доказательство теоремы Шумахера нс составляет труда, если известны и понятны результаты Шеннона. Большой заслугой Шумахера была пра- вильная постановка вопроса, что позволило впервые дать точную (кван- тово-) информационную теоретическую интерпретацию энтропии фон Ней- мана1. 5.3.1. Сжатие квантовых данных: пример Прежде чем обсуждать в общем виде протокол Шумахера сжатия кван- товых данных, полезно рассмотреть простой пример. Предположим, что нашими буквами являются отдельные кубиты, извлекаемые из ансамбля >”4 (5.70) 'Как мы вскоре увидим, интерпретация Ь'(р) на языке классической информации, закоди- рованной в кванювых состояниях, действительно была известна раньше.
236 Глава 5 так что матрица плотности каждой буквы имеет вид р- |i гу<п । Ц| о<ь [ = 1 ( 1 0 A+lp/2 V2 А ( 3/4 i/4 / 2 у О 0 у ' 2 \ 1/2 1/2 / 1/4 1/4 /' р' ' Как очевидно из симметрии, собственными состояниями р являются куби- ты, ориентированные вверх и вниз вдоль оси h — + £).' / cos£ \ l°') = lb-.>= (eiJ , \ о / / sin 2- \ 1‘^iM-cA b \ о / соответствующие им собственные значения: А<1')= [очевидно, что А(О') + A(l') = 1, а А(0')А(1') = 1/8 — detp]. Собствен- ное состояние |0') одинаково (и довольно сильно) перекрывается с обоими сигнальными состояниями (5.72) (5 73) 1(0'1 ТУ!'2 - 1(0'1 О I2 = cos2 J 0,8535: перекрытия состояния 11') тоже одинаковы (но относительно слабы) 1(1'1 УМИ tJI2- sin2 J-0,1465. (5.74) (5.75) Таким образом, если мы не знаем, какое состояние было послано, | f2) или | [ J, то лучшей пашей догадкой является \w) = |0'). Это предположе- ние имеет максимальную точность воспроизведения Ш2 среди всех возможных состояний кубита |yr) (F = 0,8535) (5.76)
5.3 Сжатие квантовых данных 237 Теперь представим, что Алисе нужно послать Бобу три буквы. Но она может позволить себе послать только два кубита (квантовые каналы требу- ют очень больших расходов’.). Тем нс менее она хочет, чтобы Боб рекон- струировал ее состояние с максимально возможной точностью воспроизве- дения. Она могла бы послать Бобу две из имеющихся у нее трех букв и пред- ложить Бобу угадать |0') для третьей. Тогда Боб получает две буквы с F- - 1 и имеет F - 0,8535 для третьей; следовательно, полная F = 0,8535. Но существует ли более разумная процедура, достигающая более высокой точности воспроизведения? Лучшая процедура действительно существует. /{иагонализовав р, мы разложили гильбертово пространство одного кубита на «вероятное» (натя- нутое на |0')) и «маловероятное» (натянутое на |1'}) одномерные подпро- странства. Подобным образом мы можем разложить гильбертово простран- ство трех кубитов на вероятное и маловероятное подпространства. Если произвольное сигнальное состояние имеет вид (с каж- дым из трех кубитов, находящихся в состоянии | |г) или | j^)), то |(0'0'0»|2 — cos" £ - 0,6219, и |(0'0Т|^}|2 ---1(0'1 'О'|^>!2 -|(1 W|v>)(2 -cos4 £ sin2 % -0,1067. „ 8 <5-77) |(0'l'l'|^)|2 = |(l'0'l'|^!2-|(l'l/0»[2--cos2^sin4 5-0.0183, О о !(1'1'1'|у»){2 - sin" 5 -0,0031. о Таким образом, мы можем разложить пространство на вероятное подпро- странство А, натянутое на {(0'0'0'), |0'0'1'), |0'1'0'), |1'0'0')}, и его ортого- нальное дополнение А1. Если мы выполняем («грубое») измерение, про- ецирующее сигнальное состояние на А или А1, то вероятность проециро- вания на вероятное подпространство равна Plikely = 0,6219 + 3x0,1067 — 0,9419, (5.78) гогда как вероятность проецирования на маловероятное подпространство — Punllkely ~ 3 * 0,0183 б 0,0031 - 0,0581. (5.79) Чтобы выполнить это грубое измерение, Алиса могла бы, например, сначала применить унитарное преобразование U, превращающее чегыре высоко вероятных базисных состояния в ;•)!», (5.80)
238 Глава 5 а четыре маловероятных базисных состояния в (5.81) затем Алиса измеряет третий кубид чтобы закончить грубое измерение. Ес- ли результатом является |0), то ее входящее состояние было спроецировано (в действительности) на А. Она посылает Бобу два оставшихся (неизме- ренные) кубита. Когда Боб получает это (сжатое) двухкубитовое состоя- ние iV’cotnp), он развертывает его, присоединяя (0) и применяя U 'J, Ю = и- Ш(Отр))0». (5.82) Если измерение Алисы третьего кубита дает 11), то она спроецировала свое входящее состояние на маловероятное подпространство А1. Лучшее, что она может сделать в этом случае, это послать состояние, которое Боб раз- вертывает в самое вероятное состояние |0'0'0'); то есть она посылает такое состояние (^СО1Пр), что Ю =U-Weo„n>))-|0W). (5.83) Таким образом, если Алиса кодирует трехкубитовое сигнальное состоя- ние |^>), посылает два кубита Бобу, а Боб декодирует как только что описа- но, тогда он получает состояние («WI - p--E|V-)(V’!E+|OW)(V’l(l-E)^)(OW|, (5.84) где Е — проекционный оператор на А. Достигаемая в этой ггроцедуре точ- ность воспроизведения равна F = Ш = (^М)2 + - ЕМ)(W'0'О'))2 - (0,9419)2 + 0,058] х 0,6219 - 0,9234. (5.85) Это действительно лучше наивной процедуры посылки двух из трех куби- тов, каждого с идеальной точностью воспроизведения. Когда мы посылаем более длинные сообщения с большим количеством букв, точность воспроизведения сжатия улучшается. Энтропия фон Нейма- на однокубитового ансамбля равна S(p) = н( cos2 ~ = 0,60088... (5.86) Следовательно, согласно теореме Шумахера мы можем сократить длинное сообщение на фактор (скажем) 0,6009 и тем не менее достичь очень высо- кой точности воспроизведения.
5.3. Сжатие квантовых данных 239 53.2. Кодирование Шумахера в общем Ключом к теореме Шеннона о кодировании в отсутствии шума яв- ляется то, что мы бет большой потери точности воспроизведения можем кодировать типичные последовательности и игнорировать остальные. Что- бы количественно описать сжимаемость квантовой информации, перейдем от понятия типичной последовательности к понятию типичного подпро- странства. Ключом к теореме Шумахера о квантовом кодировании в от- сутствии шума является то, что мы без большой потери точности воспроиз- ведения можем кодировать типичные подпространства и игнорировать их ортогональные дополнения. Рассмотрим сообщение, состоящее из п букв, где каждая буква явля- ется чистым квантовым состоянием, извлекаемым из ансамбля {1^), р£}, так что матрица плотности одной буквы равна (5 87) Более того, буквы извлекаются независимо, так что матрица плотности все- го сообщения рп р® р® -® р. (5.88) Мы хотим доказать, что для больших п почти все носители этой матри- цы плотности занимают подпространство полного гильбертова простран- ства сообщений, причем размерность этого подпространства асимптотиче- ски стремится к -2п3<-^. Этот вывод непосредственно следует из соответствующего класси- ческого у1всрждения, если мы рассматриваем ортонормированный базис, в котором р диагональна. Работая в этом базисе, по существу, мы мо- жем рассматривать наш квантовый источник информации как эффективный классический источник, производящий сообщения, которые представляют собой строки из собственных состояний р. Вероятность каждого такого со- общения определяется произведением соответствующих собственных зна- чений р. Дря заданных п и <) определим типичное подпространство Л как пространство, натянутое на собственные векторы рп, с собственными зна- чениями, удовлетворяющими 2^n(s+<5) < у <: (5.89) Непосредственно пользуясь результатом Шеннона, мы приходим к выводу, что для любых 5, s > 0 и при достаточно большом п сумма подчиняющихся
240 Гллвл 5 этому условию собственных значений р" удовлетворяет неравенству tr(pnE) > 1 - е (5.90) (где Е обозначает проекционный оператор на типичное подпространство), а количество dim Л таких собственных значений удовлетворяет неравенству (1 - dim Л 2n<s+‘i’. (5.91) Наша стратегия кодирования состоит в том, чтобы отправлять состояния, действительно принадлежащие типичному подпространству. Например, мы можем выполнить грубое измерение, проецирующее входящее сообщение на Л или на Л ; с вероятностью РЛ tr(pT1E) > 1 - с результат будет принадлежать Л. В таком случае спроецированное состояние кодируется и посылается. Асимптотически вероятность другого результата пренебре- жимо мала, поэтому не так уж важно, что мы будем делать в этом случае. Кодирование спроецированного состояния просто упаковывает его, чтобы оно мото переноситься минимальным количеством кубитов. Напри- мер, мы применяем унитарное преобразование базиса U, которое превра- щает каждое состояние |^typ) из Л в состояние вида Wtyp) = HUInp)|Oresth (5-92) где IV’comp) - состояние n(S + 5) кубитов, a |0rest) обозначает состоя- ние |0)&.. ,®|0) остальных кубитов. Алиса посылает )^(.огар) Бобу, который декодирует его, присоединяя (0^) и применяя U Предположим, что Ь») =- (5.93) обозначает произвольное сообщение, представляющее собой одно из «-бук- венных чистых состояний, которое может быть послано. После того как выполнены только что описанные кодирование, передача и декодирование, Боб получает реконструированное состояние ЫЫ р'г Е|^)(^|Е -( — Е)|у>;), (5.94) где p^junk — состояние, выбираемое нами для отправления, если грубое измерение дает результат Л". Что можно сказать относительно точности воспроизведения этой процедуры?
53. Сжатие квантовых данных 241 Точность воспроизведения изменяется от сообщения к сообщению (в противоположность обсуждавшемуся выше примеру), поэтому мы рас- сматриваем точность воспроизведения, усредненную по ансамблю возмож- ных сообщений: F ~ ^P»fo9dEl9’№JEl9:’i)+ г г Рг {фг Junk 1^»}(^1^ЕЫ>£А|}ЕЫГ (5.95) где последнее неравенство справедливо, поскольку вклад «мусора» неотри- цателен. Так как для любого вещественного числа (:г - I)2 0 или х2 > 2х - 1. (5.96) мы имеем (полагая х = |{Е|у?,)||2) ЦЕНИ4 > 2||Е|^)||2 - 1 (5.97) и, следовательно, F > ^Р1(2(^|Е|^)-1) = 2Ег(р«Е)-1>2(1-£)^1-1-2Е-. (5.98) t Итак, мы показали, что можно сжать сообщение до объема, несколько мень- шего, чем n(S у 6) кубитов, обеспечивая в то же время сколь угодно высо- кую при больших п усредненную точность воспроизведения. Следовательно, мы установили, что с несущественной потерей точно- сти воспроизведения сообщение может быть сжато до S 4- 6 кубитов в рас- чете на одну букву. Возможно ли дальнейшее сжатие? Допустим, что Боб декодирует полученное сообщение pcomPii путем присоединения кубитов и применения преобразования U-1, получая при этом р'= U-1(pcomp/1 <8> (0)<0|)U (5.99) («унитарное декодирование»). Допустим, что рсотр, было сжато до n(S — <5) кубитов. Тогда, независимо от того, как было закодировано входящее сообщение, все декодированные сообщения будут принадлежать подпрос гранству Л' размерности 2”Г5 гильбертова пространства Боба. (Мы не предполагаем здесь, что Л' не имеет ничего общего с типичным подпространством.)
242 Глава 5 Если входящим сообщением является |^), то рекопсгруированное Бо- бом сообщение — р'г, которое может быть диагонализовано - 5? (5.100) где векторы |аг) - взаимно ортогональные состояния из Л'. Точность вос- произведения реконструированного сообщения равна - <¥>г|^ы = ы < с С (5.101) о. где Е' — ортогональный проектор на подпространство Л'. Следовательно, усредненная точность воспроизведения удовлетворяет F = = tr(p"E'). (5.102) г t Но поскольку Е' проецирует па пространство размерности 2n<s то tr(pnE') не может быть больше суммы наибольших собствен- ных значений рп. Из свойств типичных подпространств следует, что эта сумма принимает сколь угодно малое значение; при достаточно большом п F tr(pnE') < (5.103) Таким образом, мы показали, что если мы попытаемся сжать сообщение до S - <5 кубитов на одну букву, тогда при достаточно большом п точность воспроизведения неизбежно станет плохой. Итак, мы приходим к выводу, что S{p) кубитов на одну букву является оптимальным сжатием кванто- вой информации, которое может быть достю нуто, если мы хотим получить хорошую точность воспроизведения при п стремящемся к бесконечности. В этом состоит теорема Шумахера о кодировании в отсутствии шума. Приведенное выше доказательство применимо к любой мыслимой схе- ме кодирования, но только к ограниченному классу схем декодирования (унитарное декодирование). Конечно, может быть рассмотрена более об- щая схема декодирования, описываемая супероператором. Тогда потребу- ется более высокая техника для доказательства того, что невозможно луч- шее сжатие, чем S кубитов на одну букву. Но вывод остается неизменным. Суть в том, что S - 3 кубитов недостаточно для того, чтобы различить все типичные состояния.
5.3. Сжатие квантовых данных 243 Подводя итог, отметим тесную аналогию между теоремами Шеннона и Шумахера о кодировании в отсутствии шума. В классическом случае по- чти все длинные сообщения являются типичными последовательностями, так что мы можем кодировать только их и тем не менее иметь малую веро- ятность ошибки. В квантовом случае почти все длинные сообщения имеют почти единичное перекрытие с типичным подпространством, так что мы можем кодировать только его и тем нс менее достигать высокой точности воспроизведения. Фактически Алиса могла бы послать Бобу эффективно классическую информацию — строку xtx2 .. хп, закодированную во взаимно ортогональ- ных квантовых состояниях тогда Боб, следуя этим классическим ин- струкциям, мог бы реконструировать состояние Алисы. Таким способом они могли бы добиться высоко надежного сжатия до Н(Х) битов (или ку- битов) в расчете на одну букву. Но если буквы извлекаются из ансамбля неортогоналъных чистых состояний, то эта степень сжатия не оптимальна; часть классической информации о приготовлении состояния становится из- быточной, поскольку неортогональные состояния не могут быть идеально различимыми. Таким образом, кодирование Шумахера может продвинуться дальше, достигая оптимальною сжатия S(p) кубитов на одну букву сооб- щения. Информация упакована более эффективно, но дорогой ценой - Боб получил то, что имела ввиду Алиса, но он не может узнать — что. В про- тивоположность классическому случаю, Боб не может выполнить никако- го измерения, чтобы корректно дешифровать сообщение Алисы. Попытка прочитать сообщение неизбежно внесет в него возмущение. 5.33. Кодирование смешанного состояния: информация Холено Теорема Шумахера характеризует сжимаемость ансамбля чистых со- стояний Но что если буквы извлекаются из ансамбля смешанных состоя- ний? В этом случае сжимаемость надежно не установлена и является пред- метом текущих исследований1. Нетрудно видеть, что для смешанных состояний $(р) уже не будет от- ветом. Чтобы привес ги тривиальный пример, предположим, что некоторое смешанное состояние р0 с энтропией 5(р0) / 0 выбирается с вероятно- стью pQ = 1. Тогда сообщение всегда равно рГ} ® р0 ® ® р0 и не несет никакой информации, Боб может идеально реконструировать сообщение, ничего не получая от Алисы. Следовательно, это сообщение можно сжать до нуля кубитов на одну букву, что меньше, чем S(p0) > 0. 'См. М. Horodecki, Limits for Compression of Quantum Information Carried by Ensembles of Mixed Slates, Phys. Rev., AST, 3364-3369 (1997); quant—ph/9712035.
244 Глава 5 Чтобы построить менее тривиальный пример, вспомним, что для ан- самбля взаимно ортогональных чистых состояний энтропия Шеннона равна энтропии фон Неймана: H(X)~S(p). (5.104) так что классическая и квантовая сжимаемости совпадают. Это справедли- во, поскольку ортогональные состояния идеально различимы. Фактически, если Алиса хочет послать Бобу сообщение 19% KJ- (5.105) то она может послать классическое сообщение я?!.. ,хп, а Боб может ре- конструировать состояние с идеальной точностью воспроизведения. Теперь предположим, что буквы извлекаются из ансамбля взаимно ор- тогональных смешанных состояний рт}: х/у; (5.106) то есть р3 и ру имеют носители во взаимно ортогональных подпростран- ствах гильбертова пространства. Эти смешанные состояния также идеал ыю различимы, го есть опять сообщения, по существу, классические и, следо- вательно, могут быть сжаты до Н(Х) кубитов на одну букву. Например, мы можем расширить гильбертово пространство наших букв Т(л до более широкого 1тространства НА ® Нв и выбрать очищение каждого рх> то есть чистое состояние € "НА ® Нв, такое что trB abK-I) Юа- (5,107) Эти чистые состояния взаимно ортогональны, а ансамбль {Юд.н, рх} имеет энтропию фон Неймана Н{Х); следовательно, мы можем выполнить сжатие сообщения KJah KJab (5.108) по Шумахеру до Н (А) кубитов на одну букву (асимптотически). После раз- вертывания этого состояния Боб может взять частичный след, «выбрасы- вая» подсистему В, и таким образом реконструировать сообщение Алисы. Чтобы сделать разумное предположение о том, какое выражение ха- рактеризует сжимаемость сообщения, построенного из алфавита смешан- ных состояний, мы могли бы поискать выражение, которое сводится к ,9(р) для ансамбля чистых состояний, и - к Н(Х) для ансамбля взаимно орто- гональных смешанных состояний. Выбирая базис, в котором <5109>
5.3 Сжатия квантовых данных 245 является блочно-диагональным, мы видим, что 5(р) = - tr plogp = - tr (рлрх) log (РгРя.) У - - XXlog/>* - X tr log р* У JT hw । <5.no) X (вспоминая, что 1грж — 1 для каждого x). Следовательно, мы можем запи- сать энтропию Шеннона в виде Н(Х) - S(p) -Хр.ад = х(£)- (5.111) Величина у(<С) называется информацией Холево ансамбля Е — {рх, р/}. Очевидно, она зависит не только от матрицы плотности р, по и от конкрет- ного способа реализации р как ансамбля смешанных состояний. Мы на- шли, что как для ансамбля чистых состояний, так и для ансамбля взаимно ортогональных смешанных состояний информация Холево х(£) представ- ляет собой оптимальное количество кубитов па одну букву, которого можно достичь, если мы сжимаем сообщение, сохраняя высокую точность воспро- изведения при больших п. Информация Холево может рассматриваться как обобщение энтро- пии фон Неймана, переходящее в S(p) для ансамбля чистых состояний. Она также является близким аналогом взаимной информации I(Y; X) - Я(У) - H(Y\X) (5.112) в классической теории информации, сообщающей нам, насколько в среднем уменьшает ся энтропия Шеннона ансамбля Y, koi да мы узнаем значение X , аналогично x(^ = 5(p)-Xp^(pJ (5.113) а; говорит нам, насколько в среднем уменьшается энтропия фон Неймана ан- самбля, koi да мы узнаем, как он был приготовлен. Подобно классической взаимной информации, информация Холево всегда неотрицательна, как это следует из свойства вогнутости ,9(р) s(EpX) (5.П4)
246 Глава 5 Теперь мы хотим исследовать связь между информацией Холево и сжима- емостью сообщений, построенных из алфавита иеортогонаяьных смешан- ных состояний. Фактически можно показать, что в общем случае невоз- можно сжатие с высокой точностью воспроизведения до объема, меныпего чем х на одну букву сообщения. Чтобы установить этот результат, воспользуемся свойством «монотон- ности» у, доказанным Линдбпадом и Ульманом: супероператор не может увеличивать информацию Холево. То есть если $ — произвольный суиеро- ператор, действующий на ансамбль смешанных состояний как £'— {S6(pJ,pJ, (5.115) то х(Г)<у(£). (5.116) Монотонность Линдблада - Ульмана тесно связана с сильной субаддитив- ностью энтропии фон Неймана, что вы покажете в домашнем упражнении. Монотонность у обеспечивает еще одно свидетельство того, что х ха- рактеризует количество информации, закодированной в квантовой системе. Декогерентизация, описываемая супероператором, может лишь сохранить или сократить эту величину информации, но не увеличить ее. Заметим, что в противоположность этому энтропия фон Неймана не монотонна Суперо- ператор может преобразовать начальное чистое состояние в смешанное, увеличивая S(p). Однако другой супероператор преобразует любое сме- шанное состояние в «основное» |0)(0| и, следовательно, уменьшает энтро- пию начального смешанного состояния до нуля. Было бы ошибкой интер- претировать это уменьшение S как «приобретение информации», так как наша способность отличить разные возможные приготовления полностью утрачена. Соответственно распад в основное состояние сокращает до нуля информацию Холево, отражая то, что мы потеряли возможность реконстру- ировать начальное состояние. Рассмотрим теперь сообщения из п букв, независимо извлекаемых из ансамбля £ = {рх, рх}; ансамбль всех таких входящих сообщений обо- значается как £’:-п'. Пусть разработан код, который сжимает сообщения так, что они все занимают гильбертово пространство ансамбль сжатых сообщений обозначается как £<г‘'1. Тогда развертывание выполняется су- пероператором $ f'О), (5.И7) чтобы получить ансамбль выходящих сообщений.
5.4 Доступная информация 247 Теперь предположим, что эта схема кодирования имеет высокую точ- ность воспроизведения. Чтобы свести к минимуму техническую сторону, не будем вдаваться в детали того, как следует охарактеризовать количе- ственно точность воспроизведения £1^1'1 относительно £^. Мы просто примем, что если £имеет высокую точность воспроизведения, то для любого 6 и при достаточно больших п Ы£{п}) - * ^(5'(П)) < + <5-118) отнесенная к одной букве информации Холево выходящего и входящего сообщений приближаются друг к другу. Поскольку входящие сообщения являются произведениями состояний, то из аддитивности S(p) следует, что х(£<п})=пХ{£), (5.119) а из монотонности Линдблада Ульмана мы знаем, что х(£'<п>) < х(£(п>). (5 120) Комбинируя уравнения (5.118)(5.120), находим, что (5.121) Наконец, х(.^пЬ ограничена сверху величиной S(p^)r которая, в свою очередь, ограничена сверху числом log dim Так как £ можно вы- брать сколь угодно малой, мы приходим к выводу, что асимптотически при п —»оо log dim#”) > х(£); (5.122) хорошо воспроизводимое сжатие, до менее чем %(£) кубитов на одну букву невозможно. Нередко возникает соблазн предположить, что сжатие до *(£) кубитов на одну букву сообщения асимптотически достижимо. С середины января 1998 г. это предположение все еще ждет своего доказательства или опро- вержения. 5.4. Доступная информация Тесная аналогия между информацией Холево уф и классической вза- имной информацией ДХД), а также монотонность х наводят на мысль,
248 Глава 5 что х связана с количеством классической информации, которая может хра- ниться в квантовой системе и извлекаться из нее. В этом разделе мы дадим точную формулировку этой связи. Предыдущий раздел был посвящен количественному определению объема квантовой информации — измеряемой в кубитах — в сообщениях, построенных из алфавита квантовых состояний. Теперь же мы обратим- ся к совсем другому вопросу. Мы хотим количественно определить объем классической информации - измеряемой в битах — которую можно извлечь из таких сообщений, в частности, в случае, когда алфавит включает взаим- но неортогональные буквы. Но почему мы должны быть столь неразумны, чтобы хранить клас- сическую информацию в пеортогональных квантовых состояниях, которые нельзя идеально различию.? Несомненно, следует избегать такою способа хранения информации, так как это ведет к деградации классического сиг- нала. Но, возможно, мы не можем обойтись без него. Допустим, например, я инженер связи и интересуюсь существенными физическими ограничени- ями классической емкости широкополосного оптического волокна. Чтобы получить наилучшую пропускную способность классической информации на единицу мощности, нам, очевидно, следует выбрать кодирование инфор- мации в отдельных фотонах, а чтобы добиться высокого темпа, мы должны увеличивать количество передаваемых за одну секунду фотонов. Но если мы сжимаем фотонные волновые пакеты достаточно тесно друг с дру- гом, они начнут перекрываться и мы не сможем их идеально различать. Как максимизировать передаваемую в этом случае классическую информа- цию? Другой важный пример: допустим, что я физик-экспериментатор и хочу использовать тонкую квантовую систему, чтобы сконструировать очень чувствительный прибор, измеряющий действие классической силы на систему. Мы можем моделировать силу как свободный параметр х в га- мильтониане системы Н(х). В зависимости от значения х состояние систе- мы будет эволюционировать к различным возможным конечным (неорго- гональным) состояниям рх. Как много информации относительно х может получить наш прибор? Несмотря на то, что с точки зрения физики эта проблема сильно отли- чается от сжимаемости квантовой информации, математически они связаны между собой. Мы обнаружим, что центральную роль в нашем обсуждении играют энтропия фон Неймана и ее обобщение, информация Холево Предположим, например, что Алиса готовит чистое квантовое состо- яние, извлекая его из ансамбля £ = {1^),рх}. Бобу известен ансамбль, но не конкретное выбранное Алисой состояние. Он хочет получить макси- мально возможную информацию относительно х.
5.4. Доступная информация 249 Боб собирает информацию, выполняя обобщенное измерение, ПОЗМ {Fy}. Если Алиса приготовила х, то Боб получит результат измерения у с условной вероятностью р№) - (v’JFJ^}. (5.123) Эти условные вероятности вместе с ансамблем X определяют количество в среднем получаемой Бобом информации, взаимную информацию ЦХ; К) приготовления и результата измерения. Боб свободен в выборе своего измерения. «Паилучшее» возможное из- мерение, максимизирующее получение информации, называется оптималь- ным измерением, определяемым ансамблем. Максимальное получение ин- формации равно Асс(Г) - тахГ(А';У), (5.124) где max определяется по всем возможным ПОЗМ-ам. Эта величина назы- вается доступной информацией ансамбля £. Конечно, если состояния 1^) взаимно ортогональны, то они идеально различимы. Условная вероятность результата ортогонального измерения Е, - (5.125) равна р(у|.т) - (5.126) так что H{X\Y) = 0, а Т(Х;У) ЩХ). Это измерение, очевидно, оп- тимально — приготовление полностью определено — так что для ансамбля взаимно ортогональных (чистых или смешанных) состояний Хсс(£) = Н(Х). (5.127) Однако проблема становится гораздо интереснее, когда сигнальными состояниями являются неортогональные чистые состояния. Для этого слу- чая не известно ни одного полезного общего выражения для Асс(£), но су- ществует верхняя граница Асс(£) S(p) (5.128) Мы видели, что эта граница достигается в случае ортогональных сигналь- ных состояний, когда S(p') = Н(Х) В общем случае из классической тео- рии информации известно, что 7(Х;У) < Н(Х); но для неоргогопалытых
250 Глава 5 состояний S(p) < Н(Х), так что неравенство (5.128) определяет наилуч- шую границу. Тем не менее эта граница не является точной, во многих случаях Асс(£) строго меньше S(p), Более определенное соотношение между Acc(f) и S{p) мы получим, если рассмотрим доступную информацию в расчете на одну букву в со- общении, содержащем п букв. Теперь Боб имеет большую свободу — он может решить выполнить коллективное измерение всех п букв и таким образом получить больше информации, чем если бы он ограничивался из- мерением только по одной букве за один раз. Более того, Алиса может решить приготовить скорее ансамбль частных, максимально различимых, сообщений (код), нежели произвольные сообщения, каждая буква которых извлечена из ансамбля £ Тогда мы увидим, что Алиса и Боб могут найти такой код, чтобы мар- гинальным (частным) ансамблем каждой буквы был £, а отнесенная к од- ной букве доступная информация асимптотически стремилась к S(p) при п —► оо. В этом смысле S(p) характеризует доступную информацию в ан- самбле чистых квантовых состояний. Более того, заменой энтропии фон Неймана на информацию Холево эти результаты обобщаются на ансамбли смешанных квантовых состояний, Доступная информация ансамбля смешанных состояний (рх,рх] удовле- творяет неравенству Асс(£) *(£), (5.129) результат, известный как граница Холево. Эта 1раница в общем случае не является точной (хотя она достигается для ансамблей взаимно ортогональ- ных смешанных состояний). Однако если Алиса и Боб выбирают п-бук- венный код, в котором частным ансамблем для каждой буквы являет- ся £, а Боб выполняет коллективное оптимальное обобщенное измерение (ПОЗМ) всех п букв, тогда максимальной достижимой информацией на од- ну букву является у(£), если потребовать, чтобы все кодовые слова пред- ставляли собой произведения состояний. В этом смысле х(£) характеризует доступную информацию в ансамбле смешанных квантовых состояний. Алфавит из смешанных квантовых состояний может возникнуть, если Алиса попытается послать Бобу чистые квантовые состояния через кван- товый канал с шумом. Вследствие декогерентизации в канале связи, Боб получает смешанные состояния, которые он должен декодировать. В этом случае х(£) характеризует максимальное количество классической инфор- мации, которое может быть передано Бобу через квантовый канал с шумом. Например, Алиса может послать Бобу п фотонов в определенных со- стояниях поляризации. Если предположить, что шум действует на каждый
5.4. Доступная информация 251 фотон независимо и что Алиса посылает фотоны в незапутанных состоя- ниях, тогда — максимальное количество информации, которое может быть передано Бобу с каждым фотоном Поскольку у(5) < S(p) 1, (5.130) отсюда, в частности, следует, что отдельный (незапуганный) фотон может переносить, самое большее, один бит классической информации. 5.4.1. Граница Холево Граница Холево для доступной информации не относится к разряду очевидных теорем, но подобно многим интересным результатам кванто- вой теории информации, она становится очевидной, ко.чь скоро установлена сильная субадцитивность энтропии фон Неймана. Здесь мы предположим наличие свойства сильной субаддитивности и покажем, что отсюда следует граница Холево. Напомним исходные данные. Алиса готовит квантовое состояние, из- влекаемое из ансамбля £ — {рх-рх}, а затем Боб выполняет ПОЗМ {Fy}. Совместным распределением вероятностей, управляющим приготовлением Алисы х и результатом Боба у является р(х,у) — pg.tr (Fvpa;). (5 131) Мы хотим показать, что (5.132) Поскольку сильная субаддитивность является свойством трех подси- стем, нам нужно определить три системы, к которым оно будет применять- ся. Наша стратегия состоит в приготовлении входящей системы X, в кото- рой хранится классическая запись того, какое приготовление было выбрано, и выходящей системы Y, классические корреляции которой с X управляют- ся совместным распределением p(z, у). Тогда, применяя свойство сильной субаддитивности кА’.У и нашей квантовой системе Q, мы сможем свя- зать 1(Х: У) с х(£)- Допустим, что начальным состоянием системы XQY является PXQY (5.133) где векторы |ж) взаимно ортогональные чистые состояния входящей си- стемы X, а |О> — частное чистое состояние выходящей системы У. Вычис-
252 Глава 5 ляя частичные следы, мы видим, что Рх = S(Px} = Я(М Pq - = Р 5(?<гу) = SCPq) = (5.134) I а так как векторы |.т) взаимно ортогональны, мы также имеем S(PXQY ) = S(Pxq) =~ - tr = X = ЩХ) + '^lPxS(p^- (5.135) X Теперь выполним унитарное преобразование, которое «отпечатывает» результат измерения Боба на выходящей системе Y. Предположим пока, что Боб выполняет ортогональное измерение {Еу }, где ЕЕ,--<5 ,Е (5.136) У У У * У У (вскоре мы кратко рассмотрим более общие ПОЗМ-ы). Наше унитарное преобразование Uqk действует на QY соитасно Чэн : 1°)у - 0 (5.137) v (где векторы [у) у взаимно ортогональны) и, следовательно, преобразу- ет Pxqy как Uqy : Pxqy ~* p'xqy Pj.|®)<^| ® ^ртЕу, ® |у){/|. (5.138) s:,y,v' Поскольку энтропия фон Неймана инвариантна относительно унитарною изменения базиса, то S{p'xqy) - S(pXQY) - Н(Х) + £PlS(pJ, X (5.139)
5.4. Доступная информация 253 а вычисляя частичный след уравнения (5.138) и используя (5.136), мы на- ходим Рху = 22^tr (Еурт) jx)(z| ® |т/)(у| = = £р(ЭД|ЭД(ЭД - 5(ЭД = H(X,Y). (5.140) Л,у Отсюда, очевидно, следует, что Ру - - 5(Ру) = Н(У). (5.141) у Применим теперь свойство сильной субаддитивности в форме S(Pxqy) t-S(p'y) < S(p'XY) -1 S(p'QY), (5.142) которая принимает вид Я(Х) + $>,ЭД) < Н(Х, У) н ЭД (5.143) или KX-.Y) - W(X) | Я(У)-Я(Х,У) < ЭД-£>,ЭД) = (5.144) Это и есть ipainina Холево. Одним из способов рассмотрения более общих ПОЗМ является расши- рение системы путем присоединения к ней еще одной подсистемы Z. Тогда мы конструируем унитарное преобразование U^yz, действующее как Uqvz •’ ® |0)у ® 10)® |у)у ® \y)'Zi (5.145) у так что p'xqyz = У? ^px^F^, ® ® |р)у|. (5.146) е,У,У' Тогда вычисление частичного следа по Z дает PXQY = ® 'fiyPxfi'y® |у){у\ (5.147)
254 Глава 5 р’*у" ® 1^иу1 = ~ -*• S'(Pxy) = (5.148) Оставшаяся часть доказательства проводится так же, как и выше. 5.4.2. Улучшение различимости: метод Переса — Вутерса Чтобы лучше познакомиться с концепцией доступной информации, рассмотрим однокубитовый пример. Алиса готовит одно из трех возмож- ных чистых состояний: объект со спином-1/2 ориентирован в одном из трех направлений, симмет- рично распределенных в и-плоскости. Каждое состояние a priori имеет вероятность 1/3. Очевидно, что «сигнальные состояния» Алисы не ортого- нальны: (УЧМ = (у’ткз) = (^2|<Рз> = —5- (5.150) Задачей Боба является: выполняя подходящее измерение, как можно больше узнать о том, что приготовлено Алисой. Матрицей плотности ан- самбля Алисы является Р=^(И)(р1Н |1, (5.151) энтропия которой S(p) = 1. Следовательно, граница Холево говорит нам, что взаимная информация приготовления Алисы и результата измерения Боба не может превышать одного бита.
5.4. Доступная информация 255 Хотя фактически доступная информация существенно меньше допус- каемого границей Холево одного бита. В этом случае ансамбль Алисы до- статочно симметричен, поэтому нетрудно угадать оптимальное измерение. Боб может выбрать ПОЗМ с тремя результатами, где «--1.2,3; (5-152) мы видим, что р(о|6) = = < О, а — Ь, (5.153) Следовательно, результат измерения а исключает возможность того, что Алиса приготовила а, но оставляет a posteriori равными вероятности (р 1 /2) двух других состояний. Полученная Бобом информация равна 1 -- Н(Х) - H(X\Y) -- log2 3 - I - 0,58496. (5,154) Чтобы показать, что эго измерение действительно оптимально, мы можем сослаться на вариант теоремы Дэвиса, которая гарантирует, что оптималь- ная ПОЗМ может быть выбрана с тремя Fo, образующими, как и три состо- яния входящего ансамбля, семейство симметрии третьего порядка. Этот ре- зультат серьезно ограничивает возможные ПОЗМ, так что можно проверить с помощью явных вычислений, что (5.152) оптимальна Таким образом, мы нашли, что доступная информация в ансамбле £ - {ра - 1/3} равна Асс(£) = log2 | — 0,58496.... (5.155) Граница Холево не достигается. Допустим теперь, что у Алисы достаточно много денег и она может позволить себе послать Бобу два кубита, каждый из которых снова извлечен из ансамбля £. Ее естественным решением будет приготовить для этого одно из девяти состояний Ю'/’ьХ щ ь = 1,2,3, (5.156) с вероятностью раЬ =1/9 каждое. Тогда наилучшая стратегия Боба, даю- щая, как и раньше, взаимную информацию 0,58496 битов на один кубит, состоит в выполнении ПОЗМ (5.152) на каждом из двух кубитов.
256 Глава 5 Но Алиса и Боб намерены поступить лучше. После обсуждения про- блемы с А. Пересом и В. Вутерсом они выбирают друтую стратегию. Алиса приготовит одно из трех двухкубитовых состояний а-1,2,3, (5.157) каждое из которых появляется с априорной вероятностью ра — 1/3. Рас- сматриваемый как один кубит, выбор Алисы управляется ансамблем но теперь между ее двумя кубитами имеется (классическая) корреляция - оба они приготовлены одним способом. Три вектора |Фа) линейно независимы и, следовательно, образуют ли- нейную оболочку трехмерного подпространства четырехмерного гильбер- това пространства двух кубитов. В домашнем упражнении вы покажете, что матрица плотности 3 Р-|Е|Ф«><Фа1 (5 158) (1=1 имеет ненулевые собственные значения 1/2, 1 /4 и 1/4, так что S{p) = -|logl - 2 (J log 1) - (5.159) Граница Холево требует, чтобы доступная информация на один кубит была меньше, чем 3/4 бита. По крайней мере это согласуется с тем. что можно превзойти ее значение 0,58496 на один кубит, достигнутое в методе девяти состояний. На первый взгляд, может показаться, что Алиса не в состоянии пе- редать такое количество классической информации Бобу, сс.ти она решает послать одно из всего лишь трех, вместо девяти, возможных состояний. Од- нако после некоторых размышлений этот вывод становится не очевидным. Действительно, Алиса имеет меньший выбор сигналов, но эти сигналы бо- лее различимы', вместо (5.150) мы имеем Wb) ~ / Ъ. (5.160) Бобу следует использовать эту улучшенную различимость при выборе сво- его измерения. В частности, он найдет более вьподным выполнить коллек- тивное измерение двух кубитов вместо измерения их по одному. Теперь уже не очевидно, каким будет оптимальное измерение Боба. Но он может привлечь общую процедуру, которая, хотя и не обязатель- но оптимальна, но по крайней мере обычно достаточно хороша. Назовем
5.4. Доступная информация 257 построенную с помощью этой процедуры ПОЗМ «достаточно хорошим из- мерением» (или ДХИ). Рассмотрим некоторый набор векторов |Фа), которые не предполага- ются ортогональными или нормированными. Мы хотим придумать ПОЗМ, которая может достаточно хорошо различать эти векторы. Прежде всего, построим С = £]Фо)(Фа|. (5.161) Это положительный оператор в подпространстве, натянутом на векто- ры |Фа). Следовательно, в этом подпространстве он имеет обратный опе- ратор G \ а обратный оператор имеет положительный квадратный ко- рень G-1/2. Теперь мы определяем (5.162) и видим, что в линейной оболочке векторов |ФЦ) EF.. -G-1'2 ^£|Фа)(Фа|^ G ^2GG“1/2 = 1. (5.163) Если необходимо, мы можем присоединить к этим Fa еще один положи- тельный оператор, проектор Fo па ортогональное дополнение рассматрива- емого подпространства и таким образом построить ПОЗМ. Она представ- ляет собой ДХИ, связанное с данным набором векторов |Фо). В частном случае, когда векторы |Фа) ортогональны Ю - Ж) (5.164) (где [Фа) ортонормированы), мы имеем ра = Е сад 1/2<м wom (|фс>ас“1/2<фс|) -= в,Ь,с - (5 165) то есть идеально различающее векторы |Фа) ортогональное и. следователь- но, оптимальное измерение Если векторы |ФП) линейно независимы, но
258 Глава 5 ие ортогональны, то ДХИ снова является ортогональным измерением (по- скольку п одномерных операторов в n-мерном пространстве могут обра- зовать ПОЗМ, если только они взаимно ортогональны), но в этом случае измерение может оказаться не оптимальным. В домашней работе вы построите ДХИ для векторов |ФО) из (5 157) и покажете, что / \2 р(а\а) (Фа|Ео|ФО) = 1 М + -L ) 0,971405, / \ 2 р(6(а) - (Фа |Еь|Фа) Ц1 - X j 0,0142977 (5.166) (при b -/ а). Отсюда следует, что условная энтропия входа Я(Х|У) ~~ 0,215893, (5 167) а поскольку Я(Х) — log2 3 — 1,58496, то приобретаемая информация I --Я(Х) - ЩХ|У) - 1,36907, (5.168) взаимная информация равна 0,684535 битов на один кубит. Таким обра- зом, улучшенная различимость сигналов Алисы действительно оправдала себя — мы превзошли 0,58496 битов, которые можно было извлечь из одно- го кубита. Мы все еще не достигли границы Холево (/ < 1,5 в этом случае), хотя и подошли к ней несколько ближе, чем раньше, Этот пример, впервые описанный Пересом и Вутерсом, преподносит несколько полезных уроков. Во-первых, Алиса в состоянии послать Бо- бу большее количество информации, «сократив» свой набор кодовых слов Ей лучше сделать выбор из меньшего количества более различимых сигна- лов, чем из большего количества менее различимых сигналов. Алфавит из трех букв кодирует больше, чем алфавит из девяти букв, Во-вторых, Боб способен считать больше информации, если он вы- полняет коллективное измерение, вместо измерения каждого кубита по от- дельности. Его оптимальное ортогональное измерение проецирует сигнал Алисы на базис запутанных состояний Описанное здесь ДХИ «оптимально» в том смысле, что оно дает наи- большее приобретение информации по сравнению с любым известным из- мерением Скорее всего это действительно максимальное значение I, кото- рое может быть достигнуто при любом измерении, но я не доказал э того.
5,4. Доступная информация 259 5.4.3. Достижимость границы Холево: чистые состояния Усвоив эти уроки, мы можем показать, что для заданного ансамбля чистых состояний можно построить n-буквенные кодовые слова, которые асимптотически достигают доступной информации S(p) на одну букву. Мы должны выбрать код, ансамбль кодовых слов, которые может при- готовить Алиса, и «декодирующую наблюдаемую» - ПОЗМ, которую будет использовать Боб, пытаясь различить кодовые слова Наша задача состоит в том, чтобы показать, что Алиса может выбрать 2П(5 таких кодовых слов, что с пренебрежимо малой вероятностью ошибки при п -»• оо Боб может определить, какое из них было послано. Мы не будем вникать во все детали доказательства, а удовольствуемся пониманием того, почему этот результат весьма правдоподобен. Конечно, главной идеей является привлечение случайного кодирова- ния. Алиса выбирает произведение сигнальных состояний ' • 1*4,)• (5 169) случайным образом извлекая каждую букву из ансамбля £ = {|<Рх), р,}- Как мы видели, для типичного кода каждое типичное кодовое слово имеет большое перекрытие с типичным подпространством Л'-п), размерность ко- торого dimA^ > Более того, для типичного кода управляющий каждой буквой частный ансамбль близок к £. Поскольку при больших п типичное подпространство очень велико, Алиса может выбрать много кодовых слов, тем не менее оставаясь уве- ренной в том, что характерное перекрытие двух типичных кодовых слов очень мало. С эвристической точки зрения типичные кодовые слова слу- чайным образом распределены в типичном подпространстве, а в среднем два случайных единичных вектора в пространстве размерности D имеют перекрытие 1/D. Следовательно, если |ц) и |w) — два кодовых слова, то (1(«М|2>л <2-n<s^>. (5.170) Здесь ( )л обозначает среднее по случайным типичным кодовым словам. Вы можете убедиться в том, что типичные кодовые слова действи- тельно однородно распределены в типичном подпространстве, как видно из дальнейшего: усредненное по ансамблю перекрытие случайных кодовых СЛОВ 1^;) - И J РаВН0 =- tr (р® • - - ® р)2. (5.171)
260 Глава 5 Теперь предположим, что мы ограничили след типичным подпростран- ством А(п\ это пространство имеет размерность diniA(n) < а соб- ственные значения сужения оператора р^ ~ р® • • (g р в подпростран- ство А-'^' удовлетворяют неравенству А < Следовательно: (!(«М|2>л = *-Гл [P(n)]2 < = 2-n(s-3<^ (5.172) где tr, обозначает след по типичному подпространству. Теперь предположим, что выбрано 2П^-Й^ случайных кодовых слов {|uj}. Тогда если (и^) произвольное фиксированное годовое слово, то < 2п(®Л-п(3-б'М-л<м'>+е: (5.173) здесь суммирование ведется по всем кодовым словам, а усреднение больше не ограничивается типичными кодовыми словами г в правой части возни- кает от атипичного случая. Теперь при любом фиксированном 8 и при до- статочно большом п мы можем выбрать 6' и г настолько малыми, насколько нам это нужно; таким образом, при усреднении по кодам и кодовым словам внутри кода последние становятся хороню различимыми при п оо. Теперь призовем на помощь несколько стандартных «шеннонизмов»: так как уравнение (5.173) справедливо в среднем по годам, то оно спра- ведливо и для некоторою частного кода. [Болес того, поскольку почти все коды обладают тем свойством, что частный (мар! инальный) ансамбль каж- дой буквы близок к £, то существует код с таким свойством, удовлетворя- ющий (5.173).] Теперь уравнение (5.173) справедливо, если мы усредняем по частному кодовому слову \и). Но, отбрасывая не больше половины го- довых слов, можно быть уверенными в том, что любое и каждое кодовое слово хорошо отличимо от всех остальных. Итак, Алиса может выбрать 2’1A'S’ хорошо различимых кодовых слов, которые становятся взаимно ортогональными в пределе п —* оо. При конеч- ном п Боб может выполнить ДХИ, которое стремится к оптимальному ор- тогональному измерению при п —* ое. Следовательно, отнесенная к одной букве доступная информация ±Асс(£<”>)-.<?(?)-<5 (5.174) достижима, где £№ обозначает ансамбль п-буквенных кодовых слов Али- сы.
5.4. Доступная информация 261 Конечно, при любом конечном п ПОЗМ Боба будет представлять собой сложное ко.ыективное измерение, выполняемое на всех п буквах. Чтобы дать настоящее доказательство достижимости, необходимо тщательно про- анализировать ПОЗМ и пределы вероятности ее ошибки. Это было выпол- нено Хауслсйденом и др1. Приведенное здесь доказательство на пальцах, по крайней мере, показывает, почему их вывод не удивителен. Из трапицы Холево и субаддитивности энтропии следует также, что отнесенная к одной букве доступная информация асимптотически не может превзойти S(p). Граница Холево утверждает, что Аес(£<й)) S(p(n)), (5.175) где р^ обозначает матрицу плотности кодовых слов, а субаддитивпость энтропии предполагает, что п ^<п))<Езд, <5-176) г=1 где pj — приведенная матрица плотности г-ой буквы. А так как каждая р,- асимптотичсски стремится к р, то liin |Acc(£(n)) < lim ^S(p^) S(p). (5.177) П,- »сю {i П—►ОС 11 Чтобы получить это ограничение, мы не делали никаких предположений от- носительно кода, за исключением того, что частный ансамбль каждой буквы асимптотически стремится к £. В частности, это ограничение справедливо, даже если кодовые слова являются не сепарабельными, а запутанными со- стояниями. Таким образом, мы показали, что А(р) является оптимальной доступной информацией на одну букву. Можно определить разновидность емкости канала связи, связанной с конкретным алфавитом чистых кван говых состояний, «емкость для за- данного алфавита». Предположим, что Алиса обеспечена источником кван- товых состояний Она может создать любое из состояний |^ж), но выбор априорных вероятностей этих состояний зависит от нес. Емкость для задан- ного алфавита представляет собой максимальную доступную информа- цию на одну букву, которой она может достичь при наилучшем возможном ’Р. Hausladen, R.. Jozsa, В. Schumacher, М. Westmoreland and W.K. Wooters. Classical information capacity of a quantum channel. Pkyt Rev. A 54 (1996) 1869-1876. [См. также А. С. Холево. Введение в квантовую теорию информации. МЦНМО, М.: 2002. Прим. peii. ]
262 Глава 5 распределении {p-J. Мы нашли, что С, = maxS(p). 4 {pj (5.178) С? представляет собой оптимальное количество классических битов, кото- рое можно (асимптотически) закодировать в одной букве данного конкрет- ного алфавита квантовых состояний из источника. 5.4.4. Достижимость границы Холево: смешанные состояния Теперь мы хотели бы распространить предыдущие рассуждения на бо- лее общий случай. Будем рассматривать n-буквенные сообщения, в кото- рых частным ансамблем для каждой буквы является ансамбль смешанных состояний £ = (5.179) Мы хотим показать, что в расчете на одну букву (асимптотически при п- > ос) можно переслать х(£) битов классической информации. Вновь нашей задачей является: (1) конкретизировать код, которым могут поль- зоваться Алиса и Боб, ансамбль которою (по крайней мере асимптотиче- ски) буква за буквой создает ансамбль £; (2) конкретизировать декодиру- ющую наблюдаемую Боба, ПОЗМ, которую он будет использовать, пыта- ясь различить кодовые слова; (3) показать, что при п —> оо вероятность ошибки Боба стремится к нулю. Как и при обсуждении случая чистых со- стояний, я не буду здесь представлять полное доказательство (см. Холе- во1 , а также Шумахер и Вестморленд3). Вместо этого я предложу вашему вниманию аргументы (даже с большим, чем ранее, количеством объясне- ний на пальцах, если такое возможно), показывающие, что их вывод ра- зумен. Как обычно, мы будем демонстрировать достижимость с помощью ме- тода случайного кодирования. Алиса выбирает кодовые слова из смешан- ных состояний, каждая буква которых извлекается из ансамбля £. То есть кодовое слово РЖ1 (5 180) A. S. Hoievo. The Capacity of the Quantum Channel with General Signal States. IEEE Trans Inf Theory, 44 (1998) 269-273; quant-ph/9611023. гВ. Schumacher and M. D. Westmoreland. Sending Classical Information Via Noisy Quantum Channels. Phys. Rev A 56 (1997) 131-138. [На русском языке доказательство теоремы Холево Шумахера Вестморленда (ХШВ) можно найти в книге М. Нильсен, И. Чанг, Квантовые вы- числения и квантовая информация, М.: Мир, 2006. Прим ред.]
5.4. ДОСТУПНАЯ ИНФОРМАЦИЯ 263 выбирается с вероятностью рх рх -рХп- Идея в том, что каждое типич- ное кодовое слово может рассматриваться как ансамбль чистых состояний, почти все носители которого находятся в определенном типичном подпро- странстве Если перекрытия типичных подпространств различных кодовых слов малы, тогда Боб будет в состоянии выполнить ПОЗМ, которая с малой вероятностью ошибки идентифицирует характеристику типичного подпро- странства сообщения Алисы, Какова размерность типичною подпространства типичного кодового слова? Если мы усредняем по кодовым словам, то средняя энтропия кодо- вого слова равна NT РТ1Рх2 ?xJ>(p*l ®РХ, (5.181) тг. Используя аддитивность энтропии произведения состояний и — Ь мы получаем {S^-n^pxS(px) = n{S). (5.182) т При больших п энтропия кодового слова с большой вероятностью близка к ее среднему значению, более того, велика вероятность того, что собствен- ные значения ® ® рх„ близки к 2""(5\ Другими словами, типичное кодовое слово pXi 0 • • ® рх^ имеет носитель в типичном подпространстве размерности 2ri:'s'! Это утверждение является близким аналогом высказывания (ключе- вого в доказательстве теоремы Шеннона о кодировании для канала связи с шумом) о том, что если через классический канал связи с шумом послано типичное сообщение, то количество типичных сообщений, которые могут быть получены, равно Далее доказательство следует знакомым путем. Для каждого типич- ного сообщения хгх2 . хп Боб может построить «декодирующее подпро- странство» размерности 2п«5>+г> с уверенностью, что почти все носители сообщения Алисы принадлежат этому подпространству. Его ПОЗМ будет предназначена для определения, в каком декодирующем подпространстве находится сообщение Алисы. Ошибки декодирования будут маловероятны, если малы перекрытия типичных декодирующих подпространств. Несмотря на то, что на самом деле Боба интересует только оценка декодирующего подпространства (и, следовательно, х{х2 . . хп), предполо- жим, что он выполняет полное ДХИ, определяемое всеми векторами, об- разующими линейную оболочку всех тапичных подпространств кодовых
264 Глава 5 слов Алисы. (При больших п это ДХИ будет стремиться к ортогонально- му измерению, пока число кодовых слов не слишком велико.) Он получает конкретный результат, который, вероятно, находится в типичном подпро- странстве размерности 2nS&\ определяемом источником р <55 р р. Более того, этот результат, вероятно, находится в декодирующем подпро- странстве сообщения, которое Алиса на самом деле послала. Поскольку результаты измерения Боба однородно распределены в пространстве раз- мерности 2nS, а ансамбль чистых состояний, определяемый частным де- кодирующим подпространством, имеет размерность то среднее перекрытие вектора, определенного результатом Боба, с типичным декоди- рующим подпространством равно: 9n((S) +<f) -----— 2-n(,s-{5)-d) 2 „(х й) (5.183) Если Алиса выбирает 2nR кодовых слов, то средняя вероятность ошибки декодирования будет 2ПЙ2--"(х-б) 2 R~s') (5 184) Мы можем выбрать R любым, меньшим тогда эта вероятность ошибки будет очень мала при т? —» оо. Эти доводы показывают, что усредненная по случайным кодами кодо- вым словам вероятность ошибки мала. Как обычно, мы выбираем конкрет- ный код и отбрасываем некоторые кодовые слова, чтобы получить малую вероятность ошибки для каждого кодовою слова. Более того, конкретный код может быть выбран типичным, так что частный ансамбль каждого ко- дового слова стремится к 8 при п —> оо. Мы приходим к выводу, что отне- сенная к одной букве доступная информация у асимптотически достижима. Но своей структуре эго доказательство близко к аналогичному дока- затсльству соответствующей классической теоремы о кодировании, В част- ности, величина х здесь играет такую же роль, как I в теореме Шеннона. В то время как 2-п/ является вероятностью того, что конкретная типич- ная последовательность лежит в определенной сфере декодирования, 2 п< представляе г собой перекрытие конкретного типичного состояния с опре- деленным декодирующим подпространством. 5.4.5. Ёмкость канала связи Комбинируя границу Холево с выводом о том, что достижимы х би- тов на одну букву, можно получить выражение для классической емкости
5.4. Доступная информация 265 квантового канала связи. (Но с предупреждением: мы уверены, что згу «ем- кость» нельзя превысить, если только мы отказываемся от использования запутанных кодовых слов.) Алиса то говит п-буквенные сообщения и посылает их Бобу через кван- товый канал связи с шумом, описываемый суперопсратором $. Предполо- жим, что упомянутый супероператор $ действует на каждую букву незави- симо (квантовый канал без памяти). Боб выполняет ПОЗМ, которая опти- мизирует получаемую им информацию относительно того, что приготовила Алиса. Фактически окажется, что лучше всего Алиса готовит сообщения из чистых состояний (это следует из субаддитивности энтропии). Если кон- кретная буква приготовлена как чистое состояние то Боб получит (5-185) А если Л.шса посылает чистое состояние ) ), то Ьоб получит смешанное состояние ® •••<??> р.г . Таким образом, ансамбль кодовых слов Алисы определяет ансамбль смешанных состояний Е^п'>, получаемых Бобом. Следовательно, оптимальное количество получаемой Бобом инфор- мации по определению равно Лсс(£<п)), что удовлетворяет границе Хо- лево. Асс(Ж) (5.186) Теперь ансамблем Боба является Ж, (5.187) где х7.... ,хп) совершенно произвольное распределение вероятно- стей кодовых слов Алисы. Вычислим х для этого ансамбля. Заметим, что X;,.. ,а„ ----- Жы Е...+s(pxj] -- Ж1 Т2 + 1>ЖЖя). (5.188)
266 Глава 5 где, например, pi(xj) = £2 . ,хп) час гное распределение Х2’ ’ >Хп вероятностей для первой буквы. Более тою, из субаддитивности энтропии мы имеем: S(~P{n}) < S(-P1) + S(p2) 4 ... + S(pn), (5.189) где Д- — приведенная матрица плотности i-ой буквы. Комбинируя (5.188) и (5.189), мы находим, что х(£(п)) < хб) + ХЙ) + + х(4)> (5.190) где Ёг — маргинальный ансамбль, управляющий i-ой буквой, полученной Бобом. Неравенство (5.190) применимо к любому ансамблю факторизуе- мых состояний. Теперь для канала, описываемого супероператором $, определим ем- кость канала по отношению к факторизуемым состояниям 6’($) =тахх($(£)). (5.191) Следовательно, для каждого слагаемого в (5.190) С и мы получаем < пС, (5.192) где Е'п> — произвольный ансамбль факторизуемых состояний. В частности, из границы Холево мы приходим к заключению, что количество получае- мой Бобом информации ограничено сверху величиной пС. Но мы видели, что для любого Е можно асимптотически достичь у(8(£)) битов на одну букву сообщения при правильном выборе кода и декодирующей наблюдае- мой. Следовательно, С представляет собой оптимальное количество битов на одну букву, которое может быть передано через канал с шумом с исче- зающе малой вероятностью ошибки при условии, что сообщения, которые готовит Алиса, представляют собой факторизуемые состояния. Мы оставили открытой возможность того, что емкость относительно факторизуемых состояний С($) может быть превышена, если позволить Алисе готовить запутанные состояния из ее п букв. Неизвестно (на январь 1998 г.), существуют ли квантовые каналы, более высокая пропускная спо- собность которых может быть достигнута при использовании запутанных сообщений. Это один из многих интересных открытых вопросов теории квантовой информации1, ' Обзор некоторых результатов относительно пропускной способности квантового канала при использовании запутанных сообщений см. в книге А. С. Холево, Введение в квантовую теорию информации, МЦНМО, М., (2002). — Прим ред.
5.5. ПЛОТНОСТЬ ЗАПУТЫВАНИЯ 267 5.5. Плотность запутывания Прежде чем завершить наш обзор теории квантовой информации, об- ратимся к еще одной теме, в которой центральную роль играет энтропия фон Неймана’ количественное определение запутывания. Рассмотрим два бинарных чистых состояния. Одно из них — макси- мально запутанное состояние двух кубитов |ф+> =-^(|00> 4-111». (5.193) Другое - частично запутанное состояние двух кутритов |Ф)-^|00) 1 ±|11) + ±|22). (5 194) V2 z " Какое из них более запутано? Непосредственно не видно, что ответ на этот вопрос имеет глубокий смысл. Почему можно найти однозначный способ упорядочения всего кон- тинуума бинарных состояний в соответствии со степенью их запутывания? Можем ли мы сравнивать пару кубитов с парой кутритов иным способом, нежели яблоко с апельсином? Определяющим свойством запутывания является то, что оно не мо- жет быть создано локальными операциями В частности, если Алиса и Боб делят бинарное чистое состояние, то они не могут увеличить его число Шмидта никакими локальными операциями — никаким унитарным преоб- разованием или ПОЗМ, выполняемыми Алисой или Бобом, даже если они обмениваются классическими сообщениями о своих действиях и резуль- татах измерений. Таким образом, число, используемое для количествено- ю определения запутывания, должно обладать тем свойством, что локаль- ные операции его нс увеличивают. Очевидным кандидатом является число Шмидта, но после некоторого размышления оно уже не кажется достаточно удовлетворительным. Рассмотрим состояние |Фе> - у/1 -2|е|2(00)+£|П)н е|22), (5.195) имеющее число Шмидта, равное трем при любом ]е| > 0. Можем ли мы на самом деле сказать, что |Ф£) «более запутано», чем ^+)? В конце кон- цов, запутывание может рассматриваться как ресурс — мы можем плани- ровать использовать его, например, для телепортации. Кажется очевидным, что |Ф£) (при |е| << 1) менее ценный, чем |<5+), ресурс.
268 Глава 5 Тем нс менее оказывается, что существует естественный и разумный способ количественного описания запутывания любою бинарного чистого состояния. Чтобы сравнить два состояния, выполним локальные операции, чтобы обменять их запутывание на гот «валютный эталон», который можно сравнивать непосредственно. Таким «валютным эталоном» является макси- мально запутанное состояние. Точное утверждение о взаимозаменяемости (посредством локальных операций) различных форм запутывания неизбежно будет асимптотиче- ским. То есть для того чтобы дать точное количественное описание за- путывания конкретного бинарною чистого состояния представим, что мы хотим приготовить п идентичных копий этого состояния. В нашем распоряжении имеется большой запас максимально запуганных пар Белла, поделенных между Алисой и Бобом. Они должны использовать k пар Белла (!$ав) и с помощью локальных операций и классических средств связи приготовить п копий требуемого состояния (|^)ав)П- Чему равно мини- мальное число Ат1П пар Белла, необходимое для решения этой задачи? А теперь предположим, что п копий |^)дВ уже приготовлены. Али- са и Боб должны выполнить локальные операции, которые преобразуют запутывание (Ivab))" назад к стандартной форме; то есть они долж- ны извлечь k' пар Белла (|ф)лв) . Чему равно максимальное количе- ство к'т!Л пар Белла, которые могут быть выделены (локальным образом) из (МавР Поскольку невозможность порождения запутывания с помощью ло- кальных операции является нерушимым принципом, то несомненно, что k',nax^kmm. (5.196) Однако можно показать, что Ь I-' = 1йп -^ВДап). (5-197) В этом смысле локальное преобразование п копий бинарного чистою со- стояния IV-1) ab в к' запутанных пар является асимптотически обратимым процессом. Так как п копий |у) АВ можно заменить к парами Белла и наобо- k рот, то отсюда следует, что - пар Белла однозначно характеризуют степень запутывания, переносимого состоянием |г/')дя- ^УДем называть отноше- ние k/п (в пределе п оо) запутыванием Е состояния 'с’/А£. Величина Е измеряет, какие требуются затраты (в парах Белла), чтобы создать |?/?)AR,
5 5 Плотность ЗАПУТЫВАНИЯ 269 а также значение lv/дв кзк ресурса (то есть количество кубитов, которые можно телепортировать с помощью |^)дв)- Чему равно Е для данного конкретного чистого состояния Мо- жете ли вы угадать ответ? Это E = S(pA) =S(pB), (5.198) запутывание является энтропией фон Неймана матрицы плотности Али- сы рА (или матрицы плотности Боба рв). Это, очевидно, правильный от- вет в том случае, когда |т>)дВ является произведением к пар Белла. В этом случае рл (или рв) равна |1 для каждого имеющегося в распоряжении Алисы кубита Ра (5.199) и 5(рд) = kS - к. (5.200) Теперь нужно понять, почему Е - S(pA) является правильным ответом для любого бинарного чистого состояния. Прежде всего, мы хотим показать, что если Алиса и Боб делят к = - n[S(pA) + Л] нар Белла, то они могут (с помощью локальных операций) с высокой точностью воспроизведения приготовить (IVVab)”- Они могут решить эту задачу, комбинируя квантовую телепортацию со сжатием Шу- махера Во-первых, локальным образом манипулируя находящейся в ее рас- поряжении бинарной системой АС, Алиса конструирует состояние IV’) дс (п его копий). Таким образом, состояние системы С можно рассматривать как чистое состояние, извлеченное из ансамбля, описываемого матрицей плотности рс, где S(pc) — А’(рд). Затем Алиса выполняет сжатие Шу- махера над ее п копиями С, сохраняя хорошую точность воспроизведения, несмотря на то, что типичные состояния из {Нс)п сжимаются в простран- ство ' с (5.201) Теперь Алиса и Боб могут использовать п[5(рЛ) 1 Л] поделенных между ними пар Белла чтобы телепортировать сжатое состояние из пространства Алисы (7Yc)n в пространство Боба \'Ни}п. Телепортация, которая в прин- ципе имеет идеальную точность воспроизведения, требует только локаль- ных операций и классических средств связи, если Алиса и Боб делят необ- ходимое количество пар Белла Наконец, Боб развертывает (декомпрессия
270 Глава 5 Шумахера) полученное им состояние, тогда Алиса и Боб деляг (Май)11 (со сколь угодно высокой точностью воспроизведения при п —► оо). Предположим теперь, что Алиса и Боб приготовили состояние (|чД) АВ)п. Так как , вообще говоря, частично запутанное состояние, го поделен- ное между ними запутывание находится в разбавленном виде. Алиса и Боб хотят концентрировать поделенное между ними запугывание, сжимая его до минимально возможного гильбертова пространства; то есть они хотят конвертировать его в максимально запутанные пары. Мы покажем, что с высокой вероятностью успеха Алиса и Боб могут «выпарить» из (|^) Ав) как минимум k' =- n[S(pA) - <5] (5.202) пар Белла Поскольку мы знаем, что Алиса и Боб не могут локальным образом порождать запутывание, то они не могут с помощью локальных операций превратить к пар Белла в к' > к пар, по крайней мере не с высокими точностью воспроизведения и вероятностью успеха. Тогда отсюда следует, что nS(pA) является минимальным количеством пар Белла, необходимым для создания п копий \Ф)Ав> и чт0 ~ максимальное количество пар Белла, которое может быть извлечено из п копий |Ф)АЙ. Если бы мы могли более эффективно создавать из пар Белла или более эффектив- но извлекать пары Белла из |ф)ле, тогда у Алисы и Боба был бы способ, которым они увеличили бы свой запас пар Белла с помощью локальных операций, что, как известно, невозможно. Следовательно, если мы можем найти способ выделить к' = п[5(р^) - <5] пар Белла из п копий |у>)лв, то мы знаем, что Е = S(pA). Чтобы проиллюстрировать плотность запутывания, представим, что Алиса и Боб имеют п копий частично запутанного чистого состояния двух кубитов. |ф(0))лв = c6s0|OO) -Б sin 0|11>. (5.203) (Подобным образом можно записать любое бинарное чистое состояние, ес- ли выбрать базис Шмидта и подходящее соглашение относительно фазы.) То есть Алиса и Боб делят состояние = (cos0|OO)+sm0|ll))n. (5.204) Пусть теперь Алиса (или Боб) выполняет локальное преобразование ее (его) п кубитов. Алиса измеряет вдоль оси z полный спин ее п кубитов п <ла1-5>М- (5.205) <=1
5.5. Плотность ЗАПУТЫВАНИЯ 271 Главной чертой этого измерения является его «трубость». Наблюдае- мая <7з°да1 является сильно вырожденной. Алиса проецирует состояние ее п спинов на одно из больших собственных пространств этой наблюдаемой. Она не измеряет спин каждого кубита; фактически она старается не полу- чить никакой другой информации, кроме значения или, что эквива- лентно, количества ориентированных «вверх» спинов. Если мы разложим (5.204), то получим всего 2ге слагаемых. Среди пих - ("J слагаемых, в которых ровно т из имеющихся у Алисы куби- тов имеют значение +1. Каждое из этих слагаемых содержит коэффициент (cos /9)"’ (sin 8)т Таким образом, вероятность того, что измерение Алисы обнаружит т направленных «вверх» спинов, равна Р(тп) - ( П ) (cos2 0)n~m(sin2 (5.206) \7П/ Более того, если она получила этот результат, то ее измерение приготови- ло равновзвешенную суперпозицию всех состояний, имеющих т ори- ентированных «вверх» спинов. (Конечно, поскольку спины Алисы и Боба идеально скоррелированы, то если бы Боб измерил <r^ai, то он получил бы точно такой же, как и Алиса, результат. Альтернативно о своем резуль- тате Алиса могла бы доложить Бобу в классическом сообщении и тем са- мым избавить его от хлопот выполнять измерение самому) Независимо от результата измерения Алиса и Боб теперь делят новое состояние в котором все ненулевые собственные значения р'А (и р'в) равны. При большом п распределение вероятностей Р(т) в (5.206) имеет рез- кий пик — вероятность близка к единице, когда т/n близко к sin2 f) и PV-f П, А 2пЯ<3‘п2(5.207) \т/ \nsiirdj где Н(р) = —plogp — (1 — р) log(l - р) - функция энтропии. То есть с ве- роятностью, большей чем 1 — е, поделенное теперь между Алисой и Бобом запутанное состояние имеет число Шмид та (^), удовлетворяющее 2п[Я(з1п2 0)-<5] < < 2nlH(sir|2sW. (5.208) \mJ Теперь Алиса и Боб хотят превратить поделенное ими запутывание в стандартную пару Белла Это было бы просто, если бы число Шмид- та их максимально запутанного состояния оказалось степенью двойки. То- гда Алиса и Боб могли бы выполнить унитарное преобразование, которое
272 Глава 5 перевело бы 2*-мерный носитель его/ее матрицы плотности в гильбертово пространство k кубитов, а затем они могли бы отбросить остаток их куби- тов. Тогда оставленные ими k пар были бы максимально запутанными. Конечно, (г" ) не обязано быть близким к степени двух. Но если Алиса и Боб разделили множество партий из п копий частично запутанного состо- яния, то они могут концентрировать запутывание в каждой партии После такой обработки Г партий они получат максимально запутанное состояние с числом Шмидта (5.209) где каждое mt, как правило, близко к nsin2 &. Для любою е > 0 найдет- ся некоторое € такое, что это число Шмидта в конечном счете окажется близким к степени двух 2^<iVSchm<2^(l + fc-). (5.210) При этих условиях Алиса или Боб могут- выполнить измерение, которое пытается проецировать носитель размерности 2*€(1 + е) ею/ее матрицы плотности на подпространство размерности 2к[, достигая цели с веро- ятностью 1 - г. Затем они переводят носитель в гильбертово простран- ство kt кубитов и отбрасывают остаток их кубитов. Обычно ke близко к Ы’Щет2 0), так что с близкой к единице вероятностью успеха они вы- делят около Н (sin2 9} максимально запутанных пар из каждого частично запутанного состояния Конечно, несмотря на то, что количество ориентированных вверх спи- нов, которые Алиса (или Боб) находит в своем измерении, обычно близко к nsin2 0, оно может флуктуировать около этого значения. Иногда, если повезед они смогут выделить больше, чем H(sin20), пар Белла на одну копию |ф(#))дВ. Но всрояпюсть такого существенно лучшего результата пренебрежимо мала при п со. Эти рассуждения легко распространяются на бинарные чистые состо- яния в более широких гильбертовых пространствах. Бинарное чистое со- стояние с числом Шмидта s может быть представлено в базисе Шмидта как |г)(а1?а2, ...,ая))лв = ajll) + а2|22) + ...ajss). (5.211) Тогда Алиса (или Боб) может измерить полное число векторов |1), полное число векторов |2) и так далее в имеющемся в ее (его) распоряжении со- стоянии (К')лв) • lie™ она (он) находит векторов 11), тг векторов |2)
5.5. Плотность ЗАПУТЫВАНИЯ 273 и т. д., тогда ее (ею) измерение готовит максимально запутанное состояние с числом Шмидта . 1Vfichir' При больших т Алиса обычно будет находить mf ~ (аг-|2п (5.213) и, следовательно, 7VSchm ~ 2пЯ, (5.214) где Н= -I2lai!31ogla’l2 " (5-215) г Таким образом, из п копий состояния IV1)дв асимптотически при п ос может быть выделено близкое к 5(рл) количество пар Белла. 5.5.1. Запутывание смешанного состояния Мы нашли хорошо мотивированный и однозначный способ количе- ственного описания запутывания бинарного чистого состояния \ф) Ав: Е = = S(pA), где Ра — trH (1^)лв ав ('^D- (5 216) Значительный интерес также представляет количественное описание запу- тывания бинарного смешанного состояния. К сожалению, запутывание сме- шанного состояния не так хорошо понято, как запутывание чистого состо- яния, и является предметом текущих исследований. Допустим, что рАВ — поделенное Алисой и Бобом смешанное состо- яние и что они имеют п идентичных копий этого состояния. Предположим также, что, используя локальные операции и классические средства связи, Алиса и Боб могут приготовить (рАВ) из к пар Белла с асимптотически (при п —* оо) хорошей точностью воспроизведения и высокий вероятно- стью успеха. Определим F — запутывание формирования рАВ как ь Г(р,4В)- lim (5.217) п—>оо Далее, предположим, что Алиса и Боб могут использовать локальные опе- рации и классическую связь, чтобы выделить к' пар Белла из п копий рАв.
274 Глава 5 Определим D — запутывание выделения рАВ как k1 D(Pab)= Um (5.218) п—*сю tL Для чистых состояний мы нашли D ~ Е = F. Но для смешанных со- стояний явные общие формулы для D или F неизвестны. Поскольку' запу- тывание не может создаваться локально, мы знаем, что D С F, по (по со- стоянию на январь 1998 г.) не известно, выполняется ли равенство D - - — F. Однако имеются сильные подозрения, что для смешанных состоя- ний D < F. Чтобы приготовить смешанное состояние (р^)" из чистого (I^+)ab ab (^+ мы должны пренебречь некоторой квантовой информа- цией. Было бы удивительно, если бы этот процесс оказался (асимптотиче- ски) обратимым. Полезно различать два разных типа запутывания выделения. I)t обо- значает количество пар Белла, которые могут быть выделены, если раз- решена только односторонняя классическая связь (например, Алиса мо- жет посылать сообщения Бобу, но не может получать сообщения оз него). !д2 - D обозначает запутывание выделения, если классическая связь ничем не ограничена. Известно, что для некоторых смешанных состоя- ний < D-2 и, следовательно, Dv < F (тозда как для чистых состоя- ний Dr = D2 = F). Одной из причин интереса к запутыванию смешанных состояний (и, в частности, kF/) является его связь с передачей квантовой инфор- мации через квантовые каналы с шумом. Если в квантовом канале связи, описываемом сунеронератором $, уровень шума не слишком высок, то мож- но построить п-буквеииый блоковый код такой, что квантовая информация может быть закодирована, послана через канал ($)п, декодирована и вос- произведена со сколь угодно высокой точностью при п оо. Оптимальное количество закодированных кубитов на одну букву, которое может быть послано через канал, называется емкостью квантового канала (7($). Оказы- вается, что <7($) может быть связана с частного смешанного состояния, связанного с каналом, — по мы пока отложим дальнейшее обсуждение ем- кости квантового канала. 5.6, Резюме Энтропия Шеннона в сжатие классических данных. Энтропия Шеннона ансамбля X -- {х.р(т)} равна Н(Х) = —(logp(rc)); она коли- чественно определяет сжимаемость классической информации. Сообщение
5.6. Резюме 275 длиной в п букв, каждая буква которого независимо извлекается из А, может быть сжато до Н(Х) на одну букву (но не более) и, несмотря на э то, все же может быть'декодировано со сколь угодно высокой точностью при п —* ос. Взаимная информация и емкость классического канала связи. Вза- имная информация f(X\Y) = И(Х) б H(Y) - H(X,Y} количественно определяет, насколько коррелированы ансамбли X и У; если мы узнаем значение у, то приобретаем (в среднем) 1(Х;У) битов информации об х. Емкость классического шумящего канала связи без памяти равна С — - тах.[р^1(Х;У). Это максимальное количество битов на одну букву, которое может быть передано через канал (используя наилучшим возмож- ный код) с пренебрежимо малой вероятностью ошибки при п ос. Энтропия фон Неймана, информация Холево и сжатие квантовых данных. Энтропия фон Неймана матрицы плотности р равна S(p) -trplogp, (5.219) а информацияХолево ансамбля £ — {рТ~Рх} квантовых состояний равна Х(£) - S (£p.pj - EpkS(p.). (5.220) Энтропия фон Неймана количественно определяет сжимаемость ансамбля чистых квантовых состояний. Сообщение длиной в п букв, каждая буква которого независимо извлекается из ансамбля }, может быть сжа- то до 5(р) кубитов на одну букву (но не более) и, несмотря на это, вес же может быть декодировано со сколь угодно высокой точностью воспро- изведения при а —» ос. Если буквы извлекаются из ансамбля £ смешанных квантовых состояний, то невозможно сжатие с высокой точностью воспро- изведения до менее чем х(5) кубитов на одну букву. Доступная информация. Доступная информация ансамбля £ кван- товых состояний представляет собой максимальное количество битов ин- формации, которое (в среднем) можно получить о приготовлении состоя- ния с помощью наилучшего возможного измерения. Доступная информа- ция не может превысить информацию Холево ансамбля. Можно построить такой и-буквенный код, что частный ансамбль каждой буквы будет бтизок к £, а доступная информация на одну букву - к х(£). Емкость квантового канала связи $ по отношению к факторизуемым состояниям равна С($)-max*($(£)) (5.221)
276 ГЛАВА 5 Это максимальное количество классических битов на одну букву, которое может быть передано через квантовый канал с пренебрежимо малой ве- роятностью ошибки при я -юс при условии, что каждое кодовое слово является тензорным произведением букв-состояний. Плотность запутывания. Запутывание Е бинарно] о чистого состо- яния Ав равна Е = S(pA), где рА - trB (|V)ab авШ- с помощью локальных операций и классических средств связи можно приготовить п копий IV) дв ю (но не из ЧУ1Ъ меньшего количества) пар Белла, а также можно выделить пЕ (но не больше) пар Белла из п копий |V)ab (асимпто- тически при п —» оо), 5.7. Упражнения 5.1. Различимость неортогональных состояний. Алиса приготовила один куби т в одном из двух (неортогональных) состояний W - О / cos | = 1 I 4 л \ Sin 2 / (5.222) где 0 < & < я-. Бобу известно значение в, но он не знает, приготови- ла Алиса |«) или |v), и ему нужно выполнить измерение, чтобы как можно больше узнать о приготовленном Алисой состоянии. Боб рассматривает три возможных измерения. а) Ортогональное измерение с Е5 = |u)(u|, Е2 = 1 - |тг)Н- (5.223) (В этом случае, если Боб получит результат 2, то он будет знать, что Алиса должна была приготовить |v).) Ь) ПОЗМ с тремя исходами Fi = 4(1 - |«)('u|), F2-4(l-|i>)(v|), F3 (1 - 24)1 ( 4(|u)(«| + |«)(tr|), (5.224) где А имеет максимальное совместимое с положительностью F3 значение. (В этом случае Боб однозначно определит приготов- ленное состояние, если по;гучит результат 1 или 2, но ничего не узнает из результата 3.)
5.7. Упражнения 277 с) Ортогональное измерение с Ej = МН, Е2 - 1 • МН, (5.225) (В этом случае Е, и Е2 представляют собой проекторы на спи- новые состояния, ориентированные в плоскости OXZ перпен- дикулярпо оси, направленной вдоль биссектрисы угла между |w) и |и).) Найдите среднюю информацию 1(8}, приобретаемую Бобом (взаим- ную информацию между приготовленным состоянием и результатом измерения) во всех трех случаях, и изобразите графики всех их, как функций 0. Какое измерение следует выбрать Бобу? 5.2. Относительная энтропия. Относительная энтропия Д(р|<т) двух мат- риц плотности р и <т определяется соотношением = trp(logp-log<r). (5.227) Покажите, что 8(р\а} неотрицательна, и выведите некоторые след- ствия этою свойства. а) Дифференцируемая вещественная функция вещественной перемен- ной называется вогнутой, если для всех хну f(u) ~ f(x) (у ~x)f,(x}. (5.228) Покажите, ч ю если а и b наблюдаемые, a f - вогнутая, то tr [/(b) - /(а)] st tr [(b - а)/'(а)]. (5.229) Ь) Покажите, что f(x) — -хlogх является вогнутой функцией при х > 0. с) Используя (а) и (Ь), покажите, что 3(р{<т) 0 для любых двух матриц плотности р и <т, d) Используя неотрицательность 5(р|<т), покажите, что если р имеет носитель в пространстве размерности D, то S(p) st log D. (5.230)
278 Глава 5 е) Используя неотрицательность относительной энтропии, докажите субаддитивность энтропии S(Pab) < s(Pa) + ^(Pb)- (5.231) [Указание. Рассмотрите относительную энтропию рА ® рв и Раи-] f) Используя субаддитивность, докажите вогнутость энтропии S ^А^(рД (5.232) где А, вещественные положительные числа, сумма которых рав- на единице. Указание. Примените свойство субаддитивности к Рав — ^3\(pJa ® (Ы(ег1)в• i (5.233) g) Используя свойство субаддитивности, докажите неравенство тре- угольника (также называемое неравенством Араки — Ли ба). S(pAB) > \S{pA) - 5(Рв)\. (5.234) [Указание. Рассмотрите очищение рАВ: то есть постройте чистое состояние W)ABC такое, что рАВ - trc (|^)авс abc(V’I)- Затем примените свойство субаддитивности к pBf7.] 5.3. Монотонность Линдблада — Ульмана. Согласно теореме, доказанной Линдбладом и Ульманом, относительная энтропия на НА ® Нв обла- дает свойством, называемым монотонностью ^'(PaIo’a) ^(Рав^ав}- (5.235) Относительная энтропия двух матриц плотности системы АВ не мо- жет быть меньше, чем редуцированная относительная энтропия под- системы А. а) Используя монотонность Линдблада - Ульмана, докажите свой- ство сильной субаддитивности энтропии фон Неймана. [Указа- ние. Рассмотрите относительную энтропию р4 tg рВ(. и рАВС в тройной системе АВС.]
5.1. Упражнения 279 b) Используя монотонность Линдблада — Ульмана, покажите, что дей- ствие супероператора не может увеличить относительную энтро- пию, то есть S($p|$<r) < Д(р|<т), (5.236) где $ — произвольный супероператор (вполне положительное отображение). [Указание. Вспомните, что произвольный суперо- ператор имеет унитарное представление.] с) Покажите, что из (Ь) вытекает, что супероператор не может увели- чивать информацию Холево ансамбля £ — {рх,рх} смешанных состояний. Х($(£Г)) Х(£), (5-237) где *(£) -= s(jTPxp^ _ £PlS(pT). (5.238) О' 5.4. ПОЗМ Переса-Вутерса. Рассмотрите источник информации Пере- са-- Вутсрса, описанный в § 5.4.2. Он приготавливает одно из трех со- стояний Ю = а —1,2, 3, (5.239) каждое из которых появляется с априорной вероятностью 1/3, где со- стояния |у5„) определены в (5.149). а) Выразите матрицу плотности (5.240) а в базисе Белла максимально запутанных состояний Ц^), 1) } и вычислите S(p). b) Для трех векторов }ФЦ), а — 1,2,3 постройте определенное в (5.162) «достаточно хорошее измерение». (Вновь разложите век- торы |Фв) в базисе Белла.) В этом случае ДХИ является ортого- нальным измерением. Выразите элементы базиса ДХИ в базисе Белла. с) Вычислите взаимную информацию результатов ДХИ и приготовле- ния состояний.
Глава 6 Квантовые вычисления 6.1. Классические (вычислительные) схемы В первой главе было введено понятие квантового компьютера. Здесь мы более строго определим модель квантовых вычислений и отмстим ее некоторые основные свойства. Но прежде чем объяснять, что делает кван- товый компьютер, возможно, следовало бы поговорить о том, что делает классический компьютер. 6.1.1. Универсальные вентили Классический (детерминистский) компьютер вычисляет функции: по данным п битам на входе он производит т битов на выходе, которые одно- значно определены входом. То есть он находит значение /: {0,1}" - {0,1}"" (6.1) для определенного, состоящего из п битов, аргумента. Функция, имеющая т-битовое значение, эквивалентна т функциям с однобитовым значением каждая, поэтому вполне можно сказать, что основной задачей, выполняе- мой классическим компьютером, является вычисление /: {0,1}“ - {0,1}. (6.2) Нетрудно подсчитать количество таких функций. Существует 2" возмож- ных входов, и для каждого из них имеется два возможных выхода. Итак, всего имеется 22 функций, переводящих п битов в один. Вычисление любой такой функции можно свести к последователь- ности элементарных логических операций. Разделим возможные значения входа X =- г, х2 ... хп (6.3)
6.1. КЛАССИЧЕСКИЕ (ВЫЧИСЛИТЕЛЬНЫЕ) СХЕМЫ 281 на множество значений, для которых /(х) — 1, и дополнительное ему мно- жество, для которого f(x) = 0. Для каждого такого, что /(х^) — 1, рассмотрим функцию f'-11'1 такую, что Тогда f(x) f^(x) У /2>(т) V fW(x) V... . (6.5) f — логическое OR (V) всех функций f^a). В двоичной арифметике двух- битовая операция V може г быть представлена как х V у = х -| у - х у; (6.6) она имеет значение 0, если хну оба равны нулю, и значение 1 в противном случае. Рассмотрим вычисление fW. В том случае, когда = 111...1, мы можем записать f(-a\x) ~x1^xihx3^..^xn; (6.7) это логическое AND (А) всех п битов. В двоичной арифметике AND пред- ставляет собой произведение х Л у — х - у. (6-8) Для любого другого функция f^ вновь строится как логическое AND п битов, в котором к каждому равному нулю предварительно применяется операция логического NOT (-), например: /^(х) = (-xrj Лх2 Лх3 Л (-7Х4) Л . .. , (6 9) если Ра) =0110... . (6.10) Логическая операция NOT в двоичной арифметике представляется как -ix = 1 — х. (6.11) Мы построили функцию f(x) из трех элементарных логических от- ношений: NOT, AND, OR. Полученное выражение (6.5) называется «дизъ- юнктивной нормальной формой» f(x). Мы также неявно использовали еще одну операцию, COPY, превращающую один бит в два: COPY : х XX. (6-12)
282 Глава 6 Операция COPY необходима, поскольку каждая в разложении f по дизъюнктивным нормальным формам требует свою собственную копию х, на которую она будет действовать. Фактически мы можем сократить набор элементарных логических от- ношений до меньшего. Определим операцию NAND {«NOT-AND») соот- ношением х Т у — ->{х /\у) -= (-.х) V (->у). (6-13) В двоичной арифметике операцией NAND служит х Т у = 1 — х у. (6 14) Если мы можем выполнять COPY, то NAND можно использовать для вы- полнения операции NOT: х ] х — I - х'' - ] - х ~ -<х. (6.15) (Иди если мы можем приготовить константу у = 1, тогда х f 1 = I - х — -<х.) Аналогично (.т т у) 1 (х I у) = -.(х I у) - 1 - (1 - X у) = х • у = х А у, (6.16) а (х Т х) Т (у 1 у) = (^х) t (->T/)=l-(l-x)-(l-^)^xl-y-x-y = xVy. (6.17) Итак, если мы можем выполнять COPY, то NAND выполняет AND и OR. Таким образом, одного логического отношения NAND вместе с COPY до- статочно для вычисления любой функции f. [Вы можете убедиться в том, что возможной альтернативой в выборе универсального логического отно- шения является NOR («NOT-OR»):1 X 1 у =-- -(х V у) = (-ix) Л (6.18) Если мы можем приготовить постоянный бит (т- 0 или х = {), то ко- личество элементарных операций может быть сокращено с двух до одной. Операция NAND/NOT (х,у) (1 - х, 1 - х -у) (6.19) 1 Обратим внимание на то, что вторые равенства в (6.13) и (6.18) фактически являются следствиями известного в теории множеств принципа двойственности: (1) Дополнение Пере- сечения равно сумме дополнений и (2) Дополнение суммы равно пересечению дополнений. См., например, А.Н. Колмогоров, С.В. Фомин, Элементы теории функций и функциональном анализа, М.’. Наука, 1976, - Прим ред
6,1. Классические (вычислительные) схемы 283 вычисляет NAND (если мы игнорируем первый выходящий бит) и снима- ет копию (если возьмем в качестве второго входящего бита у = 1, а за- тем применим NOT к обоим выходящим битам)’. Таким образом, можно сказать, что NAND/NOT является универсальным логическим вентилем. Если в нашем распоряжении имеется запас постоянных битов, а вентили NAND/NOT могут' примснягься к любой выбранной паре входящих битов, то мы можем выполнить последовательность операций NAND/NOT для вы- числения любой функции f: {0, ]}" —> {0.1} при любом значении входа х = Xj х2 . ..хп. Этими соображениями мотивируется модель вычислительной схемы. Компьютер имеет несколько основных компонентов, которые могут выпол- няв элементарные операции с битами или парами битов, такие как COPY, NOT, AND, OR. Он также может готовить постоянные биты или входящие переменные биты. Вычисление представляет собой конечную последо- вательное tb таких операций, схему, применяемую к точно определен- ной строке входящих битов1 2. Результатом вычисления является конечное значение всех битов, оставшихся после выполнения всех элементарных операций. То, что для вычисления любой функции, зависящей от конечного вхо- да, достаточно лишь нескольких элементарных операций, является фунда- ментальным результатом теории вычислений. Он означает; что с помощью очень простых аппаратных средств можно выполнять сколь угодно слож- ные вычисления. До сих пор мы обсуждали вычисления, применяющиеся к частному фиксированному входу, но можно рассматривать и семейства схем, дей- ствующих на входы переменной длины. Семейства схем предоставляют полезную модель для анализа и классификации сложности вычислений, которая будет естественным образом обобщена, когда мы обратимся к кван- товым вычислениям. 6.1.2. Сложность схем Исследуя сложность, мы часто будем интересоваться функциями с од- нобитовым выходом О такой функции / можно сказать, что она кодирует решение «проблемы принятия решения» функция проверяет вход и выдает ответ ДА или НЕТ. 1 Можно предложить более простую реализацию операции COPY путем последовательно- го применения вентиля NAND/NOT: (я, 0) —> (1 - х, 1) —> (г, I - (1 - я)-!) М*,*)-- Прим. ред. 2Схемы должны быть апериодическими, в том смысле, что полностью замкнутые циклы в них недопустимы. (6.20) f {ОЭГ - {ОД}.
284 Глава 6 Часто оказывается, что вопрос, который не хотелось бы формулировать сло- весно как вопрос, имеющий ответ ДА/HET, может быть «переформулиро- ван» как проблема принятия решения. Например, функция, определяющая FACTORlNG-проблему (задача факторизации): у) { о если целое х имеет делитель, меньший чем у, в противном случае; (6.21) знание f(r, у) для всех у < х эквивалентно знанию наименьшего нетри- виального множителя х. Другим важным примером проблемы принятия решения служит HAMILTONIAN-проблема (задача нахождения гамильто- нова обхода): рассмотрим /-вершинный граф, представленный Я. х /-мачри- цей смежности (равенство единице ее ij-элемента означает, что сутцествуе г ребро, связывающее вершины i и у); функция 1, О если граф х имеет гамильтонов обход, в противном случае. (6 22) (Обход называется гамильтоновым, если он проходит через каждую верши- ну графа только один раз ) Мы хотим оценивать трудность проблемы, количественно определяя необходимые для ее решения ресурсы. Сложность проблемы принятия ре- шения разумно измерять размером минимальной схемы, вычисляющей со- ответствующую функцию f: {0,1)" -а {0,1}. Под размером мы понимаем количество элементарных операций или компонентов, которые нужно объ- единить в схему, чтобы вычислить f Также можно интересоваться тем, какого времени требует вычисление, если многие операции могут выпол- няться параллельно Глубина схемы представляет собой необходимое коли- чество шагов при условии, что операции, действующие на различные биты, могут выполняться одновременно (то есть iдубиной является максимальная длина прямого пути от входа схемы до ее выхода). Ширина схемы - это максимальное количество операций, выполняемых на любом из ее этапов Мы хотели бы разделить проблемы принятия решения на два класса: легкие и трудные. Но где следует провести границу? Рассмотрим с этой целью бесконечные семейства проблем принятия решения с переменным размером входа, то есть количество битов на входе может быть любым целым п Тогда можно проверить, как соизмеряется с п размер схемы, ре- шающей проблему. Однако в использовании масштабного поведения семейства схем в ка- честве характеристики сложности задачи имеется одна тонкость. Было бы
6.]. Классические (вычисли гелъные) схемы 285 обманом скрывать сложность проблемы в конструкции схемы. Следова- тельно, мы должны ограничиться семействами, обладающими приемлемы- ми свойствами «однородности» — должно быть «просто» построить схему сп-у 1-битовым входом, коль скоро схема с n-битовым входом уже постро- ена. Пусть с данным семейством функций {/п} (где /п имеет «-битовый вход) сопоставлены вычисляющие их схемы {Сп}. Мы говорим, что {Сп} является семейством схем «полиномиального размера», если размер Сп растет с п не быстрее некоторой степени п: size (Сп) < ро!у(п), (6.23) где poly обозначает по-шном. Тогда определим: р (проблема принятия решения, решаемая семействами схем} (полиномиального размера J (Р означает разрешимость за «полиномиальное время») Проблемы при- нятия решения, принадлежащие Р, являются «простыми», остальные — «сложными». Заметим, что Сп вычисляет /п(х) для любого возможно- го n-битового входа и, следовательно, если проблема принятия решения принадлежит Р, то даже «в худшем случае» мы можем найти ответ, исполь- зуя схему, размер которой не превышает poly (и). (Как отмечалось выше, мы неявно предполагаем, что семейство схем «однородно», гак что проблема разработки схемы сама может быть решена с помощью алгоритма, тре- бующего полиномиального времени. В этом предположении разрешимость за полиномиальное время с помощью семейства схем эквивалентна раз- решимости за полиномиальное время с помощью универсальной машины Тьюринга.) Конечно, чтобы определить размер схемы, вычисляющей /п, мы долж- ны знать, что представший собой ее элементарные компоненты. К сча- стью, принадлежность проблемы к Р не зависит от выбора набора венти- лей, до тех пор пока они универсальны, их множество конечно, а каждый вентиль действует на ограниченное множество битов. Один универсальный набор вентилей может моделироваться другим. Огромное большинство семейств функций f: {О, I}71 —► {0,1} не принадлежит Р. Для большей части функций выход существенно случа- ен, и нет лучшего способа «вычислить» f (х), чем обратиться к таблице ее значений. Но поскольку имеется 2П «-битовых входов, то эта таблица имеет экспоненциальный размер, такой же размер должна иметь и схема, кодиру- ющая эту таблицу. Проблемы нз Р принадлежат очень частному классу —
286 ГЛАВА6 они имеют такую структуру, что функция f может быть эффективно вычис- лена. Особый интерес представляют проблемы принятия решения, на кото- рые можно ответить, приведя легко проверяемый пример. Пусть, напри- мер, для данных х и у < ж трудно (в худшем случае) определить, имеет ли х множитель, меньше чем у. Но если кто-нибудь любезно предоставит такое z < у, на которое делится х, то нам просто проверить, что г дей- ствительно яшиется множителем х. Аналогично трудно определить, имеет ли граф гамильтонов обход, но если кто-нибудь нам его показал, то легко убедиться в том, что он и в самом деле гамильтонов. Эту идею, что проблема может быть трудно разрешимой, по ее ре- шение, коль скоро оно найдено, легко проверяемо, можно формализо- вать с помощью понятия «недетерминированной» схемы. Ассоциирован- ная с Сп(.г^) недетерминированная схема Gn m(x(n\обладает свой- ством1; G’n(x(n))=-1, если у^) — 1- для некоторого (6,24) (где х'-п‘ представляет п битов, а грт> — т битов). Таким образом, ес- ли оказалось удачно подобранным для некоторого го чы чо_ жем использовать Спт для проверки того, что Сп[х^п)) — 1, Опреде- лим дгр=/проблемы принятия решения, допускающие семейство неде-1 [терминированных схем полиномиального размера J (NP означает разрешимость за «недетерминированное полиномиальное время»). Если проблема принадлежит NP, то нет гараггтии, что она про- стая. Это означает тгишь то, что ее решение легко проверить, если мы располагаем правильной информацией. Очевидно, что Р С NP. Подоб- но Р, jVP-проблемы образуют малый подкласс всех проблем принятия ре- шения. 'Согласно одному из определений проблема принадлежит классу сложности Л'Р, если существует схема полиномиального по п размера, проверяющая предложенное решение га полиномиальное время. Проверяющая схема [в данном случае это С(х^п\ г/”1))] является детерминированной. Термин недетерминированный происходит от того, чго согласно друго- му определению (см. следующее чуть ниже определение в основном гексге) А’/’-пробпема допускает решение за полиномиальное время на так набиваемой недетерминированный ма- шине 7’ыориига. способной в некоторых состояниях выбирать различные варианты вычисле- ния. См. А. Китаев, А. Шень, М. Вялый, Классические и квантовые вычисления, М., МЦНМО, ЧеРо (1999). — Прим, ред
6.1. Классические (вычислительны?) схемы 287 Многое в теории сложности опирается на фундаментальное предполо- Жение Предположение: P^-NP\ (6.25) существуют сложные проблемы принятия решения, решения которых лег- ко проверяемы. К сожалению, эта важная гипотеза все еще ждет своего доказательства. Однако после 30-ти лет попыток показать обратное - боль- шинство специалистов в теории сложности твердо уверены в ее справедли- вости' . Важным примером NF-проблемы является CIRCUIT-SAT1 2. В этом случае вход представляет собой состоящая из п вентилей схема С с т-би- товым входом и однобитовым выходом. Проблема состоит в том, чтобы найти, существует ли какой-нибудь m-битовый вход, для которого выход равен единице. Функция, которую необходимо вычислить, представляет со- бой . [ 1, если существует такое, что С(д:^)--], f (С-) — < (6.26) (Ов противном случае. Это NF-проблема, поскольку данную схему легко смоделировать и вычис- лить ее выход для любого частного входа. Я перехожу к формулировке некоторых важных результатов теории сложности, которые будут1 для нас важны. Здесь не будет времени для дока- зательств. Вы можете почерпнуть больше, обратившись к одному из многих учебников по этому предмету. 3 * * * Многие идеи, порожденные теорией сложности, вытекают из теоремы Кука (1971). Она утверждает, что любая NF-проблема полиномиально при- водима к CIRCUIT-SAT. Это означает, что для любой PROBLEM g NP существует семейство схем полиномиального размера, которое отобража- ет «ситуацию» Е7'' для PROBLEM на «ситуацию» у'?т- для CIRCUIT-SAT, то есть CIRCUIT-SAT^1») 1, если PROBLEM^») = 1. (6.27) Отсюда следует, что если бы в нашем распоряжении имелось магиче- ское устройство, которое могло бы эффективно решать CIRCUIT-SAT 1 Проблема соотношения классов сложности Р и NР остается нерешенной и в настоящее время (начало 2007г.). Более того она входит в список важнейших задач математики XX! в. — Прим, ред. 2 CIRCUIT-SAT (circuit-satisfyabihty) problem — проблема выполнимости схемы, (иерев.) 3Одной из лучших является книга M.R. Garey, D.S. Johnson, Computers and Intractability. A Guide tn the Theory afNP-Competeness, русский перевод M. Гэри, Д. Джонсон, Вычислитель- ные машины и трубнорешаемые задачи, М.: Мир (1982). [Краткий, ио достаточно полный, об- зор классов сложности и их иерархии можно найти в первой части книги: А. Кигаев, А. Шень, М. Вялый, Классические и квантовые вычисления, М.: МЦНМО, ЧеРо (!999). — Прим ред.]
288 Глава 6 (CIRCUIT-SAT «оракул»), то с помощью полиномиальной редукции мы могли бы связаться с ним, чтобы эффективно решить PROBLEM, Из тео- ремы Кука следует, что если вдруг окажется, что CIRCUIT-SAT е Р, то Р - NP. Проблема, которая, подобно CIRCUIT-SAT, обладает тем свойством, что к ней полиномиально приводится любая проблема из NP, называ- ется NP-полной (NPC). После Кука было найдено множество других примеров NPC’-проблем. Чтобы показать, что PROBLEM € NP явля- ется NP-полной, достаточно найти другую, полиномиально приводимую к ней проблему, о которой уже известно, что опа NP-полная. Например, можно продемонстрировать полиномиальную приводимость CIRCUIT-SAT к HAMILTONIAN. Тогда из теоремы Кука следует, что HAMILTONIAN то- же NP-полна. Если мы предположим, что Р NP, то отсюда следует, что в NP существуют проблемы промежуточной трудности (класс NPP). Это ни Р, ни NPC. Другой важный класс сложности называется co-NP. Эвристически NP-проблемами разрешимости являются те, на которые мы можем от- ветить, приведя пример, если ответом является ДА, в то время как на co-NP-проблему можно ответить контрпримером, если ответом является НЕТ. Более формально {С} £ NP: С(х) — 1, если С(х, у) = 1 для некоторого у: (6.28) {С} € co-NP: С(х) = 1, если С(х, у) = 1 для всех у. (6.29) Очевидно, что между классами NP и co-NP существует симметрия — рас- сматриваем ли мы проблему из NP или из co-NP зависит от того, как был сформулирован вопрос. (Проблема «Существует ли гамильтонов обход?» принадлежит классу NP. Проблема «Действительно ли, что гамильтоно- ва обхода не существует?» принадлежит классу co-NP.) Однако интересен вопрос: существует ли проблема ($ Р), одновременно принадлежащая обо- им классам: NP и co-NP. Если да, то мы можем легко проверить ответ (коль скоро имеем подходящий пример) независимо от того является им ДА или НЕТ. Считается (хотя и не доказано), что NP co-NP. (При- ведя пример, мы можем показать, что граф имеет гамильтонов обход, но мы не знаем, как подобным образом показать, что он не имеет гамильтоно- вых обходов!) При условии, что NP co-NP, существует теорема, кото- рая утверждает, что ни одна co-NP-проблема не принадлежит NPC. Сле- довательно, проблемы, принадлежащие пересечению NP и co-NP и при этом не входящие в Р, являются хорошими кандидатами для включения их в NPI.
6.1. КлассЙческие (вычислительные) схемы 289 Фактически такой проблемой, принадлежащей JVPnco-.VP, относи- тельно которой считается, что она не входит в Р, яв-шется FACTORING- проблсма. Как уже отмечалось, FACTORING-проблема принадлежит клас- су NP, поскольку мы можем легко проверить правильность предоставлен- ною множителя числа х Но она также принадлежит и co-NР, поскольку известно, что если нам дано простое число, то (по крайней мере в прин- ципе) мы можем эффективно проверить его простоту. Таким образом, ccjhi некто сообщает нам простые множители числа х, то мы можем эффектив- но проверить, что разложение на простые множителя правильно, и можем исключить, что любое целое, меньшее у, является делителем числа х. Сле- довательно, похоже на то, что FACTORTNG-проблсма принадлежит клас- су NPP. Мы пришли к грубой (гипотетической) картине структуры NP П co-NP. Классы NP и co-NP не совпадают; но имеют нетривиальное пе- ресечение. Класс Р принадлежит пересечению NP П co-NP (поскольку Р со-Р), ио кроме этого оно содержит проблемы, не входящие в Р (по- добные FACTORING-проблеме). Ни NPC ни co-NPC не пересекаются с NP П co-NP. Можно было бы гораздо больше рассказать о теории сложности, но мы ограничимся здесь упоминанием еще одного элемента, связанного с обсуж- дением квантовой сложности. Инотда полезно рассматривать вероятност- ные схемы, которые имеют доступ к i-еператору случайных чисел. Напри- мер, вентиль в вероятностной схеме может действовать одним из двух спо- собов и «подбрасывает монету», чтобы решить, какое действие выполнить. При одном фиксированном входе такая схема может избрать один из мно- жества вычислительных путей. Об алгоритме, выполняемом вероятностной схемой, говорят как о «рандомизированном». Если мы приступаем к проблеме принятия решения, используя веро- ятностный компьютер, то получаем распределение вероятностей результа- тов. Таким образом, мы не будем всегда получать обязательно правиль- ный ответ. Но если для любого возможного входа вероятность получения правильного ответа больше, чем 1 + <5 (<У > 0), то такая машина полез- на. Фактически мы можем многократно повторить вычисление и, учитывая ]В 2002 г ipyrrrroif индийских математиков предложен полиномиальный детерми- нированный алгоритм проверки ие.шх чисел на простоту. Его асимптотическая слож- ность O^lognjk), 1де п — проверяемое число, к — целое число ~ 10. Таким обра- зом, проблема распознавания простоты целого числа принадлежит классу сложности Р. М. Agiawal, N. Kayal, N Saxena, Primes is in P, Annals of Math, 160. 781 793 (2004), http://www.math.pnnceton.edu/^anoalo/. См. также Л. К). Бараш, Алгоритм AKS проверки чисел на простоту и поиск констант генераторов псевдослучайных чисел, Безопасность информа- ционнтях технологий, 2, 27-38 (2005). — Прим ред
290 ГЛАВА б «голос большинства», достичь вероятности ошибки, меньшей е. Более то- го, количество необходимых для этого повторений вычисления всего лишь полило! арифмически зависит от £ _ 11. Если проблема допускает решение с помощью семейства вероятност- ных схем полиномиального размера, которые всегда дают правильный от- вет с вероятностью, большей | + Л (для любого входа и при фиксирован- ном <5 > 0), то мы говорим, что она принадлежит классу ВРР («вероят- ностное полиномиальное время с ограниченной ошибкой»). Очевидно, что Р с ВРР, (6.30) но соотношение между NP и ВРР не известно. В частности, не доказано, что ВРР содержится в NP. 6.13. Обратимые вычисления Разрабатывая модель квантового компьютера, мы обобщим модель классических вычислительных схем. Но нашими квантовыми логически- ми вентилями будут унитарные и, следовательно, обратимые преобразова- ния, тогда как классические логические вентили типа NAND необратимы. Прежде чем обсуждать квантовые схемы, полезно рассмотрев некоторые особенности классических обратимых вычислений. Помимо их связи с квантовыми вычислениями, дру1 ие побудительные причины для изучения обратимых классических вычислений обсуждались в первой главе. Как заметил Ландауэр, поскольку необратимые логические элементы стирают информацию, они с необходимостью диссипативны и, следовательно, требуют постоянного расхода энергии. Но если компьютер оперирует обратимо, то в принципе не должно быть никакой потребности в энергии. Мы можем вычислять даром! Обратимый компьютер вычисляет обратимую функцию, преобразуя п битов в другие п битов: /: {0,1}” —> f0; 1}" ; (6.31) функция должна быть обратимой, то есть для каждого выхода существует единственный вход; тогда мы в принципе в состоянии пройти вычисление в обратном порядке и, зная выход, воспроизвести вход. Поскольку это вза- имно-однозначная функция, ее можно рассматривать как перестановку 2” строк из п битов - всего таких функций (2")!. 1 То есть количество необходимых повторений ограничено сверху полиномом poly(!og(e-1)). — Прим реа
6.1. Классические (вычислительные) схемы 291 Конечно, любое необратимое вычисление можно «оформить» как вы- числение обратимой функции. Например, для любой f : {0,1}п —> {0,1}т мы можем сконструировать f : {0,1}"4 т —> {0,1}п+™ такую, что = (6.32) (где обозначает т битов, первоначально положенных равными нулю). Поскольку f преобразует каждое (ж;0(гГ1\'| к своему, отличному от других, результату, она может быть расширена до обратимой функции от п I т би- тов. Следовательно, для любой /, преобразующей п битов в т, существуй обратимая функция /, преобразующая п + т битов в п + т битов, которая вычисляет /(х), действуя на (ж; О^). Как теперь построить сложные обратимые вычисления из элементар- ных компонентов — то есть ч го образует набор универсальных вентилей? Мы увидим, что одно- и двухбитовых обратимых вентилей не достаточно; для универсальных обратимых вычислений нам понадобятся трехбитовыс вентили. Из четырех 1-бит —> 1-бит вентилей обратимы два — тривиальный и NOT. Из (24)2 — 256 возможных 2-бит —> 2-бит вентилей обратимы 4! — — 24. Одним из особенно интересных является вентиль кон филируемое NOT или XOR, с которым мы уже сталкивались в четвертой главе. XOR: (х.у) —» (х,х<Ву), (6,33) х ----•----х у -—Ф------х Ф у. Этот вентиль инвертирует второй бит, если первый равен единице, и ничего не делает, если первый бит равен нулю (отсюда его название; контролиру- емое NOT). Его квадрат является тривиальным, то есть он обратен по от- ношению к самому себе. Конечно, этот вентиль выполняет операцию NOT на втором бите, если первый бит положить равным единице, и выполняет операцию копирования, если начальным значением у является нуль; XOR: (о?,0) —f (а-, х), (6.34) С помощью схемы У х
292 Глава 6 построенной из трех XOR-ов, мы можем поменять местами два бига1: (%,У) -> О,хФу) -+ (у,ж). (6.35) С помощью этих обменов можно тасовать биты внутри схемы, собирая их вместе, если мы хотим подействовать на них конкретным компонентом в фиксированном положении. Чтобы увидеть, что одно- и двухбитовые вентили неуниверсальны, за- метим, что все они линейны. Каждый обратимый двухбитовый вентиль дей- ствует по правилу (6.36) где константа (£) принимает одно из четырех возможных значений, а М — одна из тести обратимых матриц ( 1 о Wo 1 \ /1 П ( I о \ /о 1 WI М о 17 ’ V1 о у ’ \ о 1 7’1 1J 1 1 7’\ 1 о у • [Все суммирования в (6.36) выполняются по модулю 2.] Комбинируя шесть вариантов Л4 с четырьмя возможными константам и, мы получаем 24 раз- личных вентиля, которыми исчерпывстся набор всех обратимых 2-^2 вен- тилей. Поскольку линейные преобразования замкнуты относительно компо- зиции, любая схема, скомбинированная из обратимых 2 —» 2 (и 1 —> 1) вентилей, будет вычислять линейную функцию X —> Мх -| а. (6.38) Однако при п 3 существуют нелинейные обратимые функции п битов Важным примером служит вентиль Тоффоли (или дважды контроли- руемое NOT) 0^ :(x,y,z) (x,y,z&x у)- (6.39) у —i Z X У z $ х у, 1В двоичной арифметике сложение по модулю 2 определяется как ггфр — а: + у — 2т-р. Эта операция, очевидно, коммутативна зфу — уфх и ассоциативна — жф(у®г) - — г Ф У ф 2- — Прим ред
6.1. Классические (вычислительные) схемы 293 он инвертирует третий бит, если два первых равны единице, и ничего не делает в противном случае. Подобно XOR-вентилю он обратен по отноше- нию к самому себе. В отличие от обратимых двухбитовых вентилей, (№> является универ- сальным вентилем булевой логики, если мы можем фиксировать некоторые входящие биты и игнорировать некоторые выходящие биты. Если началь- ное значение z равно единице, то на третьем выходе возникает х "f у — ] - - х • у — мы можем выполнить NAND. Если же мы фиксируем х - 1. то вен тиль Тоффопи функционирует подобно XOR-вентилю и может исполь- зоваться для копирования. Вентиль Тоффоли универсален в том смысле, что, используя толь- ко его, можно построить схему, вычисляющую любую обратимую функцию (при условии, что можно фиксировать входящие биты и игнорировать выхо- дящие). Полезно показать это непосредственно, не опираясь на наше более раннее доказательство того, что NAND/NOT является универсальным для вычисления любой булевой функции. Фактически можно показать следую- щее: из вентилей NOT и Тоффоли (№ мы можем построить универсальную функцию п битов при условии, что мы имеем доступ к одному дополни- тельному биту в памяти. В качестве первого шага покажем, что из трехбитовых вентилей Тоф- фоли 0^ можно построить n-битовый вентиль Тоффоли 0(п\ действующий по правилу (х1,г21...,жп_1,у) (6.40) Эта конструкция требует дополнительною бита из вспомогательного про- странства. Например, мы конструируем из вентилей б1—' с помощью схемы Цель последнего 0(3>-вентиля - вернуть вспомогательному биту его началь- ное значение, равное пулю. В дейс i вительности, добавив еще один й-3)-вен-
294 Глава 6 тиль, можно реализовать (№, который работает независимо от начального значения вспомогательного бита: Z1 W у ф • #2 ' #3- Снова мы можем исключить последний вентиль, если нас не беспокоит изменение значения вспомогательного бита1. Мы можем убедиться в том, что вспомогательный бит действитель- но необходим. Поскольку 0^ представляет собой нечетную перестанов- ку (фактически подстановку) 16-ти четырехбитовых строк, он перестав- ляет 1111 и 1110. Однако 0@\ действуя на любые три бита из четырех, осуществляет четную перестановку; например, действуя па последние три бита, он переставляет 0111 с ОНО или 1111 с НЮ2. Поскольку произве- дение четных перестановок также является четным, мы не можем полу- чить 8^ как произведение вентилей 0(Л), действующее только на четыре бита. Конструкцию 8'4> из четырех 0:'?'! можно непосредственно обобщить на конструкцию из двух 0('п -1'' и двух (только расширив хг в при- веденной выше диаграмме до нескольких битов). Итерируя эту конструк- цию, мы получим й^?-схему, состоящую из 2n-2 -1 2П-3 — 2 вентилей (А3\ Более того, для этого достаточно только одного вспомогательного бита3 (Если нам необходимо построить (У'П/, то для этого подойдет любой до- ступный вспомогательный бит, так как схема возвращает ему его началь- ное значение.) Следующим шагом заметим, что, соединяя 0^ с вентилями NOT, мы можем в действительности менять значение контрольной строки, 1 На самом деле восстановление начального значения вспомогательного бита ы, осуществ- ляемое в агой схеме вторым верхним -вентилем, является иеобгойтьиой операцией Именно благодаря этому па выходе второго нижнего (/^'-вентиля получается С1 Ф ф «и, — у ф л1х^хя. Последнее равенство легко проверяется с учетом коммутативности и ас- социативности сложения по модулю 2. — Прим ред 2По-видимому автор имеет ввиду, что Д^-вентиль осуществляет нечетное количество нетривиальных подстановок (одну), a 0<ч)-вентиль — четное (две). — Црим ред. 3С большим вспомо!ательным пространством можно значительно эффективнее постро- Hib из вентилей (см. упражнения).
6.1. КЛАССИЧЕСКИЕ (ВЫЧИСЛИТЕЛЬНЫЕ) СХЕМЫ 295 «управляющей» вентилем Например, схема ац -•----------ф--- Х‘2-------i-------- жз —е—4-.......ф— у---------X-------- инвертирует значение у, если х1х2х3 = 010, и действует тривиально в про- тивном случае. Таким образом, эта схема переставляет две строки: 0100 и 0101, Подобным образом, с помощью вентилей и NOT можно при- думать схему, которая переставляег любые две «-битовые строки, отличаю- щиеся только одним битом. (Расположение бита, которым они отличаются, выбирается в качестве цели вентиля (№.) Но фактически подстановка, обменивающая любые две «-битовые строки, может быть представлена как произведение подстановок, которые обменивают строки, отличающиеся только одним битом. Если а0 и а5 - две строки, расстояние Хемминга между которыми равно s (отличаются s позициями), то существует цепь «0, а1, а3, ая, ... ,as (6.41) такая, что каждая строка в этой последовательности удалена от ближайших соседей на равное единице расстояние Хемминга. Следовательно, каждая из подстановок (аъ а2), (а2,а3), ..., (as_15aj (6.42) может быть реализована как вентиль соединенный вентилями NOT. Комбинируя подстановки, находим (a0,as) — (йз-1'а»)(а8 2:as-l)"' • • («2 , йз) (Й1 г а2 ) («0> й1) (ф > йг) («2> °з) • • (as-2ias l)(as-bas); (6.43) мы можем сконструировать подстановку с равным s расстоянием Хемминга из 2s—1 подстановки с единичным расстоянием Хемминга. Отсюда следует, что мы можем построить (a0,as) из вентилей 0^ и NOT.
296 Глава 6 Наконец, поскольку каждая перестановка является произведением под- становок, мы показали, что любая обратимая функция «-битов (каждая перестановка n-битовых строк) представляет собой произведение венти- лей О'Л' и вентилей NOT, использующее только один бит вспомогательного пространства. Конечно, операция NOT может быть выполнена с помощью венти- ля (№, если мы фиксируем два входящих бита равными единицам. Таким образом, вентиль Тоффоли Й'3’ является универсальным для обратимых вы- числений, если мы можем фиксировать входящие биты и отбрасывать вы- ходящие. 6,1.4. Компьютер бильярдных шаров Двухбитовых вентилей достаточно для универсальных необратимых вычислений, но для универсальных обратимых вычислений необходимы трехбитовые вентили. Возникает соблазн сказать, что для их реализации необходимы «трехчастичные взаимодействия», так что создание обратимо- го аппаратного обеспечения является более сложной проблемой, чем созда- ние необратимого. Однако это утверждение в какой-то мере может быть обманчивым. Фредкин описал, как можно построить универсальный обратимый ком- пьютер, в котором фундаментальным взаимодействием является упругое столкновение между двумя бильярдными шарами. Шары радиуса l/i/2 движутся по квадратной решетке, период которой равен единице. В каж- дый целочисленный момент времени цен гр каждого шара находится в уте решетки; наличие или отсутствие шара в данном узле (в этот момент вре- мени) кодирует бит информации. В течение каждого единичного интервала времени каждый (подвижный) шар проходит единичное расстояние вдоль одного из направлений решетки. Иногда, в целочисленные моменты време- ни, происходит упругое рассеяние на 90° двух шаров, занимающих узлы, удаленные друг от друга на расстояние i/2 (соединенные диагональю ячей- ки решетки). Прибор прО1раммируется закреплением части шаров в некоторых уз- лах, которые действуют как идеальные отражатели. После задания началь- ных положений и направлений движения подвижных шаров система выпол- няет программу, эволюционируя в течение конечного ип jepea.ua времени в соответствии с механикой Ньютона. Результат считывается путем наблю- дения конечных положений подвижных шаров. Столкновения недиссипа- тивны, так что после обращения всех скоростей вычисление может быть пройдено в обратном порядке.
6.1. Классический (вычислительные) схемы 297 Чтобы показать, что эта машина является универсальным обратимым компьютером, мы должны объяснить, как в ней реализовать универсальный вентиль. Удобно рассмотреть трехбитовый вентиль Фредкина (x,y,z) (x,xz + xz,xz + ху), (6.44) который меняет местами у и z, если х = 0 (мы ввели обозначение х = — -|.т). Вы можете убедиться в том, что вентиль Фредкина может моде- лировать вентиль NAND/NOT, если мы фиксируем входы и игнорируем ВЫХОДЕ!. Мы можем построить вентиль Фредкина из более примитивного объ- екта, вентиля-переключателя. Переключатель преобразует два бита в три, действуя по правилу (а',*/) —* (ж,ж • у,х • у). (6.45) т — 1 х у - 5 - х:у I 1 X - у Этот вентиль «обратим» в том смысле, что его можно пройти в обратном направлении, действуя на ограниченный трехбитовый вход, принимающий одно из четырех значений. х \ / 0 \ /0\ /1 \ / 1 \ S' ^l0 ’ 0 0 ’1’ (6.46) z / \ ° / У1/ \°/ \°/ Болес ioio, переключатель сам по себе универсален; фиксируя входы и иг- норируя выходы, он может выполнить операцию NOT (у — 1, третий вы- ход), AND (второй выход) и COPY (у — 1, первый и второй выходы). Тогда не удивительно, что, комбинируя переключатели, можно построить универ- сальный 3—^3 вентиль, Действительно, схема
298 ГЛАВА 6 образует вентиль Фредкина из четырех переключателей (два из них прохо- дятся в прямом направлении, два других — в обратном). Время задержки, необходимое для синхронизации, явно не показано. В компьютере бильярдных шаров переключатель строится из таких двух отражателей, чтобы (в случае х — у = 1) два движущихся шара столк- нулись дважды. В этом случае траектории шаров имеют вид Шар, помеченный как я, вылетает из вентиля вдоль той же траектории (и в то же самое время) независимо от наличия или отсутствия другого шара. Однако при х = 1 положение другою шара (если он имеется) сме- щается вниз по сравнению с его конечным положением при х = 0 — это и есть переключатель. Коль скоро мы можем пост роить переключатель, то можем построить и вентиль Фредкина и, таким образом, реализовать уни- версальную обратимую логику на компьютере бильярдных шаров. Очевидной слабостью схемы бильярдных шаров является то, что на- чальные ошибки положений и скоростей шаров будут быстро накапливать- ся и в конце концов компьютер окажется несостоятельным. Как отмеча- лось в первой главе (а Ландауэр настоятельно подчеркивал это), подобным недостатком будет страдать любая предлагаемая схема tic диссипативных вычислений. Чтобы контролировать ошибки, мы должны быть в состоя- нии сжимать фазовое пространство прибора, что с необходимостью будет диссипативным процессом. 6.15. Экономия пространства Но кроме проблемы контроля ошибок, есть еще один ключевой вопрос, касающийся обратимых вычислений. Как распорядиться вспомогательным пространством, необходимым для того, чтобы сделать вычисление обрати- мым?
6.1. классические (вычислительные) схимы 299 Обсуждая универсальность вентиля Тоффоли, мы видели, что в прин- ципе можно выполнить любое обратимое вычисление, используя очень ма- лое вспомогательное пространство. Но на практике может оказаться неве- роятно сложно понять, как выполнить конкретное вычисление, используя минимальное пространство, и во всяком случае экономия пространства мо- жет обернуться непомерным расходом времени. Существует общая стратегия моделирования необратимого вычисле- ния на обратимом компьютере. Каждый необратимый вентиль, NOT или СОРУ, можно моделировать вентилем Тоффоли, фиксируя входы и игнори- руя выходы. Мы накапливаем и сохраняем весь «мусор» выходящих би- тов, которые необходимы, чтобы обратить этапы вычисления. Вычисле- ние выполняется вплоть до завершения, после чего делается копия выхода. (Эта COPY-операция логически обратима.) Затем вычисление производит- ся в обратном порядке, чтобы избавиться от «мусора» и вернуть все ре- гистры в их начальные состояния. С помощью этой процедуры обратимая схема осуществляется примерно дважды, до тех пор, пока не будет вы- полнена моделируемая необратимая схема, а весь генерируемый при этом мусор- выброшен без какой-либо диссипации и, следовательно, энергети- ческих затрат. Эта процедура работает, но 'требует oipoMHOio пространства памяти се необходимый объем растет линейно с продолжительностью 'Г модели- руемого необратимого вычисления. Фактически пространство можно ис- пользовать гораздо более эффективно (лишь с минимальным замедлением), так что его необходимый объем растет как log Г вместо Т. (То еегь су- ществует универсальная схема, гребующая пространства ос logT; конечно, моделируя конкретное вычисление, можно добиться даже лучшего резуль- тата.) Чтобы эффективнее использовать пространство, разделим вычисление на более мелкие шаги приблизительно одинакового размера и, когда это возможно, будем обращать их в процессе вычисления. Однако, подобно то- му как мы не в состоянии выполнить /с-ый шаг вычисления до тех пор, пока не завершен к — 1-ый шаг, мы не сможем обратить fc-ый шаг, если пред- варительно был обращен к — 1-ый шаг1 Необходимый объем пространства (чтобы хранить наш мусор) будет расти как максимальное значение числа шагов вперед за вычетом количества выполненных шагов назад. Проблему, с которой мы столкнулись, можно сравнить с обратимой иг- ’ Мы скромно предполагаем, что нс настолько прозорливы, чтобы предвидеть, какая часть выхода fc-1 -го шага может потребоваться позже. Следовательно, мы сохраняем полную запись состояния машины после к — 1-го tnaia, которая не должна удаляться до тех нор, аока не будет обнов, гена запись после завершения следующего шага,
300 Глава 6 рой камешками1. Выполняемые шаги образуют одномерный ориентирован- ный граф с узлами, пронумерованными как 1,2,3,..., Т. Выполнение 4-го шага моделируется помещением камешка в 4-ый узел графа, а выполне- ние 4-го шага в обратном направлении моделируется удалением камешка из 4-го узла В начале игры нет узлов, занятых камешками, а с каждым ходом мы их добавляем или удаляем. Однако мы не можем поместить ка- мешек в 4-ый узел (за исключением k = 1) до тех пор, пока не заполнен к — 1-ый, а также мы не можем удалить камешек из 4-го узла (за исключе- нием 4-1), если свободен к 1-ый узел. Задача в том, чтобы заполнить узел Т (завершить вычисление), не используя большего, чем эю необходи- мо, количества камешков (генерируя минимальный объем мусора). Фактически с помощью п камешков мы можем достичь узла Т=2" — 1, но продвинуться дальше не сможем. Можно построить рекурсивную процедуру, позволяющую добраться до Т = 2”-1-ю узла с помощью п камешков, оставляя в игре только один камешек. Пусть Ft(4) обозначает помещение камешка в 4-й узел, а 7?1-1(4) — удаление камешка из 4-го узла. Тогда2 F3(l, 2) = F:(1)F1(2)F1-1(1) (6.47) оставляет камешек в узле 4 = 2, используя максимум два камешка па про- межуточных этапах. Аналогично ^3(1,4) - F2(1,2)F2(3,4)F2-’(1,2) (6.48) достигает узла 4 — 4, используя максимум три камешка, а F^hSj^Fsd.dJFsCB.SJ^-'fl.d) (649) достигает узла 4 8, используя четыре камешка. Очевидно, можно по- строить процедуру Fn(l,2n-1)> которая использует максимум п камешков и оставляет в игре один. [Программа Fn(l,2"-I)Fn r(2n-' + 1,2П 1 + 2п 2)... /-1(2” - 1) (6.50) оставляет в игре все п камешков и позволяет заполнить максимально уда- ленный узел 4 = 2” — !.] 'Как было отмечено Беннетом. Относительно последнего обсуждения см : М. Li and Р. Vitanyi, Reversibility and Adiabatic Computation: Trading Time and Space for Energy, Pmc, R. Soc. London, A 452, 769-789 (1996); quant-ph/9703022. 2Иравые части (6.47) - (6.50) следуег читан, слева направо. Именно в тгом порядке вы- полняются описываемые ими действия. — Прим ред
6.1. Классические (вычислигьльные) схемы 301 Понимаемая как программа для выполнения Т = 2П 1 шагов вычис- ления, эта стратегия игрока в камешки представляет собой моделирование, требующее роста пространства как п ~ log?', Насколько продолжитель- ным может быть это моделирование? На каждом этапе описанной выше рекурсивной процедуры два шага вперед заменялись двумя шагами вперед и одним назад. Следовательно, Tirr — 2" шагов необратимого вычисления моделируются Trev = Зп шагами обратимого вычисления или Trev-(Tlrr),OE3/log2 = (rirr)1’58; (6.51) мы имеем умеренный степенной закон замедления. В действительности мы можем уменьшить замедление до Trev~(Tj1+£ (6.52) при любом £ > 0. Вместо того чтобы заменять два шага вперед двумя шагами вперед и одним назад, заменим I шагов вперед £ шагами вперед и £ - 1-им шагом назад. Состоящая из п этапов рекурсивная процедура до- стигает узла используя максимум п{(. -1) +1 камешков. Теперь мы име- ем ?'„., -- a Trev =- (2£ - 1 )п, так что ?rev ~ (Tirr) ’ (6-53) показатель степени замедления равен |ов(И-1) ,<,еМ+М1_А) loS2 --------------кН---------=1 + 1^7' <6'54) а требуемое пространство растет как S ~ nt ~ . (6.55) log? Таким образом, для любого фиксированного е > О мы можем добиться S, растущего как log'?', и замедления, не большего чем (Т]ГГ) ^Е. (Для игры в камешки это не оптимальный способ, если наша цель - продвинуться как можно дальше, используя минимально возможное количество камеш- ков. Мы используем больше камешков, чтобы добраться до Т-го шага, зато делаем это быстрее.)
302 Глава 6 Итак, мы видим, что обратимая схема может успешно моделировать схему, построенную из необратимых вентилей, не требуя нереальных ре- сурсов памяти и не вызывая неразумно большого замедления. Почему это важно? Вас может беспокоить, что поскольку обратимое вычисление «труд- нее» необратимого, то классификация сложности зависит от того, какими вычислениями мы пользуемся, обратимыми или необратимыми. Однако это не так, поскольку необратимый компьютер легко моделируется обратимым. 6,2. Квантовые схемы Теперь мы готовы сформулировать математческую модель квантово- го компьютера. Мы обобщим модель классической вычислительной схемы на модель квантовой вычислительной схемы. Классический компьютер оперирует битами. Он оснащен конечным набором вентилей, которые могут применяться к множеству битов. Кван- товый компьютер оперирует кубитами. Будем предполагать, что он то- же оснащен дискретным набором фундаментальных компонентов, назы- ваемых квантовыми вентилями. Каждый квантовый вентиль представля- ет собой унитарное преобразование, действующее на определенное число кубитов. В квантовых вычислениях конечное количество п кубитов пер- воначально полагаются имеющими значение |00...0). Выполняемая схе- ма построена из конечного чис,га квантовых вентилей, действующих на эти кубигы. Наконец, выполняется измерение фон Неймана всех кубитов (или некоторого подмножества кубитов), проецирующее каждый из них на базис {|0)( |1}}. Результат этого измерения является результатом вычис- ления. Некоторые особенности этой модели требуют комментария. (1) Неявно подразумевается, но очень важно, что гильбертово простран- ство прибора имеет естественное разложение на тензорное произведе- ние пространств более низкой размерности, в данном случае - дву- мерных пространств кубитов. Конечно, вместо этого мы могли бы рас- сматривать тензорное произведение, допустим, кутритов. Но в любом случае мы считаем, что существует естественное разложение на подси- стемы, которое соответствует квантовым вентилям, действующим од- новременно только на несколько подсистем С математической точки зрения это свойство вентилей является решающим для формулиров- ки хороню определенного понятия квантовой сложности. С физиче- ской точки зрения фундаментальной причиной естественного разложе-
6.2. Квантовые схемы 303 ния на подсистемы является локальность; реальные квантовые венти- ли должны действовать в ограниченной области пространства, то есть компьютер разбивается на подсистемы, взаимодействующие только со своими ближайшими соседями. (2) Так как унитарные преобразования образуют континуум, может пока- заться необязательным постулировать, что машина может выполнять только выбранные из дискретного множества квантовые операции. Тем не менее мы принимаем это ограничение, поскольку не хотим, сталки- ваясь с выполнением нового вычисления, всякий раз изобретать его новую физическую реализацию. (3) Мы могли бы допусти гь, чтобы наши квантовые вентили были суперо- ператорами, а конечным измерением — ПОЗМ. Но поскольку мы мо- жем просто моделировать супероператор, выполняя унитарное преоб- разование в расширенной системе, или - - ПОЗМ, выполняя измерение фон Неймана в расширенной системе, сформулированная модель об- ладает достаточной общностью (4) Мы могли бы допустить, чтобы заключительное измерение было кол- лективным измерением или проектором на другой базис. Но любое такое измерение можно реализовать, выполняя подходящее унитарное преобразование после проецирования на стандартный базис {|0), |1)}п. Конечно, сложные коллективные измерения лишь с некоторыми за- труднениями можно преобразовать в измерения в стандартном бази- се и при характеристике сложности алгоритма эти трудности следует иметь в виду. (5) Мы могли бы допустить наличие измерений на промежуточных этапах вычислений с последующим выбором квантовых вентилей, обуслов- ленным результатами этих измерений. Но фактически гот же результат всегда может быть достигнут с помощью квантовой схемы, в которой все измерения отложены вплоть до ее окончания, (Хотя в принципе мы можем отложить измерения, на практике может оказаться полез- ным их выполнение на промежуточных этапах квантового алгоритма.) Будучи унитарным преобразованием, квантовый вентиль обратим. Факти- чески классический обратимый компьютер представляет собой частный случай квантового компьютера. Классический обратимый вентиль у(п) = (6.56)
304 Глава 6 выполняющий перестановку «-битовых строк, может рассматриваться как унитарное преобразование, действующее на «вычислительный» ба- зис {|ж,)} как и - |у*). (6.57) Это действие унитарно, поскольку вес 2п строк \уг) взаимно ортогональ- ны. Квантовое вычисление, построенное из таких классических вентилей, преобразует |0... 0) в одно из состояний вычислительного базиса, так что конечное измерение является детерминированным. Имеется три главные проблемы, касающиеся нашей модели, к кото- рым мы хотели бы обратиться. Первой из них является универсальность. Самое общее унитарное преобразование, которое может быть выполнено на п кубитах, является элементом ?7(2П). Паша модель могла бы оказаться неполной, если бы в /7(2") существовали такие преобразования, которые мы не могли бы выполнить. На самом деле мы увидим, что существует мно- жество способов выбрать дискретный набор универсальных квантовых вен- тилей. Используя набор универсальных вентилей, можно построить схемы, вычисляющие унитарное преобразование, сколь угодно близкое к любому элементу U (2п). благодаря универсальности, существует также аппаратно-независимое понятие квантовой сложности. Мы можем определить новый класс слож- ности BQ Р — класс проблем принятия решения, которые с высокой вероят- ностью могут быть решены с помощью квантовой схемы полиномиального размера. Так как один универсальный квантовый компьютер может эффек- тивно моделироваться другим, то этот класс не зависит от деталей аппарат- ного обеспечения (от выбранного нами набора универсальных вентилей) Заметим, что квантовый компьютер может легко моделировать клас- сический вероятностный компьютер: он может приготовить состояние -^=(|0) +|1)), а затем спроецировать его на {|0), jl)}, генерируя случайный бит. Следовательно, класс ВРР несомненно содержится в BQP. Одна- ко, как обсуждалось в первой главе, представляется достаточно разумным ожидать, что в действительности BQP шире, чем ВРР, поскольку класси- ческий вероятностный компьютер нс может легко моделировать квантовый компьютер. Фундаментальная трудность состоит в том, что гильбертово пространство п кубитов огромно, размерности 2", и, следовательно, мате- матическое описание типичного вектора в этом пространстве исключитель- но сложно. Вторая проблема наилучшим образом характеризовать ресурсы, необходимые для моделирования квантового компьютера классическим.
6.2. Квантовые схемы 305 Мы увидим, что, несмотря па обширность гильбертова пространства, клас- сический компьютер может моделировать n-кубитовый квантовый компью- тер, даже если его запас памяти ограничен, то есть полиномиален по п Это означает, что BQP содержится в классе сложности PSPACE проблем принятия решения, которые могут бьиь решены с использованием про- странства полиномиального размера, но могут потребовать для этого экспо- ненциального времени. [Мы знаем, что NP также содержится в PSPACE, так как проверка у^) -= 1 для всех может быть выполнена с использованием полиномиального пространства.]1 Третьей важной проблемой, к шторой следует обратиться, является точность. Класс BQP формально определен при идеализированном пред- положении, '[То квантовые вентили могут выполняться с идеальной точно- стью Ясно, что при любой реализации квантового вычисления очень важно ослабить это предположение. Семейство квантовых схем полиномиального размера, которое решает трудную проблему, не представляло бы большого интереса, если бы от используемых в схемах вентилей требовалась экспо- ненциальная точность. Мы покажем, чт о на самом деле это не гак. Идеали- зированная квантовая схема из Т вентилей с приемлемой точностью может моделироваться вентилями с шумом при условия, что вероятность ошибки па один вентиль пропорциональна 1 /Т. Таким образом, квантовые компьютеры бросают серьезный вызов сильному тезису Черча-Тьюринга, утверждающему, что любая физически разумная модель вычисления может быть смоделирована вероятностными классическими схемами с полиномиальным замедлением в худшем случае. Но до сих пор нет строгого доказательства того, что BQP ВРР, (6.58) и в ближайшем будущем оно не предвидится2. Действительно, следствием было бы ВРР ± PSPACE, (6.59) что решило бы один из давно стоящих, кардинальных открытых вопросов теории сложности Возможно, более реалис точно надеяться на доказательство того, что ВРР / BQP вытекает из другого стандартного предположения тео- рии сложности, такого как Р NP. Такое доказательство до сих пор 1В действительности в иерархии сложности существует еще одна ступенька, которая мо- жет разделять BQP и PSPACE; можно Показать, что BQP С Р#р С PSPACE, но ниже мы не будем рассматривать Р#р. “То есть не следует ожидать «нерели авизированного доказательств». Разделение между ВРР и BQP «относительно оракула» будет установлено ниже в этой главе.
306 Глава 6 не найдено. Но хотя мы все еще не в состоянии доказать, что квантовые компьютеры имеют возможности, выходящие далеко за пределы возмож- ностей обычных компьютеров, тем нс менее можно привести свидетель- ства, указывающие на то, что ВРР BQP. Мы увидим, что существу- ют проблемы, которые выглядят сложными (для классического вычисле- ния), но тем не менее могут быть успешно решены с помощью квантовых схем. Таким образом, кажется вероятным то, что классификация сложности будет зависеть от того, какой компьютер для решения задачи использу- ется, классический или квантовый. Если такое разделение действительно существует, то именно квантовая классификация должна рассматриваться как более фундаментальная, поскольку она в большей степени опирается на физические законы, управляющие Вселенной. 6.2.1. Точность Обсудим проблему точности. Представим, что мы хотим выполнить вычисление, в котором квантовые вентили U1( U2,..., UT последователь- но применяются к начальному состоянию |у>0). Состояние, приготовленное идеальной квантовой схемой, имеет вид кт) — . UgUtl^o). (6.60) Но в действительности наши вентили не являются идеально точными. Пы- таясь применить унитарное преобразование U(, мы вместо этого применя- ем некоторое «близкое» унитарное преобразование Ut. (Конечно, это не самый общий тип ошибки, который можно предположить, унитарное преобразование Ut может оказаться замененным супероператором. В этом случае применимы рассуждения, подобные следующим ниже, но здесь мы ограничим наше внимание «унитарными ошибками».) Ошибки приводят к тому, что действительное состояние компьютера удаляется от идеального Как сильно оно удаляется? Пусть |^?() обозначает идеальное состояние после применения t квантовых вентилей, гак что kJ = (6.61) Ио если мы применяем действительное преобразование Uf, то ujy’t-i) = kJ + |ь;). (6.62)
6.2. Квантовые схемы 307 где |t;) = (ut-uf>i.1) (6.63) — ненормированный вектор. Если |^t) обозначает действительное состоя- ние после I шагов, то l^i> = Ы + ю, fe) = U2|y5i> = fe) + 1^з) + fel-E)) (6,64) и так далее; в конечном счете мы получим 1+т) “ Iv’t) + l^r) + Uy|fir_t) + UTUT_JET_3) + ... 3 UTUT_j ...и2|£\), (6.65) Итак, мы представили разность между |<£г) и fe) в виде суммы Т остав- шихся слагаемых. Наихудший случай, дающий наибольшее отклонение \<p-t) от |<^т), возникает, если все оставшиеся слагаемые ориентированы в одном направлении, так что ошибки интерферируют конструктивно. Сле- довательно, life)-fe.)lfe 111^)11 + lllfe.i)ll + + ...3-111^)111111^)11, (6.66) где учтено, что ||U|E'l)|| = |||£t)|| для любою унитарного U, Пусть || А|| обозначает норму оператора А, то есть максимум модуля его собс твенных значений. Тогда 111^)11 -- II(и, - Ujfe.JH < II(Ut - UJII (6.67) (поскольку |<^( t) нормирован). Предположим теперь, что при каждом зна- чении t ошибка нашего квантового вентиля ограничена неравенством ||(U( — Ue)|j < £. (6.68) Тогда после применения Т квантовых вентилей мы имеем life) ~~ (6.69) в этом смысле накопление ошибки в состоянии растет пропорционально продолжительности вычисления.
308 Глава 6 Отклонение, ограниченное неравенством (6.68), может быть предшав- лено в эквивалентной форме ||Wt — 1||, где Wt — Utu). Так как опе- ратор унитарен, каждое его собственное число имеет вид фазы el6. а соответствующее собственное значение оператора Wt — 1 имеет модуль 1| = (2-2cos^)^2, (6.70) так что (6.68) требует, чтобы каждое собственное значение удовлетворяло неравенству cos^>i - у (6.71) (или Р| < е для малых е). Природа неравенства (6.69) понятна. В каждый момент времени |^) поворачивается относительно |у?) на угол порядка е (в худшем случае), а расстояние между векторами возрастает максимум на величину порядка е. Какая точность является достаточно хорошей? На последнем этапе вы- числения мы выполняем ортогональное измерение, а вероятность результа- та а в идеальном случае равна Р(а) = |(<фт>|2- (6.72) Вследствие ошибок действительной вероятностью будет Р(о) - |(а|^т)|2. (6.73) Если действительный вектор близок к идеальному, то и распределения ве- роятностей тоже близки. Если мы просуммируем но орто нормированному базису {|а)}, то получим £|Р(«ЬР(а)| < 2||Ы - Ы||, (6.74) а как вы покажете в домашнем упражнении. Следовательно, если при боль- ших Т мы сохраняем неизменным (и малым) Те, то ошибка в распреде- лении вероятностей также остается фиксированной. В частности, если мы разработали квантовый алгоритм, который с вероятностью выше | + <5 пра- вильно решав г проблему принятия решения (в идеальном случае), тогда с вероятностью, превышающей мы можем добиться успеха и с помо- щью наших шумящих вентилей, если действие этих вентилей может быть выполнено с точностью Т-. < 0(6}, Семейство квантовых схем может ре- ально решать сложные проблемы в классе BQP до тех пор, пока мы в со- стоянии улучшать точность выполнения вентилей пропорционально объему вычислений.
6.2. Квантовые схемы 309 6.2.2. BQP С PSPACE Конечно, классический компьютер может моделировать любую кванто- вую схему. Но какой объем памяти ему для этого потребуется? Поскольку моделирование п'-кубитовой схемы включает в себя манипулирование мат- рицами размера 2”, то с наивной точки зрения может показаться, что для этого необходим экспоненциальный по п запас памяти. Однако теперь мы покажем, что с приемлемой точностью (хотя и очень медленно!) модели- рование может быть выполнено в пространстве полиномиального размера. Это означает, что класс квантовой сложности BQP содержится в классе PSPACE задач, которые могут быть решены с использованием простран- ства полиномиального размера. Объектом классическою моделирования является вычисление вероят- ности каждого возможного результата а заключительного измерения РгоЬ(а) -- |(a|U<7')|0)|2, (6.75) где U(T) . - UTUT_!... U2U! (6.76) - произведение Т квантовых вентилей. Каждый Ue, дейс гвующий на п кубитов, может быть представлен унитарной 2п х 2п-матрицей, характери- зуемой комплексными матричными элементами (6.77) где х, у & {0,1,..., 2П — 1}. Явно выписывая произведение матриц, мы име- ем (a|U^|0) = ^2(ajUT|.Ty_1){xT_] |Ur_1|2.'T_2) ... (6.78) Уравнение (6.78) представляет собой вариант представления квантового вы- числения «интегралом по траекториям» — амплитуда вероятности конечно- го результата а выражается в виде когерентной суммы амплитуд каждого из огромного количества 2”^J возможных вычислительных путей, начи- нающихся в точке 0 и после Т шагов заканчивающихся в а. Чтобы вычислить (a|U^)|0), наш классический симулятор должен сложить 2’1^т" комплексных чисел в уравнении (6.78). Первая проблема, с которой мы встречаемся, состоит в том, что классические схемы конеч- ного размера реализуют целочисленную арифметику, тогда как матричные
310 Глава 6 элементы (y|UJx) не обязаны быть рациональными числами. Следователь- но, классический симулятор должен выполнять приближенные вычисле- ния с разумной точностью. Каждое из 2"^'-1' слагаемых суммы представ- ляет собой произведение Т комплексных сомножителей. Накапливаемые ошибки непременно должны быть малыми, если мы выражаем матрич- ные элементы с помощью m точных битов, где m велико по сравнению с п(Т — 1), Следовательно, мы можем заменить каждый комплексный мат- ричный элемент парой целых чисел определенного знака, принимающих значения {0,1,2,.... 2’"1}. Эти целые числа дают двоичное разложение вещественной и мнимой частей матричного элемента, выраженного с точ- ностью 2~т. Нашему симулятору потребуется вычислить каждое слагаемое в (6.78) и накопить их полную сумму. Но каждое добавление требует только уме- ренного объема пространства памяти, и, более того, поскольку для сле- дующего сложения необходимо сохранять только накопленную частичную сумму, не очень большое пространство требуется для суммирования всех слагаемых, даже если их экспоненциально много. Итак, остается лишь рассмотреть вычисление типичного слагаемого суммы, произведения Т матричных элементов Нам потребуется классиче- ская схема, вычисляющая жм (6.79) эта схема принимает 2п входящих битов (х, у) и выдаст на выходе 2m-би- товое (комплексное) значение матричного элемента. Имея схему, выпол- няющую эту функцию, легко построить схему, которая перемножает ком- плексные числа, не используя большого пространства. Наконец, обратимся к свойствам, которые мы потребовали от набора квантовых вентилей, — это дискретное множество вентилей, каждый из ко- торых действует на ограниченное количество кубитов. Поскольку имеется фиксированное (и конечное) количесгво вентилей, то существует лишь ко- нечное количество вентилей-подпрограмм, с которым нашему симулятору необходимо уметь обращаться. А поскольку вентили действуют только на несколько кубитов, почти все их матричные элементы исчезают (если п ве- лико), а значение {у |U |ж) может быть определено (с требуемой точностью) с помощью простой схемы, требующей незначительной памяти. Например, в случае однокубитового вентиля, действующего на первый кубит, {У1У2---yn\v\T'ix2 ‘-хп) -°, если х2х.л...хп^у2у^...уп. (6.80) Простая схема может сравнить х2 с у2, с и так далее и дать на выходе
6.2. КВАНТОВЫЕ СХЕМЫ 311 нуль, если равенство не выполняется. В случае равенства она выдает одно из четырех комплексных чисел (’Л 141*1) (6.81) с гп точными битами. Простая схема может закодировать 8т битов этой комплекснозначиой 2 х 2-матрицы. Подобным образом простая схема, тре- бующая пространство лишь полиномиального по п и т размера, может вычислить матричные элементы любого вентиля фиксированного размера Таким образом, классический компьютер с пространством, ограничен- ным сверху размером poiy(n). может моделировать n-кубитовый универ- сальный кван говый компьютер и, следовательно, BQP С PSPACE. Конечно, также очевидно, что описанное нами моделирование требует экспоненци- ального времени, так как нам необходимо вычислить сумму 2И^Г-1^ ком- плексных чисел. (В действительности большинство слагаемых исчезает, но количество неисчезающих слагаемых остается экспоненциально большим.) 6.2.3. Универсальные квантовые вентили Мы должны обратиться к еще одному фундаментальному вопросу, ка- сающемуся квантовых вычислений, как построить адекватный набор кван- товых вентилей? Другими словами, что образует универсальный квантовый компьютер? Ответ вам понравится. Для реализации универсальных квантовых вы- числений достаточно любого типичного двухкубитового вентиля. То есть, если мы можем применять эти вентили к любой паре кубитов, то любого из них, кроме множества меры нуль унитарных 4 х 4-матриц, достаточно, чтобы построить п-кубитовую схему, вычисляющую преобразование, сколь угодно близкое к любому элементу U(2Л). Математически это не особенно глубокий результат, но с физической точки зрения оп очень интересен Это означает, что в квантовом мире, пока мы можем придумывать типичные двухкубитовые взаимодействия и осу- ществлять их точно между любыми двумя кубитами, мы в состоянии вы- числять что угодно, независимо от сложности. Нетривиальные вычисления в квантовой теории встречаются повсюду. Кроме этого общего результата, интересно продемонстрировать и кон- кретные наборы универсальных вентилей, которые очень легко могут быть реализованы физически. Обсудим несколько примеров. Существует несколько основных элементов, входящих в состав любого набора универсальных квантовых вентилей.
312 Глава 6 (1) Степени типичного вентиля. Рассмотрим «типичный» fc-битовый вен- тиль. Это унитарная 2к х 2,г-матрица U с собственными значениями . е4^1". Для всех, кроме множества меры нуль, таких мат- риц каждое 0г представляет собой иррациональное число, кратное тг, и все несоизмеримы (каждое 0,/^ тоже иррационально). Положи- тельная целая степень U" матрицы U имеет собственные значения Каждый такой список собственных значений определяет точку на 2к-мерном торе (произведении 2* окружностей). Так как п принима- ет целые положительные значения, зти точки плотно запо^зняют весь тор, если U является типичной. Если U — РА, то для любого веще- ственною Л положительные целые степени U сколь угодно близки к U(А) — etXA. Мы утверждаем, что любое U(A) достигается положи- тельными целыми степенями U. (2) Переключение входов и выходов. Имеется несколько (классических) преобразований, которые можно выполнить, всего лишь переставив метки k кубитов или, другими словами, применяя вентиль U к ку- битам в друзом порядке. Из (2/;)! перестановок строк длиной k путем обмена кубитами можно реализовать к1 Если вентилем, применяемым к к кубитам в стандартном порядке является U, а Р — перестанов- ка, осуществляемая путем обмена кубитами, то мы можем построить вентиль U'. PUP 1 (6.83) только с помощью переключения входов и выходов исходного вентиля. Например, обмен двумя кубитами осуществляег перестановку Р :• |01) ~ (10) (6.84) или (1 О О О 0 1 О ] о ООО действующую в базисе {(00), |01), |10), |11)}. Переключая входы и выходы, мы получаем вентиль 0 о (6.85)
6.2. Квантовые схемы 313 Мы можем также построить любую целую положительную степень V*' (PUP”1)” --PU"P-\ (3) Замкнутая алгебра Ли. Мы уже замечали, чго если вентиль U — е‘А является типичным, то его степени плотны на торе {е‘>'А }. Мы можем далее доказать, что если U = РА и U' = егВ типичные вентили, то для любых вещественных a, fl, у из них можно составить вентиль, сколь угодно близкий к Р'>А+/?В) ндн e-TiA,B) (6 g6) Таким образом, «достижимые» преобразования образуют замкнутую алгебру Ли. Мы говорим, что U - егА генерируется преобразовани- ем А; тогда если А и В являются типичными генераторами достижи- мых преобразований, то э гим же свойством обладают их вещественные линейные комбинации и (умноженный на i) коммутатор. Сначала заметим, что lim = Ип1 Л+1(аА+/ЙВЛ =едаА+/зв). (6 87) п —>оо 4 z п—»оо \ “ / Следовательно, любое преобразование сйоА+дв) дОСтажиМо, если та- ковыми являюгся егаА-/п и ечЗв/п. Более того. (6.88) так что е 1А|В| также достижимо. Применяя результаты (1), (2) и (3), можно показать, что типичный двухкубитовый вентиль является универсальным. 1. Вентиль Дойча. Первым, обратившим внимание на существова- ние универсального квантового вентиля, был Дэвид Дойч (1989 г.). Трехку- битовый универсальный вентиль Дойча является квантовым кузеном вен- тиля Тоффоли. Это дважды контролируемое 1Спрсобра.зование
314 Глава 6 которое применяет R к третьему кубиту, если два первых имеют значение, равное единице; в противном случае - действует тривиально. Здесь R — -1Их(0) = —iexp fcos | + iCr.r s’n | j (6.89) представляет, с точностью до фазы, поворот на в вокруг оси х, где 6 неко- торый несоизмеримый с тг угол. n-ая степень вентиля Дойча представляет собой дважды контролируе- мое Rn. В частности, R4 = RE(40), так что все однокубитовые преобра- зования, генерируемые я,, достигаются целыми степенями R. Более того, его (4п + 1)-ой степенью является преобразование (4п + 1)0 (4n -|- 1)0 cos-----g----4- гах sin--------- (6.90) сколь угодно близкие к <тж. Следовательно, вентиль Тоффоли достигается целыми степенями вентиля Дойча, то есть вентиль Дойча является универ- сальным для классических вычислений. Действуя на трехкубитовый вычислительный базис {|000), |001), |010), {ОН}, |100>, |101>. |110), |1П) (6.91) । енератор вентиля Дойча переставляет два его последних элемента. |110) ~ ДИ). (6.92) Изобразим эту 8 х 8-матрицу как (0 0 (6.93) С помощью вентиля Тоффоли можно выполнить перестановку любых этих восьми элементов, в частности, для любых тип Р - (6т)(7п). (6.94) Следовательно, нам доступно любое преобразование, генерируемое PtpJwP-1 (o-x)mn- (6 95)
6.2. КВАПТОВЫЬ СХЕМЫ 315 Более того, / 0 ° 1 \ ООО = i(<ry)57. \-1 о о/ (6.96) Аналогично мы можем реализовать любое унитарное преобразование, ге- нерируемое Наконец, (6.97) Следовательно, нам доступно любое преобразование, генерируемое линей- ной комбинацией матриц (ах v ,)mn. Они образуют линейную оболочку ал- гебры Ли SU(8), следовательно, мы можем генерировать любое трехкуби- товое унитарное преобразование (за исключением несущественной общей фазы) Вспомним теперь, что мы уже обнаружили, что, комбинируя трехби- товые вентили Тоффоли, можно построить n-битовый вентиль Тоффоли. Схема использует один вспомогательный бит, чтобы построить четырехбитовый вентиль Дойча (трижды контролируемое R) из одного трехбитового венти- ля Дойча и двух трехбитовых вентилей Тоффоли Аналогичная схема ре- ализует 77-битовый вентиль Дойча из одного трехбитового вентиля Дойча и двух п — 1-битовых вентилей Тоффоли. Коль скоро мы имеем п-битовый вентиль Дойча, а также универсальное классическое вычисление, точно те же аргументы, что и выше, показывают, что можно реализовать любое пре- образование из SU(2й). 2. Универсальные двухкубяговые вентили. Мы видели, что для универсальности классических обратимых вычислений необходимы трех- битовые универсальные вентили. Однако в квантовых вычислениях ока- зываются адекватными двухкубиговые вентили. Поскольку мы уже знаем, что вентиль Дойча универсален, мы можем установить это, показав, что он может быть образован комбинацией двухкубитовых вентилей.
316 Глава 6 Фактически, если U обозначает вентиль контролируемое U (унитарное 2 х 2-преобразование U применяется ко второму кубиту, если первый имеет значение, равное едини- це; в противном случае вентиль действует тривиально), то вентиль дважды контролируемое U получается с помощью схемы Степенью U, примененной к третьему кубиту, является у — (ж Ф у) + х — т Н у - (г + у - 2ту) = 2ху. (6.98) Следовательно, вентиль Дойча можно построить из вентилей контролируе- мого U, контролируемого U 1 и контролируемого NOT, где и'2 - -ЖДЯ) : (6.99) мы можем выбрать (6.100) Так как положительные степени U сколь угодно близко приближаются к <тх и U-1, то вентиль Дойча можно сконструировать из одного лишь кон- тролироуемого U. Следовательно, при иррациональном fl/тг контролиру- емое е_’'7Г/4р.;г само по себе является универсальным вентилем. (Заметим, что приведенная выше конструкция показывает, что, несмот- ря на то, что мы не можем построить вентиль Тоффоли из классических двухбитовых обратимых вентилей, его можно сконструировать из корре- лируемого «квадратного корня из NOT», то есть контролируемого U, квад- рат которого U2 = сгт.)
6.2. КВАН ГОВЫЕ СХЕМЫ 317 3. Типичные двухбитовые вентили. Итак, мы нашли конкретные двухбитовые вентили (контролируемые повороты), являющиеся универ- сальными. Следовательно, для универсальноеги вполне достаточно, если мы можем строить плотные в (7(4) преобразования, действующие на пары кубитов. Однако на самом деле достаточно любого типичного двухкубитового вентиля, чтобы генерировать все преобразования из (7(4). Как мы видели, если eiA - типичный элемент (7(4), то можно реализовать любое преоб- разование, 1 енерируемое А. Более того, можно реализовать любые преоб- разования, генерируемые элементом минимальной алгебры Ли, содержа- щей А и В = РАР-1, (6.101) где Р — перестановка (|01) |10)), получаемая переключением входов и выходов. Рассмотрим теперь общее преобразование А [разложенное в базисе ал- гебры Ли U (4)], а также рассмотрим конкретную схему построения 16-ти элементов алгебры Ли путем последовательных коммутаций исходя из А и В. Конструируемые таким образом элементы линейно независимы [а от- сюда следует, что любое преобразование в (7(4) достижимо], если опреде- лит ель конкретной 16 х 16-матрицы не равен нулю. Если этот определитель не обращается в пуль тождественно, то его нули появляются только на под- многообразии меры нуль. Фактически мы можем выбрать, допустим, А (а! + 4-7<т!;)2з (6.102) (при несоизмеримых а, 3. д) и с помощью явных вычислений показать, что действительно, начиная с А и В, последовательными коммутациями мож- но генерировать всю 16-мерную алгебру Ли, Следовательно, мы приходим к заключению, что неуспех генерирования всей алгебры U(4) нетипичен, и обнаруживаем, что почти все двухкубитовые вентили универсальны. 4. Другие достаточные наборы вентилей. Очевидно также, что универсальные квантовые вычисления можно реализовать с помощью на- бора вентилей, состоящих из классических многокубитовых и квантовых однокубитовых вентилей. Например, можно увидеть, что универсальный набор образуется вентелем XOR, комбинируемым с однокубитовыми вен- тилями. Рассмотрим схему
318 Глава 6 применяющую ко второму кубиту преобразование АВС , если л - О, и Асг^Всг^С, если х — 1. Если мы можем подобрать такие А, В, С, что АВС 1, Ао^ВсГуС -- U, (6.103) тогда эта схема функционирует как вентиль контролируемое U. Факти- чески для любого унитарного U с единичным определителем существу- ют унитарные 2 х 2-преобразования А, В, С с такими свойствами (как вы покажете в упражнении). Следовательно, XOR в совокупности с про- извольными однокубитовыми преобразованиями образуют универсальный набор. Конечно, двух типичных (некоммутирующих) однокубитовых пре- образований достаточно, чтобы добиться чего угодно, В действительности с помощью XOR-a и единственного типичного однокубитового поворота мы можем построить второй однокубитовый поворо т, не коммутирующий с первым. Таким образом, XOR вместе со всею лишь одним однокубито- вым вентилем образует универсальный набор вентилей. Если мы способны реализовать вентиль Тоффоли, тогда для универ- сальных вычислений достаточно даже некоторых нетипичных одпокубито- вых преобразований. Например (еще одно упражнение), вентиль Тоффоли совместно с поворотами на тт/2 вокруг осей х и z представляет собой уни- версальный набор, 5. Точность. Наше обсуждение универсальности сфокусировалось на достижимости, оставив без внимания сложность. Мы всего лишь уста- новили, что можем построить квантовую схему, сколь угодно близкую к требуемому элементу из U(2П), но не рассмотрели размер необходимой нам схемы. Однако с точки зрения теории квантовой сложности универсаль- ность очень важна, поскольку она означает, что с приемлемой точностью и разумным замедлением один квантовый компьютер может моделировать другой, В действительности до сих пор мы были не очень точны в вопросе о том, что означает для одного унитарного преобразования бы гь «близким» к другому; для этого следует определить топологию. Одна возможность представляет собой использование той же нормы, что и в предыдущем об- суждении точности. Тогда расстоянием между матрицами U и W явля- ется ||U — W|| Еще одна естественная топология связана с внутренним произведением (W|U) = trWfU (6.104)
‘6.2, Квантовые схемы 319 (если U и W являются /V х А-матрипами, то это в точности обычное внут- реннее произведение в C'v , в котором U рассматривается как №-компо- нентный вектор), Тогда мы можем определить квадрат расстояния между матрицами как [|U - W||2 - (U - W|U - W), (6.105) Для анализа сложности подходит практически любая разумная топология. Решающим моментом является то, что, имея любой универсальный набор вентилей, мы можем подойти на расстояние е к любому желаемому преобразованию, действующему па фиксированное количество кубитов, ис- пользуя квантовую схему, размер которой О1рапичен сверху полиномиаль- но по с-1. Следовательно, один универсальный квантовый компьютер мо- жет моделировать другой с точностью е и не хуже, чем с полиномиальным по t-1 фактором замедления. Теперь нам уже понятно: чтобы иметь высо- кую вероятность получения правильного ответа при выполнении квантовой схемы размера Т, необходимо обеспечить выполнение каждого квантового вентиля с точностью порядка Т-1. Следовательно, если вы имеете семей- ство квантовых схем полиномиального размера, которые выполняет ваш квантовый компьютер, то я могу изобрести семейство схем полиномиаль- ного размера, которые выполняет моя машина и с приемлемой точностью эмулирует вашу. Почему схема polyfe'-^-размера может достичь данного /с-кубитового преобразования U в пределах расстояния г? Мы знаем, например, что поло- жительные целые степени типичного fc-кубитового егА плотны на 2*-торе {elAA}. Область тора в пределах расстояния £ до любой заданной точки имеет объем порядка е2* Следовательно, с помощью (e‘A)re при некото- ром целом п порядка мы можем асимптотически (при достаточно ма- лом г) достичь любого преобразования {егАА} с точностью не хуже г. Нам также известно, что, используя схемы фиксированного размера (независи- мого от е), мы можем получить преобразования {е*А°}, где Аа образуют линейную оболочку полной алгебры Ли C(2fe). Тогда также с полиноми- альной сходимостью мы можем аппроксимировать любое exp , как в уравнении (6.87), В принципе мы способны добиться гораздо лучшего результата, дости- гая желаемого А -кубитового унитарного преобразования с точностью не ху- же £ с помощью только poly (log(е 5)) квантовых вентилей. Так как коли- чество схем размера Т, которые мы можем построить, действуя на к куби- тов, экспоненциально по Г, а схемы заполняют U(‘2к ') примерно однородно,
320 Глава 6 то должна существовать схема размера Т, достигающая и пределах расстоя- ния порядка е 1 любой точки в U(2*). Однако это може с оказаться трудной вычислительной задачей - классическим способом разработать схему экс- поненциально близко подходящую к унитарному преобразованию, которого мы пытаемся достичь, Поэтому было бы нечестно опираться на эту более эффективную конструкцию в асимптотическом анализе квантовой сложно- сти. 6.3. Некоторые квантовые алгоритмы Хотя мы по-прежнему не в состоянии показать, что ВРР ± BQP, существует три подхода, которым можно последовать, чтобы изучить различия между возможностями классических и квантовых компьюте- ров. (1) Неэкспоненциальное ускорение. Мы можем найти квантовые алго- ритмы, которые заметно быстрее лучших классических алгоритмов, по не экспоненциально быстрее. Эти алгоритмы не проливают свет на общепринятую классификацию сложности. Но они демонстрируют ха- рактер разделения между задачами, которые могут выполнять клас- сические и квантовые компьютеры. Пример’ троверовское квантовое ускорение поиска в неструктурированной базе данных. (2) «Релятивизированное» экспоненциальное ускорение. Мы можем рассмотреть проблему анализа содержимого «квантового черною ящи- ка». Ящик выполняет a priori неизвестное унитарное преобразование. Мы можем приготовить для него входные данные и измерить его ре- зультат; наша задача определить, что делает ящик. Оказывается воз- можным доказать, что существуют квантовые ящики (специалисты по теории вычислений называют их оракулами1), обладающие следую- щим свойством: загружая ящик квантовыми суперпозициями, можно узнать, что находится внутри него, с экспоненциальным ускорением по сравнению с тем, как много времени пришлось бы потратить, если бы нам были разрешены только классические входные данные. Специа- лист по теории вычислении сказал бы, что ВРР / BQP «относи- тельно оракула». Пример: саймоновское экспоненциальное квантовое ускорение отыскания периода функции «2 в 1». “Термин «оракул» означает, что ящик отвечает на вопрос иемедченно; то есть время, за- трачиваемое на его работу, не включается в анализ сложности
6.3. Некоторые квантовые алгоритмы 321 (3) Экспоненциальное ускорение для «по-видимому» трудных задач. Мы можем продемонстрировать квантовый алгоритм, решающий в те- чение полиномиального времени задачу, которая с классической точки зрения выглядит сложной, то есть серьезно подозревается (хота и не доказано), что эта задача не принадлежит ВРР. Пример: алгоритм факторизации Шора. 1. Проблема Дойча. Мы обсудим примеры из всех трех подхо- дов. Но для начала разомнемся, вспомнив пример простого квантового алгоритма, который предварительно обсуждался в разделе 1.5: алгоритм Дойча для различения между постоянной и сбалансированной функциями f: {0. i} — {0,1}. Нам предоставлен квантовый черный ящик, вычисляю- щий /(ж); то есть приводящий в действие двухкубитовое унитарное преоб- разование Uf : |а» -» |х)|уФ/(х)), (6.106) которое инвертирует второй кубит, если /(первый кубит) — 1. Наша задача состоит в том, чтобы определить, выполняется ли /(0) — /(1). Если мы ограничены «классическими» входными данными |0) и |1), то, чтобы полу- чить ответ; нам необходимо обратиться к ящику дважды (.г - 0 и .с - 1). По если нам позволено ввести когерентную суперпозицию этих «классиче- ских» состояний, то достаточно одного раза. Квантовой схемой, решающей эту проблему (обсуждавшуюся в разде- ле 1.5), является Измерение |1)-[я '—I ---------- Здесь Н обозначает преобразование Адамара или н : W - 4т v2 у Н : |0) -> -( |1», ID - ~(|0) - |1»; (6.107) (6.108)
322 Глава 6 то есть Н представляет собой 2 х 2-матрицу 1 -1 (6.109) Схема преобразует вход |0)]1) в |0>|1) - ±(|0) + |1»(|0)-|1» £ + [(-1)л°> - (-1У(1)] П)} ^=(|о) -11)). (6.1Ю) Тогда при измерении первого кубита с вероятностью единица будет полу- чен результат |0), если /(0) = /(1) (постоянная функция), и с вероятностью единица — результат |1), если /(0) =/ /[!) (сбалансированная функция). Квантовый компьютер обладает преимуществом перед классическим компьютером, поскольку он может привлечь квантовый параллелизм. Так как мы вводим суперпозицию состояний |0) и |1), выход чувствите- лен к обоим значениям /(0) и /(1), даже если мы обратились к ящику только один раз. 2. Проблема Дойча - Йожы. Рассмотрим теперь некоторые обобще- ния проблемы Дойча. По-прежнему будем предполагать, что нам нужно анализировать квантовый черный ящик («квантовый оракул»). Но в надеж- де узнать что-нибудь о сложности мы будем представлять, что имеем се- мейство черных ящиков с переменным размером входа. Нас интересует, как время, необходимое для определения того, что происходит внутри ящи- ка, зависит от размера входа (где «время» измеряется тем, сколько раз мы обращаемся к ящику с вопросом). В задаче Дойча-Йожы нам предоставлен квантовый черный ящик, который вычисляет функцию, преобразуя п битов в один: / : {0,1}" {0,1}, (6.111) причем у нас есть все основания полагать, что f — постоянная [/(я) = с для всех т] или сбалансированная [/(х) — 0 для ровно половины возмож- ных значений входа] Мы должны решить проблему принятия решения: является ли f постоянной или сбалансированной?
6.3, Некоторые квантовые алгоритмы 323 Фактически, используя ту же схему, что и для решения проблемы Дой- ча (но с х, расширенным от одного до п битов), мы также можем решить и эту проблему, обращаясь к ящику только один раз. Заметим, что если п вентилей Адамара параллельно применяются к п кубитам HW Н®н® (6.112) то п-кубитовое состояние преобразуется как где х, у представляют «-битовые строки, а х-у обозначает побитовое AND (или скалярное произведение по модулю два); х у = Л ух) ф (х2 А у2) Ф - - - Ф (хп Л г/п). (6.114) Действуя на вход (|0))fljl), схема преобразует его следующим образом: (2"-1 \ А? Е н -Л=<|о> - id) i x=0 ) V “ (2"-l \ ^(-lRx) ^(|o)-(i)) (6.115) 2n/2 J ^2 ± E -^(|0)-ii)). c=0 y=0 / *2 Теперь вычислим сумму (6.116) Если f — постоянная функция, то эта сумма равна 2”-1 \ =(-И'Ч» z^O / (6.И7)
324 Глава 6 она обращается в нуль, за исключением случая, когда у — 0. Следоваг ельно, при измерении n-битового выходного регистра с вероятностью единица бу- дет получен результат |у — 0) = (|0))”. По если функция / сбалансирована, то при у — 0 сумма (6.116) становится равной 2"-1 (6.Н8) ж=П [поскольку половина слагаемых равны ( I 1), а другая половина - (-1)]. Следовательно, вероятность получения результата измерения - 0) равна нулю. Мы приходим к выводу, что квантовому оракулу достаточно одною во- проса, чтобы со 100% уверенностью различить постоянную и сбалансиро- ванную функции. Результат измерения у = 0 означает, что f — постоянная, любой другой результат сбалансированная. Итак, квантовое вычисление изящно решает эту задачу, но действи- тельно ли эго грудная проблема с классической точки зрения? Ограничи- ваясь вводом классических состояний |зг), мы можем задавать вопрос ора- кулу неоднократно, всякий раз выбирая ввод х случайным образом (без возврата). Как только будут получены различные о тветы на два различных вопроса, мы определим, что функция сбалансирована (не постоянная). Но если функция фактически является постоянной, мы не будем уверены в том, что это действительно так, до тех пор пока не предложим 2Г‘ '' + 1 вопро- сов, получая всякий раз один и тот же ответ. В противоположность этому квантовое вычисление дает определенный ответ всего лишь в один при- ем. В этом смысле (если мы требуем абсолютной определенности) класси- ческое вычисление требует экспоненциального по п количества вопросов, тогда как квантовое вычисление нет, следовательно, можно говорить об экспоненциальном ускорении. Но может быть неразумно требовать абсолютной определенности от классического вычисления (в частности, так как любой реальный компью- тер подвержен ошибкам, то и квантовый компьютер также будет нс спо- собен достигать абсолютной надежности). Допустим, что нас удовлетворя- ет предположение о сбалансированности или постоянстве с вероятностью успеха F(success) > 1 - £. (6.119) Если функция действительно сбалансирована, то вероятность получе- ния всякий раз одного и того же ответа на к заданных вопросов рав- на р — 2 Если после получения одного и того же ответа к раз под-
6.3. Некоторые квантовые алгоритмы 325 ряд мы сделаем предположение, что функция постоянна, быстрый бсйесов- ский анализ показывает, что вероятность того, что наша догадка ошибочна, равна -:-4----(в предположении, что сбалансированность и постоянство -t 1 a priori равновероятны). Итак, если мы высказываем догадку после к во- просов, то вероятность ее ошибочности 1 - /Vsuccess) = -7—7—гЦ---------• 2fc-’(2ft-14 1) (6.120) Следовательно, мы можем достичь вероятности успеха 1 — е при е 1 = - 2к 1(2'£"1 + 1) или при к ~ | log |. А так как экспоненциально высокая вероятность успеха достигается с помощью полиномиального количества попыток, то на самом деле незаконно говорить, что проблема является труд- ной. 3. Задача Бернштейна -Вазирани. Точно такая же схема может быть использована для решения другого варанта задачи Дойча-Йожы. Предположим, что наш квантовый черный ящик вычисляет одну из функ- ций fa, где fa(x) — a-x, (6.121) а а представляет собой n-битовую строку. Наше задача — определить а. Квантовый алгоритм может с определенностью решить эту задачу, по- лучив только один (».-ку битовый) квантовый вопрос. Для этой конкретной функции квантовое состояние в уравнении (6 115) имеет вид 2"-1 2Л —1 Дг£ £(-i)ai(-iryh/>. у=0 Но фактически 2"-1 £(-!)“ ж(-1)^- <5. it—0 (6.122) (6.123) то есть этим состоянием является )а). Мы можем выполнить схему один раз и измерить n-кубитовый регистр, обнаружив с вероятностью единица тг-би- товую строку а. Если разрешены только классические вопросы, то на, каждый из них мы получаем только один бит информации и для определения значения а требуется п вопросов Следовательно, мы имеем четкую границу меж- ду квантовой и классической сложностью задачи. Правда, этот пример не
326 Глава 6 вскрывает соотношения между ВРР и BQP, поскольку классическая зада- ча не является трудной. Количество вопросов, необходимых с классической точки зрения, всего лишь линейно, а не экспоненциально по размеру входа. 4, Задача Саймона. Бернштейну и Вазирани удалось сформулиро- вать вариант предыдущей задачи, который является классически труд- ным, и, таким образом, впервые установить «релятивизированную» гра- ницу между квантовой и классической сложностью. Мы найдем более по- учительным рассмотреть более простой пример, несколько позднее предло- женный Даниэлем Саймоном. Снова нам предоставлен квантовый черный ящик, п на этот раз мы уве- рены в том, что он вычисляет функцию «2 в 1» f ; {0,1}" - {0,1}". (6.124) Более того, функция имеет период, определяемый /^-битовой строкой «; то есть fix') — ffy'h если у = (6.125) где ф — побитовая XOR-операция. [То ос гь а является периодом, если мы рассматриваем х принимающим значения из (Z2а пе из Z>-, J] Это все, что нам известно об ]'. Наша задача - определить значение а. Эта задача классически трудная. Нам необходимо обратиться к ора- кулу экспоненциально большое количество раз. чтобы иметь какую-нибудь разумную вероятность определения а. Мы ничего нс узнаем, пока нам не повезет выбрать два вопроса т и у, которые случайно окажутся удовлетво- ряющими Х'Га — у. Допустим, например, что мы выбираем 2п'4 вопросов. Количество пар вопросов меньше чем и доя каждой пары {.т,у} вероятность того, что х ф а = у, равна 2 ". Следовательно, вероятное, ь успешного отыскания а меньше, чем 2-^2"/4)2-2-"'2: (6.126) даже при экспоненциально большом количестве вопросов вероятность успеха экспоненциально мала. Если угодно, эту задачу можно сформулировать как проблему приня- тия решения, функция f является иди одно-однозначиой (1 в 1), или отоб- ражает два в од.ю (2 в 1) с некоторым случайно выбранным периодом а: - группа, элементами которой являются двоичные строки длины п Групповая операция представляет собой побитовое сложение по модули 2. — ipynna остатков ui сложения по моду по 2П, — /7/жм рео
6.Я- НЕКОТОРЫЕ КВАН ГОВЫЕ АЛГОРИТМЫ 327 обе 31 и возможное!и имеют априорные вероятности ] /2. Нам нужно опре- делить, являс1ея ли функция 1 в 1 или 2 в 1. Тот.[а после 2Г,/1 классических вопросов вероятность корректной догадки удовлетворяет неравенству PiBiiceess! < к + Ц (6.127) и не удаляется от 1/2 при больших значениях г>. Но для квантовых вопросов проблема является простой! Используе- мая нами схема, по существу, та же, что и выше, по теперь оба pei истра расширены до п кубитов. Мы готовим равно взвешенную суперпозицию всех п-битовых строк (действуя на |0) преобразованием Н^’!). а затем об- ращаемся к оракулу: (?"-1 \ -1 Е ж |°> - Е 1гжи). (6.128) х=0 / > =0 Теперь мы измеряем второй регистр. (Этот этап на самом деле не обяза- телен, но для ясности изложения я включаю его сюда.) Результатом из- мерения является значение, случайно выбранное из 2" 1 равновероятных значений /(•<;), Допустим, резудыатом яв.1яегся /Ду)- Тогда, поскольку оба значения, т., и Щн, и только они отображаются функцией / па f (.г, j, мы приготовили состояние + |Т) Ф о)) (6.129) /2 в нервом регистре. Теперь мы хотим извлечь некоторую информацию относительно я. Очевидно, что на этом этане было бы бесполезно измерять регистр (н вы- числительном базисе). Мы получили бы результат л0 или э'о Ф « с вероят- ностью 1 /2 каждый, но ни тот. ни другой ничего tie сказал бы о значении а. Но представим теперь, чго непосредственно перед измерением мы применили к регистру преобразование Адамара НЖ Н' . (W + k.eaJH /2 ттЖ Ел-п-'ы «-.ад “ п у - о
328 Глава 6 Если а - у = 1, то слагаемые в коэффициенте перед |у) интерфериру- ют деструктивно. Следовательно, в сумме по у выживают только состоя- ния с а у = 0 Тогда результатом измерения является случайным обра- зом выбранное из всех возможных значений у, появляющихся с вероятно- стью 2‘ таких, что а у = 0. Мы многократно повторяем этот алгоритм, получая всякий раз еще одно значение у, удовлетворяющее а • у = 0. Как только мы найдем п таких линейно независимых значений {т/1; у2, t/3, ... г/,,} [то есть линейно независимых над (Z2)n], мы можем решить уравнения Уг а = 0, Уо а =- 0, (6.131) Уп • а °, чтобы определить единственное значение а, и, таким образом, решить по- ставленную задачу. Нетрудно видеть, что с помощью О(п) повторений мы можем достичь вероятности успеха, экспоненциально близкой к еди- нице. Итак, наконец-то мы нашли пример задачи, которую можно решить за полиномиальное время, используя квантовые суперпозиции для данно- го частною типа оракула, тогда как если ограничиться классическими во- просами, то для этого потребуется экспоненциальное время. Специалист по теории вычислений мог бы сказать. Существует оракул, относительно которого BQP i ВРР Заметим, что всякий раз, когда мы сравниваем классическую и кванто- вую сложность относительно оракула, мы рассматриваем квантовый оракул (вопросами и ответами являются состояния в гильберовом пространстве), но с выделенным ортонормированным базисом. Если мы предлагаем клас- сический вопрос (элемент выделенного базиса), то всегда получаем клас- сический ответ (другой элемент базиса). Проблема в том, можем ли мы достичь существенного ускорения, выбирая более общие, квантовые, во- просы. 6.4. Квантовый поиск в базе данных Следующий алгоритм, который мы изучим, подобно алгоритму Сай- мона, также демонстрирует ускорение по отношению к тому, чего мы мо-
6.4. Квартовый поиск в базе данных 329 жем достичь с помощью классических вычислений. Однако в противопо- ложность экспоненциальному ускорению решения задачи Саймона в этом случае ускорение только квадратично (квантовое время растет как квадрат- ный корень классического времени). Несмотря на это, результат (открытый Л. Гровером) чрезвычайно интересен ввиду большой полезное!и этою ал- горитма' . Рассматриваема» эвристически, проблема, к которой мы обратимся, выглядит так: мы столкнулись с очень большой неструктурированной ба- зой данных, содержащей » 1 отдельных объектов, а нам необходимо локализовать один конкретный объект, одним словом, найти иголку в стоге сена. С математической точки зрения база данных представлена таблицей или функцией f(x) с х е {0, 1, 2,... ЛГ-1}. Мы уверены в том, что отдель- ная запись а появляется в таблице только один раз, то есть что f(x) — а только при одном значении х. Проблема состоит в том, чтобы по данному а отыскать это значение х Если база данных подходящим образом структурирована, то поиск х прост. Возможно, кто-то был настолько любезен, что записал значения а в возрастающем порядке. Тогда мы можем найти х, просмотрев только log2 N отдельных записей в таблице. Предположим, что N — 2" являет- ся степенью двойки. Мы сначала найдем /(х) при х — 2Г1‘1 * - 1 и про- верим, больше ли /(х), чем а. Если да, то мы найдем следующее / при х _ 2"’ 3 — 1 и так далее. С каждым взглядом на таблицу мы вдвое со- кращаем количество кандидатов среди значений х, так что достаточно п взглядов, чтобы прошерстить все 2П рассортированных записей. Вы може- те использовать этот алгоритм, чтобы отыскать номер в телефонной книге Лое Анжелеса, поскольку в ней имена записаны в алфавитном порядке. Но допустим, что вы знаете чей-то номер телефона, и вы хотите узнать его имя. Если у вас нет возможности заглянуть в обратный справочник, то процедура поиска будет утомительна. Ваши шансы таковы: вам придется проверить порядочное количество отдельных записей в телефонной книге, прежде чем вы наткнетесь на известный вам номер. Фактически, если N номеров записаны в случайном порядке, то вам необходимо просмотреть N/2 номеров, прежде чем с вероятностью Р — — 1/2 найти его номер (и, следовательно, его имя). Обнаруженное Грове- ром состоит в том, что если вы имеете квантовую телефонную книгу, то, обратившись к ней примерно только з/TV раз, вы можете с высокой вероят- ностью узнать интересующее вас имя. Эта задача тоже может быть сформулирована как проблема оракула 1L К. Grover, Quantum Mechanics Helps in Searching for a Needle in a Haystack, Phys. Rev, Lett, 79, 325-328 (1997). quant-ph/9706033.
330 Глава 6 или «черного ящика». В этом случае оракулом является телефонная ките а или справочная таблица. Мы можем ввести имя (значение х), а оракул - выдать нуль, если f(x) / а, или единицу, если f(x) = а. Наша задача — как можно быстрее найти значение х, при котором f(x) - а. (6.132) Почему эта проблема важна? Возможно, вы никогда нс пытались най- ти в телефонной книге имя, которое соответствует данному номеру, но если бы эго не было так 'грудно, то вы, может быть, гораздо чаще пытались бы делать это. Ьолее широко метод быстрого поиска в неструктурированной базе данных можно было бы привлечь к решению любой задачи из NP. Нашим оракулом может быть подпрограмма, которая опрашивает каждо- го потенциального «свидетеля» у, который потенциально мог бы подтвер- дить решение проблемы. Например, если мы сталкиваемся с графом и нам необходимо узнать, существует ли на нем гамильтонов обход, мы можем представить обход «оракулу», а он - быстро ответить, является этот об- ход гамильтоновым или нет. Если бы нам был известен быстрый способ спросить оракул обо всех возможных обходах, то мы были бы способны эффективно найти гамильтонов обход (если он существует). 6.4,1, Оракул Итак, «оракулом» кратко называют подпрограмму, которая быстро вы- числяет функцию, чтобы проверить предлагаемое решение проблемы при- нятия решения, однако продолжим рассматривать оракул абстрактно, как «черный ящик». Оракул «знает», что из 2" возможных строк длины п одна («помеченная» строка или «решение» w) особенная. Мы предлагаем ораку- лу вопрос х, а он сообщает- нам или х = или нет. Другими словами, он сообщает значение функции ZU#) = о, fu(x) = 1, X — Ш. (6 133) Даже более того, это квантовый оракул, следовательно, он может отвечать на вопросы, представляющие собой суперпозиции строк. Оракулом являет- ся квантовый черный ящик, выполняющий унитарное преобразование (6.134) где |х) - n-кубитовое состояние, а |у) — однокубитовое состояние.
6.4. Квантовый поиск в базе данных 331 Как мы видели раньше в других контекстах, состояние однокубито- вого регистра может быть выбрано равным ^=(1°) ~ М))» так что оракул действует как (6.135) Теперь мы можем игнорировать второй регистр и получизъ Uw : |х) - (-1)^’)|ж) (6.136) или Uw - 1 -2|w)H (6.137) Оракул обращает знак состояния |<л), но па любое другое состояние, орто- тональное р), действует тривиально. Это преобразование имеет простую геометрическую интерпретацию. Действуя на любой вектор в 2"-мерном гильбертовом пространс тве, Uотражает его в гиперплоскости, перпен- дикулярной |щ) (он сохраняет компоненты в гиперплоскости и обращает компоненту вдоль [<л)). Мы знаем, что оракул выполняет это отражение для некоторого частно- го состояния вычислительного базиса |о.-), но a priori нам ничего не извест- но относительно значения строки Наша задача — обращаясь к оракулу минимальное количество раз, определить с максимальной вероятностью. 6.4.2. Итерация Гровера В качестве первого шага приготовим состояние w = <6-138> V х=о Равновзвешенная суперпозиция всех состояний вычислительного базиса може г быть легко получена применением преобразования Адамара к каж- дому кубизу начального состояния |ж — 0). Хотя нам не известно значе- ние мы знаем, что |<н) является состоянием из вычислительного базиса, так что независимо от значения ш |<щ|а)| - (6.139) vA
332 Глава 6 Если бы мы измерили состояние |s), проецируя его на вычислительный ба- зис, то мы «нашли» бы маркированное состояние |w), с вероятностью, рав- ной всего лишь 1/N. Однако, следуя алгоритму Гровера, мы можем много- кратно итерировать преобразование, повышая амплитуду вероятности неиз- вестного искомого состояния |w> и одновременно подавляя амплитуды всех ненужных состояний |х ш). Сконструируем эту итерацию Гровера, ком- бинируя выполняемое оракулом неизвестное отражение U,, с известным отражением, которое мы можем выполнить сами. Этим известным отраже- нием является преобразование Us=2|s)(s|-1, (6.140) которое сохраняет |з), но обращает знак любого вектора, ортогонально- го |$). Геометрически, действуя на произвольный вектор, оно сохраняет его компоненту вдоль |s) и обращает знаки компонент в гиперплоскости, орто- гональной |s) Ниже мы вернемся к проблеме построения схемы, выполняющей Us; а пока лишь предположим, что можем эффективно выполнять Us. Одна итерация Гровера представляет собой унитарное преобразование Кегоу-изиш) (6.141) в котором наше отражение следует за вопросом оракулу. Рассмотрим, как Rgrov действует в плоскости, натянутой на векторы р) и |в) Проще всего понять это действие, представив его геометрически. Вспомним, что — sin Q. (6.142) так что |s) лежит в плоскости, натянутой на ортогональные векторы |w) и 1), и наклонен к последнему из них под утлом в. В этой плоскости Uw отражает вектор относительно оси |wL), a U, - относительно оси |.$). Сов- местно два этих отражения поворачивают вектор на угол 20: — 20. Тогда итерация Гровера является ничем иным, как поворотам на угол 20 в плоскости, определяемой векторами |$) и р). 6.43. Поиск одного из четырех Предположим, например, что в базе данных N - А объекта, среди которых один маркированный, С помощью классических вопросов марки- рованный объект может быть найден с 1-го, 2-го, З-го или 4-го раза; в сред- нем для достижения цели необходимо 2| вопроса, а в худшем случае —
6.4. Квантовый поиск в базе данных 333 четыре1. Но так как «inО - =- |, то в — 30°, 20 — 60° и, следова- vW тельно, после терапии Гровера |s) поворачивается в направлении, перпен- дикулярном р 1), то есть вдоль оси |о>). Теперь измерение, проецирующее на вычислительный базис, с полной определенностью дает результат р). Достаточно всего одного квантового вопроса, чтобы найти маркированное состояние, заметное улучшение по сравнению с классическим случаем. Иногда полезно альтернативное представление итерации Гровера как «инверсии относительно среднего». Если разложить состояние в вы- числительном базисе Н} — (6.143) X то его внутреннее произведение с |s) —i— |ж) можно предст явить в ви- yW х де (ф) - -U ZX = (6.144) а- где (6 145) ,г — средняя амплитуда. Тогда применение Us — 2|л) (я| — 1 к | ^’) дает U» - £(2(a) - aj|z); (6.146) амплитуды преобразуются как Ч : ax -- (a) -> {а) - ax, (6.147) то есть коэффициент перед |.т) инвертируется относительно среднего зна- чения амплитуды. Возвращаясь к случаю /V = 4, заметим, что в состоянии |s) каждая амплитуда равна |. Один вопрос оракулу обращает знак амплитуды мар- кированного состояния и, таким образом, сокращает среднюю амплитуду конечно, если мы знаем, что один маркированный объект здесь обязательно присут- ствует, то четвертый вопрос на самом деле является излишним, так что можно быть точнее и говорить, что необходимо самое большее три вопроса, а в среднем - 2j.
334 Глава 6 до j. Тогда инверсия относительно среднего значения переводит амплиту- ды всех немаркированных состояний от i в нуль и увеличивает амплитуду маркированного состояния от —до +1. Итак, мы воспроизвели наш вывод о том, что достаточно одного вопроса, чтобы с полной определенностью найти маркированное состояние. Также легко понять, что одного вопроса достаточно для того, чтобы найти маркированное состояние, если в базе данных имеется N записей и ровно | из них маркирована, Тогда, как и выше, один вопрос сокращает среднюю амплитуду от ~^= до а инверсия относительно среднего сокращает амплитуды немаркированных состояний до нуля. (Сравнивая количество квантовых и классических вопросов, с которы- ми нужно обратиться к оракулу, возможно, не совсем справедливо говорить, что в квантовом случае необходим толью один вопрос. Если оракул выпол- няет программу, которая вычисляет функцию, то в процессе вычисления некоторое вспомогательное пространство будет заполнено мусором. Нам будет необходимо удалить мусор, пройдя вычисление в обратном направ- лении для того, чтобы сохранить квантовую когерентность Если класси- ческое вычисление необратимо, то нет необходимости возвращать оракул в исходное состояние. В этом смысле, на языке теории сложности, один вопрос квантовому оракулу может быть примерно эквивалентным двум во- просам классическому оракулу.) 6.4.4. Поиск одного из Вернемся теперь к случаю, в котором база данных содержит N объек- тов, среди которых ровно один маркирован. Каждая итерация Гровера по- ворачивает квантовое состояние в плоскости, определяемой векторами |з) и |(д); после Т итераций состояние оказывается наклоненным к оси под уголом 9 + 2Т9. Чтобы оптимизировать вероятность обнаружения мар- кированного состояния при выполнении заключительного измерения, ите- рировать следует до угла, близкого к 90°, или (2Г + 1)0 ~ £ => 2Т Н 1 ~ (6.148) вспомним, что sin 9 = ' ^=, или, при больших ДГ,
6.4. Квантовый поиск в базе данных 335 Если выбрать Т = + (6.150) то вероятность получения |ш) в качестве результата измерения будет равна Prob(w) = sin2 ((2Т-1 1)0) = 1 (6.151) Таким образом, необходимо лишь около вопросов, чтобы с высокой вероятностью определить у, квадратичное ускорение по сравнению с клас- сическим результатом. 6.4.5. Множество решений Если существует г > 1 маркированных состояний и г известно, то количество итераций можно модифицировать так, чтобы вероятность отыс- кания одного из них оставалась очень близкой к единице. Анализ такой же, как и выше, за исключением того, что теперь оракул индуцирует отражение в гиперплоскости, ортогональной вектору (6.152) — равновзвешенной суперпозиции маркированных состояний вычислитель- ного базиса (wj). Теперь (зр) = sin^ (6.153) а итерация Гровера поворачивает вектор на угол 20 в плоскости, натянутой на векторы |я) и (у); мы снова приходим к выводу, что после количества итераций = <6Л54> состояние близко к р). Тогда если мы выполним измерение, проецируя на вычислительный базис, то с вероятностью, близкой к единице, найдем одно из маркированных (равновероятных) состояний. (С ростом количества ре- шений время, необходимое для отыскания одного из них, падает как г"1/2, в противоположность к г-1 в классическом случае.)
336 Глава 6 Обратим внимание на то, что если продолжить выполнение итераций Гровера, то вектор продо:гжит поворачиваться, и, таким образом, вероят- ность отыскания маркированного состояния (в результате заключительного измерения) начнет падать. Алгоритм Гровера подобен выпечке суфле - сю- ит передержать сто в духовке, как оно начнет опадать Следовательно, если нам ничего неизвестно о количестве маркированных состояний, то поиск одного из них может оказаться безуспешным. Например, Т ~ vCV ите- раций оптимально при г = 1, но при г — 4 вероятность отыскания мар- кированного состояния после этого количества итераций довольно близка к нулю. Но даже если г a priori неизвестно, мы все же можем найти решение с квадратичным, по сравнению с классическими алгоритмами (при г Дг), ускорершем. Например, мы можем выбрать количество итераций случай- ным в интервале от нуля до Т '/N. Тогда для каждого г, ожидаемая веро- ятность отыскания маркированного состояния близка к Следовательно, маловероятно, что нам не удастся найти маркированное состояние после нескольких повторений. А при каждом измерении мы можем предлагать оракулу найденное нами состояние в качестве классического вопроса, что- бы получить подтверждение того, является ли оно действительно маркиро- ванным. В частности, если решение не было найдено после нескольких попы- ток, та вполне возможно, что оно не существует. Таким образом, с высокой вероятностью можно дата корректный ответ ДА/HET на вопрос «Есть ли здесь маркированные состояния'?». Следовательно, мы можем принять ал- горитм Гровера, в котором оракул проверяет предложенное решение, чтобы решить любую Л'Р-проблему с-квадратичным ускорением по сравнению с классическим методом исчерпывающего поиска. 6.4.6. Осуществление отражения Чтобы выполигь итерацию Гровера, необходимо (кроме вопроса ора- кулу) унитарное преобразование Us = 2|s)<s| - 1, (6.155) которое отражает вектор относительно оси, определяемой вектором js). Как эффект ивно построить это преобразование из квантовых вентилей? Так как |з) — |0), где — побитовое преобразование Адамара, то можно записать Us Н(п)(2|0}{0| - 1)Н(П). (6.156)
6.5. Оптимальность алгоритма Гровера 337 то есть для этого достаточно построить отражение относительно оси |0). Мы легко можем построить это отражение из «-битового вентиля Тоффо- ли (№. Вспомним, что НлгН-л.; (6.157) инвертирование бита с адамаронским поворотом базиса эквивалентно об- ращению относительной фазы векторов |0) и |1). Следовательно: после сопряжения последнею бита преобразованием Н вентиль ста- новится (n- 1)-кратно контролируемым <тг, который обращает фазу векто- ра | И .. .)[1) и действует тривиально на все другие состояния вычислитель- ного базиса. Сопрягая с помощью NOT^‘\ мы получаем с точностью до несущественного общего знака минус. В упражнении вы покажете, что n-битовый вентиль Тоффоли {№> мож- но построить из (2гг - 5)-ти трехбитовых вентилей Тоффоли О'у> (если доступно достаточное вспомогательное пространство). Следовательно, об- разующая Us схема имеет линейный по п = logjV размер. Гроверовский поиск в базе данных (при условии, что оракул мгновенно отвечает на во- прос) требует времени порядка -/^logN. Если мы рассматриваем оракул как подпрограмму, которая вычисляет функцию за полило! арифмическое время, тогда поиск требует времени порядка V^polyflogW) 6.5. Оптимальность алгоритма Гровера Гроверовское квадратичное квантовое ускорение поиска в базе данных уже интересно и потенциально важно, но конечно же, действуя более ис- кусно, мы можем добиться лучшего результата, не так ли? Нет, оказывается не можем. Алгоритм Гровера обеспечивает максимально быстрый кванто- вый поиск в неструктурированной базе данных, если «время» измеряется в соответствии с количеством задаваемых оракулу вопросов.
338 Глава 6 Рассмотрим случай одного маркированного состояния |w), пусть U (а?, Т) обозначает квантовую схему, Т раз обращающуюся к оракулу. Мы не накладываем на эту схему никаких ограничений, за исключением количества задаваемых ей вопросов; в частности, мы не ограничиваем ко- личество квантовых вентилей. Эта схема применяется к начальному состо- янию IV’(O)), производя конечное состояние = (6.158) Теперь мы должны выполнить измерение, предназначенное выделить |w) среди N его возможных значений. Для того чтобы мы были в состоянии идеально различать возможные состояния [у!^(0)> они должны быть взаим- но ортогональными, а чтобы их можно было корректно различать с высокой вероятностью, они должны быть почти ортогональны Если состояния {|фш)} образуют ортонормированный базис, то для любого фиксированного нормированного вектора |у?) АГ-1 £ ИЮ - 1^)Г2 > 22V - 2^N. (6.159) tb>=0 [Сумма минимизируется, если \<р} является равновзвешенной суперпозици- ей всех элементов базиса [у?) = —1= как вы можете показать, при- уд ш впекая метод неопределенных множителей Лагранжа нахождения условных экстремумов.] Наша стратегия состоит в подходящем выборе состояния ]<д), позволяющем с помощью неравенства (6.159) что-пибудь узнать о количе- стве обращений к оракулу Т. Наша схема с Т вопросами образует унитарное преобразование и^,Т) и^и-^и^ ...UWU17 (6.160) где — преобразование оракула, a U( произвольные преобразования не-оракула. Выберем в качестве |у?(Т)) результат применения к состоянию |^(0)) преобразования U(w, Т), в котором каждое Uw заменено на 1; то есть результат применения той же схемы, но со всеми вопросами, задавае- мыми «пустому оракулу». Следовательно, ИТ)) = игиг_!... U2Ui ^(0)), (6.161) в то время как Ш.Т)} - ...UJUM0)). (6.162)
6.5. Оптимальность алгоритма Гровера 339 Чтобы сравнить |у>(Т)} с |^^.(Т)), воспользуемся нашим предыдущим ана- лизом влияния ошибок на точность схемы, рассматривая w-оракул как оши- бочное применение пустого оракула. Норма вектора ошибки после t-ro ша- га [ср. уравнение (6.63)] равна ||(Ц -1)И*))Н =2||Н^1|, (6 163) поскольку иш — 1 - 2|^)(й?|, После Т вопросов мы имеем [ср. уравне- ние (6.66)] т 111^(7’)) - ИТ))|| < 2£ (6.164) Г=1 Из тождества / т х2 т (EcJ \t=l / s,t=l У (с,сИ |^-ctce + |c^ (6165) e,t=l X ' s=i следует неравенство fecd ^TEC'2’ (6.166) \t=i / t=t применение которого к (6.164) дает (т \ £|М^))|2 . (6.167) Г=1 / Суммируя по w, мы находим т £ 1ШЛ) - l^l!2 ^4ГЕМ01^)) =4Т2. (6.168) ш t=l Привлекая неравенство (6.159), мы приходим к выводу, что 4Та ^2<V-2x/?7, (6,169)
340 Глава 6 если состояния |^(Г)) взаимно ортогональны. Следовательно, мы показа- ли, что любой квантовый алгоритм, способный различить все возможные значения маркированного состояния, должен обратиться к оракулу Т раз, где (6.170, (без учета малых при N оо поправок). Алгоритм Гровера находит с помощью вопросов, что превышает эту границу всего пример- но на 11%. В действительности можно усовершенствовать доказательство, чтобы улучшить границу до ^V^Vfl — е), что асимптотически насыщается алгоритмом Гровера1. Более того, можно показать, что схема Гровера до- стигает оптимальной вероятности успеха с помощью Т Г yW вопросов. Испытываешь приступ разочарования (и одновременно волну восхи- щения перед Гровером) от осознания того, что алгоритм поиска в базе данных не может быть улучшен. Какое отношение это имеет к квантовой сложности? Для многих проблем оптимизации в А Р-классе не известно лучшего метода, чем исчерпывающий поиск всех возможных решений. Используя квантовый параллелизм, можно достичь квадратичного ускорения исчер- пывающего поиска. Теперь мы знаем, что квадратичное ускорение является наилучшим, если мы полагаемся на силу явного квантовового параллелиз- ма и не разрабатываем наш квантовый алгоритм, используя специфическую структуру решаемой задачи. Тем не менее при достаточной изобретатель- ности можно добиться и лучшего результата. Оптимальность алгоритма Гровера может быть истолкована как сви- детельство того, что BQP NP. По крайней мерс, если окажется, что NP С BQP, аР NP, то тогда iVP-проблемы должна объединять глубокая внутренняя структура (свидетельств которой в настоящее время пет), хорошо подходящая к возможностям квантовых схем. Даже квадратичное ускорение может оказаться полезным для различ- ных ЛгР-полных проблем оптимизации. Однако квадратичное ускорение, в отличие от экспоненциального, реально не перемещает границу между разрешимостью и сложностью. В один прекрасный день квантовые ком- пьютеры смогут превзойти классические компьютеры в выполнении исчер- 'С. Zalka, Grover's Quantum Searching Algorithm is Optimal, Phys. Rev., A60, 2746-2751 (1999); quant-ph'9711070. [Впервые оптимальность алгоритма Гровера была доказана в рабо- те: С. Н. Bennet, Е. Bernstein, G- Brassard, U. Vazirani, Strengths and Weaknesses af Quantum Computing, SIAM J, CompuL, 26(5), 1510-1523 (1997); quant-phys/9701001 Прим. рей.
6.6. Обобщенный поиск и структурированный поиск 341 пывающего поиска, но только в том случае, если часы квантовых приборов не будут слишком сильно отставать от их классических прототипов. 6.6. Обобщенный поиск и структурированный поиск В итерации Гровера мы выполняем преобразование U.. — 2|s)(s| — 1, 1 1 отражение относительно оси, определяемой вектором |я) — —= 52 V1V i=o Почему именно относительно нее? Преимущество состояния |к) состоит в том, что оно имеет одинаковые перекрытия с каждым состоянием вы- числительного базиса. Таким образом, перекрытие любого маркированного состояния |о>) с js) гарантированно равно J(w|s)| — 1/з/?У. Следователь- но, если нам известно количество маркированных состояний, то мы можем определить, ско;п>ко потребуется итераций, чтобы с высокой вероятностью отыскать одно из них — количество необходимых итераций не зависит от гою, какое состояние маркировано. По. конечно, мы могли бы выбрать отражение относительно другой оси. Гели мы можем построить унт арнос преобразование U (с разумной зффективностыо), тогда мы можем образовать U(2|0)(0| - l)Uf = 2и|0)<0|и+ - 1 (6.171) преобразование, отражающее относительно оси U]0). Предположим, что (HU|0)| = sin<9, (6.172) где |ш) — маркированное состояние. Тогда, если мы заменим в итерации Гровера U3 на отражение (6.171), то одна итерация будет выполнять по- ворот на угол 20 в плоскости, определяемой векторами |ц>) и U[0) (в со- ответствии с теми же аргументами, что мы использовали для U,). Таким образом, после Т итераций с (2Т +1)0 ~ тг/2 измерение в вычислительном базисе с высокой вероятностью найдет |«;). Следовательно, если мы за- меним в квантовой схеме Гровера Н<п) па U, мы по-прежнему сможем выполнять поиск в базе данных до тех пор, пока U|0) остается не ортого- нальным маркированному состоянию1. Но если мы не имеем никакой апри- орной информации о том, какое состояние маркировано, то II Г1' является наилучшим выбором не только потому, что j я) имеет известное перекрытие I-К. Grover, Quantum Computers Can Search Rapidly By 1,'siny Almost Any Transformation, Phys. Rev. Lett., 80, 43294332 (1998); quant-ph/9712011.
342 ГЛАВА 6 с каждым маркированным состоянием, ио также и потому, что оно имеет максимальное среднее перекрытие со всеми возможными маркированными состояниями. По инО1да, выполняя поиск в базе данных, мы имеем некоторую ин- формацию о том куда следует заглянуть, а в этом случае может оказаться полезной описанная выше стратегия обобщенного поиска1. В качестве примера проблемы с некоторой вспомогательной структу- рой предположим, что /(т, у) - функция с однобитовым значением, зави- сящая от двух п-бито вых строк х и у, и нам нужно найти единственное решение f(x,y] — 1. С помощью алгори1ма Гровера мы можем искать среди № возможных значений (N — 2П) пар (х, у) и с высокой вероятно- стью найти решение (х0, у0) после итераций, квадратичное ускорение по сравнению с классическим поиском. Но предположим далее, что g(z) — функция только от х, и известно, что g(x) = 1 при ровно М значениях т, где 1 М С 7V. Более того, известно, что д(х1:) — 1. Следовательно, мы можем воспользоваться функ- цией д, чтобы помочь в поиске решения (х0, у0\ Теперь для консультаций у нас есть два оракула, один выдает значе- ние f(x, у), а друюй значение д(х). Наша задача найти (х0. у^}, задав минимальное количество вопросов. С классической точки зрения нам необходимо около NМ вопросов для того, чтобы с разумной вероятностью найти решение. Сначала мы вы- числяем д(х~) для каждого х, затем мы ограничиваем наш поиск реше- ния /(ж, у) — I только такими М значениями х, при которых д(х) — 1. Естественно поинтересоваться, существует ли способ выполнить кванто- вый поиск за время порядка квадратного корня от классического времени Исчерпывающий поиск, который обращается только к /-оракулу, требует времени N VNM и, следовательно, не решает проблемы. Нам необхо- димо пересмотреть наш метод квантового поиска, чтобы воспользоваться преимуществом структуры, предоставляемой функцией д. Лучший метод — сначала применить алгоритм Гровера к д(х) При- мерно за итераций мы приготовим состояние, близкое к равно- взвешенной суперпозиции из М решений д(х} = ]. В частности, состо- яние |а:0) возникает с амплитудой 1_. Затем мы применяем алгоритм х/М lE. Farhi and S. Gutmann, Quantum-Mechanical Square Root Speedup m a Structured Search Problem, quanl-ph/9711035; L.K.Grover, Quantum Search On Structured Problems, quanl- ph/9802035.
6 7. НЕКОТОРЫЕ ЗАДАЧИ HF ДОПУСКАЮТ УСКОРЕНИЯ 343 Гровера к /(х, у) при фиксированном х, Приблизительно после итераций состояние |x0)|s) эволюционирует достаточно близко к состоя- нию |х0)|^0). Следовательно, |х0, г/0) появляется с амплитудой Образованное из вопросов унитарное преобразование, которое мы до сих пор строили, может рассматриваться как преобразование U, определяющее обобщенный поиск. Более того, нам известно, что (х0, i/o|U|O,0) ~ \/М (6.173) Следовательно, если мы итерируем обобщенный поиск примерно раз, то приготовим состояние, достаточно близкое к |х0. у0). В совокупно- сти примерно после Z V 2 J VNM (6,174) вопросов мы можем с высокой вероятностью найти решение. Это действи- тельно квадратичное ускорение по сравнению с классическим поиском 6.7. Некоторые задачи не допускают ускорения Пример структурированного квантового поиска иллюстрирует, что квадратичные квантовые ускорения по сравнению с классическими алго- ритмами могут быть достшнуты для различных проблем, а не только для исчерпывающего поиска в неструктурированной базе данных. Можно да- же надеяться, что квантовый параллелизм позволяет существенно уско- рить любой классический алгоритм. Сейчас эта надежда будет разбита — для многих задач квантовое ускорение невозможно. Продолжим рассматривать задачи с квантовым черным ящиком, ора- кулом, который вычисляет функцию /, отображающую п битов в один. Но мы немного модифицируем наши обозначения. Функция / может быть представлена строкой из N = 2п битов: X ~ ^N-l^N-2 - (6.175) где Xi обозначает /(г). Наша задача вычислить некоторую зависящую от X функцию с однобитовым значением, то есть ответить на ДА/НЕГ-воп- рос о свойствах оракула. То, что сейчас будет показано, означает, что неко- торые функции от X не могут быть вычислены с низкой вероятностью
344 Глава 6 ошибки, используя квантовый алгоритм, за исключением алгоритма, об- ращающегося к оракулу столько раз (или почти столько же раз), сколько требуется классическому алгоритму1 Главная идея состоит в том, что булева функция от переменных Хг может быть представлена полиномом от X,. Более того, распределение ве- роятностей для квантового измерения может быть выражено через полином от Хг, 1де степень полинома равна 27, если измерение следует после Т во- просов оракулу. Проблема в том, может ли полином степени 27 обеспечить разумную аппроксимацию интересующей пас булевой функции. Действие оракула может быть представлено как Uo: \i,y,z) —> |», у ф Xf, z), (6.176) где i принимает значения из {0, 1,..., N —1}, у £ {0, 1), a z обозначает со- стояние вспомогательного кубита, не изменяемого оракулом. Следователь- но, в каждом 2 х 2-блоке, натянутом на |г, 0; z) и |г, l;z), Vo представляет собой 2 х 2-матрицу Квантовые вентили, в отличие от вопросов к оракулу, не зависят от X. Следовательно, после того как схема из Т вопросов подействует на любое начальное состояние, результирующее состояние \'Ф) будет иметь амплиту- ды, которые (по крайней мере) являются полиномами степени Т от X. Если мы выполним ПОЗМ па jp), то связанная с положительным оператором F вероятность результата (^|₽|ф) может быть выражена через полином от X степени, не меньшей чем 27. Любая булева функция от Хг может быть выражена (единственным образом) через полином степени N по Хг. Например, рассмотрим функ- цию OR от N переменных Хр, это сад = 1 - (1 - - XJ • • (1 - Xw_i), (6.178) полином степени N. Допустим, мы хотим применить нашу квантовую схему для того, что- бы с полной определенностью вычислить функцию OR. Тогда мы должны 1Е. Fart», et al, A lamit on the Speed of Quantum Computation in Determining Parity, Phys. Rev. Lett., 81, 5442-5444 (1998); quanl-ph/9802045; R. Beals, el al, Quantum Lower Bounds by Polynomials. In Proceedings of the 39th Annual Symposium on Foundamentals of Computer Science (FOCS’98), 3S2 361, IEEE, Los Alamos, California, November, 1998; quart t-ph/9B02049.
6,7. НЕКОТОРЫЕ ЗАДАЧИ HE ДОПУСКАЮТ УСКОРЕНИЯ 345 быть в состоянии выполнить измерение с двумя результатами 0 и 1, где Prob(O) = 1 - OR(Jf), Prob(l) = OR(X). (6.179) Ио эти выражения являются полиномами степени Лг, которые могут быть вычислены только после как минимум Т-кратного обращения схемы к ора- кулу, где (6.180) Мы приходим к выводу, что не существует квантовой схемы, которая менее чем за Л’/2 обращений к оракулу может точно вычислить OR. Фактически для этой функции (или любой функции, принимающей значение 0 толь- ко для одного из N ее возможных аргументов) существует более сильное заключение (см. упражнение): требуется Т X, чтобы с полной определен- ностью вычислить OR. С другой стороны, вычисляя функцию OR (отвечая на ДА/НЕТ-вопрос «Имеется ли маркированное состояние?»), именно алгоритм Гровера может достичь количества вопросов порядка у/N. Таким образом, вывод о том, что для детерминированного вычисления OR необходимо N вопросов, хо- тя и корректен, но несколько обманчив. Мы можем вычислить OR веро- ятностным образом с помощью гораздо меныпего количества вопросов. По-видимому, алгоритм Гровера может построить полипом от X, который, имея степень только O(p/N), тем не менее обеспечивает весьма адекватную аппроксимацию полинома TV-ой степени OR (Л). Однако OR, принимающая значение 1 для каждого значения X, кро- ме А' (), является очень простой булевой функцией. Нам следует рассмот- реть другие функции, которые мотут предложить квантовому компьютеру более серьезные проблемы. Первое, что приходит в голову — это функция PARITY(X), принима- ющая значение 0, если строка X содержит четное количество единиц, и — значение 1, если строка X содержит нечетное количество единиц. Очевид- но, чтобы определить четность, классический алгоритм должен обратиться к оракулу N раз. Насколько лучше это можно сделать, предлагая квантовые вопросы? Фактически мы вообще не можем добиться лучшего результата — необходимо по крайней мере N/2 квантовых вопросов, чтобы с вероятно- стью успеха, большей | + <5, найти правильное значение PARITY(Л). При обсуждении PARITY удобно использовать новые переменные (6.181)
346 Глава 6 принимающие значения ±1, так что N 1 PARITY(X) - П X (6.182) 1=0 также принимает значения ±1 Теперь, после тою как выполнена кванто- вая схема со всеми Т вопросами оракулу, мы должны выполнить ПОЗМ с двумя возможными исходами Fcven и Fodd; результатом будет наша опен- ка PARITY(X). Как мы уже отмечали, вероятность получения резуль- тата (к примеру) «even» («четный») может быть выражена через поли- ном Ре^(Х) степени (самое большее) 2 Г по Xt: (6.183) Как часто наша догадка будет верна? Рассмотрим сумму ЕР-М - PARITY(X) = £р^(Х П X (6.184) (X) {X} 1=0 Поскольку каждое слагаемое полинома РаХ\А) содержит самое боль- шее 2Т из переменных Хг, то можно воспользоваться тождеством Е Х = 0, (6.185) x,e(o,i} чтобы понять, что сумма в (6.184) должна обращаться в нуль при N > 27. Таким образом, Е Е (6.186) раг(Х)=1 раг(Х) = -1 то есть при Т < N/2 мы с одинаковой вероятностью можем угадать «even», как в случае, когда на самом деле PARITY(X) является нечет- ной, так и в том случае, когда она действительно четная (в среднем). Наш квантовый алгоритм ничего не может сообщить о значении PARITY (X); то есть в среднем по возможным (a priori равновероятным) значениям Хг мы с равной вероятностью будем как правы, так и неправы. Мы можем также показать, демонстрируя явный алгоритм (см. упраж- нение), что для определения PARITY (иди вероятностного, или детер- минированного) достаточно N/2 вопросов (при условии, что N чет- ное) В этом смысле мы достигаем двукратного ускорения по сравнению с классическими вопросами. Но это лучшее из того, чего мы можем до- биться.
6.8- Поиск В PACITPF ДЕЛЕННОЙ БАЗЕ ДАННЫХ 347 6.8. Поиск в распределенной базе данных Поучительно взглянуть ла квантовый алгоритм поиска в базе данных с новой точки зрения. Представим, что двум участникам, Алисе и Бобу, необходимо договориться о встрече в удобный для обоих день. У Алисы есть календарь, в который внесено N — 2п дней, каждый из которых отме- чен нулем, если в этот день она занята, или единицей, если она свободна. Аналог ичный календарь имеется у Боба. Их задача найти день, в который они оба будут свободны. Алиса и Боб имеют квантовые компьютеры, но они находятся очень далеко друг от друга. (Алиса на Земле, а Боб путешествует по туманно- сти Андромеды.) Следовательно, для них слишком дорого связываться друг с другом. Им нужно срочно определить дату, но они должны экономить на объеме посылаемой туда и обраггно информации. Даже если существует день, когда они оба свободны, можег оказать- ся, что найти его нелегко. Если Алиса и Боб связываются, посылая туда и обратно классические биты, тогда в худшем случае им будет необходимо обменяться порядка N = 2” записями календаря, чтобы иметь разумный шанс успешно договориться о встрече. Мы спросим: может быть, вместо этого им лучше обмениваться кубитами?1 (От Земли до Андромеды тща- тельно спроектирован и построен квантовый информационный хайвей, гак что посылать кубиты вместо битов не намного дороже.) Для знакомого с основами теории квантовой информации этот вопрос выглядит странным. Теорема Холево раз и навсегда сказала, что один кубит может переносить не более одного бита классической информации. Хотя, немного подумав, мы увидим, что теорема Холево фактически не реша- ет проблему. Хотя она ограничивает взаимную информацию приготовления состояния и результата измерения, она не гарантирует (по крайней мере не прямо), что Алисе и Бобу необходимо обменяться таким же количеством 'й ранней версии Этих лекций я прсдлашл другой сценарий, в котором Алиса и Боб имели почти идентичные таблицы, но с одной несовпадающей записью; их задачей было найти положение несовпадающего бита. Однако этот пример был неудачен, поскольку задача могла быть решена с помощью всего лишь log А битов классической связи. (Я благодарен Ричарду Клину, указавшему на эту ошибку.) Мы хотели, чтобы Алиса узнала адрес (двоичную строку длиной п) одной записи, ко торой ее таблица отличается от таблицы Боба. Для этого Боб вычисляет четность А/2 записей своей таблицы с меткой, принимающей значение О в ее самом младшем значащем бите, и посылает Алисе только бит четности. Алиса сравнивает четность тех же записей ее таблицы и находит один бит (самый младший значащий бит) адреса несовпадающей записи. Затем они повторяют го же самое для каждого из оставшихся п - 1 битов до тех пор, пока Алиса не узнает Полный адрес «ошибки» Всего послано только п битов (и все от Боба к Алисе).
348 Глава 6 кубитов, что и битов, чтобы сравнить их календари. Тем нс менее это при- ятный сюрпиз - узнать, что Алиса и Боб могут' выполнить задание, об- менявшись O(i/NlogN) кубитами по сравнению с O(N) классическими битами1. Чтобы добиться этого, Алиса и Боб должны действовать сообща. осу- ществляя распределенную версию поиска в базе данных. Алиса имеет до- ступ к оракулу (ее календарь), вычисляющему функцию fA(x), а Боб имеет оракул (его календарь), вычисляющий f в (ж). Вместе они могут- предложить оракулу (6.187) Один из них может осуществить отражение Us, так что они мотут выпол- нить полную итерацию Гровера и произвести исчерпывающий поиск под- ходящего дня х такого, что /лв(х) — 1 (когда Алиса и Боб оба свободны). Если взаимоприемлемый день действительно существует, они достигнут цели в его поиске после порядка вопросов. Но как Алисе и Бобу задать вопрос /АВ(з;)? Опишем, как им это сде- лать, действуя на любое одно из состояний вычислительного базиса |х). Сначала Алиса выполняет WiO) WI/a(^ (6 188) а затем посылает п + 1 кубитов Бобу. Боб выполняет илм) - (-1)Мг'л/в(ж,тд(*))- (6.189) Это преобразование, очевидно, унитарно, и вы можете легко проверить, что Боб может осуществить его, обратившись к своему оракулу. Теперь, как и требовалось, фазовый множитель перед |ж) равен (~1Уав(х\ но в другом регистре продолжает храниться |/А(ас)), что будет портить когерентность суперпозиции значений х. Боб не может удалить этот регистр, но это может сделать Алиса. Тогда Боб посылает п+1 кубитов обратно Алисе, а она еще раз консультируется со своим оракулом, чтобы выполнить (6 190) Обменявшись 2(п + 1) кубитами, они завершили один вопрос из fAB ора- кулу и, таким образом, могут выполнить одну итерацию Гровера. flL Burhman, st al, Quantum vs Classical Communication and Computation, M Proceedings of the 30th Annual ACM Symposium ofTneoiy of Computing, ACM Press, 1998; quant-ph/9802040.
6,8. Поиск В РАСПРЕДЕЛЕННОЙ БАЗЕ ДАННЫХ 349 Допустим, например, что Алиса и Боб знают, что имеется только одна взаимоприемлемая дата, но у них нет априорной информации о том, что это за день. После примерно итераций, требующих обменяться всего v'TV 2(log .V 4-1) (6 191) кубитами, Алиса выполняет измерение, получая удобную дату с вероятно- стью, близкой к единице. Таким образом, по крайней мере в этом частном случае, обмен (^(x/TVTogjV) кубитами так же хорош, как и обмен О(ЛТ) классическими битами. По-видимому, нужно быть осторожнее в интерпретации границы Холево, которая явно утверждает, что кубит имеет не большую способность переносить информацию, чем бит! Если Алисе и Бобу заранее неизвестно, сколько имеется подходящих дат, то они тем не менее могут выполнить поиск Гровера (как мы отмечали в § 6.4.5) и с разумной вероятностью найти решение. С помощью 2 \ogN битов классического сообщения они могут проверить, действительно ли найденная дата устраивает их обоих. 6.8.1. Сложность квантовой связи В более общем виде можно представить, что каждый из нескольких участников обладает n-битовым входом; им необходимо вычислить функ- цию, зависящую от всех входов, с тем, чтобы се значение в гонце концов стало известно одному из них. Какой минимальный объем сообщений необ- ходим для вычисления функции (детерминированного или вероятностно- го)? Хорошо изученный раздел классической теории сложности, которому адресуется этот вопрос, называется сложностью связи. То, что мы уста- новили выше, является квадратичной границей между квантовой и клас- сической сложностями связи для частного класса функций двух участ- ников. Помимо перехода от обмена классическими битами к обмену кубита- ми существуют другие интересные пути обобщения классической сложно- сти связи. Например, предположим, что участники делят некоторое заранее подготовленное запутанное состояние (пары Белла или многокомпонент- ное запутывание) и могут использовать его наряду с классической связью, чтобы выполнить вычисление функции. Вновь непосредственно нс очевид- но, что разделенное запутывание упростит задачу, так как само по себе оно еще не позволяет участникам обмениваться классическими сообщени-
350 Глава 6 ями. По оказывается, что запутывание оказывает помощь, по крайней мере небольшую1. В последнее время анализ сложности связи популярен среди теорети- ков в области сложности, но эта дисциплина пока еще не представляется занимающей важное положение в практической технике связи Возможно, это удивительно, принимая во внимание важность эффективного распре- деления вычислительной нагрузки в параллельных вычислениях, которые стали обычным делом. Более того, похоже, что в реальной жизни практи- чески вся связь может рассматриваться как форма дистанционных вычис- лений. На самом деле мне не нужно получать все биты, дошедшие до меня по телефонной линии, особенно потому, что я скорее всего запомню только несколько битов информации, имекнцих отношение к звонку в ближайшем будущем (фильм, на который мы решили сходить). Как менее прозаический пример, нам на Земле может быть необходимо связа(ься с роботом в глубо- ком космосе, чтобы проинструктировать, выходить ли ему на орбиту вокру! удаленной звездной системы. Так как ширина полосы предельно ограни- чена, то мы хотели бы вычислить правильный ответ на ДА/НЕТ-вопрос «Выходить ли на орбиту?» с помощью минимального обмена информацией между' Землей и роботом. Возможно, будущая цивилизация будет использовать известное квад- ратичное разделение между классической и квантовой сложностью связи, обмениваясь, скорее, кубитами, чем битами, со своей флотилией косми- ческих сил А возможно, будет найдено экспоненциальное разделение, по крайней мере в определенных ситуациях, что существенно повысило бы стимул для развития необходимой технологии квантовой связи. 6.9. Периодичность Проблема Саймона до сих пор является единственным примером, в ко- тором мы нашли экспоненциа.п>ное разделение между скоростью квантово- го алгоритма и скоростью соответствующего классического алгоритма. Ал- горитм Саймона использует квантовый параллелизм, чтобы ускорить поиск периода функции. Его успех вдохновляет нас искать другие квантовые ал- горитмы, предназначенные для отыскания других разновидностей периода. *R. Cleve, et. al, Quantum Entanglement and the Communication Complexity oj the Inner Product Function, Leet. Notes CompuL Set., 1509, 61-74 (1998), диадt-ph/9708019; H. Ruhrtnau, et al, . Complexity, Phys. Rev., A60, 2737-2741 (1998), quant-ph/9710054.
6.9 Периодичность 351 Саймон изучал периодические функции, принимающие значения и (Z-2)n. Для этой цели мощным инструментом с.тужило n-битовое преобра- зование Адамара Н|7‘-'. Если вместо этого мы хотим изучать периодические функции, принимающие значения в Z2„, то инструментом сопоставимой силы будет (дискретное) преобразование Фурье. Урок задачи Саймона в том, что, хотя поиск иголок в стоге сена может быть трудным, отыскание периодически распределенных иголок в стоге се- на может оказаться гораздо проще Например, если мы рассеиваем фотон на периодическом массиве иголок, он вероятнее всего рассеется в одном из преимущественных направлений, в котором удовлетворяется условие брэг- говского отражения. Эти преимущественные направления зависят от рас- стояния между иголками. Таким образом, рассеяв только один фотон, мы уже приобретаем некоторую полезную информацию о периоде. При по- строении эффективных квантовых алгоритмов следует и дальше пользо- ваться смысловым нодгекстом этой метафоры. Итак, представим квантовый оракул, вычисляющий функцию {О, 1}п {0, 1}т, (6 192) которая имеет неизвестный период г, где г - положительное целое число, удовлетворяющее 1 « г « 2П. (6.193) То есть /(а?) — -\- гпт'), (6.194) где m — произвольное целое число такое, что х и х + mr лежат в {0. 1, 2,..., 2" - 1}. Мы должны найти период г. Рассматриваемая клас- сически, эта проблема трудная. Если г, скажем, иорядка 2п^, нам необ- ходимо обратиться к оракулу порядка 2г,/~ раз, прежде чем мы, возможно, найдем два значения х, отображаемых на одно и то же значение f(x), и, следовательно, что-нибудь узнаем о периоде г. Но, как мы увидим, суще- ствует квантовый алгоритм, определяющий г за время poly(n) Даже если нам известно, как эффективно вычислять функцию f(x), определение ее периода может оказаться трудной задачей. Наш квантовый алгоритм может быть применен для отыскания за poly(n) время периода любой функции, которую мы умеем вычислять за ро!у(п) время. Эффектив- ное отыскание периода позволяет эффективно решать множество (по-види- мому) трудных задач, таких как факторизация целого числа или вычисление дискре гного логарифма1. ’Дискретный логарифм определяется как минимальный положительный корень х ураяне-
352 Глава 6 Ключевая идея, лежащая в основе квантового поиска периода, заклю- чается в том, что преобразование Фурье может быть вычислено с помощью эффективной квантовой схемы (что было обнаружено Питером Шором). Квантовое преобразование Фурье (QFT) использует мощь квантового па- раллелизма, чтобы достичь экспоненциального ускорения хорошо извест- ного (классического) быстрого преобразования Фурье (FFT). Поскольку FFT имеет такое широкое поле применений, то, возможно, однажды и QFT станет столь же широко распространенным. 6.9.1. Отыскание периода QFT является унитарным преобразованием, действующим в вычисли- тельном базисе согласно ,м-1 QFT : |ж) > -±= V e^y/'N\y}, (6.195) где N — 2п. Будем пока предполагать, что мы эффективно выполняем QFT, и посмотрим, как это позволяет извлекать период функции /(а.). Эмулируя а.поритм Саймона, мы сначала обратимся к оракулу с ~т= £2 Iх) (легко приготавливаемым применением к |0)) и, таким л/Лт х образом, приготовим состояние АГ-1 (6.196) VJV 0 Затем измерим выходной регистр, получая результат j/(ac0)) при некото- ром 0 < г. Это измерение готовит во входном регистре когерентную суперпозицию А значений .г, которые отображаются на /(т0): .4-1 4=У>о + М (6.197) где N - г х0 + (Л - l)r < N (6.198) иия ах — 6(modp), где все переменные нвлякутся целыми числами. Вычисление дискретного логарифма является сложной вычислительной проблемой, что находит применение в крипто- графии. Квантовый алгоритм решения этой задачи см. в книге М. Нильсен, И. Чанг, Кванто- вые вычисления и квантовая информация, М „ Мир (2006). — Прим ред
6.9. Периодичность 353 или А- I < < Л+ 1. (6.199) На самом деле измерение выходного регистра не обязательно. Если его про- пустить. то состоянием входного регистра будет некогерентная суперпози- ция (просуммированная по т0 G {0. I, 2,..., г-1}) состояний вида (6.197). Остальная часть алгоритма также хорошо работает, действуя на это началь- ное состояние. Теперь наша задача состоит в том, чтобы извлечь значение г из состо- яния (6.197). Если бы мы на этом этапе измерили входной регистр, проеци- руя его на вычислительный базис, то мы бы ничего не узнали относитель- но г Вместо этого (ср. с алгоритмом Саймона) следует сначала выполнить преобразование Фурье, а ужа затем проводить измерение. Применяя QFT к состоянию (6.197), получим (6.200) Если мы теперь выполним измерение в вычислительном базисе, то верояг- лос’1 ъ получения результата у будет равна Prob&) = -$ (6.201) о Это распределение резко выделяет такие значения у, при которых yr/N близко к целому чис.гу. Например, если N/r оказывается целым (и, следо- вательно, равным А), то А 1 (1 л , , Prob(y) — - 1 ^2 е7т<1у/А\ У ~ А ' (целое)’ (6.202) л J I П R ТТПА’ГИПилхя г> rxjuafi J=o В более общем случае мы можем просуммировать геометрическую прогрессию (6.203) 7= 0
354 Глава 6 где 2s?/r(modN) (6.204) Существует точно г значений у 6 {О, 1, 2,..., /V — 1}, удовлетворяющих С 3*r(modN) (6.205) (Чтобы убедиться в этом, представим промаркированные кратные г и N в ряду чисел, простирающемся от 0 до rN — 1. Для каждого кратного N существует кратное г, удаленное от него не более чем на расстояние г/2) Для каждого из этих значений соответствующее в удовлетворяет (6.206) Теперь, поскольку А -1 < -У, то при этих значениях 6 все слагаемые в сум- ме по у в уравнении (6 203) лежат в одной полуплоскости, следовательно, они интерферируют конструктивно и сумма становится значительной. Мы знаем, что |1|0|, (6.207) поскольку расстояние по прямой от начала координат меньше, чем длина дуги вдоль окружности, а при А|0| я ля 2Д101 |1 -зР, (6.208) так как мы можем увидеть (графически или вычислив ею производ- ную), что это расстояние является выпуклой функцией. На самом деле А < Y" + 1 н» следовательно, Ав < тг(1 + но, применяя вышеуказан- ную границу к л(А -1)(? _ 1 £_______________1 € eiff - 1 ei{A-i)e _ j егв - 1 - 1. (6.209) мы тем не менее можем прийти к выводу, что е1Ав - 1 егв - 1 2(А - 1)|<?| 2 1Д1 “ 1 " 7Г (6.210)
6.9. Периодичность 355 Пренебрегая возможной поправкой порядка 2/Д, мы находим Prob(y) > [ Л | I (6.211) \7Г / для каждого из г значений у, удовлетворяющих неравенству (6.205), Следо- вательно, с вероятностью, не ниже чем 4/л2 измеренное значение у будет удовлетворять > N 1 s' Г. N I 1 /4 т п\ " т1 (6.212) или Л 1 У к । 1 r-2N^ г +2?V’ (6'213) где k — целое число, выбранное из {0, 1,2,..., г—1). Результат вычисления с разумной вероятностью находится не дальше чем на расстоянии 1 /2 от целого кратною числа N/r. Пусть нам известно, что г < М <g; N. Таким образом, N/r — рацио- нальное число со знаменателем, меньше т. Два различных рациональных числа, знаменатель каждого из которых меньше М, не могут быть ближе друг к другу чем на 1/М2, так как Q !)С. Если результат из- мерения у удовлетворяет неравенству (6.212), то существует единственное значение к/r (при г < М), определяемое y/N, при условии, что N > М2. Это значение к/r может быть успешно извлечено из измеренного y/N с по- мощью метода цепных дробей. С вероятностью, превышающей 4/тг2, мы нашли значение к/r, где к выбирается (примерно равновероятно) из {0, 1, 2,... ,г - 1}. С приемле- мой вероятностью кпг являются взаимно простыми (нс имеющими обще- го множителя), так что мы добились успеха в отыскании г. Обратившись к оракулу, мы можем проверить, действительно ли f (х) = f (х 4 г). Но ес- ли GCD(fc, г) I,1 то мы нашли всего лишь rlf множитель г. Если мы не достигли успеха, то мы могли бы проверить некоторые близкие значения у [измеренное значение мото оказаться вблизи интер- вала —r/‘l < yri'rnocLV) г/2, в действительности не находясь внутри его] или проверить несколько множителей г [значение GCD(fc, г), если оно не равно единице, по-видимому, невелико]. Если не удается и это, то мы прибегнем к повторению квантовой схемы, получая (с вероятностью не ни- 10 CD (Gm#test Common Divwor) — наибольший общий делитель. — Прим. иерее.
356 Глава 6 же 4/тг'2) на этот раз значение к'/г. Теперь к' также может иметь общий множитель с г, в таком случае наша процедура вновь определяет г2, мно- житель г. Но с дос) аточпо высокой вероятностью GCD(&, к') — 1, в таком случае г LCMfr^rs).' Действительно, мы можем вычислить вероят- ность того, что случайно выбранные к и к' являются взаимно простыми, следующим образом. Так как вероятность того, что простое число р делит случайно выбранное число, равна 1/р, то вероятность того, что р делит без остатка оба к и к', равна 1/р2. А А; и V являются взаимно простыми тогда и только тогда, когда не существует простого числа р, делящего их обоих без остагка. Следовательно, Prob(A:; к,' взаимно простые) — = П I1- ' > V ТТЛ - 4 (Ш)7 (6 214> Аросгые р \ г / ' [где £(z) обозначает дзе га-функцию Римана], Таким образом, после некото- рого постоянного (не зависящею от N) количества повторений алгоритма мы наверняка добьемся успеха в поиске периода г. 6.9.2. От FFT к QFT Рассмотрим теперь реализацию квантового преобразования Фурье. Преобразование Фурье £/№) - Е ( 7= (6.215) я: у \ * J * х / представляет собой перемножение унитарных N х iV-матриц, где матрич- ный (ж,у)-элемент равен (с?7ГЬ-/л') у. С наивной точки зрения это преоб- разование требует О(№) элементарных операций. Существует, однако, хо- рошо известная и очень полезная (классическая) процедура, сокращающая количество операций до O(Nlog/V). Предполагая, что N = 2п, предста- вим х и у в виде двоичных разложений х — хп—1 ' 2 + хп—2 2 4- ... 4 2 д- „ , „и {6.216) У = Уп-1 -2 1+уп-2-2 2 4- . .. +х/! 2 4- у0 'ГСМ П.спМ Common Multiple) — наименьшее общее кратное. Прим перев
6.9. Периодичность 357 В произведении .т и у можно отбросить любые слагаемые, содержащие п-ю и более высокие степени двух, поскольку они пе вносят вклада в А’А2”' Следовательно, трг = (.^0) + + Уп-зС^Л) + • • + 1 yit^n-2^ т AI+WaAA)- (6.217) где множители в круглых скобках представляют собой значения соответ- ствующих двоичных разрядов, например: ~ ~ । fl + J' (6'218> Теперь мы можем вычислить №) = 4= У>2™у/Л7ы (6.219) V у для каждого из N значений х. Но сумма по у факторизуется на п сумм по ук — 0,1, которые могут быть последовательно вычислены за время порядка п. С помощью квантовою параллелизма можно добиться гораздо лучше- го результата. Из (6.217) мы получим QFT : |ж) vN у = I e2*t<a:>Ko)|l)) . •. (|0) + (6.220) QFT преобразует каждое состояние вычислительного базиса в иезапутан- иое состояние п кубитов; таким образом, мы ожидаем, что оно может быть эффективно реализовано. Действительно, рассмотрим случай и - 3. Нетрудно попять, что эту работу выполняе т схема
358 Глава 6 (но обратим внимание на то. что порядок следования бигов на выходе ин- вертировался) Каждый вентиль Адамара действует как Н: w (6.221) Другие вклады в относительную фазу векторов |0) и |1) в Ая-ом кубите обеспечиваются двухкубитовыми условными поворотами, где Г 1 0 \ RT~( 0 ^/2" «’-222) a d — (к - j} - «расстояние» между кубитами. В случае м = 3 QFT строится из трех вентилей Н и трех венти- лей контролируемое R В общем случае очевидное обобщение этой схе- мы требует п вентилей Н и — 0 контролируемых R. Вновь двухкубиговый вентиль применяется к каждой паре кубитов с контролиру- емой относительной фазой тг/З^, где d - «расстояние» между кубитами. Таким образом, семейство схем, осуществляющее QFT, имеет размер по- рядка (Jog.V)2, Мы можем сократить сложность схемы до линейной no log N, если го- товы ограничиться реализацией фиксированной точности, поскольку двух- кубитовые вентили, действуя на значительно разделенные кубиты, вносят лить экспоненциально малые фазы. Если мы опустим вентили, действую- щие на пары, разделенные более чем на т, тогда каждое слат аемос в (6.217) заменяется приближением с?п-битовой точностью: полная ошибка в ху/2г‘ наверняка не хуже, чем п‘2~т, следовательно, мы можем достичь точно- сти € в ху/2п при т > logn/,-. Если мы сохраним вентили, действующие только на пары кубитов с расстоянием т или менее, то размер схемы будет равен тп ~ nlogra/e. Фактически, если мы собираемся измерять в вычислительном базисе непосредственно после выполнения QFT (или его обращения), то возмож- но дальнейшее упрощение - двухкубитовые вентили не нужны вообще! Заметим, во-первых, что вентиль контролируемое Ro действует симмет- ричным образом на два кубита он действует тривиально на (00), -01) и 110) и изменяет фазу [11} на e'V Таким образом, без модификации вен- тиля можно менять местами «контрольный» и «нелевой» биты. С учетом этой замены наша схема для трехкубитового QFT можег быть изображена
6.10. Фак юризацпя 359 заново как ы w 7 _ — — \у>} I v .. -J R щ н L ----------------------------•---------_ I __ , L_____ J i7. - — — — ------------ -- I —। ।— i н — ' ' ' । ! ! Коль скоро |рп) измерено, нам известно значение бита, который управля- ет вентилем Rj, действующим на два первых кубита. Следоваюльпо, мы получим то же самое распределение вероятностей результатов измерений, если вместо применения контролируемою R; и последующею измерения мы сначала измерим </р, а затем применим к следующему кубиту пово- рот (Rj^1, обусловленный результатом измерения первого кубита. Анало- гично можно заменить вентили контролируемое R, и контролируемое Н ; однокубитовым поворотом (R2)y°(R-i)Wl (6.223) [то есть поворотом с относительной фазой тт(.у}у0)], действующим на тре- тий кубит после того, как были измерены значения у1 и у0. В общем случае, если мы собираемся измерять после выполнения QFT, то для его осуществления необходимо только п вентилей Адамара и в - 1 одпокубитовых поворотов. Процедура QFT замечательно проста! 6.10. Факторизация 6.10.1. Факторизация как отыскание периода Что связывает проблему факторизации (поиск простых множителей большого составного положительного целого числа) с периодичностью? Существует хорошо известная (рапдомизованная) редукция факторизации к определению периода функции. Хотя эта редукция непосредственно не связана с квантовыми вычислениями, мы обсудим ее здесь для полноты, а также и потому, что перспектива использования квантовою компьютера как инструмента факторизации вызывает столь сильное волнение. Допустим, мы хотим найти множитель «-битового числа N. Выберем псевдослучайным образом а < N и вычислим наибольший общий дели-
360 Глава 6 тень GCD(a. Аг), что можно эффективно [за время порядка (log;V j:i] вы- полнить с помощью алгоритма Евклида. Если GCD(a, AQ / 1, тогда GCD является нетривиальным множителем числа АГ и задача решена. Но пред- положим, что GCD(n, N) 1. Отступление: алгоритм Евклида. Чтобы вычислить GCD(Ar1: А^) (при А\ > Лг2) разделим сначала А\ на N2> получая остаток Затем разделим Л’2 на 7?1( получая остаток Т?2. Разделим Rr на Т?2 и так далее до тех пор, пока не получим в остатке нуль. Последний нену- левой остаток и есть R — GCD(Ar15 TV2). Чтобы убсдитьсяв том, что алгоритм работает, заметим лишь, что: (1) на R делятся все предыду- щие остатки и, следовательно, А? и N2; (2) любое число, на которое делятся jV, и N2, делит все остатки, включая R. Общий делитель Ar, и Лг2, который в свою очередь делится на все остальные общие дели- тели этих чисел, есть не что иное как GCD(JV1;N2)- Чтобы понять, сколько времени занимает алгоритм Евклида, заметим, что Rj = qR3+x + Rj+2, (6.224) где q > 1, a R3+2 < 11> следовательно, R3+2 < Два деления сокращают остаток как минимум в два раза, так что требуется не бо- лее чем 21ogA\ делений, каждое из которых использует O((logAQ2) элементарных операций; полное количество операций имеет поря- док O((log^3). Числа а < N, взаимно простые с N (не имеющие общего множи- теля с 7V), образуют конечную группу относительно умножения ио мо- дулю (V. [Почему? Нам нужно установить, что каждый элемент а име- ет обратный. Но для данного а. < N, взаимно простого с Лг, и каждого b < Лг, пробегающего все взаимно простые с N значения, все произведения afefmod /V) различны1. Следовательно, для некоторого Ь мы должны иметь ab = l(modN); таким образом, число, обратное к а, существует.) Каждый элемент а этой конечной группы имеет конечный порядок г, наименьшее положительное целое число хакое, что ar = l(modN). (6.225) Порядок а по модулю N является периодом функции fiv,a(x) - a“(rnod^. (6.226) 1 Если .(V — делитель числа ab — at/, то оно должно делителем и b — Ь',
6.10- Факторизация 361 Мы знаем, что существует эффективный квантовый алгоритм, позволяю- щий найти период функции: следовательно, если мы можем эффективно вычислить /д, о, то также эффективно можем найти и порядок а. На первый взгляд, вычисление fN а может показаться трудным, по- скольку показатель степени х может быть очень большим. Но если х < 2т и мы представляем х в виде двоичного разложения * = д 2“-1 + хт_2 - 2т + ... + • 2 + т0: (6.227) го a'T(mod ,¥) — (а2" 1)г"1-1(а2™ 2)а!т-2.,. (п)^°(тос1 N) (6.228) Каждое а2’ имеет большой показатель степени, тем не менее оно может быть эффективно вычислено классическим компьютером путем повторного возведения в квадрат: a2?(mod /V) — (a2’ )2(mod N). (6.229) То есть необходимо только т— 1 (классических) умножений по модулю ЛГ. чтобы собрать таблицу всех а2?. Вычисление rr^modTV) выполняет программа INPUT 1 For j 0 to т - 1, if х- - 1, MULTIPLY а2'. Она требует максимум nt умножений по модулю N, каждое из которых тре- бует порядка (log jV)2 элементарных операций1. Поскольку г < N, у нас бу- дут неплохие шансы успешно выделить период, если выбрать т ~ 2 Jog Л'. Следовательно, вычисление fN п может быть выполнено семейством схем размера О ((log Aj3j, имеющих следующую структуру; Ы 1 Используя разные трюки для выполнения эффективного перемножения очень боль- ших чисел, количество элементарных операций можно сократить до С* (log Л’ log log Nx х log log lug TV); таким образом, асимптотически при больших N семейство схем размера O(log2 iV lug log N log log IogAr) может вычислить fN Q.
362 Глава 6 Умножение на а23 выполняется, если контрольный кубит х^ имеет значе- ние 1. Предположим, что мы нашли г, период а по модулю N, Тогда, если г четное, то N является делителем числа (ат^ + 1) (а^2 — 1). (6.230) Очевидно, что N не делит — 1); если бы это было так, то порядок а был бы г/2, Таким образом, если наряду с этим N не является делителем {аг‘2 + 1) или «г/2/ -KmodA’), (6.231) тогда N должен иметь нетривиальный общий множитель с каждым из пг/2 ± 3. Следовательно, GCD(,V, ат/2 + 1) / 1 является множителем Л' (что можно эффективно определить с помощью классических вычислений), то есть задача решена. Таким образом, коль скоро найдено г, мы успешно факторизова- ли N, за исключением случаев, когда (1) г нечетное или (2) г четное и аг/2 = - l(mod ТУ). Насколько вероятен этот успех? Допустим, что N является произведением двух простых множите- лей р, //>2; N - Р1Р2 (6.232) (это фактически самый неблагоприятный случай). Для каждого а < р3р2 существуют единственные aj < р-, и а2 < Рг такие, что а = a^modpj), а = a2(modp2). (6.233) Следовательно, случайный выбор а < N эквивалентен случайному выбо- ру ai <Pi и а2 < р2. Отступление: мы используем Китайскую теорему об остатках Реше- ние а уравнений (6.233) единственно, поскольку если а и b являются решениями, то и р2 должны быть делителями а — Ь. Решение су- ществует, поскольку каждое а < решает уравнения (6.233) при некоторых а1 и а2 . А так как имеется ровно Р\Р2 способов выбрать я, и «2 и ровно ррр2 способов выбрать а, то единственность означает, что для каждой пары a-, .<z2 существует соответствующее ей а.
6.10. Факторизация 363 Пусть теперь г, обозначает порядок at по модулю рь а г2 - поря- док а2 по модулю р2- Китайская теорема об остатках утверждает, что аг = li'rnodpjp.j эквивалентно тому, что а\ = l(modpL), а2 = l(modp2). (6.234) Следовательно, г = LCM(r1,r2). Если гу и г2 оба нечетны, то таковым же является г, и мы проигрываем. Но если одно из двух чисел, г1 или г2, четное, то таковым же являет- ся г, и мы продолжаем игру. Если а)/'2 ~ -((modpj, ЛУ2 = -l(modp2), то = — l(modp1p2), и мы снова проигрываем. Но если или д'/2 — l(modpj), а?2 = l(modp2), или = Ifmodpj), а2/2 = —l(modp2), (6.235) (6.236) (6.237) то аг№ ± ((modp^), и мы выигрываем. [Конечно, одновременное ра- венство а^2 = IfmodpJ и а^2 = l(modp2) невозможно, что означало бы eft- = l(modp1p2), то есть г не могло бы быть порядком а,] Допустим, что Г] - 2'1 (нечетное число), г2 = 2Сг (нечетное число), (6.238) где с, > с2. Тогда т = LCM(r13 г2) = 2г2 • (целое число), так что аг^ = l(modp2), а уравнения (6.236) удовлетворяются - мы победили! Аналогич- но с2 > Cj подразумевает уравнение (6.237) • - мы снова в выигрыше! Но при cY ~ с2 имеет место г — г, • (нечетное число) = гх (нечетное число'), так что удовлетворяются уравнения (6.235) — в таком случае мы проиграли. Итак, все сводится к альтернативе: при с, — с2 мы проигрываем, а при cj / с2 побеждаем. Насколько вероятно, что c.t
364 Глава 6 Полезно знать, что мультипликативная группа по модулю р являет- ся циклической — она имеет такой образующий элемент порядка р — 1, чю все элементы являются его степенями. [Почему? Множество целых чи- сел по модулю р образуют конечное поле. Если бы группа не была цик- лической, то максимальный порядок ее элементов был бы q < р - 1, так что r.q = l(modp) имело бы р - 1 решений. Но это невозможно: па конечном поле существует не более чем q корней g-ой степени из едини- цы.] Допустим, что р — 1 — 2к • в, где з - нечетное, и рассмотрим порядки всех элементов циклической группы порядка р - 1. Для краткости мы об- судим только самый неблагоприятный для нас случай k 1. Тогда, если Ь является образующим элементом (имеет порядок 2а), то четные степени Ь имеют нечетный порядок, а нечетные — порядок 2 • (нечетное число). То- гда в этом случае г - 2е • (нечетное число), где с с равной вероятностью принимает одно из значений {0,1}. Следовательно, если рг и оба та- кою (неподходящею) типа, а аг, а2 выбираются случайно, вероятность то- го, что с2, равна 1/2. Следовательно, раз мы нашли г, то вероят- ность успешного отыскания множителя как минимум равна 1/2, если W является произведением двух простых чисел. Если же N имеет больпте двух различных простых множителей, то наши нечетные числа даже луч- ше. Этот метод терпит неудачу, если N является степенью простого чис- ла N - ра, но степени простых чисел успешно факторизуются другими методами. 6.10.2. RSA Интересует ли кого-нибудь, простой или трудной является факториза- ция? Некоторых это очень интересует. Предполагаемая сложность факторизации является основой надежно- сти широко используемой схемы RSA для криптографии с открытым клю- чом1, которой вы можете воспользоваться, даже если посылаете через ин- тернет помер своей кредитной карточки. Идея криптографии с открытым ключом заключается в том, чтобы из- бежать необходимости обмена секретным ключом (который может быть перехвачен и скопирован) между желающими установить связь с партне- рами. Шифрующий ключ общеизвестен. Но его использование для того, 1R. L. Rivest, A. Shamir, L. М. Adietnan, A Method of Obtaining Digital Signatures and Public- Key Cryptosystems, Comm. ACM, 21(2), 120-126 (1978).
6.10. Факторизация 365 чтобы извлечь дешифрующий ключ, требует непомерно сложных вычисле- ний. Следовательно, Боб может послать шифрующий ключ Алисе и кому угодно, но только он будет в состоянии декодировать сообщение, которое Алиса (или кто-нибуць другой) закодирует с помощью этого ключа. Коди- рование является «односторонней функцией», которую легко вычислить, но очень трудно обратить. (Конечно, Алиса и Боб .могли бы избежать необходимости обмена от- крытым ключом, если бы они выбрали конфиденциальный ключ во вре- мя их предыдущей тайной встречи. Например, они моши бы договориться использовать длинную случайную строку в качестве разового шифра для кодирования и декодирования. Но, возможно, Алиса и Боб никогда не заду- мывались о том, что однажды им понадобится тайно связаться друг с дру- гом. Или. возможно, ранее опи договорились использовать разовый шифр, но уже израсходовали свои тайные ключи и не имеют желания вновь поль- зоваться ими, опасаясь, что тогда их код смогут взломать шпионы. Сейчас они слишком далеко друг от друга, чтобы безопасно обменяться новым тайным ключом; их самым надежным выбором оказывается криптография с открытым ключом.) Чтобы построить открытый ключ, Боб выбирает два больших простых числа р и q. Но он не открывает их значения, а вместо этого вычисляет произведение N-pq (6.239) Поскольку Боб знает разложение N на простые множители, то ему известно и значение функции Эйлера <р(ЛГ) количества чисел, меньших чем N, являющихся взаимно простыми с (V. В случае произведения двух простых чисел это - N ~р — q | 1 — (р — 1)(<? — 1) (6.240) (только числа, кратные р и д, имеют общий множитель с АГ). Найти 9?(ЛГ) несложно, если вы знаете разложение N на простые множители, но эго трудно, если вам известно только N. Затем Боб псевдослучайным образом выбирает е < <p(N), взаимно простое с Х-^)- Он открывает Алисе (и любому подслушивающему) зна- чения N и е, но ничего сверх этого. Алиса преобразует свое сообщение в ASCII1, число а < N. Она коди- рует сообщение, вычисляя b -= f(a) — ae(mad N). (6.241) 1 ASCII American Standard Code for Information Interchange — американский стандарт кода для обмена информацией. - Прим перец
366 Глава 6 что можно быстро выполнить путем повторного возведения в квадрат. Как теперь Бобу декодировать это сообщение? Допустим, что а является взаимно простым с N (что имеет подавля- ющую вероятность, если р и q очень большие — во всяком случае Алиса может проверить это прежде, чем кодировать). Тогда a^N'> = l(modW) (6.242) (теорема Эйлера). Это так, поскольку числа, меньшие .V и взаимно простые с АГ, образуют группу [порядка относительно умножения по моду- лю W. Порядок любого элемента группы должен быть делителем порядка группы (степени а образуют подгруппу). Поскольку GCD(e,</?(Ar)) = 1. то нам известно, что е имеет мультипликативное обратное d = е-1 по мо- дулю <4(V): ed = l(mod y?(7V)). (6.243) Значение d является строго сохраняемым секретом Боба; он использует его для декодирования, вычисляя f~ 1(b) = bd (mod N) — a':,i(mod N) -- -- - — a(mod jV) . (6.244) Отступление. Как Бобу вычислить d — е-1? Мультишшкативное обратное является побочным продуктом выполнения алгоритма Евклида вычис- ления GCD(e, yj(JV)) — 1. Проследим цепочку остатков снизу вверх, начиная с Ru 1: 1 j^n-2 ~ ^п-1 = Rn-З ~ Чп-2^п-2’ ^п-2 = 4 ~ 7п- 3^г. -3 и так далее ... (6.245) (где q3 — частные), так что 1 — (1 Мп 19п-2)^п-2 “9n-l#n-3> 1 ( Чп— 1 — Чп—з(1 d” Чп— 1?п—г))^п—3 d” (1 d" Чп— iQn-г)^п— 4 и так далее .... (6.246)
6.10. Факторизация 367 Продолжая, .мы можем выразить единицу через линейную комбинацию любых двух следующих друг за другом остатков; в конце концов, мы пройдем весь путь вплоть до 1 — d • е + q • (6.247) и идентифицируем d как e-1(mody7(Ar)). Конечно, если Ева имеет средство сверхбыстрой факторизации, то RSA-схема ненадежна. Она факторизует N, найдет у?(Лг) и быстро вы- числит d. Па самом деле ей даже не нужно факторизовать N; достаточно вычислить порядок по модулю А закодированного сообщения «"(mod А). Так как е является взаимно простым с <p(N), то порядок ae(inod N") тот же самый, что и порядок а (оба элемента генерируют одну и ту же орбиту или циклическую подгруппу). Как только порядок Ord(«) становится известен, Ева вычисляет d такое, что de = l(mod Ord(a)), (6.248) так что («У = « («о.*»/"'™' = \'| (6 249) и Ева может дешифровать сообщение. Если нашей единственной целью является взлом RSA, то мы обратимся к алгоритму Шора, чтобы найти г = — Ord(ac), и нас не должно беспокоить то, можем мы или нет использо- вать г, чтобы выделить множитель N. Насколько важна такая перспектива криптографических применений квантовых вычислений? Когда быстрые квантовые компьютеры станут до- ступной реальностью, заинтересованные стороны могут прекратить ис- пользование RSA или могут использовать более длинные ключи, чтобы оставаться на шаг впереди современной техники. Однако люди, имеющие секреты, иногда хотят, чтобы их сообщения до поры (лет 30?) оставались конфиденциальными, Их могут не устроить более длинные ключи, если они не уверены относительно темпов будущих технологических достижений. А если они избегают RSA, то чем они буду г пользоваться вместо это- го? Известно не так много подходящих односторонних функций, да и они, а не только RSA, (могут быть) беззащитны перед квантовой атакой. ТЬ есть на самом деле многое поставлено на каргу. Если станут доступными быст- рые большие квантовые компьютеры, то зашифрованная информация ста- нет легко доступной
368 Глава 6 Но квантовая теория, одной рукой отбирая, друюй дает; квантовые компьютеры могут скомпрометировать схемы открытых ключей, но вме- сте с этим — предложить альтернативу: обсуждавшееся в четвертой главе безопасное распределение квантового ключа. 6.11. Определение фазы Существует альтернативный взгляд на алгоритм факторизации (пред- ложенный Китаевым), углубляющий наше понимание того, как он работает: мы можем факторизовать, поскольку можем эффективно и точно измерять собственные значения некоторого унитарного оператора. Рассмотрим а < N, взаимно простое с N. Пусть х принимает значения из {0,1,2,..., ДГ - 1} и пусть Ua обозначает унитарный оператор Uo : > |aar(mod TV)). (6.250) Этот оператор унитарен (перестановка вычислительного базиса), поскольку умножение на а по модулю N обратимо. Если порядок а по модулю N равен г. то U^-l. (6.251) Отсюда следует, что все собственные значения Ua являются корнями сте- пени г и.з единицы: = к G {0,1,2, ...,г -1}. (6 252) Соотвегствующими собственными состояниями являются г-1 14) = : (6.253) существует г взаимно ортогональных состояний, связанных с каждой ор- битой длины г, генерируемой умножением па а. Оператор Ua не эрмитов, но его фаза (эрмитов оператор, генерирую- щий U„) является наблюдаемой величиной. Предположим, что мы можем выполнить измерение, которое проецирует на базис собственных состоя- ний Ua и определяет’ значение А,., с равной вероятностью выбираемое из возможных собственных значений. Следовагельно, измерение определяет
6.11. Определение фазы 369 значение к/r, что делает процедура Шора, и мы можем с приемлемо вы- сокой вероятное 1ью успеха получить множитель N. Но как измерить соб- ственные значения унитарного оператора? Допустим, что мы можем выполнить унитарное преобразование U, обусловленное контрольным битом, и рассмотрим схему |0) — Н |-----f-----1 Н — Измерение |А> |А> Здесь |А) обозначает собственное состояние U, соответствующее собствен- ному значению A (U|A) - А|А)). Тогда действие схемы на контрольный бит имеет вид |о) - НО) - ^1°) + А11)) - |ci I- А)|0} + 1(1 - А)|1>). (6.254) Тогда результат измерения контрольною кубита имеет распределение веро- ятностей РгоЬ(О) — 1(1 + А) =СО827Г$, (6.255) Prob(l) = 1(1 -А; - sir? тг</, где А Как мы обсуждали ранее (например, в связи с проблемой Дойча), эта процедура с уверенностью различает собственные значения А -- 1 (</> — = 0) и А - -1 (ф = 1/2). Но также могут быть различимы и другие возможные значения А, хотя и с меньшей статистической достоверностью. Например, предположим, что состояние, на которое действует U, является суперпозицией его собственных состояний ai |Ai) +а2|А3). (6.256) Предположим также, что мы п раз выполняем изображенную выше схему с п индивидуальными контрольными битами. Таким образом, мы готовим
370 Глава 6 состояние / Т г- А 1 — А X а11лт) !--2~Ч1)^ + + <*2!А2}(Ц^|0) + Ц^|1}) . (6.257) Если \ / А2, то при больших п перекрытие между двумя состояниями п контрольных битов экспоненциально мало; измеряя контрольные биты, мы можем, как минимум в отличном приближении, выполнить ортогональное проецирование на базис {(AJ, |А2)}. Если мы используем достаточно контрольных битов, то в нашем рас- поряжении имеется достаточно большая выборка, чтобы с приемлемой ста- тистической надежностью измерить Prob(O) — |(1 -Г сов2лф) Выполняя контролируемое i'U, мы можем также измерить i(l + sin 2л^), что доста- точно для определения ф по модулю целое число. Однако в алгоритме факторизации нам необходимо измерять фазу е2''‘Л/г' с экспоненциальной точностью, что, похоже, требует экспоненци- ального количества испытаний Допустим все же, что мы можем эффектив- но вычислять высокие степени U (как в случае с Ua), такие как U2J. (6.258) С помощью описанной выше процедуры измерения U2" мы определяем ехр (2тгг23^), (6.259) где е21Г4<^ - собственное значение оператора U. Следовательно, измере- ние U2’ с точностью до одного бита эквивалентно измерению j-го бита собственного значения U. Мы можем использовать эту процедуру определения фазы для отыска- ния порядка и, следовательно, факторизации. Обратим уравнение (6 253), чтобы получить г-1 |х0) --b^|Aj: (6.260)
6.11. Определение фазы 371 каждое состояние вычислительного базиса (при г0 / 0) является равно- взвешенной суперпозицией г собственных состояний U„. Измеряя собственное значение, мы получаем Afc — е2’гг/с/г с };> рав- новероятно выбирающимся из {0,1.2,...,г - 1}. Если г < 2П, то, чтобы определить к/r. мы измеряем с точностью до 2п битов. В принципе мы можем выполнять эту процедуру на компьютере, который хранит меньше кубитов, чем это необходимо для вычисления QFT, потому что всякий раз мы можем приступать к определению только одного бита из к/г. Но поучительно представить, что мы включаем QFT в процедуру опре- деления фазы. Предположим, что схема -к(|0) + А4(1)) 4=(|0> + А2|1>) V ^(|0> + А|1)) действует на собственное состояние |А) унитарною преобразования U. Условный оператор U готовит состояние -Х(|0) + А|1)), условный опе- ратор U2 готовит 1 \/2 (|0) + А2)1)), а условный оператор U4 + А411/) и так далее. Мы могли бы выполнить преобразование Адамара и измерить каждый из этих кубитов, чтобы получить распределение ве- роятностей, управляющее у-м битом ф, где А = е2,гЧ Но целесообразнее заметить, что приготовленное схемой состояние равно £ е^\у). (6.261) у- Ч Лучший способ узнать значение ф — выполнить перед измерением QFT а не преобразование Адамара Рассмотрим для ясности случай т = 3. Схема, которая готовит состо- яние 7 ко) = 4= 52 е2"^у , <6-262)
372 Глава 6 а затем выполняет его Фурье-анализ, имеет вид Эта схема почти полностью выполняет описанную выше стратегию опреде- ления фазы, по со значительной модификацией. Прежде чем мы выполняем завершающее преобразование Адамара и измеряем у{ и у.2, выполняются некоторые условные фазовые повороты. Это те фазовые повороты, кото- рые отличают QFT(3) от преобразования Адамара Н'3' и резко повышают эффективность, с которой мы можем извлечь значение ф. Мы можем лучше понять, что делают условные повороты, если пред- положим, что ф — к/8 при к L {0.1,2,.... 7}; в этом случае нам известно, что преобразование Фурье будет с вероятностью единица i енерировагь на выходе у -= к. Мы можем представить к в виде двоичного разложения к — kyk-^Q — к2 • 4 + - 2 4- к^. (6.263) Фактически схема для самого младшею значащего би га у0 преобразования Фурье является в точности измерительной схемой Китаева, применяемой к унитарному преобразованию U4, собственные значения которого равны (е2^)4 = = ±1. (6.264) Измерительная цепь идеально различает собственные значения ±1, так что у0 — fc0- Схема для следующего бита уг почти такая же, как и измеритс.тьная схема для U2 с собственным значением е2тгчр\2 = _ е«л(А1 А,с) (6.265) за исключением того, что добавлен условный фазовый поворот, который умножает фазу на ехр[-гтг(.А;0)], давая в результате eswfci. Вновь, применяя вслед за измерением преобразование Адамара, мы с определенностью по- лучаем результат у{ - kv Аналогично схема для у2 измеряет собственное значение ^’Ф - ct’!rk^i — е™^2 kikn) (6.266) за исключением того, что условный поворот удаляет е™1- так что ре- зультатом с определенностью является у2 — к2.
6.12 Резюме 373 Таким образом, QFT наилучшим образом осуществляет программу определения фазы. Сначала мы измеряем значащие биты младших разря- дов фазы ф и используем приобретенную в измерениях информацию, чтобы улучшить достоверность определения значащих битов следующих разря- дов. Имея в виду эту интерпретацию, вы сможете просто запомнить схему для QFT(Ti)! 6.12. Резюме Классические схемы. Сложность задачи можно характеризовать раз- мером однородною семейства логических схем, решающих эту задачу За- дача трудная, если размер схемы является суперполиномиальной функци- ей от размера входа. Один классический универсальный компьютер может эффективно моделировать другой, гак что классификация сложности ап- паратно-независима. Трехбитовый вентиль Тоффоли является универсаль- ным для классических обратимых вычислений. Обратимый компьютер мо- жет моделировать необратимый без значительного замедления и неприем- лемых затрат памяти. Квантовые схемы. Хотя это не доказано, но выглядит правдоподоб- ным, что квантовые схемы полиномиального размера не мотуг моделиро- ваться классическими вероятностными схемами полиномиального размера (BQP ВРР); однако для этого достаточно полиномиального простран- ства (BQP С PSPACE). Квантовая схема с шумом может с приемлемой точностью моделировать идеальную квантовую схему размера Г, если каж- дый квантовый вентиль имеет точность порядка 1/Т. Один универсаль- ный квантовый компьютер может эффективно моделировать другой, так что класс сложности BQP аппаратно независим Типичный двухкубито- вый квантовый вентиль, если он может действовать на любую пару куби- тов в приборе, адекватен для универальных квантовых вычислений. Так- же адекватны вентиль контролируемое NOT плюс типичный однокубитовй вентиль. Быстрый квантовый поиск. Исчерпывающий поиск маркированно- го элемента в неструктурированной базе данных из .V элементов может быть выполнен с помощью квантового компьютера за время порядка VAT, но не быстрее. Квадратичное квантовое ускорение также может быть до- стигнуто для некоторых проблем структурированного поиска, но некото- рые проблемы оракула не допускают существенного квантового ускорения. Два участника, каждый из которых имеет в распоряжении таблицу из N
374 Глава 6 записей, мшут локализовать совпадающие строки в их таблицах, обменяв- шись v/jV logAr) кубитами, явно вступая в конфликт с духом (но не бук- вой) границы Холево, Отыскание периода. Используя квантовый параллелизм, можно вы- числить квантовое преобразование Фурье в У-мерном пространстве за вре- мя порядка (log.'V)2 (по сравнению со временем A' log Аг для классическо- го быстрого преобразования Фурье); если нам нужно сразу после этого выполнять измерение, то для вычисления QFT достаточно однокубитовых вентилей. Таким образом, квантовые компьютеры могут эффективно ре- шать некоторые задачи с периодической структурой, такие как факториза- ция и задача о дискретном логарифме. 6.13. Упражнения 6.1. Линейное моделирование вентиля Тоффоли. На лекции мы постро- или n-битовый вентиль Тоффоли 0^п’> из трехбитовых вентилей Тоф- фоли Схема требовала только одного бита вспомогательного про- странства, но количество вентилей было экспоненциально велико по п. Используя более широкое вспомогательное пространство, можно су- щественно сократить количество вентилей. а) Найдите вычисляющее 0^ семейство схем из 2п- 5 вентилей 0&Х (Здесь используется п — 3 вспомогательных битов, которые в кон- це вычисления возвращаются к своим исходным, равным нулю, значениям.) Ь) Найдите вычисляющее 0:'п> семейство схем из 4п—12 вентилей 0'3), которое работает независимо от начальных значений вспомога- тельных битов. (Вновь п'— 3 вспомогательных битов в конце вы- числения возвращаются к своим начальным, не обязательно рав- ным нулю, значениям.) 6.2. Универсальный набор квантовых вентилей. Цель этого упражне- ния -завершить демонстрацию тою, что контролируемое NOT и про- извольные однокубитовые вентили образуют универсальный набор а) Пусть U — произвольная унитарная 2 х 2-матрица с единичным определителем. Найдите унитарные преобразования А, В и С такие, что АВС - 1, (6.267) AcrTBrr,C U, (6.268)
6.13. Упражнения 375 [Указание. Из конструкции углов Эйлера мы знаем, что и = 1Ш)Н#)ЕШ), (6.269) где, например, R. (<?) обозначает поворот вокруг оси z на угол ф. Нам также известно, что, например, = (6.270) Ь) Рассмотрите двухкубитовый вентиль контролируемой фазы: он применяет U - е1а 1 ко второму кубиту, если первый кубит имеет значение 11), и действует тривиально в противном случае. Пока- жите, что фактически он является однокубитовым вентилем. с) Используя вентили контролируемое NOT и однокубитовые венти- ли, изобразит е схему, реализующую контролируемое U, где U — ироизво.тьнос унитарное 2 х 2-преобразованис. 6.3. Точное!ь. Цель этою упражнения установить связь между точно- стью квантовою состояния и точностью соответствующего распреде- ления вероятностей. а) Пусть || Aj| обозначает норму оператора А, а || A|)tr = tr [(АА+)’/2] (6.271) обозначает следовую норму. Покажите, что ||AB|]tr ||В|| - ||A]|tr и | tr А| ||A||tr. (6.272) b) Предположим, что р и р — две матрицы плотности, а {|«)} - пол- ный ортонормированный базис. Так что Рй (а1?И А = (°|pla) (6.273) - соответствующие распределения вероятностей. Используя (а), покажите, что £|Pa-PaMlp-p||tr. (6.274) а с) Предположим, что р = IvXV’l и Р I’PJW'I — чистые состояния. Используя (Ь), покажите, что £|Ра ’ А < 2||М - |ф}||. (6.275) а
376 Глава 6 6,4. Поиск в базе данных с непрерывным временем. Квантовая система с ?г-кубитовым гильбертовым пространством имеет гамильтониан Н^.ВД4 (6.276) где jw) — неизвестное состояние вычислительного базиса. Вам нужно найти значение ш с помощью следующей процедуры. Включите не за- висящее от времени возмущение Н', так что полным гамильтонианом будет н - Н + Н'. (6.277) Приготовьте начальное состояние |^0) и позвольте ему эволюциониро- вать в течение времени Т под управлением Н. Затем измерьте состо- яние. По результату измерения вы должны сделать вывод относитель- но W. а) Допустим, что в качестве начального состояния выбрано 2"- 1 Е И (6.278) 2 s О а в качестве возмущения Н' £|s)(4 (6.279) Решите зависящее от времени уравнение Шредингора г~\ф} — (6.280) at чтобы найти состояние в момент времени Т. Каким следует вы- брать Т, чтобы оптимизировать вероятность успешного опреде- ления w? Ь) Теперь предположим, что |^0) и Н' можно выбрать какими угод- но, но мы требуем, чтобы спустя время Г состоянием системы было |ш), так чтобы измерение определяло w с единичной ве- роятностью успеха. Выведите нижнюю границу, которой должно удовлетворять Т, и сравните с вашим результатом в (а). [Ука- зание. Как и в нашем анализе на лекции, сравните эволюцию, управляемую Н, с эволюцией, управляемой 1Г (случай «пусто- го оракула»), и используйте уравнение Шредингора, чтобы найти, как быстро состояние, эволюционирующее в соответствии с Н, отклоняется от состояния, эволюционирующего в соответствии сН'.]
Часть II Решение упражнений1 ] Решения упражнений выполнены Эндрю Лэндалом и Джимом Харрингтоном (упр 4Д, 4 2,4 61
Решения упражнений к главе 2 379 Решения упражнений к главе 2 2.1. Точность воспроизведения вероятностной гипотезы Операторы (матрицы) плотности чистого состояния двухуровневой си- стемы находятся во взаимно однозначном соответствии с сочками на по- верхности сферы Блоха. Благодаря этому соответствию, мы можем выбрать меру Хаара таких матриц плотности равной обычной евклидовой мере на 52:1 sin ddSdtp. to Если мы извлекаем |^) из однородного ансамбля чистых состояний и предполагаем, что извлеченным вслед за ним из того же ансамбля состо- янием является |<£), то усредненная ожидаемая точность воспроизведения нашей гипотезы дается (классическим) математическим ожиданием по обо- им выборам: (F) Е^}Е^[\{ф\ф)\2] ЕщЕф}[{ф\ф}(ф\ф}] . - EWEW [tr (|^|>|)] - = tr (bw [|OI]£W [1<Ш) = To, что усредненная точность воспроизведения равна i, интуитивно понятно, но мы должны честно выполнить вычисления, чтобы подтвердить правильность нашей интуиции. Особенно работая в квантовом мире! Прежде чем приступать к решению, я хотел бы объяснить, почему при- готовленная измерением матрица плотности может быть записана в виде, 1В общем случае отыскание меры Хаара для маприц плотности может оказаться трудной задачей.
380 Решение упражнений данном в условии задачи Вспомним, что если начальным состоянием кван- товой системы является чистое состояние |^), то, согласно третьей аксиоме (см, раздел 2 1), измерение наблюдаемой А с вероятностью рп = ($|Р„ выбирает проектор Рп на одно из собственных состояний А и переводит систему в нормированное чистое состояние <*|Р»1/2' Это наводит на мысль, что матрица плотности чистого состояния до.пкна трансформироваться в ансамбль всех возможных результатов измерения: iV’XV’j -> п Но ] является именно проектором Рп, так что приготавливаемая измерением матрица плотности с тем же основанием может быть записана в виде l<WI п 73 Однако следует предостеречь, что такая эволюция верна, если толь- ко начальным состоянием системы является чистое состояние. В общем c.iynae, как было показано на лекциях, эволюция матрицы плотности р под влиянием измерения (фон Неймана) имеет вид р —> Р„ tr(pPn) (см. раздел 3.1.1). С данной выше матрицей плотности вычисление точности воспроиз- ведения сравнительно просто: F - = W-l(Р;^!Р, К') + Pi (VdPJ^))M - = <V.-jP;|'eW|P|l^) + (’/’IP, kWlpi М = - (т>[Рт IV»)2 + (V'lPi IV-’)2 - р2 + pi = - р2-ь(1'Р)2 О = рт) — 2/.г — 2р + 1- Чтобы найти усредненную точность воспроизведения, необходимо вы- числить (классическое) математическое ожидание по всем возможным ре- ализациям состояния IV’) Поскольку состояния |^) рас прело лены однород-
РЕШЕНИЯ УПРАЖНЕНИЙ К ГЛАВЕ 2 381 но, усредненную точность воспроизведения (F) = Е^ [F| можно най- ти. полагая однородным распределение р е [о, 1]. (Длинный путь со- стоит в замене |v) спинорами или проекторами и усреднении по всем углам.) Это дает следующее значение усредненной точности воспроиз- ведения: 1 <F) = у'(2р2-2р+1)ф-|-1 + |. о Таким образом, выполнение измерения увеличивает точность воспро- изведения на i. Эвристически это можно запомнить, заметив, что с вероят- ностью | состояние 00 ориентировано вдоль оси измерения, а соответству- ющий результат измерения дает вдоль этой оси имеет вероятность |. Вероятность того, что гипотеза верна, равна | Следует заметить, что, хотя выражения для точности воспроизведения в задачах 2.1 и 2.2 выглядят различными, на самом деле оба они являются частными случаями общего выражения В задаче 2.1 обе pj и р3 были чистыми состояниями, а в задаче 2.2 чистое только Р]. В общем случае F описывает, насколько подобны два квантовых состояния. Непосредственно видно, что точность воспроизведения является не самой лучшей метрикой, так как, например, 1г(р)2 — 1 только в частном случае, когда р является проектором. Позже в этом курсе мы найдем более хорошие меры точности воспроизведения. 2.3. Разложение Шмидта 23.1. Частичные следы. Решение этой части главным образом получается путем чисто механического применения определений. Начальным состоя- нием системы является: |ф) = Па (21 4 4 ш 1 + I1~ = -О тт> + V3| ТО 1 х/з| 1Т) + ио), у 8 '
382 Решение упражнений что, будучи записанным как оператор плотности, представляет собой. IWi = |(| 11) + Xi П) + х/3| И) Р | Ц>) х х((П I I з/3(П | + +ЭД I । (11 l)- (1 V3 т/3 1 \ 3 3 1 Хз >/з 1 / (ТТI (11 I (И I (111 Частичный след по системе В дает: Ра = trB 1$ХФ1 = -(1в !Ф)(Ф|Ы + (1В|Ф)(Ф|Ы = 1 8 I TXT Н з/з| 1)(1| + Хз| 0(11 + 31 DG н ч з|т>(11 + ^11X11+ Хз| TXT I р11X11 Ц (4| 1X1 1+2з/3|-ГХ1! + 2з/3| 1X11 И1X11) = - (I т\ I m ( М2 т/З/4 А /X? 1/2 Д (i Поскольку состояние (Ф) симметрично относительно обмена система- ми А и В, то оказывается, что частичный след по системе А дает тот же самый вид приведенной матрицы плотности рв. Рв = 1Гд1$Хф1 = = <1а IWI Ь) + (1а |Ф)(Ф| 1аН 1 8 11X11 +МЗПХ11 + МЗ| 1X11 + ЗЦХ11+ +з[ 1X11 + Мз| 1X11 + л/з[ (XT X ЦХ1! = |(4|П(1 1+2т/3| 0(11 + 2^31 1X11+4} 1X1 }) - 2.3.2 Разложение Шмидта. Решение этой части задачи тоже получается в результате простых манипуляций определениями, ио с дополнительным преобразованием, с помощью которого мы предварительно поворачиваем базис системы А так, чтобы диагонализовать приведенную матрицу рА.
Решения упражнений к главр 2 383 Чтобы выполнить это, найдем сначала собственные состояния, диагонали- зующие рА : 1/2 — A v^/4 V3/4 1/2-А 1/4-А + А2 -3/16=0, А2 - А + 1/16 = 0, А± = 1/2 ± х/3/4, Па±Ша)- Чтобы выполнить (локальную) замену базиса, которая реализует эти собственные векторы в качестве базисных, используем обычную формулу перехода от одною представления к другому, основанную на очевидной тождественной вставке; W - £ Коэффициентами этого разложения фактически являются состояния систе- мы В, так как внутреннее произведение здесь вычисляется только по со- стояниям системы А. Действительно, ^ч^-|(д<т1+Аа о* X I Пд Пв + VI j + I ^1 Пв + || Пн = |(| Ив ^1 Ив + э/3| Пв Ь I Он) ~ — 4^~(| И в + । Ив) = \Фдв’ О)- 1(л(| |-лп !)х X 11 Пл ( || Пв + ^1 Ив I + I Пд ^1 Пн + || Пн = Пв + з/3| Пв ~ з/з| Т)в - I Пв) = = —4^“(| Нв _ I Ив) = )^з)в-
384 Решение упражнений Мы почти у цели. Все, что нам осталось сделать — это нормировать полученные состояния: I + в(11)0 Т)в + I J-)b) = I + s P1’ ~ jg (в(Т I — bU l)(i T)b ~ I Db) “ Используя нормированные состояния |<£>Db = мы м®жем записать разложение Шмидта этого чистого состояния по ортонормирован- ным состояниям систем Л и В: 1ф) = $2 в ~
Решения упражнений к главе 2 385 2.4. Трехкубитовое чистое состояние Пет. Прежде чем объяснять, почему, я хотел бы отметить, что на самом деле неверно в этой задаче. Разложение Шмидта для трехкомпонентной системы должно выглядеть следующим образом; г Надеюсь, это ни у кого не вызывает недоумения, так как множители очевидно, должны присутствовать, чтобы нормировать состояние. В общем случае разложение Шмидта «-компонентной системы имело бы вид Ev^0l’V г j где каждый базис Шмидта {|0Д является ортонормированным в j-ой си- стеме. Теперь обратимся к «объяснению», которое я употребляю как эвфе- мизм «доказательства»1 Пусть чистое состояние трехкомпонснтной системы; пред- положим, что IV1)лис мест разложение Шмидта. Коль скоро это так, то вы- числение парциального следа по любым двум подсистемам даст диагональ- ную в базисе Шмидта приведенную матрицу плотности оставшейся подси- стемы. Более того, вычисляемые этом базисе приведенные матрицы плот- ности подсистем должны иметь один и тот же спектр значений рг“. Лю- бые локальные (действуюпще внутри одной подсистемы) унитарные пре- образования базисов сохраняют собственные значения приведенных мат- риц плотности. Следовательно, спектры (ненулевые) приведенных матриц плотности всех этих подсистем должны быть идентичны независимо от то- го, в каком базисе они выражаются. Это требование строгою «совпадения спектров» несправедливо д.1я произвольных IV’J.tBGb и примеров этому множество. Я думаю, что про- стейшим контрпримером являсчся: Мавс = |0) л ^^(|00)вс + |И)вс)^ ’ Эвфемизм от греческою euphemia — воздержание от резких слов, смягченное выражение (перев.) 2Точнее, приведенные матрицы плотности должны иметь совпадающие спектры ненуле- вых собственных значений (см. раздел 2,4), — Прим ред
386 Решение упражнений Раис — IV’Jabc лвс’(^| — = 1(1ооо)<ооо|+ |ооо)<ои| + |ои)<ооо| +- |on}<oin), Ра — ,,гв trc Рав с -|О)ла(О( _ ( 1 ° \ 10 0/’ Рв - trc Равс -- |(|0>в |1)в я<И) _ ( 1/2 0 \ 0 1/2 J ’ Ц 2.5. Квантовые корреляции в смешанном состоянии Как мы видели в задаче 2 2, вероятность измерения собственного зна- чения Рп равна р„ = tr Рпр Взаимно однозначное соответствие между проекторами на кубиты и точками на поверхности сферы Блоха говорит о том, что вероятность результатов двух последовательных измерений «спин вверх» вдоль оси п у первого кубита и «спин вверх» вдоль оси т у второго кубита — равна Р = trB trA [(РЛ ® 1В)р]}, Р =- trB j |(1 + т -<TB)trA По отношению к следу ио системе А проектор РА является мульти- пликативной константой, поскольку его действие на систему А тривиально В силу линейности следа такую константу можно внести под его знак: р = trB trA - trB 1гл
Решения упражнений к главе 2 387 С помощью данной в задаче р, чти следы можно вычислить явно, учитывая линейность следа и равенство нулю следов .матриц Паули: = trB tr = trB trA [(1 н ™ <*д) ®> (1 t- т *в)] + +|trBtrA [(t1 1-га-<7л)® + l] = - ^2trBtrA С1»1] + 1(1 + П-<тА) ® (1 ) -= = | (ip |1 Ч- п аА j т <тв + п • 9 А ® m • сгв\ф ) = В синглетном состоянии |^') математические ожидания аА и as рав- ны нулю, в чем можно убедиться или с помощью явных вычислений или заметив, что синглет является скалярным (спин-0) состоянием. Остается вычислить только одно слагаемое, самое правое из приведенных выше. Для этого имеется несколько способов. Возможно, проще всего показать, что благодаря спин-0 симметрии синглетное состояние имеет один и тот же вид в любом базисе, следовательно, мы можем выбрать систему коорди- нат, в которой п - z. Более того, симметрия состояния позволяет положить т = zcosfl -|- £-sin 0, так что мы находим (^“|п <тл) ® т = (и’“|ал ® a..|v )cos6H +О/’ l&z ® «’’i |Ф~) sin 9 = - cos <9. что дает ответ Р= | “ |cos*- Этот результат интуитивно понятен. С большей вероятностью мы об- наруживаем спины антипараллельными, так как матрица плотности имеет большую синглетную компоненту. Но этой же причине меиее вероятно об- наружить спины параллельными. Вариация между двумя возможностями, естественно, синусоидальная.
388 Решение упражнений Решения упражнений к главе 3 3.1. Реализация ПОЗМ Поскольку мы имеем п = 4 положительных оператора, действующих в .V 2-мерном гильбертовом пространстве Н, то согласно теореме Пай- марка эту ПОЗМ можно расширить до «ортогонального измерения фон Неймана»1 в п — 4-мерпом гильбертовом пространстве Н Ф 'Н1. Сделаем это путем расширения N — 2 проекторов до четырех, требуя ортонормиро- ванность состояний, из которых формируются эти проекторы. На лекциях было показано, что с помощью следующего отображения вариант «прямой суммы» теоремы Наймарка можно преобразовать в вари- ант «тензорного произведения». Если вспомогательная система приготовлена в состоянии [0)в, го это отображение гарантирует, что дальнейшая эволюция системы А будет огра- ничена подпространством Ti. Размерность расширенного тензорным про- изведением пространства равна N(n — N + 1), что в нашем случае рав- но шести. Однако это не самое эффективное из возможных отображений. Мы можем использовать следующее, более рациона.гьное, отображение той же самой размерности: ly’a) © 1^а)л|0)в + IV’a П. Очевидно, это отображение также ограничивает систему А подпро- странством Н, если вспомогательная система приготовлена в состоя- нии |0)s. но размерность тензорного произведения гильбертовых про- странств теперь только 2N — 4. Чтобы найти 113И, сначала найдем расширение в прямую сумму про- странств, а затем применим приведенное выше отображение. Состояниями, включающими ПОЗМ, которую мы хотели бы расширить, являются км = V Некоторые авторы называют этот тип измерения ПЗИ (проскгорио-значное измерение). К их числу Принадлежит и автор. ПЗИ гораздо более ясно, чем «ортогональное измерение фон Неймана».
Решения упражнений к главе 3 389 Чтобы расширить базис, удобнее и понятнее переписать их в спинорной форме в z-базисе, в котором два последних состояния записываются с по- мощью соотношений' IТ,) = + I Ш ^иС)’ Первым состоянием, которое будет расширено, является Един- ственным ограничением является нормировка, поэтому мы можем расши- рить его с помощью любою 2-спинора в Н , имеющего норму 1/2. Суще- ствует множество выборов, но реально разумны только те из них. у которых или равна нулю одна компонента, или обе компоненты имеют одинаковые значения. Я продемонстрирую, что получится, если выбрать расширение спинора первого типа: / \ I \ _ 0 ” 1/V2 ’ \ 0 / Следующий вектор должен быть ортогонален предыдущему и также нормирован. С точностью до произвольной фазы это фиксирует его расши- рение, которое мы можем применить. Вновь имеется только один разумный выбор, даюпщй тривиальную фазу: / ° \ 1«2? - () к iM ) 'Записывая состояния таким образом, я явно использую соглашение о фазе спинора р)} - как ’Ю обычно делается Хотя соглашение о «распределенной л. i на \\ (costf/2 \ _ фазе» <рр = I е^/г е/2 ) выглядит оолее симметрично, оно ведет к общим фазам в I Ю и I 1т )> которые труднее запомнить и уж во всяком случае нефнзичны.
390 Решение упражнений Два последних выбора полностью фиксируются требованиями ортогональ- ности и нормировки и имеют вид / М2 \ 1/2 -1/2 ’ \ -1/2 7 / 1/2 \ -1/2 -1/2 \ 1/2 / Теперь нужно применить наше отображение, чтобы преобразовать эти «прямые суммы» состояний в тензорные произведения состояний. То есть взять нашу исходную систему А и ввести вспомогательную систему В та- ким образом, чтобы базисные состояния в 'НА ©НА- отобразились на ба- зисные состояния в НА ® Нв. Непосредственная проверка показывает, что это получается, если выполнить следующее отображение базисных векто- ров I Tz) А I Тг)в I DaI TzJfi I Da 11г)в i J-z) A I Iz)b где введены обозначения jO)B записать проекторы в виде - I Ыв> (1>в I Db- Это позволяет П1 - ! «!>(«! | 1 2 1 0 1 О X 0 0 0 0] 1 0 1 0 I 0 0 0 0 / 1Ш(ТЛ h П2 — ID(U2 I (О О О О X 0 10 1 0 0 0 0 0 10 1/ Из = 1изН“з1 /1 1-1 I 1 1-1 “ 4 I -1 -1 1 \ -1 -1 1 I Ы,ЖТх I, = I 1>
Решения упражнений к главе 3 391 П4 - ]и4Ди4| (1 -1 -1 1 -1-1 1 \ ] ] _] 1 11х-Ь)(1Дж I -1-1 1 / Для того, чтобы в исходной системе была реализована ПОЗМ, вспомо- гательная система должна быть приготовлена в состоянии | }г)в. Как упоминалось в ходе вывода, существует свобода в выборе путей, следовательно, возможны другие решения. 3.2. Обратимость супероператоров а) Предположим, что супероператор М имеет левый обратный суперопера- тор JV такой, что VojM --1. Согласно теореме о представлении Крауса и Л/” имеют представления операторных сумм: ЛГ(р) = а Е^^Е^^1- /х а Более того, представление операторной суммы их композиции выражается на языке операторов = NaM;z: Е r{^prLj = Е^ммркм/ = ар ар = -ЛГоЛЦр), ар. Е - £ (N.MJ'N.M, = а/х ар = EMiNiN«Mn= ар = Емн (е^)^-1- и \ • /
392 Решение упражнений Но поскольку о — Z, то операторы одновременно должны быть операторами Крауса для тождественного суиероператора, имеющего триви- альное представление Т(р) — 1р1Л В наиболее общем случае операторы Крауса определены с точностью до унитарного поворота; отсюда следует, что NaM^ - \^13 где А — элемент унитарной матрицы, а 52 1 IX fl согласно нормировке столбцов унитарной матрицы1. Ь) Используя тождественную вставку V Nt No=l и соотношение NOM — а -- Лад1 из части (а), получим требуемый результат; Mt Мр - £ Mt Nt NaMM - (6.281) a (6.282) a = (6.283) с) Из части (b) мы знаем, что Mj,Мм 7РМ1. Этого достаточно, чтобы показать пропорциональность друг другу всех операторов М, поскольку в этом случае разложение Крауса имеет всего одно слагаемое, которое в со- ответствии с нормировкой должно быть уни тарным. Так как мы рассматриваем только ненулевые операторы, нам известно, что У 0. Таким образом2, det Mj, М — det7„..l, И М 'Ми 7 detMtdetMg= (т^)", (det М }* det М 0, detM,, 0. А4 ' [На самом деле требование унитарности матрицы Хац здесь ичтипнк. Справедливость равенства ЛГ о М(р) — 1(р) — р для любого оператора плотности р требует выполнения NaM^ — А„;, 1, где Ха^ — элемент произвольной матрицы с единичной нормой Гильберта- Шмидта, определяемой уравнениями (6.104), (6.105). Впрочем уже в следующем пункте реше- ния данной задачи унитарность матрицы не предполагается, в противном случае матрица определяемая как 52 = 7,..„ была бы равна единичной матрице — 6^. — а Прим. р&). 2З десь во втором равенстве п — размерность гильбертова пространства состояний рас- сматриваемой квантовой системы. — Прим, ред
РГПННИЯ УПРАЖНЕНИИ К ГЛАВЕ 3 393 Следовательно, каждый из операторов должен быть обратим и, в част- ности, = 7млгм;1. Отсюда следует, что псе операторы М пропорциональны друг другу; = 7^1, М„М>м = 7„дМ„, = 7^мМу, Мд = ^м, iw 3.3. Как мною супероператоров? На лекции мы видели, что существует три эквивалентных способа установить, что $ является супероператором. 1. $ преобразует матрицы плотности в матрицы плотности. 2. $ является вполне положительным линейным отображением, сохра- няющим эрмиговость и след своего аргумента. 3. $ имеет представление операторной суммы. Необходимо найти количество степеней свободы $, используя любой из этих критериев. Здесь я опипгу подходы, использующие только крите- рии (1) и (3). В каждом из этих подходов р рассматривается как N х N оператор шютности, который полностью описывает смешанное состояние (то есть ансамбль чистых состояний) в .'V-мерном гильбертовом простран- стве. Матрица плотности р является эрмитовой матрицей с единичным сле- дом и, следовательно, зависит от № - 1 свободных параметров. Однако было бы ошибкой думать, что действие $ сводится всего лишь к случай- ному перемешиванию этих параметров. Базис для р фактически является №-мерным, а р может быть записана как р — |(1 + а- А), где А, представ- ляет собой № — 1 линейно независимых базисных матриц. Как видно из этой записи, $ способен не только случайно перемешивать матрицы Аг, из- меняя а, но также может отображать единицу на линейную комбинацию 1 и А: $ |1) = |(1 b Д А) для некоторого Д.
394 Решение упражнений При таком подсчете количество свободных параметров равно (№ - 1)г для отображения Ли № — 1 для аффинного сдвига 1, что в сумме дает (№ — 1 )2+№ — 1 — 7V4—№ вещественных параметров. Если вы не убеждены в существовании аффинного сдвига, то посмот- рите, как сдвигается центр сферы Блоха под действием канала затухания амплитуды в задаче 3.6 b. Поскольку $ имеет представление операторной суммы, мы можем за- писать $(р)-£МмрМ1, м где каждый оператор Мр € GL(jV, С)1 зависит от 2№ вещественных па- раметров. В GLQV,C) существует № линейно независимых матриц, что означает, что prima facie2 $ зависит самое большее от 2№(№) = 2ЛГ4 вещественных параметров. Матрицы М,( должны также удовлетворять условию нормировки ЕмМ = г м Это дает только № дополнительных связей, так как эрмитово сопряженное уравнение идентично записанному выше. Наконец, мы видели на лекции, что наиболее общей неоднозначностью в определении матриц М,( является унитарная перестановка операторов: U^M». Так как существует самое большее № матриц Мд, то U^, G U(№) зави- сит от N4, вещественных параметров. Таким образом, мы находим, что $ зависит самое большее от 2ДГ4 - №•— /V4 — .V4 — № вещественных пара- метров. В обоих подсчетах мы нашли, что $ зависит самое большее от 2V4 — № вещественных параметров. 3.4. Насколько быстра декогерентнзация? а) Уравнение движения простого затухающего гармонического осциллятора имеет вид тх 4- Ъх 4- тш2х = 0. lGL(/V, С) ipynna невырожденных матриц размерности N над полем комплексных чи- сел С. — Прим, ред, 2Prima facie (лат) — по первому виду, ид первый взгляд. — Прим, перев,
Решения упражнений к главе 3 395 Q = 2тг Ь/т Мы ожидаем, что при слабом затухании средняя энергия осциллятора убы- вает экспоненциально: (ВД = Еое-^т Таким образом, амплитуда осцилляций должна затухать как е ы'"2т. Из классической механики или откуда-нибудь еще мы помним, что при слабом затухании добротность определяется как Полная энергия Потеря энергии за период На лекции мы нашли, что декогерентизация хорошо моделируется ка- налом затухания фазы. Из основного уравнения для этого канала следует, что недиагональные в базисе когерентных состояний элементы матрицы плотности затухают как Pnm(*)=Pnm(O)^rln-m|2i/2- где L — темп рассеяния одного кванта осциллятора его окружением. Та- кой вид затухания наводит на мысль интерпретировать Г как коэффициент эффективной радиационной силы затухания с добротностью Время декогерентизации системы по порядку величины представляет собой время, за которое недиагональные элементы уменьшаются в е раз по сравнению с их начальными значениями: Mecoh = [Х 1 |П — 7П\ Данное в задаче кот-состояние не выражается в базисе когерентных состоя- ний Однако для сильно локализованных гауссовских волновых пакетов мы ожидаем, что собственное состояние оператора уничтожения будет пример- но пропорционально собственному состоянию х-оператора:
396 Решение упражнений Следовательно, мы ожидаем, что показатель экспоненты медиа!опальных элементов матрицы плотности будет иметь порядок 1 1 ~ 1 * л ' Й ' Теперь у нас есть все необходимое, чтобы вычислить время декогерен- тизации маятника: Ck-c-nh -- 2 Г|п - mf _ 2Qh _ Qh ТП'^Х2 109 • 10 34J - s lg -_______________________ — io-IKs 10"3kg 1 s~2 - 10-4m2 b) При нулевой температуре все уровни энергии осциллятора были связаны с основным состоянием окружения. При конечной температуре п = ~ со- стояний окружения доступны для взаимодействия1. Таким образом, по по- рядку величины темп затухания становится в п раз быстрее. Соответствен- но время декогерентизации должно уменьшиться на этот фактор: t<^oh(T) - ^ideeoh(0) - 10- 34 J s'- 1 s~] w2k • 10~18s - 10 3,s. Мораль: декогерентизация — очень быстра. Это один из самых быст- рых известных в настоящее время физических процессов. 3.5. Затухание фазы а) Непосредственно видно, что Мо, Mj и М2 выражаются только через две линейно независимые матрицы (1 и сг3). Это наводит на мысль, что возможно представление операторной суммы, использующее только два ’Эго справедливо при kT 3> Ьш. - Прим, ред
Решения упражнений к главе 3 397 оператора Крауса. (Фактически всегда, koi да набор операторов Крауса за- висит от п линейно независимых матриц, можно найти представление опе- раторной суммы, использующее эти п операторов.) Посмотрим явно, как операторы М действуют на матрицу плотности р общего вида р MgpMj + м{рм| -I- М2рМ2 - {1-р)р 4-~(1 |-сг3)/>(1 I- ст3) + |(1 - <г3)р(1 - <т3) -- Л М р — \ ” у ) ^азРсгз- Эта форма подсказывает выбор No - N, = в качестве операторов Крауса канала затухания фазы. Действительно, No и N.) удовлетворяют условию NqN0 + - 1 и, следовательно, долж- ным образом нормированы. Ь) Соотношение дает следующую систему уравнений для компонент и^а; ~Рг ~ иоо 11 + Ци «’'з, (Д(1 + а3) Uia^l 1 + а3! ~ «’а) — ^'20^1 “ | 1 + Сравнение коэффициентов при линейно независимых 1 и <т.3 дает ^оо = у о -~р 1 = °’ Ulo “ f/“ = Д’ Г'20 = У4^’ ^21 - )Д-
398 Решение упражнений Осталось лишь дополнить матрицу U до унитарной, потребовав, чтобы все ее строки и столбцы были взаимно ортогональньгинормированы: I^OOp + |^1Р I- !^02р 1 => Ц)2 l^op + l^ni2 1 => ^2 ,(/20|2 + |i/21 р + = 1 =*► и22 c&Uv + [Вд2 + ед2 = о => = 1 => ф, ^00^02 + ^*0^12 +" ^20^22 — 0 => —1 6 — ф + 7Г. Больше связей нет, следовательно, с точностью до неопределенной общей фазы (N-, — 0 не может иметь хорошо определенной фазы) с) Операторы Крауса для канала, имеющего унитарное представление UAE определяются как М,, = где |/z)E -- ортогональные состояния окружения. Мы можем обычным спо- собом сформировать ортогоналный базис окружения из {|0)Б, |7о)в< l?i)в}- Одним из методов является применение процесса Грама — Шмидта, но вме- сто этого я выберу базис, отражающий симметрию между |у0)Е и ^Jg: 1±)е = ^|(|7о>е± Ые): (±|±) - 1, => |а±|2(1 ± hohi)) = 1, _ / 1 — ± у 1±(1—е)‘
Решения упражнений к i лаве 3 399 В этом базисе операторы Крауса имеют вид M.-J - (ОВ|1/4В|ОЬ) — у/1 — pl, - (±Б|СдЕ|0Е) - / р / 1 ± (1 - е) О у2[1±(1-г)Н 0 ±[1±(1-О] /р[1±(1 -£}] / 1 О \ у 2 у 0 ±1 у' Они не похожи на операторы канала затухания фазы, но их можно преобра- зовать в три таких оператора. И даже более того, их можно преобразовать в два оператора, которые выглядят как операторы канала затухания фазы. Чтобы найти их, рассмотрим, как и в части (а), действие операторов Мо,± на произвольную матрицу плотности р MopMj + M+pMff 4- M_pMf у р(2 — е) рв - (1 -Р)Р+------Р+ ^зР^з ( Р?-\ Р£ - ! 1 - у jp-i ^ЗР^З: В такой форме очевидно, что это операторы Крауса для канала зату- хания фазы, имеющего вероятность декогерентизации с его окружением, равную ер. Обратим внимание на то, что при s —> 1 мы воспроизводим канал затухания фазы из части (а), а при е -+ 0 затухание фазы исчезает; d) Если капал из (с) описывает рассеяние отдельного фотона, то мы име- ем Tscatt = pAt. Но декогерентизация возникает только тогда, когда окру- жение может различить результаты рассеяния, то есть rdecoh = epAt. Сле- довательно, ^decoh C^scatt'
400 Решение упражнений 3.6. Декогерентизации на сфере Блоха а) Под действием канала затухания фазы матрица плотности р — |(1 -I 4 Р <т) эволюционирует как (используя операторы Мм из задачи 3.5) р —* MqPJVIq 4- АД^рМ^ 4- MgpIVI^ - (1-р)р (-~(1 Ь(73)р(14-сг3) + ^(1-ст3)р(1-ст3) = (, р\ р ' 2 [Н1 * 1 "" = К1 “ ' 2Рз<Тз) = 1 - f t | ) 1 + f1 " | | ) Р 1 РР2.^3 " I t1 4 ~ ' ° ^‘стз] - =- И1 + С1 ^)Р2,Лз) ос- 1 тавим образом, мы видим, что действие канала затухания фазы сжима- ет сферу Блоха, превращая ее в вытянутый вдоль оси z сфероид (эллипсоид вращения). Выделенное положение оси z означает, что канал затухания фа- зы действует в некотором предпочтительном базисе. Ь) Под действием канала затухания амплитуды матрица плотности р эво- люционирует как р -> MopMj + МхрМ1 = I (о v/rz7)+ (о (Г)(1 о л/р 0 Y °) 1 [71 о W ]+А Л-’AW1 о \1 з |\ о л/Т^Р 7 k Р1 + »р2 1 - рз ) \ о ) j +
Решения упражнений к главе 3 401 д-1 И ° W 1 + Рз i72 W 0 0 \1 2 L\ ° ° Д л+^з 1~^э А п Д “ 1 / Н Р3+р-рР3 (Рг - 1Р2) v'l \ _ 2UP]-HF3)vT^ 1-Р3-р + рР3 ) ’ = 1 [1 + (УГ^7р1,1/Г^р3)р3 । Kl-рД) ' Д' Таким образом, мы видим, что действие канала затухания амплитуды сжи- мает сферу Блоха в сплюснутый вдоль оси z эллипсоид вращения и сдви- гает ее вверх. с) Под действием «двойного капала Паули» матрица плотности р эволюци- онирует как р -- IVIq/oIXTq -f- A/IjpM j -|- ~ - (1 -P^P+ + |cr3p<73 - = .(1 -P '!P f | (1 -p)p + ^ i Д + <rL(P cf)or) + |(1 + cr3(P <7)<T3 1-lp-^ + P^i -lp-a-1 p3^3 | [(! - P+p)l + (1 ~P~v}P <? + pP &~рР2<т2 = | [1 I ((l-p)P1,(l-2p)P2:(l-p)P3).a], Таким образом, действие двойного канала Паули при р < | сжимает сферу Блоха в сплюснутый вдоль оси у эллипсоид вращения, а прир > 1 в вытянутый вдоль оси у инвертированный сфероид (однополостпой гипер- болоид вращения). 3.7. Декогерентизация затухающего осциллятора а) Рассмотрим производную X по времени:
402 Решении упражнений Чтобы упростить это выражение, мы хотим преобразовать два вторых сла- гаемых под знаком следа к такому же виду, что и первое (с целью по воз- можности сократить их друг с другом). Это можно сделать, используя свой- ство инвариантности следа относительно циклических перестановок и ком- мутационные соотношения между операторами уничтожения и рождения: [а,а*] = 1, [а,«А“'] = [а,а»]/- (,?•') = tja' ' Применяя эти манипуляции к X, найдем X -Ttr ap;af - iap;(af - А*) - |(а + A)p7af j еАа*е = jtr [л*Р/еАа1ае-А*а - ЛР/а^Аа1С’-А’а] . От лишних операторов рождения и уничтожения можно избавиться, используя правила дифференцирования экспонент: 3 Г-Л*а = ЗА* ^-еАа' = а*еАа' ; ЗА таким образом, мы получаем для X дифференциальное уравнение в част- ных производных: v _ Г + xPfA г.Ла‘ 3 2 Л ЗА* u [pl Г I \*ЗХ , \ЗХ 2 Г ЭА? + ЛЗА Здесь я довольно бесцеремонно переставил порядок операций дифферен- цирования и вычисления следа. Для данных целей я буду предполагать, что
Решения упражнений к главе з 44)3 здесь все относящиеся к делу функции равномерно непрерывны, так что э га коммутация разрешена. Используя правило дифференцирования сложных функций (цепное правило), мы можем записать для X линейное уравнение в частных произ- водных с постоянными коэффициентами: у _ Г ( дХ дХ \ 2 \dlnX* f ainX/' Естественно предположит, что решение этого равнения является функцией от линейной комбинации его аргументов: X - ^(alnA* Е£1пА + 7<|. Подставляя этот анзац в уравнение, мы находим соотношение между коэф- фициентами 7 = + что дает искомый скейлинговый закон. Х(Х, t) — X ^alnA* t /3 In A - 4 -^X (a In (А‘е~Гг/2) + Д1п (Ae-1"^2)^ - X(A',0), A' = Ae-rf/2. b) Прежде чем начинать решение, следует заметить, что этот кот ненорма- лен не только в житейском смысле, но и в смысле борновской интерпрета- ции. Чтобы должным образом нормировать этого кота, нам нужно положить равным единице «бра-кот кет-кот». |cat) -- + 1ат>)’ INI2 (cat|cat) = Jos2> + W<*1> + («21а2» = L Но вместо того чтобы отвлекаться на дальнейшие детали нормировки этого кота, я просто замечу, что перед ним должен быть нормирующий множи- тель.
404 Решение упражнений Результаты части (а) показывают, как связаны между собой след кота и оператора в момент времени I с их следом в момент t = 0. Однако опе- ратором под знаком следа является оператор «смещения» DA - tAale“A*a, который переводит одно когерентное состояние в другое. Поскольку опе- ратор любой паб.подаемой осциллятора можно разложить по этим операто- рам сдвига* 1, то временная эволюция ко та полностью определяется тем, как изменяется во времени действие на него этих операторов сдвига. Конкретнее, согласно части (а): tr [|Cat(0))(Cat(0)|eA'aVA'*a] - tr [pcat(^Aate-A*a]. В общем случае pcat (i) не обязано быть чистым состоянием (фактически мы увидим, что оно им не является), но до поры до времени будем пред- полагать его чистым. Это дает возможность преобразовать следы в мате- матические ожидания. С помощью внутреннего произведения когерентных состояний (оф?) = « 2+|Л 2)/2 = мы находим, что (cat(i)|eAa,e-A‘a|cat(t)) = (cat(0)[eA'a^-A'*a|cat(0)), eAa((0-A*ai(t) J \ eAaJ(t)-A*a2(t) । (a2 (t) |Oj (t))eAa»| A "'I> (0 J / е(>а;-А'й;л г, ; ! \ e(Actj — (o1|ct2)e|:A^-A*^)e_rt/2 + \ (ci!2|cti}e^Af’!'2_Atci^e Г'/2 ) :См., например. A. Peres, Quantum Theory: Concepts and Methods, Kluwer Academic Publishers, New York et al, 2002. [Оператор сдвига D(A), действуя на |0) — основное состояние гармонического осциллятора, преобразует в |А) — D(A)|0) — собственное состояние опера- тора уничтожения а|А) = А|А) (когерентное состояние). Преобразование одного когерентного состояния в другое обеспечивав! закон умножения операторов сдвша D(A)D(p) = D(A -f- I g) oxp[(Ag* — А*g)/2j. На русском языке с теорией когерентных состояний можно позна- комиггься по книгам И, А, Малкин, В, И. Манько, Динамические симметрии и когерентные состояния квантовых систем, М.: Наука (1979); Л. М. Переломов, Обобщенные когерентные состояния и их применения, (1987). — Прим, ред.]
Prun-ния УПРАЖНЕНИЙ К ГЛАВЕ 3 405 Эти слагаемые можно было бы почти согласовать друг с другом, пред- полагая, что эволюция во времени преобразует чистое состояние в другое чистое, но это ведет к тому, что недиагональные элементы не подходят друг к другу: I i I — IV'2\ 1а1,2/ |°Т.2е -= е(А“Т.2-А’«12)е Г*'2 |Q1 ,е , а2,1' ”Гг/:>) = Г‘ <<*2Ы- Чтобы исправить это несоответствие нсдиагональных элементов, мы должны потребовать, чтобы недиагональные компоненты юта затухали быстрее диагональных, как раз базис для когерентных состояний является затухающим. Это ведет к полностью перемешивающей состояния эволю- ции: {aJ [«je 17/2 , к«=2)<л-2[ -> |«2г-Г1/2^«2е_п/2 , hi){a2i <а11а2)(1“е Г!) |а1е-Г£/3^а2е-Гг/2|, Мл11 Г<) |а2е~Г£/2Ха1е~Гг/2|- Таким образом, наш кот эволюционирует в нечто более диагональное: |еМ(0)'(о.1(0)| 1 г (««' ’ ) _ \ \а21а1/ 1 / + ау sin6*21(t))] , тс матрица плотное! и выше выражается в зависящем от времени бази- / а г. Г(/2\ X се j’ а углы поворота 02iW определяются как 021(i) = = - e-n). Если мы рассматриваем затухание только недиагональных элементов, то можно игнорировать фазу 02)(i). Для времен t 1/Г базисные состоя-
406 Решение упражнений ния остаются приблизительно такими же: 1М«)) а амплитуды иедиагопальных элементов экспоненциально затухают со вре- менем: -||ai-a2'2(l-e rt) - ||oIj -cr2‘2(l-(1 . Ft)) - у11 oq --a2 [2 Решения упражнений к главе 4 4.1. Теорема Харди Боб и Клер делят множество идентично приготовленных копий состо- яния Мвс = V1 - 2ж|0)в ® |0>с + VS|O)£ ® |])с I v£| 1)в & )0)с, где х — вещественное число из интервала [0,1/2]. а) Если Боб выполняет измерение в базисе {[0), |1)}, а Клер — в базисе то всякий раз, когда результатом Боба является |0), Клер полу- чает Вследствие симметрии подсистем в |^)вс, такая же картина будет наблюдаться, если Боб и Клер обменяются базисами. Тогда мы можем спроецировать разделенное состояние на |0) в одной подсистеме, чтобы найти |^?) в другой подсистеме: (|0>в в(0| ® lc) W)RC - /Т^2т|0)в ® |0)с. + у^|0)в ® |1)с - = |0)в ® (v/~2r|0)c + (jO)в в <0| ® 1с) Н)вс — |0)в ® (W)r) Нормируя проекцию, мы находим ’ \AW|0) + /т^т- Рассмотрим некоторое нормированное состояние |у) = а|0) + где а, b £ С. Поскольку (хХ|х> - (Ь(0| -«{1|) (а|0) + Ь|1» = о,
Решения упражнений к главе 4 407 то ортогональное ему нормированное состояние равно = Ь* |0) - а* |1). Следовательно, учитывая, что при х € [0,1/2] коэффициенты вещественны, мы можем определить кх) = Г 1 — X У 1 — I 1 ' Ь) Боб и Клер оба выбрали {|^}, } в качестве базиса измере- ния. Вероятность Р(х) того, что результатом обоих измерений являет- ся вычисляется как квадрат соответствующей амплитуды состоя- ния Мвс: Л*) Кв^' I ® о^1!) 1^вс|2 Мы можем вычислить в {р “ I ® 1 - [ л/ | ’В (0| _ \1 1 ~“в01) ® в^1! ® civJ I ~ ® сФ| "1 ® о01 — х/х(1 — 2х'\ -----— (в(°1 ® с(1| + в01 ® с(0|)- Подстановка разложений в (ip11 ® с <У’1| И Мвс в базисе {|0>, |1)} в определение Р(х) дает следующий результат: . _________ 2 Р(а:) = (0) - ^(1 ~ 2a:-(V^ + = I J, J. uL- J. It _____ ____ 2 x^/1 — '2x 2x\/l — 2x 1 — x 1 — x _______ 2 xy/1 — 2x 1 - X ’ i2(l — 2x) (I-®)3' '
408 Решение упражнений с) Заметим, что Р(ж) > 0 при х. G [0,1/2] и Р(0) — Р(1/2) = 0. Так как Р(х) непрерывна в этом интервале, ее максимум достигается в нското- dP{x) рои внутренней критической точке, удовлетворяющей условию (или оо): гУР(ж) dx j Гж2(1 — 2.т dx\ (1 - а;)2 —[1 - 4х- + За:2 f- х - lx1 (i-x)3L = о dP{x} dx -^(a:2-3x+l). (1 — rr) Корнями приведенною выше квадратною трехчлена являются .т |(з± V5). Внутри 0 < х < 1/2 лежит голы© одна критическая точка Р(х): х = |(3 — \/5). Подставляя ее значение в выражение для Р(з?), находим ^тах- |(5т/5-П). d) Если Р(х) не равна нулю (что соответствует 0 < х < 1/2), то суще- ствует измеримое нарушение предсказания Альберта (и теоремы Харди). Рассуждения Адьберта некорректны па этапе комбинирования результатов двух взаимно исключающих экспериментов. Наблюдаемые, соответствую- щие измерениям в различных базисах, не коммутируют между собой, то есть нс имеет смысла рассматривать систему общих собственных состоя- ний обеих наблюдаемых. Коль скоро Боб (или Клер) выбирает измерение в базисе {[0), |1)}, мы никогда не сможем (с определенностью) узнать, ка- ким был бы результат измерения в базисе {|у?), |yrlj}. Заметим, что одного запутывания недостаточно, чтобы опровергнуть рассуждения Альберта, До тех пор, пока Альберт рассматривает только коммутирующие наблюдаемые, он может построить теорию скрытых пе- ременных, чтобы объяснить корреляции результатов измерений. Например, в случаях х = Ои х = 1/2 оба базиса становятся идентичными и, как пред- сказывал Альберт, Р(х) — 0.’ 4.2. Закрытие лазейки детектирования а) Выберем переменные х, х', у, у' € {0,1}. Мы хотим показать, что ху | ху' у х'у - х'у' ^х + у. Vx. х', у, у'. 'Заметим, что состояние |факторизуемое при :г 0. остается запутанным при ж= 1/2. - Прим. ред.
Решения упражнений к главе 4 409 Конечно, можно перебрать все 16 возможностей. С другой стороны, мы могли бы воспользоваться неравенством КГШХ (доказанным на лекциях), определив переменные а - 2х - 1, а' = 2з? — 1, 3 = 2у - 1, /?' .= 2у' - 1. Заметим, что а, а',(3, д' € {-1.1}. Применим неравенство КГШХ: 2 > то'? afl Г а' 3 — ci fl, 2^ (2a:-l)(2y-l) + (2x-l)(2/-l) + + (2х' - 1)(2г/ - 1) - (2х' - l)(2y' - 1), 2 4ху — 2х — 2у -f-1 + 4ху' — 2х — 2у' + 1 + +4х'у — 2х' — 2у 4- 1 — 4х'у! Г 2х' 2у — 1, 2 4ху + 4ху' 4- 4х.'у — 4х'у' — 4js — 4у 4- 2, 2 > 4- ху' 4- х'у — х'у') - (х 4- y)j 4- 2. 0 > (ху 4- ху' I х'у - х’у') - (ж 4 у). Следовательно, ху 4- ху1 4- х'у — х'у' х + у Vx. х'; у. у' {0,1}. Ь) Предположим, что существует локальная теория скрытых переменных, описывающая результаты выполняемых Алисой и Бобом измерений N фо- тонных пар. Пусть переменные ж,, ж'. е {0,1} обозначают результаты регистрации фотонов г-й пары. А именно, xit ж' G {0,1} обозначают, срабо- тал или нет детектор Алисы, ориентированный вдоль оси а или а' соответ- ственно. Аналогично переменные с/,;, у'г € {0,1} обозначают, сработал или нет детектор Боба, ориентированный вдоль оси 6 или Ь' соответственно. Каждый набор переменных х,х',у, у' должен удовлетворять доказанному в части (а) соотношению XiVt + хгу( 4- flyi - х'гу\ 4- Сложим N неравенств, чтобы получить Аг N 52^* + Х,^ 4- flyi - fly'i) +yfl 8=1 8=1 .V N N N NN 52 +52 +52 ~ 52IL +52 г~ 1 i 1 t=l t=l г = 1 г=1 Деление обеих частей на положительное целое число не меняет неравен- ство, поэтому N N N N N N ft + А/ 52^У’ ]V 52^*^ ~ ^53^ /V 52^* + JV ^2yi' 8—1 8=1 8=1 8=1 8=1 8=1
410 Решение упражнений Выражения в левой части этого неравенства дают оценки вероятностей того, что Алиса и Боб одновременно детектируют отдельную фотонную па- ру (при определенном расположении их детекторов). Выражения в правой части дают оценки вероятностей того, что Алиса или Боб независимо де- тектируют фотон детекторами, ориентированными вдоль осей а и b соот- ветственно. Пусть N настолько велико, что эти оценки достаточно близки к соответствующим вероятностям скрытых переменных. Тогда мы приходим к выводу, что (а&) + РЬт(аЪ') + P++(a'b) - Р, Да'У) < Р. (а) + Р + (Ь). с) Заметим, что базис состояний Белла {|Ф *’), (Ф ), (Ф |Ф-)} удовлетво- ряет <гх ® 1|Ф+) |’1г + ) - (Ту ® 1 |ФЧ ) — г|Ф^) —1 ® (Ту|Ф+), ст2®1|Ф+П |Ф") - 1®СТ2|Ф+). Таким образом, (Ф+ |d - <т ® 1|Ф+) - 0 = (ф-1 |1 ® Ь <т|Ф1) при любых а, Ь При данном единичном 3-векторе а оператор а • <т имеет собствен- ные значения {—1,41}, соответствующие собственным состояниям куби- та, ориентированным или антипараллельно, или параллельно оси а. Опера- тор |(1 -т а • ст) имеет те же собственные состояния, но с собственными значениями {0,(1}. Математическое ожидание этого последнего операто- ра в точности совпадает с вероятностью срабатывания ориентированного вдоль оси а детектора при условии его идеальной эффективности. Тогда мы можем выразить вероятность одновременного детектирова- ния Алисой и Бобом фотонов из разделенного состояния |Ф+) при эффек- тивностях детекторов i)A, т)в : -= ^Ф+ jl®l+a <тф(а - - <у)| Ф^ ~М1 + 0 + 0 + а- ь], 4 L J P++(af>) = + а fr).
Решения упражнений к главе 4 411 Аналогичным образом находим Р^г(дЬЭ = + «•*>'), Р+ + (УЬ) -- ^г)Ат)Б (1 + а' - Ь), Р4 + (а'У) =- |т7лг?в(1 + а’ - Ь'). ‘1 Также можно вычислить вероятности независимою детектирования: Р+ (а) = (ф+ , (1 + а - <?) ® 1 Ф+^ - Р+(Ь) = ^Ф+|1® ^-(1 + b.rf) Ф+^^. Чтобы максимально нарушить неравенство КГШХ, следует выбрать а — х, а' Ь -- + г) и Р — ~^=(£ ~ ?) Подставим их в найденные выше выражения: Р-+(«^) =- ^ПаЛв Т Т z) | |»7а’?в К Pu.4 (ah') = ~i)AT)g (ц X -~(± - z)^ | -= ^1+ Pv Да'Ь) ’ z ~^=(х + P+Ja'b') - |^д17в + z • ~(х - Комбинируя эти вероятности, получим \ V * / Pt ! (ab) + .(ab1) + P++(a'b) - Р+(а'Р) = , P,.., (ab) t-P++K) + - P.+W = ^aVb(1 + i/2). £ Максимально запутанное состояние |Ф+) может нарушить выведенное в ча- сти (Ь) неравенство для локальных скрытых переменных, если Р+ t(ab) + Р4 г(аЪ') у Pr+(ab) - P^+(a'b') Р, (а) + Р Дд),
412 Решение упражнений |адй(1 + 72)> ЧаЧв > 1 Ча + Чв 1 + у/2 4.3. Телепортация с помощью непрерывных переменных а) Проверим сформулированное утверждение, выражая запутанные состо- яния в базисе {|gj ® кг)}-’ (Q',P'|Q,P) = + £?'!? + <?) = = dqe«p-p'^Q~Q')=. 4iO Q^P l>'). b) Чтобы найти коэффициенты, вновь разложим в базисе {| г/, ) ® Ы}: (Q'.P'^K) - -±= [dqe-^(,q\q.)(q + Q\q.2} - у2тг J - —= [ dqe^P<Jd(q -q^q 1 Q - qj -- у2тг J у/ lit с) В этой части нам нужно оставить неизменными переменные р и q. Как и в уравнении (4.84) в лекциях, мы- хотим выразить состояние системы АС в запутанном базисе. В этом базисе Алиса будет выполнять измерения, посылая их результаты Бобу. Тогда, используя эти результаты, Боб смо- жет реконструировать в своей лаборатории исходное состояние системы С. Это — грубое описание того, как должна работать телепортация; после вы- полнения некоторых предвари-!единых вычислений я представлю полную процедуру, которой должны следован. Алиса и Боб. В качестве первого шага представим систему АС в запутанном базисе. Предварительно записав [V’Jabc в базисе Мн feic’h сделаем это, используя тождественную вставку I - f dQ'dP'lQ\P'}CACA{Q’,P'\.
Решения упражнений к главе 4 413 Получающиеся при этом коэффициенты CA{Q\ Чч)сА’ которые уже были вычислены в части (Ь), позволяют неревыразить состояние в запутан- ном базисе системы АС. MeIQ, р)ли = / dlic{4\v}c\q)c х —L= [dq'elP<! |g%|g' 4 Q)B = J у2тг J = ^/ dqdq’dQ' dP' c{q\^}c^P4‘ x x IQ'- ?’>сл ca(<?' Р'\Ъ ® l<?' + Qh = - I dqdq' dQ1 dP' сШ}с^' x xc lP q6[Q' — (q' g)]|Q', P‘}ca ® I/ + Q)b — = l dqdQ'dP'^ce^'^1^ X xIQ ? ? )ca ® 1*7 + Q A-Q}n- С этого момента Алиса выполняет измерение в запутанном базисе АС, по- лучая некоторое состояние )Q', Р')с;д. Результирующим состоянием Боба является |Bob) = j dq (;{q\‘il>}ce.tP(^'"'dp~p'^\q Q' Боб имеет почти все, что ему необходимо. Если Алиса посылает ему ре- зультаты своего измерения (Q', Pf), то он может применить параллельные переносы координаты и импульса: D(g) — е‘9Р = у dq'tf + qM D(p) - е-,рч - чтобы преобразовать свое состояние |ВоЬ) в то, в какое ему нужно. Прове- ряя состояние Боба, мы видим, что он должен применить к нему D(—Q' — - Q) и П(Р - Р'). Однако выполнение этих сдвигов1 оставляет состояние Боба с общей фазой егР® , Конечно, она не имеет физического значения, 1 Именно в этом порядке, сначала D( — Q’ — Q), а затем £>(Р — Р'). Прим ред.
414 Решение упражнений но если угодно, то можно избавиться и от нее, применяя операторы сдвига в специальном порядке. Сначала заметим, что D(p)D(g) -- f dq’rdq'e ^''\q!t)(q"\q> + q}(q'\ - - У dq>e-^'e-ip‘!\q' + q) (</| = - e ™ j dq/^!e-^’\q' + q){q'\q//)(q,>\ = = £-'₽7D^)D(p). Используя этот результат, мы видим, что применение к состоянию Боба /Bob} оператора U = DHP')D(-Q')D(P)DbQ) = = e-p3'D(P - P')D(-Q' - Q) восстанавливает' состояние \ф): P|Bob} - У dqctq^ce^'+'^-^e 1РС1' X xD(P - P')D(-Q' - Q)|q + Q' + Q}B = = / dqdqMce^-^^P-P1)^^ - У dqc(q\^c^p-p^e-^-^g^ = J dqc{q\^}c\q)B = = Wb' Итак, протокол, которому должны следовать Алиса и Боб для телепор- тации с помощью непрерывных переменных, выглядит следующим обра- зом: 1) Готовится запутанное состояние \Q,P}AC. 2) Алиса измеряет (Q\ Р') в запутанном базисе системы АС.
Решения упражнений к главе 4 415 3) Алиса посылает Бобу результаты своего измерения (Q', Р1). 4) Боб применяет оператор D(—Q')D(P)D(—Q) к своему состо- янию. В итоге он имеет состояние |^>)в. 4.4. Телепортация со смешанными состояниями а) Мы знаем, что если Алиса и Боб поделили синглет, то они могут осуще- ствить телепортацию с идеальной точностью воспроизведения. Если вме- сто этого Алиса и Боб нечаянно разделили смешанное состояние, то вы- полняемое Алисой измерение Белла ничего не говорит об ее состоянии (следовательно, у нее нет классической информации, которую необходимо послать Бобу), а состояние Боба никак не коррелирует с состоянием Алисы. В этом случае лучшая стратегией Боба состоит в угадывании, которое, как мы показали, имеет точность воспроизведения 1/2 Так как данная в задаче матрица плотности может рассматриваться как ансамбль этих альтернатив, имеющих вероятности (1 — А) и X соответственно, то полная точность вос- произведения телепортации с помощью этою состояния равна Р-1.(1-А) А. Ь) Эта точность воспроизведения больше, чем 2/3, при А < 2/3. с) Очень похожие спин-спиновые корреляции рассматривались в задаче 2,5. Вырезая и склеивая ее фрагменты, я воспроизведу здесь (с небольшим из- менением) решение. (Более детальное изложение смотрите в решении за- дачи 2.5). Р = trA + ® + х х (А1ав + (1 _ A)|^){V--|)] = = trB trA [(i-A + П • <TA) ® (1в + rn • <TB)j I- + ~fA trH trA [(1-A + ” <?a) ® (Ijg + тп - [1a®1b] + ^4^(^ 1(1д 1-й <тл)®(1в I т-<тв)|^’) -
416 Решение упражнений I + —р- + lft °А -I 'п <*в Н « <4 & т ав|v’ ’) = 4 + ’Ц^[™'^~1^1^“) + т-} + + (V'-|”-• <^л‘8> w <тв|^^)^| = = | + ^=^(яГ|пч7д<»П! = d) При А = 1/2 вероятность того, что спины Алисы и Боба коррелированы, равна р — j — |п • т. Очень естественным предположением относитель- но порождающего згу корреляцию распределения вероятностей скрытых переменных выглядят /д(а п) = | + а(а п), fB(n т) - | + Ь(а т). Этот вид подсказывается взаимно-однозначным соответствием между про- екторами на сфере Блоха и единичными векторами на S1. Он автома- тически порождает индивидуальные распределения наблюдаемых Алисы и Боба. Для того чтобы воспроизводить квантово-механические спин-спи- новые корреляции между Алисой и Бобом, а и Ь должны удовлетворять условию / /д(а п)/в{а • т) - | У(а • п)(а гп)Ж ~ а 1 . ab ( 4тг\ - - — Т + ГГ ( ТГ ” ' т — 4 4тг \ 3 ) ~= + iftfecos# => 'ж ^а6 = ~1- Для того чтобы fA и fB действительно были распределениями вероят- ностей (то ест ь принимали значения в [0,1 ]), должны выполняться неравен- ства |«| 1/2 и |6| < 1/2. Но, согласно неравенству Шварца, это означает;
Решения упражнений к главе 4 417 что |«!»| < |а| jt>| < 1/4 < 3/8 (!), Таким образом, этой простой модели нс достаточно — квантовые корреляции слишком сильны, чтобы моделиро- ваться наивной теорией скрытых переменных. Чтобы добиться сильных корреляций, рассмотрим разрывные функции распределения вероятностей /А(б п) = + asignfd n). fB(a m) - + b(a • n). Очевидно, что эта новая теория по-прежнему воспроизводит индивидуаль- ные распределения Алисы и Боба с = {/в) — Чтобы вычислить их интеграл спин-спиновых корреляций, запишем 6, п и т в конкретном базисе: d = х cosy> sin О -I у sin р sin О I z cos 0, n — z, m = x sini/ + z cosy?. В этом базисе корреляционный интетрал имеет вид У/д(а "’) ~ 4 1 4“ rn)sign(d-n)<fl’2 cosр sin 0 sin tl> + cos# cosi/)sign(cos#) 0 cos# — у d(cos#)cos# -i “ I+ T COK V> 1 . ab 1,1 1 , ab „ , +-co&v 5 । 2 = Русову. Это соответствует предсказанию квантовой механики при ab — — 1 /4, что выполняется, например, при а — 1/2, b —1/2: {1, d п О, О, d • п < О, /3(d- т) = |(1 - а • т).
418 Решение упражнений 4.5. Распределение квантовых ключей а) Решение первой части этой задачи в целом совпадает с решением задачи следующей главы 5.2(b). Как там показано, ограничение собственных чи- сел оператора Fi?A- неотрицательными значениями накладывает верхнюю границу на возможные значения А. Я приведу здесь доказательство: / I - 2А О А о 1 - 2А ) (cos2 а cos a sin а + а( sin2а \ cos a sin а cos ct sin а+ < ? sirr а cosct sin а cos2 а 1 - А 2 A cos a sin а 2Acosa sin о 1 - А Характеристическое уравнение имеет вид: О — А2 — A tr + det FDA- ~ - А2 - 2(1 - А)А + (1 - А)2 - 4А2 cos2 a sin2 а А = 1 - А ± ^/(1 - А)2 - (1-А)2 + Л2 sin2 2а - — 1 А ± A sin 2а. Из условия неотрицательности собственных чисел А 0 следует неравен- ство: 1 ± sin 2а' Поскольку 0 < о < тг/4, ограничение положительности может быть пере- писано как О А ---------1——, 1 +- sin 2а Если Алиса делает равновероятный выбор из {|«),|о)}, то матрица плотности Боба выглядит как р = 4 |v)(v|). Следовательно, веро- ятность получения результата DK: Рок ~ tr(pFDK) — 1 / 1 sin 2ct \ / 1 - A A sin 2a \ _ r 2 \ sin 2a 1 / I A sin 2o 1 A I ~
Решения упражнений к главе 4 419 = 1 — А 4- Л sin2 2а — = 14 A(sin2 2а - 1). Для того чтобы минимизировать рГ)К, мы должны выбрать максимально возможное значение А, а именно: А = 1/(1 4- sin 2а). Тогда вероятность того, что Боб не знает, что послала Алиса: sin2 2а - 1 1Г)К г 14- sin 2а Ь) Наиболее естественный способ построения распределения квантовых ключей вокруг источника Алисы и ПОЗМ Боба представляет собой неболь- шую модификацию схемы ВВ84 с целью адаптировать ее к ПОЗМ. (См. раз- дел 4.2.2 в лекциях.) Алиса случайным образом готовит состояния, а Боб измеряет их с помощью своей ПОЗМ. Затем он открыто объявляет, как только узнает, что послала Алиса. Конечно, он не распространяется о том, что он открыл, а только о том, что это ему известно. При идентифика- ции |п) = 0, |щ) = 1, Алиса и Боб теперь имеют безопасно разделенную строку случайных битов, с помощью которой они могутъ выполнять шиф- рование (используя одноразовый протокол). Конечно, прежде чем ее ис- пользовать, им также будет необходимо провести коррекцию ошибок и сек- ретное увеличение их строки, чтобы свести вероятность подслушивания к тому уровню, при котором они будут чувствовать себя комфортно. Однако эта «пост-обработка» их строки представляет именно то, что они должны были бы сделать, осуществляя стандартный протокол ортогональных со- стояний ВВ84. с) Вмешательство Евы вызовет лишь ошибку, когда Ева перехватывает по- сланное Алисой |«) (|«)), Бобу передается неправильное состояние ]») (|и)). Для любого посланного Алисой сигнала это происходит с вероятностью sin2 а. [Эта симметрия имеет место благодаря тому, что для выполнения своего измерения Ева выбрала в качестве базиса векторы (д), (°), относи- тельно которых |гб) и |») повернуты на один и тот же угол а по и против часовой стрелки соответственно.] Имеется два способа описания влияния Евы на скорость появления ошибки, которые лишь слегка различаются в семантике, но дают различные численные результаты. Первым способом описания ее воздействия являет- пусть Боб имеет «убедительный» результат, веро- ятность того, что он отличается от посланного Алисой, равна sip3 а.
420 Решении упражнений Но поскольку нам известно, что Боб получает «убедительный» результат только с вероятностью 1 - sin 2а, можно также сказать: отнесенная к измеряемому Бобом состоянию веро- ятность того, что оно не может быть использова- но в качестве правильного ключевого бита, равна (1 - sin 2а) sin2 а. Оба этих ответа могут быть полезными. Первый описывает, что Ева испортила часть ключа. Второй описывает, сколько еще необходимо Бобу выполнить измерений, чтобы получить ключ той же длины, что и раньше. Если Алиса и Боб готовы пожертвовать некоторой частью своего ключа, чтобы обнаруживать любые гнусные делишки Евы, им следует выбрать а, максимизирующее последнее выражение, чтобы было как можно легче об- наруживать се вмешательство. А именно им следует выбрать а = тг/8. Всякий раз, когда частота скорость ошибки их протокола будет превышать (1 - sin 2а) sin2 а, они будут подозревать неладное. Точный смысл поставленного в этой задаче вопроса состоит в рассмот- рении влияний на убедительные результаты Боба. Следовательно, фактиче- ски первое выражение из приведенных выше следует представить как вли- яние Евы на протокол. 4.6. Минимальное возмущение Алиса случайным образом (с равной вероятностью) готовит одно из двух возможных состояний: или cosa|0)-f sina|l), иля jy’)=s*iia)O) + -f-cosa|l). В части (d) упражнения 2.1 мы нашли, что оптимальная ПОЗМ, различающая эти два состояния, состоит из проекторов |0)(0| и 11) (1|. Пусть Мо = a с произвольными нормированны- ми векторами |<£0) и |0j). Это операторы измерения для реализации опти- мальной ПОЗМ, различающей приготовленные Алисой состояния: mJm0 = |О>(^о(ф0)(О| - |0)(0|, Если Ева выполняет это измерение до того как состояние достигнет Боба, то, в зависимости от того, посылала Алиса или |^), он получит одно из состояний: р' - = со82а|с>0){ф0| +sin2a|01)(^1|, г р' = = sin2 сф0)<ф0| 4 cos2 |.
Решения упражнений к главе 4 421 Ева хочет минимизировать «возмущение» _£>=—! - 1(F + F), чтобы максимизировать среднюю точность воспроизведения получаемого Бобом состояния. а) Мы можем вычислить эти точности воспроизведения: F (vh'lVO = cos2 F = cos2 a(<£o|^<Wo) + F =--- = - siti2 а{ф\ф^{фа\ф} + cos2 ^^^{ф^ф}, F = sin2а(фп\ф){ф\ф0} Pcos2cX<W) Wt>- Тогда, складывая их, получим F + F со82а(^о|^)(^|0о) 4 si^a^jV’XV’l^i) + Т sin2 а(ф()\ф}(ф\ф0} 1 cos'2o^1|^)(v|c'i') = = (ф0 J[cos2 a|^){ф\ \ sin2o|^)(^fj| +- 4 | [sin2 «KWI + cos2 | Ф\ F I F -. ШЛ|<у где . 9 ( cos3 a. sin a cos a A — cos a . .2 \ sin ft COS ft sin _ / (1 - sin2 o) cos2 о \ (1 — sin2 a) sin a cos a (. 7 sin a . sin a cos a (1 — sin2 a) sin a cos a \ 2 2 H sin a cos2 a I sin a cos a cos2 a . 0 \ . 9 3 (1 — cosz tt)sm a sin a cos a . 9 -99 sin a cos a sm a. cosz а 1—2 sin2 a cos2 a sin а cos a sin о cos а 2 sin2 ft cos2 a В = sin2 о cos2 a sin a cos ft sin о cos a sin2 ft q + COS ft . 2 sm а sin о cos ft sin о cos о 9 COSZ Ct
422 PFLIILnitl' УПРАЖНЕНИЙ / sin2 ft cos3 a (1 — cos3 a) sin a cos о A A (1 — cos2 a) sin a cos a (1 — cos2 ft) sin3 о J / si rr o: cos2 a sin о cos3 о A \ sin о cos3 о (1 ~ cos2 a) cos2 ct у' (л • 2 9 • \ 2 sin a cos^ a sin a cos a \ sin ct cos ct I — 2 sin a cosz a J b) Заметим, что Л1 — A, a = В — эрмитовы матрицы, следовательно они могут быть диагонализованы. В части (d) упражнения 2,3 мы нашли, что собственные числа 2 х 2-матрицы можно выразить через их след и де- терминант: А; - 1 (trM ± y/(trM)2 - 4 det AT. Заметим также, что tr.-l — tr В — 1, а det Л — det В, так что эти матрицы имеют одинаковые (вещественные) собственные значения. Пусть {Aj} и {|ctj)} - собственные значения и соответствующие им собственные векторы матрицы А. До тех пор пока А несингулярна (то есть det Л 0), мы можем разлагать ^0) = Сг,(пс)+< j |а.] )* в собственном базисе. Тогда мы можем вычислить (<?и|А|0о; -- (c(*{a0| t c](ai|) ^2 I"''A'ИG‘ol"n) + <’1|a1/J. I (<AJA)(£>0) = AqIcJ-' 4- AJcJ2. Это просто взвешенная сумма собственных значений матрицы А. Без поте- ри общности можно предположить, что Ао > АР Тогда мы максимизируем выражение (<р0|Л|<(>0), выбирая |<р0) -так, чтобы (qj = 1, а —- 0. Мак- симальное значение (Ф0|Л|<2>0) просто равно максимальному собственному значению А. Аналогично оптимальный выбор |^j) сделает выражение равным максимальному собственному значению В (которое совпадает с максимальным собственным значением А). Из предыдущего следует, что Атах = 1(1 + vT^d det Л). Минималь- но возможное возмущение равно: 1 2 ^°Р’-। opt (*?J II12opt) ~
РЕШЕНИЯ УПРАЖНЕНИЙ К ГЛАВЕ 4 423 ^nnn--- •>(’ - VT^TdcrA). Мы можем переписать А через Н. определяемое соотношением cos в — — sin 2о: 1 - 1 hili'’ 2о 1 sin 2а 1 sin 2 а 4 siir 2а. 1 cos (> Toma det А 1 cos2 9 вательно, 4 C.OS4 9 4 соя2 9 . 4 ( cos2 9 - cos1 и, следо- •1 4 4 Пп,п, - \ (1 - У1 - cos2 9 + cos4 9). с) Построим 1рафик функции Pm!n(.rl — 1(1 - i/l - х + J'2), где .г - — cos2 0 Если eosf? = 1, то начальные состояния |ф) и неразличимы То- ща, независимо от того, выполняла Ева измерение или нет, Боб ле может получить никакой информации о том, какое состояние ирш отовлено Али- сой. Это означает, что он не может обнаружить вмешательство Евы, то есть вносимое ей возмущение неизмеримо.
424 Решение упражнений Когда cos# — 0, начальные состояния ортогональны, следовательно, Ева может выполнить оптимальную ПОЗМ в базисе {|0) J1)} и, не возму- щая состояние, узнать, что приготовила Алиса, Если она пересылает его Бобу, то в этом случае измеримое возмущение отсутствует. Именно это препятствует использованию классических (ортогональных) состояний для безопасной связи — как Алисе и Бобу узнать, что их подслушивают? Наибольшее значение Pmin достигается при х = что соответству- £ ет в — arccos — 4 • х/2 4 Это является фактическим выбором состояний схе- мы распределения квантовых ключей (такой как ВВ84), в которой Али- са и Боб хотят создать разделенную секретную строку битов, одновремен- но максимизируя величину возмущения, которое в среднем будет вносить подслушивающий, пытаясь узнагь значения передаваемых битов. Позднее в этом курсе мы еще больше узнаем о квантовой кришо1рафии. ) (ля этого выбора приготовлений мы можем вычислить 4.7. Приближенное клонирование а) Эта машина физичеки реализуема в том и только в том случае, когда она корректно сохраняет вероятности. .Это требует, чтобы отображение было унитарным или аптиунитарным, а из теоремы Вигнера следуют, что на са-
Решения упражнений к главе 4 425 мом деле оно должно бьнь унитарным. Унитарные отображения сохраняют не только вероятности, но и внутренние произведения. Следовательно, до- статочно показать, что машина сохраняет внутреннее произведение, чтобы показать, что опа физически реализуема. До: (1001000) - о, <000|000> -1, (100|100) 1. После: <100^+1/|000) (000|СД[7|000) (100|?7^С/|100) Ь) Переход от унитарного представления к представлению операторной суммы $ выполняется путем отождествления Мм-лС;(р|Г7|б)вг;; где |0) вс — некоторое фиксированное состояние. К данному в усло- вии задачи описанию отображения естественно подходит выбор |0) вс = — |00)вс. В этом базисе необходимые нам существенные слагаемые U имеют вид и = y||000)(000| + у||011)(000| + У||101)(000| | + y/j |111> (100| + ^/||010){100| + У||100)(100|.
426 РЕШЕНИЕ УПРАЖНЕНИЙ Следовательно, операторами представления операторной суммы являются: М00 “ bcWHbc - l/|l°K°l + М1О = вс(10|(/|00)БС = -Д|0)<1|, Мп = вс(1 - y||0)<0| + с) Запись в виде суммы проекторов для матриц операторной суммы позволяет быстро вычислить точность воспроизведения Е даже без явного вычисления р!л: F - WpM = \ • ]Г |(дам2 -- -|И I |Н4 + |И|Ьр- |(Ы2 + Ю2 = |. Этот результат означает, что, имея ресурс двух дополнительных вспомога- тельных кубитов, мы можем копировать неизвестный кубит с точностью воспроизведения 5/6. Действие этого «квантового ксерокса» на входящее состояние отобра- жает его на состояние м _ 1 / 2 О X / |а|2 ab* X / 2 О X ЦО 1 J a*b |6|2 Д О 1 ) + 1/0 0 X / |а|3 ab* X / 0 1 X +6 V 1 О Д а*Ь |Ь|2 До о Д
Решения упражнений к главе 4 427 1 ( ° 1 W |а|2 ab* \ f О О \ + 6 \ О О ) а*Ъ |Ь|2 ) 1 О J + 1 ( 1 О \ ( |а|2 ab* \ ( 1 О \ + 6 \ О 2 ) \ а*Ь |Ь|'2 / \ О 2 J _ 1 ( 4|п|2 2аЬ* \ 1 ( О О \ " 6 у 2а*Ь |Ь|2 ) + 6 \ О |а|2 ) ~ 1 ( l№ О \ 1 ( |а|2 2ab* X _ “ 6 \ О О / + 6 2а*Ь 4j&[2 у ~ 1 ( 5|а|2 + |Ь|2 4аЬ* \ _ 6 \ 4a*b ja|2 | 5|Ь|2 ) ~ _ 1 ( 4|a|2 4afr*\ 1/1 О\ 2 1 d “ 6 I 4a*& 4|bf2 J + 6 I 0 1 J ~ 3WM + gl. Этот квантовый ксерокс действует так же, как и деполяризующий ка- нал ср- 1/4. Следовательно, в части (Ь) мы с полным основанием могли использовать операторы из раздела 3.4.1. 4.8. Прости нас, дядюшка Альберт а) Пусть Sn обозначает оператор (04 h icr2fin + -- гсг2)®п. Из элемен- тарной квантовой механики известно, что <7± = ^(<7! ±г<т2) являются повышающими и понижающими операторами для спина. Следо- вательно, действие Е„ на \у}п имеет вид: =Е„Д(|000...0) 1 = Д [(2a, )®”|000.. .0) + (2а_)®"|111 ... 1))] = 2п Д(|Ш - - • 1Н 1000.. .0)) = Ь) Теория скрытых переменных утверждает, что ет1 и <т2 в любой момент времени являются функциями набора недоступных для нас «скрытых пере- менных». Она утверждает; что наша неспособность узнать эти переменные
428 Решение упражнений заставляет все измерения <т1 и ст2 давать только усредненные по ансамблю этих скрытых переменных результаты. Заметим, однако, что модуль оператора («tj ± г<т2)®п имеет только одно значение для любого возможного распределения значений наблю- даемых <т; и сг2: [(О’! ±«T2)®n| = |(±l)±i(±l)|” =Т^. с) Оператор (<т1 + I- (<7! — i<r2)®n эрмитов и, следовательно, его мо- дуль является наблюдаемой величиной. Теория скрытых переменных пред- сказывает, что се измеряемое значение дается усредненным по ансамблю определенных значений, принимаемых <т1 и <т2. Используя неравенство треугольника для нормы, мы можем ограничить этот модуль суммой вы- ражений, вычисленных в части (Ь). Важность этого ограничения в том, что вычисленные в части (Ь) слагаемые независимы от любого такого распре- деления: |SJ - К^т + ^2)«'‘ + - {<Г1 + ^2|" + ^1 - ^2|” - |х/2|” + |V2[n - d) Эйнштейн сказал бы: Sie haben demonstriert (me auf der Hand gelegen haben sollte), da fl mein Argument gegen Quanten Mechanik mssenschaftlich stichhaltig ist, wed es dutch Experiment falsifizierbar ist. Fur die System? die. n > 2 haben, sind die Vbraussagungen der lokalen versteckten variablen Theorie und Quanten Mechanik offenhar inkompatibel. Lassen Sie uns ein Experiment machen, um zu uberprufen, da fl ich Recht habe1... Под впечатлением экспериментального свидетельства, которое поддер- живает квантовую механику и опровергает теорию скрытых переменных, Эйнштейн бы сказал: Achl Dieses ist wirklich mein grbflter Fehlgriff Es scheint, dafl Gott tatsdchlich Wurfel spielfl. 'Вы продемонстрировали (как это и должно было быгь очевидно), что мои аргументы против квантовой механики научно обоснованы, пока они не опровергнуты экспериментально. Для системы из п > 2 частей предсказания локальной теории скрытых переменных и кван- товой механики, очевидно, несовместимы. Давайте поставим эксперимент. чэобы убедиться в том, что я прав... . 2 Ах! Эю поистине моя самая большая ошибка. Похоже, что Бог действительно играет в кости.
Решения упражнений к главе 4 429 4.9. Манипуляция запутыванием а) Алиса может связать команды с помощью обмена запутыванием. Я опишу этот процесс на языке состояний и языке стабилизатора. Суди- те сами, какой язык покажется вам наиболее подходящим для этой задачи. Язык состояний. Начальным состоянием системы является 1АГ, а2р} = |(|ооШг|%, + |н)л|1Ы1>р + Н03)а10)у|]>р + |10>Ай>г|0>р) = 2v 2 L - I |Ф )а(|0)у|0)р _ Юу Юр) + + |Фт)а(|ФуЮр + Юг |0)р) + + 1*Юа(Ю)уЮр - Юу(О)р)]- Алиса измеряет два ес сос гояния в базисе Белла Затем она посылает одной из команд два полученных ей классических бита. Тогда эта команда вы- полняет одну из следующих операций, гарантирующих, что получающееся в результате 50-кубитовое состояние является кот-состоянием Состояние Действие |Ф+>4 НН А НИ 4 Ничего не делает. Один участник применяет trz. Все участники применяют <тх. Все участники применяют ах Один участник применяет <т2 Язык стабилизатора. Исходным стабилизатором системы является1 'Стабилизаторы — симплектические коды, корректирующие ошибки, рассматриваются в седьмой главе лекций, вошедшей во вторую часть этой книги. —Прим pet>.
430 Решение упражнений Янки (25 кубитов) Z Z 1 1 1 Z Z 1 111 Z XXX X Алиса 1 1 1 1 Святые отцы (25 кубитов) Z 1 X 1 1 Z 1 1 1 1 1 X Z 1 1 1 Z Z 1 1 111 Z XXX X Собственное значение + 1 +1 +1 + 1 +1 +1 +1 +1 1 1 Алиса измеряет ZZ, затем XX, получая собственные значения сераг и aph. После каждого измерения генераторы стабилизатора заменяются только на те генераторы, которые коммутируют с измерением. (Заметим, что произведение двух антикоммутирующих с измерением генераторов коммутирует с этим измерением.) Результирующим стабилизатором явля- ется (для ясности две колонки Алисы сдвинуты влево) Алиса Янки - Святые отцы Собственное значение Z Z X X 1 “par ttpl> Z Z 1 .......... 1 -t-1 1 z z 1 -i 1 z z ... 1 111 ............ Z +1 XXX ............ X aph
Решения упражнений к главе 4 431 Для того чтобы команды разделили кот-состояние, Алиса должна со- общить одной из них собственные значения ораг и aph. После чего эта команда выполняет одну из следующих операций, i аран гируюгцих, что по- лучающийся в результате стабилизатор Янки и Святых Отцов имеет все собственные значения равные +1 (вспомним, что операция А переводит генератор стаби.шзатора М в .4M/V): (opar, Qph) Действие__________________________ ► Ничего не делает. (+1,-1) —» Один участник применяет Z. (—1. +1) —► Все участники применяют X. {Все участники применяют X Один участник применяет Z b) (I) Если Алиса имеет вспомогательный кубит... Имея вспомогательный кубит, Алиса может оставить команду в неко- тором смысле в ю.м же положении, что и в части (а). Снова я опишу сс действия на языке состояний и языке стабилизатора. Язык состояний. Алиса готовит свой вспомогательный кубит в состоянии ил—аонж Следовательно, начальным состоянием системы является И1ЛП - |(|00>А|0)у + + +|01)А|0)у + (Ю)А|1)У) = = —[|ф+ ) д(|0}у + |1}у) + 2v L + l^h(|O)y-|I)y) + +|ф+Ы10)у + |1М- -|ф->д(|о>у - |1)у)]- Алиса измеряет два ее состояния в базисе Белла. (На самом деле ей нужно измерить только бит фазы.) Затем она посьыает результат измере- ния оставшейся команде. Тогда эта команда выполняет одну из следующих
432 Решение упражнений операиий, гарантирующих, что получающееся в результате 24-кубитовос состояние является кот-состоянием: Состояние 1ф')а> |Ф")а Действие —► Ничей) не делает. —> Один участник применяет <тг Язык стабилизатора Алиса готовит свой вспомогательный кубит в соб- ственном состоянии X — +1 1 Начальным стабилизатором системы явля- ется Алиса Янки (24 кубита) Собственное значение X 1 1 1 +] 1 X X X +1 1 Z Z 1 +1 1 1 Z 1 ‘1 11 1 Z +1 Алиса измеряет XX на ее двух кубитах, получая собственное значе- ние а Новым стабилизатором является Алиса X X X 1 Янки (24) Собственное значение 1 Z Z 1 1 1 Z Z 1 1 1 1 Z X X X X а + 1 +1 +1 -1 +1 Алиса сообщает свое собственное значение а оставшейся команде, ко- торая выполняет одну из следующих операций, гарантирующих, что иолу- *То есть в собственном состоянии оператора X с собственным значением -|-3. Прим peri
Решения упражнений к главе 4 433 чающийся в результате их стабилизатор имеет все собственные значения, равные +1: си Действие | I —> Ничего не делает, —1 —и Один участник применяет Z (П)а если она не имеет вспомогательного кубита. Даже если Алиса не имеет вспомогательного кубита, прицеплявшегося выше, она no-ирсжисму может покинуть команду. Снова я опишу ее дей- ствия (на обоих языках). Язык состояний. Начальным состоянием системы является = I [(!0>а + 11)л)(|6>у + 11}у) + (|0)а - 11>а)()О>у - 11}у)] - Алиса измеряет сгг на своем спине и посылает результат оставшейся команде Эта команда выполняет одну из следующих операций, гаранти- рующих, что получающееся в результате 24-кубитовое состояние является кот-состоянием: Состояние Действие | ТЖ)А —* Ничего не делает. I-1г)а —* Один участник применяет <тг Язык стабилизатора. Начальным стабилизатором системы является Алиса Янки (24 кубита) Собственное значение X X X ... X +1 Z Z 1 1 +1 1 z z 1 +1 1 1 1 Z Ч
434 Решение упражнений Алиса измеряет X на своем кубите, получая собственное значение а, Новым стабилизатором является Алиса Янки (24) Собственное значение X 1 Z Z 1 1 1 Z Z 1 1 : : 1 1 1 - - Z XXX X Алиса сообщает свое собственное значение а оставшейся команде, ко- торая выполняет одну из следующих операций, гарантирующих, что полу- чающийся в результате их стабилизатор имеет все собственные значения, равные +1: о Действие 1 1 —> Ничего не делает. -1 —* Один участник применяег Z Решения упражнений к главе 5 5.1. Различимость неортогональных состояний В отсутствие какой-либо предварительной информации, мы (как правовер- ные бейесиане) должны предположить, что с равной вероятностью Алиса готовит одно из состояний |н) и |г). Пусть во всех частях этой задачи определены следующие случайные переменные: А = состояние, которое готовит Алиса. В = результат, который получает Боб. Пусть для краткости В принимает значения 1,2 или 3, соответствующие применяемому Бобом «мерительному оператору, а А принимает значения и и v, соответствующие приготавливаемым Алисой состояниям. В каждой части этой задачи мы должны вычислить следующие величины1 | (w|E,1w) |2 (ортогональное измерение) |(w|Fjw)|2 (ПОЗМ) 'Конечно, учитывая сиять J(B;A) = 1А‘,В} — В (A) — If(AjB), вместо этого для вы- числений можно выбрать и Н(А). p(»|w) =
РЕШЕНИЯ УПРАЖНЕНИЙ К ГЛАВЕ 5 435 П(В\А) - У^р(а, b) logp(6|a) =- a>b - ^p(b\a)p(a) logp(t>|a). 11(B) - ^p(a. b) logp(b) = л, b - - 52p(i>|a)p(a) log I ]>2р(Ь|с)р(с) j , a»b \ c J I(B,A) = 11(B)-II(B\A). а) Результатом исходной «фон неймановской» стратегии Боба является приобретение следующей информации. Вероятности: р(1|п) = 1, р(2|и) = 0, р(«) = pUIO = cos2 p(2]v) -= sin2 |, p(n)^|. Условная энтропия: H(B\A) = cob2 log (cos2 | sin2 | log (sin2 |Y w £ \ a 1 £i \ “ / Энтропия Шеннона: B(B) = -~ (1 1 cos2 Y) log [1 (1 +cos2^ - sin2 | log ( j sin2 Взаимная информация: 7(B; A) = 1 • | (1 1 cos2 log (1 + cos2 i cos2 log fcos2 = -1-1(1 I cos2 s I я, I------ I, А У v+^V где H<i(x) — —x Jogx - (1 -x) log(l - x) — бинарная функция энтропии.
436 Решение упражнении b) Осуществляя более симметричное измерение ПОЗМ, Боб рассчитывает увеличить приобретение информации. Фактически мы находим, что, посту- пая так, он на самом деле уменьшает приобретение информации. Вероятности; р(1|«) = О, р(2|ц) — Asin'2 р(3|«) = 1 — А 4 A cos2 р(2|«) О, p(l|tr) Asin2 j?(3|v) — 1 — А |- A cos2 Р('«) = Условная энтропия: Я(/?|А) — Li sin2 log ^Asin2+ I И - А + A cos2 |)logfl-A + A cos2 Энтропия Шеннона: Я(В)- Asin21 log (| A sin2 £ \ Lt £ 1 — А + Acos2 1 log f 1 - А 4- A cos2 Взаимная информация: Цв;А) - - Asin2 ( log | 4 — A sin2 1 - A I A cos2 ~ j log 1 Чтобы найти А, мы используем требование положительности F3, а именно F3 имеет положительные собственные значения: А2 — A tr F3 + det F3 — 0. =s> A — 1 A ± A cos -, A 0, A 4 --------------77-- 1 ±cos 6/2
Решения упражнений к 1 лаве 5 437 При О G [0, тг] таким наибольшим А, при котором оба собственных значе- ния остаются положительными, являйся А — ----1---- Следовательно, 1 + cos 0/2 максимальное приобретение информации равно 1{В,А) - 2 sin2 | = cos с) В последней отчаянной попытке Боб возвращается к измерению фон Неймана, которое «выявляет различие» между |и) и |v). Эта схема действи- ге,п>но оказывается наилучшей. Вероятности: p(l|u) = cos2 р(2|и) - sin2 ( д р(«) Условная энтропия: Н(В\А) = - sin2 ( 1- cos2 Энтропия Шеннона: Я(В) = - Взаимная информация: p(l|v)-sm2 ( р(2|г0 - соя2 ( + рк) - 9 4- 7Г А । f • 2 f 9 + тт\\ , 4 J10g (jln 4 ) J h + кА . ( 2 f 9 + 4 jbg^cos2^ 4 Jjj. >log 2 + 2 log 2 Г(В;А) - 1+sin2 2 f 9 -p 7! + C°s2^ 4 — J - Hi ^cos2 r\ 1 f . 2 {0 +7r\\ 1 log 1 sin2 1 1 1 + \ т ( 2 ( $ “Ь A *\ -Hog (cos 1 —4— H - Й + л \ \ 4 ) ) ’
438 Решение упражнений d) Несмотря на то что в условии задачи не было раздела (d), в ее кон- гексте полезно рассмотреть границу Холево, если, конечно, мы увере- ны в разумности результатов, полученных в предыдущих частях этой за- дачи. Граница Холево утверждает, что приобретаемая Бобом информация ограничена сверху доступной информацией источника Алисы Асс(£) - = S(p) — ^Pz^Px)- Поскольку оба сигнальных состояния Алисы являют- X ся чистыми состояниями, доступная информация сводится к энтропии фон Неймана, которую мы можем вычислить путем диагонализации: И 1 + cos2 | i cos sin | Z Z ш I COS | sin | 1 -.^2 0 2 Ь1П 9 A2 - A + | (1 + cos2 sin2 — cos2 ~ sin2 4 [д 2/2 2 2 A — ± i/1 — sin2 | ± cos — cos2 | или sin2 , Z Z V Z Z Z Z t: *"1 Таким образом, приобретаемая Бобом информация ограничена условием Г(В; А) sin2 | log f sin2 j - cos2 | log f cos2 | j = /cos21 Построив график приобретаемой Бобом информации, как функции для каж- дой из трех схем вместе с границей Холево, мы видим, что наилучшим вы- бором Боба является сратегия (с), несмотря на то, что граница Холево не насыщается. На диаграмме ниже стратегии а, Ь, с и h (для Холево) помече- ны соответствующими кодами азбуки Морзе1 5.2. Относительная энтропия а) Эта задача содежит небольшую трудность, поскольку А и В не обяза- тельно коммутируют между собой. Однако, работая с некоммутирующими объектами, мы можем применить обычный трюк и разлагать все выраже- ния по компонентам обычных коммутирующих чисел. Пусть {10} является базисом, диаюнализующим А, и пусть {|j)J базис, диагонализующий В 1 Коды азбуки Морзе, а • — • b «—s- —с «-» — —hi-* . — Прим пере#.
Решения упражнений к главе 5 439 10' 8- У','/ Z Z 6- //у 4- . ' /УУ ’ •' , “'г 2- ” “ । “---"т----1----— | I ‘ | 0,5 1 1,5 2 2,5 3 Разлагая по этим базисам, мы имеем tr [/(В) - /(А)] - 52м/(В) - У w г J - 52М(В - аЛ'(а<)Ю = tr [(В - A)f'(A)]. t b) Этот результат, подобно многим неравенствам в теории информации, следует из неравенства In х х - 1. Достаточно показать, что д(х) = — -х'1пт является вогнутой функцией, следовательно, вогнутой является и функция /(ж) = у(т)/1п2. Доказательство для у(т): gfa) - д(х)---у\пу -1 xlna: — т/(1пяг - 1пу) Ч (ж — у)1па:- - y in^ - (у - х?)1пт с У (f ~ 1) ~ ~ а:^п:с ~ = (у -z)(-l - In.г) = -- (.У ~ я)Ж); ®(х) — вогнутая функция ==> f{x) *- вогнутая функция.
440 РЕШЕНИЕ УПРАЖНЕНИЙ с) Применяя результаты (а) и (Ь), находим, что относительная энтропия неотрицательна1: tr[—р log р + а log ст] <' tr (р-стЦ-logCT-^ согласно частям (а) и (Ь). Далее, - trplog р + tr ст log ст — trplogCT 4 tr ст log ст, -trplogp С - trplogCT, 0 s-J trplogp - trplogcr, 0 5= 5(р|ст). d) Пусть ст — матрица плотности, совпадающая с единицей в подпростран- стве, являющемся носителем р. К искомому результату ведет выражение неотрицательности относительной энтропии между р и ст в базисе, в кото- ром они обе диагональны: 0 < 5(р|ст) — S[p) - trplogCT, S(p) sS - tr [pJogCTi + ... + pDlogCTp] - -- - (bg tr(Pi I • • + Pul - bgl). e) Используя неотрицательность относительной энтропии между рАВ и рл® рв, находим s(Pae\Pa®Pb) = -^(Рав)-Ьг [рав^Ра ®Рй)] > °> s(Pab) - tr [р4д(1оёрл + lA®logpB)] - - -trpAlogpA - tr р/{ log p£i - Ь’(рд) + 5(рв). f) Рассмотрим матрицу плотности рЛ1, и ее частичные следы, данные со- отношениями Рав = ® (1ез)(ез1)в> 3 Ра ~ Рв = 'Формально, для того чтобы это доказательство было верным, нам нужно показать, что /(а:) является вогнутой при х — 0. (р и er Moiyr иметь некоторые обращающиеся в нуль собственные значения.) Вы можете проверить самостоятельно, что при этом остается вогнутой функцией.
Решения упражнений к главе 5 441 Субаддитивность энтропии этой системы доказывает общую вогну- тость S(p): s(.Pab) < 8(Рл) + S * * * *(Pb)> Если мы берем след по системе В в базисе то сумма по j сводится к одному ее cjiai аемому с i = j. Упростим левую часть (LHS) этого неравен- ства:’ LHS - - tr = — tr ^2xiPi® k»>(eJj iog(\Pi® kiJkil) ~ 4 7 / ^\pt « кЖ1 I (logpi® 1 -I- 1 ® log Аг|ег)(е,|^ > i / J «> kHeJlog (AJeJ(ej) =~ 12Ailei>(eillog(\ki}(ej) г Li - 12 K^pi) -12A’ logAi- i г 1 Здесь в ходе преобразований используется равенство PlogP - Plog(l-Q)--p(Q + lQ2 + lQ» I ...'I \ Z О у = -Pq(i I I + ! + •••) =0, где P — |e){e|, Q = 1 — P — проекторы на нзаимн-j ортогональные подпространства. — Прим, ред.
442 Решение упражнений Подставляя этот результат обратно в неравенство субаддитивности, мы по- лучим условие вогнутости: £ЛЛ(рг) s: S Q2-V*) -^MogA,-, t i \ г J2XtS(Pi) S 5.3. Монотонное ib Линдблада Ульмана Используя некоторые разработанные в задаче 5.2 приемы, мы находим, что свойство монотонности позволяет вывести некоторые очень полезные ре- зультаты. а) Применяя свойство монотонности к состоящей из трех частей системе, получим свойство строгой субаддитивности: 8(Рав\Ра ® Рв) S(Pabc\Pa ® Рвс)> ~8(Рлв) ~ tr [рав 1°К(Рл ® Рв)] ~8(Равс) ~tr [равс 1°£(Ра ® Рве)] > -АРав) + Ара) + •S'(Pb) < ~s(Pabc) 4 5(Ра) + S(pBC), -S(pAB) + S(pB) $ -S(pABC) + S(pBC), S(Pabc) + $(Рв) ^(Рав) + 'S'(pbc)- Ь) Действие супероператора $ на матрицу плотности рА (аА) можно пред- ставить, как вычисление следа по окружению после приведения ею в кон- такт с системой А и совместной с рА (етА) унитарной эволюции: Pab^PaMIAAb)^"1, <7АВ = ^(^А® (НИвР \ ®Ра = tre Рав?
Решения упражнений к главе 5 443 Энтропия фон Неймана матрицы плотности инвариантна относительно унитарной эволюции или присоединения чистого состояния. Опуская для простоты индексы чистого состояния |е} и унитарной матрицы U, мы ви- дим: A’(PabI^ab) = tr [С7(рА ® log (U(pA ® - - tr [^(рА® Н(е|)Г/ 1log(D'(a-A ® = - tr [f/(pA ® |e)(e|)f7*1{71og(pA® |e) (e|)U~2] - - tr [U(pA ® |e)(e|)[T ^logO^ ® )e) L] -- - tr [(pA® (e)(e|)log(pA® - - tr[(pA® |e}(e{)log(<7A g> |e>(e|)] = -= tr(pAlogpA) -tr(pAlog<rA) = = ^(PaI^a)- Вместе с монотонностью Линдблада-Ульмана это дает искомый результат ,-<>(®Ра1®<та С S(PabI^ab) ^(PaI^a)- с) Рассмотрим матрицы плотности, определенные соотношениями Рав = Ра Рх Рх з X Рв = X Относительная энтропия $(рАЯ\рл ® рв) в точности совпадает с инфор- мацией Холево х(£) (длЯ краткости опущены индексы подсистем Л и В): S(Pab\Pa ® Pn)~tr I Y^PxPx® |еж)<еи| 1 log _ \ X /
444 Решение упражнений Так же как и в задаче 5.2 (f), мы можем взять след по состояниям системы В в базисе |ех), сводя суммы по у и z к одному слагаемому каждую: &(РЛв\Рл ® Рв) tr 1 ^jPxPx^S Рх & кг) '/Т-1 + tr 52?гРх ® J°g (pje^ej) ' ~ ~ logp* 4" 4 S I + logp* - - J^p^cpj + $ ^pxpx = X(£). 5.4. ПОЗМ Переса — Вутерса а) Записанные в обозначениях Дирака сигнальные состояния Алисы имеют вид 1<Р1) - I Тк Iva) - I))' М -4(1 TH V3|n)-
Решения упражнений к ] лаве 5 445 Дираковские обозначения позволяют очень быстро выразить состояния — |у,г}1'Р4) (’- — 1,2,3) в базисе Белла: |Ф,> = I тт> = |Ф2> = П-Al)) (| Т) - >/з| !)) = - |(l Ш + 3| Ш-А1ПН1Ш) = - j (2(1 ТТ) I I И)) - (I ш -1 W) - Al W + I хт») = - -А (2;ф+) - |ф-) - 2у'2 V /' 1*3)-|(| П + А П)(| П + А !))- - ±(| ТТ> + 3| Ц) +Aiw + IIT))) = -|ф-) + АфЬ - ^(2|ф+) Матрица плотности, соответствующая приготовлению Алисы, представляет собой одну треть суммы проекторов |Фт><Ф11 |ф2><ф2| |ф3>(ф3| / 4 4 0 0 \ 114 4 0 0 1 8 0 0 0 0 1’ \ 0 0 0 0 / —2 -2\/3 0 \ 1 О V3 з о О 0 0/ р - diag(l/2, 1 /4,1/4.0^.
446 Решение упражнений Возможно это удивительно, что матрица плотности диагональна в ба- зисе Белла. Следовательно, энтропией фон Неймана этого источника явля- ется •S'(p) 2log2 2 (4^4) 2’ b) «Достаточно хорошее измерение» (ДХИ), которым следует пользоваться Бобу, чтобы декодировать сигнал Алисы, представляет собой ПОЗМ, опре- деляемую операторами F4 — G“1/<2|Фг)(‘i’JG-1/2, где G — Зр: / 1 У2 0 0 \ р _ 1 У2 2 О О 1 3 0 0 0 0' \ О ООО/ / 2 —У2 -VG о \ Р = 1 -V2 1 Уз 0 2 о -Уо Уз з о \ О о 0 0/ (2 -У2 Уб О \ ~У2 1 -Уз О Уб -Уз з о О О 0 0/ Оказывается, что эта ПОЗМ в действительности является ортогональным измерением, определяющими состояниями которого служат 4=(|ФУ + С2|Ф-)), |Ф2} = — (У2(Ф+) —)Ф^) -Уз|ф+)'), |Фз> = (У2|ф+) - !Ф-} + Уз|Ф+>), |Ф4) = |Ф~), (для полноты базиса). с) Как и в задаче 5.1, чтобы вычислить взаимную информацию между при- готовлением Алисы и измерением Боба, мы должны начать с вычисления
Решения упражнений к главе 5 447 вероятностей, В общем случае они представляют собой р (Боб измеряет |ФЬ)|. Алиса готовит |ФО)) - (Фа|Рь|Фа) - 1(ФЬ|ФЛ2- Последовательно вычисляя их для каждых а и Ь, мы действительно найдем цитированный в лекциях результат. b а. Поскольку каждая вероятность здесь сводится к одному из двух значений, то нетрудно вычислить приобретаемую Бобом информацию; Н(В) - -[р(1|1) + 2p(l|2)|log i(p(ljl) |-2p(I|2)) -Hog| « 1,585 H(B|A) = -р(1 ]1)logp(l|l) - 2р(1|2) logp(l[2) ss 0,215893, I(B; A) ss 1.36907. Решения упражнений к главе б 6.1. Лилейное моделирование вентиля Тоффоли а) Рассмотрим описанную в лекциях схему, которая выполняет ис- пользуя только компоненты и один бит вспомогательного пространства,
448 РЕШЕНИЕ УПРАЖНЕНИЙ первоначально полагаемый равным нулю Используя конструкцию для вентиля в^4\ мы можем рекурсивно по- строить вентиль (№: Заметим, что, благодаря тождеству = 1, два вентиля во внутренней части последней диаграммы необязательны. Продолжая ре- курсивным образом эту процедуру, мы, очевидно, подобным образом мо- жем исключить все внутренние вентили Тоффоли, получая в результате
Решения упражнений к главе 5 449 ------------------1----------------- Поскольку каждой контрольной линии вентиля (№, исключая ли- нии 1, 2 и 2п — 3, сопоставлен вспомогательный бит, то для реализации этой схемы необходимо « — 3 вспомогательных бита. Далее, поскольку каждый вспомогательный бит является целью двух вентилей fr'"3' (после вычисле- ния необходимо восстановить исходное значение вспомогательного бита) и так как целевой бит вептиля в свою очередь также является целью вентиля то всего для этой конструкции необходимо 2(п—3) +1 = 2п - - 5 вентилей Ь) Описанный в (а) каскад вентилей Тоффоли отображает целевой бит у на У (((<«1 © Ф з3)а:4 ф в3.. ->„_2 Ф s„_.3)zn L Ф у -= [3,3-32:4 . . . Ф 32Х4315 . . ,.тп_1 ф . . . ф Sn_3Xn-l] Фа-1...х„_, Фр - [((((«2 ® ® s3~)x5 © «4 -К-2 ® Зп-3>п-1] Ф*1 . ,.Хп_ j фр, где si помечают вспомогательные биты, ах, - контрольные линии. F ели все вспомогательные биты первоначально равны нулю, то заклю- ченное в квадратные скобки слагаемое тождественно обращается в нуль.
450 Решение упражнений Чтобы нейтрализовать влияние некоторых вспомогательных битов, не рав- ных нулю в начальном состоянии, мы можем вычислить cnaiaeMoe в квад- ратных скобках [•] отдельно и подставить его XOR (то есть [] => [] ф [)) в окончательный результат У Конечно, мы должны быть внимательны к XOR в этом новом слагае- мом «осле того, как восстановили значения вспомогательных битов. Нако- нец, как и в консгрукции части (а), нам нужно восстановить вспомогатель- ные биты, на которые повлияла эта новая схема. Таким образом, модифи- цированный массив вентилей напоминает башни Бробдингнега1 Следовательно, количество вентилей в этом семействе схем равно 2п~ -5 + 2(п-1)-5 = 4п-12. 6.2. Набор универсальных квантовых вентилей а) Используя указание, мы можем записать каждое из преобразований А, В, С, и U в виде произведений трех поворотов. Более того, нам известно, 'Бробдингнег придуманная Джонатаном Свифтом фантастическая страна великанов, в которую попал Гулливер во время своего второго путешествия. — Прим перев
Решения упражнений к главе 5 451 что сопряжение матрицей <тх меняет знак угла матрицы поворота. Чтобы не переписывать всякий раз букву R, я буду обозначать Кг(^) символом Z^, Ry(0) - символом Ye, а <т.г — символом X. Принимая эти обозначения, можно записать А = ZqY^Z., B^Z6YfZ^ C-Z^Z,, U = Z^Y₽Z_>. Подобно этому уравнения связи представляются в виде 1 = Z^.Z^Y.Z^Y^ - Z^Z^A.Z^aY^Z,, ZVY0Z^ =- (ZaYpZJ)X{ZeXXYsXXZv>')X(Z>YfiZt,) - - Z^Z^Y-.Z^Y^. С этого момента у нас два уравнения с девятью неизвестными. Най- ти решение будет большой удачей, не правда ли? Конечно, на самом деле это матричные уравнения, следовательно, имеется самое большее восемь уравнений, связывающих эти переменные, при условии, что ни одно из них не эквивалентно другому. Тем не менее посмотрим, сможем ли мы найти решение для углов, не копаясь в матричных элементах. Непосредственно проверяется, что од- но из решений первого уравнения связи возникает; если соседние матрицы определяют повороты на равные углы в противоположных друг другу на- правлениях, то есть когда углы удовлетворяют условиям ¥> — —А, £ Т р — у = — <5, а = —V. Этот выбор позволяет записать второе уравнение связи в виде ZaY-(e+^Z^Y _fZ2AY J1Z_a — Z^YgZ^,. Выбор a — w согласует друг с другом последние повороты вокруг оси z в обеих частях этого равенства. Тогда Z^ согласуется при дополнительном выборе 7 = р = 0: Z«Y^(Z2a..q = Z^Y^.
452 Решение упражнений Теперь мы имеем три уравнения с тремя неизвестными (прогресс!), которые имеют решение -4 Подставляя их все вместе в матрицы А, В и С, мы находим, что они удовлетворяют условиям А “ Z^V?/2> C-Z.^ *)/2 или в более общепринятых обозначениях: а = ад^/г), в^-«жИН)/2): Ь) Чтобы показать, что вентиль контролируемой фазы Р = diag(1,1, e1Q, eto является однокубитовым вентилем, мы должны показан», что Р — V & W для унитарных матриц V и W. Непосредственной проверкой можно убе- диться в ’Том, что Р разлагается как Р - Z(a) ® 1, где Z(«) = diag(l, е’0). Однако при более строгом подходе мы должны доказать следующее. Матрица Р диагональна, и если она разлагается, то тоже на диагоиашныс матрицы. Более того, поскольку {{Rz(0), 1}|$ G [0,2тг]} образует базис ,ыя диагональных матриц в SU(2), то в самом общем виде разложимая матрица Р может быть записана в виде суммы четырех слагаемых: Р — А, 1 ® 1 + А21 <g Rz(0) + A3R,(9?) «' 1 + A4R2(^) <& Нг(у), где А; € С удовлетворяют условию 152 А( |3 = 1. i Так как Р одинаково действует на состояния |(Ю) и 111), го Аэ — А4 — ~ 0. Аналогично, так как Р по разному действует па состояния |00) и |01}, то Aj = 0 Следовательно, оставшийся коэффициент в наиболее общем случае представляет собой фазовый множитель е”7. Таким образом, Р - e"'Rz(^) ® 1, diag(l,l,4“ eicl) -- 4?diag(C!<4 eW2, с что имеет решение 2р — — <р> — а.
Решения упражнений к главе 5 453 Следовательно, мы видим, что Р действительно разложима, причем р _ е'“/2дг(_а) (g 1 Общую фазу можно включить в состав другого сомножителя тензорного произведения, но, вероятно, самым естественным является упомянутый выше способ Р — Z(a) ® 1: /й- с) Произвольный элемент SV(2) может быть записан как А<тхВсггС, где А, В и С определены в части (а). Следовательно, произвольное уни- тарное 2 х 2-преобразование U € U(2) может быть записано как U = — е’°/2А<тхВ<тхС. Используя полученные в части (а) тождества, мы мо- жем записать контролируемое U как последовательность однокубитовых вентилей и вен тилей контролируемое NOT: 6.3. Точность а) В этой задаче имеются некоторые трудности, поскольку на операторы не наложено никаких ограничений’. В частности, соотношения из условия 'Формально, для того чтобы нормы были определены, мы должны потребовать, чтобы А был компактным, а В ограниченным. [Фактически приводимое ниже решение требует ком- пактности обоих операторов, А нВ. Прим ред ]
454 Решение упражнений задачи справедливы и для недиагонализуемых матриц, для которых мы не можем рассматривать || A||tr как сумму модулей собственных значений А. Например, матрица _ ( ° 1 \ А ДО О J имеет ||A||tr = 1 Тем не менее мы можем добиться успеха, покопавшись поглубже в за- коулках нашей памяти и вспомнив теорему о полярном разложении из ли- нейной алгебры, которая утверждает, что для любой матрицы А существует единственная унитарная матрица V такая, что А= 1Д/А»А, U|A|, где введено краткое обозначение |А| для т/AtA. Это разложение полез- но, поскольку по построению |А| является самосопряженной и, следова- тельно, диагонализуемой ортогональным базисом {|г)} с соответствующи- ми собственными значениями (так называемые сингулярные числа матри- цы A) |aj. Используя это разложение, мы найдем: | tr А| = | tr U|A| | =• 52(г|и|аЛг) < £|(i|U|ai| |0| - • |(i|U|i)| £ ? =£ 52 N = 52<МAlh’> = tr IА| = IIA||tr, i г где мы использовали тот факт, что унитарная матрица преобразует один ортогональный базис в другой, так что |(i|U|i}| < 1. Другую часть этой задачи сложно проверить из-за порядка матриц А и В под знаком следовой нормы. Проще сначала показать, что ||AB||tr < || А|| || В || tr, а затем обратиться к полярному разложению, чтобы получить искомое ограничение. Вычисляя след в базисе, диагонализующем BtB (то есть В^В — = 52 -Мг)(»|), мы находим г ||AB||tr J>||AB||i> ^£|0||АВ||г}| = I I - £ \/|(i||AB||i) |3 <
Решения упражнений к главе 5 455 Е JE iO'iiABiiop - Е ./ЁдавнлонАвп*} = г у j i у J = £ ^il АВРЮ £ У(i|BtAtАВ|0 = I {iiBtAtABp) BW; = . v\| V ЦВЮН v < ^П^Г\/<;1в,ви- IIAII EVf'iB'Bii) = = ||A|| E^= HAJI £<i|vEK> - i i MAllE^V^H) MAHIBIU 1 Как уже I Сверилось, это почти то, что требуется получить, но в непра- вильном порядке! Но мы можем привлечь полярное разложение, чтобы по- лучить правильный порядок. Если положить АВ — U|AB|, то ||AB||tr = tr |АВ| = = tr(ABU-1) - — tr(BU' !А) = | tr(ABU-1 )|. Но согласно нашему первому результату | tr(ABU-1)| [IBU^Ajl^ а согласно второму — ||BU-1A|(tr цви-1!! • IIAIItr - -||B|I^A||tr, то есть |{AB||tr^||B||-||A||tr, что и требовалось показать.
456 Решение упражнений b) Этот результат вытекает из совершенных в части (а) подвигов Геракла ЦЖ - Л»1 = - (а|р|а)| = |(а|р ~ р!«)1 - а а а = - Pl«> sign[(a|p - р|а)] = а “ 52tr [(p~P)|a)H eigri[(a]p-p|a>] = а 12tr [(р - р)|а><а|] sign[(a|p-p|a)] <t 12^P “ P;S’>trl [<aIP “ Pl«)] l«) («I O 11 tr (p - p) 12 sign[(a|p - p|a)]|a)(o| a lip— Plltr 52sign[(a|p-p|a)]|a) (a| if llp-plltr Здесь при переходе к последней строке мы воспользовались тем, что нор- ма оператора, собственные значения которого равны ±1, ограничена сверху единицей. с) Без потери общности можно записать — а\ф} | /3]^), где а./^еС и удовлетворяют условию [о|2 + |/?|2 — 1. Выражая р и р в базисе получим IIР - Plltr = tr {р - р)Чр ~ Р) = = tr У(р - рУ = _ tr J Г1 ~ Н2 ~а^ -trr -1/3|2
Решения упражнений к главе 5 457 - tr -аЗ* 12 -и2. - tr Ы2И2 о О PPPI2 tr \в\2 о О 1/?12 - 2|Я Однако при 0 0 расстояние между состояниями \tb) и |v) II L.'A |.7.\II _ II/1 „Л1„/А ЯЬ.|Д\II — l1-^2 >131 l.sp "1 Ь Таким образом, если 3 /- 0, то А поскольку при в - (J то, используя результат части (Ь), мы находим, что EPtt -PJ IIp-pL < 2|| р) - р)||- а 6.4. Поиск в базе данных в непрерывном времени а) Поскольку гамильтониан Н не зависит от времени, формальное интегри- рование нестационарного уравнения Шредингера дает ЮТ) = е--да7>0). В рассматриваемом случае ро) = |а). Гамильтониан Н ограничивает эволюцию подпространством {р), |s)} с (ненормированным) базисом собственных состояний {|s) + р), |s) - р)}
458 Решение упражнений ' (Представьте, например, сферу Блоха, чтобы убедиться в этом.) Вычисляя собственные значения Н, находим Н(|з> ± |^>) = + |s)(e|)(|S) ± к)) = =- E[|u;)(w{(|s) ± |и>)) + |s>(sK|s) ± И)] - E[(|s> ± Р)) ±2-± |и,»] = -Е(1±2-"/2)[|й)±Н)/ где мы подставили перекрытие (s|w) — 2~п1‘г. Записывая js) — ^(|s) + р)) + — l^'/Л представим состояние системы в момент времени Т в виде |^(Т)) - е-гНТН = = + М) + _ р)) _ ,-ЖГ Чтобы оптимизировать вероятность успешного определения |ш), необходимо максимизировать вероятность р (2. Непосредствен- ная проверка показывает, что значение р — 1 достигается, если фазы соб- ственных векторов различаются на 180°: e-iET(l+2-"/2) _ ЕТ • 2 2 = -ЕТ 2 Г1:' ‘2 4 (2fc 4- 1)тг, Т = (2Л-+ 2Е Очевидно, нам хотелось бы определить |ш) как можно быстрее, поэто- му выбирем k — 0 и получим границу Гровера: гг> _ 7Г 2Е ’ Ь) Можно по.1[учить весьма общую границу квадратичного ускорения по- иска в базе данных в непрерывном времени, подобно тому, как это было сделано для поиска в базе данных в дискретном времени. Фактически мы увидим, что это, по существу, та же самая граница.
Решения упражнений к главе 5 459 Допустим, что мы имеем алгоритм А, который применяет гамильтони- ан Н — Нш + H'(i) к состоянию и спустя время Т со стопроцентной надежностью определяет состояние jw). Так как |ш) может принять любое из 2" различных значений, гильбертово пространство, содержащее резуль- тат вычисления \фт}, должно иметь размерность как минимум 2П. Более того, так как А должен быть способным идеально различать все альтерна- тивы, множество {IV-'т) | IV’-j-) представляет ответ Д(|^о)) = а} должно образовывать ортогональный базис. Теперь рассмотрим (скорее «плохой») алгоритм Р, который пытается определить |<л), путем применения лишь гамильтониана Н — Н'(/) к со- стоянию |^'о) в течение времени Т. Так как мы неявно предполагаем, что H'(t) не имеет определенной зависимости от ш, кажется невероятным, что алгоритм Р будет успешным. Но в то же самое время похоже, что в сред- нем1 результат [фу] алгоритма Д должен отличаться от результата |у?т) алгоритма Р на величину, ограниченную некоторой функцией от Т. («В течение ограниченного интервала времени оракул [гамильтониан] может только увести нас от нашей плохой догадки».) Мы можем усилить наше подозрение, выполнив такой же анализ, что и в дискретном случае: разобьем А на отдельные шаги и определим грани- цу того, как далеко от ]</?t) берется на каждом шаге. (Но теперь шаги инфинитезим ал ьны!) Унитарные операторы, которые применяются алгоритмами А и Р на каждом «шаге времени», представляют собой А : Ш - ЛШП, Р : -» <Ш». Действие А на «плохое» состояние в момент времени t имеет вид = Iv’z) + \Et)> 1ДС = ((1 - iHdt) - (1 - iH'dt) |<pt) - 1 Среднее здесь представляет собой среднее по ансамблю всех возможных значений |си)
460 Решение упражнении Как и в дискретном случае, спустя время Т мы получаем непрерывный аналог уравнения (6.65) из лекций: 1^’т) ~ Iw} + I-^t) + ^ит|Ег_й() + ... ч сШт ... <Д10|К0) — - +e-iHOfrT) I e-mdt\ET^it} + ...+ c^HT\Etl) - =-Iv’t) Ь / e~tHt\ET t)dt^ о т = |^т) — iEУ е lHt|w)(^#T _t)dt = о - ы - = о т -Ы /в~’Н(Т“г)МЯе о Вооруженные этим выражением, мы можем вывести границу для рас- стояния между и |^т). (Аналог «зловещего» уравнения за номе- ром (6.66) в лекциях1.) II IV't) " \‘Ет) II - т О т — Е У || — о т = Е о 1 Подходящее для задания на пятницу 13-го, пе правда .ги?
Решения упражнений к шаве 5 461 Возводя это соотношение в квадрат, находим / т \ 2 II к’т) - 1^т)П2 < 1У j < \о / т I |(w| yt}fdt. о Усредняя этот результат по всем возможным оракулам, мы находим, что, в подтверждение наших ранних подозрений, среднеквадратичное расстоя- ние между конечными состояниями алгоритмов А и Т> ограничено сверху: т 0 __ 1 - 2nJ' К счастью для нас, это среднеквадратичное расстояние также ограни- чено и снизу. Так как состояния {IV’t)} образуют ортогональный базис, они не могут все сколь угодно близко сконцентрироваться вокруг некото- рого определенного фиксированного состояния. В частности, они не могут все сконцентрироваться вокруг |</?г) и, следовательно, среднеквадратичное расстояние между конечными состояниями алгоритмов А и V ограничено снизу уравнением (6.159) из лекций; ±(2-2п-2^. Сравнивая эти верхнюю и нижнюю границы, мы, как и было обещано, получаем квадратичную по времени границу |роверовского типа: Е2Т2 > 2 • 2" - 2л/2". - З"”/2, Т
462 Решение упражнений Поскольку а/2 аз 1,41, а « 1,57, эта общая граница сильнее текущего времени явного алгоритма из части (а) на V2 Это то же различие, что и найденное нами в исходном (то есть дис- кре гном) алгоритме Гровера. Поскольку в дискретном случае более тонкие границы демонстрировали насыщение алгоритма, у нас есть все основания ожидать, что и для непрерывного алгоритма подобное улучшение границы также будет демонстрировать оптимальность.
Прескилл Джон Квантовая информация и квантовые вычисления Том 1 Дизайнер М. Баженова Технический редактор А. В. Широбоков Компьютерная верстка Д. П. Вакуленко, А. В. Моторин Корректор Г, Г. Тетерина Подписано в печать 21.02.2008. Формат 60 х 84,/1(;. Печать офсетная. Усл. неч, л. 26,97. Уч, изд. л. 25,21. Гарнитура Таймс. Бумага офсетная №1. Заказ N»10. Научно-издательский центр «Регулярная и хаотическая динамика» 426034, г. Ижевск, ул, Университетская, 1, http://ahop.rcd.ru E-mail: mail@rcd.ru Тел./факс: (+73412) 500-295 Переплет выполнен в ГУП УР «Ижевский полиграфический комбинат» 426039, г. Ижевск, Воткинское шоссе. 180.