Текст
                    • КИБЕРНЕТИКА >
Ю.И. МАНИН
ВЫЧИСЛИМОЕ
И НЕВЫЧИСЛИМОЕ
Москва «Советское радио» 1980

ББК 32.81. М23 УДК 51—007 Манин Ю. И. М23 Вычислимое и невычислимое. — М.: Сов. радио, 1980. — 128 с., ил, (Кибернетика). 45 к. Книга посвящена доказательству существования невычислимых функций и алгоритмически неразрешимых задач. Обсуждаются проб- лемы оцейки сложности вычислений и алгоритмов. Книга будет полезна широкому кругу специалистов, занимающихся проблемами машинного перевода, искусственного интеллекта, общего использования ЭВМ, 30501-072 М 046(0Т)-80~ 68'8‘ 2500000000 32.81 6Ф0.1 Рецензенты: чл.-корр. АПН СССР В. П. Зинченко, док. физ.-мат, наук И, М. Целом. Редакция кибернетической литературы © Издательство «Советское радио», 1980 г.
ПРЕДИСЛОВИЕ Использование электронно-вычислительной техники свя- зано с возможностью алгоритмического решения задач и эффектив- ного вычисления функций. Между тем в математике широко исполь- зуются функции, заданные неэффективными определениями. Столь же часты доказательства разрешимости задач, например оптимизации, не сопровождаемые алгоритмами их решения. В действительности класс задач, доступных классическим сред- ствам, в некотором трудно уточняемом смысле строго шире класса задач, решаемых алгоритмически. Книга посвящена прояснению смысла этого утверждения, изложению математических моделей вы- числимости, а также некоторых недавних результатов, которые ис- пользуют понятия теории вычислимости, но выходят за ее пределы. Сюда относятся прежде всего идеи А. Н. Колмогорова о связях по- нятий вычислимости и случайности, а также результаты о теоретико- числовых аспектах теории вычислений. Более подробно математи- ческая проблематика книги обсуждена во введении. Скажем несколько слов о том, как книгу можно читать. Прежде всего, для понимания большей ее части достаточно минимальных ма- тематических знаний, но, конечно, необходима некоторая матема- тическая культура. Ее характер примерно определяется соединением привычки к теоретико-множественным понятиям начального анализа (функции, их графики, области определения) и навыков составления простых программ. Основные понятия, приводимые в книге (рекур- сивная функция, перечислимое множество, алгоритмическая разре- шимость массовой задачи и др.), важнее, чем доказываемые о них тео- ремы, а формулировки теорем важнее, чем их доказательства. Хотя в конечном счете овладение понятиями идет и через проработку дока- зательств, знакомство с последними может надолго остаться поверх- ностным. Местами в доказательствах нужны технические сведения из алгебры и теории чисел; все такие места и вообще «кухня» выделены петитом. Глава I книги содержит большую часть основных определений, они тут же подробно прокомментированы. Читая эту главу, можно опустить доказательства в § 4 и 5. Во второй главе по существу дока- зывается одна теорема. Рекомендуется продумать ее формулировку, данную в § 1, доказательства снова можно пропустить. Эта теорема и рассуждение из-гл. III дают некоторый универсальный способ опи- 3
сания любой вычислимой функции, требующий только вычисления значений одного (Г) универсального полинома и перебора. Этот ре- зультат имеет важное принципиальное значение и используется во всех последующих главах, но его доказательство не используется вовсе. Главы III, IV и V вместе, VI посвящены отдельным темам и мо- гут читаться независимо, сразу после второй главы. Последняя гла- ва вообще заметно более специальна и может быть опущена при чте- нии. В ней изложена очень знаменитая и трудная теорема теории групп. Подробнее о содержании остальных глав см. во введении. Различным аспектам теории вычислимости посвящена обширная литература. Читатель, впервые знакомящийся с ней и не желающий вникать в математику, получит удовольствие и пользу из популяр- ных работ В. А. Успенского [91 и Н. А. Криницкого [8L Учебники по теории рекурсивных функций, рассчитанные на профессиональных математиков,—-это книги В. А. Успенского [11, X, Роджерса [2J и А. И. Мальцева [31. Монография А. А. Маркова [41 подробно изла- гает созданный автором подход к теорий алгоритмов, основанный на идее о том, что первичные понятия должны формализовать элемен- ментарные процессы обработки линейных символьных текстов. Тео- рия машин Тьюринга, популярная альтернативная модель вычисли- мости, описана в сборнике [71. Увлекательная книга А. П. Ершова [111 дает живое представление о том, как развивается сейчас теория программирования, не отделимая от запросов практики и возможно- стей ближайшего поколения компьютеров. По поводу тем, кратко за- тронутых во введении, см. две замечательные статьи А. Н. Колмо- горова [19, 201, написанные весьма неформально. Мы совсем не каса- лись в книге задач построения конкретных экономных алгоритмов. Книга [32) — одна, из последних сводок на эту тему. Почти Все нуж- ные теоретико-числовые сведения можно подчерпнуть из книги М. М. Постникова [31]. Остальная литература из списка по тем или иным поводам цитируется в книге. В заключение я хотел бы поблагодарить И. М. Яглома и В. П. Зинченко за внимательное и доброжелательное рецензирова- ние рукописи. Ю. И. Манин
ВВЕДЕНИЕ 1. Алгоритм — это текст, который в определенных об- стоятельствах может привести к однозначному развитию событий — процессу выполнения алгоритма. Фермент, катализирующий спе- цифическую реакцию, устав караульной службы или программа ЭВМ — примеры алгоритмов в этом широком смысле слова. Математика поставляет алгоритмы вычислений и обработки сим- вольной информации, которые являются существенными компонен- тами научной деятельности; языки для записи алгоритмов, их работы и результатов; проекты физических устройств, выполняющих алго- ритмы. Наконец, математика строит теоретические модели всех, этих понятий. Таким теоретическим моделям — математической теории алгорит- мической вычислимости — посвящена эта книга. Она является есте- ственным продолжением книги «Доказуемое и недоказуемое» (М.: Сов. радио, 1979; ниже цитируется как «Д и НД»), но по большей части может быть прочитана независимо от нее. 2. Простейшая, но очень универсальная модель алгоритма по- стулирует, что алгоритм предписывает способ вычисления функции, заданной_на подмножестве целых положительных чисел Z+ и прини- мающей. целые положительные значения. Для одной и той же функ- ции таких способов может быть много. Оказывается, что среди них есть следующий'типовой способ: по любому. описанию алгоритма вы- числения функции у = f (х) можно построить многочлен Р, (х, у; /1( ...» tn) с целыми коэффициентами, такой, что b = f (а), если и только если существуют целые числа Й g Z+ с условием Pt (а, Ь; t°, tn) = 0. Зная Р; и а, мы можем найти b = / (а) перебором .векторов (b, tlt ..., tn) по очереди. Это — основной результат первых двух, глав книги. Путь к нему долог. Первая половина пути состоит в анализе самой идеи детерминированного процесса вычислений; этот анализ приводит к представлению о том, что такой процесс может быть раз- ложен на элементарные шаги из конечного и фиксированного раз и навсегда списка и что функции, вычислимые с помощью итерации этих .шагов, исчерпывают функции, вычислимые любым другим алго- 5
ритмическим способом. Последнее утверждение является естественно- научным постулатом, который не*доказывается математически, но подтверждается экспериментально. Такой анализ связан с именами Тьюринга, Черча, Поста, Маркова, Клини, Колмогорова. Он при- водит к математическому определению рекурсивной функции, ко- торое вводится и изучается в первой главе. Вторая половина пути состоит в математической обработке поня- тия рекурсивной функции средствами элементарной, но очень нетри- виальной теории чисел. Первые идеи здесь были заложены в работах Геделя, Дэйвиса, Патнэма, Дж. Робинсон, а завершающий результат получен Ю. В. Матиясевичем. 3. Реальный процесс вычислений производится над записями чисел, скажем, в двоичной системе. Первый этап работы любой боль- шой ЭВМ состоит в алгоритмической переработке программы, написан- ной на языке программирования, в программу на языке машинных команд. Осуществляющий такую переработку транслятор есть алго- ритм, переводящий символьную информацию в символьную. По- этому в математической теории вычислимости, опирающейся на по- нятие рекурсивной функции, должна найти свое место модель связи между числами и текстами. Такой модели — нумерации Геделя — по- священа гл. IV. Ее основной результат состоит в том, что все эле- ментарные операции над текстом, которые могут лечь в основу про- цессов алгоритмической переработки текстов, превращаются в рекур- сивные функции при любой естественной нумерации текстов. По- этому нумерация позволяет перевести такую теорию на язык рекур- сивных функций. Принципиальное значение этого результата состоит в том, что он открывает возможности вводить разного рода «замыкания вычисли- тельного универсума». Если аргументы и значения вычислимых функ- ций могут быть текстами, то текст, описывающий алгоритм, сам может быть предметом обработки алгоритмом. Далее можно вообразить себе алгоритм, порождающий все тексты, которые являются описа- ниями алгоритмов. Исследование свойств таких универсальных конструкций, в ча- стности эффектов самоприменимости, приводит к обнаружению алго- ритмически неразрешимых математических задач и недоказуемых теорем в формальных языках. Очень общему результату Геделя о неполноте формальной математики посвящена пятая глава, а одной тонкой неразрешимой задаче из теории групп — шестая глава. Теорема Матиясевича из гл. II также немедленно приводит к ут- верждению о неразрешимости одной из знаменитых проблем Гиль- берта. 4. Существование алгоритмически неразрешимых задач и фор- мально недоказуемых истин было первым фундаментальным откры- тием теории вычислимости, если не считать самой системы основных понятий этой теории. Сейчас такого рода результаты продолжают 6
появляться и вызывать интерес: см., например, § 6 гл V, где сфор- мулирована усиленная теорема Рамсея — несложное комбинированное утверждение, невыводимость которого из аксиом арифметики была обнаружена лишь в 1977 году. Но основные тенденции теории вычис- лимости определяются работами, которые мотивированы ее приклад- ными, 'общематематическими и даже общенаучными аспектами. К первому направлению относятся многочисленные работы по соз- данию эффективных, т. е. укладывающихся в, реальные ограничения на время работы и объем памяти, алгоритмов решения конкретных вычислительных задач и теории алгоритмов. Сюда же относятся раз- работки языков программирования и трансляторов, 3 также прин- ципов их создания. Возникающая новая дисциплина — теоретическое программирование — вынуждена при этом работать иногда на самом краю «пропасти неразрешимости», но все же ее главная забота со-, стоит в том, как сделать хорошо то, что в принципе сделать можно. Цели и объем этой книги не позволили нам коснуться этой огромной и важной области Теория рекурсивных функций лишь очерчивает ее самые отдаленные границы. Ко второму направлению можно отнести исследования, связываю- щие теорию вычислимости с более классическими математическими структурами. Так же, как соединение структур группы и дифферен- цируемого многообразия приводит к понятию группы Ли, ко многим математическим определениям можно добавить условие вычислимости входящих в это определение операций или, более общо, конструктив- ности объектов и получить новую версию традиционной теории. Уже построены конструктивные варианты анализа из фрагментов других теорий. Можно надеяться, что предрассудки философского порядка, связывающие эти идеи с устаревшими концепциями «обоснования математики», будут постепенно отходить в тень и общематематическая роль полученных результатов будет осознаваться яснее. Конструк- тивная математика призвана не заменить классическую, а стать ее полноправной частью. В частности, задача характеризации рекур- сивных структур в более обычных терминах, образцами которой служат теоремы Матиясевича (гл. II) и Хигмэна (гл. VI), вероятно, даст еще много замечательных результатов. Пример гораздо менее прямолинейной связи рекурсивности с классической математикой представляют глубокие идеи А. Н. Колмогорова в теории сложности и теории вероятностей, введению в которые посвящена гл. III. Фор- мально говоря, одна из задач, решенных Колмогоровым и его уче- никами, состоит в точной математической характеризации случайных последовательностей. Но по существу Колмогоров сделал предметом глубокой теории интуитивное ощущение того, что степень организо- ванности больших структур (в противовес их случайности и хаотич- ности) проявляется в ходе алгоритмического взаимодействия с ни- ми, далеко не сводящегося к простым процедурам подсчета частот (см. § 3 гл. III). 7
Поэтому теорию Колмогорова [19—21J можно с равным правом отнести к третьему направлению развития идей вычислимости, на- правлению, где теория алгоритмов рассматривается как формали- зованная модель алгоритмической деятельности и алгоритмических процессов в широком понимании. К таким процессам относится, ска- жем, перевод текстов на естественных языках или разворачивание генотипа в фенотип, происходящее в процессе развития живого ор- ганизма. Такая точка зрения на алгоритмы позволяет увидеть неожидан- ные аналогии и постановки задач, заслуживающие обдумывания. Опишем вкратце два круга идей, относящихся к лингвистике и фи- зике соответственно. 5. Язык в широком плане есть структура управляющих воздей- ствий в сложной системе; речь — конкретный фрагмент таких воз- действий. Соотношение, текст 1значение текста подобно не соотно- шению фотография / реальность, а соотношению прюграмма / выдача или программа / вычислительный процесс. В результате многолетней работы над проблемой автоматического перевода выкристаллизовалась одна из значительных общих кон- цепций современной лингвистики: известная модель «смысл <-> текст» (см. [14, 151). В этой модели язык представляется как соответствие между двумя бесконечными множествами: «текстов^ и «смыслов». Элементами первого множества являются тексты на том или ином естественном языке; элементами второго — также тексты, но на искус- ственном семантическом языке, подлежащем конструированию. Со- ответствие сопоставляет каждый естественный текст с набором его возможных смыслов, а каждый смысл — с набором его возможных выражений на естественном языке. Семантический язык в принципе должен быть универсальным по разным параметрам, в частности, не зависящим от исходного естественного языка. Лингвистика есть тео- рия перевода «смысл текст». Перевод должен осуществляться через ряд промежуточных этапов, называемых уровнями представления предложений естественного языка. К этим уровням относятся: фо- нетический (или орфографический), фонологический, поверхностно- морфологический, глубинно-морфологический, поверхностно-синтак- сический, глубинно-синтаксический и семантический. «Каждый из уровней, за исключением, может быть, орфографического, задается своим формальным языком; на каждом из уровней исходное предло- жение имеет формальный образ, называемый представлением предло- жения — фонологическим, поверхностно-морфологическим, глубинно- морфологическим и т. д.» [15, с. 4]. «Модель «смысл <-> текст», таким образом, является инструмен- том, который делает возможным овладение смыслом большого круга текстов на естественном языке. Поэтому представляется заманчивой реализация этой модели на ЭВМ и ее использование для решения за- 8
Рис. 1 дач, возникающих в различных автоматических и автоматизированных системах обработки текстовой информации» [15, с. 51. Разработка детализированной модели — долгое и кропотливое де- ло. Анализ даже простых образцов бытовой речи приводит к доволь- но сложным комбинаторным структурам на уровне семантического Представления (см. рис. 1, где приведено семантическое представ- ление фразы «Косте удалось победить», взятое из [14, с. 67]). В иссле- довании оказываются запутанными проблемы анализа семантики и создания языка смыслов и собственно перевода в обе стороны. Не- ясно, какой максимальный уровень структурированности может быть достигнут и каково происхождение «неалгоритмизуемого остатка»: является ли он следствием исторических случайностей и прихот- ливости естественного языка или есть более глубокие причины его существования Некоторый свет на этот вопрос проливает попытка рассмотреть упрощенные варианты описанной программы как бы модели «смысл <-» текст». В частности, удобно выбрать такую ограниченную область смыслов, чтобы ее семантическое представление имело возможно более простую и фиксированную структуру. Выберем в качестве этой об- ласти «натуральные числа», семантически представляя их последо- вательностями палочек: I, II, III, ПП, ..., История ее представления средствами естественных языков относится к описательной лингви- стике; одновременно она доставляет ценные свидетельства о ранних стадиях математического мышления. В частности, «предматематический» период отражен в следующих чертах системы названий чисел в различных естественных языках.
В некоторых примитивных языках имеются названия лишь для малых натуральных чисел, остальные обозначаются единым словом «много». Так, в папуасских языках Генде, Кати, Каморо имеется два собствен- но числительных 1 и 2, далее до 20 счет идет по пальцам рук и ног, на 20 натуральный ряд «кончается». Разумеется, система {1, ..., 20, много} может быть без труда оформлена как непротиворечивый «ма- лый универсум» математики. Более того, такой и аналогичные нату- ральные ряды заново рассматриваются в одной из школ оснований математики («ультраинтупционизм») на равных или даже преиму- щественных правах со стандартным натуральным рядом классиче- ской математики. Однако нельзя переоценивать значения этого ра- финированного возвращения сознания к архаичным стадиям и отка- зываться от могущественной идеи потенциально или даже актуально бесконечной продолжимости ряда целых чисел. В некоторых языках сохранились разные серии названий числи- тельных для счета предметов разной природы (длинных, круглых, одушевленных, неодушевленных и т. п.). Это свидетельствует о дол- гом периоде формирования идеи о числе как об инструменте, пригод- ном для счета «чего угодно». Сознание Человека довольно долго не было готово к объединению в один «класс эквивалентности» произвольных (хотя бы и малых конечных) равномощных множеств; эта же идея в применении к бесконечным множествам стала достоянием матема- тики лишь после работ Г. Кантора. Следы таких разных типов счета сохранились в современном китайском языке, где хотя и имеется единая система числительных, но она дополняется развитой системой счетных частиц, употребляемых с существительными разных классов типа kuai («кусок»), ge («штука»), ben («корешок») и т. д. В ряде языков отмечается различие корней, от которых образуют- ся соответствующие порядковые и количественные числительные (ср. uno/primo, duo/secundo в латыни). В этих свидетельствах можно усмотреть весьма раннее зарождение идеи порядка ( в отличие от идеи количества), оформившейся в качестве самостоятельного матема- тического понятия удивительно поздно («кардиналы» и «ординалы» Кантора и структуры порядка Н. Бурбаки). Первые дошедшие до нас тексты (Вавилон, Египет) отражают уже картину развитых математических знаний, в частности, зарождение языка математических обозначений, достаточно четко отдаленного от естественного языка. Основное место в нем занимает система обозна- чений чисел и операций над ними. Предыстория позиционной системы обозначений современного типа основана на идее счета все более круп- ными единицами. Эти единицы могут быть степенями одного и того же числа (основание позиционной системы), но это не обязательно. Так, в хронологической системе майев единицы счета суть 1, 18, 360 и далее 18, 20 (ср. следы архаического счета двадцатками во француз- ских числительных типа quatrevingt six). Число единиц очередного разряда обозначается специальным символом, который в начале 10
может зависеть и от номера разряда (у египтян, греков, римлян). Когда этот символ перестает зависеть от номера разряда и последний определяется лишь положением символа в цепочке, для недву- смысленного прочтения записи становится необходимым символ нуля. Его появление задерживается довольно надолго; к концу вавилонской традиции отсутствие единиц данного разряда отличается нулем лишь в середине записи. Идея о том, что символ нуля является не просто знач- ком, но обозначением самостоятельного числа, имеет еще более позд- нее происхождение и приписывается индусам, у которых она была заимствована европейской математикой под арабским влиянием. Сама позиционная запись содержит уже зачатки теории алгебраических операций над числами: прочтение записи требует умножения единицы очередного разряда на число этих единиц и сложения результатов. Правила выполнения действий над целыми числами в позиционной записи были даны аль-Хорезми*1, имя которого фонетически трансфор- мировалось в современное слово алгоритм. На этом уровне система названий чисел в естественном языке перестает быть лингвистическим материалом: «тысяча девятьсот во- семьдесят четыре» есть собственно название десятичной записи 1984, а не числа, изображаемого этой записью, т. е. некоторое вторичное яв- ление. (Число 1000 в двоичной записи психологически трудно про- честь, «восемь» воспринимается сейчас скорее как имя цифры, чем имя числа.) Поэтому откажемся от рассмотрения наименований чисел в естественном языке и попытаемся представить себе характерные черты любой мыслимой системы наименований: десятичной, двоич- ной или даже не обязательно позиционной. Очевидно, минимальные требования должны быть такими: наименования должны быть конеч- ными текстами; способ восстановления числа по наименованию дол- жен быть вычислимой функцией, т. е. задаваться алгоритмом. Если бы дело этим ограничивалось, нечего было бы заменять наименования I, II, III, ... другими. Позиционная система реализует фундаменталь- ное открытие: число N можно занисать~1о§М знаками вместо палочек: даже очень большие числа имеют короткие записи. Смысл записи воплощен в алгоритме ее переработки в последовательность палочек. Правила аль-Хорезми суть алгоритмы переработки записи двух чи- сел в записи их суммы и произведения. Но тогда в качестве модели системы наименований чисел мы можем взять любую вычислимую функцию f от натуральных чисел (вспом- ним, что тексты можно заменять их номерами Геделя , принимающую все натуральные значения. Оставив в стороне вычислимость операций, сосредоточимая, на идее экономии: нас интересует функция f, такая, чтобы имя п каждого числа N, т. е. значение аргумента f, для которого Хорезми, Мухаммед бен Муса — узб. математик и астроном IX в. Автор арифметического трактата, алгебраического труда «Книга о восстановлении и про- тивопоставлении» и др. (Прим, ред.) 11
f (n) = N, было настолько малым, насколько это вообще возможно (в двоичной записи числа «1О10"10 (1000 раз)» очень много бит, но мы сумели записать его совсем коротко. См. также сведения о функции Рамсея в § 6 гл. V). Как доказал А. Н. Колмогоров, такие функции f существуют и могут быть построены явно: каждая из них позволяет назвать число А настолько коротким именем, насколько позволяет любая другая система наименований^, возможно, с потерей некоторого числа бит, зависящего от f и g, но не от Л/. Однако это условие оптимальности неизбежно влечет за собой следующие свойства функции /. В любой оптимальной системе наиме- нований а) Каждое число имеет бесконечно много наименований. б) Не все целые числа п являются наименованиями-, функция f лишь частично рекурсивна, но не общерекурсивна, и не может быть продол- жена до общерекурсивной. в) Восстановление числа по его наименованию в оптимальной си- стеме требует работы сложного алгоритма', оптимальные функции строятся с помощью универсальных вычислимых функций, которые в не- котором смысле настолько сложны, насколько это вообще возможно. г) Проблема отыскания по числу его наиболее короткого наимено- вания алгоритмически неразрешима-, анализ большого числа на предмет обнаружения структурированности, позволяющей назвать его ко- ротко, есть творческая задача: Сопоставим этот список свойств оптимальной системы наименова- ний чисел со следующими свойствами естественного языка: А. Обилие синонимии: каждый смысл может быть выражен огром- ным количеством текстов на естественном языке. (Для фразы «Смит не сумел перевести этот текст только из-за того, что в нем оказалось много специальных терминов» по оценке [141 имеется более миллиона перефразировок.) Б. Открытость языка: на каждый момент времени не все грамма- тически правильные тексты осмыслены. (Эта краткая констатация нуждается в тщательном обсуждении. В модели «Смысл «-> Текст» полагается, что любой правильный текст может быть переведен в правильный текст на языке смыслов, но среди последних есть «бес- смысленные» в неформальном понимании этого слова: интересующая нас категория, стало быть, переводится на другой уровень.) Эта открытость естественного языка является исключительно важным резервом его творческого использования не только в поэзии и фи- лософии, но и в науке. Для выражения вновь возникающего смысла может быть использован ранее неосмысленный текст («волна вероят- ности» в квантовой механике или более прозаический «пакет молока» . Еще интереснее факты рождения нового смысла из ранее неосмыс- ляемых, хотя и грамматически допустимых языковых выражений (поэтические метафоры; континуальные интегралы Фейнмана). 12
В. Перевод «Текст *-* Смысл» требует многоступенчатой рабо- ты системы сложных алгоритмов, выявляющих огромную структури- рованность языковых конструкций. Г. Во всех разработках перевод «Смысла Текст» оказывается еще гораздо более трудным, чем обратный. Сопоставление свойств а) — г) и А. — Г. показывает их удиви- тельный параллелизм. Это побуждает высказать гипотезу о том, что многие черты естественных языков, обычно относимые за счет исто- рических случайностей, хотя бы частично отражают свойства эко- номичности языка: его возможности кратко выразить сложный смысл, который такое выражение вообще допускает. Обилие синони- мических способов выражения и бессмысленных текстов кажется противоречащим этой гипотезе, но если считать нашу модель адек- ватной, то это обилие парадоксальным образом оказывается неиз- бежным следствием экономичности. 6. В посленыотоновской физике основным выражением идеи детер- минированности служит принцип, согласно которому развитие изо- лированной физической системы в пространстве — времени опре- деляется дифференциальными уравнениями («законы природы») и гра- ничными (начальными) условиями. Этот принцип принимается и в кван- товой идеологии: вероятностный аспект квантовой теории существен для описания взаимодействий, в частности, с измерительным устрой- ством, но не для теории изолированной системы. Вычислительный процесс можно рассматривать как другую мо- дель идеи детерминированности. Она во многом параллельна первой: «закон» отвечает структуре вычислительного устройства, начальные условия — программам. Разбиение вычислительного процесса на эле- ментарные шаги, включающие, в частности, простейшие малые изме- нения содержимого памяти (как стирание или вписывание символа на ленте машины Тьюринга), можно сопоставить с идеей дифферен- цирования. В таких процедурах, как решение уравнения теплопровод- ности методом сеток, мы совершаем довольно прямолинейную ими- тацию непрерывной детерминированности с помощью дискретной, но, вообще говоря, сопоставление этих двух моделей далеко не три- виально. Молекулярная биология доставляет образцы поведения естествен- ных (не сконструированных человеком) систем, которое мы вынуж- дены описывать в терминах, близких к принятым в теории дискрет- ных автоматов. На рис. 2 изображена схема синтеза белка на инфор- мационной РНК: она очень похожа на изображение машины Тью- ринга, копирующей информацию с одной ленты на другую. Классические непрерывные системы, управляемые дифферен- циальными уравнениями, могут имитировать дискретные автоматы лишь при исключительно сложной структуре своего фазового про- странства: обилии областей устойчивости, разделенных невысокими энергетическими барьерами. Ввод программы проделывает изощрен- 13
ную систему проходов в этих барьерах, предопределяя движение фа- зовой траектории по этому лабиринту. Как физическая система вы- числитель должен быть очень неустойчив, ибо ошибка в один знак в программе, вообще говоря, приводит к совершенно другой траек- тории. Но сам процесс вычисления должен быть беспримерно ста- бильным, т. е. самопроизвольные ошибки (переход траектории через барьер, который должен быть закрыт, в результате флюктуации) должны иметь весьма малую вероятность. Хорошо известно, что эти требования (в сочетании с медленностью работы и экспоненциальным ростом диссипируемой энергии при увеличении сложности) поста- Рис. 2 14
вили барьер перед развитием механических компьютеров. Между тем действие «генетических автоматов» мы пытаемся часто описывать имен- но такими механическими терминами. К самым известным парадок- сам, к которым приводит такое описание, относится гипотетическая картина разворачивания двойной спирали в процессе репликации. В этой картине двойная спираль бактериальной хромосомы закру- чена примерно на 300 000 оборотов. Так как ее удвоение в благоп- риятных обстоятельствах занимает 20 мин, согласно механической модели репликации, при разворачивании спирали часть хромосомы должна вращаться со скоростью, не меньшей 125 оборотов в секунду. Параллельно должна происходить сложная сеть безошибочных био- химических превращений. Возможно, для прогресса в понимании таких явлений нам недо- стает математической теории квантовых автоматов. Такие объекты могли бы показать нам математические модели детерминированных процессов с совершенно непривычными свойствами. Одна из причин этого в том, что квантовое пространство состояний обладает гораздо большей емкостью, чем классическое: там, где в классике имеется N дискретных состояний, в квантовой теории, допускающей их суперпо- зицию, имеется cN планковских ячеек. При объединении классических систем их числа состояний Ny и N2 перемножаются, а в квантовом варианте получается cNl N1. Эти грубые подсчеты показывают гораздо большую потенциальную сложность квантового поведения системы по сравнению с его класси- ческой имитацией. В частности, из-за отсутствия однозначного раз- деления системы на элементы состояние квантового автомата может рассматриваться многими способами как состояние совершенно раз- ных виртуальных классических автоматов. (Ср. со следующим поучи- тельным подсчетом в конце работы [17]. «Для квантовомеханического расчета молекулы метана требуется провести вычисления по методу сеток в 1012 точках. Если считать, что в каждой точке следует выпол- нить всего 10 элементарных операций, и предположить, что все вы- числения производятся при сверхнизкой температуре (Т = 3 • 10-3 /О, то и при этом расчет молекулы метана потребует израсходовать энер- гию, производимую на Земле примерно за столетие».) Первая трудность при проведении этой программы состоит в вы- боре правильного баланса между математическими и физическими принципами. Квантовый автомат должен быть абстрактным: его ма- тематическая модель должна использовать лишь самые общие кван- товые принципы, не предрешая физических реализаций. Тогда модель эволюции, есть унитарное вращение в конечномерном гильбертовом пространстве, а модель виртуального разделения на подсистемы отве- чает разложению пространства в тензорное произведение. Где-то в этой картине должно найти место взаимодействие, описываемое по тради- ции эрмитовыми операторами и вероятностями. 15
Глава 1 РЕКУРСИВНЫЕ ФУНКЦИИ И АЛГОРИТМЫ 1. ИНТУИТИВНАЯ вычислимость 1.1. Основным объектом этой главы будут строгие математические понятия, которые формализуют представление о том, что некоторые функции поддаются «механическому» вычислению, скажем,. на ЭВМ, как только для этого составлена надлежащая программа, тогда как дру- гие функции, заданные неэффективным определением, могут требо- вать творческого подхода к задаче определения каждого своего значения. Несколько характерных черт идеализации следует объяснить сразу. а) Областями определения и значений рассматриваемых нами функций 'будут в основном целые положительные числа или состав- ленные из них векторы фиксированной длины, или, наконец, под- множества таких векторов. Это связано, например, с представлением о том, что цифровые ЭВМ имеют дело с приближенной записью чи- сел, скажем, в двоичной системе, и притом с заранее ограниченной точностью. Измеряя все эти числа в единицах последнего разряда, можно считать их целыми. б) Нас почти не будет интересовать пока вопрос о структуре самих программ и разворачивающегося во времени и пространстве процесса их работы, в частности, проблема объема памяти и длины вычислений. Лишь существование или несуществование программы, вычисляющей некоторую описанную функцию, будет главным предметом рассмот- рения. С более широкой точки зрения основные абстракции теории вы- числимости будут описаны в последнем параграфе этой главы. Там мы коснемся идеализации «конструктивного объекта», которая слу- жит адекватной моделью для представления об алгоритмах, пере- рабатывающих символьную информацию, а также соответствующих идеализаций и самого понятия алгоритма. В этом параграфе мы обсудим понятие вычислимости неформально. Его главная целы— подчеркнуть важность абстрации «полувычисли- мости» и дать первую,, самую слабую формулировку знаменитого «те- зиса Черча». 16
1.2. Введем несколько простых основных понятий. Пусть X, Е — два мйожества. Частичной функцией (или отображением) из X в Y будем называть любую пару < D (f), f >, состоящую из подмножества D (f) s X и отображения f : D (f) -> Y. Здесь D (/) называется об- ластью определения /; f определена в точке х g X, если х g D (/); f нигде не определена, если D (/) пусто; существует единственная ни- где не определенная частичная функция. Через Z+ = (1, 2, 3...) будем обозначать множество натуральных чисел, исключая нуль. (Последнее не обязательно, но допущение нуля требует другой редакции доказательств.) Если п 1, через (Z+)" мы обозначим п -кратное прямое произведение Z+ на себя, т. е. множе- ство упорядоченных п-ок < хх, .... хп > , xt £ Z+. Удобно счи- тать, что (Z+)0 — множество, состоящее из одного элемента. Нашим основным объектом будут частичные функции из (Z+)"* в (Z+)n для различных т, п. В следующей далее классификации этих функций по степени их вычислимости под словом «программа» читатель может представлять себе программу для универсальной вычислительной машины, написанную без учета ограничений на время*и память. Под- разумевается, что каждая программа для вычисления функции со- держит специальное «пустое место» для вставки очередного значения аргумента. 1.3. Основное определение, а) Частичная функция f из (Z+)m в (Z+)" называется вычислимой, если существует такая «программа», что при подаче на ее вход вектора х с (Z+),n мы получим на выходе f (х), если х £ D (f); 0, если х D (/). (Здесь 0 — просто указатель того, что f не определена в х; можно было бы разрешить в этом случае получить на выходе что угодно не ыз (Z+)".) б) Частичная функция f из (Z+)m в (Z+)n называется полувычйс- лимой, если существует такая «программа», что при подаче на ее вход xg (Z+)"’ мы получаем на выходе /(х), если x^D (/); получаем на выходе 0 или же программа работает бесконечно долго, если х 6 D ([). В частности, вычислимые функции полувычислймы, а всюду опре- деленные полувычислимые функции вычислимы. в) Частичная функция f называется невычислимой, если она не удов- летворяет условию б) и тем более а). 1.4. Пояснения, а) Из этих трех понятий основным является полу- вычислимость, ибо вычислимость сводится к нему. Действительно, для выделения вычислимых функций из полувычислимых можно по- ступить так. Пусть X S Y — два множества. Назовем характеристической функцией подмножества X в Y такую функцию %х: Y -> Z+, что Хх (х) = 1, если х EF Х-, 2, если х X. 17
Заметим, что хх определена всюду. Теперь пусть / — полувычислимая функция из (Z4’)'" в (Z+)n. Если она даже вычислима, то вычислима и характеристическая функция ее области определения D (/): к вычисляющей f программе нужно доба- вить инструкции «переработать 0 в 2, а не 0 в 1 и подать на выход». Наоборот, если вычислима ХЬ(П> то вычислима и f: перед программой, полу вычисляющей /, нужно написать программу, вычисляющую XD(f), и подавать на выход сразу 0, если Хо<Г) = 2, или пере- давать х в программу для /, если хо(;) (х) = 1. Таким образом. / полувычислима и xdc/j, f вычислима полувычислима (и, значит, (/) автома- тически вычислима, ибо всюду определена). Правую часть этой импликации мы выберем в качестве формализации пснятия вычислимости, когда полувычислимость будет формали- зована. б) Существуют невычислимые функции. Действительно, каждая программа — это конечный текст в конечном алфавите, так что множе- ство программ счетно, тогда мак множество всех функций Z+ -> Z+ несчетно. (Критику этого рассуждения см. ниже в п. 1.5.) Конкретный пример невычислимой функ- ции. Рассмотрим формальный язык арифметики SAr, описанный в § 10 гл. II книги Д и НД. Пронумеруем формулы этого языка, как это было объяснено в § 11 гл. II той же книги. Определим функцию f соглашением ( 1, если k-я формула истинна в стандартной интерпретации; ( не определена, если k-я формула ложна. Функция f невычислима. В гл. V мы увидим, что это следует из не- выразимости множества D (f), установленной теоремой Тарского. Иначе говоря, нельзя распознать (хотя бы в принципе) все тео- ретико-числовые теоремы, написав одну (хотя бы очень большую и сложную) программу для их распознавания по данной формулировке. Доказательство этого результата, конечно, требует гораздо более глубокого анализа понятия вычислимости. в) Существуют полу вычислимые, но не вычислимые функции. Сначала приведем пример полувычисляющей программы. Рассмотрим функцию / из Z+ в Z4’, определенную через задачу Ферма: /(«) = 1, если существуют х, у, z £ Z+ с условием хп+2+г/л+2 =z"+2; не определена иначе. 18
Вот программа, полувычисляющая /: после того как на вход по- дано п, перебирать векторы < х, у, г > в лексикографическом по- рядке и проверять для каждого вектора условие хп + 2 + уп +2 = zn +2. Если оно выполнено, подать на выход. 1. Иначе, переходить к сле- дующему. Значит, f полувычислима. Но мы до сих пор не знаем, вычислима ли f. Гипотеза Ферма состоит в том, что / нигде не определена (и, зна- чит, вычислима!). Самые сильные теоретические результаты, извест- ные относительно f. — так называемые критерии Куммера, Вифери- ха, Вандивера и др. — можно рассматривать как некоторое прибли- жение именно к доказательству вычислимости [, а не того, что она нигде не определена. Поэтому для следующей проверки гипотезы Ферма для тех или иных значений п нужен еще (машинный) счет (объем которого быстро растет с ростом п) для вычисления в точке п, когда оно возможно. Аналогичную природу имеет пример полувычислимой функции, которая уже заведомо не является вычислимой: мы докажем в гл. II, что существует такой многочлен Р (/, %!, ..., х„) с целыми коэффициентами, что функция g(i) = 1, если уравнение Р (t, хп) = 0 разрешимо Xi,..., х„ 6Z-*-; не определена иначе — не вычислима. Ее невычислимость устанавливается точно так же, как для функции /, связанной с уравнением Ферма. 1.5. Критика предшествующих доказательств: Прежде чем двигаться дальше, рассмотрим более критически, скажем, рассуждение из п. 1.4 б). Первое слабое место бросается в глаза: мы не уточнили, что такое программа. Однако это не так су- щественно; при любом выбранном уточнении программа должна быть текстом над конечным алфавитом, чтобы удовлетворять интуитив- ным представлениям, а таких текстов счетное множество. Гораздо более сильное возражение состоит примерно в следующем: на каком основании мы можем работать с одним уточнением понятия программы? Возможно, существует все возрастающая иерархия точно описывае- мых «вычислительных средств», так что для каждой функции из Z+ в Z+ можно подобрать свою программу, которая может вычислять эту функцию? Фундаментальным открытием теории вычислимости было то об- стоятельство, что на последний вопрос нужно дать отрицательный ответ. К настоящему времени мы обладаем единственным и оконча- тельным формальным понятием, которое выдержало все проверки на 19
его соответствие интуитивному представлению о полувычислимости и которое конструируется так. 1.6. Тезис Черча (слабейшая форма). Можно явно указать а) семейство простейших полувычислимых функций; б) семейство элементарных операций, которые позволяют строить по одним полувычислимым функциям другие полувычислимые функции; с тем свойством, что любая полувычислимая функция получается за конечное число шагов, каждый из которых состоит в применении одной из элементарных операций к ранее построенным либо к простей- шим функциям. 1.7. Пояснение. В следующем параграфе тезису Черча будет придана точная формулировка: простейшие функции и элементарные операции будут заданы явно. С одного места начнется точная мате- матическая теория вычислимости. Однако нам казалось важным отме- тить принципиальное значение того открытия, что семейства таких функций и операций вообще существуют и могут быть явно указаны, что далеко не очевидно. Это—экспериментальный факт, один из важнейших открытых логикой. Свидетельства в его пользу и его значение будут обсуждены в следующем параграфе. Сейчас отметим лишь, что он родствен финит- ности основных логико-множественных принципов математики (за- ложенных, скажем, в языке Set: см. Д и НД), но не тожде- ствен. 2. ЧАСТИЧНО РЕКУРСИВНЫЕ ФУНКЦИИ 2.1. В этом параграфе мы изложим точное определение и-первона- чальные свойства класса частичных функций из (Z+)m в (Z+)n, ко- торый считается адекватной формализацией класса полувычисли- мых функций. Он будет описан тем способом, который указан в фор- мулировке тезиса Черча в п. 1.6. 2.2. Простейшие функции. sue: Z+ -> Z+, sue (х) = хф 1; В") : (Z+)n-> Z+; 1<п> (хп .... хп) = 1, п > 0; pr? : (Z+)n-> Z+, pr? (%!, ..., хп) =jxi, п~^ \. 2.3. Элементарные операции над частичными функциями. а) Композиция (или подстановка). Она ставит в соответствие паре функций f из (Z+)"’ в (Z+)« и g из (Z+)n в (Z*y> функцию h. = g « [ из (Z+)"1 в (Z+)₽, которая определяется так: D (g о /) - f~l (D (g)) = {х 6 (Z+П X 6 D (/), f (X) e D (g)} (go f) (x) =g (/ (x)). б) Соединение. Эта операция ставит в соответствие частичным функ- циям fi из (Z+)m в (Z+^j, i — 1, ..., k, функцию (fj, ..., fh) из (Z+)m в (Z+)"i x ... x (Z+)nh, которая определяется так: 20
D((flt М)=О(Л)П - fl D(fk), (h, •••> fh) Ul. xm) = < Л (Xlt ..., Xm).fk (Xt.Xm) > в) Рекурсия. Эта операция ставит в соответствие паре функций из (Z+)n, в Z+ и g из (Z+)n+a в Z+ функцию h из (Z+)n+1 в Z+, которая определяется рекурсией по последнему аргументу: хп, 1)=/(хх...хп) (начальное условие); ft(xlt..., хп, k + 1) = g(x1,..., хп, k, h (Xj,..., хп, k)) при 1 (рекурсивный шаг). Область определения D (h) описывается также рекурсивно: < хь ..., х„, 1 > е О W < *1..........хп > е D (/); < Хц хп, k + 1 > £ D (h) <==> < хь хп > g D (Л) и < х1э хп, k, h. (xlt хп, k)> £ D (g) при ft > 1. г) Операция p. Эта операция ставит в соответствие частичной фик- ции f из (Z+)n+1 в Z+ частичную функцию h из (Z+)n в Z+, которая определяется так: £>(*)== {<х1г..., хп)1зхп+1> 1, /(Xj,..., Хп, Хп+1) = 1 и (Xi,..., х„, ft> е D (/) для всех k^x п + 1 | 9 h(x1,..., x„) = min (xn+1 |/(Xi.x„, xn+1) = 1]. В общих чертах роль р состоит во введении функций, заданных «неявно». Кроме того, она позволяет вводить в -вычисление перебор объектов для отыскания нужного в бесконечном семействе. Три осо- бенности операции р заслуживают быть отмеченными немедленно. Выбор минимального у с f (xlt ..., хп, у) = 1 делается, конечно, для обеспечения однозначности функции h. Область определения h на первый взгляд представляется искус- ственно суженной: если, скажем, f (xlt ..., xn, 2)= 1, a f (xn ..., xn, 1) не определено, мы считаем h. (xlt ..., хп) не определенной, а не равной 2. Причина этого состоит в желании сохранить интуитивную полувы- числимость функции h и будет несколько подробнее прокоммен- тирована ниже (см. п. 2.7а). Наконец, все описанные до р операции, если их применять к всюду определенным функциям, дают в результате всюду определенную функцию. Для р это, очевидно, не так: это единственная операция, ответственная за возникновение, частичных функций. 2.4. Определение, а) Последовательность частичных функций flt ..., In называется частично рекурсивным (соответственно прими- тивно рекурсивным) описанием функции = f, если — одна из простейших функций-, 21
ft — для всех i 2 либо является простейшей функцией, либо получается применением одной из элементарных операций к некоторым из функций Д, ..., ft-! (соответственно одной из элементарных опе- раций, кроме р). б) Функция f называется частично рекурсивной (соответственно примитивно рекурсивной), если она допускает частично рекурсивное (соответственно примитивно рекурсивное) описание. (Аналогия с определением вывода в формальном языке бросается в глаза и может быть использована.) 2.5. Тезис Черча (обычная форма). а) Функция f полувычислима, если и только если она частично рекур- сивна. б) Функция f вычислима, если и только если f и частично ре- курсивны. Терминологическое замечание. Всюду опреде- ленные частично рекурсивные функции называют также общерекур- сивными. В случае, когда область определения ясна или несуществен- на, употребляется просто термин «рекурсивная». Сложившееся рус- ское словоупотребление неудачно: следовало бы говорить рекур- сивная частичная функция и т. п. 2.6. Использование тезиса Черча. Прежде чем обсуждать подроб- нее аргументы в пользу тезиса Черча, укажем, как он используется' в математической практике. Два основных способа бросаются в глаза при изучении литературы, а) Тезис Черча как определение алгоритмической неразрешимости. Пусть имеется счетная последовательность математических «за- дач» Ръ Pit ... Предлагается далее, что каждая задача имеет ответ «да» или «нет» и что по номеру п условие задачи Рп выписывается «эффек- тивно». Такая последовательность Р = (Рп) называется «массовой проблемой». Свяжем с ней функцию f из Z+ в Z+: D (f) = {i g Z+]Pt) имеет ответ «да»); f (i) = 1, если i g D (f). Массовая проблема P называется алгоритмически разрешимой, если функция f и частично рекурсивны. В противном случае Р на- зывается алгоритмически неразрешимой. Можно еще различать слу- чаи, когда только не является частично рекурсивной или когда даже f не частично рекурсивна. Вторая неразрешимость еще «хуже» первой; примеры были указаны в § 1. Наконец, можно строго опре- делить и исследовать разные иерархии «степеней разрешимости». Один известный пример массовой проблемы проблема тождества слов в группах. Пусть G—некоторая конечно определенная группа, «1,.... аг 6 G — некоторые элементы. «Приведенное слово» от аъ .... аг— это выражение вида afi... af\ где ± 1, и если = ij+l, TO $; = $j+l. 22
Расположим все приведенные слова в алфавитном порядке и по ставим задачу Рп: «Верно ли, что п-е слово представляет единичный элемент группы G?» «Массовая проблема» (Рп) алгоритмически разрешима для одних групп G и элементов ал, ап и не разрешима для других (Новиков, Хигмэн). Функция f здесь всегда частично рекурсивна, но %D(f) — не-обязательно, см. гл. VI. Другой пример неразрешимой проблемы, связанный с диофанто- выми уравнениями, описан в следующей главе. б) Тезис Черча как эвристический принцип. Интуитивно понятие «полувычислимости» представляется более широким, чем понятие «частичной рекурсивности», и многие задачи о частично рекурсивных функциях становятся значительно легче, если подставить в их усло- вие неформальные представления и разрешить пользоваться ими в решении. Скажем, формула е = lim( 1 + — \ п и алгоритм Эвклида делают интуитивно ясным, что функции /, g : Z+ -> Z+; f (п) = n-й десятичный знак разложения е; g (п) — п-е простое число, вычислимы, тогда как проверка их рекурсивности требует довольно кропотливых конструкций. Тезис Черча позволяет разбить решение таких задач на два этапа: отыскание неформального решения с использованием любых интуитив- ных алгоритмов; последующая формализация. Второй этап предпо- лагает известную опытность в отыскании частично рекурсивного описания самых разнообразных полувычислимых функций, а тезис Черча дает уверенность в том, что такое описание существует. По мере накопления доказательств рекурсивности в литературе все чаще ограничиваются проведением лишь первого этапа решения: ярким примером тому служит книга X. Роджерса [2]. К концу книги мы также позволим себе ряд вольностей такого рода. Все в этом есть известные опасности. Можно думать, что распростране- ние привычки к неформальным аргументам задержало открытие такого фундаментального факта, кан совпадение перечислимых множеств с диофантовыми. 2.7. Аргументы в пользу тезиса Черча, а) Прежде всего представ- ляется ясным, что простейшие функции должны быть вычислимы, как бы ни уточнять это понятие. Далее, элементарные операции, приме- ненные к полувычислимым функциям, снова дают полувычислимую функцию: программа, полувычисляющая ее, без труда компонует- ся из полувычисляющих для данных функций. Мы рассмотрим под- робнее только случай p-оператора, оставив легкую конструкцию остальных трех программ читателю. 23
В обозначениях п. 2 3 пусть f — полувычислимая функция из (Z+)n+1 в Z+. Для вычисления >г (xlt хп) будем перебирать в по- рядке возрастания последней координаты векторы < xlt х2, хп, 1>, <С х±, хп, 2 > , ... и вычислять значения f в них. Если <;%!, g D (й), где h получается из f применением ц-опера- тора, то программа для f последовательно вычисляет f(xlt ..., хп, 1), ..., f (xlt ..., хп, у — 1) и, наконец, f (хн ..., хп, у) — 1. Наимень- шее такое у, если оно существует, нужно подать на выход: это будет значение h в точке < xlt хп> (до достижения f — 1). Если h ока- жется неопределенным, то полувычисляющая f программа либо будет работать бесконечно долго, либо даст ответ не из Z+ — его нужно по- слать на выход; но по нашему соглашению h в точке CXj, ...,хп, > тогда не определена, и такое поведение программы для h согла- суется с определением полувычислимости h. Из всего сказанного нужно сделать вывод, что частично рекур- сивные функции полу вычислимы. Наиболее сильное утверждение те- зиса Черча состоит, таким образом, в том, что полувычислимые функции частично рекурсивны (определение вычислимости через полувычисли- мость мы просто перенесли без изменений из § 1). Как было сказано, это экспериментальный факт. Экспериментальные свидетельства в его пользу делятся на несколько классов, которые мы рассмотрим после- довательно в подпунктах б) — г). б) В литературе имеется огромный набор рекурсивных описаний различных (полу) вычислимых функций. (См., например, книгу Р. Петер [25].) Часть этого списка мы приведем в следующем пара- графе. Имеется также набор приемов составления рекурсивных опи- саний, применимых к целым классам (полу) вычислимых функций. Каждый раз, когда какой-нибудь автор пытался найти частично ре- курсивное описание (полу) вычислимой функции, это описание нахо- дилось. в) Тьюринг предложил математическое описание абстрактной вы- числительной машины и выдвинул сильные аргументы в пользу того, что эта машина является универсальной ( т. е. может (полу) вычис- лять все (полу) вычислимые функции), детально проанализировав ха- рактерные черты процесса детерминированного вычисления. (Еще раз обратите внимание на то, что мы совершенно не занимались формали- зацией процессов вычисления, а Только их результатами.) Оказалось, что класс функций, полувычислимых машинами Тью- ринга, в точности совпадает с классом частично рекурсивных функ- ций. г) Черч, Пост, Марков, Колмогоров, Успенский и др. предло- жили другие детерминированные схемы переработки информации (не обязательно числовой) общего характера. Во всех случаях оказалось, что при подходящей «эффективной» нумерации множеств входов и вы- ходов эти способы приводят к такому классу отображений из Z+ в 24
Z+, который совпадает с соответствующим подклассом частично рекур- сивных функций. За дальнейшим обсуждением тезиса Черча мы отсылаем читателя к литературе; см. в особенности С. Клини [261. 3. ОБРАЗЦЫ РЕКУРСИВНОСТИ 3.1. В этом параграфе будут приведены краткий список рекур- сивных функций и выборка первоначальных примеров демонстрации рекурсивности. В дальнейшем изложении оба списка будут попол- няться по мере надобности: см., в частности, гл. VII. 3.2. а). sum2 : (Z+)2 -> Z+, < хъ х2 > i-> хг 4- х2. Рекурсия по х2, исходя из начального условия + 1 = SUC (xj, посредством рекурсивного шага Xi + k 4- 1 = sue (sum2 (хь й)). 6) . sum„ : (Z+)n -э- Z+, <Xj.x„> i-> 2 xi> n > 3. i Считая известным, что sumn_! рекурсивна, получаем sumn с помощью соединений и композиции sumn = sum2 о (sumn_!»(рг",..., pr"_i), х„). Другой вариант — рекурсия по хп, исходя из начального значения sue ° sumn_y, посредством рекурсивного шага п—1 у Xi +& + 1 = suc(sumn(x1,..„ хп_ь й)). Эта многозначность рекурсивных описаний, даже «естественных», будет все возрастать. 3.3. a) prod2 : (Z+)2 -> Z+, < хн х2 > i-* r,x2. Рекурсия по х2, исходя из начального условия хь посредством рекур сивного шага (k + 1) = х^к + Xi = sum2 (ххй, xt). 6) prodn : (Z+)n -> Z+ <xv .... xn)> -> ........... n > 3: prodn = prod2<=(prodn_1(pr^..„ pfn-i), x„). 25
3.4. a) Z+ -> Z+; . lx— 1, если x > 2; x i-> x — 1 = { ( 1, если x = 1. Рекурсия к функциям: f : (Z+)°-> Z+ : g = pri : (Z+)2 -> Z+, < xt, x2 >i-> Xp 6) (Z+)2 -> Z-h <xb x2> ( x,—хг, если x, > x2: l-> Xi — x2 = { I 1, если x-t x2. Эта «усеченная разность» получается применением рекурсии к функ- циям f(X1) = Xi 1, g(x1; х2, х3) = х3— I. 3.5. F : (Z+)n-+ Z+, где F — любой многочлен от xlf .... хп с це- лыми коэффициентами, принимающий только значения из Z+. Если все коэффициенты F неотрицательны, то F есть сумма про- изведений функций рг? : < хъ ..., xn > I-* хг. Иначе F = F+ — F~, где коэффициенты у Е+ и F~ неотрицательны, а значение неусечеиной разности во всех точках (Z+)n совпадает со значением усеченной разности F+ F~ по предположению об F. Мы часто будем пользоваться рекурсивностью функций (Xj — х2)2 + 1 или h = (/ —g)2-ф- 1, где f, g рекурсивны; этот прием Позволяет отождествить «множество совпадения» f = gt «множеством 1-уровня» h = I, с которым удобнее работать. 3.6. «Ступенька»: » (х) __ ( а ПРИ I Ь при х > х0; а, Ь, х £ Z+. При х0 = 1 она получается рекурсией с начальным значением а и последующими £>. В общем случае sV(x) = s“’ "(x + l^Xo). 3.7. rem (х, у) = остаток от деления у на х, лежащий в [1, х1 (у нас нет нуля!). Имеем rem (х, 1) == 1, rem(х,//ф-1) = / k = [ sue . rem(х, у), если .rem (х, у) х. 26
Применим следующий искусственный прием. Рассмотрим ступеньку s (х) = 2 при х > 2, s (1) = 1 и положим <р (х, у) = s ((rem (х, у) — х)2 + 1). Очевидно, rem (х, у) =# х гр (х, у) = 1, rem (х, у) = х <==> ср (х, у) = 2, откуда тет (х, у + 1) = 2 sue (rem (х, у) ср (х, у) sue (гет (х, у)). Это дает определение гет рекурсией. Опишем этот прием в более общем виде. 3.8. Пусть h задана «рекурсией с альтернативами»: й (хъ .... хП) 1) = / (х1; .... хп); h (хъ ..., хп, k + О = gi(xr, .... xn, k, h (xlr xn, k))„ если выполнено условие С, (xn ..., хп, k; h}, i — 1, ..., т. Взаимо- исключающие условия C( приведем к виду Сг выполнено-ч==>- ср, (хг, ... ..., xn; k; h. (xlt .... хп, k)) = 1, <рг — всюду определенная рекурсивная функция, принимающая только значения 1 и 2. Тогда рекурсивный шаг можно записать так: h{xr...хп, fe-pl) = 2 2 g-JXi,..., хп, k, h (хь..., xn, i = ] — 5 (gt <Pi) (-«i..xn, k, h (xx..xn, k)). = 1 Этот прием позволяет установить примитивную рекурсивность следующих функций, которые понадобятся нам дальше. 3.9. Неполное частное: ( целая часть w/x, если w/xjs 1, qt (х, у) = ( 1, если ylx < 1. Имеем qt (х, 1) = 1; qt(x. у), если rem (х, р-Р1)=#х; qt (х, у) -р1, если rem (х, у -р 1) =# х, г/-р1¥=х; 1, если р-р 1 =х. К стандартному виду 3.8 условия приводятся с помощью функций s((rem (х, у -р 1) — х)2 -Р1), S((rem,(x^ £/-pl)—х)2-р 1).. s((x — у~ 1)2+ 1), s((x-y- 1Г+1), + 0 = 27
где s(l)=l sQj2) = 2: Г(1) = 2, s'(>2) = l. 3.10. rad x = целая часть x. Имеем rad (1) = 1, rad (x +1) = rad x, если qt (rad x +1, x + 1) <rad x 4- 1; rad x +1, если <^(rad x +1, x + 1) = rad x +1. Предоставляем читателю привести условия к стандартному виду. 3.11. a) min (х, у): min (х, 1) = 1; , .. [ min(x, у), если тш(х, у + 1) = { у у ( min (х, у) + Г, если х > у. б) max (х, у) аналогично. 3.12. Если f.(xr, ..., хп) рекурсивна, то хп хп Sf= У, /(хь..., х„_ъ k), Pf= п /Сч.......Xn-p k) рекурсивны. 4=1 4=1 Действительно, Sf (Л-1> •••> ^п-1> %п "Ь 1) ~ Sf (Хр .... Xn) + /Дхр хп + 1), Pf (Xj, .... Xn-1, Xn + 1) = Pf (*p • ••, X„) • f (xlt .... xn + 1). 3.13. Если f (xp ..., xn) рекурсивна, то рекурсивны функции, кото- рые получаются из f: а) любой перестановкой аргументов-, б) введением любого числа фиктивных аргументов-, в) отождествлением членов любой группы аргументов (f (х, х) вмес- то f (х, у} и т. п.). Действительно, все эти функции можно получить из f и различных рг™ композицией и соединением. 3.14. Отображение f : (Z+)m(Z+)n рекурсивно, если и только если все его компоненты рг1? » f рекурсивны. (Очевидно.) Отметим в заключение, что все конкретные функции, описанные до сих пор, были примитивно рекурсивными и все описанные опера- ции, если применяются к примитивно рекурсивным функциям, дают также примитивно рекурсивный результат. Начиная со следующего параграфа, мы будем существенно пользоваться операцией р. 28
4. ПЕРЕЧИСЛИМЫЕ И РАЗРЕШИМЫЕ МНОЖЕСТВА 4.1. Определение. Множество Е (Z+)n называется перечисли- мым, если существует такая частично рекурсивная функция ), что Е = D (f) (область определения [). Обсуждение в § 1 и 2 показывает, что интуитивный смысл перечис- лимости Е таков: существует программа, которая распознает элемен- ты х, принадлежащие Е, но, возможно, не умеет распознавать элемен- ты, не принадлежащие Е. Позже, в п. 4.12 и 4.18, будет дано другое интуитивное описание перечислимых множеств, более ясно указываю- щее на этимологию названия: это множества, все элементы которых могут быть получены (возможно, с повторениями и в неизвестном по- рядке) с помощью некоторой ’'.порождающей^ их программы. Понятие перечислимого множества наряду с понятием частично рекурсивной функции занимает центральное место во всей теории. Из дальнейших результатов, в частности предложения 4.15, будет видно, что любое из них может быть приведено к другому, однако в доказа- тельствах необходимую гибкость дает лишь использование обоих по- нятий. Начнем со следующего простого факта. 4.2. Предложение. Следующие три класса множеств совпадаю.... а) Перечислимые множества. б) Множества уровня частично рекурсивных функций. в) Множества 1-уровня частично рекурсивных функций. Доказательство. Напомним, что множеством т-уровня (или просто /п-уровнем) функции / из (Z+)n в Z+ называется множе- ство Е s D (f), такое, что х £ Е ч==> f (х) — т. a) cz в). Пусть Е перечислимо, Е = D (f), где f частично рекурсив- на. Тогда Е = 1-уровень функции 1(1> - f, б) = в), m-уровень f совпадает с 1-уровнем (f — т)2 + 1. Функ- ция (/ — т)2 + 1 частично рекурсивна в силу предложения 3.5 вмес- те с /. в) сд а). Пусть Е — ^уровень частично рекурсивной функции f (хг, ..., хп). Положим g (xlt ..., хп) = min {y\(f (xlt .... xn) — I)2 + у = 1}. Очевидно, g частично рекурсивна и Е = D (g). Основным результатом этого параграфа будет следующее гораздо более трудное утверждение и его следствия. 4.3. Теорема. Следующие два класса’ множеств совпадают: а) Перечислимые множества. б) Проекции множеств уровня примитивно рекурсивных функций со значениями в Z+. 29
4.4. Первая часть доказательства. Напомним прежде всего, что если дано некоторое множество Е с (Z+ то его проекцией («на пространство первых п координат») называется множество F <= (Z+)n, которое определяется так: <х1,..., хп) е F — :j (gj,..., ут> 6 (^+)™. <%1.ут) 6 Е. (Здесь и ниже мы, в расхождение с практикой первой части, не отме- чаем в обозначениях разницы между «переменными координат» и их частными значениями.) Аналогично определяется проекция «на ко- ординаты с номерами (Zj, ..., Zn) <= (1, ..., л)». Число т удобно назы- вать коразмерностью проекции. Каноническое отображение Е -+ F также принято называть проекцией: это не может привести к путани- це. Назовем временно проекции уровней примитивно рекурсивных функций примитивно перечислимыми множествами. Первая часть доказательства будет состоять в установлении того факта, что примитивно перечислимые множества перечислимы; вто- рая — в проверке обратного включения. Итак, пусть f (x]t ..., хп, хп+1, ..., xn+m)— некоторая прими- тивно рекурсивная функция, Е — проекция ее 1-уровня на первые п координат. (1-уровнями можно ограничиться в силу уже использо- ванного соображения: fe-уровень f совпадает 1-уровнем f = = (f — k)2 + 1). Построим явно такую частично рекурсивную функ- цию g, что Е — D (§) Разберем отдельно три случая, в зависимости от коразмерности проекции: т = 0, 1 или т 2. Случай а): т = 0. Тогда Е = 1-уровень /<==>£ перечислимо по предложению 4.2 (g построена там явно). Случай б): т = 1. Положим g (хо ..., xn) = min {хп+11/ (Xj, .... x„, xn+1) = 1}. Очевидно, g частично рекурсивна и D (g) = E (обратите внимание на то, как здесь используется обстоятельство D (f) = (Z+)n+1). Случай в): т > 2. Мы сведем этот случай к предыдущему с помо- щью следующей леммы, важной во многих других вопросах и имею- щей принципиальный интерес (отсутствие понятия размерности в «ре- курсивной геометрии»), 4.5. Лемг»а. Для всех т Сг 1 существует такое взаимно однозначное отображение Fm>> : Z+ —>- (Z+)(m), что: а) Функции F-m’ = рг)т) 0 Fm> примитивно рекурсивны для всех 1 сС i т. б) Обратная функция т,т> : (Z+)n Z+ примитивно рекурсивна. 4.6. Использование леммы. Предположим, что лем- ма верна. Применим ее к ситуации п. 4.4в). Так, положим (при m > 2) g (xi, ..., х„, у} = / (хъ ..., хп, (g), .... (i/}). 30
Очевидно,g примитивно рекурсивна вместе с/. Легко проверяется, что Е совпадает с проекцией 1-уровня функции g на первые п координат. Так как это проекция коразмерности 1, мы свели этот случай к уже разобранному. 4.7. Доказательство леммы. Случай т = 1 тривиален. Проведем индукцию по т, начиная с т = 2. Конструкция Сначала построим явно т(2> : (Z+)2 —> -> Z+, положив т,2> (xlt х2) — 0,5 ( (х} + х2)2 — х, — Зх2 + 2). Легко проверяется, что если пронумеровать пары х2> € g (Z+)2 в «канторовском порядке», расположив их по возрастанию Xj -j- х2, а внутри группы с данным xt + х2 — по возрастанию хн то т(2) (хъ х2) будет как раз номером пары <Xj, х2> в этом списке. Тем самым, т(2) взаимно однозначна и примитивно рекурсивна (использо- вать предложение 3.5 и рекурсивность qt, п. 3.10 для учета 1/2). Восстановление пары <Xlt х2> по ее номеру у является элементар- ной задачей и ппиводит к следующим формулам для обратной функ- ции (<Л(!/)=^Д [|/2!,_д _д]([ уД,—г —j] + 1). 48,(0)= -t\*\y)+2. Здесь Izl означает целую часть г. Проверку примитивтой* рекур- сивное™ этих функций с помощью результатов (и приемов) § 3 мы оставляем читателю в качестве упражнения. Конструкция /(т), т 3. Предположим, что уже построены и проверены их свойства. Положим прежде всего (xlt ..., хт) = т<2> (х1? ...-, хт). Ясно, что примитивно рекурсивна и взаимно однозначна. Решив уравнение т‘2>(т(т-')(х1,..., хт_г), хт) = у в два приема, получим для обратной функции формулы С (y) = t^ (у), 6т> (У) (t^ (у)), 1 < I < т -1. По индуктивному предположению примитнппп пекупсивны. Этим завершается доказательство леммы и вмеще с паи первая часть Доказательства теоремы 4.3. 31
Вторая часть доказательства. Теперь мы должны установить, что всякое перечислимое множество примитивно перечис- лимо. Начнем со следующего свойства класса примитивно перечислимых множеств. 4.8. Лемма. Класс примитивно перечислимых множеств замкнут относительно следующих операций: конечное прямое произведение, ко- нечное пересечение, конечное объединение, проекция. Доказательство. Пусть Е, Е' s (Z+)n, Ех с: (Z+)"’ — три примитивно перечислимых множества, проекции 1-уровней при- митивно рекурсивных функций f, f' и ft соответственно: х = <х,. .... хп> £ Е <==>- at/ = <.yt, .... yr >, f (х, у) .= I, х = <xv .... xn> £ Е <==>- gz = <zu .... zg >, f (x, z) = I, и = <u,, .... wm> £ Er -?==> 3V = <ttn ..., vs >, fr (u, v) = 1. Тогда имеем E X Ey = проекция I-уровня функции (J fx) (x, u: y, v): E [) E' = проекция 1-уровня функции (f — 1) (/' — 1) + 1; E П E’ = проекция 1-уровня функции (/ » f') (x; у, г). Устойчивость относительно проекций заложена в определении. Пусть теперь Е — некоторое перечислимое множество. Реализуем его как 1-уровень частично рекурсивной функции f из (Z+)n в Z+ по предложению 4.2 и заметим, что для доказательства примитивной перечислимости Е достаточно проверить примитивную перечислимость графика. Г, с: (Z+)n X Z+. Действительно, ясно, что Е ~ 1-уро- вень f=проекция на первые п координат множества Гу f| ) (Z+)n х X {1}1. Кроме того, множество {1}с Z+ примитивно перечислимо, например, по п. 3.6. Если мы докажем, что Г/примитивно перечислимо, из леммы 4.8 будет следовать то же самое для Е. Итак, окончательная редукция нашей задачи выглядит так: доказать, что графики частич- но рекурсивных функций f примитивно перечислимы. С этой целью мы проверим, что а) графики простейших функций примитивно пере- числимы; б) если даны функции с примитивно перечислимыми графи- ками, то у функции, которая получается из них применением одной из элементарных операций, так же примитивно перечислимый график. Графики простейших функций. Г sue с (Z+)2 = 1-уровень (х, + 1 — х2)2 + I; Г sue с (Z+)n+1 = 1-уровень хч+1; Г рг? с (Z+)n+1 = 1-уровень (х, —хп+Д2 + 1. Устойчивость относительно соединения Пусть /, g— частичные отображения из (Z+)m в (Z+)0”h (Z+)e соот- ветственно. Предположим, что Л и Г? примитивно перечислимы Тог- да Г(у g} с (Z+)"1 х (Z+K х (Z+K совпадает с пересечением (Гу х (Z+K) П perm (Tg X (Z+)₽). 32
Здесь perm : (Z+)m X (Z+)? X (Z+)p -> (Z+)m X (Z+)p X (Z+)’ операция, которая меняет местами два последних сомножителя: у^, z(p) >-> &pi, >. Из леммы 4.8 видно, что ж) примитивно перечислим. Устойчивость относительно композиции. Пусть g— частичное отображение из (Z+)" в (Z+)m, f — то же из (Z+)"1 в (Z+)₽, h = f • g. Тогда ГЛ = проекция множества (Г» X X (Z+?) П ((2+)" X Гу)на(7+)" X (Z+)₽. Как выше, если Г/ и Г примитивно перечислимы, то же верно для ГЛ по лемме 4.6. Устойчивость относительно рекурсии и р-оператора является значительно более тонким фактом. Нам понадо- бится следующая красивая и полезная лемма. 4.9. Лемма. Существует примитивно рекурсивная функция Gd (k, t) (функция Геделя) со следующим свойством: для любого N £ Z+ и любой конечной последовательности аи ...,ам£ g Z+ длины N существует такое t £ Z+, что Gd (k, t) = ak при всех (иными словами, Gd (k, t) — это такая последователь- ность функций от аргумента k, пронумерованная значениями пара- метра /, что любая функция от k на сколь угодно большом интервале I, .... N может быть имитирована подходящим членом последователь- ности). Доказательство. Сначала положим gd (и, k, t) = rem (1 + kt, и) и покажем, что gd обладает тем же свойством, что и Gd, если разре- шить подбирать <н, g (Z+)2. После этого можно будет положить Gd (k, у) = gd (/<?> (у), k, /<!> (у)), где № : Z+ -> (Z+)2 — изоморфизм из леммы 4.5. Избавление от лишнего параметра и в Gd (k, t) по сравнению с gd (и, k, t) несущест- венно, но в дальнейшем укоротит некоторые формулы. Итак, пусть даны аъ ..., а,ч £ Z+ Сначала выберем X £ Z+ с условиями X X, 1 + kX\ > ah для всех 1 k N Далее поло- жим t = X! Легко видеть, что если kt /г2, /г,, /г2 'С X, то 1 + /г,Х! и 1 + /г2Х! взаимно просты: их общий делитель должен был бы делить (fej — k2)Xl, т. е. состоять из простых чисел s^X, но они одно из них не делит 1 + /ггХ! По элементарной теореме теории чисел существует решение и £ Z+ системы сравнений и == ак mod (1 + /гХ!), 1 с" k с" X. Очевйдно, отсюда вытекает, что gd (и, k, t) = rem (1 + kt, ц) = ah, 1 k < X. 2 Зак. 1873 33
Теперь продолжим доказательство теоремы 4.3. 4.10. Устойчивость относительно ц-операции. Пусть f — частичная функция из (Z+)n+1 в Z+ и пусть g (х1т .... хп) = min {y\f (хъ хп,у) = 1}. Напомним, что область определения g состоит из тех < хь ..., хп>, для которых такой у существует, и <х1; ..., хп, k> £ D (/) для всех k, меньших min у. Мы хотим доказать, что если Г/ примитивно перечислим, то Tg так же примитивно перечислим. Пусть Гу является проекцией 1-уровня (на первые п + 1 коорди- нат) примитивно-рекурсивной функции F: <р = f (хь ..., хп+1) <==> а <</!,.... ут>, F (х1; ..., xn+1, <р, уи .... ут) = 1 (буквой ф мы обозначим тот аргумент F, который становится значе- нием /). Как и в п. 4.4, достаточно рассмотреть случай т = 1: если т. — 2, то воспользоваться леммой 4.5 для замены вектора < уъ ... ..., Ут> одним числом у, а если т = 0, то ввести «фиктивный аргу- мент» у, от которого F на самом деле не зависит. Итак, пусть tn = 1. Введем функцию G от аргументов хх, хп, у, у, t, tv положив s (1) = 2, s (х) = 1 при х 2, Fh — F (хъ .... хп, k, Gd (k, t), Gd (k, ), k 1, v—i G=/7(x1,..., xn, у, 1, у) П s (Gd(k, fe«.i о Здесь П = 1 по определению k=i Легко убедиться, что G примитивно рекурсивна; она получается рекурсией по аргументу у из двух других функций, примитивная рекурсивность которых очевидна. Мы покажем, что Гг является проекцией на координаты (xv ... ..., хп, у) I-уровня функции G. В к л ю ч е н и е рг (G = 1) S Гг. Пусть ..., хп, у, у, t, tF> — фиксированная точка на 1-уровне G. Мы должны проверить, что <ХЬ ..., Xn>gO (g) И ЧТО у = g (хх, ..., xn). Иными словами, нужно установить, что f (хь ..., хп, у) = 1; f (хь ..., хп, /г) определена и больше 1 для всех k у — 1. Так как G = 1 в данной точке, все сомножители G = 1 в этой точке. В частности, F (хг, ..., хп, у, 1, у) — 1, откуда и следует, что f (хх, ... 34
..•» xn, T ) = 1, ибо Г, есть проекция 1-уровня F. Если у = 1, боль- ше проверять нечего. у—-1 Пусть у> 1. Обращение в 1 fe-ro сомножителя в П дает s ( Gd (k; f)) = 1 => Gd (k, t) > 2, Fh = 1 => Gd (fe, t) = f (xT.xn, k) 2. Это доставляет требуемое. Включение Г? s pr (G = 1). Пусть <x,, ...,xn, y> £ Г?. Мы должны подобрать значения остальных координат у, t, так, что- бы сделать все сомножители в соответствующей точке равными 1. Прежде всего <хп хп, у, 1> £ Г/ согласно определению g. Поднимая эту точку с Г, на 1-уровень F, найдем нужное значение у. В случае у — 1 значения I, t± можно взять любыми. Пусть у > 1. Найдем тогда t из системы уравнений Gd (/г, /) = [ (хн ..., хп, k) для всех 1 < k < у — 1. (Правые части существуют в силу определения D (g).) Наконец, при каждом /г у — 1 поднимем точку <х1( ..., хп, k, Gd (/г, /) > £ Г/ до точки на F = 1 с дополнительной координатой после чего най- дем G из системы уравнений Gd Л, 4) = 1 С k < У — 1- V—1 Это обратит в единицу все сомножители в П • В самом деле, 6=1 s (Gd (/г, /)) = 1, потому что Gd (/г, г*) = f (xt, ..., xn, fe) > 2 при k < у — 1; наконец, Fh = F (хь ..., хп, k, Gd (fe, t), Gd (k, /J) = 1 по определению I, tY. 4.11. Устойчивость относительно рекурсии. Нам осталось провести последний этап доказательства теоремы 4.3. Пусть f, g — частичные функции от п, п + 2 переменных соот- ветственно, a h — функция от п + 1 переменной, которая получает- ся из них с помощью рекурсии: Л (xp ..., хп) 1) f (хп ..., хп), /i (хи ..., xn, k Ч- 1) = g (Xj, xn, k, h (xy, ..., xn, k)). Мы должны установить, что если Г/, Г3 примитивно перечисли- мы, то и ГЛ примитивно перечислим. Пусть F, G — примитивно рекурсивные функции, 1-уровни кото- рых проектируются на Г/, соответственно: <р = f (хъ .... xn) у, F (хъ ..., хп, <р, у) = 1, V = g (хг...хп+2) <==> н 2, G (xv ..., хп+а, у, г) = 1 2* 35
(как в п. 4.10, достаточно ограничиться случаем, когда коразмер- ность проекции равна 1). Построим явно функцию Н, 1-уровень которой проектируется на Гй. Ее аргументами будут х1; ..., хп+1, т], у, I, (rj — аргумент, ко- торый станет значением Н). Положим s (1) — 1, s (х) = 2 при х 2; Gh = G (хн ..., xn; k — 1; Gd (/г — 1, t), Gd (/г, t), Gd (/г, Q), H=F (xlt..., xn; Gd(l, t), r/).J[(n - Gd (xn+l, /))2 +1] fl' Gh. fc = 2 *11+1 (Мы считаем, что П = 1. если xn+1 = 1.) Как в п. 4.10, легко про- вернется, что Н примитивно рекурсивна. Включение рг (Н = 1) с: ГЛ. Пусть < хп ..., хп+1, т), у, t, t£> — точка на Н — 1. Мы должны проверить, что h (хь ... ••• Хп+1) = 11- Так как второй сомножитель Н = 1, то получаем прежде всего г) = Gd (х„+1, t). Если к тому же хп+1 = 1, то равенство единице первого сомножи- теля Н дает с учетом предыдущего т) == Gd (1, t) = /.(хь ..., xn) = h (X!.xn, 1). Пусть теперь xn+l > 1. Тогда из равенства Gk = 1 при всех 2 k хп+1 находим Gd (/г, /) — g (хъ ..., хп, k — 1, Gd (k — 1, t)), а из равенства F = 1 и определения h Gd (1, t) = f (xj..xn) = h (xn .... xn, 1). Поднимаясь no k от k = 1 до k — xn+l и пользуясь рекурсивным определением h, убеждаемся индукцией по /г, что Gd (/г, t) — h (х1( ..., хп, /г) и, в частности, т] = Gd (хп+1, /) = h (хь ..., хп+1). Включение ГЛ s рг (Н — 1). Дана точка < xj, хп+1, г] = h (xt......х„+1) > 6 Гй. Мы должны подобрать такие значения у, t, чтобы обратить Н в 1. Если xn+1 = 1, выберем t так, чтобы Gd (1, /) — h (xv ... , xn, 1) =; = f (xn ..., xn). После этого поднимем точку <хь ..., xn, Gd (1, t)> £ 36
Е Г/ до точки F = 1; это дает нужное значение у; 1г можно выбирать как угодно. Пусть, наконец, xn+1> 1. Сначала выберем t как решение сис- темы уравнений Gd (1, /) = f (хь ..., хп) = h (х„ ..., хп, 1J, Gd (k, t) — h (xx, .... xn, fe) = g (x,, ..., xn, k — 1, Gd (k — 1, /)), 2 /г x„+1. Затем, подняв точку < xn .... xn, Gd (1, О > £ Г/ на l-уровень F, отыщем у. Это обратит в 1 первые два сомножителя Н. После этого поднимем точки ..., хп, k — 1, Gd (k — 1, /), Gd (k, /)> f Г?, 2 < k < xn+I на l-уровень G, добавив координаты и решив относительно tt си- стему уравнений Gd (k, /t) = ?<*>, xn+[. Это обеспечит обращение в 1 сомножителей Gh. Доказательство теоремы 4.3 окончено 4.12. Объяснение термина «перечислимое мно- жество». Теорема 4.3 показывает, что если Е перечислимо, то существует программа, «порождающая Е» (ср. с п. 4.1) Действительно, пусть Е—проекция на первые л координаты 1-уровня примитивно рекур сивной функции f (хь ..., хп, у). Порождающая Е программа должна перебирать векторы <хь хп, у>, скажем, в канторовском по- рядке, вычислять f и подавать на выход <xlt хп> в том и только в том случае, когда f= 1 (ср. со следствием 4.18). В отличие ст «рас- познающей» программы типа описанной в § 1, которая может навечно застрять на элементе, не принадлежащем Е, порождающая программа рано или поздно выпишет любой элемент Е и ничего кроме него. Од- нако, если Е пусто, мы этого можем никогда не узнать В заключение параграфа обсудим свойства так называемых раз- решимых множеств. Интуитивно Е S (Z+)n разрешимо, если есть программа, по каждому элементу (Z+)n выясняющая, принадлежит ли он Е или нет. 4.13. Определение. Множество Е s (Z+)n называется разреши- мым, если оно и его дополнение перечислимы. В § 5 и в следующей главе мы докажем, что существуют перечис- лимые, но не разрешимые множества. Этот результат тесно связан с теоремой Геделя о неполноте, которой посвящена гл. IV. 4.14. Теорема. Следующие три класса множеств совпадают: а) множества, характеристическая функция которых рекурсивна: б) множества уровня общгрекурсивных (всюду определенных частич- но рекурсивных) функций: 37
в) разрешимые множества. Доказате л ь с т в о. Соотношения а) = б) с в) очевидны из уже доказанного. Поэтому остается проверить включение в) cz а). Пусть Е s (Z4)" — разрешимое множество, Е — его дополне- ние. По определению Е = £>(/,), Е' = D (j') для некоторых частично рекурсивных функций f, f. Можно даже считать, что f = 1, f' = 2 (там, где они определены). Рассмотрим Г, и Гг = (Z+)" X Z+. Очевидно, это объединение является гра- фиком fg характеристической функции g множества Е. Из леммы 4.8 и дальнейшего обсуждения ясно, что Tg перечислим вместе с Г, и Г,-. Поэтому частичная рекурсивность g будет вытекать из следующего результата, который представляет самостоятельный интерес. 4.15. Предложение. Для того чтобы частичная функция g из (Z+)n в Z+ была частично рекурсивной, необходимо и достаточно, чтобы ее график Tg был перечислим. Доказательство. Необходимость уже установлена. Проверим достаточность. Так как Tg перечислим, существует та- кая примитивно рекурсивная функция G (хп ..., хп, у, г) (см. п. 4.10), что I'g = проекция на (лу, ..., хп, у) 1-уровня G. Поло’ жим Н = (ху, .... хп, и) = G (х15 ..., хп, («), (и)), где u-><tli>(u), /Ф («)> — примитивно рекурсивный изоморфизм Z+ (Z+)2, описанный в п. 4.5 и 4.7. Очевидно, Н примитивно ре- курсивна. Наконец, положим 1г (лу, ..., xn) — min {и\Н (хъ ..., хп, и) = 1}. Это частично рекурсивная функция, область определения которой совпадает с D (g) и которая, как легко видеть, позволяет вычислить g (лу, ..., хп) = w (h (лу, ..., xn)). Тем самым g частично рекурсивна, чем завершается доказательство предложения 4.15 и теоремы 4.14. 4.16. Следствие. Для любой частично рекурсивной функции g су- ществует описание, в котором операция ц применяется один раз. 4.17. Следствие. Если частично рекурсивная! функция g всюду оп- ределена, то существует ее описание gx, ..., gu=g, в котором все функ- ции всюду определены. Действительно, описание, конец которого (начиная с G) построен в п. 4.15, обладает этим свойством. 38
4.18. Следствие. Класс перечислимых множеств совпадает с классом множеств значений примитивно рекурсивных отображений. Действительно: множество значений f есть проекция графика /. Наоборот, перечислимое множество Е с (Z+)n, являющееся проек- цией на (Xj....хп)-пространство 1-уровня примитивно рекурсив- ной функции f (xn ..., хп, у), совпадает с множеством значений прими- тивно рекурсивного отображения. g(z) =[ <^+'>(г),..., ^ + ,)(г)>, если /Ср+1>(г),...,йп+п(2)) = 1, I §(г — 1) в противном случае. 4.19. Следствие, а) Конечные множества и их дополнения в (Z+)n разрешимы. б) Любое частичное отображение из (Z+)m в (Z+)n с конечной об- ластью определения рекурсивно и вычислимо. В самом деле, одноточечное множество {а} £ Z+ есть уровень суммы двух подходящих ступенек, в дополнение к нему — другой уровень такой суммы. Конечные объединения и пересечения сохра- няют разрешимость и дают а) для п — 1; изофоризм т<п) позволяет перенести этот результат на все п. Отсюда следует и б), ибо графики рассматриваемых отображений конечны и, значит, перечислимы. 5. ЭЛЕМЕНТЫ РЕКУРСИВНОЙ ГЕОМЕТРИИ 5.1. Основные объекты современных геометрических дисциплин (дифференциальная, аналитическая, алгебраическая геометрии) оп- ределяются как пары Смножество, совокупность частичных функций на нем>, удовлетворяющие тем или иным аксиомам. Это — новое воп- лощение старой идеи о том, что математика изучает «числа и фигуры». Множества определения частичных функций рассматриваемого типа, как правило, открыты в подходящей топологии, а сами функции образуют на этой топологии пучок. В этом параграфе мы прослеживаем аналогии между теорией ре- курсивных функций и более классическими геометриями. Читатель, не знакомый с языком топологии и теории пучков, может пропускать упоминания о них и следить лишь за точными утверждениями о свой- ствах рекурсивных объектов. Начнем с определений. Пусть Е s (Z+)m— перечислимое множество. Рассмотрим струк- туру на Е, образованную следующими данными: а) $ = {Е' | Е’ s Е, Е' перечислимо}, б) для каждого Е' R (£') = {f | D (f) = Е', f : Е' -> Z+ ре- курсивна}. Положим Я = множество пар <£', R (Е')>, Е' g %. ЗЭ
Покажем, что структура {8, Я) во многом сходна со структурой «топологическое пространство с пучком». Это позволяет естественно истолковывать некоторые известные результаты о перечислимых мно- жествах и ставить новые задачи, руководствуясь аналогией с други- ми геометрическими теориями. Начнем со следующих простых замечаний. 5.2. 8 является решеткой, т. е. замкнуто относительно конечных объединений и пересечений. Поскольку для произвольных бесконечных объединений это не так, 8 нельзя рассматривать как систему открытых подмножеств Е в не- которой топологии. Тем не менее устойчивость относительно важного класса бесконечных объединений будет показана в п 5.9. Будем гово- рить, что 8 определяет квазитопологию на Е (она обладает свойства- ми, близкими к свойствам так называемых топологий Гротендика, но не удовлетворяет всем аксиомам последних). 5.3. Пусть Е', Е" £ 8, Е's Е". Тогда ограничение функций опре- деляет отображение R (Е") - R (£') : f f\E> Действительно, пусть сЕ- € R (£'). сЕ- = 1 на Е'. Тогда f |£- = = /с£- рекурсивна вместе с f и сЕ'. 5.4. Пусть £'= U Еь, Е', Ек^8. 1г = 1 Пусть fk С R (Ek) и fk согласованы на пересечениях: V I, j С п, ft |£. п Ej =fj |£. п е.. Тогда существует (очевидно, единственная) функция f€R(E'), такая, что k^.n,.f\E}t = th. Нужно проверить только, что f £ R (£'), ибо существование f : Е' -* Z+, «склеенной» из fk, очевидно. Но график f перечислим как объединение конечного числа перечислимых графиков Гл s Е' х Z+, и остается воспользоваться предложением 4.15. Результаты п. 5.2 и 5.3 позволяют рассматривать Я как пучок на квазитопологии 8. 5.5. Пусть Et, Е2 — перечислимые множества и f : Ег -> Е2 рекур- сивное отображение. Оно определяет морфизм соответствующих ква- зитопологий с пучками в следующем смысле: а) Если Е's Е2 перечислимо, то f~l (£') s Ег перечислимо. б) Композиция с f определяет для каждого Е's Е2 отображение fE'.R(E')-+R(f~l(E')). 40
Первая часть следует из того, что функция = се> > f рекурсивна вместе с С£- и /; вторая очевидна. Могло бы создаться впечатление, что пара <ZS, достаточно полно характеризует Е вне зависимости от вложения Е s (Z+)m, од- нако это не так. 5.6. Предложение. Пусть Еъ Е2 — бесконечные перечислимые множества. Тогда существует биекция f : Ех ~ Е2, такая, что f и /-1 рекурсивны. Она индуцирует изоморфизм ~ <ZS2, %2Z>. Доказательство. Установим следующие более точные фак- ты: а) Если Е s 2+ бесконечно и разрешимо, то существует обще- рекурсивная биекция f : Z+ ~ Е с рекурсивной f"1, которая явля- ется возрастающей функцией. Верно и обратное. б) Если Е £ 2+ бесконечно и перечислимо, то существует обше- рекурсивная биекция f : Z+ ~ Е с -рекурсивной f~l. Пусть сначала Е разрешимо, g (х) = 2 при х £ Е, g (х) = 1 при х ф Е, h = Се- Положим /(z) = min 1у v V I S g(x)—у—Z] 4-1=1 =г-й Х=1 / J элемент Е. Легко убедиться, что > / Л . . \ ( номер х как элемента Е, если х £ Е\ f Ч*) = У х Л(х) = н \i,= i / ( не определена иначе. Теперь пусть Е перечислимо. Согласно следствию 4.18 существу- ет примитивно рекурсивная функция g : Z+ -* Е, образ которой сов- падает с Е. Изменим ее так, чтобы она стала биекцией. Положим E=|AeZ+|y/<A, g(i)=£g(k)}. Это множество разрешимо: оно есть 1-уровень примитивно рекурсив- ной функции h: k-t Л(1)=1; h(k)= П S((g(i) -£(*))2+1) ДЛЯ ,« = ( ' "Р" '>2. ( 2 при х = 1. Из предыдущего результата существует рекурсивная биекция g1 : Z+ ~ F. Положим f = g » g'. Так, для g\p F z Е есть биек- ция, то и / : Z+ z Е есть биекция. Обратная функция частично ре- курсивна, ибо f-1 (х) = min {у | (/(«/) — х)2 + 1 = 1). 41
Предложение доказано. Имея в виду этот результат, вложение Е s (Z+)m обычно рассмат- ривают как существенный элемент структуры Е\ в частности, £, и Е2 называются изоморфными, если существует биекция между ними, индуцированная рекурсивной биекцией объемлющих пространств. Полная классификация перечислимых множеств с точностью до изоморфизма неизвестна, хотя многие тонкие результаты получены в теории сводимостей. Ниже, пользуясь теоремой, которая будет дока- зана в следующей главе, мы покажем только, что не все перечислимые множества разрешимы. 5.7. Семейства. Пусть т О, В — некоторое множество. Назовем семейством m-множеств (или т-семейством) над базой В лю- бое отображение В -> 3й ((Z+)m). Если Eh s (Z+)m — образ k g В при этом отображении, то мы будем обозначать это семейство также {Eh}- Множество Е — {<х, fe> | х g Ek} s (Z+)m X В будем на- зывать тотальным пространством семейства. Аналогично отображение В -> {частичные функции из (Z+)m в Z+} назовем семейством т-функций над базой В. Функцию / : <Zx, k> fh (х) для х £ D (/fe) назовем тотальной функцией се- мейства. Семейство m-множеств (соответственно m-функций) назовем пере- числимым, если В (Z+)m для некоторого п и тотальное пространство перечислимо в (Z+)m х (Z+)n (соответственно тотальная функция частично рекурсивна на (Z+)m X (Z+)n. Если {Ek} перечислимо, то множество {k£B \ Ek не пусто} пере- числимо как проекция тотального пространства Е и все Ek перечи- слимы как пересечения Е П (Z+)m X {k}. Аналогично если {/*} перечислимо, то множество {k £ В | fh — не пустая функция} перечислимо как проекция области определения то- тальной функции / и все fk частично рекурсивны как ограничения f на перечислимые множества D (f) П (Z+)m х {fe}. Если {fh} — перечислимое семейство m-функций, то {D (fh)}—пе- речислимое семейство m-множеств (с тотальным пространством D(/)), a {E/ft} — перечислимое семейство (m + 1) — множеств (с тотальным пространством точнее, результатом перестановки мно- жителей в Г/). Перечислимое семейство {Eh} (соответственно {fk} ) называется версальным, если любое перечислимое m-множество (соответственно любая частично рекурсивная m-функция) содержится среди членов семейства. (Термин заимствован из современной геометрии; снята при- ставка «уни», указывающая в слове «универсальный» на однократно- сть вхождения всех членов семейства). В § 1 гл. III мы покажем, что для любого т вер сальные семейства существуют. Это — один из центральных результатов теории; тоталь- ные пространства и функции версальных семейств являются исход- 42
ними для исследований неразрешимости и многих других важных кон- струкций. Сейчас мы ограничимся простейшим и самым фундаментальным приложением. 5.8. Теорема. Пусть {Ek}—версальное семейство 1-множеств над базой В <= Z+. Тогда множество Е = {k\k 6 Ek} перечислимо, но неразрешимо. Доказательство. Пусть Е cz Z+ X Z+ — тотальное про- странство семейства. Тогда F = проекция на 1-й множитель Е П (диагональ в Z+ х Z+) и по- тому перечислимо. С другой стороны, для любого k£ В, F' = Z+ П F =# Ек, ибо k принадлежит либо F, либо Ek, но не обоим множествам вместе. Так как {Д/г} — версальное семейство, то F не может быть перечислимым. Теорема доказана. Покажем теперь, как использовать перечислимые семейства для усиления результатов п. 5.2 и 5.4. Вернемся к обозначениям начала этого параграфа. 5.9. $ замкнуто относительно объединения элементов любого пе- речислимого множества семейства подмножеств Е. Действительно, пусть {E'k} — такое семейство, Е' —его тоталь- ное пространство, Е' s (Z+)OT X (Z+)n. Тогда (J Ek = проекция Д' tea на (Z+)m 5.10. Пусть {fk} — перечислимое семейство частичных функций на Е, E‘k = D (fк), Е — (J Ek и yfi, j £ B, ft |£' E. f71£; e' kQB ’ f Тогда существует единственная функция f £ R (Д'), склеенная из ft. Действительно, график Г/перечислим как объединение перечисли- мого семейства перечислимых множеств Г( . Приведем в заключение несколько результатов о структуре %. В силу предложения 5.6 достаточно ограничиться подмножествами Z+. 5.11. Предложение. Существуют перечислимые подмножества F cz Z+ с бесконечным дополнением, такие, что для любого бесконечно- го Е имеем F П $ Ф 0, так что F f| Д бесконечно. Такие Д называются простыми-, с точки зрения наших топологи- ческих представлений они подобны плотным открытым множествам. Доказательство. Пусть {Ек} — версальное семейство 1-множеств над Z+ с тотальным пространством Д cz Z+ X Z+. По- ложим Д' = Е П {<fe, х> | х > 2k}. Так как Д' перечислимо, су- ществует примитивно рекурсивное отображение с образом Д': g = (gi- gj Z* Е‘- 43
Положим h (k) = min {z | gx (г) — k}, f (k) — g2 (h (fe)) и обозначим через F множество значений /. Дополнение к F бесконечно, ибо f (k) > 2k. Пересечение F с любым бесконечным Eh непусто, ибо все значения g2 (г) при gr (г) = k лежат в Eh П Е' #= 0. Предложение доказано. 5.12. Предложение, а) В фактор-решетке $ /(конечные множества) существуют нетривиальные максимальные элементы. б) Любое непростое перечислимое множество с бесконечным допол- нением содержится в таком элементе. в) Существуют простые перечислимые множества с бесконечным дополнением, не содержащиеся в нетривиальном максимальном множе- стве. За доказательством этого и многих других результатов мы отсы- лаем к книге Роджерса [2]. 6. КОНСТРУКТИВНЫЕ ОБЪЕКТЫ И АЛГОРИТМЫ 6.1. В этом параграфе мы кратко опишем те понятия теории вы- числимости, в которых большой упор делается на реализацию процес- са вычисления, а само вычисление понимается как детерминированная обработка данных, представленных не обязательно целыми числами. Эти понятия возникают как конкретизация (в форме математичес- ких определений) нескольких интуитивных понятий: а) универсума конструктивных объектов; б) универсума предписаний по переработке конструктивных объ- ектов, т. е. описаний алгоритмов; в) универсума устройств, способных реализовать работу алгорит- мов; г) универсума процессов работы этих устройств. Разберём эти понятия по очереди. 6.2. Конструктивные объекты. Каждый конструк- тивный универсум представляет собой конечное или счетное множе- ство объектов, допускающих финитное описание в некотором языке. Чтобы превратить это представление в математическое определение, конструктивные объекты часто отождествляют с этими описаниями. Вот примеры. а. Целые числа как конструктивные объекты можно представлять себе в виде наборов палочек: I, II, III, IIII ..., которые изображают соответственно 1, 2, 3, 4... Конечные последовательности целых чисел можно представлять наборами таких палочек, разделенными нулями. б. Если задан конечный алфавит Л, слова в этом алфавите, т. е. конечные последовательности букв из А, являются конструктивными объектами. в. Можно объявить, что в качестве универсума конструктивных объектов выбираются конечные неориентированные графы. При этом подразумевается, что квалифицированный читатель сам вообразит се- 44
бе несложный формальный язык, такой, что явно описываемые слова в этом язвше будут отвечать таким графам. Еще один пример: объеди- нение первых этажей теоретико-множественного универсума V в ко- нечном или счетном числе (см. Д и ДН, с. 101) является конструктив- ным универсумом. Он состоит из конечных множеств, элементами ко- торых являются конечные множества, и замкнут относительно опе- раций объединения, конструкции пар, перехода к множеству подмно- жеств и т. п. 6.3. Описания алгоритмов. Данному в.п. 2.2 опреде- лению функции ргр : (Z+)" -> Z+ может отвечать примерно такое описание алгоритма, который перерабатывает последовательности па- лочек, разделенных п нулями, в последовательности палочек. а) В предъявленной последовательности найдите (г — 1)-й слева нуль и г-й слева нуль. б) Сотрите все знаки, находящиеся левее (i— 1)-го нуля (вклю- чая его) и правее i-го нуля (включая его). Аналогичные рецепты мож- но дать для вычисления остальных простейших функций из § 2. Эле- ментарные операции над простейшими функциями сводятся к соеди- нению описаний алгоритмов, вставлению цикла и т. п. Степень подробности, с которой должно быть составлено описание алгоритма, и степень формализованное™ языка описания, чевидно, зависят от структуры устройства, которое будет выполнять алгоритм. Человеку может хватить нескольких неформальных указаний, ЭВМ должна получить не просто формально правильный текст, но даже физически правильно реализованный текст (в виде колоды перфокарт с жесткими допусками на размеры и прочность самих карт и пробитых в них отверстий). Очень важно, что формализованные описания алгоритмов сами мо- гут рассматриваться как конструктивные объекты и, в частности, подвергаться переработке в ходе вычисления (см. гл. IV). 6.4. Вычисляющие устройства. Эти устройства должны реализовать некоторые элементарные операции над конструк- тивными объектами («добавлять и стирать палочки») и логические опе- рации, предусмотренные описанием алгоритмов, состоящие в выборе очередного действия. Детальный анализ одного из наиболее эконом- ных наборов элементарных шагов был впервые проведен Тьюрингом в знаменитой работе, ставшей провозвестницей нынешней эпохи ком- пьютеров. Мы не будем воспроизводить здесь описания «машины Тью- ринга», которое читатель сможет найти во многих книгах (см., напри- мер, [6—9]). Подчеркнем снова, что вычисляющее устройство (в разумной идеа- лизации) может быть описано конечным текстом и потому снова мо- жет рассматриваться как конструктивный объект. Но обычно в опи- сании «устройства» отделяют переменную программную часть от неиз- меняющегося «железа». Универсум вычисляющих устройств может 45
появиться при исследовании системы взаимодействующих автома- тов. 6.5. Связь с рекурсивными функциями. Чтобы связать эти представления с теорией рекурсивных функций, исполь- зуют стандартный прием: нумерацию всех встречающихся универсу- мов целыми числами. Экспериментальный факт, который можно счи- тать дополнением к тезису Черча, состоит в том, что всегда существу- ют простые и естественные нумерации, после применения которых все представления о вычислимости адекватно переводятся на язык рекурсивное™. В IV гл. мы изложим некоторые результаты математи- ческой теории нумерации, которые оправдывают принятия точки зре- ния, что теория алгоритмической вычислимости без потерь сводится к теории рекурсивной вычислимости. Но, как мы уже отмечали, это не относится к теории алгоритмических вычислений с ее проблемами минимизации числа действий, объема памяти, задачами исследова- ния топологии вычислительных процессов (возможности параллель- ного вычисления) и т. п. Глава II ДИОФАНТОВЫ МНОЖЕСТВА И АЛГОРИТМИЧЕСКАЯ НЕРАЗРЕШИМОСТЬ 1. ОСНОВНЫЕ РЕЗУЛЬТАТЫ 1.1. В § 4 гл. 1 было доказано, что перечислимые множе- ства суть проекции множеств уровня примитивно рекурсивных функ- ций. Среди последних содержатся многочлены с коэффициентами из Z+; назовем проекции их уровней диофантовыми множествами', этот класс не расширится, если разрешить коэффициентам лежать в Z. Основная цель этой главы — доказать следующий тонкий результат. 1.2. Теорема. Перечислимые множества диофантовы, следователь- но, эти два класса множеств совпадают. В § 2 описан план доказательства. Ажурные, хотя н совершенно элементарные конструкции, составляющие само доказательство, со- держатся в § 3—7; читатель может их опустить без ущерба для пони- мания дальнейшего. В § I гл. III на основе теоремы 1.2 будет установлено существова- ние версальных семейств перечислимых множеств и функций; в § 5 гл. 1 было показано, как из этого следует существование неразреши- мых перечислимых множеств. В гл. IV будет существенно использоваться следствие из теоремы 1.2: перечислимые множества выразимы & языке Lx Аг (см. Д и НД). Действительно, диофантовы множества по самому их определению вы- ражаются формулами зхг ...зхп (р), где р — атомарная формула. 46
Оставшаяся часть этого параграфа посвящена описанию самых эф- фективных приложений теоремы 1.2: решение десятой проблемы Гиль- берта, конструкция многочленов, принимающих только (и все) про- стые значения и Z+ и т. п. 1.3. Десятая проблема Гильберта. Гильберт сфор- мулировал ее так: «Пусть задано диофантово уравнение с произволь- ными неизвестными и целыми рациональными числовыми коэффици- ентами. Указать способ, при помощи которого возможно после конеч- ного числа операций установить, разрешимо ли это уравнение в целых рациональных числах». Покажем, что из объединения теоремы 1.2, выводимой из нее тео- ремы 5.8 гл. I и тезиса Черча вытекает неразрешимость этой пробле- мы. Прежде всего любое натуральное число есть сумма четырех квад- ратов целых чисел (Лагранж). Поэтому разрешимость уравнения f (хн ..., хп) — 0 в (Z+)n равносильна разрешимости уравнения 4 4 f (1 + У, yh, ..., 1 + у yin) = 0 в (Z)4 Следовательно, достаточ- (= 1 i=t но установить алгоритмическую неразрешимость массовой пробле- мы «распознавание наличия решений в (Z+)"» (см. п. 2.6 гл. 1). Пусть Е с Z+ — перечислимое, но не разрешимое множество. Представим его в виде проекции на t — координату 0-уровня мно- гочлена ft = f (t\ х1( ..., xn) = 0, f £ Z [/, x1( ..., xj. Уравнение fi0 ~ 0; 4 € 2+ разрешимо, если и только если t0 £ Е. Согласно обсужде- нию в § 2 гл. V соответствующая массовая проблема для семейства {/Д алгоритмически разрешима, если и только если характеристичес- кая функция Е вычислима. Но по выбору Е она только полувычислима. Таким образом, разрешимость в целых числах нераспознаваема уже для подходящего однопараметрического семейства уравнений. Число неизвестных в нем (и вообще коразмерность проекции, подра- зумеваемой в теореме 1.2) может быть сведено до 9 (Ю. В. Матиясевич). Точный минимум неизвестен, хотя очень интересен. Подчеркнем, наконец, что конструкция диофантова представления любого перечислимого множества Е совершенно эффективна в том смыс- ле, что по заданному рекурсивному описанию функции f с D (f) — Е либо функции g eg (Z+) = Е соответствующий многочлен может быть выписан явно. То же относится к построению версального семейства, перечислимого неразрешимого множества и т. д. Все это — конструк- тивные утверждения, а не просто теоремы существования. 1.4. Многочлен, представляющий простые числа. Поиски «явных формул» для простых чисел были традицион- ным предметом занятий бескорыстных любителей теории чисел в про- должение долгого времени. Эйлер указал многочлен х2 + х + 41, принимающий длинный ряд только простых значений. Но давно бы- ло известно, что множество значений многочлена / из Z [х1( ..., хп] в 47
целых точках не может состоять лишь из простых чисел, например, потому, что если р, q два достаточно больших простых числа, то срав- нение f .=s 0 mod pq разрешимо (бесконечно многими способами). С другой стороны, в классе примитивно-рекурсивных функций задача уже решается: функция {ii-e простое число} сама примитивно рекурсивна (ср. с § 1 гл. IV), но по тривиальным причинам. Нетривиальная постановка вопроса и его решение снова связаны с теоремой 1.2: множество простых чисел есть множество всех положи- тельных значений некоторого многочлена с целыми коэффициентами в точках из (Z+)" (или, если угодно, из (Z)4n: ср. редукцию в п. 1.3). Один из возможных многочленов явно выписан в § 8 этой главы. Специфика простых чисел в этом общем результате никак не участ- вует: 1.5. Предложение. Пусть Е S Z+ —диофантово множество. Тог- да существует такой многочлен g g Z [х0, ..., хп], что Е совпадает с множеством положительных значений g в точках из (Z+)n+i Доказательство. Пусть Е — проекция на х0-координату 0-уровня многочлена / (х0, хх, ..., хп). Положим g = х0(1 — /2 (х0, х,, хп)|. Ясно, что положительные значения g — это в точности элементы Е. Остается воспользоваться тем, что множество простых чисел раз- решимо и потому диофантово в силу теоремы 1.2. Множествами натуральных значений многочленов являются так- же: 1.6. Последовательности {1, 10, 100.10*, ...} или {1, 22, З33,... „ .-п , . . (п раз), ...}. Удивительно, как значения соответствующего многочлена прова- ливаются до нуля и ниже в окрестностях точек, где они так огромны. 1.7. Множество Ферма {п | п > 2 и хп 4- уп 4- z" = О разрешимо в Z). Таким образом, переменную п можно из экспоненты перевести в коэффициенты диофантова уравнения. 1.8. Множество {10 102 ..., 10п<§п, ...}, где Si — i-я после запятой цифра десятичного разложения е (или л, или |Z2, или любого другого «вычислимого» иррационального числа). 1.9. Множество всех неполных частных е или л, или у^2 при раз- ложении в непрерывную дробь. Напомним, что для {^2 до сих пор неизвестно даже, конечно или бесконечно это множество. Эти примеры показывают, что к задачам о разрешимости диофанто- вых уравнений сводятся многие теоретико-числовые вопросы. В гл. IV мы убедимся, что в некотором смысле слова к ним сводится вообще «почти вся математика». 48
2. ПЛАН ДОКАЗАТЕЛЬСТВА 2.1. В этом параграфе введены некоторые вспомогательные поня- тия и описан план доказательства теоремы 1.2. Временно введен класс множеств, промежуточный между перечи- слимыми и диофантовыми. Чтобы определить его, рассмотрим ото- бражение, которое ставит в соответствие каждому подмножеству Е s (Z+)n новое подмножество F s (Z+)n по следующему правилу: <х1( ..., х„> Q F k £ II, xj, <Х1, .., .¥n_i, /?> Q Е. Мы будем говорить, что F получилось из Е применением ограничен- ного квантора общности по и-й координате. Аналогично определяется применение по любой координате. 2.2. Определение—лемма. Рассмотрим следующие три класса под- множеств в (Z+)n при всевозможных п. I. Проекции множеств уровня примитивно-рекурсивных функций. II. Наименьший класс множеств, содержащий множества уровня многочленов с целыми коэффициентами и замкнутый относительно опе- раций конечного прямого произведения, конечного объединения, конеч- ного пересечения, проекции и ограниченного квантора общности. III. Проекции множеств уровня многочленов с целыми коэффициен- тами. Тогда справедливы следующие утверждения: а) Класс I совпадает с классом перечислимых множеств, а III — с классом диофантовых множеств. Множества класса II будем называть D-множествами. б) I гэ 11 =э III. Доказательство, а) Совпадение примитивно перечислимых множеств с перечислимыми было установлено в теореме 4.3 гл. I. Ос- тальное — определения. б) Не совсем очевидно только включение II с: I. Прежде всего множество m-уровня многочлена f является множеством 1-уровня при- митивно-рекурсивной функции (/— т)2 + 1. Поэтому для проверки включения II о I достаточно установить, что класс I замкнут относи- тельно операций прямого произведения, объединения, пересечения (все в конечном числе и ограниченного квантора общности. Кроме последнего, все это установлено в лемме 4.8 гл. I. Наконец, пусть примитивно перечислимое множество F является образом Е относительно ограниченного квантора общности: —, xn_j, Хц1) £ F k хп, <х1( ..., xn_lt k> £ Е. Мы ХОТИМ построить ПО функции f (хг, ..., Хп_1, уъ .... ут), 1-уро- вень которой проектируется на Е, новую примитивно рекурсивную функцию g, 1-уровень которой будет проектироваться на F. 49
Естественная мысль — рассмотреть в качестве приближения к g произведение П /(Л....xn_lt fe; ylk.утк\ i = 1 где (yik) — «независимые переменные». Неприятное обстоятельство состоит в том, что число аргументов этой «функции» растет вместе с хп. Чтобы справиться с этим, применим функцию Геделя Gd (k, f), определенную в п. 4.9 гл. V. Функция g будет зависеть от хг, ..., хп и т дополнительных аргументов ..., tm. g(Xi,..., хп; П f(xl,...,xn_1,k;Gd(k,t1),...,Gd(k,m)). 4 = I Она примитивно рекурсивна, потому что /г-й сомножитель получается из f и Gd подстановкой и отождествлением аргументов, а затем g стро- ится по этому сомножителю рекурсией. Проверим, что множество F является проекцией 1-уровня функции g на <хь ..., хп>-координаты. Действительно, если g (хг, ..., tm) = 1, то для всех 1 k хп имеем f (*х..k, .... Gd (k, tm)) = 1, т. e. для всех 1 k хп точка О',, ..., хп~г, k> принадлежит Е Это значит, что .... xn> £ F. Наоборот, если <х1( , xn> С Р> мы можем поднять точку <хь ..., xn_1; fc>, 1 k хл, на 1-уровень /. Пусть (/-координа- ты этой точки будут гл h, ...,ут Решим систему уравнений относительно tt. Gd (k, (,) = уi k для всех 1 k xn. Это возможно по основному свойству Gd. Найденные значения аргументов tt вместе с х1( ..., хп обращают g в единицу. Это заканчивает доказательство леммы 2.2. 2.3. Дальнейший план работы следующий. В §3 показано совпадение классов 1 и 11, в §4—7 — совпадение классов II и III. 2.4. Замечания. По ходу доказательства леммы 2.2 мы получили следующие простые факты, которые следует постоянно иметь в виду: а) В определениях классов I—III всюду можно заменить множе- ства уровней на множества 1-уровней (перейдя от / к (/ — m)2 + 1). б) Все классы I—III замкнуты относительно операций произве- дений, пересечений, объединений (все в конечном числе) и проекции. (Доказательство этого для класса I в лемме 4.8 гл. V применимо и к классу III). Ограниченный квантор общности доставляет значительно большие трудности. На самом деле, замкнутости класса диофантовых множеств 50
относительно него посвящена наиболее техническая часть доказа- тельства в § 4—7. 3. ПЕРЕЧИСЛИМЫЕ МНОЖЕСТВА ЯВЛЯЮТСЯ D-МНОЖЕСТВАМИ Пусть f : (/*)"-> Z-p —примитивно-рекурсивная функция. Ее 1-уровень можно представить в виде проекции на первые п координат множества Гу | (Z+)n X {1} 1, где Гу — график /. Поэтому любое перечислимое множество можно получить в виде проекции пересе- чения графиков двух примитивно-рекурсивных функций. Так как класс D-множеств замкнут относительно проекций и пересечений по определению, то для доказательства утверждения, вынесенного в за- головок, достаточно установить следующий факт. 3.1. Предложение. Графики примитивно-рекурсивных функций яв- ляются D-множествами. Доказательство. Графики простейших функций диофан- товы. Устойчивость свойства графиков «быть D-множествами» отно- сительно композиции и соединения функций проверяется тем же рас- суждением, что и в доказательстве леммы 4.8 гл. V. Остается разобраться с рекурсией. Конечно, нам понадобятся сведения о графике функции Геделя. Здесь удобнее пользоваться gd вместо Gd. 3.2. Лемма. График функции Геделя gd (и, k, t) — rem (1 + kt, и) является диофантовым и тем более D-множеством. Доказательство. Множество Г„а = {<и, k, t, у > | у = остаток от деления и на 1 + kt} яв- ляется пересечением следующих двух множеств в (Z+)1: у 1 + kt, Е2 : и — у 0 и делится на 1 + kt. Оба они диофантовы. Действительно, Ех есть проекция множества 0-уровня многочлена 2 + kt — у — ух, Е.г — проекция множества 0-уровня многочлена и — у — (1 + kt) (у2 — 1). Лемма доказана. 3.3. Следствие. Пусть f, g — функции от п и п 2 аргументов, графики которых являются D-множествами. Тогда D-множества опре- деляют следующие уравнения'. Е : gd («, 1, t) = f (xu ..., xn), F : gd («, xn+i + 1, t\I = g (xu .... xn+1, gd (u, xn+l, t)) в пространствах (xn ..., xn+1, u, t...) (где многоточием обозначены любые дополнительные координаты). Доказател ьство. Введение лишних координат сводится к прямому умножению на (Z+У’, которое, конечно, переводит D-мно- жества в D-множества. 51
Е можно представить в виде проекции пересечения множеств gd (u, k, t) = w, f (xlt ...» xn) = w, k = 1 (fe, w — вспомогательные координаты). Так как Tgd и Гу суть D-множества, то же верно для Е. Аналогично F можно представить в виде проекции пересечения множеств gd (ц, xn+1 + 1, t) = wlt gd («. xn+1, t) = w2, g(xlt xn+1, ay2) = wv Они являются D-множествами вместе c Tg и rgd. 3.4. Доказательство предложения 3.1. Напомним, что нам осталось проверить следующее утверждение. Даны функции f, g, как в следствии 3.3. Функция h определяется по ним рекурсией: h (хь ..., Хп, 1) = f (xlt ..., xn), h (xlt .... xn, k 4- 1) = g (xx, .... xn, k, h (xx, .... xn> fe)). Тогда график ГЛ <*i....*n+i> Л > € rh -<==> T] = h (xx... xn+1) является D-миожеством вместе с графиками Гу и Гг. Первый шаг. Положим Г,, = Г1 U Г2, где xn+1 = 1 на Г1, хп+1 > 2 на Р. Так как <*i....х»+1. Л > € Г1 <==> {Xn+i = 1 }> {Л = f (хи ..., хп)}, то Г1 есть пересечение Гу иО-множества и потому является D-множе- ством. Остается проверить, что Г2 — тоже D-множество. Второй шаг. В пространстве с координатами <хп .... хп+1, г], и, рассмотрим множества Di : Л = gd (и, х„+1, О, Е2 : gd (u, 1, /) = f (xlt ..., xn), £з : хв+1 > 1, gd (и, k, f) = g (xu .... xn, k — 1, gd (u, k — 1, /)) для всех 2 k xnM. з Легко проверить, что Г2 = pr f) Et. i— i Как в § 4 гл. V, включение в одну сторону получается сравнением Ег, Ез с индуктивным определением ft, а в другую — подбором пара- метров и, t в функции Геделя. Поэтому остается проверить, что Et суть D-множества. Третий ш а г . Е± есть график gd с лишними координатами; Е2 разобрано в следствии 3.3. 52
Наконец, Ез «почти» получается из множества F, описанного в следствии 5.3, применением ограниченного квантора общности по координате хп+х. Точнее (не обращая внимания на координату q, для сокращения записи): x„+J, и, О £ Е3 -=>- у k € Г2. хп+1], (xlt..., xn, k — l, u,ty £F yk 6 [ 1, xn+1 —1], (Xx,..., xn> k, u, ty £ F. Следовательно, применяя к F ограниченный квантор общности по хп+1, мы приходим к D-множеству, которое получается из Ез умень- шением хп+1-координаты всех точек Ез на 1. Поэтому остается убе- диться, что операция обратного сдвига на 1 сохраняет свойство «быть D-множеством», что легко следует из определений. Доказательство закончено. 4. РЕДУКЦИЯ 4.1. Ближайшие три параграфа посвящены доказательству того что класс D-множеств совпадает с классом диофантовых множеств- Как было замечено в конце § 2, для этого достаточно проверить, что класс диофантовых множеств замкнут относительно ограниченного квантора общности. Пусть f (хъ ..., xn, k, уг, ..., ут) — некоторый непостоянный мно- гочлен с целыми коэффициентами. Он считается фиксированным до конца этого параграфа. Пусть d — его степень, С — сумма модулей коэффициентов. Определим множество Е из условия <Хх,..., хп, уУ^Е -==- » Ут>> f №.....хп, k, уг....ут) = 0. Мы хотим установить, что Е диофантово (для любого выбора f). В этом параграфе доказан следующий редукционный результат. 4.2. Предложение. Е диофантово, если диофантовы следующие три множества: Хх = х^»; Xj =х2!; Д1. =/х3/х4\ { v I’ Л3 Л4 *2 \ / где = /Чга--1)..Ип—^+1>---------^биномиальный коэффициент». Доказательство этого и всех последующих предложений такого ти- па строятся по единой схеме. Чтобы установить диофантовость Е, вве- дем вспомогательные множества Е( со следующими свойствами: 53
N a) E = проекция f| Eh i=*l 6) Et диофантовы. Обычно, однако, непосредственно установить диофантовость всех Ei не удается, и к некоторым из них применяется аналогичная проце- дура. Таким образом, схема полного доказательства является дере- вом. Литературное оформление каждого шага состоит из следующих этапов: введение вспомогательных переменных, пропадающих при проекции; конструкция множеств Е, с помощью явных соотношений; N доказательство включения Е ,s pr (~| Et доказательство включения i=i Е Э pr f) Е}. <=1 4.3. Доказательство предложения 4.2. Вспомогательные переменные обозначим символами У, А/, К, Уц Ут- Множества Et в пространстве <%!, .... хп, у, У, М, К, Yi........ Ут> введем следующими соотношениями: Ei : N > С (*!...xnyY)d, У < Уъ ..., У < Ут (содержательный смысл правой части первого неравенства — грубая оценка для значения многочлена / в точке ..., хп, у, уг, ..., ут>> если у, yt < У), У Ег: 1 +/OV!= П (1 +Ш) fe = i (это — «большой модуль»; равенство / нулю будет заменено делимо- стью на него.) Е3-.Цхъ..„ хп, К, У1,..., Ут) = 0 mod 1 +О!, E3+i : П (У г -/) 0 mod (1 + KNV), i = 1,..., tn. m+3 Множество E' определяется как р| i~\ Доказательство включения Е s pr Е'. Дана точка <%!, ..., хп, у > £ Е; мы должны подобрать зна- чения остальных координат так, чтобы выполнялись соотношения Ei, ..., Ет+з. Согласно определению Е каждую точку <xlt ..., хп, k>, k^y, можно поднять до 0-уровня /: / (Xi, ..., Хп, k, yih, ..., Угпк ) 0. t>4
Возьмем в качестве Y максимум у, ylh. Затем, как и выше, отыщем Yt и N, решая систему уравнений Геделя gd (Yь k, N!) = ylk для всех 1 k С у. Доказательство леммы Геделя показывает, что Уг, М можно взять как угодно большими, в частности, удовлетворив Ег. Число К одно- значно определится из Е2- Все -выборы уже произведены. Соотношение E3+i выполняется потому, что среди чисел Yt—j при Y для каждого k у найдется Yt — yih = ® mod (1 + feAf!) по определению Yt и gd. Следовательно, произведение слева в E3+i делится на все 1 + fe^!, 1 k у, которые попарно взаимно простые, ибо М у по Ег. Таким образом, это произведение делится . на 1 + KN! Наконец, для проверки Е3 заметим, что из Е2 вытекает сравнение К = k mod (1 + kN!), 1 k у, потому что (1 + /<W!) — (1 + + feAf!) = 0 mod (1 + feAf!). Но тогда, учитывая, что yih =э Y; mod (1 + &ЛП) по выбору Yi, находим f(xlt ..., хп, К; л,.... Y т) = f (xlt .... хп, k, ylk, ..., ymh) 53 = 0 mod (1 + kN!). Отсюда следует E3 в силу попарной взаимной простоты модулей 1 + kN! Доказательство включения pr Е' s Е. Дана точка <%!, ...хп, у, Y, N, К, Yu ..., Ут>, координаты которой удовлетво- ряют соотношениям Еъ ..., Ет+з. Мы должны подобрать для каждо- го k у такой вектор <у^ чтобы f Xn, k, yih, ...» Утк) O’ С этой целью обозначим через pk любой простой делитель числа 1 + kN! и положим У Ik — остаток от деления Yt на pk. Покажем, что этот выбор дает требуемое. Из Еэ следует, что f (М, .... хп, k, ylk. ymh) = 0 (ph). Остается проверить, что число в левой части сравнения меньше р^. Имеем: pk делит П (Yi — j) в силу E3+i => pk делит Уг — / для некоторого j Y ylk = остаток от деления Уг на ph Y => f (хъ ..., хп, k, У1К, Утк) С (х1г ..., XnyY)d < N <ph (предпоследнее неравенство следует из а последнее из того, что Ph делит 1 + kNV). 55
О ко нчание доказательства. Остается проверить, что диофантовость множеств Еи Ет+з следует из диофантовости множеств, описанных в предложении 6.1. Действительно, тривиальное введение вспомогательных перемен- ных (для подстановок) позволяет свести проверку диофантовости всех Ei сначала к диофантовости множеств х1 = х2\', Xj= П (1 -Их3); k «с х. Xj= П (X2 —/), X2 > X3. i < x. После этого остается заметить, что второе из этих соотношений можно представить в виде Х1 = х^! х21 Р , \ I а третье — в виде \ / Предложение 4.2 этим доказано. 5. КОНСТРУКЦИЯ СПЕЦИАЛЬНОГО ДИОФАНТОВА МНОЖЕСТВА 5.1. В этом параграфе мы начнем доказательство диофантовости множеств, введенных в предложении 4.2. Чтобы лучше уяснить ход доказательства, укажем, что самое существенное препятствие — бы- стрый рост одной из координат по сравнению с другими (например, Xj = х2!). Дж. Робинсон принадлежит важная идея: она показала,’ как из диофантовости любого конкретного множества в (Z+)2, одна из координат которого растет быстрее любой степени другой, но мед- леннее хх (например, как экспонента), можно ввести диофантовость всех перечислимых множеств. После этого Матиясевичу и независимо Чудновскому удалось установить диофантовость множества такого типа, связанного с числами Фибоначчи. Историю вопроса см. в статье Ю. В. Матиясевича [181. В этом параграфе приведена конструкция из более поздней статьи Ю. Матиясевича и Дж. Робинсон, являющаяся усовершенствованным вариантом первых построений. Замысел ее основан на следующем со- ображении. Пусть х2 — dy2 = 1 — уравнение Пелля (d £ Z+ — це- лое число, не являющееся полным квадратом). Его решения <Zx, у> С (Z+)2 образуют полугруппу относительно закона компо- зиции (ХЕД ух]/d) (х2 + у2 /d) = х34- ys Vd. 56
Эта полугруппа циклична. Иными словами, пусть ух> — реше- ние с наименьшей первой координатой. Тогда любое другое решение имеет вид <.хп, уп>, где п £ Z+, и. х п + Уп Vd = (xi -f- у г Vd)n. Число п Назовем номером решения <Zxn, уп>- Координаты хп, уп растут с п экспоненциально, так что множество решений уравнения Пелля, а также его проекции на х- и //-оси явля- ются диофантовыми множествами логарифмической плотности. Это — еще не то, что нужно: основная трудность состоит в том, чтобы вклю- чить номер решения п в число координат диофантова множества — только тогда мы получим возможность применить дальнейшие сообра- жения. Это и будет сделано ниже. 5.2. Обозначения. Рассмотрим уравнение Пелля с переменным d. Его первое решение меняется в зависимости от d, вообще говоря, очень неконтролируемым образом, поэтому удобно отобрать лишь часть d, для которых первое решение иметь простой специальный вид <Za, 1>, a £ Z+. Очевидно, тогда d = а2 — 1. Уравнение х2 —(а2 — l)z/2 = 1 будем называть а-уравнением. Оп- ределим две последовательности чисел хп (а), уп (а) как координаты его «-решения: хп (a) +yn(d) V а2 -1 == (а + /а2 — О". Формальное определение хп (а) и уп (а) как многочленов от а легко дать индукцией по п. Тогда выражения хп (а), уп (а) будут иметь смысл для всех п £ Z и а £ С. В частности, ^п (О ~ 1, Уп (1) ~ при этом все приводимые ниже формулы останутся справедливыми. Основным результатом этого параграфа является 5.3. Предложение. Множество в <Zy, «> <£>-пространстве Е : у = уп (а), а > 1 является диофантовым. В доказательстве используются элементарные теоретико-числовые свойства последовательностей (а), уп (а). Их проверки в основном отнесены в конец параграфа (см. п. 5.8). Идея диофантового восстановления п по <Zy, а> состоит в заме- чании, что уп (а) == п mod (а — 1) (лемма 5.4). Это однозначно определяет п, если только п < а — 1. Чтобы перейти к общему случаю, вводится вспомогательное А — уравнение с боль- шим А, и его zi-e решение, которое следует (с помощью у) определить так, чтобы использовать п лишь в диофантовом контексте. 57
Формально диофантовость Е устанавливается по схеме, описанной в п. 4.2. Кроме основных переменных у, п, а, вводятся шесть вспомо- гательных: х; х', у'; А; х1г уг. Положим далее Е4 : у п, а >• 1; Ег : х2 — (а2 — l)z/2 = 1; Е3 : у’ = 0 mod 2x2z/a; Е4 : х'2 - (а2 — l)z/'2 = 1; Es : А = а + х'2 (х'2 — а); Е6 : х? - (Д2 - 1) у* = 1; Е, : ух — у 0 mod х'2; Es : yY = п mod 2у. 8 Пусть Е' = Л Е;. Покажем, что рг Е' = Е. Включение EsprE'. Дацы <Zy, п, а> £ Е; нужно по- добрать значения остальных переменных так, чтобы удовлетворить Еь ..., Е8. Как и выше, мы не будем вводить для них специальных символов; после выбора, скажем, значения х буква х далее становится именем этого значения. Е4 удовлетворяется автоматически: уп (а)^п для всех а~^ 1, 1 (индукция по п). Найдем единственное х из Е2: х = хп (а). В ка- честве <х', —-—> возьмем любое решение уравнения Пелля 2х- уг X2 — (а2 — 1) (2xV)2K2 = 1. Это даст Е4 • А однозначно находится из Е5. В качестве <х1(#4> возьмем п-е решение Д-уравнения. Все выборы произведены. Для проверки Е, и Е8 нам понадобятся две леммы; 5.4. Лемма. yk (а) = k mod (а — 1). 5.5. Лемма. Если а = b mod с, то уп (а) =s уп (Ь) mod о. Доказательства их см. в п. 5.8. Используются они так. Из Е5 находим А = а + (1 + az/'2) (1 + а/2 — а) = 1 mod 2у с учетом Е3. Лемма 5.4 тогда дает У1 = Уп (Д) = п mod 2у: это Е8. Лемма 5.5 дает уп (Д) = уп (a) mod х'2 (с учетом Е5): это Е7. Включение рг Е <= Е. Из соотношений Еп ..., Е8 мы дол- жны только вывести, что п есть номер решения <Zx, у>- Заметим, что п участвует лишь в Е8. 58
Временно обозначим через Af, АГ, номера решений <Zx, tf>, <х',у'>, <^xlt у±~> соответственно. Мы докажем, что n == М или п = —N mod 2у. Так как, кроме того, у^у п (Ех) и у~^ N (определение N), это дает N = п, что и требуется. Номер Nx будет «посредником» между п и N. Прежде всего из Е3 находим, как выше, А = 1 mod 2у и затем из определения Л\ и леммы 5.4 уг == Nr mod 2у. Но по Е8 ух=- п mod 2у, поэтому == п mod 2у. Далее, из Е3, А = a mod х'2 и затем У1 == Ум, И) s Ум, (a) mod х'2 по лемме 5.5. В силу Е1 у = yN (а) = у± mod х'2, поэтому yN (а) ss yN< (a) mod х'2. Для дальнейшего нам понадобятся еще две леммы, которые мы до- кажем в п. 5.8. 5.6. Лемма. Если yt (a) у} (a) mod хп (а), а > 1, то i = / или I а —/ mod 2п. 5.7. Лемма. Если у, (a)2/yj (а), то у, (а)/}. Лемма 5.6, примененная к N, Nlt N' вместо I, j, п, с учетом послед- него доказанного сравнения дает N == ± mod 2N’. j Лемма 5.7, примененная к Af, АГ вместо i, j, с учетом Е3 дает y/N'. Поэтому Az = ±А^ mod 2у. Так как мы уже установили, что AZ, = п mod 2у, это заканчивает до- казательство. 5.8. Доказательство леммы. Ьудем писать лпуп вместо хп («)> Уп («)• Из формулы хпк +УпкУа2 — 1 =(хп +упУ а2 — 1) 59
находим Упк = S /=Tu) В частности, Упь = kXn~' yn mod (a2 — 1), что дает лемму 5.4 при п 1. Кроме того, //пй = /гх^‘ уп mod у3п- Заменив здесь nk, k, п на п, n/k, получим п k Уп = — Xk Уп mod yl. Так как (хй, z/ft) = 1, находим отсюда уп = 0 mod yt => — = moa yh=^ п = 0 mod yh. что дает лемму 5.7. Выражение уп (а) в виде универсального многочлена от а, коэф- фициенты которого целы и зависят (вместе со Степенью) лишь от п, немедленно дает лемму 5.5, Остается доказать лемму 5.6. Прежде всего из равенства xn ± m + 1 уп ± т — (Хп 4"Р^Я 1 упУ (хт4; Р^Я! 1 Ут) находим %п ± т ~хп хт i (& Уп Ут> Уп ± т ~ хп Ут in' Отсюда fin ± т = Уп 4- (п Ь т) === хп Л т Уп mod Хп = 4z (® 1) Уп Ут mod Хп = 3= Ут mod хп и аналогично У&П ± т У%п+(2п dt === Уъп -t т HlOd Хп = У4. т mod Хп, Это означает, что как функция от k класс yk mod хп имеет период 4п; внутри же периода [1, 4«1 поведение определяется его первой четвер- тью [1, п\: Уъп ± т 4“ Ут> У ± т — Ут ^ри 1 /71 И,,
Теперь при а > 3 лемма 5.6 следует из этих факторов и из того, что ут < 0,5хп при 1 sC tn iC п. Действительно, 4ут < (а2 — 1) Уп +1 = Хп. При а — 2 имеем ут < 0,5хп только для т п — 1, но и этого достаточно для доказательства леммы. 6. ГРАФИК ЭКСПОНЕНТЫ ДИОФАНТОВ 6.1. Предложение. Множество Е : у = ап в <Zy, а, п> — пространстве диофантово. Доказательство. Достаточно проверить диофантовость Ео = Е (1 {а | а > 1}. При а >» 1 индукцией по п легко получаем (2а — 1)« < уп+х (а) < (2а)" в обозначениях § 5. Отсюда для любого N 1 имеем ап /1___!_\« = (2Л/а—I)'1 < уп+, <Na) < (2Уа)п а„ Л _ 1 \. \ 2Na ) (2Л/)" Vn+i "" (2N —1|" \ 22V/ Значит, если выбрать N столь большим, чтобы одновременно то получим ап — [z/n+1 (Na)!yn+V (AZ)1 (квадратные скобки здесь и ниже означают целую часть числа). Таким образом, Ео есть проек- ция множества Eti а > 1; 0 < Уп+1 (N)y — Уп+i (Na) < уп+1 (у), N > ?, где вместо ? нужно поставить подходящую нижнюю оценку N, в то же время позаботившись о диофантовости этого последнего соотноше- ния. Элементарные оценки показывают, что достаточно положить N > 4п (у + 1). Диофантовость £1 можно получить тогда из результатов § 5 с помо- щью введения тривиальных вспомогательных соотношений У'^Уп+AN) и у" =уп+1 (Л/а). 61
7. ГРАФИКИ ФАКТОРИАЛА И БИНОМИАЛЬНЫХ КОЭФФИЦИЕНТОВ ДИОФАНТОВЫ В этом параграфе проведена последняя серия рассуждений. 7.1. Предложение. Множество Etr = (^, n^k, в <f, k, п>-пространстве диофантово. Здесь по определению (—'j = п(га~... (д—Н-1), для доказа. \ k j 41 тельства нужна следующая лемма. 7.2. Лемма. Если и > га*, то (= остаток от деления [(га + !)"/«*] на и. Доказательство. Имеем (« + !)"/«* = 2 №и‘~*+1ь} + • = 4+1 V / \К/ ' = 0 V / Первая сумма делится на и, а последняя меньше единицы при и > nk. 7.3. Доказательство предложения 7.1. Введем вспо- могательные переменные и, v и соотношения Ех : и > га*; Е2 : v = [ (и + !)"/«*]; Ез : г == v mod и; Et : г < га; Е5 : га k. Из леммы немедленно следует, что Е = pr Q Et. Диофантовость Et <=1 следует из диофантовости экспоненты; диофантовость £3, и Еъ оче- видна. Диофантовость £2 становится ясной, если представить Ег в виде (и + 1)" ukv < (га + 1)" + га* и воспользоваться снова диофантовостью экспоненты. Предложение доказано. 7.4. Предложение. Множество Е : т — k\ диофантово. Г 7.5. Лемма. Если й > 0 и п> (2й)*+\ то й! = (Доказательство получается легкими оценками.) Доказательство предложения. Вспомогательная пере- менная га; соотношения 62
Eit п> (2й)^ + ь, Е2: tn = Дальнейшее очевидно (используются доказанные ранее диофанто- вость экспоненты и биномиальных коэффициентов). 7.6. Предложение. Множество У \ /г / в пространстве <Zx, у, р, q, k> — диофантово. Доказательство является некоторым усложнением плссмждений из п. 7.2, 7.3. 7.7. Лемма. Пусть а^> О — такое целое числи, что и s= и (q,{k!) и а> 2Р'1 ph+1. Тогда а-1 [а24+1 k / (1 4-а"2)в/Д— a[a2i-' (1 + а"2)р/‘']. Доказательство получается разложением (1 + a~2)p/j? в биноми- альный ряд Тейлора. Неравенство позволяет при переходе к целой части отбросить в первом слагаемом все члены, начиная с (k + 1)-го, а во втором — начиная с й-го. Сравнение а = 0 (gkk\) обеспечивает целость неполных сумм. 7.8. Доказательство предложения. Вспомогательные пе- ременные а, «!, u2> v- Соотношения : а = О mod qkk\\ Е2 :а>2Р-1р^1-, Е3 : «i/Ua = а-1 [aas+1 (1 + а-2)^/^]; Ei : v = а [а2*-1 (1 + а-2)^]. 4 Условие Е = рг Q Ei следует из леммы. Диофантовость Ei и £2 не- <=1 посредственно следует из диофантовости экспоненты и факториала. Диофантовость Ез и £4 устанавливается, как в конце п. 7.3; нужно не только избавиться от знаменателя, но еще и возвести неравенства в q-ю степень. Это завершает доказательство теоремы 1.2 о совпадении классов перечислимых и диофантовых множеств. 63
8. ДОПОЛНЕНИЯ После того как был доказан принципиальный результат о диофа- нтовости перечислимых множеств, появилось много работ, усовершен- ствующих доказательства и дающих более экономные диофантовы представления. В этом параграфе мы приведем несколько результатов такого рода, отсылая за доказательствами к оригинальным статьям. 8.1. Универсальный многочлен. Согласно теореме 1.2 всякое пере- числимое подмножество Z+ можно представить в виде проекции под- множества вида Р = 0 в (Z+)n+1, где Р — многочлен с целыми ко- эффициентами. В § 1 следующей главы мы несколько усилим этот ре- зультат, построив версальное семейство перечислимых подмножеств в Z+ и представив его в виде проекции подмножества вида U = 0 в (Z+)n+2 на Z+ X Z+, где U — многочлен с целыми коэффициентами. Назовем такой многочлен U универсальным. В его записи заключе- на программа для порождения всех перечислимых подмножеств Z+; важно знать, насколько сложно устроен U. Эту сложность можно измерять разными способами. Существенно было бы узнать, каково наименьшее возможное значение числа п, т. е. коразмерности проек- ции. Ю. В. Матиясевич показал, что можно построить универсальный многочлен U с п = 9, но у него очень большая степень — по оценке Дж. Джоунза, она имеет порядок 1,6 • 1045. С другой стороны, можно построить универсальный многочлен степени всего 4, но с п. = = 58. Другие возможные значения степени и коразмерности суть: (38,8); (32,12); (24,36); (19,2668). Еще одна естественная мера сложно- сти U — количество Q сложений и умножений, необходимое, чтобы вычислить любое его значение. Дж. Джоунз доказал, что можно по- строить U, для которого Q = 100. Приведем теперь два конкретных диофантовых представления. 8.2. Простые числа. Множество простых чисел совпадает с множе- ством положительных значений, которые принимает в целых точках многочлен степени 25 от 26 переменных (все буквы английского алфа- вита!): (k 4- 2) {1 — \wz.4- h 4- j — ql2 — [(gfe 4- 2g 4- k 4- 1) (/i + /) 4- Л — — z]2 — 12л + p 4- q + z — el2 — [16 (k 4- I)3 (k + 2) (n + I)2 + + 1 _ p]2 _ [e8 + 2) (a + 1)2 +- ! _ o2]2 _ [ (q2 _ J_ - x2l2 - [ 16/V (a2 - 1) + 1 - u2l2 — [ ( (a + u2 (u2 - a) )2 - -!)(« + 4d(/)2 + 1 — (x + cu)2l2 — In + I + v — у I2 - [ (a2 — — I)/2 4- 1 — m2]2 — lai 4- k 4- 1 — I — t]2 —• [p 4- I (a — n —• 1) 4* 4- b (2an + 2a — n2 — 2n — 2) — ml2 — [q + у (a — p — 1) + 4- s (2ap 4- 2a — p2 — 2p — 2) — x]2 — Iz + pl (a — p) -p t (2ap — — p2 — 1) — pm\2}. Этот многочлен был предложен в работе Дж. Джоунза, Д. Сато, X. Вада и Д. Вайэнса [22]. 64
8.3. Числа Фибоначчи. Они образуют последовательность 1, 1, 2, 3, 5, 8, ..., Wn+2 ^n+i 4~ Дж. Джоунз нашел, что в отличие от простых чисел эта последова- тельность совпадает с множеством положительных значений совсем простого многочлена пятой степени от двух переменных. 2а4Ь + а3Ь2 — 2a2Zr — а° — ab‘ 4 2а. Глава III СЛОЖНОСТЬ И СЛУЧАЙНОСТЬ 1. ВЕРСАЛЬНЫЕ СЕМЕЙСТВА Версальные семейства были определены и впервые исполь- зованы в п. 5.7 гл. 1; цель этого параграфа —доказать их существо- вание с помощью теоремы 1.2 гл. II о диофантовости перечислимых множеств. 1.1. Теорема. Для любого т^ О версальные перечислимые семейст- ва т-множеств и т-функций с базой Z+ существуют и могут быть эф- фективно построены. Следствие. Существуют перечислимые, но не разрешимые множе- ства. (Введено в п. 5.8 гл. I; использовано в п. 1.3 гл. II.) Доказательство. Мы разобьем его на несколько этапов. Напомним, что т<а> : (Z+)a-> Z+— примитивно-рекурсивный изо- морфизм, построенный в § 4 гл. I, <7(р, — обратный ему. Бу- дем писать tx, t2 для краткости. а) Нереальное семейство многочленов из Z+ [хг, х2, хз, ...1. Опре- делим многочлены f [I] £ Z+ х2,.хз, ...1 рекурсией по I £ Z+, 4: НП = / [21 == /=[3] = 1, f [4fe] = k\ f [4k + 11 — Xki I [4k + 2Г= НЛ (6)1 4- m (*)]; Л4Й + 31 = f[tx (&)im ж Определение корректно, ибо tx (k), t2 (fe) < 4fe + 2. Образ отобра - жения k f [fe| совпадает co всем кольцом, ибо он содержит Z+ (на местах 4k), все xh (на местах 4k 4- 1) и вместе с двумя многочленами f [fej и f их сумму (на месте 4т(2) (ku k2) + 2) и произведение (на месте 4т(а| (kx, k2) + 3). 3 лак. 1873 65
б) Конструкция версального /-семейства над Z+.. Положим Eh = проекция на ^-координату 0-уровня многочлена / I/, (*)1 - f [/2 (*)1. Так как все элементы Z [%!, х2, хз, ...1 представимы в виде таких раз- ностей, ясно, что семейство {£fe} содержит все перечислимые множе- ства. в) {£\} перечислимо. Мы должны установить перечислимость тотального пространства Е = {</, /> | i £ Ej} с Z+ X Z+. Запишем условие <Zi, j> g Е в виде логической формулы типа at (см. Д и НД), где все кванторы относятся к переменным, принимаю- щим значения в Z+. Учтем, что f [4 (/)! — t 1/2 (/)! € 2 [х1; .... х,-1. Имеем <(, /> 6 Е *=>- i 6 Е} 3.Г1... 3-х, (Xj = i К fWi (/)! - = f (h (/)]) 3' ((ЭМ- ЗМ V k С j (f [ft] = Gd (/г, /))) Д Gd(l. = Gd(2, /) = Gd(3, 0 = 0 Д Gd (5, f) = i /\ Gd(/1(/), /) =Gd (?2 (/), c)), где Gd (k, i) — функция Геделя (§4 гл. 1). Далее, по определению / [/г] 3%!... 3XjV4</(/[fe] = Gd(ft, Z)b=> v / ((ft < 3 Л Gd(ft, 0 = 0) V V з/((/г = 4/ Л Gd(/e, 0 = 0 V(^ = 4/ 4-2 Л Gd(/e, 0 = = Gd (0 (/), 0 4- Gd (Д (0, 0) V (^ = 4/ + 3 Д Gd (k, t) = = Gd (Д(/), 0Gd(/2(0> О)))- Здесь формула, следующая за 3/, определяет разрешимое множе- ство в <Zk, t, />-пространстве. Квантор 3/ превращает его в перечис- лимое, проектируя на <Zk, />-координаты, а ограниченный квантор yk sC j не .нарушает перечислимости (см. §2 гл. II). Переходя к формуле, определяющей Е, мы обнаруживаем, что нужно пересечь построенное множество еще с тремя разрешимыми и спроектировать вдоль /-оси, так что результат снова перечислим. г) Конструкция версального m-семейства над Z+. Случай т = 0- тривиален; т = 1 уже разобран; т 2 сводится к т = 1 с помощью изоморфизма т<т): (Z+)m^Z+. Пусть Ек = Ety — версальное 1-семейство; положим — = М’1 (£*)• 66
Перечислимость {Е^>} следует из того, что £(т) = (<х, й> I X е Е<”>} = {< (т^)-1 (х), fe> I X G E4>} — pri)-1 Elli. д) Конструкция версального семейства 1-функций. Рассмотрим версальное семейство 2-множеств {£(р } с остальным пространством £(2) = (<х, у, k> | <х, у> е с (Z+)3. Пусть g (х, у, k, z) — примитивно рекурсивная функция, проекция 1-уровня которой на <х, у, &>-пространство совпадает с Z^2). Поло- жим f (х, fe) — (min {и | g (x, (u), k, tty («)) = 1. Утверждается что {fk (x) — f (x, k)} есть версальное семейство 1-функ- ций. Тотальная функция, очевидно, рекурсивна. Нужно проверить лишь, что всякая частично рекурсивная 1-функция f встречается в семействе. Пусть Г/ — ее график и Г( = k0 g Z+. Покажем, что тогда f = fk„ Действительно, <х, /(х)> € Г,==^> <х,/(х), fe0>€£<2> <=> 32CZ+, g (X, f (х), k0, z) = 1. Выберем среди подходящих z £ Z+ такое, чтобы число и, найденное из условия </ (х), z> = (и), /ф (п)>, было наименьшим. Для этого и имеем Ik, (X) = /ф (и) = f (х), что доказывает требуемое. е) Конструкция версального семейства т-функций. Случай т = О тривиален; если {/Ф} — версальное семейство 1-функций, то пола- гая при m 5г 2 (хъ ..., xm) = fk'y (т(т) (хп ..., хт)), получаем версальное семейство /и-функций. Теорема доказана. 1.2. Выбор версальных семейств весьма не однозначен. Универ- сальных семейств, содержащих каждую функцию (соответственно каждое множество) точно по одному разу, при /и> 1 не существует. Тем ие менее есть важные способы извлекать инвариантную инфор- мацию из сведений о положении функции (множества) в версальном семействе. Этому посвящен следующий параграф. з* 67
2. СЛОЖНОСТЬ ГЮ КОЛМОГОРОВУ li- 2.1. Пусть и = {uh} — перечислимое семейство m-функций над Z+, f — некоторая частично рекурсивная т-функция. Сложность f относительно семейства и. определяется так: с f min (й| ==/}, если такое k существует; I оо в противном случае. Перечислимое семейство и называется (асимптотически) оптималь- ным, если для любого другого перечислимого семейства v существует такая константа си > 0, что для всякой частично рекурсивной т- фуикции / имеем Си Взяв здесь в качестве v любое версальное семейство, находим,- что оптимальное семейство должно быть версальным (бесконечных зна- чений Си (/) не принимает). 2.2. Теорема Колмогорова. • а) Для любого m О оптимальные се- мейства существуют и могут быть эффективно построены. б) Если и, v — оптимальные семейства т-функций, то для любой т-функции f r Сц С) г VU Со (/) " и°' 2.3. Замечания, а) С мерой сложности Си (/) связаны следующие интуитивные представления. Чтобы определить любое перечислимое семейство и, достаточно задать некоторую конечную информацию: скажем, программу, полувычисляющую тотальную функцию и. Чтобы определить конкретную функцию f, встречающуюся в се- мействе и, достаточно поэтому задать не больше log2 Си (/) 4- const бит информации: к программе для и следует при- писать номер [. б) Оптимальность семейства означает, что оно годится для вычис- ления любой m-функции и что проигрыш в длинах вычисляющих программ по сравнению с любым другим семейством ограничен кон- стантой, не зависящей от функции. в) Наконец, неравенство б), тривиально следующее из определе- ния оптимальности, показывает, что логарифмическая сти Колмогорова Ки (f) -= I log2 Си (/)) + 1 с точностью до ограниченного по модулю слагаемого выбора оптимального семейства и и, значит , является ки инвариантной характеристикой Д 68 мера сложно- не зависит от асимптотичес-
2.4. Доказательство теоремы 2.2. а) Выберем рекурсив- ное вложение 0: Z+ X Z+ Z+ с рекурсивной обратной функцией; удовлетворяющей условию линейности роста по одному аргументу: 9 fa. /) k<P (/) для всех k, j g Z+ и подходящей <р: Z+ -> Z+. Например, можно положить 0, (й, /) = (2й — 1)2/ с <рх (/) = 2'г* или, по Колмогорову, ММг ... йг, Д...Д)-ЛЛ... ДДО 1 й,.. йг, где йа, £ {0, 1}, а черта подразумевает двоичное разложение. Здесь <р2 (/)< const /а, так что эта функция экономнее по росту. Ср. также с п. 2.8 ниже. б) Пусть U — любое версальное семейство (пг + 1)-функций. Оп- ределим семейство m-функций и, положив U (Хр ..., хт, й) = U(xlt ..., хт, 0-1 (й)). Покажем, что оно оптимально, со следующей оценкой констант: СцрСФ (Си fa))- В самом деле, пусть f — рекурсивная /n-функция. Достаточно разо брать случай, когда она встречается в семействе V. Тогда f (х1? ..., хт) = v (xj, ..., хт; Сь (/)) = U (ху.хт, Со (f); Си (р) ) = = и (хг, .... хт,в (С„ (f), Си (р)), откуда Сц (Д 0 (С„ (/), Си (v)) С,, (/)<р (Си (р)). Теорема доказана. 2.5. Пример. О-функцию f можно отождествить с ее единственным значением, т. е. с положительным целым числом п. Таким образом, теорема 2.2 определяет почти инвариантную сложность целых чисел Си (п). Имеем а) Си (п) const п для всех п, ибо в простейшем версальном се- мействе ип (•) = п функция «да появляется на п-м месте. б) С (п) ~ min {2/~* (2й — 1) | п есть й-е значение /-й функции в каком-нибудь версальном семействе 1-функции}. (Здесь и ниже мы будем писать / ~ g, если f, g имеют общую об- ласть определения, f constj g и g const2 f для подходящих кон- стант. В соотношениях типа Си (fk) ~ g fa) можно опускать упоми- нание оптимального семейства и, считая, что и произвольно, но фик- сировано.) Из б) видно, что при п оо сложность чисел рп (/г-е простое число), . п п2 или пц- ’ (п раз) асимптотически не больше const п, ибо все это— /г-е значения фиксированной рекурсивной функции. Ниже в п. 2.76 эта оценка будет уменьшена до const С (/г). Колмогоров рассматривал вместо целых чисел конечные двоичные последовательности и построил вместе с сотрудниками теорию, пока- зывающую, что максимально сложные двоичные последовательности 6Э
ведут себя подобно случайным. См. ее обзор в статье А. К. Звонкина и Л. А. Левина в УМН, 1970 т. XXV, вып. 6, с. 85—127, содержащей большую библиографию. В § 3 изложены некоторые результаты из этой статьи. 2.6. Предложение, а) Пусть F fo (fl (-^i, •••> •••> fn •••» где ft — рекурсивные функции. Тогда п , п C(F)< const П С (fi) log П С (ft) i=i V <=i если f0 фиксирована, a ft пробегает все возможные т-функции. Здесь const зависит от f0 и семейства, относительно которых вычисляется сложность, но не от flt ..., fn. п б) Если позволить менять также f0, справа следует заменить П на i=i П и log"-1 на log". 2.7. Частные случаи, а) Полагая /0 = sum2 или prod2 получаем, например С (Л + f8), с (fx, f2) < const C (A)C (f2) log (C (A)C (f2) ). б) Полагая n=l, m = 0, получаем для любого перечислимого се- мейства . yft} С (f (k, Ху, .... xp)) const C (k). 2.8. Д о к а з а т e л ь с т в о предложения 2.6. Прежде всего для каждого п 1 определим следующую рекурсивную биекцию с рекурсивной обратной: 0'">(/гх, fen) = номер га-ки <feb..., йп> при упорядочении их в по п П рядке возрастания kif а при данном |”| kt — — в словарном порядке. Нетрудно убедиться (индукция по п), что п / п \ п— 1 (fex,..., fen)sg: const РI kt I log П i=l \ <= 1 / Определим фукцию В : (Z+)"+1-> Z+: S(/x.....7n+i) = e(0(")(/x...../„),/„+1), где 0 выбрана, как в п. 2.4. 70
Далее рассмотрим два оптимальных семейства: р-функций v (хх, хр, I) и m-функций и (хх, хт, k). Наконец, построим по ним семейства W (хх, хр; klt .... fcn, I) = v (и (хх, хт, kJ, и (хх, .... хт, kn), хп+1, .... хр> /), W (хх..Хр, /?)) = W (хх, .... Хр, 3-1 (k)). Функция F встречается в семействе w на месте 0 (0(п) (Си (А).Си (fn) ), С„ (/0) ), и оценка 0 (k, j)-^k <р (j) вместе с оценкой для 0(п> дают утверждение а) теоремы. Утверждение б) получится аналогично, если в определении w за- менить 3 на 0(п+1). 2.9. Замечание. Функция 0(,,) приводит к самой экономной оцен- ке С (F), симметричной относительно С (fL), .... С (fn). В конкретных задачах может оказаться полезным улучшить оценку, скажем, по не- которым из С (ft) за счет ее ухудшения по остальным: для этого нуж- но соответствующим образом изменить 0<г1>. Например, 0 Колмого- рова дает с (А + f2) С const С (К)С (К)\ что при очень слабо растущей С (f2) (по сравнению с С (А) ) выгоднее, чем const С (fJC (A) log (С2 (А)С (А) ). 2.10. Теорема. Функция С (f) невычислима. Точнее, пусть g (k) — любая неограниченная частично рекурсивная функция, {А}— любое перечислимое семейство. Тогда неверно, что С (fk) | D(g) ~ g (k). Таким образом, С (fh) может быть вычислимой, даже о точностью до ~, только на таком множестве индексов k, где среди функций fk есть лишь конечное число рйзных — иначе С (fk) на этом множестве не ограничена. Доказательство. Предположим, что С (fk) | D(g) ~ g (k). Покажем, что существует общерекурсивная функция /i : Z+ -> -*• Z+, образ которой принадлежит D (g) и такая, что g ° h монотон- но возрастает. Противоречие получается отсюда так; для всех k име- ем в силу 2.76) С (fh(h)) < const С (k), в „илу предположения и возрастания g • h С (Адю) A- const g (h. (k)) > const k. Эти два неравенства несовместимы, потому что lim C.(k) k = 0, на- пример С (£2) const й2 "" й 71
Остается построить h. Выберем общерекурсивную биекцию hA : Z+ -> D (g) (предложение 5.6 гл. I), положим Е = {k | yi < k, g (th (0 ) < g (hi (h))}- Это множество разрешимо, бесконечно, и функция g ° h, на нем воз- растает. Пусть /г2 Z+ -*• Е — возрастающая общерекурсивная биекция (см. то же предложение 5. 6. гл. I). Тогда функция h = • й2 обладает требуемыми свойствами. Тео- рема доказана. 2.11. Замечания, а) Теорема 2.10 показывает, что вычисление сложности является творческой задачей: даже если мы нашли какой- го номер функции f в оптимальном семействе {uh}, она могла бы встре- титься еще раньше. . б) Так как С (k) =#= С то для всех х, В число {у | у •< х, х В’ С(у)<^}< т. е. большинство чисел имеет большую сложность. Тем не менее эффективно указать последовательность чисел асимп- тотически максимальной сложности невозможно. Точнее, пусть — любая возрастающая последовательность с С (fe;) для некоторой В константы В. Тогда нет ни одного перечислимого бесконечного мно- жества Е, содержащегося в {&,}. Иначе мы могли бы найти возрастаю- щую общерекурсивную функцию h: Z+ -> Е и получить противоре- чие, как в теореме 2.10. в) Пусть и = {uft} — любое оптимальное семейство т-функций. «Моменты первых появлений» {k | yt < k, щ ф uk} образуют как раз последовательность асимптотически максимальной сложности, ибо по определению и п. 2.76 для них k = Си (uh) > const С (k). Таким образом, можно сказать, что в оптимальном семействе функции впервые появляются «в случайные моменты». Задача вычисления С (uk) осложняется тем, что в версальных се- мействах любая функция появляется бесконечно часто, так что, если не повезет, она может быть впервые обнаружена как угодно далеко от места своего первого появления. г) Укажем, наконец, что по крайней мере один существенный ас- пект сложности вычислений теорией понятия Си не затрагивается: log2 С (k) измеряет длину программы, необходимой для вычисления k, но не касается времени, в течение которого эта программа должна работать, не говоря уже о возможностях сокращения времени за счет параллелизации вычислений или удлинения программы и т. п. См. по этому поводу сборник [61 и цитированную там литературу. 72
Понятие сложности лежит на горизонте практической пользы. Од- нако оно кажется столь фундаментальным, что его роль в теоретичес- кой математике, возможно, еще будет возрастать. з. сложность и СЛУЧАЙНОСТЬ 3.1. Мы несколько раз упоминали о том, что сложные последова- тельности «ведут себя, как случайные». С математической точки зре- ния корректной формулировке результата должно предшествовать определение случайной последовательности в терминах теории ре- курсивности; разумеется, это определение должно удовлетворять ес- тественным интуитивным условиям. Главная цель этого параграфа — сформулировать такое определение и некоторые точные результаты о связи сложности и случайности, которые можно доказать, пользу- ясь им. 3.2. Чтобы привлекать как можно меньше понятий теории веро- ятности, мы будем рассматривать в качестве пространства элементар- ных событий Q множество бесконечных последовательностей из нулей и единиц с какой-нибудь вероятностной мерой Р, например мерой Лебега L. Если наблюдателю по очереди предъявляются члены последова- тельности, он может как-то отрабатывать начальные отрезки, стара- ясь найти в них «закономерности»: скажем, он может проверять после- довательность на наличие периодичности, вычислять частоты появ- ления нуля, единицы или групп знаков и т. п. Идеализацией этих представлений служат понятие об универсуме «тестов на случайность» F, который определяется следующим образом Р — тест на случайность есть общерекурсивная функция F на множестве конечных последовательностей нулей и единиц со значе- ниями в Z+, которая удовлетворяет условию: для каждого т>0 P-мера множества последовательностей со, у которых существует начальный отрезок (со)п с F ((со)п) д>- т, не превосходит 2~т Грубо говоря, функция F считает, на сколько бит закономерностей определенного типа можнр найти в данной последовательности; каж- дый бит закономерностей должен по крайней мере вдвое урезгть мно- жество допустимых последовательностей. Требование сбщерекурсив- ности F обеспечивает возможность передачи проверки на случайность компьютеру. Положим F (со) = sup F ( (со)„) п и будем говорить, что последовательность со выдерживает тест F, ес- ли F (со) < оо, р — случайной последовательностью называется последовательно- сть, выдерживающая все Р-тесты. Это определение было дано П. Мартином-Лефом на основе идей А. Н. Колмогорова (см. [21]). Приняв его, можно доказать, что все 73
случайные последовательности удовлетворяют всем эффективно про- веряемым законам теории вероятностей, вроде закона больших .чисел, повторного логарифма и т. п. Дело в том, что условие невыполнения закона можно переработать в тест, которого не выдерживают соответ- ствующие последовательности. Если мера Р в некотором (легко уточ- няемом) смысле слова вычислима, то можно построить один универ- сальный Р-тест, заменяющий все тесты (ибо универсум Р-тестов тогда перечислим). 3.3. Пусть I (х) — длина двоичного слова х. Обозначим через р (х) число бит закономерностей, которое найдет в нем универсальный L- тест U. Для определения р (х) нужно применять U ко всем последова- тельностям длины п, начинающимся с х, вычислить наименьшее зна- чение U на таких последовательностях и затем его максимум при оо. (В самом деле, универсальность теста есть «предельное» по- нятие и для отыскания закономерностей в х может потребоваться ана- лиз продолжений х.) Результат Мартина-Лефа, связывающий понятия сложности и слу- чайности, дается следующим неравенством: | I (х) —- (р (х) + К (х)) | < 4/ (I (х)) + const. Грубо говоря, сложность числа плюс число бит закономерностей в его двоичном разложении по порядку почти совпадает о длиной двоич- ного разложения. В частности, если последовательность ® случайна, то сложность (со)п не меньше, чем п — 41 (п) + const для всех п. Глава IV ФОРМАЛЬНЫЕ ЯЗЫКИ И ВЫЧИСЛИМОСТЬ Эта глава служит подготовкой к изложению теоремы Ге- деля в гл. V. Здесь и ниже мы пользуемся определениями и обо- 31 ачениями из Д и НД. 1. АРИФМЕТИКА СИНТАКСИСА 1.1. В этом параграфе показано, как синтаксис формальных язы- ков в принципе сводится к арифметике. С этой целью символы, выра- жения, тексты в конечном или счетном алфавите А отождествляются с натуральными числами (нумеруются) таким образом, что синтакси- ческие операции (соединения, подстановки и др.) представляются ре- курсивными функциями, а синтаксические отношения (вхождение, 74
«быть формулой» и др.) прадставляются разрешимимы или перечисли- мыми множествами. Наша первая забота — показать, что на множествах выражений и текстов вычислимость синтаксических операций и разрешимость (перечислимость) синтаксических отношений не зависят от способа нумерации, если только он подчинен слабым естественным ограниче- ниям. Эта независимость позволяет рассматривать метод нумерации не просто как технический прием, но как отражение глубинной экви- валентности арифметики и комбинаторики формальных текстов. В практике современных ЭВМ, где содержимое ячейки может быть не- разъединенным сплавом числа, имени (кода) и команды, эквивалент- ность синтаксиса и арифмётики реализована в «железе» и восприни- мается как азы. Это было не так в 1931 году, когда появилась работа Геделя, введшая нумерацию в математический обиход. Укажем, наконец, что с точки зрения психолога нумерация мно- жества А есть простейший способ помечать его элементы различными метками | , || , ||| , ... и т. п. 1.2. Нумерация. Пусть S — конечное или счетное множество. Ну- мерацией S мы назовем любое инъективное отображение N : S -> Z+, образ которого разрешим. Число N (s) называется N-номером элемен- та s £ S. Нумерации N, N' : S -> Z+ называются эквивалентными, если частичные функции N « (АГ)-1, N' А/-1 : Z+ -> Z+ частично ре- курсивны. Эти функции автоматически вычислимы (а не только полу- вычислимы), ибо их области определения разрешимы (см. § 1, 2 гл. 1). Эти и последующие определения имеют ясный интуитивный смысл: разрешимость множества номеров обеспечивает распознаваемость свойства «быть номером элемента S»; эквивалентность нумераций — эффективное восстановление одного номера по другому. В § 11 гл. II книги Д и НД описана конкретная нумерация множества выражений в языке арифметики Шмульяна S Аг. Заметим, что наше определение нумерации приспособлено специально к сравнению арифметики и син- таксиса и отличается от определения, принятого в книге [51, где нуме- рацией называется отображение Z+ -> S. Мы отсылаем читателя к этой книге за изложением большого количества тонких результатов общей теории нумерации. 1.3. Лемма, а) Эквивалентность нумераций является рефлексивным, симметричным и транзитивным отношением. б) Любое инъективное отображение конечного множества в Z+ является нумерацией, и любые две нумерации конечных множеств экви- валентны. в) Любая нумерация бесконечного множества эквивалентна нуме- рации с образом Z+. Все это очевидно или уже было доказано; в частности, в) следует из предложения 5.2. гл. I. 75
1.4. Пусть Sx, S2— два множества, Nf : S, -> Z+, i = 1, 2, их нумерации. Частичное отображение f : Sx -> S2 называется час- тично рекурсивным относительно <WX, Л^2>, если отображение М2 ° f - Nf' : Z+ —Z+ частично рекурсивно. Тавтологический при- мер: Отображение нумерации N : S —> Z+ частично рекурсивно отно- сительно <ZN, тождество^-. Подмножество Т S называется разрешимым, перечислимым, арифметическим относительно нумерации Л\, если множество Л\ (Т) обладает соответствующим свойством. 1.5. Лемма. Если в условиях п. 1.4. заменить <ZNi, Л^2> на пару -квивалентных нумераций <cN{, N'z>, то классы рекурсивных отоб- ражений Sx -> S2 и разрешимых, перечислимых, арифметических под- множеств в S2 не изменятся. Доказательство. Композиция вычислимых рекурсивных функций рекурсивна и вычислима. Прообраз разрешимого (соот- ветственно перечислимого) множества относительно вычислимой функ- ции разрешим (перечислим). Наконец, пусть f : Z+ -> Z+ — частич- но рекурсивная функция, Е s Z+ — арифметическое множество. Тогда f~l (£) = prx ((Z+ X £) П Гу) (в Z+ х Z+). Так как Z+ х Е арифметично и Г, арифметично (даже диофантово), то и )-1 (Е) арифметично. 1.6. Пусть Si — множества с нумерациями /V/, i= 1,,..., г. Нумерация N : Sx X .. xS,->Z+ называется согласованной с </Vx, ..., Nr>, если для всех i = 1, ...,/ проекции рг , : Sx х ... ... х Sr -► St рекурсивны относительно и частичная функ- - N ция (Z+)r (Л^1, .... Nr ') Sj X ... X Sr Z+ рекурсивна. Иными словами, ./Уг-номера координат вычисляются по ЛЛномеру вектора и наоборот. 1. 7. Лемма, а) В обозначениях п. 1.5 для любых <ZNlt .... N^> согла- сованная с ними нумерация N существует. Например, можно положить для S/ g Si, i = 1,... , г N (sx, .... sr)-= т<г> (A\ (sx).NT (sr)) (определение x(r) см. в n. 4.5 гл. V). б) Если N согласована с <Л/Х, ..., Nz>, N эквивалентна N', Nt эк- вивалентны Ni (t = 1, ..., r), mo N' согласована c <ZN{, ...., A/;>. в) Если N согласована c<ZNx,..., Nr> и N' согласована c <NX, .... NrZ>, mo N u.N' эквивалентны. Если N согласована c <2Nlt ..., Nr^> и c <ZN{, ..., N'Z>, mo Nt a N't эквивалентны для всех i = 1, .... г. Все это вместе означает, что сеймества из г классов нумераций множеств Sj, .... Sr (с точностью до эквивалентности) взаимно одно- значно соответствуют некоторым классам нумераций S, X. xSP (посредством отношения согласованности). Доказательство леммы сво- дится к механической проверке определений. 76
1.8. Пусть А! = ЛХ...Х А (I раз) и S (Л) = A9 (J A1 U ... U А1Ц U ... Если А — алфавит, то S (Л) — множество выражений в нем; Л° = {Л} состоит из пустого выражения. Функция S(A)->Z+, принимающая значение р на Ар, есть длина выражения. Частичная функция «i-я координата» Z^ XS (А) А1:^, <alt..., afl^> -+at оп- ределена на подмножестве (J V) х (Л' (J Л'+1 U ...) Функция «сое- динение» 5(Л)х5(Л)-»-£(Л) переводит <^ац, ...,ар>, < Ьи ..., Ь, > в <ai,---> ар, ht, ..., bq^>. Нумерация N множества S (Л) называется допустимой, если функ- ции «длина», «i-я координата» и «соединение» частично рекурсивны относительно <ZN, id>, <^id, N>, A/>, <^7V,./V;>, N> соответственно. Нумерация А/ множества S (Л) называется согласованной в нумера- цией А/о множества Л, если она допустима и ограничение N на Л1 эк- вивалентно А/о на Л (при отождествлении А с Л1). Вот основной результат этого параграфа: 1.9. Предложение, а) Если N допустима, то любая эквивалентная ей нумерация допустима. б) Если N и No согласованы, N' эквивалентна N, N' эквивалентна No, то N” и N? согласованы в) Если А/ и Мо согласованы, N' и N 0 согласованы, то N и А/' экви- валентны. г) Для любой нумерации N0 множества А существует согласован- ная в ней нумерация N множества S, (Л), класс которой однозначно определен классом No в силу в). Д о к а з а т е л ь с т в о. а) и б) формально получаются с помощью леммы 1.6. Утверждение в) следует из того, что переход от А/'-номера к (V-номеру выражения происходит так. Пусть т*п = А/ (М-1 (m<N~l (п)) (под знаком N стоит соединение). Частичная операция Z+ х Z+ —Z+ : <гп, п> -> т * п. рекурсивна и ассоциативна в си- лу допустимости А/. Пусть далее (fe); = N (i-я координата A/-1(fe)). Частичная опера- ция Z+ XZ+ -> Z+ : <fe, i>->(fe);; рекурсивна по той же причине. Ана- логично определяется (fe)/ по АГ Наконец, пусть Z+ -> Z+ — частичная функция «длина A'-1 (fe)». Она также рекурсивна. Тогда имеем N о A/'-i(fe) = A/ » Л/'-1 ((fe){) *...* N ° W'-1((fe)r '*))• Но Л/'-номера однобуквенных выражений {(fe)/) составляют разре- шимое подмножество в Z+ (1-уровень вычислимой функции Г). Огра- ничение АДА/'-1 на это подмножество является рекурсивной функцией, ибо ограничения N и N' на Л1 эквивалентны. Отсюда и из рекурсив- 77
ности *, (k)l и Г получается в) (рекурсия по х для х N N'"1 ((£)/) * ttea 1 и подстановка х = /' (/г)). Утверждение г) мы установим в помощью явной конструкции Ге- деля (идея ее, впрочем, восходит к Лейбницу). 1) Конструкция N, согласованной с Noi N (аъ..„ ат) = рт°(“т\ где рг — 2, р2 = 3, ... — последовательные простые числа; N (Л) = I. Проверим, удовлетворяет ли N всем требованиям. г2) N является нумерацией. То, что N:S (Л) Z+ вложение, сле- дует из того, что N0:Л -► Z+ вложение и из теоремы об однозначном разложении bZ+. Установим разрешимость образа N. Прежде всего множество про- стых чисел в Z+ разрешимо как 2-уровень всюду определенной рекур- сивной функции п число делителей п = S d (k, п) —- п, где (см. &=1 § 3 гл. I) ... . ,, , (2, если kin., d (k, п) = s ((rem (k, п)— fe)24-l)=J ( 1 в противном случае. s (1) = 2, s(>2) = 1. Поэтому функция i -> pt рекурсивна (см. доказательство предложе- ния 5.2 гл. I). Положим теперь f (n, I, у) = s (( rem (pf, п) — ру? + I). Эта функция рекурсивна, поэтому рекурсивна по (n, i) также Vt(n) = = min {у | f (n, i, у) = 1} = (степень, в которой pt делит п) + 1. Отсюда следует, что рекурсивна «длина»: I (п) = число простых делите- лей п = 2 s (vi («)) — п (заведомо pm ф n при m > n, ибо рт > т). <=1 Пусть теперь Е — образ А70 в Z+. Тогда образ N = {п | уг < I (n), oj (п) £ Е + 1}. Применение ограниченного квантора общности не портит разрешимо- сти. Действительно, пусть F — {<t, п> | ог (n) £ Е -Т I). F разре- шимо как о-прообраз Е. Пусть xf(G п) = 1 при <г, n> f F, %Р (i, п)=2 1<п) при <г, n> $ F. Функция s ( П XfO. п)) от п имеет своим 2-уровнем (=i образ N. гз) N допустима. Рекурсивность «длины» мы уже проверили. «i-я координата» представляется функцией Г ОН”), 1 , /PtJ (целая часть). 78
Наконец, соединение представляется функцией (п П°4 (П; — 1 р <«)+/ , i= I рекурсивность которой следует из уже доказанных фактов. Заметим, что наши арифметические функции определены не только на множествах геделевых номеров любой конкретной нумерации, но на всем Z+. В дальнейшем такое расширение областей определения мы не будем отмечать без особой необходимости г4) N согласована с А/о. На однобуквенных выражениях переход от одной нумерации к другой задается функциями х-+ 2‘, у-+ log2- (У) (У € 2Z+), рекурсивность которых очевидна. На этом заканчивается доказательство предложения 1.9. 1.10. Заключительные замечания. Предложение 1.9 показывает, что если задан класс эквивалентных нумераций алфавита А формаль- ного языка; то однозначно определен класс эквивалентных нумераций множества выражений S (Л), множество текстов S (S (Л)) и т. д., сог- ласованных с нумерациями А из этого класса. Поэтому множества рекурсивных операций и разрешимых или перечислимых отношений на выражениях и текстах определены инвариантно. Единственная оставшаяся неоднозначность — выбор класса экви- валентных нумераций Л. Во всех известных автору случаях этот выбор также канонически определяется следующим образом: .4 реализуется как разрешимое под- множество выражений некоторого конечного тротоалфрвитаъ Ло; при этом разрешимость понимается в смысле любой нумерации S (Ло), согласованной с любой нумерацией Ло. В силу лемм 1.3, 1.5 и предло- жения 1.9, примененных к Ло, полученный класс нумераций А уже не будет зависеть ни от вложения Л в S (Л„), ни от нумерации Ло, ни даже от выбора Ли (учесть, что если Ло с Л, конечны, то S (Ло) с с: S (Л4) разрешимо). Онзаннйй в § 1Э гл. II книги Д и НД девятибуквенный алфавит языка S Аг с нынешней точки зрения естественнее считать протоалфа- витом: выражения х, х , х”, х", ... суть элементы «настоящего алфави- та». Нумерация Шмульяна очень удобна для доказательства теоремы Тарского, но «невыразимость истинности» в S Аг от ее конкретного вида не зависит: теперь это должно быть совершенно ясно. Более общо, любое полное печатное описание любого алфавита Л реализует Л в протоалфавите наличных типографских знаков, кото- рый, разумеется, конечен, и тем определяет канонический класс эк- вивалентных нумераций Л. 79
2. СИНТАКСИЧЕСКИЙ АНАЛИЗ 2 1, В этом параграфе собран подготовительный технический материал для § 3, в котором устанавливается перечислимость вводимых формул в языках '£х (см, Д и НД), Пусть L — фиксированный язык класса 5?, с конечным или счетным алфа- витом А. Для некоторого сокращения технической работы ограничимся диалек- том со связками —j, -> и квантором \/. Это ни в каких отношениях не существен- но. Предполагается, что на А задан канонический класс эквивалентных нумера- ций, как в § 1, который определяет нумерации S (Д), S (S (Л)) и т. п. Рекур- сивность, разрешимость и т, д. понимаются относительно этого класса. В форму- лировках основных результатов поэтому мы вправе не упоминать нумерацию явно. В доказательствах, однако, удобнее работать прямо-с номерами. Поэтому мы фиксируем одну из нумераций /V ; S (Д) —> Z+ с функциями соединения *, длины I и <-й координаты (k)it как в .доказательстве предложения 1.9. Будем считать, что т * п > max (т, п): номер любой части выражения строго меньше номера целого. Нумерация Геделя именно такова. Дополнительно к условиям § 1 мы потребуем, чтобы N удовлетворяла сле- дующим условиям распознаваемости синтаксических характеристик символов алфавита: а) Множества переменных, констант, операций и отношений в А разре- шимы. б) Функция «ранг» на множестве операций и отношений рекурсивна. Теперь мы можем приступить к делу. Перед чтением дальнейшего реко- мендуется просмотреть § 1 гл. II. . 2.2. Частичное отображение S (А) х Z+ —> Z+ : <выражение Р, I > > номер места скобки), парной к скобке (, стоящей на i-м месте в выражении Р вычислимо, т. е. 'рекурсивно с разрешимой областью определения. Доказательство. Нам будет удобно пользоваться следующим обозначением: если Q — некоторое высказывание о целых числах из Z+, го (1, если <2 истинно, р Q у — I 2, если Q ложно. Это функция истинности, приспособленная к отсутствию нуля в Z+, Построим функцию Par (k, I) : Z+ X Z+ — Z+ Par (k, i) = 1, если (k)i не определено, или (fe); ф W( а); или (k)t = /V (а), но у,- £ |i, I (fe)], 2 II (k)m = /V (а) || ф |Rm = WII; т = i m = i min {/|/^Z(fe)} и 2 II(fe)m = N(a)|| = m = ’ = 2 H(fc)m = N(!>)ll в противном случае. m=-i Очевидно, после ограничения на Л'—1 (S (Д)) X Z+ функция Par (k, i) даст но- мер места парной скобки k, стоящей на f-м месте в выражении N~1 (k), когда это возможно, и 1, когда это невозможно (см. лемму 1.2 § 1 гл. II книги Д и НД); Поэтому достаточно установить рекурсивность Par (k, i). 80
Но написанное определение функции Par (k, i) представляет ее в виде склей- ки конечного числа (четырех) рекурсивных функций с разрешимыми (в силу свойств .V) областями определения. Поэтому она рекурсивна. 2.3. Частичное отображение S (А) —> Z+. (выражение Р) -» (число тер- мов L, соединением которых является Р) вычислимо. Напомним, что это число определено однозначно (§ 1 гл. II). Доказательство. Мы построим сначала формулу, которая рекур- сивно определяет функцию Z+ —> Z+ L Т (k) — р (й) 1., если Л~‘ (#) не есть соединение термов; число термов, сое- динение кого'рых есть А/-1 (/г) в противном случае — через ее значения для мень- ших значений аргумента. Словесный рецепт для синтаксического анализа N—1 (k) таков: нужно посмотреть, является ли переменной или константой и если да, то является ли (k)2 * ... * (k)i(k')' соединением термов; если нет, является ли (й)1 операцией, стоит ли за ней скобка «(», есть ли к ней парная скобка »)», стоит ли после »)» соединение термов. (В предыдущей фразе названы номера вместо выражений.) Для систематического описания положим г /м _ I <*>’ еСЛИ 1W > 2‘. I 1 —в противном случае; . ,.х [ (*)а* * (^)рат (ft,2)-i, если 4<Раг(й,2); 2 (К) — { ( 1—в противном случае; : _ I (^Раг <»• 3>+1 *--• * <*’’ еСЛИ 1 < РЭГ (k> 2) < 1 3\К> — j . I 1 —в противном случае. Все эти функции рекурсивны. Теперь можно написать следующий рецепт для рекурсивного вычисления LT (k)-. переменная =>LT(k)=\, /(&)=! i(k) > 1 и и N~1(k) константа => L Т (k) = 1, A/-1 (k) ни то, ,ни другое => LT(k) = 2\ переменная =► LT (k) = 1 -ф-LT (k)), Л’-1 ((£)i) константа =► LT (k) = 1 4- LT (/г (fe)), A/-1 ((fej) операция, (k)2 = N ( Q ),4 < Par (k, 2) = Z (k), ранг A1-1 ((k)l) = LT (/a (k))—”' =- LT(k) = l-, I (k) > 1 и (iV—1 (6)0 — операция, (k2) = N ((), 4 < Par (k, 2) < I (k), ранг N-1 (Wi) = LT (/2 (k)) < I (/2 (£)F, LT (/3 (£)) < I (f3 (*)) => LT (*) = 1 + LT (/3 (*)); _ I (k) > 1 и ни одно из предыдущих (сложных) условии ие выполнено => L1 (й) = = 1 4- i (ty. Чтобы установить рекурсивность LT, заметим сначала, что для каждой из выписанных восьми альтернатив легко построить рекурсивную функцию (k, х, у, г) со следующим свойством: В k удовлетворяет z'-й альтернативе || =» =/< (й, LT (А (й)), LT (/2 (й)), LT (/3 (й))), 61
а также рекурсивную функцию и, (k, х, у, г) со свойством (k удовлетворяет :-й альтернативе) =>- LT (k) = с, (k, LT (k)), LT (f2, (k)), LT (/3 (k))). Поэтому справедливо равенство 8 LP(fe) = 2 LT(f1(k')), LT(fa(k)), 1 8 LT(.f9(k)))^- £ (hi vt)(k, LTtf^k)), <= 1 -T(f2(k)), LT<I3W))- Вместе c LT (1) эта формула позволяет реально вычислять последовательно значения LT (й), ибо ft (fe) < k при k > 1. Но рекурсия при этом происходит не к предыдущему значению k, а к нескольким из рассмотренных ранее. Это и есть основная трудность установления рекурсивности синтаксических функций. Мы покажем сейчас, как она 1реодолевается в этом и во всех последующих случаях. Пусть вообще <р, (k)....<ps (h) — рекурсивные функции со свойством: для всех i < s и к > 2, <р, (k) < k. Пусть далее h (х,, ..., хп, к, у,.. ys) — ре- курсивная функция и пусть g (х,, .... xn, k) определена соотношениями g (хь xn, k) = известная рекурсивная функция;. g (*i....хп- k + 1) = h (*i......хп; k\ g (xt.....x’n, <pj (£)), .... g (x,, xn, 4-s (*))) Пользуясь функцией соединения *, положим k G (хг,. хп, k)= * gfxj, ...» xn, i). i = 1 1ак как g (xj, xn. 0 =• (G (xj, ,;i, xn, k))t для всех t < I (G (xb xn, k)) = k, в частности, для наибольшего такого i, то для проверки .рекурсивности g достаточно установить рекурсивность G. Но для G имеем при fe > 2 G (Xj, . ,.,.Xn, к -ф I) 3=3 G (Xj, .хп, к) * g (X,, .... хп, k + 1) = G (х,...xn, k) * h (X]....xn; k; (C, (xb .... xn, *))ф1(Л), .... (G (хп ..., xn, ^))Фп(£))> что является стандартным рекурсивным уравнением. Применяя этот трюк к LT, получаем ее рекурсивность: здесь п = 0, s = 3 и <рг- (k) = ft (k + 1). Следствие. Множество термов разрешимо. Действительно, это 1-уровень вычислимой функции LTi 2.4. Множество атомарных формул разрешимо. Действительно, N~l(k) атомарная формула <==> (^)t отношение, (й)2 =• N (0, Par (k, 2) = = / (/г) > 4, ранг У"» = LT (f2 (k)) < I (f2 (k)), где f2 (k) определена в предыдущем пункте. 2.5. Множество формул разрешимо. Действительно, в нашем упрощенном диалекте имеем: N~l (k) формула <==> (k) есть атомарная формула, нли i (Р), или (Р) -» Q или V х (Р), где Р, Q — формулы; х — переменная, 82
По образцу п* 213 определяем рекурсивные функции f = J <й)з *• • •* (^)г есЛи Hfe) > 4, ( 1—в противном случае. ( (fe)2 *...* (fe)par <к i)_i, если Par(fe, 1) > 3, /s(fe)= , ( 1 —в противном случае; ( (fe)par(fe, 1) + з *•••*<*)/(h;-i. если 3<Par(fe, l)^.l(k) — 4, fsW = { I 1—в противном случае; Г /Ах ( (&)**••• если > 5. /»(fe) = < , ( I—в противном случае; fl, если У-1 (fe)— атомарная формула, 4/(fe) = s 1, 2,—в протиинвм случае. Функция {!, если АН1 (fe)—формула, 2—в првтивном случае вычисляется с помощью рекурсивного соотношения С s (1) = 1, s (fe) = 2 при fe > 2 ) Fm(fe) = s » min {At (fe); || (feh = W (—I) ||. .||fe. =JVCC )B X flZ (fe) > 4|l°Fm(f4(fe)); (fe)! = №.( C)H« 0 Par (fe, 1) > 3[|» Fm(fs(fe)) x ||(fe)Par (ft. n+) = = A/(->-)(! «||(fe)Par 1) + 2=Л/ < C )IT Par (fe. Par (fe. 1)4-2) = / (fe)|| x Fm (fe), (| = /V (у) II ° || (fe)2 =M (переменная)|| ° 0(fe)3 =<V ( £ )|| x II Par (fe, 3) = = /(fe) > = Ц » Fm(fi(k))}. Рекурсивиость Fm (fe) теперь устанавливается с помощью приема, описанного в п. 3.3. Следствие. Множества формул вида (Р), (Р) -» (Q), V х (р) разрешимы. 2.6. Отображение S (А) X Z+ X S (4) —» S (4): <Р, i, Q> |-» резуль- тат подстановки Р вместо 1-го символа в выражении Q вычислимо. Положим f (m, * ... * (m),-_, * fe * (m)i *.. .* (Щ)/ (m), если / I (т). Sub (fe, i, т) = { , (1 — в противном случае. Ясно, что эта функция рекурсивна и на множестве <fe, I, т> с т ^~1(S(4)) совпадает с требуемым отображением. 2.7. Отношение в Z+ X S (4) X S (4): «на i-м месте в формуле Р стоит свободная переменная (однобуквенное выражение) х» разрешимо^ Действительно, положим ( 1, если условие 2.7 выполнено для P=/V"1(fe)> <x>=.V_,((), Fr(/, fe, /)=| ( 2—в. противном случае. ЕЗ
Тогда имеем Л/-1(й) не формула, нлн V-1(/) не переменная, У______ }— * Fr (i, k, Л«=2. цили i > I (fe) J Пусть теперь одновременно V-1 формула, /V-1 (/) переменная, t < I (£), Дальнейшие альтернативы; =* Fr(i, k, /))=2; l = Л1 (*»=!=► Fra,k, P=l; l = (k)it Л'-’(й) имеет вид — l(P)=»- Fr (i, ‘k, l)=~Fr(l, /): Z = (fe)i, N~l{k) имеет вид (P)->(Q>, i < Par(fe, 1) =► Fr(t, s, /) = «=Fr <i, ft (Й), /); I (k)t, AH1 (fc) имеет вид (P)->(Q), t > Par (fe, 1)4-2 =► Fr(i, k, l) = = Fr(t, ft(kr, П; A/~1 (fe) имеет вид yx(P), (fe)2->/=»- Fr (Z, fe, Z)=2; N~1{k) имеет вид yx(P), (fe)g =/=(=>• Fr(r, k, l)=>Fr (i, f7 (k), I). Функции ft, ..., /7 определены в п. 2.5. Дальше для,доказательства рекурсив" ностн Fr можно применить тот же прием, что в п. 2.4 и 2.5. 2.8. -Множество {<х. Р, t> | х переменная, Р формула, I терм, х не свя- зывает t в Р) разрешимо. Это значит для номеров <z, k, т> V / < 1 либо либо (k)j=>i A Fr С/, k, г) =2; либо (fe); = i Д Fr (/, k, i) = I Д у n £ [1, I (m)] x X !Fr (14-n) — 1, Sub (m, 1, k), Sub(m, /,.k)j+n. переменная ||), т. e. после подстановки t вместо любого свободного вхождения г в Р все пере- менные в t остаются свободными. 2.9. Частичное отображение <х, Р, t > —» результат ниисшан-овки I вместо всех свободных вложений х в Р вычислимо. Пусть <i, k, т> — номера х, Р, t. Положим | (kfj, если Fr (/, k, /)=2 l(j,k,t,m) I если Fr (/, fe, 0 = 1 Это рекурсивная функция; и далее (*1 » SubZ(i, k, т)= * f(i, k, 1, m). Это — номер результата подстановки t вместо всех свободных вхождений х в Р. 84
3. ПЕРЕЧИСЛИМОСТЬ ВЫВОДИМЫХ ФОРМУЛ 3.1. Общая схема. Пусть L — произвольный язык с нумерован- ным счетным алфавитом А. Предположим, что фиксированы следую- щие данные: а) Перечислимое множество «аксиом» Ах cz S (Л). б) Частично рекурсивное отображение Inf:Z+ xS (3 (А)) -> S'(А) — перечислимое семейство «правил вывода» Будем говорить, что выражение P^S (А) непосредственно сле- дует из выражений Plt ..., Рг согласно i-му правилу вывода, если < h < Pt, .... Pr » € D (Inf) и Inf (i, < Plt P, > ) = P. Назовем выражение P выводимым (из «аксиом»), если существует такая конечная последовательность выражений Plt Рп = Р, что для каждого j п либо Р} . £ Ах, либо существуют i g Z+ и {Plt ..., Pr} s {Pi, ..., Pj-t} U Ах такие, что Р, непосредственно сле- дует из РЛ, ..., Р согласно i-му правилу вывода. Обозначим через D множество всех выводимых выражений. 3.2. Предложение. D перечислимо. Доказательство. Пусть а : Z+ -► S М) — рекурсивная функция, образ которой совпадает с Ах; inf: Z+ -► S (А) — частично рекурсивная функция inf 'n>=lnf (б,2) (П), A/г1 (б2а > 'п))), где А/, : S (3 (A)) ->Z+ — какая-нибудь HVMenanHft текстов, согласо- ванная с нумерацией выражений Построим рекурсивную функцию- d ; ZT -* о 0); d (2п — 1) = а (п); d (2n) = inf (n), п 1. Утверждается, что ее образ равен D. Действительно, достаточно про- верить, что: а) Ах с образ d; б) если Plt ..., Р, $ образ d и Р непосредственно следует из Рх ..., РГ по i-му правилу вывода, то Р g образ d. Но а) очевидно: все аксиомы выписываются на нечетных шагах. Для проверки б) выберем п так, что б? (n) = I, бр (n) - Ni «Pi,..., Pr>). Тогда d (2n) = P. Предложение доказано. Проверим теперь, что эта общая ситуация реализуется в языках класса 3.3. Правила вывода Gen и МР. Определим отображение Inf: Z+ X S (3 (А)) -► S (А) так: D (Inf) = {<1,-<Р, (Р)-> (Q) » Р, Q, формулы} U {</, <Р » | Р формула, i 2}, Inf < 1, <Р (Р) -» (Q) > = Q, Inf о, <6>> = vxi_llQ), 85
где Xj — j-я переменная языка L в какой-нибудь фиксированной нуме- рации переменных с образом Z+, согласованной с нумерацией Л. Ясно, что Inf рекурсивно и исчерпывает правила вывода МР и Gen. 3.4. Аксиомы. Проверим, что в любом языке класса перечислимы следующие множества: а) тавтологии; б) логические аксиомы с кванторами; в) аксиомы равенства. Кроме того, перечислимы г) специальные аксиомы Lx Аг; д) специальные аксиомы Lx Set. На самом деле все эти множества даже разрешимы, что нетрудно установить методами § 2, но перечисли- мость доказывается немного короче, и нам ее достаточно. 3.5. Тавтологии. В §5 гл. II книги Д и НД построен конечный спи- сок схем базисных тавтологий и показано, что все остальные выводятся из них посредством МР. Поэтому согласно предложению 3.1 достаточ- но проверить перечислимость базисных тавтологий. Любая схема ба- зисной тавтологии определяет множество формул вида Qi рIIPit • PirQr+\t где Qt — фиксированные непустые выражения (кроме, возможно, Qi> Qr+i); •••> ir € {1, • ••, m} и <Л,Pn> пробегает упорядочен- ные m-ки формул L. Так как согласно п. 2.5 множество таких т-к разрешимо и операция соединения рекурсивна, ясно, что мы получаем перечислимое множество формул. 3.6. Аксиомы с кванторами. В диалекте Хх, где g исключен, они укладываются в две схемы аксиом: а) (ух (Р (х))) ->• (Р (/)), где х не связывает терм t в формуле Р. б) (ух ((Р) -> (Q))) -> ((Р) (ух (Q))), если х не входит свободно в Q. Согласно п.2.8 множество троек {<х, Р, t> | х не связывает t в Р} разрешимо. Согласно п. 2.9 отображение <х, Р, t> —Р (/) ре- курсивно. Так как соединение тоже рекурсивно, множество аксиом а) перечислимо как образ разрешимого множества относительно рекур- сивной функции. Аналогично получится перечислимость б), если мы проверим, что условие «х не входит свободно в Q» разрешимо. Но оно равносильно, например, такому; «результаты подстановки в Q вместо свободных вхождений х переменных хх, х2 совпадают с Q», где xlt х2 — любая фиксированная пара переменных. Разрешимость этого условия сле- дует из п. 2.9. 3.7. Аксиомы равенства. Согласно предложению 4,6 гл. II книги Д и НД достаточно проверить перечислимость формул вида (х = у) -> (Р (х, х) -> Р (х, у)), 86
где Р пробегает атомарные формулы языка, а Р (х, у) получается из Р заменой любой части вхождений-х на у; х, у — переменные. Их множество можно получить, например, как образ частично рекурсив- ной функции S (Л) X Л1 х Л1 X S (Z+) -> S (Л): <Р, <х>, <.у^, <t'i, .... ir > -> результат подстановки у на места i‘i, i, в атомарной формуле Р, если на этих местах стоит х. Рекурсивность ее следует из результатов п.2.4, и 2.6 3.8. Аксиомы LjAr и Lj Set. Часть из них не содержит «метаязй- ковых переменных» для формул, а только переменные языка: это все аксиомы арифметики, кроме индукции, и все аксиомы теории множеств, кроме подстановки. Разрешимость каждого из множеств таких аксиом следует из того, что его можно описать условием типа «множество фор- мул длины 39, у которых на 1-м месте стоит (, на 2-м у, на 3-м перемен- ная, на 4-м (, ..., на 39-м), на 40-м); на 3-м, 8-м и 16-м местах перемен- ные одинаковы; на 9-м и 36-м местах переменные одинаковы; на 17-м и 37-м местах переменные одинаковы; эти три переменные попарно раз- ные» (аксиома объемности Z^Set в нормализованной записи). Впро- чем, достаточно было бы написать по одному экземпляру каждой такой аксиомы: остальные порождаются Gen, аксиомой специализации и МР. Перечислимость аксиом индукции и подстановки получается с по- мощью тех же приемов, что и перечислимость базисных тавтологий и логических аксиом с кванторами. Мы оставляем детали читателю. Глава V ТЕОРЕМА ГЕДЕЛЯ 1. ПРИНЦИП НЕПОЛНОТЫ 1.1. Теорема Геделя о неполноте формальных теорий мо- жет быть точно сформулирована во многих конкретных вариантах, ни один из которых не исчерпывает ее содержания целиком. В этом параграфе мы попытаемся отделить принципиальную сторону теоремы от технических деталей ее доказательств для разных языков, опираясь на результаты гл. IV. 1.2. Пусть А — конечный или счетный алфавит с каноническим классом нумерации; S (А)— множество выражений над А. Предпо- ложим, что в S (А) как-то определены два подмножества: а) Тс S (А) — множество «истинных» выражений. Например, над А может быть задан язык, та или иная его семантика и функция истинности относительно нее. б) D с S (А) — множество «доказуемых» или «выводимых» выра- жений. 87
Оно может быть описано «аксиомами» или «правилами вывода» или как-нибудь еще. Мы будем считать, что D s Т в соответствии с семан- тикой терминов (доказуема лишь истина). Есть все основания верить, что если D, Т построены «естественно» в ходе любой формализации любого фрагмента современной математи- ки, то выполняются следующие принципы. 1.3. Множество D перечислимо Интуитивные аргументы в пользу этого таковы. Предположим, что «доказуемые» выражения — это те, для которых существуют «дока- зательства». «Доказательства» — это тексты, которые пишутся, воз- можно, в другом алфавите В, т. е. элементы 3 (S (В)). (Например, тео- ремы LjAr могут доказываться в языке Ц Set.) Минимальное требова- ние к формальным математическим доказательствам состоит в том, что бы они могли быть механически распознаваемы как таковые, т. е. образовывали разрешимое подмножество S (S (В)). (Впрочем, здесь бы- ло бы достаточно потребовать перечислимости и самих «доказательств».) Второе неизбежное требование состоит в том, чтобы по каждому «до- казательству» можно было механически получить «доказанное выраже- ние» в 3 (А). Иными словами, частичная функция 3 (3 (В)) -> 3 (А); «доказательство»-»- «доказанное» должна быть (полу) вычислима. Но тогда ее образ перечислим. В § 3 гл. IV мы установили перечислимость выводимых формул в языках в согласии с этими неформальными рассуждениями. Заметим, что во всем обсуждении неявно присутствовал временной аспект: «доказательство» понимается как «доказательство с помощью средств, принятых к настоящему моменту и (полу) распознаваемых как таковые». После введения, скажем, новой аксиомы теории мно- жеств и ее достаточно широкого признания понятие доказательства расширится, как это произошло с аксиомой выбора (или, скорее, прин- ципом трансфинитной индукции, леммой Цорна...). Ср. с обсуждением в § 5. 1.4. Множество Т неперечислимо, если семантика истинности на- столько богата, что включает в себя элементарную арифметику. Ясйо, что мы имеем в виду те или иные варианты теоремы Тарского, доставляющие даже неарифметичность Т. В соедующем параграфе мы укажем несколько точных конкретизаций этого принципа. См. также п. 5.3, 5.4 ниже. 1.5. Теоремы Геделя о неполноте (общая форма). Формальные тео- рии математики удовлетворяют принципам 1.3 и 1.4. Поэтому в до- статочно богатых теориях всегда существуют недоказуемые истинные выражения. 2. НЕПЕРЕЧИСЛИМОСТЬ ИСТИННЫХ ФОРМУЛ Следующие критерии все являются вариациями на одну тему, хотя это не было очевидным сразу: «аутореферентность, или диагональный процесс» (см. Д и НД). 88
2.1. Язык S Аг. Мы отсылаем к § 10 гл. II Д и НД за описанием это- го языка и его стандартной интерпретации. В § 11 гл. II показано, что множество номеров истинных формул в нумерации Шмульяна неариф- метично. Тем более оно неперечислимо, поскольку перечислимые мно- жества даже диофантовы. 2.2. Язык LjAr. Здесь мы приведем два варианта аргументов: один дает более сильный результат, а другой — более конкретный. Третий вариант, наиболее близкий к первоначальному рассуждению Геделя, описан в § 5. а) Теорема Тарского для LjAr. Мы можем свести доказательство не- арифметичности истинных формул в Ег Аг к теореме Тарского в S Аг следующим способом. Во-первых, множества формул Аг и S Аг разрешимы во множестве всех выражений (это доказано в § 2 гл. IV для Lj Аг). Во-вторых, отображение перевода; {формулы S Аг} —> {фор- мулы Lj Аг}, описанное в § 10 гл. II книги Д и НД, рекурсивно (это легко установить по образцу рассуждений главы IV). Так как оно сохраняет функции истинности, то Ts = /г-1 (7\) в очевидных обо- значениях. Но тогда из арифметичности Ts следовала бы арифметич- ность (см. доказательство леммы 1.5 гл. IV), что-противоречит теореме Тарского для ЗАг. Провести это доказательство во всех деталях было бы полезным уп- ражнением для читателя. Следующее рассуждение проще, точнее, но оно показывает лишь неперечислимость TLt вместо неарифметичности. б) Пусть Е с: Z+ — перечислимое, но неразрешемое множество (его существование установлено в § 5 гл. I). Пусть формула Р (х) язы- ка Ar с одной свободной переменной х выражает Е. Положим для п > 2 : « = (...+ (1 + 1,1)...), где справа стоит терм — имя целого чис- ла п в очевидной канонической записи типа Ж,. Рассмотрим семейство замкнутых формул { — (Р (п)) | п g Z+} в Аг. 2.3. Предложение, а) Отображение Z -> {формулы Lx Аг) : -> —- Р (п) рекурсивно. б) Множество {п | — (Р (п)) истинна} неперечислимо. Следствие. Tl, нёперечислимо\ более точна, множество истинных- формул семейства { — (Р (п))} неперечислимо. (Иначе прообраз TL, в Z+ был бы перечислим.) Доказательство, а) Пусть формула — (Р (х) ) имеет вид соединения PjX-Rtx...xRs+1, где х не входит в выражения Rt. В обо- значениях доказательства предложения 1.9 гл. IV имеем для фик- сированной нумерации N множества выражений с функцией соеди- нения*; N (—](Р (п ))) = А/ (Ri) * N (п ) к N (Rt) *...» N <Rs+f). Поэтому достаточно доказать рекурсивность функции п i-> N (и). 89
Но так как «4-1=4- (1га), то при п С; 1 N (/Г+Т)=.Л/ (-4-) • ACС) * ЛГ(Т) * N (п ) * N Q). что дает рекурсивное выражение N (п 4- 1) через /V (п). б) {п|— нР пр £ Т ti}=z+\fi по определению формулы Р (х), выражающей Е. Но дополнение к Е неперечислимо, так как Е неразрешимо. Предложение и следствие доказаны 2.4. Языки, ие менее богатые, чем Ег Аг. Пусть L — произвольный язык с алфавитом А (конечным или счетным), в котором задано мно- жество «истинных» выражений Т. Предположим, что он не беднее язы- ка арифметики в следующем смысле: Существует отображение перевода tr {формулы Lj Аг}-> {выражения в А}, которое переводит Tlx в Т, дополнение Т^в дополнение к Т, и рекурсивно. Тогда Т неперечислимо. Такое отображение можно построить, скажем, для Set. Пред- ложение 2.3 показывает, что достаточно уметь переводить на языке L даже только формулы из семейства — (Р («)), что позволяет обойтись очень скромным языком арифметики 2.5. Замечания, а) Серия диофантовых задач «истинна ли Р (га)», г. е. «существует ли решение в Z+ диофантова уравнения F (га; хг>..., хг) = О?» (Л —подходящий многочлен с целыми коэффициентами)' такова, что для ее полного решения не может хватить никакого финитно описываемого набора доказательных средств. Можно сказать, что теория диофантовых уравнений уже бесконечно сложна. б) В некотором смысле любая задача математики сводится к диофан- товой. Действительно, переводя ее на подходящий формальный язык, разумно спросить, «доказуема ли формула Р или — Р?» Но это есть в точности вопрос о том, попадает ли номер Р (номер — Р) в перечисли- мое множество D доказуемых формул, т. е. о том, разрешимо лц дио- фантово уравнение из данной серии, отвечающей D. Это — несколько неожиданное подтверждение мнения Гаусса о королевском статусе арифметики. Существует даже «королевское дио- фантово уравнение» — проекция графика его есть множество номеров формул в Set, выводимых из аксиом Цермело — Френкеля. Конечно, мы привыкли спрашивать «истинна ли Р?, а не «доказуе- ма ли Р?» С этой точки зрения высшие творческие акты в математике суть изобретения новых принципов доказательств, которые не редуци- руются к «наследию отцов» и должны быть заново принимаемы на ве- ру. Теория множеств в целом была последним таким принципом в ма- 90
тематике нового времени. Драматическая история ее торжества и не- приятия достойна величины этого открытия. Удивительно, что в рамках формальной математики можно кое-что сказать и о столь неформальных вещах (ср. с. § 5 дальше). 3. О ДЛИНЕ ДОКАЗАТЕЛЬСТВ 3.1 Название этого параграфа воспроизводит заглавие небольшой работы Геделя 1936 года. Содержание его состоит в уточнении и дока зательстве следующих качественных утверждений. Пусть дан формальный язык L вместе с некоторой концепцией вы- водимости формул Р из (переменного) множества формул А. Сверх то- го, пусть дана некоторая функция, оценивающая «сложность вывода» формулы Р из множества А (это может быть минимальный объем фор- мального вывода Р из А, т. е. число знаков конечного протоалфавита, входящего в такой вывод). Предположим, что в L заложен определен- ный фрагмент логики что L и А достаточно богаты для действия принципов неполноты и что «сложность вывода» удовлетворяет неко- торым естественным аксиомам (не путать ее со сложностью Колмого- рова; это совершенно другое понятие). Тогда справедливы следующие факты: а) Существуют выводимые из А формулы, вывод которых сколь угодно более сложен, чем сама формула. Набюдение показывает, что к этому расплывчатому классу при надлежат если не самые важные, то, по крайней мере, «призовые» ма тематические факты. б) Если добавить к аксиомам А любую независимую формулу А, то цайдутся выводимые из А формулы, вывод которых из Л U {А} будет сколь угодно проще, чем вывод из А (принцип ускорения доказа- тельств). Ср. большую силу «аналитических» методов по сравнению с «эле- ментарными» в теории чисел. Следующее точное изложение основано на заметке Эренфойхта и Мыцельского в сборнике [61. В этом сборнике имеются также родствен- ные работы по сложности вычислений и ускорению вычислений. 3.2 . Рассмотрим следующий, набор данных. а) Счетный алфавит А с фиксированной нумерацией /V : А Z+. б) Подмножество F = S (А), элементы которого называются фор- мулами. в) Частичное отображение S): 3й (F) -> 3й (F), которое некоторым множествам формул А = F ставит в соответствие множества ® (А) «вы- водимых из Аъ формул. Вместо Р £ 3) (А) мы будем писать А Р. г) Сложность вывода: функция Cd^ (Р), определенная для пар A = F, Р £ Ф{А) и принимающая значения из Z+. Удобно считать, что Cd^ (Р) — оо, еслиP$S) (А). 91
Наложим на эти данные следующие условия. -3.3. а) А содержит -|, (,). б) Если Р, Q Е F, то -I (Р), (Р) (Q) Е F. Как обычно, бу- дем писать Р Q вместо (Р) -> (Q) и т. п вг) А £= 3) (Л); если А с= А' и 3(A) определено, то 3\А') опре- делено и 3 (A) = 3 (А'). в,) Если di U {Р} I— Q, то — Р -> Q. в3) j# I—Р (—। Р -► Q) для любых Р, Q Е F. г0) Если .Л , то Cd^ , (Р) < Cd^ (Р) rj) Множество (<Р, п> | GdiPi <n} <;.SlXi X Z+ разрешимо. Условие rt) не обязано выполняться для любых А sUF, но мы будем рассматривать только такие А, для которых оно верно. В случае, когда Cd^ (Р) — объем кратчайшего -вывода Р из А в конечном прото- алфавите, а А — разрешимое множество аксиом, свойство гг) выпол- няется по следующей причине. Мы можем написать все тексты в А объема sC п, которых конечное число, и для каждого из них по очереди проверить, является ли он выводом Р из А- г2) Существует такая неубывающая по х общерекурсивная функция f (х, у, г), что C<U и < 1 (Cd^ lP -* N ’ N Щ для всех Q Е 3 (А). Обе части неравенства конечны в этих условиях: так как А |- Q в силу вх) имеем АО {Р} f- Q, а в силу в2) A h Р-> Q. Оценка типа г2) имеет место в языках ^, потому что из любого вывода Р -> Q из А можно получить вывод Q из АО {Р}, просто добавив Р, Q (в силу modus ponens). Это увеличивает объем • вывода Р -* Q на объемы Р и Q. гз) Существует такая общерекурсивная функция g (х, у), что Cd^ (Р - (-1 Р -> Q)) < g (N (P),N (Q)). В языках формула Р -*• (—। Р Q) является логической аксио- мой и если А ее содержит, то вывод аксиомы имеет длину 1 и объем, совпадающий с объемом самой формулы. Последний, конечно, предс- тавляется в виде g (N (Р), N (Q) ). Сформулируем теперь теорему Геделя «об ускорении доказательств». Мы предполагаем,что выполнены соглашения и условия 3.2, 3.3. 3.4. Теорема, а) Пусть А с Р. 3 (А) неразрешимо. Тогда для лю- бой общерекурсивной функции I существует бесконечно много формул Р Е 3 (А), таких, что Cd^ (P)>l(N (Р)). 92
б) Пусть Л' = Л U {А} и формула А такова, что 3) (Л Г {-; А}) Неразрешимо. Тогда для любой общерекурсивной функции г существует бесконечно много формул Р Q 3) (Л), таких что Cd^(P)>r(Cd^ (Р)). Доказательство, а) Если первое утверждение неверно, то для походящей I и всех Р £ 3) (Л) имеем Cd^ (Р) / (А (Р)). Но тогда множество ® (Л) = {Р | Cd.^ (Р) < I (ДО (Р) )} <= S (Л) разрешимо в силу г^, ибо получается применением ограниченного квантора существования (по п) к разрешимому множеству, описанному в rt). Это противоречит предложению. б) Пусть Р g 3j (Л) U { -1 А}). В силу г2) имеем С<1^ и Л) (Р) < / (Cd^ (~ А -> Р), N A), N (Р)) Если теперь предположить, что второе утверждение теоремы неверно, то для подходящей неубывающей общерекурсивной функции г полу* чим cd^(-U->P)<r(Cd^,(-U->P)) или в силу г2) и гз) Cd^ (НА Р) < r of (Cd^ (А -> н А -> Р)), N (A), N (Р)) г о f(g (N (A), N (£)), ДО (А), ДО (Р)). Подставляя это в самое первое неравенство, получаем при фиксиро- ванной А оценку вида Cd Л1 (Р) <(Р)), •я? и { I л> где I общерекурсивна, А}). Это противоречит нераз- решимости S(v4U{~iA}) в силу, первого утверждения теоремы. 3.5. Замечание. В формулировке теоремы 3.4 существенно условие неразрешимости множества доказуемых формул. Его доказал Черч для любой теории, не менее сильной, чем арифметика. 4. АРИФМЕТИЧЕСКАЯ ИЕРАРХИЯ 4.1 Определим рекурсией по п следующие классы Sn, Пп подмножеств в 7+)т для всевозможных т = 0, 1,2... а) 20 = П0={разрешимые множества}. б) Sn+j= {проекции коразмерности >1 элементов Пп}. в) Пп+!= {дополнения к элементам Sn-t-i в их объемлющих пространствах}. 93
Очевидно, Sj — перечислимые множества, Щ—дополнения к ним. Следу- ющий результат оправдывает название «арифметической иерархии» для последо- вательности {Sn, Пп}. 4.2. Предложение, а) уп > 0, Sn(jnncSn+1 f] Пп+1. 00 00 б) [J Sn= [J Пп={арифметические множества}, п=0 ч=0 т. е, множества, выразимые формулами языка Li Аг. в) Множества класса Sn при п > 1 совпадают с множествами, которые выразимы следующими формулами типа SSy (кванторы—по переменным в Z+, £—разрешимые множества): 3 *1 Vх! 3 хз • • V хп ~1 (<*i> •• •• хп’ xn+i, хт~> € £). а четно; 3xiVx23x3 ••• 3*п«х1.......хп> .. . ...хт> С &)• п нечетно; аналогично для лп Vxi3x?V*s 3xn(<xi..........хп, хп+1....хт) £ Е), п четно; у X! а хг у х3... V хп (<х1(..., хп, хп + 1,..., хт> £ £), п нечетно. г) Множества классов Sn. лп выразимы аналогичными формулами в Ц Ar- co следующими изменениями: вместо <хь ..., хп> £ Е следует писать любую атомарную формулу; число кванторов перед ней > п, но число перемен кванто- ров (соседних пар вида уд или gw) по-прежнему равно п — 1. Доказательство, а. Проведем индукцию но п. При п = 0 имеем So UПо = Sj П Щ по определению разрешимых множеств. Если 2n-i С с Snj то Sn cz Sn+t (ибо Sn+, — проекции дополнений к элементам 2П, a Sn — проекции дополнений к элементам Sn_i) и Пп с Пп+( по опреде- лению П. Наконец Пцс:2п+1, откуда Sn cz Пп+1: действительно, если Е £ £ Пп, то EXZ+ £ Пп (так как умножение на Z+ коммутирует с дополнениями и проекциями и перевозит So = По в себя) и, значит, Е — проекция Е X Z+ £ € Sn+i- 00 00 б) Совпадение (J 2n = U Пп следует из а). Этот класс множеств содержится л=0 п=0 в арифметических, ибо перечислимые множества арифметичны, а проекции и дополнения не нарушают арифметичности: им отвечает навешивание g и Дли доказательства обратного включения {арифметические множества} С 00 С (J Sn — S , заметим, что множества, выразимые атомарными формулами, п=0 30 разрешимы, а остальные получаются из ннх применением проекций, допол- нений, объединений и пересечений (§ 2 гл. II книги Д и НД). Поэтому достаточ- но проверить, что замкнут относительно (конечных) пересечений и объеди- нений. Это верно для каждого Sn в отдельности. Для So это уже было доказано; далее индукция. Если Sn замкнут относительно (~), то Пп замкнут относительно U, Если Elt £2 € Sn+i. Е( — проекция f j, Ft £ Па, то можно ввести фиктивные пере- менные и отождествить друг с другом объемлющие Fг пространства и их проек- ции в пространство, общие для Et. Тогда Ег (J £2 = проекция £, (J £2, так что £i (J ^2 € Sn+i, и значит, замкнут относительно (J. Наконец, если Sn Замкнут относительно (J, то Пп замкнут относительно (~), и аналогичное рассуждение показывает, что Sn+1 замкнут относительно 94
Здесь, однако, нужно вложить в общее пространство некоторые произведения fj X (Z+)m‘, (Z+)mi X F2, так> чтобы при отождествлении отображений проек- ции мы имели pr (Fl X (Z+)m2 (-] (Z+)m, X Е2) = рг Л |~| ргЕ2. На языке формул это означает, что связанные кванторами 3 переменные в фор- мулах, отвечающих Fy и F2, нужно переименовать так, чтобы их множества не пересеклись. в) Это утверждение получается индукцией по п и прямым применением оп- ределений. Связку —выражающую дополнение, нужно каждый раз проносить через все кванторы направо, пользуясь обычным правилом коммутирования —iV,= И-l- ~1Е = V —> Проекцию коразмерности т > 2, которая выражается серией кванторов зх г1 х,^, нужно сводить к проекции коразмерности 1, заменяя группу переменных ..., х,т> на <^т) (у), (у)>, меняя соответствующим образом множество Е и ставя квантор 3 у. г) Доказательство получается такой же индукцией, как в), с использо- ванием диофантовости множеств из So. Учесть, что здесь заменять 3 ... g на g же, вообще говоря, нельзя. Предложение доказано. 4.3. Теорема. Для всех п 1 2п\Пп¥=0. nn\Sn=t0. Доказательство. Утверждение \ nj 0 — это теорема 5.8 гл. I о существовании неразрешимых перечислимых множеств. Общий слу- чай доказывается с помощью аналогичного диагонального рассуждения, при- мененного к версальному семейству. Пусть {£ь} — версальное семейство перечислимых (п -ф- 1)-множеств над Z+, Е — его тотальное пространство: <fe, х0,..., хп> £ Е -«=► <х0.хп> £ Eh. Положим, считая для определенности п = 0 (2): F={fe | з Xi у х2. -. V — 1 (<й, xi.хп> £ Е)}сГ. В силу 4.2в) F £Sn. В силу версальносги {Ед} н 6.2в) любое подмножество Z+ из лп можно выразить в виде Ед0 ={х0| I- (3 Xi V х2... у хп)~1 (<*о. х0, Xi,..., хп> £ £)} для подходящего k0^Z+. Ясно, что лежит либо в Е \ fh0, либо в Efc0\ F Поэтому Е =# Fk0 и F (- Sn \ Пп. Остальные случаи разбираются аналогично. 4.4. Замечания, а) С точки зрения теорем Тарского и Геделя результаты 4.2 и 4.3 подчеркива'ют огромное расстояние от доказуемости до истинности: D £ 21; а Т не только не принадлежит St, но даже выходит за пределы 2^. В' следующем параграфе мы укажем некоторые верстовые столбы на этом пути, б) Формально не оправдана предшествующими рассмотрениями, но имеет смысл классификация арифметических задач, т. е. вопросов «Верно ли, что Р £ Г?», по числу переменных кванторов в замкнутой формуле Р, записанной в виде 4.2г). Как показано в § 1 гл. I книги Д и НД, гипотеза Ферма выражается фор- мулой nb а Римана — формулой л3, хотя есть эквивалентное ей утверждение типа Яр 95
X. Роджерс [2] пишет: «Нетрудно заметить при относительно поверхност- ном исследовании, что почти все гипотезы, которые (I) интенсивно рассматри- ваются математиками и (11) выразимы в арифметике, находятся на довольно низ- ком уровне в классификации Sn. По-видимому, можно полагать, что челове- ческий мозг опособен понимать и изучать только предложения с ие более чем четырьмя-пятью переменами кванторов. Более того, можно считать, что всякие изобретения, подтеории и главные леммы в различных частях математики — это приспособление в помощь мозгу при работе с одной или двумя дополнитель- ными переменами кванторов». 5. ПРОДУКТИВНОСТЬ АРИФМЕТИЧЕСКОЙ ИСТИНЫ 5.1 В этом параграфе мы обсуждаем последний аспект теоремы Геделя: возможность, исходя из любого перечислимого множества уже известных истин арифметики,, эффективно пополнить его новыми исти- нами. С этой целью рассмотрим первоначальный вариант доказательства, в котором диагональный метод выявлен, а не скрыт в конструкции пере- числимого неразрешимого множества. Удобно описать его, сравнив с доказательством теоремы Тарского. 5.2. Пусть задан некоторый язык арифметики (Л, Аг, SAr или их расширение). Будем считать, что выбрана фиксированная нумерация его алфавита, определяющая фиксированную нумерацию формул У. Для дальнейшего существенно, что конструкция не инварианта отно- сительно замены нумерации на эквивалентную ей. Как Тарский, так и Гедель опираются на следующую «лемму об аутореферентности». 5.3. Лемма. По любой формуле языка с одной свободной переменной Р (г) можно эффективно построить замкнутую формулу Qp, которая говорит: «мой номер не принадлежит множеству, выразимому по- средством. Р». Иными словами, Qp истинная, если и только если Р (N (Qp)) ложна, где N (Qp) — терм «имя номера Qp». Доказательство. Для S Аг эта лемма была установлена в §11 гл. II книги Д и НД. Для Аг формула Qp строится так. Назовем диагонализацией формулы R (х) с одной свободной пере- менной формулу R (Л (R)). Пусть diag: Z+ -> Z+ — частичная функ- ция, «N — номер формулы с одной свободной переменной I-*- N — номер ее диагонализации». Результаты и методы гл. IV позволяют лег- ко установить, что diag вычислима. Поэтому ее график выразим форму- лой Ц Аг, которую можно явно построить. Обозначим ее через «у = = diag г», построим формулу R (х): д у («у = diag х" /\ Р (у)) и, наконец, положим Qp : ~I R (N ( I R)) = диагонализация —I R. Согласно определениям имеем 96
Qp истинна <==> номер ч R не удовлетворяет R <==> номер диагонализации -| R не удовлетворяет Р <==> <=-•=> номер Qp не удовлетворяет Р. Лемма доказана. Отметим, что проверка выразимости «у = diag г» в Lt Аг требует большой технической работы, из-за чего в книге Д и НД мы и замени- ли Lr Аг на S Аг 5.4. Далее рассуждения Тарского и Геделя в параллельном изло- жении выглядят так: Тарский: а) Предположим, что истинность выразима (формулой Р) б) Тогда есть формула, говорящая «я не истинна» (Qp). в) Она не может быть ложной (по своей семантике). г) Она не может быть истинной (по своей семантике). д) Следовательно, истинность не выразима. Гедель: а) Доказуемость выразима (формулой Р) б) Есть формула, говорящая «я не доказуема» (Q ). в) Она не может быть ложной (по своей семантике, иначе она дока- зуема и потому истинна). г) Следовательно, она истинна.’ д) Следовательно, она же не доказуема (по своей семантике). Отметим, что пункт в) рассуждения Геделя в нашем пересказе явно использует гипотезу о том, что доказуемы лишь истинные формулы. В 1931 году, когда появилась работа Геделя, специалисты были все еще заняты поисками финитных доказательств непротиворечивости ак- сиомы арифметики, так что принятие гипотезы D с Т проиворечило бы духу времени Поэтому в редакции самого Геделя рассуждение вы глядит несколько иначе. Все это по традиции подробно освещается во всех учебниках логики. Нам достаточно заметить, что если D Т, то D Т и теорема о неполноте верна тривиально, но мы настолько глубоко заблуждаемся, что это уже и неважно. Более существенно для нас следующее обстоятельство: по каждой фиксированной концепции доказуемости, приводящей к перечислимо- му (или даже арифметическому !) множеству доказуемых истинных фор- мул D, можно эффективно построить новую формулу, истинную, но не доказуемую Уточним, что здесь понимается под «эффективностью». 5.5. Определение. Множество F с Z+ называется продуктивным относительноверсальногосемейства {-множеств {Еh}, если существует такая частично рекурсивная функция f, что для всех kQZ+ с Eh с с= F имеем k Q D (f) и t (k) С E\£h. 5.6. Предложение. В предложениях п. 7.2 множество (номеров) истинных формул продуктивно относительно версального семейства {Eh}, построенного в § 8 гл. IV. 4 Зак. 1873 7
Доказательство. Будем для конкретности работать с язы- ком Lj Аг. Прежде всего построим перечислимое семейство {Рк (хх)} формул со свободной переменной хА, таких что Рк выражает Ек. С этой целью определим последовательность термов f Ifel в Lr Аг, как в п. 8.1 а), § 8 гл. VI, положив J[4/г] =й= +(... + (Т,Т)...), k раз; f [4/г + 1] =хк+ , —(k-|- I )-я переменная Lr Ar, 7[4/?4-2J = + (7р, (k)]~f [г2 </г)]); Й«+з] = -(7[f> (Д1), и затем напишем Рь= л «2(Л хз- • • (л xh (Дб Рекурсивность функции k —V (Рк) легко проверяется методами § 4. После этого, фиксировав перевод «у = diag х», положим /?fc = H*fc+i<("rft+i=diagx'i[) Л (P/i(xi))), и окончательно Вычислимость этой функции следует из вычислимости N (Рк). Она удовлетворяет условию 5.5, для Т вместо F по лемме 5.3. 5.7. Концепция продуктивности предоставляет следующий подход к задаче исчерпания Т\ начнем с множества D формул, доказуемых от- носительно системы аксиом Пеано Ах0; выразим Do формулой. Р(|; положим Ахг = Ах0 J {Qp„}; аналогично построим D,, Pt и Ах, = = Ах] U {Q/?j} и т. д. Из теоремы Геделя следует, что пока мы про- делываем все это «равномерно эффективно», мы все равно не сможем получить целиком Т даже после трансфинитного числа шагов. Тем не менее, как показал С. Феферман, иеной неизбежной утраты эффектив- ности мы можем таким способом получить все Т Аг, что дает об этом множестве неожиданную и философски интересную информацию. Сформулируем в заключение результат Фефермана |27|. 5.8. Принцип продолжения. Прежде всего для исчерпания ТАг недостаточно на каждом шагу добавлять к Ахг лишь формулу Геделя. Существует много других способов строить интуитивно истинные фор- мулы, по-разному формализуя «веру в аксиомы Ахг». Феферман использует, в частности, следующую конструкцию. Пусть система аксиом Аха уже построена (а — ординал) и множество номеров выводимых из Аха формул выражается формулой Для любой фор- мулы с одной свободной переменной Р (х) построим формулу с интуитивным смыслом:
«если Р (п) доказуема (исходя из Ахл) для всех термов-имен чисел п, то ух Р (х) истинна». Эти формулы должны лежать в Т, и мы сможем по- ложить Аха+1=Аха и {В„|все Р], Ах$ = U Аха для предельных (3. а < р Вот способ указать В? явно. Функция п N (р (п)) вычислима как функция от п и N (Р). Выразим ее график формулой М (х, у, г) так, что для d, tn, п £ Z+ 'I есть номер формул Р с единственной сво- M(l, tn, п) истинна <==> бодпой переменной х; пг есть номер Р (п). После этого положим Sa = у у у z (М (/V (Р), у, г)->- Da(y))~> ухР(х). 5.9. Проблема выбора Da. Это — наиболее тонкий момент; особен- но остро стоит вопрос даже о существовании £>р для предельных ор- диналов р. Феферман показывает, как построить Da для подходящей счетной последовательности ординалов с пределом у, не превосходящим так, что окажется верным следующий результат. 5.10. Теорема. Все истинные формулы Lx Аг выводимы из U АхЛ. а<у Итак, пусть мы приняли аксиомы Пеано. Тогда для постижения полной истины в арифметике остается еще совершить трансфинитную последовательность актов веры в то, что предшествующие акты веры не были заблуждением. 6. ВЫЧИСЛИМЫЕ ФУНКЦИИ С ОЧЕНЬ БЫСТРЫМ РОСТОМ 6.1. В этом параграфе мы приведем два примера истинных арифме- тических утверждений, не доказуемых в арифметике, скажем, с ак- сиомами Пеано. Оба они связаны с существованием очень быстро рас- тущих вычислимых функций: в первом примере по построению, во вто- ром — менее очевидным образом. 4* 99
6.2. Доказуемо вычислимые функции. Пусть f : Z+ -> Z+ — неко- торая вычислимая (т. е. общерекурсивная) функция. Представим ее график Г, в виде диофантова множества. Тогда общерекурсивность / означает истинность утверждения вида ух 3! у 3%1 ,...XN (Р (х, у, Xj, Xn) = 0), где Р—многочлен с целыми коэффициентами; кванторы относят к пере- менным из Z+. Среди истинных утверждений такого рода некоторые доказуемы в данной формальной теории, скажем, в теории Пеано. Но заведомо не все такие истинные утверждения доказуемы. Действительно, мно- жество доказуемых утверждений перечислимо; если n-е доказуемое утверждение определяет вычислимую функцию fn, то функция F («)= —/п («) + 1 вычислима, но не содержится в списке доказуемо вычисли- мых функций. Иными словами, проблема распознавания вычислимых функций среди полувычислимых (заданных своими описаниями) не- разрешима. 6.3. Теорема Рамсея. Пусть X — некоторое множество; обозна- чим через 3"r (X) множество его подмножеств, состоящих из г элемен- тов. Ясно,, что если Y с= X, то ?РГ (У) с= (X). Подмножество У на- зывается однородным относительно данного разбиения SP, (X) на классы, если •9ЭГ(У) целиком попадает в один класс. Обозначим через Iп] множество целых чисел от 1 до п. Теорема Рамсея — это следую- щее комбинаторное утверждение: для любых т, г, 1 существует такое п, что для любого разбиения З1, |п) на k классов в In], найдется однородное подмножество, содержащее т. элементов. В частности, с помощью перебора вычислима функция Рамсея AJ0 (m, г, k), дающая наименьшее значение п с таким свойством Справедливо также усиление теоремы Рамсея. Чтобы его сформули- ровать, назовем подмножество |п| дисперсным, если количество его элементов не меньше, чем его наименьший элемент Усиленная теорема Рамсея утверждает, что для любых т, г, k 1 существует такое п, что для любого разбиения 3\ |«1 на k классов в [л] найдется дисперсное однородное подмножество, содержащее т элементов. Точно так же с помощью перебора вычислима вторая функ- ция Рамсея R (т, г, k), дающая наименьшее значение п с таким свой- ством. Оказывается, однако, что хотя теорема Рамсея доказуема в арифме- тике Пеано, усиленная-теорема Рамсея уже не доказуема. Скорость роста функции R чрезвычайно велика. Уже /?0 растет .2т довольно быстро: Ro (т, т, т) примерно как 22' (т раз), но R (т, т, т) не поддается никакому воображению. Эти результаты были дока- заны Пэрисом и Хэррингтоном [24]. 100
Глава VI РЕКУРСИВНЫЕ ГРУППЫ 1. ОСНОВНОЙ РЕЗУЛЬТАТ И ЕГО СЛЕДСТВИЯ 1.1. Рассмотрим счетный «групповой алфавит» А = {а1; а2, ...; аг1, а2 Выражения в алфавите А, включая пустое выражение Л, будем по традиции называть словами. Слово а,...аг (т I раз) будем обозна- чать а?"; аГ1 ...а~' (т 1 раз) — соответственно будем считать, что а” = Л. Слово а”’... си* называется приведенным, если оно пустое или в его полной записи нет подслов вида arL а, и а^Г1. На множестве приведенных слов операция «соединение и приведе- ние— вычеркивание всех подслов вида ata аг' а, определяет струк- туру группы с единицей Л, которую мы также будем обозначать 1. Это — свободная группа F со счетным множеством образующих {а] ап, Не обязательно приведенные слова также могут рассматри- ваться как элементы F: они отождествляются с результатом приведе- ния в F. На А имеется каноническая нумерация: (V (a,) = 2i, N [аг1) ~ = 2i — 1. Все понятия, связанные с вычислимостью операций и пере- числимостью подмножеств в А и S (Л) будут рассматриваться по от- ношению к любой из нумераций А, эквивалентной Л/, и любой из Нумераций £(Л), согласованной с- N (см. определения в § 1 гл. IV). Мы будем постоянно пользоваться следующими фактами. 1.2. Лемма, а) Множество F приведенных слов в S (Л) разрешимо. б) Групповые операции в F вычислимы. в) Подгруппа G гг F перечислима в S (Л) тогда и только тогда, когда у нее есть перечислимое множество образующих. г) Нормальный делитель Н G в перечислимой подгруппе G ГГ F перечислим тогда и только тогда, когда он порожден Перечислимым множеством как нормальный делитель. д) Гомоформизм F -* F рекурсивен тогда и только тогда, когда рекурсивно индуцированное им отображение {«!, ... ап, ....}-* F. Это хорошее упражнение на владение техникой гл. IV, и мы остав- ляем его читателю Начать доказательство удобно с установления вы- числимости операции приведения; все остальное делается более или менее автоматически. 1.3. Определение. Группа называется рекурсивной, если она изо- морфна фактогруппе вида GIH, где G F — перечислимая подгруп- па, а Н ГГ G — перечислимый нормальный делитель. 101
Здесь можно было бы ограничиться подгруппами G F, которые порождены перечислимым подмножеством стандартных образующих {^1» - •» 1.4. Замечания и примеры, а) Рекурсивные группы не бо'лее чем счетны. б) Группы, заданные конечным числом образующих и соотношений {конечно определенные, сокращенно к.о.), рекурсивны. В частности, ре- курсивны конечные группы и конечно порожденные (к.п.) абелевы группы. в) Подгруппа И к.о. группы G не обязана быть к.о. (или даже к.п.) группой. Однако если она конечно порождена, то она рекурсивна. Действительно, пусть {hlf hm} — система образующих Н. До- полним ее до системы образующих {hlf .... hm, hm+1, .., hn} группы G, где hm+1,..., hn порождают G и связаны конечным числом соотношений, и определим гомоморфизм <р : F -> G, (р (аг) = ht для i Ф (°/) — 1 для j > п. Его ядро £ порождено конечным числом соотношений меж- ду hlt ..., hn и множеством {an+i, ап+2, ...} и потому перечислимо по лемме 1.2.г). Подгруппа Н cl F, порожденная аъ .... ат, также перечислима по лемме 1.2 в). Поэтому множество Н П Е перечисли- мо. Но <р индуцирует изоморфизм Н/Н П £ Z Н Следовательно Н рекурсивна. Основная цель этой главы — доказательство следующей замеча- тельной теоремы Хйгмэна [28], которая обращает простое утвержде- ние 1.4 в следующую теорему. 1.5. Теорема, а) Любая рекурсивная группа G/Н (в обозначениях 1,3) погружается в подходящую к о. группу F N. б) Это погружение можно считать эффективным, т. е. индуциро- ванным посредством подходящего рекурсивного отображения G -> F. Вот некоторые ее следствия. 1.6. Универсальная конечно определенная группа. Существует такая к.о. группа U, что любая к.о. группа G может быть погружена в U (значит, и любая рекурсивная группа погружается в U). Действительно, любая к.о. группа изоморфна фактору £ по нормаль- ному делителю, который порожден конечным множеством приведенных слов в £ и всеми а, для i п с подходящим п. Обозначим через / с: cz S (S (Л)) X Z+ разрешимое множество пар < конечная последо- вательность приведенных слов, п > и пусть Л/г (для i g I) — соот- ветствующий нормальный делитель. Построим «дважды бесконечный» групповой алфавит {ajk, ajk1 If, fe I}, выберем рекурсивную нуме- рацию множества 7. отожествив его с Z+, и. зададим группу (70 об- разующими {ajk} и соотношениями «Л/,-, записанными в алфавите [ап, а)г, ..}». Ясно, что 77 0 рекурсивна. Из результатов следующего параграфа будет видно, что (70 — свободное произведение всех групп F/Nj, поэтому любая к.о. группа в (7в погружается. Значит, любая 102
к. о. группа U, в которую по теореме Хигмэна погружается Un, уни- версальна. В работе М. К- Валиева [291 строится универсальная группа U, за- данная 14 образующими и 42 соотношениями. Там же указано, что можно ограничится 2 образующими и 27 соотношениями. 1.7. К.о. группа с алгоритмически неразрешимой проблемой тож- дества слов. Пусть G — группа с четырьмя свободными образующими a, b, с, d и соотношениями b~mabm = d~mcdm для всех т g Е, где Е с 7+ — перечислимое не- разрешимое множество. Из результатов 2 легко следует, что в 6 р_ венство b~lab* = d~'cd* выполнено только для х £ Е (В самом деле, элементы b~m abm для т I порождают в G свободную подгруппу, так что G содержит сво- бодное произведение подгрупп, порожденных {b~xabx | х. 1} и {d~zcdx[x 1} с объединенными подгруппами (b~xab‘ = d~rcd' \ х £ Е}.- Поэтому справедливость написанного равенства неразрешима (как мас^ совая задача, пронумерованная х), и эффективное погружение G в к.о. группу дает неразрешимость проблемы тождества слов в этой к.о. группе. Существование таких групп было впервые установлено П. С. Нови ковым 1J8. «Естественные» рекурсивные группы. Много примеров рекур- сивных групп не являющихся априори конечно определенными, до- ставляет алгебраическая геометрия над полями алгебраических чисел Ограничимся типичным примером. Пусть 0п (Q) — группа ортогональных автоморфизмов некоторого л-мерного линейного пространства L (над полем рациональных чисел Q), снабженного квадатичной формой f. Пусть b — соответствующая билинейная форма. Для любого вектора х £ L с } (х) 0 определена симметрия тх £ Cj (Q): t пЬ(х, If) - г тх(у) = У —2 X для всех у С L. Инволюции тх Q О (Q) составляют перечислимую систему образу- ющих этой группы, а все соотношения порождены перечислимой (даже разрешимой) системой соотношений <г‘ = 1. (тхтутг)2=1 для всех, коплапарных {х, у, z} (С. Беккеп). Подразумеваемая нумерация L s Qn согласована с любой нуме- рацией Q, которая Z+ согласована со стандартной и в которой операции поля вычислимы. 1.9. Теорема Хигмэна родственна теореме о диофантовости пере- числимых множеств (гл. II), хотя была впервые доказана раньше последней. Возможно, что оба факта являются частными случаями 103
подходящего общего утверждения о рекурсивных алгебраических структурах. Во всяком случае использование теоремы о диофантовости зна- чительно упрощает «рекурсивную» часть доказательства Хигмэна. Это показал М. К. Валиев, рассуждения которого мы приведем в §. 5, 6. Теоретико-групповой подготовке посвящены § 2—4; здесь мы следуем Хигмэну. 2. СВОБОДНЫЕ ПРОИЗВЕДЕНИЯ И HNN-РАСШИРЕНИЯ 2.1. Пусть дано семейство групп (G;), 1^1, и семейство гомоморфизмов групп ai : А —» Gj. Рассмотрим класс семейств (И, 0{) гомоморфизмов 0i : G; —» Н с условием: Pi о а; : А —» Н не зависит от i £ /. В этом классе существует единственное с точностью до изоморфизма универсальное семейство <рг- : G,- —» * G^:, любое А другое*семейство (//, 0,-) однозначно определяется гомоморфизмом у : * Gh —» Н А для которого Р, = . Ниже мы будем пользоваться только случаем, когда все а,- — вложения; В этом случае »G^ называется свободным произведением групп G; с объединенными А подгруппами а.^ (4) С G,-. Структурные отображения Gz- —» * G^ будем обо- А значать, как правило, ф,-, возможно, с дополнительными индексами. Структур- ный гомоморфизм ф, ' а,- : А —» * G&, не зависящий от i, обозначим ф. А В случае А = {1} мы пишем просто * Gf вместо * G(; если множество ин- А дексов есть {1, п}, применяется запись Gj * i:. * Gn и т. п. Мы будем постоянно пользоваться следующим структурным результа- том. Пусть : А Gt — вложения и пусть S,- С G,- — такие подмножества, что и аг(Д)д И аг (Л)S! аг (Л) s2 при seSj 2.2. Предложение. Любой элемент группы * Gr- однозначно представляется А в виде Ф («)<₽/, («1) <Pin («п). где а £ А, sk £ Ч О+1 при ЛСРХ п зависят от элемента, Это разложение будем называть каноническим. Доказательство этого факта и дальнейшие подробности см., например, в лекциях Серра «Деревья, амальгамы и SL„» (Математика, 18 ; 1, 1974 с 3— 51). 2.3. Следствия, а) В условиях п. 2.3 структурные гомоморфизмы ф, фг являются вложениями. Это позволяет иногда отожествлять А и G;- с подгруппами * Gi относитель- А но ф, ф{. В следующих формулировках мы так и поступим. Однако в многоэтаж- ных конструкциях последующих разделов одна и та же группа будет по-раз- ному вкладываться в другую группу с помощью различных композиций струк- турных отображений, и за ними придется тщательно следить. 6) Gz Л «б; = А при ( =/= / (в * Сг), т. е. ц>; (G/) Q (G,-) = ф (4), IC-1
Для доказательства включения G воспользуемся предложением 9.2: иначе мы имели бы <р,- (sj) “ ф, (Sj) вопреки единственности. в) Пусть дано семейство вложений р, ; Hi —• О, и аоисрунни о с_ а, та- кая, что Pi (#i) П «i М) “ ai(B) для всех i, РГ1-а1 vrai * Тогда композиция В---------, И,- —-Ав, не зависит от I и потому определено каноническое отображение * Н, —• * Gj. Оно является вложением. В частно- В А ста, подгруппа В * (ц, порожденная <р; . рг- (/Уг), изоморфна * Н>, А в Действительно, каноническое разложение элемента * fit, описанное в В п. 2.2,. переходит в каноническое разложение его образа в * Gj, Л г) В тех же обозначениях имеем = B в .0г; В А в ,Gf. В А 2,4. Образующие и соотношения. Пусть М — некоторое множество, a R — некоторое подмножество свободной группы FM, свободно порожденной М. Тог- да через | М : R | будем обозначать факторгруппу F^/Л, где R — наименьший нормальный делитель FM, содержащий У?; Это задание группы образуюшимв (Л4) и соотношениями (R). Мы будем- дополнительно пользоваться следующими вольностями записи> а) Если М имеет непустое пересечение с какой-то ранее описанной группой, то следствия из соотношений в этой группе подразумеваются входящими в R, даже если они не выписаны. Упоминание об R может вообще быть опушено, ес- ли сверх таких соотношений ничего больше нет. Например, если E.FGG — две подгруппы, то ] Е (J F ] — порожденная ими подгруппа в G и т> п. б) В R вместо, скажем, мы можем написать а^ •= а2. Пример. Если аг : А —» бг — вложения, то * 0$ задается образующими А и соотвошеннямн так: |IJI Gf: ai (a) = a.j (aj для всех aG^i,/,/Е/1. Введем теперь фундаментальную для всего дальнейшего чонструкпню (Г. Хигмэн, Б. Нейманн, X. Нейманн). Пусть даны два вложения групп а, 0 : А —• и 2.5. Определение. НNN-расширением группы О (относительно A, a, pj на- З’явается группа Л «= | С U {<} : Z-1a (a)t “ б (а) для всех а £ A |t 2.6. Предложение. Следующие гомоморфизмы являются чложеинями‘ а) О — X е I—• класс g £ G mod соотношений е л б) G * — К. где свободное произведение берет-» относительно ело- А жений a j-> р (а), а |—> Г‘а (aj h 105
Доказательство. В группе G * {«”} подгруппа (J, порожденная G и и~'а(А)и, изоморфна G*u_,a(A)u. Действительно, каноническое раз- ложение элемента второй группы имеет внд gi и-1 a (aj ug2 ... gn и-1 a (an) и, где g,eG, g2....gneG\{l}; «1....an-i £ an £ A, и поэтому имеет канонический вид также в G * Аналогично построим подгруппу V = G * (А)о-1 С G * {о"}. Отождествим с U и V группу W — Grw-] Aw посредством изоморфизмов, тождественных на G и переводящих w~1aw, в u-1a (а)и, с0 (а)о-1 соответст- венно. Рассмотрим группу (G * {«”}) * (G * {о”})- Группа G cz W канонически вложена в иее, и элемент t — ио удовлетворяет соотношениями (~га (a)t =• = 0 (а) для всех а £ А, потому что мы отождествили и~1а (а)и = у0 (а)у-1, Кроме того, из предложения 2.2 видно, что u~'Gu, vGv~’ порождают в (G * {и"}) * (G * {о"}) свободное произведение с объединенной подгруппой А, вложенной посредством отображений al—» и~ 1 а (а) и, а > п0 (а) соот- ветственно. Значит, G и /~<GZ также порождают свободное произведение, опи- санное в формулировке (применить сопряжение посредством с). Поэтому подгруппа /С = | G U {/ = uv} | С2 (G*{un}) » (G » {o'1}) является гомоморфным образом К, и утверждения а), б) справедливы для К. ’ Более того, каноническое отображение К —» К' является изоморфизмом. Для проверки достаточно заметить, что существует изоморфизм. К * {o'1} 5(0 * {ип}) * (G * {оп}), переводящий t £ К в uv. В частности, порядок t в К бесконечен. Преложение доказано; Нам понадобится уточнение и обобщение этого результата в двух направ- лениях. Во-первых, следует рассмотреть итерацию ДАЛ/-расширений; во-вто- рых, связь Hn'N — расширений группы и подгруппы. Объединим все нужные факты в одной формулировке. Предположим, что задано целое семейство пар вложений at, 0, ; А; —> —» G (< (j /) и подгруппа Н С G с условиями о^-1 (af (A) Q Д) = 0“i (0/ И) Н) = Bt С. А — подгруппы. В этих условиях имеем 2.7. Предложение. Положим Кп== I G U {G I« £ 0 : tf1 rj-i (a) li = ?i (а) для всех i 6 /, а 6 А, | Кн = | Н U | i £ /} : Zf1 «i (*) !i = 0i (*) для всех 1С I, b£ Bt\. Тогда а) Vi} свободно порождают свободную подгруппу в KG\ б) естественные отображения G—> KG и Кн —► KG : 1} 1—» Ц являются вложе- ниями. Кроме того, Кн (] G = Н в Ка. 106
Доказательство, а) Если бы в KG из имеющихся соотношений сле- довало нетривиальное соотношение между tt, оно сохранилось бы в факторе по наименьшему нормальному делителю, содержащему G. Но в этом факторе соотношения trlai (a}ti = Рг (а) превращаются в тривиальные 1 = 1 и ника- ких ограничений на образы не накладывают. Это доказывает первую часть. б) Разберем случай одноэлементного /. В обозначениях доказательства предыдущего пункта рассмотрим Кв как подгруппу (G *{un})* (G * {п"}). В G * {пп} имеем по предложению 2.2 // * (un}f)G*u~1 а (4) и = Нги—>- а (В) и н аналогично в G * {ол} //*{nnjr)G*op(4) v~l~H * yfj (В) о-1. Описанное выше отождестви ей и е U с V отождествляет эти пересечения с под- группой Vt=H* 1 Bw C.G * w~1 Aw — W. Из следствия 2.Зв) находим каноническое вложение (Н * {ип\)f [Н t -» (G * {«"}) * (G * {o'1}). IV „ W ’ Но, как в конце доказательства 2.6, группа слева есть Кн * {гХ1}, а спра- ва — K.G * {п"}, что дает вложение Кн —» Далее (пересечение в (G * {«”}) * (G * {п”})): W (И г !ип}) f (Н f {vni)f]G г v~l а (А) и = Н » и~1 а (В) и, IV” откуда, пересекая еще с G, получаем Н. Тем более, Кн (") G = Н. Отсюда случай общего / получается для конечных / несложной индукпией по п, а для бесконечных — переходом к индуктивному пределу (здесь — объе- динению). Подробности мы оставляем читателю. 3. ВЛОЖЕНИЯ В ГРУППЫ С ДВУМЯ ОБРАЗУЮЩИМИ В этом параграфе мы докажем результат, который будет использован в дальнейшем и в то же время выпукло продемонстрирует в простой ситуации приемы уменьшения числа образующих при вложении. 3. 1. Предложение, а) Любую счетную или конечную группу можно вложить в группу с двумя образующими. б) Если G рекурсивна, то вложение можно сделать рекурсивным. Доказательство, а) В Z г Z = {&"} * {о”} есть свободная подгруп- па счетного ранга, например; S = l{b-‘udlli > 0}|. Отсутствие соотношений между образующими b-'oh1 немедленно следует из предложения 2.2. Поэтому если G — свободная счетная группа, го оиа погружается в Z г Z. В противном случае можно попытаться представить G в виде Е/N, где F счетна 107
и свободна, погрузить F в Z * Z и затем рассмотреть индуцированный гомомор- физм F/N —• Z * Z/N', где N' — нормальный делитель в Z * Z, порожденный V, К сожалению, N' f) F может быть строго больше (V, так что этот гомомор- физм не обязан быть вложением. Следующая конструкция показывает, как а этим бороться. Пусть {gj, g2, gs, i;.} — счетная система образующих группы G, g; 1> Последовательно построим следующие расширения группы G: 1) G * {н«}. 2) //ЛЛ-расширеиие группы G * {«"}: jG*{u"}(J {(,• !«/-’ utt^ugi, < = 1,2, Учесть, что и, ugi порождает в G* {«”} бесконечные циклические подгруппы. 3) Свободное произведение Р этого //AW-pacm прения и группы {/?"} » {<"} с объединенными подгруппами! {/lt t2, ... } |, 1} I относительно изоморфизма tf = b—‘ vbl, 1. 4) В Р есть две свободные подгруппы ранга 2: | {Ь, г} | и | {и, 6}]. Отсут- ствие соотношений между и, b следует из того, что они ие могут появиться в фак- торе по минимальному нормальному делителю, содержащему G, ti, v. Окончательно построим ///V/V-расширеиие группы Р: Q = | P(J {а} : а-1 ba = u , a~Lva = b |. Для завершения доказательства осталось проверить, что Q порождена элемента- ми а, Ь. Действительно, очевидную систему образующих Q составляет множество (gi, tf (‘ > i); “, у, °, Ь}. Соотношения g;-= u~lt~'uti позволяют исключить gp Соотношения ti = b~lvb; ПОЗВОЛЯЮТ ИСКЛЮЧИТЬ ti. Соотношения и = a~lba. v = aba~l позволяют исключить и, о. Это до- казывает первую часть предложения. Следующий анализ конструкции уста- навливает вторую часть. Выражая gj через а, b в Q с помощью выписанных соотношений, нахо- дим gi = с; mod соотношений в Q, где е, =a~l b~1 ab~1 ab~l а~1 Ь{а~'х Xbab~2 aba-1 №. Поэтому в группе * {Ьп} подгруппа | (е; | i > 1} | = Е обладает следующим замечательным свойством: любой нормальный делитель N < Е порождает в {«п| * {Ьп} такой нормальный делитель N', что Е (~) N'~N (ср. с обсуждением в начале доказательства). В частности, если {g;} — перечислимая система образующих группы G, связанная перечислимым множеством соотношений, то отображение g,- I— et mod соотношений порождает рекурсивное вложение G в рекурсивную группу Е/N', ибо N' перечислимо вместе с N. 4. ХОРОШИЕ ПОДГРУППЫ 4.1 Определение-лемма. Пусть G — конечно порожденная группа, HCZ.G ___ ее подгруппа. Н называется хорошей, если выполнены следующие условия-. а) Существует конечно определенная группа К, ее конечно порожденная подгруппа L и вложение дсК. такое, что G L = Н б) FINN-расширение : t~lht ~ h для всех h £ Н | вкладывается в конечно опреде- ленную группу в) G * G вкладывается в конечно определенную группу, н 108
Доказательство эквивалентности. а)=> б). Пусть G С К, L удов- летворяют а). Тогда KG вкладывается в //Л'Л'-расширеиие I К (J (Л : <“1^= I для всех I £ L\ в силу 2.6. Ойо конечно определено: к образующим К иужио добавить t, а к соотношениям между образующими К — соотношения t-Utt—l; для конечной системы образующих {/г} группы L. б) => в). Группа G * G вкладывается в KG в силу 2.66), a Хй вкладывается н в к. о. группу по предложению б). в) => а). Пусть G * G С. М, М конечно определена. Тогда положим К “• М, н L = образ G при сквозном вложении ф2 : G —» G * G —и вложим G в К по- н средством <pj : G —» G * G —» М. Из того, что Ф, (G) (") ф2 (G) =» Н, следует н требуемое. Основная цель этого параграфа состоит в сведении теоремы 1.5 Хигмэиа к доказательству того, что перечислимые подгруппы в Z * Z хороши. Для это- го и для дальнейших нужд нам понадобится следующая лемма. 4.2. Лемма. Пусть R — хорошая подгруппа к. п. свободной подгруппы Р, R — порожденный ею нормальный делитель. Тогда Р/R можно вложить в к. о, группу. Доказательство. Пусть i — вложение Fr F в к. о. группу К (см; 4.1в)) и пусть <pt, ф2 : F —» F * F — структурные отображения. Рассмотрим два _ R вложения F в К X F/R: а : f |-> < i о ф1 (/), fR>> Р : ) I- <1 • Ф2(Л. !>• На подгруппе R G F они, очевидно, совпадают; Поэтому они индуцированы гомоморфизмом у : F * F -» К X FIR, R который имеет тривиальное ядро <это так для композипии V с проекцией ня К, совпадающей с i). _ Построим ///V/V-расширение, переводящее (X {!};/•'»/'—» л X Г/К в Л у: L= | Хх F/R U {/}: <-1<‘ °Ф1(Л> » f = <^Фт(Л> /Я>. << ° /2</)> 1> ( = <« ° фг(Л. 1> Для всех ) G F|. Очевидно, L содержит F/R. Покажем, что она конечно определена. Образующие L : (/} (J {отмеченные образующие К) (J (отмеченные обра- зующие Г}. Эта система конечна. Соотношения в L: а) (соотношения между образующими К); б) (соотношения коммутирования между образующими К и образующими F}. Наложив их, мы можем считать, что дальше работаем в Л X Р, в) t-1 <i о ф, (/), 1> - = <; - ф, (/), f>, t~l <( о ф, (f). 1 > ' = </ ° Ф.2 (Л. 1 > • где / пробегает отмеченные образующие F, 109
г) Соотношения между образующими F, принадлежащие R. Систему соотношений Ra = a) (J б) (J в) можно взять конечной. Остается только проверить, что г) следует из иее. Пусть R' С F — нормальный делитель, порожденный Ra, т. е. ядро есте- ственного гомоморфизма F |Л (J F (J (Z) : Ro |. Мы хотим установить, что R' = R. Включение R‘ С R очевидно,.- Проверим обратное включение. Для f £ F положим f = f mod R’, 71>г = t <p12 (/) £ К. Тогда из со- отношений б) и в) следует, что в К X F/R' имеем /-1 <Л, 1> t = <flt \> <1, f'>, t~' <f2, 1> t= <f2, 1>. С другой стороны, если f £ R, то, поскольку FR r F вложена в К из еоотиоше- ний а) следует, что = /2. Поэтому /'=>!, так что R — R', Выведем из этой леммы редукционный результат. 4.3. Предложение. Если все перечислимые подгруппы в Z г Z хороши, то теорема Хигмэна верна. Доказательство. Пусть G — свободная группа, порожденная пе- речислимым множеством свободных образующих {g;}, i = 1, 2, 3, N С G — ее перечислимый нормальный делитель. Покажем, как вложить G/М в к. о. груп- пу. Рассмотрим сначала вложение 6 —> {а«} » {Л”), gi |—» 7, где /г описаны в конце § 3. Пусть при этом вложении М порождает нормальный делитель ЛИ с {ап} * {&”}. По замечанию в конце § 3 G/N вкладывается в {ап} * {£П}/Л". Но N' перечислим по лемме 1.2 г), ибо порожден образом перечислимого множе- ства при рекурсивном отображении. Значит, ЛИ — хороший нормальный дели- тель. Лемма 4.2 показывает тогда, что {а"} * {bn}/!v' можно вложить в к, о. группу. В заключение этого параграфа установим несколько полезных свойств хо- роших подгрупп. 4.4. Лемма. Пусть Е, FQG — хорошие подгруппы. Тогда а) Е F — хорошая подгруппа; б) | Е (J F | («сумма Е и F в G») — хорошая подгруппа. Доказательство, а) Пусть фь ф2 : G —» G * G и ф{, ф' : G -» Е —> G * G — структурные гомоморфизмы. Пусть Л11я Л12 — такие к. о. группы, F что G * G С Л4 j и G* GC Л12. Отождествим (G) С М} и ф( (G) С Л4, с G и Е F построим группу Л1] * Л12. Она конечно определена (к соотношениям в ЛЦ и Л4а G достаточно добавить соотношения ф, (gi) — ф,' (gt) для конечной системы об- разующих G). Пусть <pj', ф2 ' М], Л12 — Л1, * Л12 —структурные вложения. G Положим К = Mi * М2, L = ф1 о ф, (G) и вложим G в К посредством <pj о <р', G Утверждается, что G (~) L = Е (~| F (как подгруппа G в К). Действительно, Ф1 (Л<1) П Фа (Л,г) = G с каноническим вложением в Л1, * М„. Если в М^ взять f G лишь ф, (G), а в Л1.2 лишь ф2 (G), то пересечение с объединенной подгруппой G даст Е и F соответственно, а друг с другом Е F. б) Подгруппы ф, (| Е (J F I) и ф2 (G) в G * G имеют одинаковое пересечение с объединенной подгруппой: они ее содержат. Поэтому в силу 2.3г) в G * G.имеем Е Фг (I Е U Я) U <H(G) | П Ф1(б) = | Е U F |, т. е. поскольку Е объединена, ! Фг (F) (J фа (G) | Я Фг (G) = | Е J F |. НО
Аналогично l<Pi'(£)U<P2 (G) I П <p{ (G) = | E (J F |. Обозначения согласованы с тем, что эти пересечения отождествляются в объеди- ненной подгруппе произведения Mi * М2, построенного, как в пункте а). G Применяя 213г) к этому произведению, находим I <Р1 (I <Р1 (^> U <Рз (G) I) U Фг (I Ф1 (£) U Ф2 (G) I) П G = | £ |U Г|. Но группа | ф^’ с ф2 (G) U ф'з с <p' (G) | G, очевидно, содержит правую часть этого равенства и содержится в левой, поэтому она также совпадает с | Е (J А | Наконец, | ф," > ф2 (G) U Ф-’ Ф? (G) I конечно порождена в к. О; группе Mi * Л12, что завершает доказательство. G 4. 5. Лемма. Пусть G, Н — к. п. подгруппы к. о. групп. Тогда лМюй гомо- морфизм G s Н переводит хорошие подгруппы G в хорошие подгруппы Н. Доказательство, а) Если A G G хорошая, то А X {1} С GxE— тоже хорошая: по вложению (G, А) в (К, L) условиями 4.1 а) строится очевид- ное вложение (G X Н, А X {1}) в (АХ М, L), которое также удовлетворя- ет 4.1а), если М — к. о. группа, содержащая Н. Наоборот, если АХ |1|GGX // хорошая, то по вложению 4.1а) (G X X Н, А X {1}) в (К, L) строится соответствующее вложение (G, А; в (К. L()GX {1}). б) Пусть теперь ф: G —> Н — любой гомоморфизм, F— его график (A G G — хорошая подгруппа. Тогда имеем в G X Н 1} X ф (А) = |(|А X {1} U (1) X Н\ П F) U G X |1| П1 {П X Н, Из предположений относительно G, Н ясно, что F — хорошая подгруппа в G X Н. Из пункта а) видно, что остальные подгруппы в правой части формулы тоже хорошие. По лемме 3.2 {1} X ф (А) — хорошая подгруппа. Поэтому и ф (А) хорошая. 5. ОГРАНИЧЕННЫЕ СИСТЕМЫ ОБРАЗУЮЩИХ 5.1. Пусть G-' = | {во. =-•- “nl ! п > 1 — группа, свободно порожденная образующими at. Назовем подмножество R' С О' ограниченным, если сущест- вует такоег > 1, что любой элемент/?' может быть представлен в виде а*’ ... аХг, к, £ Z. В этом параграфе мы докажем следующий частный случай посылки пред- ложения 4.3. 5.2. Предложение. Если подгруппа Н' G G' порождена ограниченным пе- речислимым подмножеством R' С G', то она хороша. Следствие. То же верно для G', являющихся к. п. подгруппами к., о. групп (воспользоваться леммой 4.5). В следующем параграфе будет показано, как общий случай выводится из этого. Доказател ьство 5.2. состоит из очередной серии редукционные шагов. 5.3. Первая редукция. Рассмотрим в свободной группе G = Ца0, &о > Со1 • • • j arn > > сгп} I 111
н екоторое множество «слоеных» слов вида Д’ = ! az<> bn cza ... axrn brn cxrn I 1 о “ о гп гп I и порожденную им подгруппу Н QG. Мы покажем в дальнейшем, что если R пе- речислимо, то Н хороша. Это — частный случай 5.2, к которому обшая ситуация сводится следующим приемом. Пусть даны G', й', как в п. 5.1. По каждому элементу g'== ах' ,,, аУ R' построим элемент g £ G следующим образом. Представим g' в виде п п а П axi,i п ax2,i... П axr,i, '= 1 ‘ Z = 1 ‘ 1=1 ‘ где {хь при i — , О при i =f= th. После этого положим / п \ / п g = П aKi,i b( cx\,i I • • • I П axr,i bi c*r-,i \i= I 1 1 / v= i- ' 1 Если R' перечислимо, то множество R всех элементов Р. подученных так из всевозможных g' £ R' , перечислимо. Рассмотрим сюръективный гомоморфизм ср: G —• G'; ф (а;) = аг, ф (bi) = — Ф (сг) = 1 Для всех 1 = 0 п. Ясно, что ф (R) — R' и, значит, ф (Н) = = /7'. Йз леммы 4.5 тогда следует, что если R хороша в G, то R' хороша в G', 5.4. Использование диофантовости перечислимых множеств. Начиная с этого места, мы фиксируем пару (G, перечислимое R), как в п. 5.3. Вместо гп будем писать / > 1 и определим множество Е С усло- вием й = {а«» Ьас*<> ... axl bi сх11 <х0...........хг> £ Е]. Нетрудно убедиться, что перечислимость R равносильна перечислимости Е, Мы покажем сейчас, что Е можно представить в виде проекции на первые I + 1 координат множества [) (2)'+l X (Z)m-‘, т > 1-\- 2, S— I где каждое из Es задается одним из уравнений вида Xi—с, cf:Z\ xt = Xj, 0 < i, j < т или х&=х,-+п, х^ = Xj • Xi, где I -ф-1 < k < j < i < m, 112
В самом деле, пусть $п, :!1) <£е £ {1, —1}, $ — <$0, ;.ч $г>. Рассмот- рим перечислимые множества е^={<*<>.....х(>еiz+ и(о})'+1 |<^о^о> ....^,хг)еq. По основной теореме гл. VI существуют такие многочлены с целыми коэффици- ентами Р‘§, что Е'& = проекция 0-уровня Р'$ в (Z+ J {0})!+’ X (Z+)n~l на первые / + 1 координат <х0, xi>. При этом можно считать п настолько большим, чго множества «пропадающих» при проекции переменных, реально входящих в Р^' и Р$', при (S' =т^= (S" не пересекаются. Добавив к пропадающим при проекции пере- менным еще (п + 1)2(+3 новых переменных < i <?п, j = 1, 2, 3, 4), мы получим, что Е можно представить в виде проекции на первые I + I коорди- нат 0-уровня многочлена Q =П \Р (80 .........<Si х1’ х‘+с уже в Z'+'- X (Z)" + ('1+ ’> 2 + ~‘- + Наконец, чтобы представить множество Q = 0 в виде проекции пересечения N П Es описанного выше вида, будем вводить дополнительные переменные сле- s= 1 дующим способом. Пусть х0, ..., xt — переменные, входящие в Q. Вместо Q — 0 напишем. Q, = Q?, где Qt — сумма одночленов Q с положительными коэффици- ентами, a Q2 — с отрицательными. Тогда 0-уровень Q = проекция (xi + 1 = Q!) П (jq.12 = П (-Ч-Н = xf+2)- Если Q] и Q2 суть константы или перемен- ные, искомое" представление найдено. Иначе, скажем, можно представить в виде Q, + Qi' либо- О] Qj и написать, введя дополнительные переменные: (х/+1 =^(2,4^1') = проекция (-4+3 = Qi') П (*t+4 = QI) П (*/+1=*<+з+-^+4). Индукция по сумме коэффициентов и степени Q даст требуемое, 5.5. Вторая редукция. Теперь мы считаем, что для пары G, R, описанной в N п, 5.3, зафиксировано представление Е в виде проекции П Es вида, описанного S—I в п. 5.4. В этом пункте мы йокажем, что подгруппа ‘Н С G, порожденная R, хо- роша, если хороши все подгруппы Я, С G, s = I..... N описываемые следующим образом: G “ |{^o, ' с0» • • . й tn . &т , Ст,01, bi, Ci, . . . , Cti, bi, C/} |, ws= / m \ —1 f I _ __ П аДЬ/сД] П axibiCx.t \i ~/Д-1 L 1 / v= I m П axi bt Cxi; <x0, ..., xm> 6 Es = 0 113
С этой целью положим а (х0, ..., хт) = f П a*1 bi сЙ а*1 Ь, с*1 'j П a*lbi-c*1. (I) \( = ; + 1 / \/=1 / < = о Множество слов {а (х0, xm); <ха, >,,, хт> £ Zm+1} свободно: действительно, при соединении пары таких слов (или одного слова и обратного к другому такому слову) взаимное сокращение не может затронуть «середины» каждого слова, состоящей из символов ait bi, ср. Отсюда следует, что N _ f N П Н,= !а(х0, ... , хт). <хп.......Хт> п Es ___ N _____ _ _ и подгруппа И — хороша, если все Hs хороши. Наконец, I 77 U + • • • » Пщ» Ьгп» Ст', а1» , Ci, . . . , - |« fl N 1 = П а,- ' bi Cl1, <х0, .... Х(> ££ = проекции П Es\ (J Ui+i. i’i+i, «г+i, ... (/ = 0 i=l J ... at,bi. Cl } I, откуда _ H = |/7 u la;+i. b;+t, ..., b;, c;} I n I {a0, •••, bi, c;}| и эта подгруппа хороша вместе с И. 5.6. Конструкция группы К. Мы будем проверять, что Hs G G — хорошие подгруппы, пользуясь критерием 4.1а): явно построим конечно определенную группу КЭ G и конечно порожденные подгруппы L. С /(, такие, что Ls (~) П G = Hs для всех s = 1, ..., N. Группа К будет построена как кратное //МЛ'-расширение G. а) Первое HNN-расширение. Положим Ко = I G U {^о» 7m}:Ko I, где «о — множество соотношений вида ifi bi tt = ai bt Ci, i = 0,...,m; ' G bi = ai bi cj; (2) . ti коммутируют co всеми остальными образующими G. б) Второе /7W-расширение. Положим К = 1 Ко U {Ит'й; ' + 1 < k <i, k < /, i ф j; t, j, k < m}:R |, где R — множество соотношений вида Ajk bi 11 jh — at bi ci, r ijk ci cb (3) tilh коммутирует c th и остальными образующими G. 114.
В отличие от 5.6а) не вполне очевидно, что К есть /7<УЛ/-расширение Для проверки_этого достаточно установить, что отображение множества {образующие 6} J {/А} в себя (I, j, k фиксированы; i k, / =/= k)-. bt at bi ci, Cj -* th Cj, tk -* tk> тождественное на остальных образующих G, продолжается до некоторого авто- морфизма подгруппы I G J {^} IS Ка. Имеем fGU {Ml= I5* ... |, где многоточие заменяет соотношения, не зависящие от 6;, cj и потому переходя- щие в себя при применении (р^д. Выписанные же два соотношения при примене- нии (pijk переходят в следствия соотношений в Ка: первое в t k* ai bl ci bi Ci, а второе — в k 1 ?b Cj ~ ^b Cj. Остается учесть, что Z =fc fe и / =£ fe. Из определения К видно, что К конечно определена; из свойств HNN- расширений — что G S К. 5.7. Конструкция подгрупп Ls G К. Вид подгруппы Ls будет зависеть от уравнения, определяющего множество Еа (п. 5.4) Определим запас групп, среди которых содержатся все Ls‘. L^= ||а(0__0с0... 0), tr (r=Ai)||. LJJ = | (а (0 ... 0), ti tj, t, (r =f= i, /)} |, £+^ = | {a(0 ... 0). titk, tj th, tr (r^l, j. £)} Ець = | {a (0 ... 0), tijk, tjih> tr i, I, k)} |, и аналогично в обозначениях 5.5 Д; — I {о (Xq , . . . , Xm), Хг- = с} |, — I {о (Хо , .... Хт), Xi ”Х7} |, tf^ = |{a(x0, ...,хт), Xk^Xf + xi} |, Нц/г I {о (х0....хт) > xb ~ xj'xi) I- Ясно, что Ls конечно порождены. Остается последняя серия провероК1 5.8. Hei=G(]Lj, H^=G(]L^ и г. д. 115
Прежде всего из (1) — (3) находим Ч1 а(х0.......хт) ti=a(x0.....xt-t, xt + 1, хг+1, .... xraJ‘, (4) ^Tik a(*o. • •• . xm) ttjk = a(y0, , ym), (5) где J/i = X;+l, yh — Xk + Xj, ys — xs при s=f=l,k. (при проверке последнего равенства учесть, что k > I + I, так что коммути- рует со средней частью слова а (х0, xm), состоящей из at, bi, ci, К/); Отсюда следует, что и {'гir#= оI, Ly:~ = \ TlTj и {Ч ij;tT\r^=i, /}|, Lijk = \^tjk и { Н > Ч lk> lr I г #= * • /, ^5 |> Ljjk~ I Hijk U { Чуй , t jth, tr | г ф I, j, fe} |. В самом деле, включения С очевидны. Далее, начав с а (х0,..., хт) и применив сопряжение посредством tr, мы можем как угодно изменить r-ю координату в си- лу (4): это сразу дает включение Ч; =3 И? и потому требуемое равенство. Ана- логично проверяется второе равенство. Третье: сопряжение с помощью Ч/ft увеличивает t-ю и /г-ю координаты на 1, а с помощью tjtk—j-ю и /г-ю, потому что можно получить любой вектор с хд = — Xj + xt исходя из нулевых координат на этих местах. Четвертое: сопряжение с помощью tijk увеличивает х, на 1, хд на х;; tjik ана- логично, что позволяет получить любой вектор с хд = Xjx^ исходя из нулевого; Эта новая характеризация групп Ls показывает, что Ls ("] G =3 Hs для всех s. Остается установить обратное включение. С этой целью заметим, что любой элемент из Ls с помощью соотношений (4) и (5) может быть представлен в виде Th, где Т £ | Чуй} I (набор допустимых ин- дексов i, ijk зависит от s) и Л £ Hs (то же рассуждение, что и выше). Но по пред- ложению 2.7 а) все {Ч, tijk} порождают свободную подгруппу, имеющую три- виальное пересечение с G (см. доказательство 2.7а)). Следовательно, если Th С- G, то Т = I и h G Hs, что завершает доказательство. 6. ОКОНЧАНИЕ ДОКАЗАТЕЛЬСТВА 6.1. В этом параграфе Заканчивается проверка посылки предложения 4 3и тем завершается доказательство теоремы Хигмэна. Положим G = | (а, Ь} | и пусть HCQ — перечислимая подгруппа. Мы по- кажем, что Н хороша. Первый шаг состоит в редукции задачи к доказательству тогоГ что хороша некоторая конкретная подгруппа Н' с G' * I, не зависящая от Н. Чтобы определить Н', введем сначала рекурсивное (бесконеч- ное) перечисление у : 1+ —» G 1 (2т» З"'1 П + + > = 0 116
После этого положим G' =| {a, b, t, о, о. d, е} t:S ({а, b, а.—1, Ь-1}) -» G': П o'”2* -» t f] (p—' ао‘ут~1 'v~1 1 , <>0 '>0 77'=1 {t (g) ertden | g £ S({a, b , a-1,/r-1}), n£Z+, g = y (re)} | CZ G'. Выписанная формула определяет т на не обязательно приведенных словах, и приведение может изменить т-образ. Слово т (g)cnden, образующее Н1, однозначно определяется по своему номе- ру « 6.2. Лемма. Если Н' С G' хорошая подгруппа, то любая перечислимая под- группа Н С. G хорошая. Доказательство, а) Положим //'=| {т (Л) cnden | образ h^H', n£Z+, h = у (re)} | С Н'. Тогда Н" = Н‘ П | {a, b, t, v, cnden\ п£у~1(Н)} |. В са’мом деле, включение С очевидно. Обратное включение следует из того, что множество образов элементов cnden, п > К в факторе G' по ядру, порожденном у a, b. t, v, свободно. Поэтому по каждому приведенному слову от образующих т (g) cnden последовательность номеров ге этих образующих восстанавливается однозначно; и если все они лежат в у-1 (И), то слово лежит в И". Значит. Н" есть пересечение Н' с подгруппой, порожденной ограниченным перечислимым множеством образующих (у-1 (Н) перечислимо вместе с Н). По- этому Н" хороша, если Н' хороша. б) Положим H = |СС'. Легко убедиться, что Н (J {c,d,.e)\~]H" (J {с, d, е] |, Поэтому Н = \Н" U l{c,d, е}|| П 1{а’Ь, о, (}|. По лемме 4.4 Н хороша, если И” хороша. в) Наконец, рассмотрим гомоморфизм <р • G' — G переводящий a, b в себя, t,v, с, d, е в 1. Очевидно, (р (Н) = Н. По лемме 4.5 Н хороша, если Н хороша. 6.3. Приступим к доказательству того, что подгруппа //'C.G' хорошаЯ1 С этой целью построим коммутативную диаграмму вложений групп. G' - К -» К 1 t • t Н‘ —L' ZL со следующими свойствами: а> X определена конечным множеством образующих и ограниченным перечис- лимым множеством соотношений; L порождена ограниченным перечислимым мно- жеством слов в образующих К; б) L' ~ L есть изоморфизм; в) Н' = G' L' в К'• 117
Отсюда следует, что Н' хороша. В самом деле, пусть К = F/R, где F — сво- бодная группа, порожденная конечной системой образующих К ; Ro—ограничен- ное перечислимое множество соотношений между ними, a R — порожденный имн нормальный делитель. Из предложения 5.2 следует, что порождает хорошую подгруппу R в F, а из леммы 4.2 тогда вытекает, что F/R вкладывается в к.О; группу Л4. При этом вложении ограниченное перечислимое множество образую- щих L остается таким в М (относительно образующих М) и потому L d М хоро- ша по следствию предложения 5.2. Отсюда в силу б), в) имеем: подгруппа FT = = С'П L хороша вместе с G и L как подгруппа М. Значит, есть вложение (М, Н') в (Л4, Н), такое, что М конечно определена, Н конечно порождена и //' = = Н П М. Это вложение индуцирует вложение пары (О', И') в (Л4, И) с теми же свойствами. Следовательно, Н' хороша и в О'. Остается построить указанную диаграмму и доказать свойства а) — в). 6.4. Группа К'. Это — кратное /7Л?Л?-расширение группы О', определенное, как в предложении 2.7, с помощью четырех счетных последовательностей нетри- виальных изоморфизмов подгруппы | {/, с, d, е, v~lavi, v~lbvl\ i 0} | с: 6' в G'. Так как выписанные элементы свободно порождают эту подгруппу, достаточ- но указать, во что они переводятся интересующими нас изоморфизмами. В К' эти изоморфизмы будут индуцированы сопряжением посредством четырех по- следовательностей образующих Xi, xt, yt, yi, i > 0 (вместо ti, i £ / в обозна- чениях § 2)! В следующей таблице указано их действие. Обозначения: at = — v~iavl, = v~ibvi, pj = j -e простое число. Элемент таблицы, стоящий на пересечении, скажем, строки с и столбца х;, есть xf-1c х;. ri xi 'Ji 4i t IBi ar 1 bi lb-' с Pit C Cpti+1 cpti+i c''«+3 d d d d d е ePii „₽4i+i ,pn+-2 eP4i+3 Oj pf1 ajai, j < i \aj, j > i z e> о •* v' ~?| A lb,-1 a j bi, j < i |<2(, i > i Ibi af b~lt I < i [flj. , > 1 Ь) /a-1 b, at, I < ' [bj , i > । pi bj a,-', i < i Рл / > i I*,-1 b) bi, 1 < t I > 1 pi oj b-', i < г / > 1 Окончательно положим К' = 1 G' U I*;, xi- Уг> У1 \ i 0): соотношения из таблицы |, G' —> R' — естественное вложение. 118
6.5. Группа L:' Положим Ll = | (tcde, xi ,Xi, yt, yi\i > 0} | C A”, L' K' — естественное вложение. Проверка того, что /7' вкладывается в L' (по коммутативности диаграммы, как подгруппа К"), будет проведена в п.6.7. 6.6. Группы К, L, Положим K = \G' (J {«,, «г, as, а4, vlt а-, о3,о«} : R I, где соотношения R и вложение К' — К одновпеменно опотделяются следующими- ми условиями: /?=образ табличных соотношений после подстановки в нил Xi и^~' V, а{, xi -> и.-' о2 и'2 У1 ^3 Уг. “* U4 ^4 » К' -» К — гомоморфизм, тождественный на G' и действующий на остальные об- разующие этими подстановками. Гомоморфизм К' —• К является вложением. Действительно, элементы uj~'vj u'j е | {«у, сД | свободны, поэтому К можно рас- сматривать как свободное произведение К' и | («;, Vj | 1 < / < 4} | с объеди- ненными согласно выписанным подстановкам подгруппами (учесть предложение 2.7а)). Наконец, положим £-образ L' при вложении К' — Ki 6.7. Диаграмма построена. Утверждение 6.4а), б) для нее проверяется не- посредственво из определений. Остается доказать, что Н' = G' (*| L’ в К', а) Положим th] = т (g) cnden для п £ Z+, g = у (п) в обозначениях п, 6.1, Напомним, что Н' порождена всеми (п] в G' и, значит, в К' Таблица соотношений в К' была придумана так, чтобы выполнялись следу- ющие тождества: х~' ’re] xi = \pii п], х~* [re] xz- = fp,f+, п| , у~' 1ге1 У1 = 1Ра+2 п], У,~1 1'»1 У1 = \РЧ + з «]• В самом деле, проверим, скажем, первое из ннх. Пусть тогда согласно опреде- лениям у (П) = П а^~т4Т+1 ^+2-^/+^ i f„] = t П а^^~т^+1 + сп den, / откуда по первому столбцу таблицы в п. 6.4; И Xi = tai-aj-1 П (...);агП (...), с₽41 п dePii п = fp4i п]. i<< />> Учитывая еще, что (1] =» tcde £ L', из этих формул сопряжения получаем, что In] £ L1 для всех п и И' С L', как было обещано в п. 6.5. Сверх того I И' U Ui> У1' У1^ > = 119
включение С проверено, а обратное очевидно, б) Покажем теперь, что в К' \Н' и I П G' =//’. Так как К' является HNN-расширением G', достаточно установить, что мы на- ходимся в ситуации, когда выполнены условия предложения 2,7 (они описаны в конце п. 2.6) и применить утверждение 2.76). Проверим этн условия, скажем, для первой серии.•изоморфизмов подгруппы G', описанной в начале п. 6.4. Эта серия отвечает сопряжению посредством х, в К'. В нашем случае условия принимают следующий вид: г,"1 \Н' П I {г, с, d, е; а7, б,-1 / > 0} | ] хг=7/' fl xf1 1 {г, с, а, е; aj, bj | j>0} | xt, г. е. по определению Н' и таблице х,-1 Н' xt=H' (1 | («, «₽4i ePii-, aj, bj | j > 0}|. Так как xf1 In] x, = [р4;п], включение G очевидно. Наоборот, пусть задан эле- мент из Н', записанный как приведенное слово в образующих (п] : П Lnil^J, />0 $. = ±1. Рассмотрим соответствующее ему приведенное слово g в G', Покажем, что если с, d входят в’ g только в степенях, делящихся на рц, то среди [ny], все П; делятся на т. е. [п7-] £ хг1 Н'Х(. В самом деле, пусть g = образ g в | {с, d, е) | при гомоморфизме, переводя- щем t, aj, bj в 1, Так как [п] =» cnden, то_все [п] свободны, и последовательность ,nj] однозначно восстанавливается по g. Нетрудно убедиться, что формулы, вы- ражающие rij через степени, с которыми с, е входят в приведенное слово g, линейны с целыми коэффициентами (точнее, это дизъюнкции линейных фор- мул, сопровожденных условиями типа неравенств). Поэтому из делимости всех этих степеней на рц следует и делимость nj на Рц. Это завершает доказательство.
ЗАКЛЮЧЕНИЕ В сентябре 1979 года в Ургенче, центре Хорезмской обла- сти Узбекистана, состоялся международный симпозиум математи- ков «Алгоритм в современной математике и ее приложениях». Ме- стом его проведения была выбрана родина великого ученого IX ве- ка Мухаммеда аль-Хорезми (то есть «хорезмийца»). Мы уже упо- минали во Введении, что к имени аль-Хорезми восходит термин «алгоритм» (а к названию составленного им учебника — слово «алгебра»). Трактат аль-Хорезми был написан по-арабски; среди прочего в, нем была описана индийская позиционная система запи- си числе и приемы вычислений в такой записи. Латинская версия трактата, относящаяся к XII веку, начинается словами «Dixit algorizmi», то есть «Сказал аль-Хорезми». Воздух Хорезмского оазиса и древнее радушие хозяев не только способствовали успеху симпозиума в том техническом смысле это- го слова, как его понимают обычно, но заставили участников вос- принимать математику одновременно более исторически и более личностно. Абстрактная математическая процедура, гарантией цен- ности которой для современника служит именно ее защищенность от произвола индивидуального сознания, вдруг предстала в Урген- че почти как поэтический феномен, зачатый и поддержанный авто- ритетом творческой мысли конкретного человека. XII век не был случайным временем в истории европейской культуры. Французский медиевист Марк Блок в своей книге «Я фео- дальное общество» (см. М. Блок, «Апология истории», М. Наука 1973) широкими мазками набрасывает картину общества, которое именно в это .время все активнее начинает последовательно рас- суждать о себе самом. «Можно ли считать несущественным в еще полной загадок исто- рии связей между мыслью и практикой тот факт, что к концу вто- рого феодального периода люди действия обычно располагали бо- лее совершенным, чем прежде, инструментом логического анали- за?» (М. Блок, loc, cit., стр, 159). В этой фразе историк обществен- ных отношений вовсе не имеет в виду именно трактат аль-Хорезми, но, вглядываясь в развернутую им панораму, мы начинаем лучше различать время, когда правила-сложения столбиком могли впервые стать социальным явлением. Участие в симпозиуме «Алгоритм» побудило автора этой книж- ки еще раз задуматься о том, что ее заглавие могло бы обещать 121
много больше, чем предложенное читателю жесткое изложение не- скольких (в самом деле замечательных) теорем и понятий теории рекурсивных функций. Например, следовало бы тщательно про- анализировать представление о кггструктивном (или вычислитель- ном) универсуме, которое являете' одной из полуоформившихся абстракций теории вычислимости. Такой универсум — это потен- циально счетное множество объектов, которые можно эффективно строить и эффективно различать с помощью операций из фиксиро- ванного конечного списка. Алгоритмы в универсуме осуществляют переработку одних конструктивных объектов в другие. Нумерации Геделя и отождествление алгоритмов (результатов их работы) с частично рекурсивными функциями можно интерпретировать как универсальный способ устанавливать изоморфизм между любыми двумя конструктивными универсумами. Но изоморфизм не есть тождество, и одна из главных возможностей теории универсумов состоит в систематическом рассмотрении расширений. На языке теории рекурсивных функций идея такого расширяющегося кон- структивного универсума приводит к вопросам, которые в книге даже не поставлены. Арифметический универсум Z+, основной прототип и модель всех универсумов, предстает в роли, важность которой, может быть, преувеличена. В гносеологическом плане многое можно было бы сказать о соотношении понятий «вычислимость» и «познаваемость». Пер- вое из них относится только к проработке избранной математиче- ской модели действительности, будь то система дифференциальных уравнений или задача выпуклого программирования. Второе же много шире, поскольку и сам выбор модели, и задача проверки ее адэкватности находятся далеко за пределами алгоритмического мира. Поставленный на симпозиуме вопрос «Что делать после того, как неразрешимость массовой задачи доказана?» был и приглаше- нием взглянуть на этот мир извне. Но все это — «мысли на лестнице». Автор откладывает шари- ковую ручку в надежде, — общей для всех пишущих, — что кто- нибудь додумает их за него.
СПИСОК ЛИТЕРАТУРЫ 1. Успенский В. А. Лекции о вычислимых функциях. М.: Физматгиз, I960. 2. Роджерс X. Теория рекурсивных функций и эффективная вычислимость! Пер. с англ./Под ред. В. А Успенского.— М.: Мир, 1972. 3. Мальцев А. И. Алгоритмы и рекурсивные функции.— М.: Наука, 1966. 4. Марков А. А. Теория алгоритмов.— Труды/Математический ин-т им. В. А. Стеклова АН СССР, 1954, т. 42. 5. Ершов Ю. Л. Теория нумераций.— М.: Наука, 1977. 6. Сложность вычислений и алгоритмов: Пер. с англ./Под ред. В. А. Козмидиа- ди, А. Н. Маслова, В. Н. Петри.— М.: Мир, 1974. 7. Машины Тьюринга и вычислимые функции: Пер. с нем.— М.: Мир, 1972. 8. Криницкий Н. А. Алгоритмы вокруг нас.— М.: Наука, 1977. 9. Успенский В. А. Машины Поста.— М.: Наука, 1979. 10. -Тростников В. А’ Конструктивные процессы в математике.— М.: Наука, 1975. 11. Ершов А. П. Введение в теоретическое программирование.— М.: Наука, 1977. 12. Дейкстра Э. Дисциплина программирования: Пер. с англ./ Под ред. Э. 3. Любимского.— М.: Мир. 1978. 13. Манин Ю. И. Доказуемое и недоказуемое.— М.: Сов. радио, 1979. 14- Мельчук И. А. Опыт лингвистических моделей «Смысл «-» Текст». — М.: Наука, 1974. . ' , 15. Апресян Ю. Д., Богуславский И. М., Иомдин Л. Л., Крысин Л. П., Лазур- ский А. В., Перцов Н. В., Санников В. 3. Лингвинистическое обеспечение в системе автоматического.перевода третьего поколения.— М.: АН СССР На учный совет по комплексной проблеме «Кибернетика», 1978. 16. Роллер Э. Открытие основных законов жизни: Пер. с англ./ Под ред. В. М. Родионова.— М.; Мир, 1978. 17. Поплавский Р. П. Термодинамические модели информационных процессов. — УФН, 1975, т. U5, вып. 3, с. 465—501. 18. Матиясевич Ю. В. Диофантовы множества.— У МН, 1972, т. 22, вып. 5, с. 185—222. 19. Колмогоров А. Н. Гри подхода к определению понятия «количество инфор- мации».— Проблемы передачи информации, 1965, т. 1, вып. 1, с. 3—7 20. Колмогоров А. Н. К логическим основам теории информации и теории веро- ятностей.— Проблемы передачи информации, 1969, т. 5, вып. 3, с. 3—7. 21. Звоикин А. К., Левин Л. А. Сложность конечных объектов и обоснование по- нятий информации и случайности с помощью теории алгоритмов,— УМН 1970, т. 25, вып. 6, с. 85—127 22. Jones J. Р., Sato D., Wada Н., Wiens D. Diophantine representation of the set of prime numbers. — Amer. Mathem. Monthly, 1976, v. 83, № 6, p. 449—464. 23. Davis M., Matijasevic Ju. Robinson J. Hilbert’s tenth problem. Diophantine equations: positive aspects of.a negative solution. — Proc, of Symposia in Pure Mathem., v. XXIII, 19 Ao, Providence, Rhode Island, p. 323—378. 24. Paris J., Harrington L. A mathematical incompleteness in Peano arithmetic.— — Handbook of Mathem. Logic, North Holland, Amsterdam, 1978. 123
25. Петер Р. Рекурсивные функции: Пер. с англ./Под-ред. В. А. Успенского.— М.: ИЛ, 1954. 26. Клини С. Введение в математику: Пер. с англ./Под ред. В. А. Успенского.— — М.: ИЛ, 1957. 27. Feferman S. Transfinite recursiwe progressions of axiomatic theories.—J. Symb. Logic, 1972, v. 27, Ns 3, p. 259—316. . 28. Higman G. Sybgroups of finitely presented groups.— Proc. Royal Soc., Ser. A., 1961, v. 262, p. 455 — 475. 29. Валиев M. К. Примеры универсальных конечно определенных групп. — ДАН СССР. 1973, т. 211, Ns 2, с. 265-268. 30. Серр Ж-П. Деревья, амальгамы и Sl2.— Математика, 1974, т. 18, вып. 1, с. 3-51. 31. Постников М. М. Теорема Ферма.— М., Наука, 1978. 32. Ахо А., Хопкрофт Дж., Ульман Дж.— Построение и анализ вычислитель- ных алгоритмов: Пер. с англ./ Под ред Ю. В. Матиясевича. — М.: Мир, 1979.
ИМЕННОЙ УКАЗАТЕЛЬ Апресян Ю. Д. 8, 9 Ахо А. 4 Беккен С. 103 Блок М. 121 Богуславский И. М. 8, .9 Бурбаки Н. 10 Вад X. 64 Вайэнс Д. 64 Валиев М. К. 103, 104 Вандивер 19 Внферйх 19 Гедель 6, 12, 75. 96, 97, 121 Гильберт Д. 6, 47 Джоунз Дж. 64, 65 Дэйвнс 6 Ершов А. П. 4 Звоикнн А. К. 70 Иомднн Л. Л. 8, 9 Кантор Г. 10 Клнни 6, 25 Козмиднади В. А. 72 91 Колмогоров А. Н. 3, 4, 6, 7, 8, 12, 24, 68, 73 Крнннцкнй НА 4 Крыснн Л. П. 8, 9 Куммер 19 Лагранж 47 Л азу некий А. В. 8, 9 Левин Л. А 70 Лейбниц 78 Мальцев А И. 4 Манин Ю. И 5 Марков А. А 4, 6, 24 Мартин Леф П. 73, 74 Маслов А. Н. 72, 91 Матиясевич Ю. В. 4, 6, 7, 56 Мельчук И. А. 8, 9, 12 Мыцельский 91 Нейманн Б. 105 Нейманн К. 105 Новиков 23 Патнэм 6 Петер Р. 24 Петри В. Н. 72, 91 Перцов Н. В. 8, 9 Поплавский Р. П. 15 Пост 6, 24 Постников М. М. 4 Пэрис 100 Рамсей 7 Робинсон Дж. 6. 56 Роджерс X. 4, 23 96 Савинков В. 3 8, 9 Сато Д. 64 Тарский 96, 97 Тьюринг 4, 6. 24 Ульман Дж. 4 Успенский В. А. 4, 24 Ферма П. 19 Феферман 98 Харрингтон 100 Хигмэн 7, 23, 102, 103. 104. 105 Хопкрофт Дж. 4 Хорезмн, Мухаммед бен Муса 11,120 Чудновскнй 56 Шмульян 75 Эренфойхт 91 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абстрактная вычислительная маши- на 24 Аксиомы с кванторами 86 — L,Ar и LiSet 87 — Пеано 100 Алгоритм 5. 11 Алгоритмы конструктивные 44 Алгоритмически неразрешимые зада- чи 6, 22 — разрешаемая проблема 22 Арифметическая иерархия 93 Версальные семейства 65 Вложения в группы с двумя образу- ющими 407 125
Выражение выводимое 85 Вычислимая частичная функция 17 Вычислимые функции с очень быст- рым ростом 99 Гипотеза Ферма 19 Группа с алгоритмически неразреши- мой проблемой тождества слов 103 Десятая проблема Гильберта 47 Диофантово пространство 61 Диофантовость перечислимых мно- жеств 112 Длина доказательств 9! Доказуемо вычислимые функции 100 Д-множества 49 «Естественные» рекурсивные группы 103 Композиция 20 Конструктивные объекты 44 Коразмерность проекции 30 Многочлены, представлиющие про- стые числа 97 Множества диофантовы 46 Множество перечисляемое 29, 37 — продуктивное 97 — разрешимое 37 Неперечислимость истинных формул 88 . Неполнота формальной математики 6, 87 Номер решения 57 Нумерация 75 — множества допустимая 77 — Геделя 6, 74 Область определения 217 Ограниченные системы образующих 111 Оптимальная система наименований 12- Открытость языка 12 Перечислимое множество версальное 42 Перечислимость выводимых формул 85 Перечислимые множества 31 Позиционная система 11 Полувычислимая функция 17 Представление предложения 8 Проблема тождества слов в группах 22 Продуктивность арифметических истин 96 Разрешимость диофантовых уравне- ний 48 Рекурсивная геометрия 39 Рекурсивная функция 6, 16, 25 Рекурсивные группы 101 Свободные произведения 104 Семейство m-множеств 42 Синтаксис формальных языков 74 Сложность и случайность 65 — по Колмогорову 68 Соединение 21 Тавтологии 86 Тезис Черча 16, 20, 22 ----как эвристический принцип 23 Теорема Геделя 87 — о диофантовости перечислимых множеств 46, 102 — Колмогорова 68 — Матиясевича 6, 7 — Рамсея 7, 100 — Хигмэна 7, 102, ПО Теорема Колмогорова 8 Универсальный многочлен 64 Уровни представления предложений естественного языка 8 Фибоначчи числа 65 Формальные языки и вычислимость 74 Функции иевычислнмые 18 — полувычисяимые 18 Функция Геделя 33 Характеристическая функция подмно- жества 17 Хорошие подгруппы 108 Частичная функция 17 Частично рекурсивное отображение 76 Частично рекурсивные функции 20 Эквивалентность нумераций 75 Язык 8 Языки естественные 10, 12 — LiAr 89
ОГЛАВЛЕНИЕ Предисловие . ...................................... 3 Введение . .................................. 5 Глава I. Рекурсивные функции и алгоритмы..................... . 16 1. Интуитивная вычислимость ...................................16 2. Частично рекурсивные функции................................20 3. Образцы рекурсивности........................................ 25 4. Перечислимые и разрешимые множества.........................29 5. Элементы рекурсивной геометрии..............................39 6. Конструктивные объекты и алгоритмы..........................44 Глава II. Диофантовы множества и алгоритмическая неразрешимость 46 1. Основные результаты . .. ............ 46 2. План доказательства......................................... . 49 3. Перечислимые множества являются D-множествами...............51 4. Редукция . . . 53 5. Конструкция специального диофантова множества..................56 6. График экспоненты диофантов.................................61 7. Графики факториала и биномиальных коэффициентов диофантовы . 62 8. Дополнения................................................... 64 Глава III. Сложность и случайность................................65 1. Версальные семейства . . ...................................65 2. Сложность по Колмогорову.......................................68 3. Сложность и случайность ..................................... 73 Глава IV. Формальные языки и вычислимость.........................74 1. Арифметика синтаксиса..........................................74 2. Синтаксический анализ .........................................80 3. Перечислимость выводимых формул................................85 Глава V. Теорема Геделя...........................................87 1. Принцип неполноты............................................ 87 2. Неперечислимость истинных формул...............................88 3. О длине доказательств . 91 4. Арифметическая иерархия........................................93 5. Продуктивность арифметической истины...........................96 6. Вычислимые функции с очень быстрым ростом......................99 127
Глава V|. Рекурсивные группы ......................................101 1. Основной результат и его следствия . . ....................101 2. Свободные произведения н НAW-расширения.........................104 3. Вложения в группы с двумя образующими...........................107 4. Хорошие подгруппы............................................. 108 5 Ограниченные системы образующих.............................. .111 6. Окончание доказательства...................................... 116 Список литературы................................................ 123 Именной указатель................................................ 125 Предметный указатель.............................................. 125 Юрий Иванович Манин ВЫЧИСЛИМОЕ И НЕВЫЧИСЛИМОЕ Редактор Н. Д. Иванушко Художественный редактор Н. А И'-натьса Технический редактор Т. Н. Зыкина Корректор Н. Н. Васина ИБ № 623 Сдано в набор 20,05 80. Подписано в печать 9.10 80. Т-14876 Формат 60x84'/.6 Бумага кпижно-жури. № 3, Гарнитура литературная. Печать высокая. Объем 7.44 усл. н. л. 7.99 уч.-изд. л. Тираж 25 000 экз. Заказ 1873 Цепа 45 к. Издательство «Советское радио», Москва, Главпочтамт, а/я 693 Московская типография .№ 4 Союзполиграфпрома Государственного комитета СССР по дел.-м издательств, полиграфии и книжной торговли. 129041, Москва, Б. Переяславская ул., д. 46,
Настоящая серия печатается по рекомендации IX Меж- дународного Совещания руководителей научно-техниче- ских издательств социалистических стран (июнь 1975). В серии участвуют: Издательство «Советское радио» (СССР) Издательство технической литературы (ВНР) Издательство «Техника» (ГДР) Издательство научно-технической литера- туры (ЧССР)
•••••••••• КИБЕРНЕТИКА •••• Ю. И. МАНИН ВЫЧИСЛИМОЕ И НЕВЫЧИСЛИМОЕ