Текст
                    УНИВЕРСИТЕТСКИЙ УЧЕБНИК
Серия «Прикладная математика и информатика»
И.А.ЛАВРОВ
МАТЕМАТИЧЕСКАЯ
ЛОГИКА
Под редакцией Л.Л.Максимовой
Допущено
Министерством образования и науки Российской Федерации
в качестве учебного пособия для студентов высших учебных заведений,
обучающихся по техническим и естественно-научным специальностям
ACADEMA
Москва
Издательский центр «Академия»
2006


УДК 510.6(075.8) ББК 22.12я73 Л136 Рецензенты: С. С. Гончаров — член-корреспондент РАН; К. В. Рудаков — член-корреспондент РАН Лавров И. А. Л136 Математическая логика : учеб. пособие для студ. высш. учеб. заведений / И.А.Лавров; под ред. Л.Л. Максимовой. — М.: Издательский центр «Академия», 2006. — 240 с. — (Университетский учебник. Сер. Прикладная математика и информатика). ISBN 5-7695-2735-8 В учебном пособии изложены основы современного подхода к изучению математических теорий с привлечением логических понятий и методов, а также концепция программы Д. Гильберта о построении математических теорий аксиоматическим путем. Рассмотрены аксиоматические теории для множеств натуральных и действительных чисел и для геометрии. Для студентов высших учебных заведений. УДК 510.6(075.8) ББК 22.12я73 Учебное издание Лавров Игорь Андреевич Математическая логика Учебное пособие Редактор М. В. Макарова. Технический редактор Н. И. Горбачева. Компьютерная верстка: Н.Н.Лопашова. Корректор Г. Н. Петрова Изд.№ 101110171. Подписано в печать 28.06.2006. Формат 60x90/16. Гарнитура «Тайме». Печать офсетная. Бумага офсетная № 1. Усл. печ. л. 15,0. Тираж 3000 экз. Заказ № 7306. Издательский центр «Академия», www. academia-moscow.ru Санитарно-эпидемиологическое заключение № 77.99.02.953.Д.004796.07.04 от 20.07.2004. 117342, Москва, ул. Бутлерова, 17-Б, к. 360. Тел./факс: (495)330-1092, 334-8337. Отпечатано с электронных носителей издательства. ОАО "Тверской полиграфический комбинат", 170024, г. Тверь, пр-т Ленина, 5. Телефон: (4822) 44-52-03, 44-50-34, Телефон/факс: (4822)44-42-15 Home page - www.tverpk.ru Электронная почта (E-mail) - sales@tverpk.ru ш ж Оригинал-макет данного издания является собственностью Издательского центра «Академия», и его воспроизведение любым способом без согласия правообладателя запрещается © Лавров И.А., 2006 © Образовательно-издательский центр «Академия», 2006 ISBN 5-7695-2735-8 © Оформление. Издательский центр «Академия», 2006
ПРЕДИСЛОВИЕ Математическая логика создавалась как наука, призванная исследовать фундаментальные понятия математических наук, способы возможных доказательств, решения вопросов философского осмысления математики. По этой причине круг вопросов математической логики близок любому отдельному математическому направлению. Каждому математику или специалисту, использующему в своих исследованиях какие-нибудь математические науки, крайне необходимо знакомство с математической логикой, ее понятиями, методами и результатами. В настоящее время широкое распространение и развитие получили другие науки, близкие к математике, такие, как информатика, программирование и моделирование, исследование искусственного интеллекта и др. В основе этих наук лежат базисные понятия классической математики, в особенности математической логики и ее важнейшего направления — теории алгоритмов. Автор данного учебного пособия в течение многих лет читал курсы лекций и спецкурсы по математической логике и теории алгоритмов в Новосибирском и Московском государственных университетах, Московском физико-техническом университете. Материал книги базируется на понятии алгебраической системы и соответствующем логическом аппарате, а также на программе (формализме) Д. Гильберта, что разрешает универсальным образом рассмотреть имеющиеся в настоящее время результаты и методы, присущие многим математическим направлениям. В книге представлены элементы теории множеств, арифметики натуральных и действительных чисел, алгебры и геометрии. При написании учебного пособия автор во многом использовал материал из совместной с Л.Л.Максимовой книги «Задачи по теории множеств, математической логике и теории алгоритмов». Автор искренне благодарен Л.Л.Максимовой за научное редактирование учебного пособия, а также выражает благодарность своим коллегам, беседы и консультации с которыми способствовали значительному улучшению изложения материала книги.
ВВЕДЕНИЕ Программа Д. Гильберта построения аксиоматических теорий Первые попытки аксиоматического построения важного раздела математики — геометрии — были предприняты древнегреческим ученым Евклидом (около III в. до н.э.). В книге «Начала» он строит математическую теорию — геометрию, положив в ее основу некоторое число исходных положений, названных им аксиомами и постулатами. Другие утверждения теории получались как логические следствия выбранных аксиом и постулатов. В начале построения Евклид называет основные объекты геометрии — точки, прямые и плоскости. Другие геометрические объекты появляются в процессе построения теории как различные комбинации основных объектов. Так возникают понятия лучей, углов, треугольников, многоугольников, многогранников, окружностей и пр. При определении основных объектов (точек, прямых и плоскостей) встретились естественные трудности, присущие процессу построения любой научной теории, — как определить основные объекты, если никаких других объектов еще нет? С точки зрения современных взглядов, Евклид не смог удовлетворительно решить подобные проблемы. Основные объекты он «определил» следующим образом: «Точка — это то, что не имеет частей»; «Прямая — это то, что имеет длину, но не имеет ширины»; «Плоскость — это то, что имеет длину и ширину, но не имеет высоты». В качестве основных отношений между этими объектами были выбраны отношения принадлежности одних объектов другим, например: точка лежит на прямой; прямая проходит через точку; точка не лежит в плоскости и т.д. Во все последующие времена, да и в настоящее время в процессе преподавания геометрии, объясняя основные геометрические понятия (точка, прямая, плоскость, принадлежать), обычно опираются на интуитивные представления об окружающем нас мире. Однако, как известно из многочисленных примеров, интуиция часто не совсем адекватно отражает существо реальных объектов и часто нас подводит. Очевидно, что с помощью подобных способов определения основные объекты и основные отношения между ними остаются размытыми и неточными. Современная методология построения теорий проблему определения основных объектов и основных от- 4
ношений решает совершенно по-другому. Об этом скажем несколько позже. Указав основные объекты и отношения геометрии, Евклид формулирует несколько утверждений об этих объектах и отношениях, которые, как уже говорилось, он называет аксиомами и постулатами. Различие между аксиомами и постулатами трудно уловить, по этой причине в дальнейшем будем говорить только об аксиомах. Например, одна из аксиом Евклида в современных терминах звучит так: через любые две неравные точки можно провести единственную прямую. Основное предназначение аксиом, являющееся решающим фактором при их выборе, состоит в следующем: из выбранных аксиом чисто логическими средствами можно доказать {вывести их как следствия) все остальные «верные» утверждения теории, называемые теоремами. Список аксиом, данный Евклидом для геометрии, таким основным свойством не обладал. При построении геометрии он да и многие последующие исследователи часто неявно использовали такие (казавшиеся интуитивно очевидными!) утверждения, которые не являлись следствиями избранных аксиом, но без которых невозможно построить достаточно полноценной теории. Так, у Евклида отсутствуют аксиомы конгруэнтности и взаимного расположения точек на прямой. Другой пример: в конце XIX в. М. Паш выявил утверждение (теперь называемое аксиомой Паша), которое не является следствием аксиом и постулатов Евклида, но которое тем не менее часто неявно используется как очевидное утверждение. Без аксиомы Паша трудно получить многие классические результаты геометрии, без этой аксиомы геометрическая теория становится излишне бедной. Не слишком вдаваясь в подробности, сформулируем на современном языке аксиому Паша: если прямая, не проходящая через вершины треугольника, пересекает одну его сторону, то она обязательно пересечет и еще одну сторону этого треугольника. Таких «пропущенных» Евклидом аксиом было найдено несколько. По этой причине в разные времена делались многочисленные попытки описать как можно более полную систему аксиом для геометрии. Наиболее совершенная, с современной точки зрения, система аксиом геометрии была сформулирована Д. Гильбертом в начале XX в. в книге «Основания геометрии». В последующие времена и эти аксиомы Гильберта совершенствовались и модифицировались. Когда рассмотрим логические теории, познакомимся с геометрическими аксиомами Д. Гильберта и некоторыми другими системами, в том числе негеометрическими. Часто об аксиомах (и о постулатах как об аксиомах) говорят как об утверждениях, которые не требуют доказательств, подразумевая при этом их простоту и интуитивную очевидность. Но в 5
рамках строящейся теории аксиомы и не нужно доказывать, так как они сразу взяты в качестве основы нашей теории; наоборот, все другие утверждения (теоремы) необходимо доказывать из аксиом. Сложнее вопрос относительно очевидности аксиом. Выше были отмечены принципиальные трудности определения основных объектов теории. Оперировать с неточно определенными объектами и их комбинациями задача довольно неблагодарная, которая может в любой момент привести к нежелательным последствиям. Естественно возникают и другие подобные вопросы, относящиеся к той области науки, которую можно назвать основаниями математики. Вот лишь некоторые примеры таких вопросов. Что такое математическая теория? Что такое аксиомы? Что значит доказывать или выводить из аксиом теоремы? В начале XX в. в различных областях математики создалась ненормальная ситуация, связанная с обнаружением так называемых парадоксов. Например, в теории множеств Г. Кантора, которая мыслилась как строгий и удобный фундамент всей математики, были обнаружены парадоксы, связанные с обнаружением противоречий, т.е. ситуаций, в которых одновременно и доказывается, и опровергается некоторое утверждение. Подобные кризисы в истории математики случались неоднократно. Это и обнаружение несоизмеримых отрезков, и безуспешные попытки решать в радикалах полиномиальные уравнения любой степени, и непонимание такого понятия, как бесконечно малая величина, и др. Во всех случаях тонкий анализ истоков кризиса, уточнение основных понятий и идей, расширение и уточнение этих понятий помогали выйти из тупиковой ситуации. Чтобы спасти математику от разрушающих ее основу парадоксов теории множеств, Д. Гильбертом была предложена программа построения математических теорий, получившая название формализма. Конечно, в этом слове не нужно искать того пренебрежительного смысла, который приписывается ему в повседневной жизни; здесь только подчеркивается способ построения теории по формальным правилам, не опирающимся на интуицию и недосказанность. По мысли Д. Гильберта, всякую теорию, в том числе большую часть классической математики, надо строить как формальную аксиоматическую теорию, а затем в рамках этого формализма попытаться доказать ее непротиворечивость, т.е. убедиться в отсутствии в этой теории каких-либо противоречий. Основные цели, которые преследовал Д. Гильберт, создавая свой формализм, заключались в следующем: ♦ рассматривать сами математические теории как математические объекты и изучать их с помощью известных в математике методов; 6
♦ решать принципиальные вопросы обоснования математики и ее направлений, среди которых, без сомнения, находится проблема непротиворечивости. Для изучения самих математических теорий необходимо построить метатеорию, иногда называемую метаматематикой, или теорией доказательств. Тогда и вопросы обоснования данного направления математики нужно решать в рамках соответствующей метатеории. Опишем в общих чертах подход к достижению указанных целей, предлагаемый формализмом {программой) Д.Гильберта. Начнем не с объектов и отношений между ними (содержательных, семантических понятий), а с формул (синтаксических понятий), построенных по вполне определенным синтаксическим и логическим правилам, используя некоторый язык L для обозначения объектов и отношений между ними, а также для построения формул и пр. При этом до некоторого времени не будем придавать какого-либо содержательного смысла символам этого языка. Выберем теперь в качестве исходного набор аксиом, т. е. некоторое множество 21 специально выделенных формул. Будем с помощью логических средств выводить как следствия из 21 новые утверждения, которые в совокупности и составят аксиоматическую теорию Ф. Значение термина «выводить формулы» будет точно определено при описании таких теорий. Внутри аксиоматических теорий употребим термины «выводить формулы» и «вывод» вместо привычных для математиков терминов «доказывать теоремы» и «доказательство». Последние термины используем в метатеориях, когда будем выходить за рамки конкретных аксиоматических теорий и рассматривать факты или свойства самих этих теорий. Построив какую-нибудь аксиоматическую теорию Ф, можно обратиться и к ее семантическому (содержательному) аспекту. Рассматривая обозначения объектов из языка L как переменные формул, будем придавать им значения из некоторого «мира объектов» ЯЛ, а обозначения отношений между объектами, используемые при построении формул, — истолковывать как конкретные отношения между объектами из ЯЛ. Итак, для языка L выбираем интерпретацию. Тогда каждому утверждению (формуле) языка L будет соответствовать некоторое конкретное утверждение об объектах данной интерпретации. Одни такие утверждения на объектах интерпретации будут отражать истинные (верные) утверждения об этих объектах и отношениях между ними, а другие — ложные (неверные) утверждения. Постараемся сделать выбор интерпретации ЯЛ для языка L так, чтобы все аксиомы 21 теории Ф оказались истинными утверждениями для объектов и отношений этой интерпретации, а те логические средства, которые позволяют из уже выведенных формул получать новые, сохраняли бы истинность утверждений, т.е., будучи 7
примененными к истинным утверждениям, эти средства порождали только истинные утверждения. Такую интерпретацию назовем семантикой для теории Ф. Если для аксиоматической теории Ф удастся подобрать соответствующую семантику, то все выводимые из данных аксиом утверждения, т.е. как раз все формулы из Ф, окажутся истинными для данн!ой интерпретации. Итак, с помощью интерпретаций все синтаксические понятия наделяем конкретным содержанием, семантическим смыслом. При подробном построении аксиоматических теорий (исчислений, или формальных систем) все понятия, приведенные ранее, получат свои точные определения. Для заданной подобным синтаксическим путем аксиоматической теории Ф a priori возможны следующие случаи. 1. Для Ф не существует ни одной подходящей семантики. По этой причине подобная теория совершенно непригодна для изучения реальных интерпретаций, «миров объектов». Такие исчисления естественно называть невыполнимыми, они не могут адекватным образом описывать никакой мыслимый «мир объектов». Наоборот, выполнимыми исчислениями называются те, которые имеют хотя бы одну семантику. 2. Дли Ф существует единственная семантика 9Я. Смысл понятия «единственность» необходимо должным образом уточнить. Легко представить две интерпретации, которые различаются такими малосущественными обстоятельствами, как разные обозначения для объектов и отношений между ними. Подобные интерпретации обычно называют изоморфными. Изоморфные интерпретации невозможно отличить друг от друга с помощью утверждений, записанных в соответствующем языке L. Исчисления Ф, имеющие с точностью до изоморфизма единственную интерпретацию, называют категоричными. Здесь имеется в виду, что с помощью категоричного исчисления можно наиболее адекватным образом отличать интерпретацию Ш от других не- i ей «миров объектов». существует несколько принципиально различных (не- семантик. В этом случае такие неизоморфные интерпретации Ш\ и дЩ нельзя отличить друг от друга с помощью формул исчисления Ф. Интересно заметить, что в ряде случаев для строящихся по указанным схемам аксиоматических теорий можно чисто синтаксическим путем отвечать на семантические вопросы о том, является ли данное исчисление выполнимым, категоричным и пр. Обратимся к вопросу определения основных объектов теории. Начнем опять с классического примера — геометрии. Выберем в качестве аксиом строящейся геометрии G некоторые синтаксические формулы 21, использующие обозначения для точек, прямых, изомор' з.д4я| изомор^
плоскостей и основных отношений между ними. Естественно, эти формулы должны по возможности отражать те соотношения, которые кажутся справедливыми для точек, прямых и плоскостей при интуитивном их представлении. Но тогда и соответствующие объекты любой семантики для G разумно называть точками, прямыми и плоскостями, так как эти объекты имеют те же свойства, которые мы намеренно формализовали в выбранном языке. Понятно, что если у данной геометрической теории G окажется несколько неизоморфных семантик, основные объекты какой- то конкретной интерпретации, называемые теперь точками, прямыми и плоскостями, могут быть совершенно непохожими на те «обычные» точки, прямые и плоскости, которые предоставляет нам интуиция. Как шутливо говорил Д. Гильберт о подобной ситуации, что это могут быть столы, стулья и пивные кружки, лишь бы они удовлетворяли тем соотношениям, которые мы посчитали правильными для интуитивных точек, прямых и плоскостей. Итак, проблема определения основных объектов теории решается с помощью интерпретаций и семантик, что может привести к совершенно неожиданным результатам. Такой подход, в частности, привел математиков к открытию новых, неевклидовых геометрий. Скажем несколько слов о тех логических средствах, с помощью которых осуществляется основная работа в самих исчислениях. Ясно, что понятия самой логики должны быть подвергнуты анализу, который применяется к математическим теориям. Желательно саму логику изложить в форме подходящих исчислений, которые будут входить как обязательная часть в любое изучаемое исчисление. Язык и понятия математической логики, создаваемые в течение долгого времени, но в наиболее совершенном виде сформулированные в трудах Д. Буля и Г. Фреге, явились базой для таких наиболее известных и удобных логических аппаратов, как исчисление высказываний (ИВ) и исчисление предикатов и функций (ИПФ). Эти логические аппараты ИВ и ИПФ получили название классических. Однако использование именно классических логических понятий, методов и ИВ, и ИПФ для построения формальных систем в духе программы Д.Гильберта встретило довольно серьезную критику со стороны специалистов, исповедующих идеи интуиционизма (А. Пуанкаре, Л. Брауэр, Г. Вейль и др.). В классической математике (и не только в логике) распространен метод доказательства от противного (в старой классической терминологии: reductio ad absurdum, т.е. сведение к абсурду). Суть этого метода можно сформулировать следующим образом: 1) хотим найти какого-то представителя а из рассматриваемого семейства объектов А, который обладал бы некоторым указанным свойством Р; 9
2) делаем предположение (гипотезу), что такого а не существует, т.е. для любого а из /^свойство /*не выполняется; 3) из указанного предположения с помощью каких-то разумных рассуждений (доказательств) приходим к абсурду (противоречию); 4) тогда считаем, что тем самым доказано существование объекта а со свойством Р. Интуиционисты справедливо критикуют (и отвергают) подобные доказательства существования объектов. Действительно, в приведенных рассуждениях мы по существу не смогли сконструировать требуемый объект, конструктивно указать или описать его. Другой пример не принимаемого интуиционистами классического рассуждения — так называемый закон исключенного третьего (tertium поп datur, т.е. третьего не дано). Возьмем какое-то семейство объектов А и некоторое свойство, относимое к объектам из А. Классическое понимание закона исключенного третьего состоит в том, что для любого объекта а из А можно утверждать одно из двух: 1) а обладает свойством Р; 2) а не обладает свойством Р. Однако при рассмотрении конкретного объекта а из А может возникнуть ситуация, когда нет возможности решить указанную альтернативу, т.е. конструктивно ответить на вопрос: выполняется или нет свойство Р для объекта а? На этой почве развилось конструктивное направление в математике (А.Гейтинг, А.А.Марков, Н.А.Шанин и др.). Согласно основным идеям конструктивистов, всякое доказательство существования объекта должно сопровождаться конструктивным построением этого объекта. Интересно отметить, что некоторые классические теоремы, например в математическом анализе, не имеют конструктивных аналогов и оказываются в этом смысле просто неверными. Главный недостаток классической логики (и математики в целом), по мнению интуиционистов и конструктивистов, состоит в том, что логические законы, понятные для конечных множеств, безосновательно переносятся на бесконечные множества. Рассмотренные примеры, конечно, справедливы для конечных множеств: здесь можно ответить на поставленные вопросы, используя простой осуществимый перебор всех объектов и проверку относительно выполнимости заданного свойства. Однако для бесконечных множеств такой перебор принципиально не возможен. В ряде случаев можно и для бесконечных множеств косвенным путем получить ответы на поставленные вопросы, но на общую ситуацию это не переносится. Интуиционисты предлагают, рассматривая бесконечные множества, отказаться от абстракции актуальной бесконечности, т.е. не рассматривать бесконечные множества как завершенные совокупности. Даже признавая существование как угодно больших натураль- 10
ных чисел, они не считают множество натуральных чисел N завершенным, а представляют его потенциально становящимся. По их мнению (А.А.Марков и др.), бесконечное вводится через абстракцию потенциальной осуществимости, которая «отвлекается от практических границ наших конструктивных возможностей, обусловленных ограниченностью имеющихся в нашем распоряжении пространства, времени и материалов». Но для рассмотрения потенциальной осуществимости требуется и особая логика — конструктивная. Программа Д. Гильберта позволяет решать многие подобные проблемы: строя формальную систему, надо взять за основу ту логическую систему, которая является безупречной с вашей точки зрения. Таким образом были построены интуиционистские логические исчисления, а также и другие исчисления, основанные на других видах неклассических логик. И сам Д. Гильберт при построении своей программы требовал придерживаться определенных рамок финитизма (от finitary — конечный), признавая, что использование завершенной бесконечности может вывести за рамки интуитивной очевидности. Он неоднократно подчеркивал, что ни реальный мир, ни даже какая- либо наука не представляют нам объектов, для которых наше восприятие указывало бы, что они бесконечны: «Какие бы опыты и наблюдения и какую бы отрасль науки мы не рассматривали, нигде в действительности мы не находим бесконечности». Бесконечные множества появляются как абстрактные, идеальные объекты при различных научных исследованиях, умственных построениях. По этой причине Д. Гильберт также предлагал считать такие бесконечные совокупности не завершенными ни в какой момент времени, а лишь потенциально становящимися. Но Гильберт был категорически не согласен на отказ от бесконечных множеств: аккуратное обращение с бесконечными множествами не позволит «изгнать нас из рая, созданного Г. Кантором». В метаматематике (теории доказательств), по мнению Д. Гильберта, можно использовать лишь финитные методы. Так, понятие вывода {доказательства) формул в исчислениях носит четкий финитный характер. Даже если есть необходимость использовать какие-то бесконечные множества (символы в языке, формулы, аксиомы и пр.), надо постараться описать эти множества в финитных терминах. Каждое доказательство существования должно давать хотя бы неявно метод построения этого объекта. Надо заметить, что Д. Гильберт иногда требовал даже более сильных ограничений на оперирование с бесконечными множествами, чем инту- иционисты, хотя для логики он выбирал классический вариант. Теперь обратимся к вопросам обоснования математических теорий. Одной из основных и принципиальных задач обоснования является задача непротиворечивости конкретной математической теории. Это означает, что в такой теории невозможно подтвердить 11
и одновременно опровергнуть какое-нибудь утверждение (формулу). Если нам ясно, что подтвердить формулу А в исчислении Ф означает вывести эту формулу в данном исчислении, то понятие «опровергнуть формулу» может иметь несколько толкований. В исчислениях, которые обычно используются в математике, среди логических понятий, как правило, имеется словесная форма или понятие отрицания (или его модификации), а семантическое толкование этого понятия связывают с интуитивным пониманием таких фраз, как «неверно» и т.п. Учитывая особую роль отрицания, будем считать, что во всех рассматриваемых исчислениях это понятие имеется. Для отрицания будем использовать символ -I. Тогда «опровержение» формулы А в исчислении Ф можно представить в виде «вывод в Ф формулы -, А». Исчисления, в которых какая-то формула А может быть в этом смысле одновременно подтверждена и опровергнута, т.е. в Ф можно вывести А и -, А, представляются малоинтересными и непригодными к использованию. Подобные исчисления называют противоречивыми. Непротиворечивыми исчислениями тогда следует назвать такие исчисления, в которых подобных формул нет. Одним из главных принципов программы Д.Гильберта является требование доказательства непротиворечивости изучаемой теории как обязательного условия, гарантирующего от неприятностей, подобных парадоксам. Сразу же возникает следующий вопрос: как доказывать непротиворечивость построенных таким путем теорий и исчислений? Ясно, что если исчисление Ф имеет семантику, то оно не может быть противоречивым (в классическом понимании, каждое утверждение может быть верным или неверным для любой интерпретации). Более того, К. Геделем доказано и обратное: если исчисление Ф непротиворечиво, то оно имеет семантику. Однако откуда же брать интерпретации и семантики? Д. Гильберт считал, что при построении интерпретаций нельзя пользоваться воспринимаемым физическим миром — нам так мало известно об объектах этого мира, все наши познания о нем базируются в основном на интуитивных представлениях и наборе относительных закономерностей, открытых в результате научных исследований. Использование же абстрактных понятий, подобных множествам, числам, точкам и пр., будет также некорректным — эти понятия сами появляются с использованием таких теорий. Д.Гильберт долгое время был уверен, что доказательства непротиворечивости таких теорий может быть проведено средствами и методами, формализованными в самих теориях. И действительно, для ряда довольно простых теорий были получены подобные доказательства непротиворечивости. В частности, таким образом, как этого требует программа Д. Гильберта, доказана непротиворечивость ИВ и ИПФ (см. подразд. 9.2 и 10.4). 12
Но для многих важнейших математических теорий была доказана лишь их относительная непротиворечивость: данная теория непротиворечива, если непротиворечивы так называемые теория множеств Цермело— Френкеля (ZF) или арифметика Пеано (АП) натуральных чисел. Для самих же теорий ZF и АП были предприняты многочисленные попытки доказательства их непротиворечивости в духе программы Д. Гильберта, но которые не привели к успеху. И дело в том, что для этих теорий нельзя использовать их стандартные семантики, так как они сами получались с использованием этих теорий. В начале 30-х годов XX в. К. Гедель доказал знаменитую теорему о неполноте формальной арифметики Пеано натуральных чисел, из которой следовало, что таких доказательств непротиворечивости в принципе не существует. Этот сенсационный результат свидетельствует об относительной слабости избранных логических средств, чтобы с их помощью можно было решать кардинальные вопросы обоснования математических теорий. Непротиворечивость теорий ZF и АП была позднее доказана Г.Генценом и П.С.Новиковым с помощью средств, которые выходят за рамки формализма и финитизма Д.Гильберта. Теперь обратимся к другим вопросам обоснования математических теорий, в частности к вопросу о категоричности и полноте таких теорий. Пойдем от семантики к синтаксису. Нужно признать, что целевое построение конкретной теории связано с каким-то известным (или кажущимся нам известным) «миром объектов» 9Л. Постараемся построить исчисление Ф, все выводимые формулы которого будут верными утверждениями об объектах и отношениях из 9Л. Для этого нужно, чтобы интерпретация Ш была семантикой для Ф. Если при этом построенное исчисление Ф будет категоричным (хотя обычно это довольно редкое и трудно доказываемое явление), то вся «математика» этого уровня для Ж полностью отождествляется с выводимыми формулами в исчислении Ф. Если же исчисление Ф окажется некатегоричным, то это означает, что у Ф есть и другие семантики, неизоморфные исходной Ш. Вспомним вновь историю геометрии. Пусть AG — аксиомы абсолютной планиметрии — это система аксиом G Гильберта для евклидовой геометрии без аксиомы о параллельных А и аксиом непрерывности (см. подразд. 13.1). Конечно, в системе аксиом для AG имеется более полный набор аксиом, чем у Евклида. Аксиома Л — знаменитый «пятый постулат» Евклида, один из вариантов которого утверждает, что на плоскости через точку, не лежащую на прямой, можно провести единственную прямую, параллельную данной. В конце XIX в. были построены различные семантики 13
для AG, неизоморфные стандартной, в которых не выполнялась аксиома Евклида о параллельных А, а были справедливы «противоречащие» ей утверждения. Это означает, что наряду с обычной евклидовой геометрией существуют и другие неевклидовы геометрии. Среди таких геометрий имеется и геометрия Н.И.Лобачевского, в которой справедлива другая «аксиома о параллельных» В: через точку, не лежащую на какой-то прямой, можно провести бесконечно много прямых, параллельных данной. Именно исследования Н.И.Лобачевского и Я.Больяй, в которых изучалась новая геометрия, основанная на обычных аксиомах Евклида, но аксиома А заменена на аксиому В, привели математиков к переосмыслению общих взглядов на проблемы построения математических теорий. Что же произошло? Оказывается, нашлось такое утверждение (свойство) А (конечно, все сказанное относится и к —iA), которое не может быть распознано в рамках исчисления AG, мы не можем в AG вывести ни А (подтвердить), ни -,А (опровергнуть А). Такие формулы называются неразрешимыми для исчисления AG. В этом смысле можно говорить об определенной неполноте исчисления AG. Одной из причин такой ситуации может быть следующая: рассмотрено недостаточное количество аксиом для выяснения выполнимости в строящемся «мире объектов» некоторых выразимых в выбранном языке свойств объектов. Кроме того, на базе исчисления AG можно построить более широкие исчисления, добавив к аксиомам AG в одном случае А, а в другом ,А. И оба эти расширения останутся непротиворечивыми, если исходное исчисление AG было непротиворечивым. Арифметика Пеано натуральных чисел оказалась некатегоричной — у нее имеются семантики, содержащие помимо стандартных натуральных чисел нестандартные элементы. Наоборот, все равномощные семантики арифметики действительных чисел изоморфны. Кроме того, известно, что семантика для евклидовой геометрии изоморфна арифметике действительных чисел. А как уже говорилось, теория, основанная на аксиомах абсолютной геометрии, некатегорична. Одним из важнейших метасвойств исчислений является их полнота. Будем называть исчисление Ф полным, если каждое предложение А (т.е. формула, имеющая на любой интерпретации постоянное значение) разрешимо для Ф, т.е. может быть подтверждено или опровергнуто в Ф, другими словами, в исчислении Ф либо выводима сама формула А, либо выводимо ее отрицание —,А. Уже упоминавшийся результат К. Геделя как раз и состоит в том, что для теории АП строятся неразрешимые предложения; по данной причине эта знаменитая теорема и носит название «Теорема Геделя о неполноте арифметики Пеано натуральных чисел». 14
Для полных теорий, у которых система аксиом может быть задана некоторым регулярным образом (это обычно объясняется в теории алгоритмов), можно построить алгоритм выяснения выполнимости предложений. Надо постепенно выписывать всевозможные выводы в этом исчислении и ждать, не появится ли предложение А или -i/l в одном из таких выводов. Исчисления, для которых подобный алгоритм существует, получили название разрешимых. Итак, евклидова геометрия и арифметика действительных чисел разрешимы. В то же время доказано, что арифметика Пеано натуральных чисел неразрешима, так как подобного алгоритма для нее не существует. Другой аспект понятия полноты исчислений состоит в следующем. Будем называть непротиворечивое исчисление Ф пополняемым, если существует такое неразрешимое для Ф предложение А, что исчисление, аксиомами которого являются аксиомы для Ф вместе с А, снова непротиворечиво; в противном случае исчисление Ф называется непополняемым. Итак, непополняемые исчисления невозможно без противоречий пополнить (расширить). Это означает, что такие исчисления вобрали в себя довольно компактное (полное) множество формул. Еще одним важным вопросом, относящимся к аксиоматическим теориям, является вопрос о независимости аксиом теории. Задавая исчисление Ф с помощью аксиом 21, мы интересуемся — нельзя ли какую-нибудь аксиому А исключить из списка аксиом 21, т.е. не будет ли она выводима из остальных аксиом. Часто, но не всегда, строя исчисление Ф, стараются избрать систему аксиом независимой. Напомним, что построение неевклидовых геометрий (в частности, геометрии Лобачевского!) было связано как раз с попытками доказать независимость аксиом Евклида. Программа Д. Гильберта сыграла выдающуюся роль, особенно в вопросах оснований математики. В ней удалось систематизировать весь накопившийся в математике опыт исследований и решений трудных математических проблем. Под этот необозримый материал была подведена разумная философия осмысления достигнутого, что, в свою очередь, помогло строго математически поставить такие вопросы обоснования, которые ранее лишь предугадывались. На базе данной программы для классических математических объектов (множества, числа, геометрия и др.) были сформулированы их аксиоматические теории. Относительная неудача основной идеи Д.Гильберта о непременном доказательстве непротиворечивости теорий средствами формального языка, выявленная в теореме К. Геделя о неполноте арифметики натуральных чисел, ни в коей мере не умаляет значимости программы Д. Гильберта. Такое положение, наоборот, отметает тупиковые пути для решения подобных проблем и подсказывает возможные дальнейшие направления их исследования.
ЧАСТЬ I СЕМАНТИКА ГЛАВА 1 АЛГЕБРАИЧЕСКИЕ СИСТЕМЫ 1.1. Множества и предикаты Множества. Понятие «множества» относится к первичным понятиям, так как нет других, более простых понятий для их определения. Поясним лишь то, что будем понимать под данным понятием, используя какие-либо слова. Чаще всего эти слова интуитивно адекватны тому, что мы подразумеваем под словом «множество»: совокупность, семейство, набор и др. Под множеством будем понимать совокупность каких-либо предметов, понятий и пр. Эти предметы и понятия, входящие в множество А, будут называться элементами множества А. Для выражения того факта, что некоторый элемент а принадлежит множеству А, будем использовать следующее обозначение: ае А; если же элемент а не принадлежит множеству А, то используем обозначение: а<£ А. Заметим, что для обозначения множеств используются прописные буквы, а элементов множеств — строчные. Однако не всегда это будет удобным. Дело в том, что элементами некоторого множества А могут быть и некоторые другие множества В, С, ... . В подобных случаях придется нарушить договоренность о различии в написании обозначений для множеств и их элементов. В этих случаях нам будет оказывать помощь контекст, из которого будет ясно, что и как обозначается. Два множества А и В считаются равными, если они состоят из одних и тех же элементов (пишем А = В, если множества А и В равны, и А ф В — в противном случае). Как задаются или описываются множества? Если элементов множества А не очень много, то их можно перечислить, заключив в фигурные скобки: А = {а, Ъ, с}. Иногда этот способ применим и к достаточно большим и даже бесконечным множествам, если известен закон образования элементов множества: А = {о,, аъ ..., ат); 16
N = {0, 1,2, 3, ...} — множество всех натуральных чисел (замечание: во многих областях математики число 0 относят к натуральным числам); С- {..., -3, -2, -1,0, 1,2, 3, ...} — множество всех целых чисел; Е= {0, 2, 4, 6, ..., 2п, ...} — множество четных чисел; S- {0, 1, 4, 9, ..., п2, ...} — множество квадратов натуральных чисел; R — множество рациональных чисел, т.е. дробей — >, где a, b — натуральные числа и b Ф 0; D — множество всех действительных чисел, т.е. бесконечных десятичных дробей. Ясно, что при таком задании множества равные элементы можно не повторять несколько раз. Заметим, что пока еще не знаем, что такое натуральные, целые и другие упомянутые выше числа, да и число 103 пока не определено. Такие объекты в дальнейшем будут построены внутри теории множеств. Однако в примерах, призванных пояснять введенные объекты и понятия, часто будут использоваться наши интуитивные знания о подобных объектах и понятиях. Если нужно задать какое-либо семейство (множество) некоторых множеств, то можно использовать следующее обозначение: где элементами семейства 21 являются всевозможные множества А,-, а множество /играет роль множества индексов (номеров) для множеств в указанном семействе. Очень полезным оказывается схематичное, графическое задание множеств. Для множества А рисуем некоторую фигуру, напоминающую круг, квадрат, прямоугольник и пр. (рис. 1.1). Точки этой фигуры будут символически обозначать элементы множества А. Если необходимо рассматривать несколько множеств, то нужно нарисовать соответствующее число фигур (рис. 1.2). Такие схемы часто называются диаграммами Венна. Они помогают наглядно представить себе взаиморасположение множеств и подсказать различные возможные пути рассуждений. Следует при этом учесть, что для строгих доказательств математических фактов на диаграммы Венна в силу их схематичности полностью полагаться не стоит. Рис. 1.1 Рис. 1.2 17
Общеупотребительным является задание множеств с помощью следующего приема: А = {х I х обладает указанным здесь свойством}. В такой записи говорится, что в множество А входят элементы, обладающие сформулированным после символа / свойством. Такой способ задания множеств очень удобен и используется чаще всего. Однако необходимо учитывать, что указанное свойство элементов может быть так сформулировано, что бывает трудно, а иногда и просто невозможно проверить, обладает ли какой-либо элемент этим свойством. Например, А - {х I х — натуральное число, являющееся суммой двух простых натуральных чисел}. Есть предположение, что все четные натуральные числа, кроме 2, попадают в множество А (проблема Гольдбаха). Но до сих пор это никем не доказано и не опровергнуто. Здесь имеется и другая очень существенная трудность, называемая парадоксом Рассела. Ранее уже говорилось, что вполне допустимо (и так чаще всего и бывает), если элементами множества А могут быть какие-то множества. А может ли быть элементом множества А само множество А? Конечно, во многих «естественных» случаях А е А. Но уверенности, что так будет всегда для произвольных множеств А, нет. «Соберем» множество В из всех таких «естественных» множеств: В = {А I А е А}, т.е. в множество В попадают такие множества А, которые не являются элементами самих себя. А теперь зададим вопрос: принадлежит ли множество В самому множеству В? И здесь приходим к совершенно невозможной ситуации: В е В тогда и только тогда, когда В <£ В. Итак, «сбор» множеств без всяких ограничений в подобную совокупность В приводит нас к некоторому объекту, который вряд ли разумно считать множеством. Эта совокупность В, если она вообще существует, имеет какую-то новую, более сложную природу, чем понятие множества. Теория множеств, созданная Г. Кантором, в связи со своей универсальностью оказалась очень удобной для построения многих областей математики. Но наличие парадоксов, подобных вышеописанному, в самом этом фундаменте математики привело исследователей к различным философским переосмыслениям и в самой теории множеств. 18
Ясно, что можно двигаться следующими путями: либо строить новую, гораздо более разветвленную теорию совокупностей, которые могут быть сложнее, чем множества, либо вводить какие-то разумные ограничения при образовании множеств из элементов. Б. Рассел пошел первым путем — он строил так называемую теорию типов, где в иерархии подобных типов элементы, множества элементов, множества множеств элементов и т.д. занимают различные сложностные слои. Более современная точка зрения предлагает все же вводить различные ограничения при собирании элементов в множества с тем, чтобы избежать ситуаций, подобных парадоксу Рассела. Одно из таких эффективных ограничений состоит в следующем: когда начинаем собирать множество А из некоторых элементов, то к этому моменту уже нужно иметь в распоряжении (хотя бы мысленно) все эти элементы. Таким образом, А просто не может быть своим элементом, так как именно этот элемент пока еше не создан! По этим же причинам такого объекта, как множество всех множеств, просто не может существовать — оно не может быть собрано раньше, чем мы его соберем самого. Как говорилось во введении, наиболее современным и надежным способом определения абстрактных математических объектов является аксиоматическое построение соответствующих теорий. Так и для теории множеств были построены различные аксиоматические теории. Одной из самых употребительных и признаваемых большинством математиков является аксиоматическая теория ZF, предложенная Е.Цермело и А.Френкелем в начале XX в. В теории ZF удалось формализовать достаточно обширные фрагменты различных областей математики (см. подразд. 11.2). Но до тех пор будем иметь дело с так называемой наивной, или интуитивной, теорией множеств, где постоянно будем апеллировать к нашим интуитивным представлениям о множествах и действиях над ними. Вернемся к основным понятиям теории множеств. Если каждый элемент множества А является и элементом множества В, то А называется подмножеством множества В, а В — надмножеством множества А. Такое отношение включения множеств обозначается через А с В (рис. 1.3). В тех случаях, когда А с В, но А * В, используется символ строгого включения А а В. Из определений ясно, что А = В тогда и только тогда, когда А с В и В с А. По этой причине доказательства того, что какие-то множества А и В равны, обычно распадаются на две части: в первой части доказывают, что А с В, а во второй, что В с А. Рис. 1.3 О 19
Множество, не содержащее никаких элементов, называется пустым и обозначается через 0. Подмножество В множества А назовем собственным, если 0 с В с А. Выпишем ряд свойств уже введенных понятий, доказательства которых очевидны. Для любых множеств А, В, С выполняются следующие соотношения: 0 с А; если А с 0, то А = 0; А с А: если А с 5 и В с С, то /1 с С. Обозначим через />(/4) множество всех подмножеств множества А, т.е. Р(/1) = {Я/ ДсЛ}. Для некоторых не очень сложных множеств А легко явно выписать все элементы множества Р(А). Например, Р(0) - {0}. Заметим, что множество Р(0) Ф 0, так как оно содержит один (1 =2°) элемент 0. Если А состоит из единственного элемента а, т.е. А = {а}, то Р(А) состоит из 2 = 2' элементов: Р(А) = {0, {а}}. Если А состоит из двух различных элементов а и Ь, т.е. А = {а, />}, то Р(А) состоит из 4 = 22 элементов: Р(А) = {0, {а}, {/>}, {а,.Ь}}. Если А состоит из трех различных элементов a, b и с, т.е. А - = {а, Ь, с}, то Р(Л) состоит из 8 = 23 элементов: Р(А) = {0, {а}, {/>}, {с}, {о, Ь), {а, с}, {А, с}, {а, Ь, с}}. Если /) состоит из п различных элементов А = {а,, а2, ..., я„}, то /3(Л) состоит из 2" элементов: Р(А) = {0, {я,}, ..., {а,,}, {а,, а2}, ..., {а,, а2, -, ««}}• Для бесконечных множеств подобные формулы также будут иметь определенный смысл, об этом поговорим далее. Предикаты. Подмножество В множества А можно отождествлять с так называемым одноместным предикатом (отношением, свойством) В1л(х), заданным на множестве А. Если х — элемент множества А и х е В, то считаем, что В\(х) выполняется или, другими словами, имеет значение и (от слова «истина»). Если х — элемент множества А и х <£ В, то считаем, что В\(х) не выполняется, или другими словами, имеет значение л (от слова «ложь»). Верхний символ, означающий местность предиката — предикат зависит от одной переменной, часто просто опускается, так как из самой 20
записи ВА(х) уже видно, от скольких переменных данный предикат зависит. Для определения л-местных предикатов на множестве А необходимо ввести еще одно новое понятие — понятие упорядоченной п-ки (кортежа длины п). Это выражение вида <аи аъ ..., а„>, где все а,е А. Множество всех и-к на множестве А удобно обозначать через А". Позднее увидим, что подобное обозначение имеет смысл, связанный с операцией возведения в степень на множествах. Понятие упорядоченной я-ки необязательно вводить как первичное понятие. При рассмотрении теории множеств в логических терминах будет указано, как можно определить это понятие через другие уже имеющиеся понятия теории множеств. Подмножество В множества А" можно отождествлять с п-мест- нъш предикатом (отношением, свойством) ВпА(хи ..., х„), заданным на множестве А. Если xh х2, ..., х„ — элементы множества А и <хи х2, ..., х„>е В, то считаем, что В"А(хи ..., х„) выполняется или, другими словами, имеет значение и. В этом случае будем писать просто: ВА(хь ..., х„). Если а;,, х2, ..., х„ — элементы множества А и <хь хъ ..., х„><£ В, то считаем, что ВЛ(хи ..., х„) не выполняется или, другими словами, имеет значение л. В этом случае будем писать: -,В"А(х\, ..., х„). Верхний символ, означающий местность предиката — предикат зависит от п переменных, часто просто опускается, так как из самой записи ВА(хи ..., х„) уже видно, от скольких переменных данный предикат зависит. Для двухместных предикатов R? (в литературе их часто называют бинарными) часто пишут xRy вместо R(x, у) - и. Задание на множестве А некоторого набора предикатов является одним из способов получения новых образований — алгебраических систем. 1.2. Функции и взаимно-однозначные соответствия Функции. Рассмотрим два множества А и В. Пусть каждому элементу а е А ставится в соответствие некоторый элемент b е В. В этом случае будем говорить, что задана функция f(x) типа f:A —> В (рис. 1.4). Тот элемент b е В, который соотносится элементу а е А при заданном соответствии/, обозначим через b =f(a) и назовем значением функции f при значении аргумента х, равного а. Ясно, что при определении функции/: /4 -» В можно ничего не говорить про интуитивное понятие «соответствие», а вполне обойтись рамками предикатов. Когда будем рассматривать теорию мно- 21
/ жеств в логических терминах, укажем там, как можно определить это понятие через предикаты и другие уже имеющиеся понятия теории множеств. Рассмотрим более сложную ситуацию: рис 14 пусть заданы две функции f:A -» В и g: В -» С. Назовем функцию h:A -^ С суперпозицией функций / и g и обозначим ее через g(f(x)), если для всех а е А выполняется h (а) = g(f(a)). Здесь часто не|ставят одну пару скобок, а пишут gf(x). Иногда говорят, что функция h получается подстановкой функции/в функцию g. Понятно, как получать значения, например, такой суперпозиции функций: h(x) = srgf(x). Имея элемент а е А, находим значение f{a) в множестве В, далее находим значения gf(a), rgf(a) и srgf(a) в соответствующих множествах. Функция т\та/:А"-ъ В называется п-местной функцией, и ее значение при Аргументе <аь ..., ап> обозначается через/(а,, ..., а„). Также ясно, ч[го означает такая, например, суперпозиция многоместных функций: /(gl(Xi, ..., х„), ..., gm(yb ..., у,)) (здесь нужно /ишь, чтобы число записанных аргументов у каждой функции gj и функции/соответствовало их местностям; некоторые символы аргументов у этих функций могут совпадать). Может так ^лучиться, что некоторая «-местная функция/: А" -» -> В по существу не зависит от какого-то аргумента х„ т.е. для любых наборов Значений аргументов вида <аи ..., а,_\, b, ai+u ..., а„> и <аь ..., i?,_,, с, о,+ ь ..., а„> значения функций равны между собой: /(а,, ..., а,_л, Ь, а, + 1» ап) =/(«1, -, fl,-i, с, а,+ ь ..., а„). Такой аргумент х, называется фиктивным для функции/; аргументы, не являющиеся фиктивными, называются существенными. Ясно, что во многих случаях можно не различать между собой функции, отличающиеся фиктивными аргументами, хотя эти функции могут иметь различные типы. Если задана какая-то функция/ то тем самым считаем заданными и все функции, получающиеся из/ введением и удалением фиктивных аргументов. Аналогичное соглашение вводится для переобозначения и отождествления аргументов. Дело в том, что при конкретном задании функции мы т&кже указываем и некоторые конкретные обозначения аргументов. Но здесь важна сама закономерность, указываемая функцией. Поэтому можно считать, что вместе с каждой функцией /(хь ..., х„) мы имеем и все функции, которые получаются из данной переобозначением аргументов. Например, f{y\, ..., у„), f(Z\, ..., z„) и др. Заметим, что допустимо переобозначение не всех 22
аргументов, а лишь некоторой их части. Если при переобозначении аргументов некоторые из них обозначаются одинаковыми символами, то говорят об отождествлении этих аргументов. Попытаемся представить множество возможных функций типа/: А—> В. Для функции/и элемента b е Z? рассмотрим множество f\b) = {a/f(a) = b}, называемое полным прообразом b относительно функции/(рис. 1.5). Ясно, что каждая функция/:А -» i? однозначно определяется семейством 21 = {f~\b)}bG в подмножеств множества А (эти множества попарно не имеют общих элементов). В подобном семействе нужно обязательно указывать и пустые множества, являющиеся полными прообразами тех элементов b е В, которые не являются значениями функции/ Теорема 1.1. Если множество А содержит п элементов, а множество В ~ т элементов, то имеется т" различных функций типа f:A-*B. Доказательство. 1. Если А = 0 или В= 0, то число функций типа /:Л —> В равно 0, т.е. т°илиО". Здесь для определенности считается 0° = 0. 2. Полагаем, что А ф 0 или Вф0. Проведем индукцию, начиная с п = I. 3. База индукции. Если А = {а}, то каждая функция f:A^>B полностью задается ее значением/(а), для выбора которого имеется т - т1 возможностей. 4. Индуктивное предположение. Если А = {аи ..., а„] и B= {Ьх, ..., Ьт), то предполагаем, что число функций/:/! н> В равно т". 5. Индуктивный шаг. Пусть Ах = {аь ..., а„, а„+]}, А = {а{, ..., а„} и В - {Ьи ..., Ьт}. Тогда всякая функция / : А\ -•> В может быть получена из некоторой функции /: А -» В (а их по индуктивному предположению имеется тяштук), если «доопределим»/, указав значение f(an+i). Для выбора таких доопределений/имеется т возможностей. Итак, число функций/:/!, —» Z?равно т"- т = т"+]. ■* В общем случае, когда множества А\л В необязательно конечны, формула т" теряет смысл. Однако параллель с этой формулой имеется в следующем обозначении: ВА = {// функции типа /: А -» В}. Будет удобно также рассматривать и 0-местные функции. Такая функция будет встречаться всякий раз, когда у функции f{xu ..., х„) * Здесь и далее знак ■ обозначает окончание доказательства. F-\b) 23
все аргументы окажутся фиктивными. Будем считать, что в этом случае задана на множестве А некоторая константа а. Взаимно-однозначные соответствия. Крупнейшим достижением Г. Кантора явилось введение понятия взаимно-однозначного соответствия. Это позволило с новой точки зрения взглянуть на основные понятия теории множеств и сделало саму эту теорию чрезвычайно богатой и способной по-новому решать многие вопросы из различных областей математики. В частности, появилось новое осмысление такого кардинального понятия математики, как бесконечные множества. Скажем, что функция/: Л —> В осуществляет взаимно-однозначное соответствие между Aw В, если каждый элемент b е В является значением/(а) ровно для одного элемента а е А. Заметим в этом случае, что функция g(x) = {у I Ду) = х} осуществляет взаимно-однозначное соответствие между В и А. Такая функция g обозначается через /"' и называется обратной к функции/(рис. 1.6). Два множества А и В называются эквивалентными, или равно- мощными, если между ними можно установить взаимно-однозначное соответствие. Символически эквивалентность множеств А и В будем обозначать через А ~ В. Двухместный предикат «~» на семействе всех рассматриваемых множеств очевидно удовлетворяет следующим свойствам: 1) А ~ А с помощью функции/(х) = х; 2) если А ~ В с помощью функции f(x), то В ~ А с помощью функции f~l(x); 3) если А ~ В с помощью функции f(x), а В ~ С с помощью функции g(x), то А ~ С с помощью функции gf(x). Мощностью множества А называется класс эквивалентных множеству А множеств; мощность множества А обозначается через А ; мощности часто также называют кардинальными числами. Отметим следующее простое свойство, связанное с мощностями множеств: В е А тогда и только тогда, когда А е В , означающее независимость (корректность) понятия мощности от выбора представителя из этой мощности. Ряд кардинальных чисел имеют специальные (исторически сложившиеся) обозначения. Мощность множества N„ = = {О, 1, ..., я-1}, где п — натуральное Рис. 1.6 24
число, удобно обозначать символом п. Имеем N0= 0 и 0 = 0. Среди кардинальных чисел мощности п так и носят название натуральных чисел. Теорема 1.2. Л',, ~ Nm тогда и только тогда, когда п- т. Доказательство очевидно. ■ Каждое множество А, эквивалентное N„ для некоторого п, называется конечным, an — числом элементов множества А. Таким образом, всякое конечное множество А содержит п элементов для некоторого натурального числа п, т.е. имеет вид А - {а0, а,, ..., апЛ). Те множества, которые не являются конечными, называются бесконечными. Таким образом, какое бы натуральное число мы не взяли, бесконечное множество А содержит больше, чем п элементов. Множество А, эквивалентное множеству натуральных чисел Л', называется счетным, и его мощность имеет специальное обозначение Х0 (читается «алеф-нуль»). Множество А, эквивалентное множеству действительных чисел D, называется континуальным, а его мощность также имеет фиксированное специальное обозначение с (читается «континуум»). Для обозначения кардинальных чисел, кроме специально выделенных, часто используются строчные готические буквы. В гл. 3 более подробно рассмотрены арифметика натуральных чисел (см. подразд. 3.3) и арифметика кардинальных чисел (см. под- разд. 3.6). Здесь же докажем несколько теорем о некоторых свойствах понятия эквивалентности множеств. Теорема 1.3. Во всяком бесконечном множестве можно выделить счетное подмножество. Доказательство. Так как А ф 0, то в нем есть какой-то элемент о0. Но так как А ^ {а0}, то выберем из оставшегося множества (т.е. из А без а0) еще один элемент ах. Продолжим этот процесс. Если мы уже выделили в А множество из п элементов В = {а0, аи ..., tf„._]K то в оставшемся множестве А без элементов В есть еше хотя бы один элемент. Обозначим этот новый элемент через а„. Итак, продолжая этот процесс выделения элементов, получим А = {а0, fl|, ..., а„, ..., х, ...}. ш Заметим, что в доказательстве пришлось использовать некоторое рассуждение, которое в дальнейшем будет названо принципом (аксиомой) выбора. Особенности аксиомы выбора будут подробно рассмотрены в теории упорядоченных множеств (см. подразд. 4.2). Понятия взаимно-однозначного соответствия и равномощно- сти позволяют сформулировать некоторый критерий, с помощью которого можно различать понятия «конечность» и «бесконечность». Теорема 1.4. Множество А бесконечно тогда и только тогда, когда оно равномощно некоторому своему подмножеству В cz А. 25
Доказательство. 1. Пусть А бесконечно. Выделим в нем счетное подмножество С- {с0, с{, ...} с А. Ясно, что здесь легко добиться строгого включения: даже если бы оказалось, что С= А, то в качестве искомого счетного подмножества надо взять С без с0. Тогда имеем А = {Со, сьс2.......х...}, D В = {с\, с2..., ...х...}. D Функция f< ч fc„+i, если х = с„; fix) = ' [ х, если х е D осуществляет взаимно-однозначное соответствие между А и В. 2. Если множество А конечно, то оно не может быть равномощ- но своему подмножеству В а А, так как у них разное число элементов. ■ Может показаться, что понятие равномощности отличает лишь конечные множества от бесконечных. Однако следующие две теоремы показывают, что и бесконечные множества расслаиваются на разные классы равномошных множеств. С этой точки зрения можно рассматривать мощность множества как некоторую «меру» количества его элементов. Теорема 1.5. Множества N н D неэквивалентны. Доказательство. Проведем доказательство с помощью диагонального метода, открытого Г. Кантором. Такие рассуждения стали очень популярны в различных областях современной математики. Пусть существует функция а, осуществляющая взаимно-однозначное соответствие между N и D. Запишем образ а (и) в виде десятичной дроби ам, ап]а„2а„3 ... Будем строить новое действительное число р = Ь0, Ь{ЬгЬт, ... следующим образом: [\, если ан Ф 1; [2, если а а = 1. Ясно, что а(п) ф Ьп для всех и, поскольку а„„Ф Ь„. Итак, такого взаимно-однозначного соответствия а не существует. ■ Теорема 1.6 (теорема Кантора). Любое множество А не может быть эквивалентным множеству его подмножеств Р(А). Доказательство. Допустим, что существует взаимно-однозначное соответствие/между А и Р(А), рис. 1.7. Здесь f(x) — некоторое подмножество множества А
Рассмотрим В={х/ хе A,xef(x)}. В связи с тем что В с А, для некоторого xQ имеем /(х0) с В. Получаем, что ис" ' х0 е В тогда и только тогда, когда х0 i f(xQ) = В, но это быть не может. Итак, такого взаимно-однозначного соответствия/между А и Р(А) не существует. ■ 1.3. Алгебраические системы Основным семантическим инструментом в дальнейших рассмотрениях будут алгебраические системы. Непустое множество М с заданными на нем константами а0, А|, ..., предикатами р/Я| рт, и функциями J \ ■> •■•■> J s будем называть алгебраической системой и обозначать через Ж = <М; а0, аь ...; /»,"", .... Р?; /,"-, ..., /*>. (1) Заметим, что в алгебраической системе будем допускать лишь конечное число предикатов и функций, хотя число констант может быть и бесконечным. Важно также, что во всех рассмотренных случаях множество М*0. В частных случаях, когда в алгебраической системе 9Н отсутствуют предикаты, ее называют алгеброй, а когда у 9Л нет функций, то — моделью. Во многих случаях можно ограничиваться лишь рассмотрением моделей. Рассмотрим для функции/" предикат 0^хи...,х„,у) = \Н>*СШУ = /(Х-->Х»>У)> [л — в противном случае. Для алгебраической системы 9Я, указанной в (1), строим модель ОТ, = <М; ао, аъ ...; Р?>, ..., />,"'; <?|*+1, ..., Qf+]>. 27
Понятно, что многие свойства алгебраической системы ОТ и модели ОТ, совпадают. С алгебраической системой (1) связаны следующие понятия: \) М — основное множество системы ОТ; 2) набор чисел <ти ..., ms\ пи ..., пг>, фиксирующий местности предикатов и функций, заданных на множестве М, — тип системы ОТ; 3) набор символов а = <а0, а,, ...; Pf1, ..., Р?'; /,"', ..., /">>, обозначающих константы, предикаты и функции на множестве М, — сигнатура системы ОТ; 4) мощность множества М — мощность системы ОТ; 5) Ла — класс алгебраических систем, у которых константы, предикаты и функции обозначены теми же символами, которые входят в сигнатуру а; этот класс Я„ называется классом алгебраических систем сигнатуры о. Заметим, что когда говорим, что две алгебраические системы ОТ] и ОТ2 имеют одинаковую сигнатуру, то это просто означает, что все константы, предикаты и функции у ОТ, и ОТ2 обозначены одними и теми же символами, хотя конкретные интерпретации каждого из этих понятий на ОТ, и ОТ2 имеют свое специфическое содержание. Часто для краткости будем записывать алгебраическую систему ОТ сигнатуры а как ОТ = <М; а>. Подсистемы. Пусть имеем алгебраическую систему ОТ = <М; а> и некоторое множество Л с М. Скажем, что А — замкнутое множество алгебраической системы ОТ, если: все константы а0, о,, ... е А; для всех функций/из а, если значения переменных хи х2, ..., х„е А, то Дхь ..., х„) е А. Для замкнутого подмножества А алгебраической системы ОТ можно ввести новую алгебраическую систему 21 = <А; о>, называемую подсистемой системы ОТ: надо на множестве А интерпретировать символы из о в точности так же, как они интерпретировались в ОТ. В свою очередь, ОТ для 21 является надсистемой. Переход от алгебраических систем к их подсистемам и надсистемам позволяет значительно пополнить запас алгебраических систем. Фактор-системы. Еще один, часто используемый в математике, способ получения новых систем связан с переходом к фактор- системам. Как это делается? Назовем двухместный предикат R на множестве А эквивалентностью, если для всех х, у, z е А выполняются следующие свойства: 1) х R х (рефлексивность); 2) если х R у, то у R х {симметричность); 3) если х R у \л у R z, то х R z (транзитивность). 1Я
Классом эквивалентности (смежным классом) элемента х по эквивалентности R называется множество lx]R = {y/xRy}. ^wt^[b\R A/R Множество классов эквивалентности элементов множества А по эквивалентности R называется фактор-множеством А по Я и обозначается через A /R. Ясно, что х е \x]R; если х R у, то \x]R = ]y]R. Таким образом, все множество А разбивается на непересекающиеся классы эквивалентности по R. Эти классы и будут элементами фактор-множества A/R (рис. 1.8). Интересно, что имеется и обратная связь между разбиениями множества А (иногда их называют покрытиями) на непересекающиеся подмножества и эквивалентностями, заданными на множестве А. А именно, пусть множества А, попарно не пересекаются и каждый элемент множества А принадлежит одному из множеств Д. Тогда существует эквивалентность R на А, такая, что A/R есть множество, элементами которого являются множества А,. Действительно, определим двухместный предикат R на множестве А следующим образом: х R у тогда и только тогда, когда существует / е /, такое, что х, у е А,. Очевидно, что так определенное отношение R рефлексивно, симметрично и транзитивно, т.е. R — эквивалентность на А. Пусть дана алгебраическая система 21 = <А; о> и R — некоторая эквивалентность на А. Желательно, чтобы основным множеством новой алгебраической системы 21 /R той же сигнатуры о было бы множество {\a\R/ as А}, а интерпретации сигнатурных символов на этом множестве были бы соответствующим образом связаны со значениями аналогичных сигнатурных символов на А, определяемые представителями элементов разбиения: [a0]R, [fliJ/;, ... были бы константами 21 /R; P([xj], [х2], ..., [х„\) = и тогда и только тогда, когда Р(хь х2, ..., х„) - и; Ж*]], \Х2\, ..-, Ы) = [/(*|, Х2, ..., Х„)\. 29
Но здесь возможно столкнуться с некоторой несогласованностью. Дело в том, что, выбирая разных представителей [x,]R= [yj]R, можно получить разные значения предикатов Р(хь х2,..., х„), Р(у\, Уъ ■■; Уп) и функций Дхь х2, ..., х„), f(yu уъ ..., у„). Чтобы подобного казуса не случилось, необходимо потребовать выполнения следующих условий корректности: если [x,]R= [y,]R, [x2]R= [у2]я, ..., [х„)Й= [y„]R, то P{xu хъ ..., x„) = P(yu уъ ..., уп) и [/(*,, хъ ..., х„)] = [Дуи у2, ..., у„)]. Итак, имея алгебраическую систему 21 и некоторую эквивалентность R на ее основном множестве, для которой выполняются указанные условия корректности, можно построить новую алгебраическую систему 21 /R той же сигнатуры, что и у 21, называемую фактор-системой, если положим: константа а, системы 21/7? — [aj\R; Р([х\], Ш, -, [*„]) = Р(хь хъ ..., х„); f([x\], [х2], ..., [х„]) = [Дхь х2, .... х„)]. Переход от алгебраических систем к их фактор-системам позволяет получать новые алгебраические системы. Позднее приведем ряд интересных примеров. Изоморфизм. Сравнивая две алгебраические системы ОТ, и ОТ2 одной сигнатуры, можно заметить, что, если отвлечься от обозначений, элементы множеств Мх и М2 ведут себя довольно похожим образом и свойства, рассматриваемые на Ми вполне аналогичны при подходящем их переводе свойствам на М2. Эта «похожесть» оформляется в понятии «изоморфизма алгебраических систем». Алгебраические системы ЯЛ, и 9Л2 одной сигнатуры называются изоморфньши, если существует взаимно-однозначное соответствие а между Af| и М2, такое, что для любых элементов хь х2, ..., х„ из М,: 1) a(fl,) = а, для любой константы а, из о; 2) Р(а(Х|), о~(х2), ..., а(х„)) = Р(хи х2, ..., х„) для любого предиката из а; 3)/(а(лС|), а(х2), ..., а(х„)) = af(xh хъ ..., х„) для любой функции из о. На изоморфные алгебраические системы естественно смотреть как на разные варианты одной системы, отличающиеся лишь своими обозначениями. С точки зрения тех логических средств и понятий, которые в дальнейшем будут построены, изоморфные системы совершенно неотличимы друг от друга.
ГЛАВА 2 ЛОГИЧЕСКИЕ СИСТЕМЫ 2.1. Алгебра высказываний Каждая математическая теория имеет свою собственную область объектов, которую она изучает. Так, в арифметике основными объектами изучения являются натуральные (и близкие к ним) числа и связи между ними. Геометрия обычно исследует различные геометрические фигуры, их преобразования и пр. Основные объекты математического анализа — это, как правило, действительные и комплексные числа, функции и действия над ними. Основными объектами изучения той части математической логики, которая называется алгеброй высказываний (АВ), являются высказывания. Обычно основные объекты любой теории трудно точно определить, поскольку пока еще нет других более простых объектов и понятий. Так и здесь, в алгебре высказываний, не сможем до поры до времени точно определить, что такое высказывание. Постараемся лишь дать некоторые пояснения, что имеется в виду. В обычном разговорном языке под высказываниями подразумеваются грамматически правильные предложения, в которых что- то утверждается. Запас таких предложений, конечно, необозрим. Но в большинстве встречающихся случаев бывает ясно, что данное утверждение является либо истинным, либо ложным (хотя может быть в настоящее время и неизвестно это значение). Однако следует заметить, что существуют и такие предложения, которые вроде бы и утверждают нечто, но при внимательном рассмотрении оказывается, что им нельзя приписать никакого значения, ни истинного, ни ложного (парадоксальные утверждения). Приведем несколько примеров. 1. «Число 20 больше числа 5» — это утверждение является истинным высказыванием в нашей стандартной арифметике. 2. «Москва — столица России» — это также истинное высказывание, если здесь имеется в виду именно российский город Москва, а не какой-нибудь другой зарубежный город, имеющий такое же название. 3. «Берлин — один из крупных городов Франции» — это утверждение является ложным высказыванием. 4. «В каждом треугольнике сумма углов равна 180°» — в обычной евклидовой геометрии это истинное высказывание. 5. «Сколько Вам лет?» — это предложение не является высказыванием. 31
6. «Простых чисел бесконечно много» — содержание этого истинного высказывания составляет классическую теорему Евклида. 7. «Простых чисел-близнецов бесконечно много» — это утверждение, конечно, также является высказыванием. Правда, в настоящее время неизвестно его значение. 8. «То, что я сейчас говорю, ложно» — этот типичный пример парадоксального высказывания имеет специальное название — «парадокс критянина» (т.е. человека, живущего на острове Крит). Действительно, если считать это утверждение истинным (верным), то по его содержанию выходит, что оно ложно. И наоборот, если бы оно было ложным, то это означало бы, что надо признать его истинным. Тот раздел логики, о котором пойдет речь и который называется алгеброй высказываний, будет изучать высказывания, имеющие определенные истинностные значения. В соответствии с этим в рассмотрение вводятся абстрактные объекты, называемые высказываниями (точнее, элементарными высказываниями), для которых постулируется, что они обязательно должны быть либо истинными, либо ложными. В дальнейшем будем обозначать высказывания строчными буквами, возможно, с индексами: а, Ъ, с, ..., х, у, ..., аь Ьъ, ... Если высказывание а имеет истинное значение, то пишем а = и; если а имеет ложное значение, то пишем а = л. Если рассматривать символ х как переменное высказывание, то вместо х можно иметь в виду произвольное высказывание. Возьмем множество /= {и, л}, состоящее из двух элементов, и рассмотрим какой-нибудь л-местный предикат на этом множестве Р(хх, ..., х„). На этот предикат можно смотреть как на некоторое переменное высказывание, значение истинности которого при определенных значениях переменных х, = ах, ..., х„ = а„, где все а, е /, совпадает с Р(аи ..., а„). Обозначим через П множество всех предикатов произвольных конечных местностей на множестве /. Построим теперь одно конкретное множество, элементами которого будут логические формулы (формулы алгебры высказываний, или формулы алгебры логики, или просто формулы), составленные из переменных высказываний и использующие логические связки. Нас мало будет интересовать конкретное содержание переменных высказываний, из которых составлена данная формула. Все, что нужно будет знать об этих высказываниях, это — какое значение они имеют. С этой точки зрения можно смотреть на составляющие данную формулу высказывания как на переменные этой формулы, могущие принимать лишь два значения — и и л, а на саму формулу как на предикат из П (логическую функцию, или функцию алгебры логики, или булеву функцию, как их часто также называют по име- 32
ни Д. Буля, одного из создателей логики высказываний) от этих переменных, значениями которой также могут быть лишь и и л. В этом случае можно считать данную логическую формулу реализацией соответствующего предиката. Как увидим, всякий предикат из П будет иметь много различных реализаций логическими формулами. Рассмотрим множество символов а, состоящее из трех частей cci, ос2, щ, называемое алфавитом: 0С( = {а, Ь, с, ...} и {и, л} — переменные высказывания (или просто переменные), где и, л — особые символы, обозначающие постоянные формулы, не зависящие от переменных; а2 = {->, -^} — логические связки (соответственно отрицание и импликация); ос3= {(,)} — вспомогательные символы (скобки). Словами в данном алфавите назовем любую конечную (возможно, пустую) упорядоченную последовательность символов данного алфавита. Вот несколько примеров слов в алфавите ос: (а -» Ь), ) а -1 Ь( ), -»-»-» а -» Ь, -. Ъ. Слово В называется подсловом слова А, если А = CBD, где С и D — некоторые слова, возможно пустые. Определим формулы АВ следующими индукционными правилами. 1. Переменная есть формула. 2. Если А и В есть формулы, то -, А и (А -» В) — формулы. 3. Других формул, кроме построенных по правилам 1, 2, нет. Замечание. Здесь удобно договориться о чтении сложных формул, которые получаются по указанным правилам. Так, формулу -. А будем прочитывать как «не А», или «неверно, что А»; а формулу (А -> В) прочитывать как «из А следует 5», или «если А, то В». Такое прочтение формул не является обязательным. Оно лишь может дать читателям некоторую ориентировку в тех случаях, когда будут формулироваться утверждения о формулах из АВ. В определении для обозначения произвольных формул использовались символы А и В, которых нет в нашем алфавите а. Удобно называть такие новые символы — метасимволами, подчеркивая их особую роль. Если при написании какой-либо формулы были использованы метасимволы, то ее можно рассматривать как схему формулы, считая, что вместо подобного символа может стоять любая формула. Подформулой формулы А называется любое подслово слова А, которое само является формулой. Если при построении формулы А были использованы переменные из набора переменных {хь ..., х„), то часто будем обозначать эту формулу через А(хь ..., х„). Заметим, что при этом в А(хх, ..., хп) 33
можем указывать и фиктивные переменные, т. е. и такие, которые в построении формулы А не участвовали. Для более удобного чтения формул будем использовать вместо круглых скобок и другие виды скобок, например квадратные или фигурные. Формулу, являющуюся какой-либо переменной типа а или отрицанием переменной типа -. а, назовем литералом. Часто литерал будем символически обозначать через га. При этом символ е будет либо пустым словом, либо символом отрицания -,. Ввиду своей простоты литералы обычно называются атомными формулами. Если не детализировать вид метасимвола А, то можно схемы формул А и -IА также называть литералами. Как по выбранному слову определять, является ли оно формулой или нет? Из вышеуказанных примеров слов только первое и последнее являются формулами. Действительно, (а —> Ь) получается по правилу 2 построения формул из переменных а и Ь, которые по правилу 1 сами являются формулами. Аналогично, -. Ъ получается по правилу 2 из переменной Ъ. Для двух других примеров небольшие рассуждения позволят нам убедиться, что эти слова не являются формулами. Так, в слове ) а -1 Ь( ) можно увидеть некоторое несогласование с числом скобок, а в слове -»-»-» а —> Ъ с числом связок. Докажем ряд лемм, которые указывают на некоторые отличительные особенности слов, являющихся формулами; эти результаты позволят во многих случаях довольно быстро отличать формулы от не формул. Рассмотрим любое слово А. Пусть 1[А] означает число «левых» скобок вида ( в слове А, а г [А] — число «правых» скобок вида ) в слове А. Лемма 2.1 (о числе скобок в формуле). Если слово А — формула, то 1[А\ = г[А\; если А есть -, В или (В -> С) для некоторых слов В и С, то/[б] >г[В] и/[С] <г[С]. Доказательство. Первое утверждение леммы очевидно, так как по правилам построения формулы, если какие-то скобки вводятся, то обязательно парой ( и ). Второе утверждение будем доказывать индукцией по числу вхождений логических связок в формулу А. База индукции. Если в формуле А нет логических связок, то это — переменная. Значит, в А нет никаких скобок. Индуктивное предположение. Будем предполагать, что лемма доказана для всех формул, число логических связок в которой не больше п. Индуктивный шаг. Рассмотрим формулу А, число логических связок в которой равно п + 1. Если формула А построена по правилам и имеет вид -, D для некоторой формулы D, то возможен лишь один случай, когда А 34
есть -i В и, следовательно, слова В и D совпадают. В формуле D число логических связок меньше, чем в формуле Л. Тогда 1[В] - = l[D] = r[D] = г[В]. Пусть формула А построена по правилам и имеет вид (Щ>Е) для некоторых формул D и Е, а символ (3 — логическая связка -». По условию, А является словом (ВуС) для некоторых слов В я С (они могут не быть формулами), а символ у также означает логическую связку -». Здесь сознательно обозначаем символ -> в этих двух случаях разными символами, чтобы отличить возможные разные вхождения —> в формулу А. Подсчитывая число скобок в А, получим следующее равенство: 1[А] = 1 + 1[В] + 1[С] = г[В] + г[С] + 1 = г[А]. (1) Если в слове (D$E) символ у стоит левее символа р, то слово В является подсловом формулы D и, следовательно, по индуктивному предположению 1[В] > г[В] (ясно, что в формуле D число логических связок меньше, чем в формуле А). Из равенства (1) следует, что /[С] < г [С]. Если в слове (D$E) символ р стоит правее символа у, то слово С является подсловом формулы Е и, следовательно, по индуктивному предположению /[С] < г [С] (ясно, что в формуле £ число логических связок меньше, чем в формуле А). Из равенства (1) следует, что 1[В] > г [В]. ■ Лемма 2.2 (о двух формулах). Если формула А является началом формулы В, то А и В совпадают. Доказательство. Опять проведем индукцию по числу вхождений логических связок в формулу В. База индукции. Если в формуле В нет логических связок, то это переменная. Тогда и А должна быть переменной; в противном случае она должна начинаться либо с символа -., либо с символа (. Но тогда А не может быть началом В. Индуктивное предположение. Будем предполагать, что лемма доказана для всех формул, число логических связок в которой не больше п. Индуктивный шаг. Рассмотрим формулу В, число логических связок в которой равно п + 1. Если В построена по правилам и имеет вид -i С для некоторой формулы С, то и А можно построить как -. D для некоторой формулы D. Тогда D — начало С. По индуктивному предположению С совпадает с D (ведь формула С имеет логических связок меньше, чем В). Таким образом, А и В совпадают. Пусть В построена по правилам и имеет вид (Ср/)) для некоторых формул С и D (здесь символ р означает логическую связку ->). Тогда формула А как начало формулы В имеет вид (ЕуЕ) для некоторых формул Е и F, а символ у также означает -к 35
Если в слове (C$D) символ у стоит левее символа (3, то формула £ является началом формулы Си, следовательно, по индуктивному предположению (ясно, что в формуле С число логических связок меньше, чем в формуле В) формулы Е и С совпадают. Если в слове (C$D) символ у стоит правее символа р, то формула С является началом формулы Е и, следовательно, по индуктивному предположению (ясно, что в формуле Е число логических связок меньше, чем в формуле В) формулы Ей С совпадают. В обоих случаях С совпадает с Е, а значит, вхождение символа (3 тоже, что и вхождение символа у, a D совпадает с F. Итак, доказали, что формулы А и В совпадают. ■ Лемма 2.3 (о строении формулы). Всякая формула А является либо переменной, либо представима единственным образом в одном из следующих видов: -, В или (В -» С) для некоторых формул В и С. Доказательство легко следует из предыдущих лемм. ■ Как же, пользуясь доказанными результатами, определять, является ли формулой данное слово U1 Прежде всего посмотрим, является ли слово U переменной. Если U — переменная, то U — формула. Если слово U — не переменная, то оно, чтобы было формулой, обязано иметь вид -, Кили (К-» W), где К и W — некоторые формулы. Итак, все дело сведется к проверке, являются ли слова К и Ж(более «короткие», чем слово U) формулами или нет. Вся проблема теперь состоит в нахождении нужного вхождения символа —» в слово U. Перебирая в слове £/все символы -», будем выяснять всякий раз, являются ли слова V и W формулами. По лемме о строении формулы: если (/является формулой, то ситуация, когда V и W — формулы, может случиться лишь однажды; если же U не является формулой, то ситуация, когда V и W — формулы, вообще не произойдет. Этот процесс нахождения нужного вхождения символа —> в слово U можно значительно ускорить, если вести подсчет скобок. Действительно, если U={VxtWx), то, подсчитывая число скобок /[(К,] и /"[(К,] до символа /, будем иметь 1[{V\] = 1 + l[(V\] только в случае, когда t есть нужное нам вхождение символа —>. Теперь определим значение формулы А(хи ..., х„), когда ее переменные Х|, ..., х„ принимают значения аи ..., ап из / = {и, л}. 1. Если А(х) есть переменная х, то А(а) = а. 2. Если А(хи ..., х„) есть ~i5(xb ..., х„), то [и, если В(аи ..., ап) = л; А(аи; ..., ап) = \ [л, если В(аь ..., ап) = и. 3. Если А(хи ..., х„) есть (В(хи ..., х„) -» С(хь ..., х„), то 36
[л, если В(аи ..., а„) = и, а С(аи ..., а„) = л; Л(яь ..., ап) = \ [и — в остальных случаях. Замечание. Логическая связка -. в какой-то степени интерпретирует содержательное «соединение высказываний» — отрицательную частицу «не». Логическая связка -» в какой-то степени моделирует содержательное «соединение высказываний» — союз «если ..., то ...». В дальнейшем введем еще несколько новых логических связок, но они будут выражены как комбинации основных связок -, и —к Пример 2.1. Формулу -,(-,А)) будем писать и проще, опуская скобки, -,-1/1. Она прочитывается так: «неверно, что неверно, что х». Легко видеть, что значения формул —,-,А и А совпадают. Итак, две формулы х и -,-,* реализуют одну и ту же функцию. Это утверждение называется законом двойного отрицания. Пример 2.2. Рассмотрим формулу А(х, у, z) = 1(х -> у) -> -,(z -> -.*)]. Составим для этой формулы так называемую таблицу истинности (табл. 2.1), где будем указывать значение нашей формулы при всевозможных распределениях значений ее переменных. Таблица 2.1 X и и и и л л л л У и и л л и и л л Z и л и л и л и л А(х, у, z) и л и и л л л л Заметим, что в таблице имеется 23 = 8 строчек, соответствующих различным распределениям значений переменных х, у, z- Легко доказать, что для формул, зависящих от и переменных, таких строчек будет 2". Пример 2.3. При каких значениях переменных х, у, z формула А(х, у, z) = [—1 (jc -> у) -» (z -» —i jc)] имеет значение л? Это может быть только, если -,(х -» у) = и, а (г -> ->х) = л. Другими словами, когда (х —> у) = л, и (z —> -ix) = л. «Первое уравнение» имеет решение л; = и, у = л. «Второе уравнение» имеет 37
решение z = и, х = и. Итак, формула ложна только при х = и, у = л, Пример 2.4. Найти значения х, у, z, чтобы {[х-* (у-* z)]-> [(х-> у)-* (х-^> z)]} = л. Имеем (х -» (у -» г)) = и, | (х -» (у -> г)) = и, [(х -» у) -> (х -» г)] = л; [(х -» у) = и, (х -» z) = л; (х -> (у -> г)) = и, (х -» у) = И, X = и, z = л. Если (х -> у) = и и х = и, то у = и. Но при х = у = и, г = л имеем (х -> (у -» г)) = л. Итак, формула ни при каких значениях переменных не принимает значение л. Такие формулы, которые при всех значениях переменных имеют значение и, называются тождественно истинными формулами, или тавтологиями. И наоборот, если формула при всех значениях переменных всегда принимает значение л, то она называется тождественно ложной, или противоречием. Обозначим через Ф множество всех формул АВ. Уместно отметить здесь, что каждый предикат из П реализуется некоторой формулой из Ф (докажем в подразд. 2.2). Алгебраическая система АВ = <Ф;-,,-^> называется алгеброй высказываний. Часто в сигнатуру системы АВ включают две константы и и л, а также некоторые символы для других логических связок, например конъюнкцию & и дизъюнкцию v. Однако формула (х -» х) является тождественно истинной, а формула -> (х -»х) — тождественно ложной, и по этой причине они вполне могут заменить константы. Связки & и v будут введены как сокращения некоторых формул. 2.2. Логические эквивалентности в АВ Вначале введем ряд новых логических связок. Будем обозначать через (х & у) формулу -i (х -» -, у), называть ее конъюнкцией высказываний х и у и читать: «х конъюнкция у», или «х и у». Составим для конъюнкции (х & у) таблицу истинности (табл. 2.2). Как видно из таблицы, конъюнкция (х & у) имеет истинное значение тогда и только тогда, когда оба высказывания х и у имеют истинные значения. 38
Таблица 2.2 X и и л л У и л и л (х&у) и л л л Замечание. Эта логическая связка в какой-то степени интерпретирует содержательное «соединение высказываний» — союз «и». Пример 2.5. Таблица истинности для формулы -, (х & -, у) может быть легко вычислена (табл. 2.3). Таблица 2.3 X и и л л У и л и л -.(х&^у) и л и и Будем обозначать через (х v у) формулу (->х —> у), называть ее дизъюнкцией высказываний хиуи читать: «х дизъюнкция у», или «х или у». Составим для дизъюнкции (х v у) таблицу истинности (табл. 2.4). Таблица 2.4 X и и л л У и л и л (XV у) и и и л Как видно из таблицы, дизъюнкция (х v у) имеет ложное значение тогда и только тогда, когда оба высказывания хну имеют ложные значения. Замечание. Эта логическая связка в какой-то степени интерпретирует содержательное «соединение высказываний» — союз «или». 39
Пример 2.6. Построим таблицу истинности (табл. 2.5) для формулы A = [-,(xvy)&-,x]v(y&-,x). Таблица 2.5 X и и л л У и л и л А л л и и Пример 2.7. Построим таблицы истинности (табл. 2.6) для следующих двух формул: А = (-,х v -,у) и В = [-1 (х & у) V (х & -пу)}. Табл ица 2.6 X и и л л У и л и л А л и и и в л и и и Видим, что хотя строения формул А и В различны, их таблицы истинности совпадают. Это как раз тот случай, о котором говорилось раньше: формулы А и /?дают различные реализации одной и той же функции. Такие формулы будем далее называть эквивалентными. Дадим точное определение. Формулы А(х, у, ..., z) и В(х, у, ..., z) будем называть эквивалентными и обозначать это через А ~ В, если для любых наборов значений переменных х - а, у = Ь, ..., z- с значения формул А{а, Ь, ..., с) и В(а, Ь, ..., с) совпадают. Заметим, что можно говорить об эквивалентности формул А и В, даже если они зависят от разных наборов переменных — надо воспользоваться фиктивными переменными. Приведем наиболее употребительные эквивалентности. 1.x —■ —1 jc (закон двойного отрицания). 2. (х & у) ~ (у & х), (х v у) ~ (у v х) (коммутативность & и v). 3. [х & (у & Z)] ~ [(х & у) & z], [xv (у v z)] ~ [(х v у) V Z] (ассоциативность & и v). Учитывая ассоциативность & и v, можно опускать скобки в формулах, содержащих несколько конъюнкций и дизъюнкций. Например, x&y&z,xvyvzvuvww. 4.\(x8cy)vz]~[(xvz)&(yvZ)],l(xvy)&z~(x&z)v(y&z)) (дистрибутивность v по отношению к &, дистрибутивность & 40
по отношению к v), \(х -» у) -> z] ~ \(х —> z) —> (у -> z)] {самодистрибутивность —>). Первые эквивалентности очень похожи на обычный дистрибутивный (распределительный) закон в арифметике: (а + Ь)с - (а- с) + (Ь- с). Правда, в арифметике сложение не дистрибутивно по отношению к умножению, так как (а ■ Ь) + с = = (а + с) ■ (Ь + с) не является арифметическим тождеством. 5. х & и ~ х, х v и ~ и, х&х~х, xvx~x, х & -I х ~ л (закон противоречия), х v -, х ~ и (закон исключенного третьего). 6. (х —> у) ~ (-■ xv у). Эта очень важная эквивалентность, которая позволяет обходиться в ряде случаев без связки —». А именно, нетрудно доказать, что для всякой формулы А существует эквивалентная ей формула В, не содержащая связки —». Пример 2.8. А = -л {[х -> ->(у -» z)] -» [(х -> у) -> -л х]} ~ , {-, [-л xv (-, yv z) ] v [ -,(-, XV у) v -,х]}. 7. -, (х & у) ~ (-1 х v -1 у), -1 (х v у) ~ (-, х & -I у) (законы де Моргана). Эти эквивалентности позволяют привести любую формулу к такому виду, что символы отрицания -, будут стоять только над переменными (так называемые «тесные» отрицания). Пример 2.9. {[*->-> (у-> z)] -» [(х->у) -»-i*]} ->х~ ,{—,[—, X v -,(—, у v z)\ V [-, (-1 xv у) V -, х]} V X ~ ~ [-1 X V -1 (-■ у V z)] & -1 [-1 (-1 X V у) V -> х]} V X ~ ~ {[-. X V -, (j/& -, z)\ & [(-. х v у) & X]} V X. 8. [(х & у) v х] ~ х, [(х v у) & х] ~ х (законы поглощения). Доказательства всех вышеприведенных эквивалентностей просты, их легко проделать самостоятельно. С помощью эквивалентностей можно преобразовывать формулы, что часто приводит к их значительным упрощениям. В ходе преобразований будем опускать некоторые пары скобок, если это не будет приводить к двусмысленности. Будем в А заменять входящую в нее подформулу В на эквивалентную формулу С; очевидно, что новая формула будет эквивалентна А. Пример 2.10. {х -> [(у -» х) -> -, у]} ->(>>->*)- 1 {-. X V [-1 (-. у V х) V -I у]} v -, у V X ~ ~ {х &-I [-1 (-1 у v х) v -, у]} v -, yv X ~ ~ {х & [(-1 yv х) & у]} v -,у v х ~ 41
~(xv—lyvx)&(—,yvxv—lyvx)&(yv—,yvx)~ ~ (x V -i y) & (-1 у v x) & (и V x) ~ X V -i y. Пример 2.11. Докажем, что Л ~ В тогда и только тогда, когда {А -> В) & (В -» Л) — тождественно истинная формула. 1. Пусть Л ~ 5. Если при некоторых значениях переменных формула А имеет значение а, то такое же значение имеет и формула В. Но тогда значение формулы (А -» й) & (В -»/4) есть и. 2. Если (Л -» 5) & (5 -> Л) — тождественно истинная формула, а формула А при каких-то значениях принимает значение а, то при этих значениях переменных (а —> 5) & (В —> а) = и. И значит, Л имеет значение а. Часто рассматривают и такую связку (х <н» у), как сокращение формулы [(х -4 у) & (у —» х)], и называют ее эквивалентностью, учитывая похожие свойства ^-> и ~. Пример 2.12. Сделаем в формуле А, содержащей только символы связок -л, &, v, следующие преобразования: все символы & заменим символами v, все символы v заменим символами &. Полученную таким путем формулу обозначим через А* и назовем двойственной к формуле А. Закон двойственности. Если А ~ В, то А* ~ В*. Доказательство. Легко заметить, используя законы де Моргана, что А*(х, у, ..., z) - -. [А(-, х, -, у, ..., -, z)]. Тогда, если А ~ В, то А(-, х, -, у, ..., -, z) ~ В(-, х, -, у, ..., -, г), -, [/!(-, х, -л у, ..., -,*)]--, [5Ь ^, -> У, -, -■ г)], Л*(х, у, ..., г) ~ 5*(х, у, ..., z). ■ Делая преобразования формул, будем стремиться, если это возможно, приводить их к какому-либо единообразному виду. Удобными стандартными видами оказываются так называемые нормальные конъюнктивные и дизъюнктивные формы. Рассматривая эти формы, заодно докажем, что всякий логический предикат может быть реализован некоторой формулой логики высказываний. Будем говорить, что формула А является элементарной конъюнкцией, если она есть конъюнкция переменных или их отрицаний и каждая переменная встречается в А не более одного раза. Вот некоторые примеры элементарных конъюнкций: X & ^У& Z, -nX&-,y&-iZ, x&-iy&z&-iu&v. 42
Но формулы х & -. х, х & -1 у & х не являются элементарными конъюнкциями. Дизъюнкцию элементарных конъюнкций называем дизъюнктивной нормальной формой (ДНФ). Пусть формула А(х, у, ..., z) — некоторая элементарная конъюнкция. При каких значениях переменных х, у, ..., z формула А имеет значение и? Ответ прост: придадим тем переменным, которые входят в А без отрицания, значение и, а тем, которые входят в А с отрицанием, значение л. Формула А только при таких значениях имеет значение и. И наоборот, если задано некоторое распределение значений переменных х = а, у - Ь, ..., z - с, где а, Ь, ..., с — это и или л, то можно построить только одну элементарную конъюнкцию В, которая именно при этих значениях переменных имеет значение и. Эта элементарная конъюнкция строится так: те переменные, которые при данном распределении значений имеют значение и, войдут в В без отрицания, а переменные, имеющие значение л, войдут в В с отрицанием. Так построенная элементарная конъюнкция В будет дальше называться соответствующей элементарной конъюнкцией для данного распределения значений переменных. Заметим, что в соответствующей элементарной конъюнкции представлены ровно по разу (с отрицанием или без) все переменные, указанные как переменные формулы В. Пример 2.13.A = x&-^y&z&u&v имеет значение и только при х = и, у - л, z = и, и = Л, V - и. Соответствующей элементарной конъюнкцией В для распределения значений переменных х = и, у = л, z = л будет х & -, у& -. z- Теорема 2.1. Всякий предикат Риз П, не являющийся тождественно ложным, может быть реализован дизъюнкцией элементарных конъюнкций, соответствующих тем распределениям значений переменных, при которых Р имеет значение и. Тождественно ложный предикат реализуется формулой (х & -, х). Доказательство. Действительно, если придадим переменным те значения, при которых Р имеет значение и, то соответствующая этому распределению элементарная конъюнкция также примет значение и, а значит, и вся дизъюнкция примет значение и. Наоборот, если придадим такие значения переменным, при которых / имеет значение л, то, так как соответствующая этому распределению элементарная конъюнкция отсутствует, все другие элементарные конъюнкции будут иметь значение л, а значит, и вся дизъюнкция примет значение л. ■ Итак, из теоремы следует, что всякая не тождественно ложная формула эквивалентна формуле, записанной в совершенной дизъюнктивной нормальной форме (СДНФ), т.е. дизъюнкции элемен- 43
тарных конъюнкций, в которые каждая переменная, указанная в формуле, входит ровно один раз. Для формул имеется и другой стандартный вид — совершенная конъюнктивная нормальная форма (СКНФ), т.е. конъюнкция элементарных дизъюнкций (КНФ), в которые каждая переменная, указанная в формуле, входит ровно один раз. Аналогично доказательству предыдущей теоремы может быть доказан и следующий факт. Теорема 2.2. Всякий предикат />из П, не являющийся тождественно истинным, может быть реализован конъюнкцией элементарных дизъюнкций, соответствующих тем распределениям значений переменных, при которых Р имеет значение л. Тождественно истинный предикат реализуется формулой xv-ix. Пример 2.14. Пусть предикат Р имеет таблицу истинности (табл. 2.7). Таблица 2.7 -Y И И И и л л л л У и и л л и и и л Z и л и л и л и л Р(х,у, Z) и л л и и л л л Тогда СДНФ, реализующая предикат Р, имеет вид А(х,у, z) = (х & у & z) v (х & ^ у& ^ z) vbx&y&z), а СКНФ, реализующая этот же предикат Р, имеет такой вид: В(х, у, z) = (-* xv -, yv z) & (-1 xv у v -у z) & (х v -, yv z) & & (x v -> у V -i z) & (x v у v z)- Пример 2.15. Приведем следующую формулу А к какой-нибудь нормальной форме, преобразовывая ее с помощью эквивалентно- стей: А(х, y,z) = x& [{у &z)^(x& у)} ~ ~ х & [-1 (у & z) v (х & у)] ~ X & [-1 у V -, z v (х & у)] ~ ~ (х & -I у) V (х & -1 z) v (х & у). Итак, привели формулу к ДНФ. 44
Данная форма не является СДНФ: первая и третья элементарные конъюнкции не зависят от переменной z, а вторая — от переменной у. Исправим эти «недостатки»: x&-iy~x&-ly&n~x&-iy&(zv-iz) ~ ~ (х & -< у & z) v (х & -> у & -i z)', х & -> z~ (х& у &^ z) v (х& -1 у & -I z)\ x&y~(x&y&z)v(x&y&-,z); А(х, у, z) ~ (х & -, у & z) v (х & -, у & -, z) v v(x&y&.-,z)v(x&-iy&-iz)v v (x&y&z)v (x&y&^z) ~ ~ (x&y& z) v (x&y&^z)v (x&-,y& z)v (x&->y&-,z). А это уже СДНФ. Необходимо заметить, что СДНФ обычно дает не самую простую запись для рассматриваемой формулы. Так, легко догадаться, что вышерассмотренная формула эквивалентна формуле х. Однако СДНФ очень удобна при рассмотрении целого ряда теоретических вопросов, в которых «длина» формулы не имеет большого значения, здесь предпочтительны ее «однородность» и «стандартность». Пример 2.16. А(х, у, z) = 1(х &у)^(у& z)] -» [(х -> у) -> (z -> у)] ~ , [-, (х & у) v (у & z)] V [-, (-, xv у) V -, z v у\ ~ ~ [(х & у) & -, (у & z)] v \(х & -, у) V -, z v у ] ~ ~ [х & ^ & (-1 j' v -1 г)] v(x&-.j)v-,^vy~ ~ (х & у & ^ у) v (х & у & -, z) v (х & -i у) V -, zv у ~ ~(x&.^y)v-^zvy~(xv-,zvy)&(-,yv-,zvy)~ -(jcvj/v-,^. Это — СКНФ формулы А. Формулу xv у v -, г можно рассматривать и как ДНФ для А. Чтобы ее привести к СДНФ, надо «исправить» каждую элементарную конъюнкцию, состоящую всего из одной переменной вместо трех. Имеем А(х, у, z) ~ xv у v -^ z ~ ~ (х & у & z) v (х & у& ^ z) v (х & -1 у & z) v (х & ^ у& -^ z) V v (х & у& z) v (х & у & -л z) v (-. х& у & z) v (-, х& у& -1 г) v v(x&l'&-iZ)v(-iX&_}'&-.z)v(-,x&-.>'&^z)~ ~ (х & j & z) v (х & у & ^ г) v (jc & -, у & г) v (х & -. у & -1 г) v v(-.x&j&z)v(-,x&v&-i^)v(-ix&-i^&-i^). Это — СНКФ для А. На последнем шаге были удалены повторяющиеся элементарные конъюнкции. 45
2.3. Алгебра предикатов и функций Для формализации различных математических теорий, в частности теорий алгебраических систем, логических средств уровня алгебры высказываний явно недостаточно. На языке алгебры высказываний трудно выразить многие математические факты, выходящие за рамки простых суждений. Например, не удастся на этом языке говорить о таких фактах, где идет речь о «всех предметах с данным свойством». Алгебра предикатов и функций, обогащенная новыми логическими средствами, например кванторами, обладает более сильными возможностями выразительности, чем алгебра высказываний. Основными объектами изучения той части математической логики, которая называется алгеброй предикатов и функций (АПФ) данной сигнатуры, являются предикаты и функции, их символы зафиксированы в некоторой сигнатуре о. Возьмем произвольное непустое множество М и рассмотрим какой-нибудь я-местный предикат на этом множестве Р(хь ..., хп). На этот предикат можно смотреть как на некоторое переменное высказывание, значение истинности которого при определенных значениях переменных ху = аь ..., х„ - а„, где все я, е М, совпадает с Р(аи ..., а„). Обозначим через П(М) множество всех предикатов на множестве М. Теперь пусть 9Я = < М; о > — алгебраическая система сигнатуры а=<а0,аь...; Р*\ ..., Р?>; /Г>-,/,"*>, где а0, аь ... — константные символы; />["', ..., р™1 — предикатные символы; /,"', ..., /s"> — функциональные символы. Напомним, что в о собраны обозначения констант, предикатов и функций с указанием их местностей. Как уже говорилось, будем часто не указывать эти числа-местности там, где из контекста будет ясно их значение. Построим конкретное множество АПФСТ, которое будем называть алгеброй предикатов и функций данной сигнатуры о. Также будем часто писать АПФ, не указывая сигнатуру, считая, что в данном контексте она фиксирована. Рассмотрим алфавит а, состоящий из семи частей а,, а2, а3, 0С4> а5> а6> (*7: а, = {х, у, ..., Х\, у2, z$, •••} — предметные переменные (или просто переменные); щ = {а0, ах, ...} — константные символы из а; аз = {Р?', •••> Лт'} — предикатные символы из о; 46
Щ = {/"'> •••)/"'} — функциональные символы из а; а5 = {-1, -> V} — логические символы (соответственно, отрицание, импликация, квантор всеобщности); щ = {=} — символ равенства; «7 = {(>)} — вспомогательные символы, скобки (конечно, в целях различения будем использовать и другие виды пар скобок, например [,] или {,}). Словами в данном алфавите, как и прежде, назовем конечные упорядоченные последовательности символов из алфавита а. Вот несколько примеров слов в алфавите а: х = а0, VVx, ((Vx ->) и т.д. Будем использовать и метасимволы в словах языка АПФ. Определение формул АПФ будет даваться последовательно, переходя от простых понятий к более сложным: терм, атомная формула, формула, с указанием их свободных и связанных переменных. Прежде всего определим понятие терма сигнатуры а. 1. Предметная переменная или символ константы есть терм. 2. Если t\, t2, ..., t„ — термы и/е о, то f(tu t2, ..., t„) есть терм. 3. Других термов, кроме построенных по правилам 1, 2, нет. Все вхождения переменных в терм считаем свободными; связанных переменных в термах нет. Если в сигнатуре о нет функциональных символов, то термами являются только предметные переменные и константы. Если же, например, в сигнатуру а входят двухместные функциональные символы + и •, тогда термами будут следующие слова: х ■ х, х + х, х + у, х ■ у, (х + у)-(х + z), l(x + x)-(z + х)) + (х■ у) и т.д. Теперь определим атомные формулы сигнатуры о. 1. Если /,, t2, ..., t„ — термы и Р е а, то P(JU t2, ..., /„) есть атомная формула. 2. Если t\, ?2 — термы, то t\ = t2 есть атомная формула. 3. Других атомных формул, кроме построенных по правилам 1, 2, нет. Все вхождения переменных в атомную формулу считаем свободными; связанных переменных в атомных формулах нет. Наконец, дадим определение формулы сигнатуры а. 1. Если А — атомная формула, то она есть формула. 2. Если А — формула, то -.Л есть формула. Если вхождение переменной в формуле А свободно {связано), то соответствующее вхождение этой переменной в —>А остается свободным (соответственно, связанным). Заметим, что одна переменная может иметь в формуле А как свободные, так и связанные вхождения. 47
3. Если An В— формулы, то (А -» В) есть формула. Если какое- то вхождение переменной в А или В свободно {связано), то соответствующее вхождение этой переменной в (А —> В) остается свободным (соответственно, связанным). 4. Если А — формула, то УхА есть формула. Логический символ V называется квантором всеобщности, переход от формулы А к формуле VxА — операцией связывания переменной квантором всеобщности. Выражение Ух А читается, как «для всех х выполняется А». В формуле УхА все вхождения переменной jc считаем связанными квантором У, вхождения остальных переменных в формуле Ух.А носят тот же характер, что и соответствующие вхождения в А. Слово хА будет считаться областью действия данного квантора У. 5. Других формул, кроме построенных по правилам 1—4, нет. Замечание. Ранее было сказано, что в формуле одна переменная может иметь как свободные, так и связанные вхождения. В этих случаях говорят, что произошла коллизия переменных: свободную переменную обозначили тем же символом, что и связанную. Пусть, например, х — некоторая свободная переменная формулы А, и эта же переменная х входит в формулу В, и там она была связана квантором V. Если по п. 3 определения формулы будем строить формулу (А —» В), то как раз и получим типичную коллизию переменной х. Конечно, ничего страшного при этом не произойдет — роли свободных и связанных переменных совершенно различны (это увидим, когда будем интерпретировать формулы на алгебраических системах). Однако коллизия переменных может создать определенные неудобства, заставляя внимательно следить за характером переменной в формуле, которую будем стараться осмыслить при таких интерпретациях. Чтобы избежать подобных коллизий, часто используют прием переобозначения переменных. Проиллюстрируем этот прием на вышеуказанном примере: если переменная х связывается квантором V где-то в формуле В, то заменим х везде в области действия этого квантора на переменную у, которая не использовалась при построении формул Аи В. Сделав несколько таких переобозначений, через конечное число шагов избавимся от всех коллизий переменных. Можно сразу договориться, что во всех случаях при построении сложных формул из более простых делаем необходимые переобозначения переменных так, чтобы в окончательных формулах не было никаких коллизий. Подформулой формулы А называется любое подслово слова А, которое само является формулой. Как и для АВ, можно доказать соответствующие леммы о числе скобок в формуле, о двух формулах и о строении термов и формул в АПФ. В дальнейшем будем обозначать через А(хи х2, ..., х„) формулу, где хь х2, ..., хп — все свободные переменные формулы А (возможно, и фиктивные). Причина, по которой в подобном обозначении 48
не фиксируем связанные переменные, станет понятной, когда будем интерпретировать формулы на алгебраических системах. Теперь определим значение формулы А{хх, ..., х„) на алгебраической системе ОТ = < М; о, когда ее переменные х,, ..., х„ принимают значения Ьъ ..., b„ е М. Символы алфавита а будут интерпретироваться следующим образом: предметные переменные будут принимать в качестве своих значений элементы множества М; константы, предметные и функциональные символы — как соответствующие конкретные константы, предикаты и функции алгебраической системы 9Л. Начнем с определения значений термов. Понятие терма вводилось индуктивно — от коротких термов к более длинным. Также поступим с определением их значений. Пусть /(х,, ..., х„) — терм, построенный из каких-то констант и свободных переменных хь ..., х„\ как известно, связанных переменных в термах нет. Придадим переменным х}, ..., х„ значения Ьи ..., b„ е М. Определяем значение t(bu ..., b„) индуктивно. 1. Если / — константа а,-, то значение / равно ah 2. Если t — переменная х„ то значение t равно Ь,. 3. Если/е с и термы tx, ..., tm имеют значения си ..., ст, то значение терма f(t{, ..., tm) равно /(сь ..., ст). Переходим к определению значения атомной формулы А(хь ..., х„) при значениях Ь{, ..., Ьп ее свободных переменных xh ..., х„. 1. Пусть А{х\, ..., х„) есть атомная формула P(th ..., /,„) для Pea и некоторых термов tb ..., t,„ и пусть при этих значениях переменных термы имеют значения сь ..., ст. Тогда значение формулы А(Ьи ..., Ьп) полагаем равным Р(с{, ..., ст), т.е. и или л. 2. Пусть A(xh ..., х„) есть атомная формула /, = t2 для некоторых термов t\, hw. пусть при этих значениях переменных термы имеют значения с, и с2. Тогда значение формулы А(ЬЬ ..., Ь„) полагаем равным и, если с( = с2, и л — в противном случае. И наконец, определим значение формулы А(хь ..., х„) при значениях Ьь ..., Ь„ее свободных переменных хи ..., х„. 1. Если А(х{, ..., х„) есть атомная формула, то ее значение А(Ь{, ..., Ь„) уже было определено. 2. Если А(х\, ..., х„) есть -. В(хъ ..., хп), то А(Ьи ..., Ь„) = = -пЯ(6„ ..., Ь„). 3. Если А(х{, ..., х„) есть (В(хь ..., х„) —> С(х[ч ..., х„)), то А{Ьи ..., Ьп) = (В(Ьи ..., Ь„) -> С(Ьи ..., Ьп)). 4. Если А(хи ..., х„) есть \/хВ(х, хь ..., х„), то A(bh ..., Z>„) = и, если при всех значениях b е М переменной х значение В(Ь, Ьь ..., Ъ„) = и. 49
Итак, каждая формула А(хи ..., х„) при значениях ее свободных переменных Ьь ..., Ь„на алгебраической системе ОТ принимает одно из значений — и или л. В формулах используем и другие символы для логических операций, такие, как &, v, <-», В и 3!. Будем понимать эти новые метасимволы так. 1. Значение формул (А & В), (A v В) и (А <-» В) вычисляются, как в АВ. 2. Формула ЗхВ(х, хи ..., хп) есть сокращение следующей формулы: —ivX—i£>\X, X], ..., Хп), говорящей о том, что существует значение х, такое, что В(х, Х\, ..., хп). 3. Формула 3\хВ(х, хь ..., хп) есть сокращенная запись следующей формулы: Зх[В(х, х,, ..., х„) & Уу (В(у, хи ..., хп) -* у = х)], говорящей о том, что существует единственное значение х, такое, что В(х, хи ..., хп). Замечание. Сделаем некоторое пояснение о том, почему при вычислении значений формулы придаем значения лишь ее свободным переменным. Это связано с тем, что свободные и связанные переменные играют в формулах совершенно различные роли. Рассмотрим, например, формулу А(у), имеющую вид \/хР(х, у), где Pea. Пусть у = b е М. Если придавать переменной х формулы Р(х, у) различные значения из множества М алгебраической системы ЯЛ, то получим вполне осмысленные утверждения об элементах множества М: />(«,, Ь), Р(т2, Ь), ... . И вот, если при всех значениях те М переменной х имеем Р(т, Ь) = и, то А(Ь) = и. Если же придадим связанной переменной х значение т, то будем получать довольно бессмысленные выражения типа: для всякого элемента т (а он конкретно выбран!) справедливо Р(т, Ь). Связанная переменная перестает играть роль переменной, она лишь служит целям описания той функциональной зависимости от свободных переменных, которую стараемся выразить с помощью формулы. Особый интерес представляют формулы, у которых нет свободных переменных. Такие формулы называем предложениями. На каждой алгебраической системе предложения имеют свое постоянное значение. Если предложение А имеет на алгебраической системе ОТ значение и, то говорят, что оно выполняется на системе ОТ; если же значение предложения А в ОТ равно л, то оно опровергается на системе ОТ. 50
Предложение А называется: тождественно истинным, если оно выполняется на всех системах; выполнимым, если оно выполняется на какой-то системе; опровержимым, если оно опровергается на какой-то системе; тождественно ложным, если оно опровергается на всех системах. Можно также говорить о тождественной истинности формул, содержащих свободные переменные: А(хь ..., х„) — тождественно истинная формула, если для любых значений Ьь ..., Ь„ переменных X], ..., х„ любой системы 9Л значение А(Ьи ..., Ь„) = и. Другими словами, формула VxiVx2 ... Vx„ А(хь ..., х„) должна быть тождественно истинной. Последнее предложение называется замыканием формулы А{х\, ..., х„). Пример 2.17. Попробуем узнать характер следующих предложений: (3xVyP(x, у) -» УуЭхР(х, у)), (Зх<2(х, х, х) -» Vx0(x, х, х)), 3xVy(R(x, х) & -, R(x, у)), Ух\/у(х + у = у + х) по их отношению к выполнимости. Прежде всего, первое предложение (ЗхУуР(х, у) -» УуЗхР(х, у)) является тождественно истинным. Действительно, пусть на какой- то алгебраической системе 9Л = < М; Р> предложение Зх\/уР(х, у) = = и, т.е. существует такой элемент т е М, что Р(т, х) = и для любого х е М. Но тогда, если для любого у придется выбирать х, чтобы Р(х, у) = и, надо просто взять т в качестве значения х. Второе предложение (3xQ(x, х, х) -> \/xQ(x, х, х)) выполняется на алгебраической системе 9Л = < М; Q>, где М= {0), а предикат Q(0, 0, 0) = и; но опровержимо на алгебраической системе 9Л = <М; Q>, где М — обычные натуральные числа, а [и, если х + у = z; Q(x,y,z) = \ [л — в противном случае. Третье предложение 3xVy(R(x, х) & -. R(x, у)) является тождественно ложным, так как не может быть одновременно R(x, х) = = и и R(x, х) = л. И наконец, последнее предложение VxVy(x + у = у + х) выполнимо на обычных натуральных числах с обычным сложением, но опровержимо на множестве квадратных матриц порядка 3, и где х + у понимается как произведение матриц. Обозначим через Ф множество всех формул, а через Пр — множество всех предложений АПФ. Уместно отметить, что не каждый предикат из ЩМ) реализуется некоторой формулой из Ф. Например, на множестве натуральных чисел N имеется континуальное множество одноместных предикатов (т.е. подмножеств множества N), хотя формул с одной свободной переменной (а именно они реализуют одноместные предикаты) всего лишь счетное число. 51
Подобное обстоятельство, принципиально отличающее алгебру высказываний от алгебры предикатов и функций, является источником значительного числа феноменов, встречающихся в различных областях математики. Алгебраическая система АПФ = <Ф; -,, -», V> называется алгеброй предикатов и функций. В сигнатуру системы АПФ не включаем константы и и л, а также логические операции &, v, <-», 3 и 3! в связи с тем, что они могут быть Логика, выражены с помощью подходящих формул через основные сигнатурные символы. связанная с алгебраической системой АПФ, будет основным орудием при изучении различных математических теории. 2.4. Логические эквивалентности в АПФ В АПФ, как и в АВ, различные формулы могут быть реализациями однЬго и того же предиката. Формул|ы А(х, у, ..., z) и В(х, у, ..., z) будем называть эквивалентными ц обозначать через А ~ В, если для любой алгебраической системы 9Л соответствующей сигнатуры с основным множеством М, для любых наборов значений переменных х= а, у = Ь, ..., z = с из Щ значения формул А(а, Ь, ..., с) и В(а, Ь, ..., с) на М совпадают.! И опять можно говорить об эквивалентности формул А и В, даже если они зависят от разных наборов переменных — надо воспользоваться фиктивными переменными. ПонятнЬ, что те эквивалентности, которые были справедливы в АВ, останутся таковыми и в АПФ. Приведем наиболее употребительные эквивалентности, имеющие дело с кванторами. Пример НИИ X, то I (УхА(х) V (УхА(х) & Данные 18. Если формула В не содержит свободных вхожде- В) ~ \/х(А(х) v В); (ЗхА(х) v В) В) ~ Ух(А(х) & В); (ЗхА(х) & В) Зх(А(х) v В); Зх(А(х) & В). Эквивалентности говорят о том, что кванторы можно «выносить» и «распределять» относительно v и &, если один из членов дизъюнкции и конъюнкции не зависит от переменной, которая связывается квантором. Пример 52 19. Имеем (VxA(x) & \fxB(x)) (ЗхА(х) v В(х)) ~ ~ Ух(А(х) & В(х)); Зх(А(х) v В(х)).
Оказывается квантор V можно «выносить» и «распределять» относительно &, а квантор 3 относительно v, даже если оба члена зависят от связываемой переменной. Докажем, например, первую эквивалентность. Возьмем произвольное множество Л/, и пусть левая формула имеет истинное значение на М. Тогда при любом значении х = т формулы А(т) и В(т) имеют истинное значение. Наоборот, если правая формула имеет истинное значение, то и Л(т), и В(т) имеют истинное значение при любом значении т переменной х. Другая эквивалентность доказывается аналогично. Замечание. Здесь уместно дать некоторое «интуитивное» пояснение, которое позволит в какой-то степени осмыслить такое избирательное отношение квантора V по отношению к &, а квантора Э к v. Если множество М- {т, ..., п, ...} и, например, бесконечно, то истинность \/хА(х) означает, что А(т) = и, ..., А(п) = и, ...; другими словами, верна следующая «бесконечная конъюнкция»: А(т) & ... & А(п) & ... Тогда (\/хА(х) & \/хВ(х)) означала бы истинность (А(т) & ... & А(п) & ...) & (В(т) & ... & В(п) & ...), что «естественно» заменяемо на И (от) & В(т)\ & ... & И (л) & В(п)\ & ... Для истинности формулы ЗхА(х) подобное пояснение связайо с «бесконечной дизъюнкцией» А(т) v ... v А(п) v ... Но в АПФ нет формул, имеющих бесконечную длину, и поэтому такой способ доказательства прямо не используется. Пример 2.20. Если оба члена v зависят от связываемой переменной, то квантор V можно только «выносить», но не «распределять». Аналогичное положение с квантором 3 и &: здесь можно «распределять», но не «выносить». А именно легко доказать, что ЦУхЛ(х) v УхВ(х)) -^ Ух(А(х) v В(х))] и [Зх(А(х) & В(х)) -> (ЗхА(х) & ЗхВ(х))] являются тождественно истинными формулами. Однако «обратные» импликации [\/х(А(х) v В(х)) -^ (\/хА(х) v УхВ(х))} и [(ЗхА(х) & ЗхВ(х)) ->Зх(А(х) & В(х))] оказываются опровержимыми формулами. По этой причине квантор 3 нельзя «выносить» из &, а квантор V нельзя «распределять» по V. 53
Проведем рассуждение, которое позволит понять, почему, например, первая из этих импликаций не имеет истинного значения. Пусть М— множество натуральных чисел, формула А{х) означает, что число х — четное, а формула В(х) означает, что число х — нечетное. Тогда формула \/х(А(х) v В(х)) означает верное в арифметике натуральных чисел утверждение о том, что всякое натуральное число или четно, или нечетно. Но формула (VxA(x) v Vx2?(x)) означает неверное утверждение, что всякое натуральное число является четным или же всякое натуральное число является нечетным. Итак, найдена алгебраическая система, где эта формула не выполняется. Для другой импликации подходит следующее рассуждение: хотя существуют некоторое четное число и некоторое нечетное число, но нет такого числа, которое было бы одновременно четным и нечетным. Пример 2.21. Интересная ситуация связана с попыткой «перестановки» кванторов. А именно можно доказать VxVyA(x, у) ~ VyVxA(x, у), ЗхЗуА{х, у) ~ ЗуЗхА(х, у), [Зх\/уЛ{х, у)] -$ \/уЗхА(х, у)] — тождественно истинная формула, но формула [\/уЗхА(х, у) -» Зх\/уА(х, у)] опровержима. Доказательство первых двух эквивалентностей тривиально. Пусть М' — произвольное множество. Тогда формула Зх\/уА(х, у) означает, что в М существует некоторый элемент Ь, такой, что для всех элементов с е М формула А(Ь, с) = и. Тогда, рассматривая формулу \/уЗхА(х, у), для любого элемента с е М будем брать именно указанный элемент Ъ, чтобы А(Ь, с) = и. Будем интерпретировать формулу А(х, у) как предикат у < х на натуральных числах. Тогда, хотя для каждого натурального числа у существует строго большее его число х, но не существует такого натурального числа х, которое строго больше любого числа у. Пример 2.22. Вспоминая, что была введена формула ЗхВ(х, хи ..., хп) как сокращение формулы -i Vx-. В{х, хь ..., х„), легко понять следующие эквивалентности, говорящие о связи -i с кванторами: ->\/хА(х) ~ Зх-,А(х); ^ЗхА(х) ~ Ух^А(х). Пример 2.23. Имеем УхА(х) ~ \/уА(у) и ЗхА(х) ~ ЗуА(у), если переменная у отлична от всех переменных формулы \/хА(х). Используя эквивалентности из приведенных примеров, можно доказать, что всякая формула АПФ эквивалентна формуле, записанной в так называемой пренексной нормальной форме, т. е. имеющей вид Q\x\Qlx2 ■■■ Qkxk^{xU х2, •••> xk)i 54
где Qj — один из кванторов V или 3, а формула А(хи х2, ..., хк) не содержит кванторов. Как конкретно приводить формулы к пренек- сной нормальной форме, будет ясно из нескольких примеров. Пример 2.24. [\Zx3yVz3u А(х, у, z, и) & Vx3y\/z3u В(х, у, z, «)] ~ ~ \/x3y3v\/z3u3w[A(x, у, z, и) & В(х, у, z, w)] (для того чтобы сделать правильные «вынесения», меняем во втором члене конъюнкции переменные: у на v, и на w); [Vx3y\/z3u А(х, у, z, и) v \/x3y\/z3u В{х, у, z, и)] ~ ~ VxVv3y\/zVw3u [А(х, у, z, и) v B(v, у, w, и)] (и здесь меняли переменные х на v, z на w); [\/x3yMz3u А(х, у, z, и) -> \Jx3y\lz3u В(х, у, z, и)] ~ ~ [3xVy3zVu -i А(х, у, z, и) v Vx3yVz3u В(х, у, z, и)] ~ ~ [3xVy3zVu -1 А(х, у, z, и) v Vs3rVv3w B(s, г, v, w)] ~ ~ 3x\/yVs3z3r\lu'Vv3w[A{x, е, z, и) -> B(s, г, v, w)] (а здесь во втором члене дизъюнкции пришлось поменять все переменные). Понятно, что был продемонстрирован лишь один этап приведения формулы к пренексной нормальной форме. Если же формулы А и В еще содержат какие-то кванторы, то подобный процесс необходимо продолжить. Кванторы можно было «выносить» и в другом порядке. Например, эта же формула из последнего примера эквивалентна следующей формуле: 3x\/y3zVuVs3r\/v3w[A(x, е, z, и) -» B(s, г, v, w)]. Здесь «вынесли» кванторы сперва первого члена v, а затем — второго. В таких пренексных формах часто последовательность одноименных кванторов заменяют одним кванторов с несколькими переменными. Например, вместо VxVyVz пишут Vxyz- В некоторых разделах математической логики «сложность» формулы оценивается числом перемен кванторов (переход от одного вида квантора к другому виду) в кванторной «приставке» ее пренексной нормальной формы. Для данной формулы, когда выносили кванторы первым способом, то получили форму, как говорят, типа 3V3V3 с 4 переменами кванторов. Второй способ дал форму типа 3V3V3V3 с 6 переменами. В этом смысле первый способ оказался более «экономным».
ГЛАВА 3 КЛАССИЧЕСКИЕ АЛГЕБРАИЧЕСКИЕ СИСТЕМЫ 3.1. Модель для множеств Теперь укажем еще ряд конкретных алгебраических систем. Это будет способствовать лучшему усвоению понятий, связанных с алгебраическими системами. Когда будут построены логические исчисления, вернемся к этим алгебраическим системам для изучения их на более высоком аксиоматическом уровне. Прежде всего начнем с алгебраической системы для изучения множеств, так как множества будут в дальнейшем служить основным материалом для построения всех классических математических объектов. Рассмотрим некоторую непустую совокупность множеств Set, называемую универсумом. Объектами алгебраической системы будут элементы универсума Set. Сам универсум, согласно нашим договоренностям, не является своим элементом. Такое требование об исключении самого универсума Set из числа своих элементов диктуется желанием избежать ситуаций, приводящих к парадоксу Рассела. С другой стороны, универсум должен быть достаточно обширным: нужно, чтобы множества, которые каким-либо образом собраны из элементов, уже имеющихся в распоряжении множеств (элементов Set), также находились в нашем универсуме. В аксиоматической теории ZF постулируется (утверждается в аксиомах) существование в универсуме таких новых множеств для ряда операций: объединения, множества подмножеств и др. Исключение составляет классическая операция дополнения, так как неаккуратное ее применение может привести к нежелательным результатам. Когда будем вводить операции над множествами, уточним, замкнут ли универсум относительно данных операций, т.е. укажем те множества, которые будем вынуждены включать в универсум. Итак, рассмотрим модель & - < Set; g >, где Set — семейство всех рассматриваемых множеств, т. е. элементов универсума Set, кроме его самого. Объекты из Set будем называть множествами, а двухместный предикат принадлежности х е у будет означать, что множество х входит как элемент в множество у. В сигнатуре этой основной алгебраической системы нет ни констант, ни функций, поэтому и называем ее моделью. Хотя такие 56
образования, как константы и функции, появятся по ходу изучения модели 6. В модели в будем логически определять другие предикаты и функции (операции) над множествами. Учитывая, что сам универсум Set не рассматривается как множество, т.е. не входит в Set, надо проявить определенную бдительность при построении таких функций. Определяя какой-нибудь предикат Р(хь ..., хп) или функцию /(хь ..., хп), аргументами которых являются множества хь ..., х„, часто будем считать, что все множества х{, ..., хп являются элементами уже заданного множества х (здесь нельзя в качестве множества х использовать Set, так как оно не является множеством). В аксиоматической теории ZF для этих целей будет предусмотрена специальная аксиома выделения. Там также будут аксиомы, утверждающие существование в универсуме Set множеств, которые получаются в результате применения некоторых операций к уже имеющимся множествам. Особое множество 0 можно включить в сигнатуру в качестве константы, но тогда получим несколько другую алгебраическую систему (другой сигнатуры), впрочем, принципиально мало отличающуюся от &. Но пустое множество можно логически определить внутри системы 6: возьмем произвольный элемент х универсума Set (конечно, при условии, что сам универсум содержит хотя бы один элемент!) и определим у=0 = \/z(ze х & гФ z), т.е. отберем из уже имеющегося множества хтакие элементы z, что z *■ z, а таких z просто нет. Прокомментируем эту запись: слева от знака з стоит обозначение некоторого предиката (или функции); справа — некоторая формула АПФ сигнатуры а = {е}, у которой число свободных переменных совпадает с местностью указанного предиката; знак = означает определение в АПФ предиката Р(хи ..., х„) (или функции) с помощью указанной формулы. В связи с нашими договоренностями формула Чу (у е х) не выполняется ни для какого х из универсума Set. Сам основной предикат е должен удовлетворять некоторым требованиям, одним из которых является выполнимость (истинность) следующего предложения на модели 6 - < Set; е >, ZFe = Vxyuv[(x ~ у & и = v) -» (х е и <-» у е v)\. Здесь это предложение сознательно обозначено через ZFe, так как для классической аксиоматической теории множеств ZF, которую укажем в подразд. 11.2, данная формула будет избрана в качестве аксиомы. Отметим также, что в дальнейшем для упрощений будем писать х g у вместо -,{х е у), х ф у вместо -i(x = у), одноименные 57
кванторы будем соединять в одну группу. А когда захотим сказать, что данное предложение А имеет истинное значение, будем просто писать само это предложение А, а если А имеет ложное значение, то будем это записывать как -,А. При рассмотрении множеств была договоренность о том, что два множества хну равны, если они состоят из одних и тех же элементов. Это требование можно формализовать с помощью следующего предложения: ZFo6 = Vxy[Vz(z g JC«ze У) <-> x = у]. Предложение ZFo6 также избирается одной из аксиом теории ZF и называется аксиомой объемности (это проясняет выбранное для этой формулы обозначение). Определение отношения включения с формализуется так: х с у = Vz(z е х -> z <= у). Напомним, что если х с у выполняется, то х называется подмножеством у, а у — надмножеством х. В дальнейшем будем свободно использовать в формулах такие метаформулы-обозначения, как, например, х с у, имея в виду, что в том месте, где они встречаются, написана соответствующая этому обозначению формула. Конечно, если возникнет такая необходимость, надо постараться избежать возможной коллизии переменных. Определение строгого включения множеств можно записать так: ха у= (хф у & х ^у). Расшифровывая формулу (х ф у & х с у), т. е. избавляясь от мета- формулы хс^и других сокращений, получим -i(x = у) & \/z{z е х -» z е у). Можно отметить некоторый аналог аксиомы объемности, связанный с с: Vxy(x = JH(XC)'&)'C х)). а также следующие утверждения наивной теории множеств, уже отмеченные ранее: Vx(xcx), \/xyz((x cj>&ycz)-)xcz), : \/xyz((x с у & у с z) -» х а г). Рассмотрим следующее определение: х = Р(у) = \fz{z ехегс)). 58
Оно означает, что в множестве х собраны все подмножества множества у. Одной из аксиом теории ZF будет аксиома степени, или аксиома множества подмножеств, утверждающая существование множества Р( у) для любого множества у: ZFCTen = Vy3lx(x=P(y)). (Напомним, что квантор 3\х означает, что «существует единственный х».) Итак, будем требовать, чтобы универсум Set был замкнут относительно операции выделения подмножеств данного множества: с каждым множеством у элементами Set должны быть и все подмножества множества у. Отметим, что не будем требовать подобной замкнутости относительно надмножеств данного множества. Опишем простейшие операции над множествами. Пересечение. Из двух множеств х и у строим новое множество х п у, называемое пересечением множеств хи у: Z = х n y = \fu[u е г<->(ме х & u е у)], хпу= {и I и е химе у}. Таким образом, элементами множества х п у являются те элементы уже имеющегося множества х, которые принадлежат множеству у. Другими словами, элементами множества х п у являются те элементы и, которые принадлежат обоим множествам хну. Будем считать, что универсум Set с каждыми своими элементами содержит и их пересечение. На диаграмме Венна дважды заштрихованная часть указывает пересечение множеств хну (рис. 3.1). Множества хну называются непересекающимися, если х п у = 0. Для любых множеств х и у легко доказать следующие свойства: ХП0 = 0, хпх = х, если х с у, то х п у = х, хпу = хг\у (коммутативность п), х п (у n z) = (х п у) n z (ассоциативность п). Если даны несколько множеств х, у, z, ■■■, а, Ь, то можем их последовательно попарно пересекать несколькими способами, например: {[(anx)nz\ п [хп (Ьпу)]} п (bп z) (здесь различного вида скобки указывают порядок последовательных пересечений). Указанные свойства (законы, тождества) позволяют при таком последовательном пересечении совсем обойтись Рис. 3.1 59
без скобок (так как но существу от них в этой ситуации ничего не зависит), изменять произвольным образом порядок множеств, не повторять несколько раз одно и то же множество. Так, пример может быть записан короче: хс\ у r\ z<~\ а <~\ Ь. Операцию пересечения двух множеств можно обобщить до операции пересечения элементов непустого множества у: х - п у =\fu\u е х <-> Vi»(v е у -> и е v)\. И снова для таких пересечений справедливы соответствующие законы коммутативности и ассоциативности. В теории ZF доказывается существование и единственность пересечения: \/yz3\x(x = у п z) и \fy[y Ф 0 -» 3!х(х = п у)]. Объединение. Из двух множеств х и у строим новое множество х и у (рис. 3.2), называемое объединением множеств х и у: хи у = {и I и е х или и е у}, Z = хи у = \/и[и е гв(ие xv и е у)]. Таким образом, элементами множества х и у являются все элементы множества х и все элементы множества у, другими словами, те элементы, которые принадлежат хотя бы одному из множеств х и у. На диаграмме Венна заштрихованная часть (см. рис. 3.2) указывает объединение множеств х и у. Не составляют никакого труда доказательства следующих соотношений для любых множеств х и у. XU0 = X, х и х = х, если х с у, то х и у = у, х и у - у и х (коммутативность и), хи(уи£) = (хи_у)иг (ассоциативность и). Те свойства, в которых говорилось о последовательных пересечениях множеств, справедливы и для последовательных объединений множеств. По этим причинам при объединении нескольких множеств также не будем писать скобки для указания порядка объединений, можем менять местами множества и не повторять одно и то же множество. Операцию объединения двух множеств можно обобщить до операции объединения элементов множеств: Рис. 3.2 х = и у = Уи[и е х <-» 3v(v е у & и е и)]. 60
Для таких объединений законы коммутативности и ассоциативности также могут быть соответствующим образом сформулированы. Одной из аксиом теории ZF является аксиома суммы, или объединения, утверждающая существование множества и у для любого множества у и доказывается существование и единственность объединения: Vyz3!x(x = у и z) и Vy3.'x(x = иу). Итак, универсум Set с каждым множеством у должен содержать и множество \jy. Разность и дополнение. Классической разностью х - у множеств х и у называется множество тех элементов множества х, которые не принадлежат множеству у: x-y={z/ Z£ хп z<£ у}- На языке АГТФ эту операцию можно определить так: и = х - у = Vz[z eu<~>(zex&z£ У)]. В тех случаях, когда у е х, разность х-у называется дополнением множества у до множества х и обозначается через (у)'х. В тех случаях, когда множество х ясно из контекста, нижний индекс х часто опускается и пишется просто у': и = у' s и = {у)'х = \/z[z е и <н> (ze х& z£ у)]. В теории ZF доказывается существование и единственность разности и дополнения: Vyz3!x(x = у - z) и Vj/z3!x[x = (у)С]. На диаграмме Венна заштрихованная часть указывает дополнение множества у до множества х (рис. 3.3). Ясно, что дополнение пустого множества 0 до множества х совпадает с самим множеством х, а дополнение множества х до множества х совпадает с пустым множеством: vx[(0)i=х & (х); = 0], vxj [х п (*>;] = 0. Очевидно также, что Vxy [(х^]у = х (закон двойного отрицания). Учитывая, что в разности и допол нении в роли х и у могут выступать толь ко множества, то не можем здесь ис пользовать универсум Set. Рис. 3.3 61
Приведем еще несколько важных тождеств теории множеств. Операция и удовлетворяет дистрибутивному закону по отношению к операции п, а именно \/xyz[{xr.y) u z= (хи z) п (у (J z)]. Доказательство. 1. Пусть и е (хпу)иг; тогда и& хглу или кег. Если и е х n j>, то и е х и ы е у, а значит, ме хигине уиг. Таким образом, ме (хиг)п(з'и^). Если же и е г, тоне хи^иие >> u z. Таким образом, и в этом случае и е (хи z) гл (уи z). 2. Пусть «е(хиг)п(уиг); тогда и е хигиие yut Если и е х и и е у, то и е х гл у, а значит, и е (хпу)иг. Если же м е z, то и е (х п у) и z. ■ Интересно, что и операция п удовлетворяет похожему дистрибутивному закону по отношению к операции и, а именно, имеет место тождество Vxyz[(xu у) r\z=(xn z)u (уп z)]- Доказательство этого тождества вполне аналогично предыдущему. Укажем тождества, называемые законами поглощения: х и (хслу) = х; х n (х и у) = х; х' и (х п у) = х' и у; х' n (х и у) = х' п у; и тождества, называемые законами расширения: (х и у) п (х и у') = х и (х п у) и (j> п у') - X. Здесь, конечно, берутся дополнения до фиксированного множества z, для которого все указанные дополнения определены. Доказательства всех этих тождеств очень просты и поэтому не приводятся. Интересные тождества, в которых указаны свойства дополнения по отношению к объединению и пересечению, называются законами де Моргана и имеют вид \/ху[(хи у)' = х' п у1, \/ху[(хслу)' = х' и у1]. И здесь берутся дополнения до фиксированного множества а, для которого все указанные дополнения определены. Приведем доказательство, например, первого закона де Моргана. Доказательство. 1. Пусть z е (хи у)'; тогда г е аи z£ х и у; т.е. Z е a, z £ х и z <£ у. Но это означает, что z е a, z е х' и г е /. Таким образом, г е а и z е х' п /. 2. Пусть гех'п у'; тогда z е a, z е х' и г е у', т.е. z е а, z <£ хи г £ у. Но это означает, что г е йигг хиу. Таким образом, z е а и ге (хиу)'. ■ С помощью введенных операций можно образовывать сложные выражения, используя различные виды скобок для указания выполнения операций. Например: 62
u = [(z'nx)vy]n{[y'n(xvz)]'v[(xnyYnz]'Y. И здесь берутся дополнения до фиксированного множества а, для которого все указанные дополнения определены. С помощью указанных тождеств теории множеств можно производить различные преобразования формул. Например, для указанной формулы, задающей множество и, проделаем ряд подобных преобразований. Сначала преобразуем дополнение «второй квадратной скобки» формулы: [у' п (х и £)]' = >> u {xvjz)' = j'u (x'nz'). Теперь «обработаем третью квадратную скобку»: [(х г\у)' nz]'=(xn у)" \jz'={xr\y)vjz'. Тогда вся «фигурная скобка» примет вид: у и (х' n z') и (х п у) и z' = У и z\ а ее дополнение: (у <j z'Y = у'г, z. Итак, и = [(z'nx) и у] п у' п z = (z' г> х п у' п z) и (у гл у' r\ z) = 0. Оказывается, так сложно заданное множество и является пустым! 3.2. Операции над множествами Для того чтобы записывать на языке АПФ понятия, связанные с прямыми произведениями, функциями, взаимно-однозначными соответствиями и др., потребуются некоторые вспомогательные понятия. Рассмотрим следующие определения: х = {y} = \fz(zs х^ z = y), М,_элем(х) = 3у(х = {у}У, х = {y,z} =Уи[ие x^>(u = yvu = z)], М2_элем(х) = 3yz(x = {y,z}). Ясно, что формула Мх_Э!КЫ{х) выделяет одноэлементные множества; формула М2.элеы(х) выделяет двухэлементные множества (содержит не более двух элементов). Таким же образом строятся формулы для определения п-элементных множеств, где п — некоторое конкретное натуральное число. Необходимо однако понимать, что в языке АПФ нет прямой возможности записывать утверждения, когда квантор связывает переменную, указывающую число элементов множества. Например, выражение V(« — натуральное число) ЗхЗу^у2 ...Зуп(х = {у\,у2,-,Уп}), 0) 63
с помощью которого хотим сказать фразу «для каждого натурального числа п существует множество, состоящее ровно из п элементов», не является формулой языка АПФ. Во-первых, в формулах кванторы связывают переменные, конкретный вид которых ими не фиксируется. Эту трудность можно обойти в тех случаях, когда умеем формульно определять конкретный вид переменных. Вот, например, если бы имели в АПФ формулу-определение N(x), означающую, что множество х является натуральным числом, то вместо выражений V (х — натуральное число) А(х) и 3(х — натуральное число) В(х) можно было бы использовать формулы Vx[N(x) -^ А(х)] и 3x[N(x)&B(x)]. И такую формулу N(x) позднее в действительности укажем. Вторая трудность более существенна. «Длина» части Зу{3у2... Зу„ выражения (1) является величиной переменной, зависящей от п. А этого делать при построении формул не разрешается. Аналогичное обстоятельство связано с частью х = {уь у2, ■ ■-, у„) выражения (1). По таким причинам приходится определять «-элементные множества для каждого конкретного натурального числа п. Для этого потребуется понятие упорядоченной п-ки (кортежа длины п). Будем определять упорядоченные пары (кортежи длины 2). Для конкретного, но произвольного натурального числа п соответствующее понятие определяется аналогично. Хотя уже можем в языке АПФ говорить о двухэлементных множествах, однако в таких множествах порядок следования элементов не фиксируется. По этой причине имеем {у, z\ - {z, у}- Но хотим рассматривать именно упорядоченные пары, где фиксируется порядок элементов. Этого можно добиться различными способами. Укажем один из них. Назовем множество х упорядоченной парой <у, z >, если х = = {}\ {У, z}}. Следующее основное свойство упорядоченных пар показывает: получаем то, что нужно. Теорема 3.1. \/yzuv[(y = и & z= v) <^> <у, z> = <и, v>]. Доказательство. В одну сторону доказательство очевидно. Пусть теперь <у, z> = <и, v>, т.е. {{у}, {у, z}} = {{«}, {и, v}}. Элемент {у} является элементом {{и\, {и, v}} т.е. {у} = {и} или {у} = {и, v\. В обоих случаях имеем у = и. Но тогда <у, z> = <У, v >. Если z Ф у, то z = v. Если же z - у, то v = у. ■ В теории ZF постулируется существование множества — пары {х, у}, а значит, и существование упорядоченной пары <х, у> для любых множеств х и у. Таким образом, универсум Set с любыми множествами должен содержать и пару, и упорядоченную пару, 64
образованные из этих множеств. Аналогична ситуация и для случая любого натурального п. Прямое произведение. Имея несколько множеств А\, ..., А„, построим новое множество Ах х ... хА„, называемое их прямым произведением. Элементами множества At х ... хАп будут упорядоченные я-ки <а\, ..., а„>, такие, что для каждого индекса / выполняется а,-е А{. А) х ... хА„ - {<й,, ..., а„> /d|6 А], ..., а„ е А„). Итак, «/-я координата» (/-е место) у w-ки <аь ..., а„> из ^ х х ... хА„ заполняется элементами из Д. В этом, как раз, и состоит смысл словосочетания «упорядоченная я-ка». Заметим, что в данном случае удобно обозначать множества- сомножители прописными буквами, а их элементы — строчными. Определения прямых произведений в языке АПФ имеют для каждого конкретного натурального числа п следующий вид: х = ух z = Vw[« е х <-» Зу\У2(у\ е у & v2 е z & u = <vu v2>)]; х = }'i x...xyn = \/u[ue x о 3v[ ...vn(v\ e y{ & ...& vn e yn & u = = <D,,...,f„>)]. Частный случай прямого произведения А{ х ... х А„, когда Ах = ... = А„ = А, называется прямой степенью множества А и обозначается через А". Этот частный случай уже рассматривался, когда вводилось понятие предиката (см. подразд. (. 1). Определения прямых степеней для каждого конкретного натурального числа п имеют следующий вид: Графически прямое произведение Ах В удобно изображать с помощью систем координат (рис. 3.4). Здесь по оси абсцисс располагается множество А, а по оси ординат — множество В. Если хотим отметить расположение множеств А и В по отношению к объемлющему множеству С, то это можно изобразить так, как показано на рис. 3.5. Рис. 3.4 А Рис. 3.5 65
Графическое изображение прямого произведения более чем двух множеств технически более трудно, хотя интуитивно довольно прозрачно. Для прямых произведений в совокупности с другими операциями справедливы следующие тождества: 1) (Л'и Y) х Z= (Хх Z) и (Yx Z); 2) (Хп У) х Z= (Хх Z) п (Yx Z); 3) (Хх Г)'= (Х'х U)\j(Ux У). Докажем второе тождество. Доказательство. 1. Пусть а е (Хп Y) х Z; тогда а = <х, у>, где х е Хп Yh у е Z. Таким образом, хе X, хе Y, у е Z, тогда а = <х, у> е Хх Zvl а = <х, у> е Yx Z, т.е. (Хп Y) х Zc (Хх Z) п (Yx Z). 2. Пусть а = <х, у> е (Хх Z) п (Yx Z), тогда а = <х, у> е Хх Z и а = <х, у> е YxZ. Таким образом, х е X, х е Y, у е Z, тогда х е е Xп Ун у е Z, т.е. а - <х, у> е (Xгл Y) х Z, а значит, (Хх Z) п п(Ух Z) с (Хп У) х Z. Ш Теперь докажем третье тождество. Доказательство. Пусть А — объемлющее множество, для которого все далее указанные дополнения определены. Имеем а = <х, у> е (Хх У)' тогда и только тогда, когда а - <х, у> е А, н а <£ Хх Утогда и только тогда, когда а = <х, у> е А, х е X, или у й Y тогда и только тогда, когда (а <= А, х € X), или (а е А, у г У) тогда и только тогда, когда а е X' х А, или ае^хГ' тогда и только тогда, когда ае (Х'х А) и (Ах В'). ■ Однако для прямого произведения законы коммутативности и ассоциативности не выполняются: легко придумать такие множества X, Y и Z, что Хх Уф УхХ, (Хх У) х Z* Хх (Ух Z) (здесь важную роль как раз играет упорядоченность пар). Однако эти множества эквивалентны (равномощны), а именно: Хх Y~ УхХ, (Хх Y) xZ~ Хх (Ух Z). Определим понятие одноместной функции /типа/: А -» В для множеств А и В: /— функция из А в В, если каждому элементу а из А ставится в соответствие один элемент f(a) из В; 66
Ф1л,в(Л={/^ЛхВ&Уа[аеА^ЗЬ(Ье B&<a,b>ef)}& &Vcde[<c, d>e f&<c, e>e f -=> d - e\\. Ясно, как записать для каждого конкретного натурального числа п определение Ф"А B(f) «-местной функции/типа/: А -> В. Значение функции / при некоторых значениях ее аргументов формализуется следующим образом: х = /л,в(У)=ФлАЛ&<У>х>е/л,в; ' х=/1в(у1,...,уп)^Ф%в(Л&у1еА&...&у„ЕА. Область определения и область значений одноместной функции/определяются так: х = 5(/) ее Зиь{Ф[^Л & Vf[f еш 3Z(z = №)]}, у = р(/) = Зиь{ФиЛ & W[t е у <r> 3z(t = f(z))]}. Подобным образом определяются область значений и область определений для «-местных функций. Множество всех функций /типа f:A -» В, обозначаемое ранее через ВА, определяется следующей формулой: х = ВА=\/у[уех+*ФА,в(у)]- Скажем теперь, что функция f:A->B осуществляет взаимнооднозначное соответствие между множествами А и В: ВОСАВ(Л = {ФаАЛ &ЩЬ е В -> 3\а(<а,Ь>е /)]}. Это позволяет определить эквивалентные (равномощные) множества: А~В = А=В=3/ВОСА,в(Л, где А — класс множеств, равномощных с множеством А. К сожалению, формульно определить понятие мощности множества не сможем, так как это понятие не является множеством. Теорема Кантора может теперь быть записана так: ЧхЫх~Р(х)]}. В подразд. 1.2 с помощью аксиомы выбора было установлено, что множество А бесконечно тогда и только тогда, когда оно равно- мощно некоторому своему подмножеству В с А. Это позволяет определить конечные и бесконечные множества: Конеч {А) = VB[B с А -> -, (В ~ А)], Бесконеч (А) = -. Конеч (А). 67
Однако без аксиомы выбора эти определения не будут адекватно отражать указанные свойства множеств. Теперь постараемся выделить объекты, которые могли бы интерпретироваться как натуральные числа. Имеется несколько способов определения натуральных чисел. Один из популярных способов состоит в следующем: множество 0 будем называть натуральным числом О, множество 0 и {0} будем называть натуральным числом 1, множество 0 и {0} и {0 и {0}} будем называть натуральным числом 2, множество п и {п} будем называть натуральным числом и + 1, Но как на языке теории множеств сказать, что какое-то множество является одним из натуральных чисел указанного вида? В теории множеств развита теория ординалов, основанная на понятии вполне упорядоченных множеств. В теории ординалов натуральные числа определяются. Однако вполне упорядоченные множества будем рассматривать значительно позднее, а теорию ординалов совсем не будем развивать. Так что надо идти другим путем. Определим на множествах одноместный предикат 7\х) = 0 е х & \/у(у е х -» у и {у} е х). В теории ZF имеется аксиома бесконечности, утверждающая, что существует множество, на котором выполняется предикат Т. Таким образом, каждое такое множество х содержит в качестве своих элементов все те множества, которые назвали натуральными числами. Рассмотрим формулы х = со= Т(х) & Уу[Т(у) ->Х£ Я, N(x) s Зу(у = со & х е у). Как видим, практически все основные понятия и результаты наивной теории множеств могут быть высказаны на соответствующем языке для АПФ. В подразд. И.2 будет рассмотрена аксиоматическая теория ZF (теория множеств Цермело —Френкеля), где некоторые выписанные предложения будут объявлены аксиомами, а остальные предложения, выполнимые на модели в = <Set; е >, необходимо выводить (доказывать) из этих аксиом. 3.3. Натуральные числа Другой важнейшей алгебраической системой является арифметика натуральных чисел. 68
Внутри теории множеств были выделены такие объекты, которые можно рассматривать аналогами интуитивных натуральных чисел. Но можно поступить и по-другому, называть натуральными числами какие-либо конкретные множества, а не классы множеств. Назовем множество 0 натуральным числом О, множество {0} = {0} натуральным числом 1, множество {0, {0}} = {0, 1} натуральным числом 2, множество {0, {0}, {0, {0}}} = {0, 1, 2} натуральным числом 3, множество {0, {0}, {0, {0}} ... } = {0, 1, ..., п-\) натуральным числом п и т.д. Конечно, подобное определение носит характер «порочного круга»: чтобы определить натуральное число п, надо выписать п штук множеств. Получается, что для описания числа п надо использовать само это число п\ Эту трудность можно обойти — определим натуральные числа индуктивно. 1. Натуральное число 0 есть множество 0. 2. Если множество А есть натуральное число п, то множество А и {А} есть натуральное число п +1. 3. Других натуральных чисел среди множеств нет. Когда будем строить аксиоматическую теорию натуральных чисел, то там суждения, понятия и другое, связанные с понятием индукции, будут объявлены как одни из первоначальных понятий. Это будет формализоваться в виде соответствующих аксиом индукции. Множество N = {0, 1,2, ...} будет называться множеством натуральных чисел. Можно использовать обозначения конкретных натуральных чисел для обозначения констант в алгебраических системах, связанных с натуральными числами. На множестве натуральных чисел N можно, например, задать следующие одноместные предикаты: „. ч (и, если х — четное число, Ч(х) = \ [л, если х — нечетное число; 1Т¥>/ ч [и, если х — нечетное число, НЧО) = 1 [л, если х — четное число. Имеем 4(5) = л, 4(6) = и, 4(0) = и, НЧ(7) = и, НЧ(138) = л, НЧ(3) = и. 69
Примером двухместного предиката может служить следующий: [и, если у делит нацело л-; [л — в противном случае. Имеем Д(10, 5) = и, Д(7, 8) = л, Д(4,0) = л, Д(0, 13) = и, Д(0, 0) = и (традиционно считаем, что 0 делит нацело лишь число 0). Однако наиболее классическим вариантом алгебраической системы натуральных чисел является так называемая арифметика натуральных чисел: m = <N; +, • >, где на множестве N заданы обычные двухместные операции сложения и умножения. При аксиоматическом построении арифметики натуральных чисел сами эти операции будут задаваться с помощью логических аксиом. Формулы языка для АПФ в этом случае будут рассматриваться в сигнатуре а = <+, ■ >. В арифметике 91 можно из всех натуральных чисел корректно выделять индивидуальные числа посредством какого-либо свойства, например: п = 0 = п + п-п; п = 1 = [п ■ п = п & п ф 0J; п = 2 = Зт(т = \&т + т = п)и т.д. Указанные выше предикаты Ч(х), НЧ(х) и Д(х, у) также определимы в терминах алгебраической системы 91: Ч(х)=3у(х = у + у); H4(x) = 3yz[z = \&x = (y + y) + z]; JX(x,y)=3z(x = z-y). Заметим, что операция вычитания х - у вообще не является функцией, заданной на N, так как, например, не сможем из 5 вычесть 7, оставаясь при этом во множестве N. Аналогично, операция деления х:у также не является функцией, заданной на N. Из-за выбора операций + и • на N все арифметические утверждения, свойства, понятия для обычных натуральных чисел автоматически сохраняют свой смысл и в алгебраической системе 91. Так, в системе 91 можно ввести понятие «сравнения чисел по величине»: x<y = 3z[x+ z = y]. Очевидно, что натуральные числа «по порядку» расположены следующим образом: 0 < 1 < 2 < ... < п < п + 1 < ... 70
Отметим следующие свойства такого порядка на натуральных числах N: 1) в каждом непустом подмножестве М с N имеется наименьшее число (меньше всех других); в частности, существует наименьшее число 0; 2) для каждого числа и, отличного от 0, существует непосредственно предшествующее число т, такое, что не существует чисел между т и п, т.е. {х/ т < х < п) - 0; таким числом является и - 1; 3) для каждого числа п существует непосредственно следующее число т, такое, что между пит других чисел нет, т.е. {х / п < х < < т} = 0; таким числом является п + 1. На основе этих свойств можно доказать для 91 принцип индукции. Теорема 3.2 (принцип индукции). Пусть для подмножества Л/с yV выполняются условия: а) 0 е М; б) с каждым числом п множество М содержит и непосредственно следующее за п число, т.е. если п е М, то п + 1 е М. Тогда множество Мсовпадает со всем множеством N, т.е. М= N. Доказательство. Пусть для М с N выполняются оба условия, указанные в теореме, но Мф N. Тогда существует такое п, что п& М. Выберем из таких чисел п наименьшее п0. Ясно, что п0 ф 0, так как 0 g М, а щ i М. Возьмем для п0 непосредственно предшествующее число т. Так как п0 — наименьшее число, такое, что п0 е М, то те М. По второму свойству должны бы иметь п0 е М, что противоречит выбору п0. ■ Доказывая, что некоторое свойство (подмножество) М справедливо для всех натуральных чисел с помощью метода математической индукции (т.е. используя принцип индукции), вначале рассматривают базу индукции: пытаются доказать, что этим свойством М обладает наименьшее натуральное число 0. Далее делают индуктивное предположение: предполагают, что некоторое (вообще произвольное) число п обладает свойством М. Такая условная гипотеза обычно доставляет много дополнительной информации, которая должна оказать значительную помощь на следующем этапе. А этот этап, называемый индуктивным шагом, состоит в доказательстве того, что в этом случае и число п +1 обладает свойством М. Метод математической индукции применяется и для определений новых понятий для натуральных чисел, и для различных построений. Этот метод оказался чрезвычайно эффективным. Более того, как уже отмечали, когда рассматривается аксиоматическая теория натуральных чисел, индукция в различных ее проявлениях оказывается едва ли не единственным специфическим приемом, характеризующим натуральные числа. 71
о Иногда в качестве базы индукции • • • • " г г rv 012 п удобно выбрать не 0, а какое-то другое конкретное число а. Рис- 3-6 Естественно, если проведем индукцию в таком случае, это будет означать то, что данным свойством обладают все натуральные числа, большие или равные а. Учитывая, что подмножествам произвольного множества соответствуют некоторые одноместные предикаты на этом же множестве, принцип индукции уместно переформулировать на языке предикатов: {Рф) & Vx[ Р(х) -» Р(х + 1)]} -> VzP(z). Укажем на возможную геометрическую интерпретацию натуральных чисел. Возьмем полупрямую с начальной точкой О и некоторым эталоном единичного отрезка на этой полупрямой. Тогда натуральное число п изобразится точкой на данной полупрямой, отстоящей от точки О на расстоянии п единичных отрезков (рис. 3.6). Подробнее логические свойства алгебраической системы 91 = < N; +, ■> будут рассмотрены в подразд. 12.1. 3.4. Целые и рациональные числа Из алгебраической системы 91 = < /V; +, • >, используя переход к фактор-системам, можно построить алгебраические системы £ = < С; +, • > и 91 = </?;+,•> — арифметики целых и рациональных чисел. Целые числа. На множестве N1 пар натуральных чисел определим двухместный предикат R следующим образом: <a, b> R <с, d> тогда и только тогда, когда а + d = Ъ + с. Вначале убедимся, что предикат R — эквивалентность: а) рефлексивность: <а, b> R <а, Ь>, так как а + b = b + а; б) симметричность: < a, b> R < с, d> означает, что а + d = b + с, <с, d> R<a, b> означает, что с + b = d + а; в) транзитивность: если <а, b> R<c, d>, то а + d = b + с, если < с, d> R < е, />, то с + /= d + е, тогда, складывая полученные равенства, получим a + d+c+f=b + c + d+e, т.е. a+f=b + e, а это означает, что <а, b> R <e,f>. Теперь заметим, что <а + к, а> R<b + к, Ь> и <а, а + к> R <Ь, Ъ + к> для любых а, Ьи к. Таким образом, классами эквивалентности по R будут к= [<к, 0>]я= {<а + к, а> / для любого о}, -к= [<0, к>] R = {<а, а + к> / для любого а}. 72
Элементами фактор-множества N2/R будут множества вида к и -к, которые назовем целыми числами. Обозначим множество всех целых чисел через С. Для обозначения конкретных целых чисел не будем в дальнейшем использовать буквы полужирного начертания, а будем обозначать их как и натуральные числа, добавляя знак «-» там, где это необходимо. На множестве целых чисел С можно ввести операции сложения и умножения следующим образом: [<а, Ь>\ + [<с, d>\ = [<а + с, b + d>], [<а, Ь>] ■ [<с, d>] = [<ас + bd, be + ad>]. Проверим, что условия корректности для так введенных операций выполняются. Пусть <а, b> R <аи Ь\> и <с, d> R <сь dx>, т.е. а + Ь\ = Ь + а{ и с + d\ = d + с{. Но тогда, складывая последние равенства, имеем (а + Ь{) + (с + d{) = (b + а,) + (d + с,), т.е. (a + с) + (й[ + d\) = (ax + c,) + (b + d), а это означает, что <a + с, b + d> R <ax + cu b{ + dx>. Для доказательства корректности введенной операции умножения сложим следующие равенства, вытекающие из соотношений а + b) = b + аЛ и с + d\ = d + с,: ас + b\C = be + а\С, bd + atd = ad + b\d, btd + bxC\ = bxc + b\dh ci\C + aidl = «]£/) + a]Cb получим (ас + bd) + (b{cx + aldl) = (be + ad) + (a[cl + b{d\), а это и нужно для выполнения условия корректности. Пример 3.1. 2 + (-3) = -1; (-5) • (-2) = 10. Выбирая из 2 представителя <7, 5>, а из -3 представителя <5, 8> и складывая этих представителей по правилу, получим <12, 13>, который лежит в классе -1. Выбирая из -5 представителя <2, 7>, а из -2 представителя < 2 ,4 > и перемножая этих представителей по правилу, получим <4 + 28, 8 + 14> = <32, 42>, который лежит в классе 10. Кстати, «мистическое» для школьников правило «минус на минус дает плюс» можно подтвердить, вычисляя (-п)(-т) для натуральных чисел пит, так: < 1, п + 1 > • <2, т + 2> = < 1 • 2 + (и + 1) ■ (т + 2), (т + 2) + 2(п + 1) > = < пт + 2л + т + 4, т + 2п + 4 > е пт. 73
На множестве целых чисел С можно ввести понятия «порядок», «сравнение чисел по величине»: [<о, b>) < [<с, d>] тогда и только тогда, когда а + d < b + с. Корректность введенного отношения и его основные свойства легко могут быть проверены читателем. О 1 2 Рис. 3.7 Заметим, что в указанных обозначениях целые числа будут «по порядку» расположены так: ... <-3 < -2 < -1 < 0 < 1 < 2 < 3 <... Интересно графически проследить ход построения этого фактор-множества (рис. 3.7). Кстати, на множестве целых чисел теперь уже осуществимо вычитание, другими словами, уравнение а + х=Ь, где a, b е С, всегда имеет единственное решение: если в а выбрать представителя <аь а2>, а в Ь — представителя <b\, Ь2>, то для целого числа х можно взять, например, представителя <Ь\ + аъ ах + Ь2>. В связи с этим на множестве целых чисел С можно ввести операцию вычитания: [< a, b >] - [< с, d >] = [< а + d, b + о]. Итак, умея только складывать и умножать натуральные числа (но не умея их вычитать!), можно ввести целые числа (положительные, отрицательные и 0). Докажем, что N = C. Расположим все целые числа в определенной последовательности следующим образом: 0, -1, 1, -2, 2, -3, 3, ... Тогда функция /<*) = 0, если х - 0, п, если х = 2 п, -п, если х = 2и -1 осуществляет взаимно-однозначное соответствие между N и С. Укажем на геометрическую интерпретацию целых чисел. Возьмем прямую с отмеченной точкой О и некоторым эталоном единичного отрезка на этой прямой (рис. 3.8). Тогда целое число с изобразится точкой на данной прямой, отстоящей от точки О на рас- 74
стоянии с единичных отрезков вправо О от точки О, если 0 < с, и на расстоянии -* *-2* -* о 1 2 * * * * (-с) единичных отрезков влево от точки О, если с < 0, и точкой 6>, если г = 0. с- 3° Итак, построили алгебраическую систему С = < С; +, ■ >, называемую арифметикой целых чисел. Рациональные числа. На множестве пар целых чисел Сх(С- {0}) (т.е. вторая координата пары не равна 0) определим двухместный предикат Q следующим образом: <а, b> Q <с, d> тогда и только тогда, когда а ■ d = b-c. Вначале убедимся, что предикат Q — эквивалентность: а) рефлексивность: <а, b> Q <а, Ь>, так как а-Ъ = Ь-а; б) симметричность: <а, b> Q <с, d> означает, что a-d = b-c, <с, d> Q <a, b> означает, что c-b = a- d; в) транзитивность: если <a, b> Q <c, d>, то a-d = b-c, если <c, d> Q <e, />, то c-f = d-e. Если c^ 0, то, перемножая полученные равенства, получим a-d-c■/= b- с- d- e, т.е. я•/= 6• e, а это означает, что < a, b> Q < e, f>. Если же с = 0, то тогда a - 0 и е = 0, т. е. и в этом случае а •/= b ■ е. Теперь заметим, что <a- k, b- k> Q <a, b> для любых a и b Ф 0, fc * 0. Таким образом, классами эквивалентности по Q будут a/Ь = £ = [<а, 6>Ш. Элементами фактор-множества Сх(С - {0})/Q будут множества вида а/Ь (или —), которые назовем рациональными числами о или арифметическими дробями. Первый символ а называется числителем дроби, а второй b — знаменателем дроби (вот почему пришлось исключить случай, когда вторая координата пары равна 0). При таких обозначениях а/Ь - а ■ k/b ■ к, это в точности означает известное из арифметики основное свойство дробей о том, что дробь не изменится, если ее числитель и знаменатель умножить на любое число, не равное 0. Обозначим множество рациональных чисел через R. На множестве рациональных чисел R можно подходящим образом ввести операции сложения, вычитания, умножения и деления, а также понятие «сравнение чисел по величине»: а с _ad + bc а с _ ad -be b d bd ' b d bd 75
а с ас а с ad , „ч = —, -: — = — (здесь предполагается, что с ф 0), о d bd b d be а с - < — тогда и только тогда, когда 0 < (bc-ad)bd. b d Итак, умея только складывать, вычитать и умножать целые числа (но не умея делить!), можно ввести рациональные числа. Кстати, на множестве рациональных чисел теперь уже осуществимо деление, другими словами, уравнение а- х=Ь, где a, b е R и а ф 0, всегда имеет единственное решение: если в а выберем представителя <«,, а2>, а в b — представителя <ЬЬ Ь2>, то для рационального числа х можно взять, например, следующего представителя — < й, • а2, ах ■ Ь2>. Изобразим графически ход построения рациональных чисел (рис. 3.9). _ Докажем, что N =С. \Разобьем множество R на ряд непересекающихся конечных подмножеств следующего вида: о ,г0 1 2 ?-1 К, = ' \t't-Y t-2' 1 где / — натуральное число, отличное от 0. Как видим, в множество R, собираем рациональные числа т, такие, что а + b = t. Теперь легко расположить все рациональные числа в последовательность по типу множества натуральных чисел N, что будет означать задание некоторого соответствия/между N и R: лт R~> R-> Однако каждое рациональное число входит в эту последовательность много раз (и даже бесконечное число раз), что не позволяет говорить о взаимной однозначно- - - - 2 ДД -^ сти соответствия / Например, еЛ5, 5*^= 2 2-2 LJMb=z но - = — е Rw и другие /?,, Надо провести определенное отсеивание таких Рис. 3.9 повторов. 76
Возьмем снова Rt и вычеркнем из него такие рациональные числа — , у которых числитель и знаменатель имеют некоторый общий b множитель к ^ 1. Оставшееся множество обозначим через Q,. Вот теперь последовательность Q, Qi Оз задаст взаимно-однозначное соответствие между N и R. Отметим одно любопытное свойство рациональных чисел, свидетельствующее об определенной «плотности» множества R: если рациональные числа Г\ < г2, то существует рациональное число г между ними, т.е. гх < г < гг. Действительно, в качестве г можно взять среднее арифметическое этих чисел J 1. В действитель- 2 ности между г, и г2 имеется бесконечное число рациональных чисел. Заметим, что подобным свойством «плотности» множества N и С с их стандартными порядками не обладают. И наконец, о геометрической интерпретации рациональных чисел. Возьмем снова прямую с отмеченной точкой О и некоторым эталоном е единичного отрезка на этой прямой (рис. 3.10). Как изобразить рациональное число — на этой прямой? Будем считать для простоты, что 0 < а, Ь; для других вариантов легко понять необходимые изменения. Разделим единичный отрезок на Ъ частей — это даст нам новый эталонный отрезок еь нового масштаба. Тогда отложим от точки О вправо а таких новых эталонных отрезков. Это даст точку, интерпретирующую — • о Свойство плотности множества рациональных чисел R может навести на мысль, что точки, интерпретирующие рациональные числа, целиком заполняют всю прямую. Но это не так! Отложим от точки О вправо отрезок ОА, равный по длине гипотенузе прямоугольного треугольника, катеты которого имеют длину эталонного отрезка е. Как известно, длина такой гипотенузы «несоизмерима» с длиной катетов. Таким образом, точка А не может являться интерпретацией никакого рационального числа. На прямой есть «точки-дырки», им не предписано никакого рационального числа. Как увидим в дальнейшем, таких «точек-дырок» намного больше, чем точек для рациональных чисел. Итак, построили алгебраическую систему У\ = < R; +, • >, называемую арифметикой рациональных чисел. -■-! —— е О _1 0 1 2 3 и 3 3 ' Рис. 3.10 А 4 5 3 3 2 77
3.5. Действительные и комплексные числа Как уже видели, в терминах арифметики натуральных чисел можно сконструировать арифметики целых и рациональных чисел. Для конструкции действительных чисел на базе натуральных и даже целых и рациональных чисел таких простых средств, как переход к фактор-системам, явно недостаточно. Необходимо использовать какие-то более сложные конструкции, которые бы в полной мере смогли учесть глубокие различия между так называемыми дискретными объектами (к ним как раз и относятся натуральные, целые и рациональные числа) и непрерывными объектами (это одна из характерных особенностей множества действительных чисел). Здесь огромную роль играют мощностные соображения. Как увидим далее, счетные и континуальные множества резко отличаются друг от друга. Действительные числа. Для построения действительных чисел были придуманы различные конструкции, которые в той или иной степени используют переход от множеств к их подмножествам. Опишем здесь, не очень детально, подход, предложенный Р.Де- декиндом. Пару множеств (разбиение) (Rb R2) множества рациональных чисел R назовем сечением Дедекинда (рис. 3.11), если: 1) Л, и R2 = R; 2) /?, * 0, R2 ф 0, Л, n R2 = 0; 3) /•( е /?ь r2 е R2, то г, < г2. В сечении Дедекинда (/?,, R2) нас будут интересовать следующие возможные варианты стыка множеств Rx и R2\ 1) в /?, имеется наибольшее число г, в R2 нет наименьшего числа (здесь г — стыковочное число разбиения); 2) в Л, нет наибольшего числа, в R2 имеется наименьшее число г (здесь г — стыковочное число разбиения); 3) в Л, нет наибольшего числа, в R2 нет наименьшего числа (здесь у разбиения нет стыковочного числа). Заметим, что мысленно возможный вариант, когда и в У?, имеется наибольшее число гь и в Л2 имеется наименьшее число г2, просто никогда не встретится: из-за плотности R должно найтись число г, такое, что гх < г < г2, но г не может попасть ни в /?,, ни в R2 На первый взгляд кажется, что и третьего случая не бывает. Однако это не так. Рассмотрим, например, множества Rx = {г I г ё R и (г < 0 или г2 < 2)}, R2= {г/ re Ru (0 < ги2 < г2)}. То, что это сечение Дедекинда, легко проверяется. Докажем, что здесь нет Рис. 3.11 стыковочного числа. 78
Пусть r& R\\\ 0 < г < - (ясно, что - е R2). Подберем натуральное число п так, чтобы j < п. Тогда для рационального числа 1 rx = г + - имеем: п ( 1 Y 2 2г 1 , 2г 1 у п) п п~ п п = г2 + < г2 +— < г2 +(2 -г2) = 2. Это означает, что г < /•, и г2 < 2. Итак, число г не является наибольшим числом в R{. Аналогично доказывается, что в R2 нет наименьшего числа. Отсутствие у некоторых разбиений (/?,, R2) множества рациональных чисел Я стыковочных чисел характеризует дискретность множества R. Будем говорить, что сечение Дедекинда (Ru R2) определяет (является) действительное число а. Если для (/?,, R2) имеется стыковочное число г, то а отождествляется с этим рациональным числом г. Если же для (Rb R2) нет стыковочного числа, то действительное число а называется иррациональным числом. Обозначим множество всех действительных чисел через D. Заметим, что в подразд. 1.1 через D обозначалось множество всех бесконечных десятичных дробей. Позднее увидим, что в действительности здесь идет речь об эквивалентных множествах. А одна из теорем, приведенная в подразд. 1.2, говорит о том, что множества Nw Dнеэквивалентны. Таким образом, мощности Х0и с различны. Введем на множестве действительных чисел D понятие «сравнение чисел по величине». Пусть действительное число а определяется разбиением (Ru R2), а действительное число (3 разбиением (Q\, Qi)- Будем считать а < р\ если: 1) аир — рациональные числа и а < (3 на множестве R; 2) а — рациональное число, р — иррациональное число и а е (2ь 3) а — иррациональное число, (3 — рациональное число и р е R2. 4) а — иррациональное число, р — иррациональное число и Л, с 0,. Считаем, что а = Р, если а < Р и р < а. Также будем писать а < Р, если а < р и а ф р. Назовем число а положительным, если 0 < а, и отрицательным, если а < 0. Легко доказать следующие свойства так введенного «порядка» < (именно выполнения таких свойств в дальнейшем будем требовать от общего понятия линейного порядка): а) а < а; 79
б) если а < В и В < а, то а = В; в) если а < В и В < у, то а < у; г) для любых а и (3 выполняется одно из следующих: а < В или а = В, или В < а. Теорема 3.3. Порядок < на множестве D является плотным, т.е. между любыми двумя неравными действительными числами можно вставить некоторое рациональное число (а значит, и бесконечно много таких чисел). Доказательство. Пусть а < В. Рассмотрим возникающие здесь случаи отдельно. 1. Если а и В — рациональные числа, тогда между ними есть рациональное число (из-за плотности множества R). 2. Если а — рациональное число, В — иррациональное число, определяемое разбиением (Q{, Q2), тогда а £ Ql. А так как в Qx нет наибольшего числа, то требуемое рациональное число легко находится. 3. Если а — иррациональное число, определяемое разбиением (/?i, R2), В — рациональное число, тогда Be R2. А так как в R2 нет наименьшего числа, то требуемое рациональное число легко находится. 4. Если а, В — иррациональные числа, определяемые разбиениями (/?i, R2) и (Qi, Q2), тогда Rx с Q{. Возьмем в качестве искомого рационального числа такое г, что г <£. Ru г е (?,. ■ По аналогии с множеством рациональных чисел R можем и на множестве действительных чисел определять сечения Дедекинда. Но теперь уже не может встретиться случай, когда у разбиения нет стыковочных чисел. Такое свойство получило название непрерывности. Теорема 3.4. Множество действительных чисел D непрерывно, т.е. в каждом сечении Дедекинда множества D имеется стыковочное число. Доказательство. Рассмотрим произвольное сечение (D\, D2) на множестве D. Пусть Rx — все рациональные числа из D\, a R2 — все рациональные числа из D2. Понятно, что (Яи R2) — сечение на множестве R. Разберем следующие случаи. 1. Если в /?, есть наибольшее число г, то г и в Dx будет наибольшим. Действительно, пусть г < а и а е D\. Но между г и а можно вставить рациональное число гх. Так как г, £ Du то г, е Rt. 2. Если в R2 есть наименьшее число г, то г и в D2 будет наименьшим. Действительно, пусть В < г и В е D2. Но между В и г можно вставить рациональное число г2. Так как г2в D2, то r2 е R2. 3. Пусть у разбиения (/?ь R2) нет стыковочного числа. Это означает, что сечение (Ru R2) определяет некоторое иррациональное число а. Но само а должно принадлежать одному из D\ или D2. Если а е Dx, то оно там должно быть наибольшим. Пусть а < В и В е Z),. 80
Но между а и (3 можно вставить рацио- \<^i \ нальное число г, которое обязано принадлежать Ru т. е. г < а. Аналогично рассматривается случай, Г] А Г2 ™СХе/)2. ■ рис_з.12 Когда рассматривали геометрическую интерпретацию рациональных чисел, то видели, что на прямой с отмеченными рациональными числами имеются точки-дырки, которым не предписано никаких рациональных чисел. Вот таким точкам и будем предписывать иррациональные числа, тем самым заполняя пустоты. Возьмем на прямой точку А, которой не предписано никакого рационального числа (рис. 3.12). Рассмотрим разбиение (Ru R2), где: ^i = ir\ I r\ е Я и точка, которой предписано гь расположена левее А); Ri = {ri I r2 е R и точка, которой предписано г2, расположена правее А}. Легко видеть, что (Ru R2) — сечение Дедекинда. Оно определяет некоторое иррациональное число а. Вот это действительное число и предпишем точке А. Итак, прямая заполнится действительными числами и из-за непрерывности D при таком заполнении точек-дырок уже не будет. Наши интуитивные представления о линиях предполагают такую непрерывность. В свою очередь, получили взаимно-однозначное соответствие между точками прямой и множеством D. Все вышеизложенное свидетельствует о том, что D = Т, где Г — множество точек на действительной прямой. Часто действительные числа задаются с помощью бесконечных десятичных дробей. При этом на конечную десятичную дробь можно смотреть как на бесконечную периодическую дробь, у которой период равен (0). Покажем на примере, как реализуется такое представление. Пример 3.2. Возьмем действительное число а, определяемое разбиением (Ru R2), где Rx={r / гв R и (г < 0 или г2 < 2)}; R2= {г I re Rn (0 < г и 2 < г2)}. Вначале заметим, что 12= 1 < 2, но 2 < 22. Таким образом, 1 е Ru 2 е R2. Будем считать, что целая часть числа а равна 1, а само число а= 1, ... Рассмотрим ряд рациональных чисел: 1,0; 1,1; 1,2; 1,3; 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0 (здесь просто разбили отрезок [1, 2) на десять равных частей в соответствии с тем, что имеем дело с десятичными дробями). 81
Возводя их в квадрат, увидим, что 1,4 е Ru 1,5 г R2. Будем считать, что первый знак после запятой у числа а равен 4, а само число <х= 1,4... Чтобы выявить второй знак после запятой у числа а, рассмотрим ряд чисел: 1,40; 1,41; 1,42; 1,43; 1,44; 1,45; 1,46; 1,47; 1,48; 1,49; 1,50 (и здесь разбиваем отрезок [1,4; 1,5] на десять частей). Снова получаем 1,41 g Ru 1,42 г R2. Тогда второй знак после запятой у числа а считаем равным 1, а само число а = 1,41 ... Продолжая этот процесс далее, будем получать все больше и больше знаков после запятой у числа а. В итоге получим а= 1,41421356... Эта бесконечная десятичная дробь и будет представлять действительное число, которое, естественно, обозначать через V2. Получающиеся по ходу действия рациональные числа 1; 1,4; 1,41; ... будем называть приближениями числа а по недостатку с точностью до соответствующего знака после запятой; а числа 2; 1,5; 1,42; ... — приближениями числа а по избытку с точностью до соответствующего знака после запятой. При подобной интерпретации действительных чисел десятичными дробями может встретиться одна неприятность, которая может поставить под сомнение взаимную однозначность конструируемого соответствия. Вот, что может случиться. Пусть приближения некоторого числа а по недостатку таковы: 1; 1,9; 1,99; 1,999;..., а приближения по избытку: 2; 2,0; 2,00; 2,000; ... Это просто означает, что действительное число 2 имеет два представления в виде десятичных дробей: 1,(9) (число 9 в периоде) и 2,(0) (число 0 в периоде). Но таких чисел не так много — это обязательно рациональные числа, так как их дроби — периодические. Когда будем изучать арифметику кардинальных чисел, научимся избавляться от подобных повторов, если их счетное число. Часто действительные числа представляют не десятичными дробями, а дробями по какому-нибудь другому основанию. Например, если бы избрали представление посредством двоичных дробей, то в саму конструкцию надо внести минимальные измене - 82
ния: там, где дробим отрезки на 10 час- О тей, надо это делать на 2 части. Само чис- / \\ч ло а теперь будет представляться в виде /' \ \ «1А \ Х«2 а = Ооо, ... а„, Ьф2 -, / х\ L 1 ^ где все числа a,, bj равны 0 или 1. Pi /W Рг Постараемся установить взаимно-од- „ „ нозначные соответствия между множеством действительных чисел D и некоторыми другими множествами. Назовем интервалом множество ((Х|, а2) = {х / х е D и ос, < х < а2}, отрезком множество [аь а2] = {х / х е D и щ < х < а2}. Если хотим указать отрезок, но не учитывать какого-либо его конца, то будем соответствующую этому концу квадратную скобку заменять на круглую и в том случае называть данное множество полуотрезком (или полуинтервалом). Если, например, написано [а,, °°), то это множество означает полуось {х/ х е D и а, < х]. Если не указываются оба конца отрезка, то получаем интервал и обе скобки будут круглыми. Другие подобные обозначения понимаются аналогично. В связи с эквивалентностью множества построенных действительных чисел с множеством точек на действительной прямой все введенные понятия, такие, как отрезок, интервал и др., для чисел из D совпадают с соответстующими понятиями, которые обычно используются при рассмотрении действительной прямой. Теперь докажем, что любые два непустых интервала (аь а2) и (Рь Рг) равномощны. Взаимно-однозначное соответствие между этими интервалами устанавливается так (рис. 3.13): проектируем из точки О каждую точку х интервала (ось ос2), образом будет точка fix) интервала (р,, р2). Так как отрезок [ось ос2] и полуотрезки (ссь ос2] и [ось ос2) отличаются от интервала (аь а2) лишь «концами» oci и а2, то (а,, а2) ~ (аь а2] ~ [а,, а2) ~ [а,, а2]. Эти эквивалентности сохраняются, если один из концов есть °о, так как, например: (а,, «.) = (а,, п) и [п, п + 1) и ..., где п — некоторое натуральное число, большее ot|. 83
Наконец, взаимно-однозначное соответствие между интерва- ( к тс^ лом 2 и D устанавливается с помощью тригонометрической функции tgx. Из всего вышеизложенного следует, что D равномощно любым непустым интервалам, полуотрезкам, полуосям и отрезкам действительной прямой. Учитывая, что [0, 1] ~ Д можно установить взаимно-однозначное соответствие множества D с множеством P(N), множеством всех подмножеств множества N. Возьмем любое ос е [0, 1], записанное в виде двоичной дроби а = 0,101 001... Поставим этому числу в соответствие подмножество Аа с N, определенное так: пе Аа тогда и только тогда, когда и-й разряд после запятой у числа а равен 1. Итак, имеем D ~ 2N. Рассмотрим еще одно соотношение. Возьмем D0 = Dx = [0, 1]. Тогда D0x Dx отождествляется с точками квадрата (рис. 3.14). Если даны два действительных числа а - 0, аха2... и Р = 0, bxb2 ... из отрезка [0, 1], то поставим паре <а, (3> в соответствие действительное число у = 0, ахЪха2Ъ2 ... Ясно, что так получаем взаимно-однозначное соответствие, так как, имея какое-либо действительное число у= 0, схс2с3с4 ..., можно восстановить соответствующую этому числу пару <ос, р>, где а = 0, схс?, ... и р = 0, с2сА ... . Итак, имеем D2 ~ D. Задание действительных чисел с помощью сечений Дедекинда позволяет очень естественно ввести операции сложения и умножения, а по ним и операции вычитания и деления на множестве D. Пусть сечения (Rb R2) и (Qx, Q2) определяют действительные числа аир. Суммой а + Р назовем действительное число, определяемое сечением (Sx, S2), у которого Sx - {г I существуют гх е Rx и r2 е Qx, <0,0> 1 Рис. 3.14 такие, что г = гх + г2). 84
Для определения произведения а ■ (5, когда 0 < а, р\, будем строить его сечение (Ти Т2) так: Г) = {г / существуют г, е /?| и r2 е Qu такие, что г- г{- г2). В случаях, когда хотя бы один сомножитель является отрицательным, надо пользоваться обычными арифметическими соглашениями: «минус на плюс дает минус» и «минус на минус дает плюс». Многие арифметические законы для действительных чисел теперь могут быть без труда доказаны. Алгебраическую систему 2) = < D; +, • > называем арифметикой действительных чисел. В соответствующем месте укажем систему аксиом для логической теории действительных чисел. Комплексные числа. Алгебраическую систему & = <D2; +, •> назовем арифметикой комплексных чисел, а пары <а, Ь> — комплексными числами, если на множестве пар действительных чисел операции + и • таковы: <a, b> + <с, d> - <а + с, b + d>, <а, b>- <с, d> = <ас - bd, be + ad>. Рассмотрим комплексные числа вида < а, О >. Такого вида комплексные числа относительно сумм и произведений чисел ведут себя в точности как обычные действительные числа: < а, 0 > + < с, 0 > = < а + с, 0 >, < а, 0 > • < с, 0 > = < ас, 0 >, поэтому такие числа <а, 0> среди комплексных чисел будем обозначать просто как действительное число а. Комплексное число < 0, 1 > играет особую роль, оно называется мнимой единицей и имеет в математике классическое обозначение /. Если посчитаем следующее выражение а + / • Ь, то, учитывая введенные обозначения, получим а + /• b = <а, 0> + <0, \><Ь, 0> = <а, 0> + <О, Ь> = <а, Ь>. Итак, каждое комплексное число <а, Ь> представимо в виде а + /'• Ь, где а, Ь — действительные числа, а / — мнимая единица. Кстати, Р = <0, 1>-<0, 1 > = <-1, 0> = -1. Для геометрической интерпретации комплексных чисел рассмотрим декар- тову систему координат на плоскости (рис. 3.15). >Ч -*Т (а,Ь) Рис. 3.15 85
Комплексное число <а, b> изображается точкой плоскости с координатами {а, Ь). Здесь по оси абсцисс х располагается первая координата а, а по оси ординат у — вторая координата Ь. Из доказанного ранее имеем К ~ D2 ~ D. 3.6. Арифметика кардинальных чисел Построим одну любопытную алгебраическую систему, применив к модели теории множеств & = <Set; е > факторизацию, т.е. перейдем к некоторой фактор-системе (естественно ее называть фактор-моделью). Напомним, что кардинальными числами назывались классы эквивалентных (равномощных) множеств. Рассмотрим семейство Card кардинальных чисел, получающееся как фактор-множество на семействе всех рассматриваемых множеств. Как известно, понятие мощности корректно по отношению к предикату е, т.е не зависит от выбора представителя в классах эквивалентных множеств этой мощности: В е А тогда и только тогда, когда As В. На множестве кардинальных чисел Card введем следующее отношение порядка: m < п тогда и только тогда, когда существуют множества А, В и/?, с В, такие, что А = т, В = п, и А ~ Ви другими словами, множество А эквивалентно некоторому подмножеству 5, множества В (рис. 3.16). Тогда пишем m < п, если m < п, но m Ф п. Проверим независимость (корректность) так введенного отношения от выбора множеств-представителей изданных мощностей, другими словами, докажем, что если А = С, В = D и А < В, то С < D. Рис. 3.16 Рис. 3.17 86
Действительно, если функция/осу- С ... АА Аъ Аг Ах Ап ществляет взаимно-однозначное coot- | i i i i =u ветствие между Ли B{q В, функция g — между В и Д функция h — между С и Рис. 3.18 А, то функция s = gfh осуществляет взаимно-однозначное соответствие между множествами Си D, = = {g(x)\xe Я,} ей (рис. 3.17). Введенное отношение < на кардинальных числах обладает всеми свойствами, которые обычно требуются от отношения частичного порядка. Рефлексивность (т < т) и транзитивность (если m < п и п < р, то т < р) очевидны. Доказательство свойства антисимметричности более сложно и составляет содержание следующей теоремы. Теорема 3.5 (теорема Кантора— Бернштейна). Если m < п и n < т, то т = п. Доказательство. Пусть А0 =т, Во = п. Пусть функция/осуществляет взаимно-однозначное соответствие между множествами А0 и fl,c В0, а функция g — между множествами В0 и А - gB0 с А0. Обозначим через Ап+2 = gfAn, а также С = П А (рис. 3.18). Ясно, что ,6,v (Ао - А) ~ (А2 - А) ~ (А4 - А5) ~ ... ~ (А2п - А2п+У) ~ ... и (А - А2) ~ Из - А) ~ (А - А6) ~ ... ~ (Л2я+1 - А2п+2) ... Множества А0 и А можно представить в следующих видах: А0 = (А0 - А^ и (А2 - А3) и (А, - А) ^ - и и (А - А2) и Из - А4) и И5 - А) ^ ••• ^ С; А = (А2 - А) и И4 - А) и (А - А) и - и и И, - А) и (А* - А) и (As - А) и ••• и С. Из этих двух представлений и обнаруженных эквивалентностей видим, что Ао ~ А- ■ Итак, введенное на кардинальных числах отношение < задает частичный порядок. В действительности, отношение < является линейным порядком и даже полным порядком (определения частичных, линейных и полных порядков будут даны в подразд. 4.1, 4.2). Теорема 3.6 {закон трихотомии). Для любых кардинальных чисел тип справедливо ровно одно из трех (отсюда слово «трихотомия») соотношений m < п или m = п или п < т. Доказательство не может быть проведено без принятия принципа (аксиомы) выбора, а значит, и без теоремы Цермело, которые обсудим позднее. Поэтому пока опустим это доказательство. 87
Для трех видов специальных кардинальных чисел справедливы следующие неравенства: О < 1 < ... < п < ... < Х0 < с, доказательства которых, по существу, уже проводили. То, что п < Х0, вытекает из следующего рассуждения. Пусть функция/осуществляет взаимно-однозначное соответствие между множествами 7V и N„ для некоторого п. Рассмотрим множество /4 = {/(0), /(1), ..., f(n - 1)}. Ясно, что любое натуральное число т £ А не может служить значением функции/ и поэтому /не является взаимно-однозначным соответствием. То, что Х0< с, следует из неэквивалентности множеств N и D. Доказанный факт (правда, с использованием аксиомы выбора), что из всякого бесконечного множества можно выделить счетное подмножество, говорит о том, что Х0 является наименьшим среди бесконечных кардинальных чисел. Вопрос о существовании кардинального числа между К0 и с оказался довольно трудным. Гипотеза континуума, поставленная Г. Кантором, утверждает, что таких промежуточных кардинальных чисел не существует. Эту проблему удалось полностью решить только в терминах аксиоматических теорий. А именно, в 1936 г. К. Гедель доказал, что если аксиоматическая теория ZF непротиворечива, то, добавляя к ней в качестве аксиомы гипотезу континуума, получим снова непротиворечивую теорию. В 1963 г. П. Коэн доказал, что если аксиоматическая теория ZF непротиворечива, то, добавляя к ней в качестве аксиомы отрицание гипотезы континуума, получим снова непротиворечивую теорию. Тем самым оказывается, что эта гипотеза полностью независима от аксиом множеств ZF. На множестве кардинальных чисел Card можно ввести аналоги арифметических операций — сложение, умножение и возведение в степень. Сложение. Кардинальное число m называется суммой кардинальных чисел п, и п2 и обозначается через п, + п2, если каждое множество мощности m эквивалентно объединению двух непересекающихся множеств мощностей п, и п2. Аналогично, кардинальное число m называется суммой кардинальных чисел п, (/ е /) и обозначается через ^п, , если каждое множество мощности m рав- номощно U А, где Ai = п, и множества А, попарно не пересека- /е/ ются. Сложение кардинальных чисел обладает обычными свойствами коммутативности и ассоциативности: П, + П2 = П2+ ГЦ, п, + (п2 + п3) = (п, + п2) + п3. 88
Пример 3.3. 2 + 3 = 5. Пусть А = {аи а2}, В = {/>,, b2, Ь3} и А п В = 0. Тогда А<и В = {я,, о2, bu b2, b3}. Пример 3.4. n + X0= х(ъ гДе n — конечное кардинальное число. Пусть А = {аь ..., а„}, В = {Ь0, Ьи Ь2, ...} и А п В = 0. Тогда A\j В = {я,, ..., а„, Ь0, Ьи Ьъ ...} = {cQ, с,, ..., с„_,, с„, ...}. Пример 3.5. N0 + N0= К0. Пусть /1 = {я0, а,, я2, —Ь -# = {b0, bu Ь2, ...} и A n 5 = 0. Тогда Л и 5= {я0, 60, о,, А,, а2, Ь2, ...}. Пример 3.6. Х0 + хо + ••• - хо- 4 v ' Пусть х« Л) = {%Ъ floi> fl02> •••}> А = {аю, аи, а,2, ...}, А2 = {а20, а2х, а22, ...}, и множества Д попарно не пересекаются. Тогда U А-, = {а00, аои я,о, Щ)Ъ о,,, а20, ...}. Пример 3.7. Х0+ m = m> гдет — бесконечное кардинальное число. Пусть А = {а0, аь а2, ...} и В = т. Выделим в В некоторое счетное подмножество С = {с0, сь с2, ■■■}■ Между множествами А и С и С можно установить взаимно-однозначное соответствие с помощью некоторой функции / Тогда функция [х, еслихе В -С; [f(x), если х е А и С устанавливает взаимно-однозначное соответствие между Ви Ви А. Как уже отмечалось, выделение счетного подмножества требует применения принципа выбора. Таким образом, и этот результат носит относительный характер. Пример 3.8. с + с = с. Имеем [0, 1) и [1, 2] ~ [0, 2]. Умножение. Кардинальное число m называется произведением кардинальных чисел п, и п2 и обозначается через п, • п2, если каждое множество мощности m равномощно прямому произведению двух множеств А и В, где А = П| и В = п2. Аналогично, кардинальное число m называется произведением кардинальных чисел п, (/' е /) 89
и обозначается через J^n,, если каждое множество мощности m /е/ _ эквивалентно множеству \\Ah где Л, = п,. fe/ Умножение кардинальных чисел обладает обычными свойствами коммутативности, ассоциативности и дистрибутивности по отношению к сложению: п, -п2= п2-п,, п,-(п2-п3) = (n1-n2)-n3, п, • (п2 + п3) = (п, • п2) + (п, • п3). Пример 3.9. 2-3 = 6. Пусть А = {а,, а2}, В = {bh b2, b3}. Тогда АхВ = {<аь bt>, <аи b2>, <ah b3>, <а2, b\>, <а2, b2>, <а2, b3>}. Пример 3.10. п • Х0- х(ъ гДе п — конечное кардинальное число. Пусть А = {аи ..., а„}, В = {Ь0, Ьь Ьъ ...}. Тогда А х В = ({о,} х В) и (Ш х В) и ... и ({й„} х В). Таким образом, п • К0 = N0 + К0 + •••+ **о = ^о- Пример 3.11. X Q • К 0 = X 0. Пусть А = {а0, аь аъ ...}, В = {b0, bu Ьъ ...}. Тогда AxB = \J{ai}xB. /е/ Таким образом, Х0 ■ Х0 = Х0 + Х0 + ... = Х0. ■> v ' So Пример 3.12. X 0 • с = с. Обозначим через Д• = Dx {/}. Тогда А,- [0, 1), А~ [1,2), ... \J(Dx{i})=[0,oo). Пример 3.13. с • с = с. Это следует из доказательства того, что D2 ~ D. Итак, построили алгебраическую систему Я = < Card; +, • >, называемую арифметикой кардинальных чисел. Возведение в степень. В алгебраической системе Я можно определить и операцию возведения в степень. Кардинальное число m называется степенью кардинальных чисел п и р и обозначается через пр, если каждое множество мощности m эквивалентно множеству функций типа/: В —> А, где А = п и В = р. 90
Для операции возведения в степень кардинальных чисел многие стандартные свойства арифметического возведения в степень справедливы. Например, т"+р = т".тр, (т-п)р = тр-пр, (тп)р= тпр. Теорема 3.7. 2А =Р{А). Доказательство. Действительно, функцию типа/:Л -» {а, Ь) можно отождествить с подмножеством В - {х | х е A, f(x) = а} множества А. ■ Теорема 3.8 (теорема Кантора). Для любой мощности m справедливо строгое неравенство m < 2m. Доказательство. Пусть А = т. Как видели, 2т = Р(А). То, что m < 2m, очевидно, так как А эквивалентно множеству одноэлементных подмножеств множества А. Но уже было доказано, что не существует взаимно-однозначного соответствия между А и Р(А). ш Все приведенные соотношения позволяют составить некоторую шкалу кардинальных чисел: О < 1 < 2 <...<«<...< Х0 < ...< с = 2К°< ... < m < ... < 2m < ..., причем в наивной теории множеств неизвестно, что находится между m и 2т. Если же рассматривать аксиоматическую теорию ZF, то в этих отрезках могут находиться различные варианты кардинальных чисел; это зависит от того, какие дополнительные аксиомы добавляем к аксиомам теории ZF.
ГЛАВА 4 СИСТЕМЫ ИЗ ОБЩЕЙ АЛГЕБРЫ И ГЕОМЕТРИИ 4.1. Частичные порядки Чрезвычайно популярным в математике двухместным отношением является частичный порядок. Ранее уже вводились отношения порядка на натуральных, целых, рациональных, действительных и кардинальных числах. Для этих отношений проверялась выполнимость некоторых условий, которые требуются для отношения частичного порядка. Теперь рассмотрим модель Щ - < М; R > с одним двухместным предикатом /?и назовем ее частично упорядоченным множеством, а сам предикат — частичным порядком, если для любых х, у, z е А выполняются следующие условия: 1) х R х (рефлексивность); 2) если х R у к у R х, то х - у (антисимметричность); 3) если х R у я у R z, то х R z (транзитивность). Наиболее характерным частичным порядком является отношение < «меньше или равно по величине» на множестве натуральных чисел N По этой причине в общем случае предикат частичного порядка на произвольном множестве А чаще всего так и обозначают символом <, хотя он совсем может быть не похожим на сравнение чисел по величине. Если а < b и а ф Ъ, то используют хорошо знакомый символ строгого неравенства <. Частичный порядок на множестве А можно задавать и с помощью отношения <, если отношение (х < у или х = у) удовлетворяет условиям рефлексивности, антисимметричности и транзитивности. Например, зададим на N следующее отношение порядка: УУ, = {... < 3 < 2 < I < 0} (здесь указываем порядок с помощью отношения < вместо исходного <, который, очевидно, является частичным порядком). Сознательно обозначим это множество натуральных чисел через N{ с тем, чтобы отметить отличие данного частичного порядка от стандартного. Дадим еще несколько примеров. Стандартный порядок на множестве целых чисел таков: С = {... <-3<-2<-1<0<1<2< < 3 < ...}. Упорядочим, т.е. зададим частичный порядок этого же множества целых чисел С другим образом: С, = {0 < 1 < -1 < 2 < -2 < 3 < -3 < ...} 92
(здесь С, — множество целых чисел С, но с другим частичным порядком). Пусть С2 — снова множество целых чисел С, на котором частичный порядок R задан так: х R у тогда и только тогда, когда | х \ < \ у | (здесь | л: | обозначает операцию взятия абсолютной величины целого числа х). Типичным частичным порядком является отношение включения с, заданное на множестве всех подмножеств Р(А) произвольного множества А. Действительно, для любых подмножеств В, С, D множества А выполняются свойства: 1) 5с В; 2) если йс Си Cq В, то В= С; 3) если ВсСиСсДтоВсО. Графически частично упорядоченные множества часто изображают с помощью так называемых графов (т. е. фигур, состоящих из вершин и ребер), стараясь соблюдать следующие требования: а) вершины графа означают элементы самого множества; б) если х R у, то вершину х рисуют несколько пониже вершины у и соединяют эти вершины ребром; в) если х R у, а у R г, то, проводя ребра от вершины х к вершине у и от вершины у к вершине z, можно «сэкономить» на ребрах (из-за транзитивности R) — не соединять вершину х с вершиной z, считая, что от х можно «пройти» к z по имеющимся ребрам с «транзитом» в вершине у. На рис. 4.1 представлен граф Г, на котором а < с, а < d, b < g и т.д. Однако элементы end несравнимы между собой, так как не выполняется ни с < d, ни d < с. Если вернемся к ранее рассмотренным множествам N, Nb С, С, и С2 с соответствующими частичными порядками, то их графы будут иметь вид, приведенный на рис. 4.2. Пусть дано частично упорядоченное множество 21 = <А; <>. Как видели, в частично упорядоченном множестве могут существовать несравнимые элементы, т.е. такие элементы а и Ь, что не выполняется ни условие а < Ь, ни условие Ъ < а. В частично упорядоченном множестве 21 = <А; <> определим некоторые специальные элементы: 1) элемент а называется максимальным в 21, если не существует элемента х, такого, что а < х; 2) элемент а называется минимальным в 21, если не существует элемента х, такого, что х < а; 3) элемент а называется наибольшим , в 21, если х < а для любого элемента х; I г \8 4) элемент а называется наименьшим \__*^С -■—-^d в 21, если а < х для любого элемента х. с^ ^**а~~ *о Заметим, что максимальность элемента совсем не означает, что он наи- Рис. 4.1 93
о 1 2 "2 ■'1 N Ni Рис. 4.2 больший, а означает только то, что «больше его нет других элементов». Подобное замечание справедливо для минимальных и наименьших элементов. Естественно, что в конкретных частично упорядоченных множествах может быть несколько максимальных и минимальных элементов, в том числе и ни одного. Так, в наших примерах число О является минимальным и наименьшим в N, Си С2, но в этих множествах нет максимальных элементов. Наоборот, в Л', число 0 является максимальным, а минимальных элементов нет. В С нет ни максимальных, ни минимальных элементов. В частично упорядоченном множестве, граф которого на рис. 4.1 обозначен через Г, элементы а, Ъ — минимальны, е, g — максимальны, а наибольших и наименьших элементов нет. Понятно также, что, если в частично упорядоченном множестве 21 есть наибольший (наименьший) элемент, он будет единственным максимальным (минимальным) элементом. В частично упорядоченном множестве 21 = <А\ <> определим ряд полезных подмножеств, которые уже вводили для действительных чисел: [а, Ь] = {х / а < х < Ь} — отрезок, определяемый концами аи Ь; (а, Ь) = {х I а < х < Ь} — интервал, определяемый концами а и Ь. Если какой-нибудь конец у отрезка или интервала не фиксируется, то вместо него будем писать символ °°. Например, [оо, а] = {х / х < а} — начальный отрезок с правым концом а; (Ь, °°) = {х J Ъ < х\ — финальный интервал с левым концом Ь. Можно также рассматривать полуотрезки или полуинтервалы, например: (а, Ь] = {а < х < Ь) и др. ' ' I 3 2 1 i i ' 1 > '-3 ■-2 i-l 0 с2 94
Просто начальным (финальным) отрезком множества А будем называть такое подмножество В, что с каждым своим элементом множество В содержит и все меньшие х < а (все большие а < х) элементы. Теорема 4.1. Имеем: а < Ъ тогда и только тогда, когда [°°, а] с [°°, Ь]; а < b тогда и только тогда, когда [Ь, °°] с [а, °о]. Доказательство. 1. Если а < b и х е [°°, a], ay е [Ь, °°], то х< а и 6 < у; тогда х < 6 и а < у; значит, х е [оо, £] и у е [а, оо]. 2. Если [оо, а] с [о°, Ь], то, так как а е [°о, а], имеем a е [<*>, й], т.е. a < b. Если [6, оо] с [а, оо]> то, так как b е [оо, Ь], имеем b е [а, °°], т. е. а < 6. ■ Для интервалов подобные теоремы не имеют места, например, частично упорядоченные множества, заданные графами на рис. 4.3. На графе Г] имеем (оо, Ь) - (оо, с), но b и с несравнимы, на графе Г2 -— (е, о°) = (/ о°), но снова е и/несравнимы. Применительно к частично упорядоченным множествам 21 = = <А; <|> и 05 =<В; <2> понятие изоморфизма ос будет иметь вид: а — взаимно-однозначное соответствие между А и В, такое, что для любых а,, а2 е А а, < а2 тогда и только тогда, когда а (а,) < а(а2). Ясно, что изоморфные частично упорядоченные множества имеют одинаковые графы, они отличаются лишь обозначениями своих элементов, а по отношению к частичным порядкам, заданным на них, совершенно неотличимы. Если сравним графы для 21 и для семейств начальных и финальных интервалов 03 = {[оо, а)}аеА и € = {(а, °°]}аеА> которые, очевидно, частично упорядочены отношением с, то увидим, что они совершенно одинаковы (рис. 4.4). Итак, видим, что по существу все частично упорядоченные множества исчерпываются (с точностью до изоморфизма) системами множеств, упорядоченных отношением включения с. Покажем, как можно ввести частичный порядок < на множестве А и В, если 21 = < A; <i >, 03 = < В; <2> — частично упорядоченные множества и А п В= 0. Сделаем это, например, так: 1) считаем а, < а2, если аь а2 е А и 2) считаем Ьх < Ь2, если Ьь Ь2е В и Ь\ <2 Ъ2\ 3) считаем а < Ь, если а е А и b е В. Рис. 4.3 95
Граф для 21 Граф для <8 Граф для С Рис. 4.4 • • • • (0,0> <0,1>- (1,0) <1,1> v 0_ 1 TV Рис- 4.5 Итак, схематически порядок < выглядит следующим образом: Avj В ~ ...<а< < b <... А В Частичный порядок < на множестве Ах В, где 51 = <А; <)>, 05 = = <В; <2>, можно ввести, например, лексикографическим образом: <ах, Ь\> < <а2, Ь2> тогда и только тогда, когда [(а, <, а2) или (о, = а2 и bx <2 Ь2)\. Так, в различных словарях, справочниках, энциклопедиях основные слова, из-за которых собственно и создано подобное издание, чаще всего расположены лексикографически. Вначале идут слова, начинающиеся на первую букву алфавита, далее — слова, начинающиеся на вторую букву алфавита, и т.д.; внутри группы слов, начинающихся на одну и ту же букву, порядок устанавливается по второй букве слова, и т.д. Лексикографический порядок на N2 схематически выглядят так, как показано на рис. 4.5. В различных областях математики частично упорядоченные множества играют важную роль. Их применения разнообразны и многочисленны. Подробно изучаются и специальные классы частично упорядоченных множеств, в которых предполагается выполнение новых дополнительных условий для их частичных порядков: линейно упорядоченные множества, вполне упорядоченные множества, решетки и др. С некоторыми из этих классов также познакомимся. 96
4.2. Линейные и полные порядки Линейные порядки. Частично упорядоченное множество 21 = = <А; <> назовем линейно упорядоченным, если любые элементы а, b е А сравнимы по < между собой, т. е. выполняется а < Ъ или Ъ < а. Если В с А и В — линейно упорядочено относительно того же порядка <, который задан на частично упорядоченном множестве А, то В называется цепью в А. Указанные в подразд. 4.1 множества с соответствующими порядками N, N|, С, С, являются линейно упорядоченными множествами. Порядок на С2 не является линейным, так как элементы 1 и -1 несравнимы. Частично упорядоченное множество, граф Г которого указан на рис. 4.1, также не является линейно упорядоченным потому, что элементы еж dнесравнимы. В этом частично упорядоченном множестве можно выделить различные цепи, например {a<c<f <...}, {</<g} и др. Линейно упорядоченные множества в какой-то степени более удобны, чем частично упорядоченные. Например, возьмем частично упорядоченное (и даже линейно упорядоченное множество) ОТ = <N; <>, где N — натуральные числа с обычным частичным порядком (по величине). Как видели, на N можно проводить индукцию. Конечно, принцип индукции нельзя применить для произвольного линейно упорядоченного множества. Однако если какое-то линейно упорядоченное множество 21 = <А; <> изоморфно 91 = -<N;<> (будем говорить «по типу со», или «имеет тип со»), то на А возможно проводить соответствующую индукцию. По этим причинам, когда приходится рассматривать множество А, то желательно его линейно упорядочить «по типу со», чтобы было возможно применить мощный и эффективный метод математической индукции. Вопрос о том, всякие ли и какие множества можно линейно упорядочить, да еще и «по типу со», очень непрост, но крайне интересен. Очевидно, что конечное множество А = {а0, а2, ..., а„_\) легко линейно упорядочить. Например, щ < а2< ... < а„_\. Ситуация коренным образом меняется, когда А не является конечным. Рассмотрим более подробно случаи, когда множества бесконечны. Изоморфные линейно упорядоченные множества 21 -<А; <> и 53 =< В; <> называют подобными (символически 21 - 05). Класс всех линейно упорядоченных множеств, подобных 21 = <А; <> называется порядковым типом множества А и обозначается через А. Конечно, такое отношение - является отношением эквивалентности: 1) тождественная функция ос(х) = х осуществляет подобие между 21 и 21; 97
2) если а — подобие между 21 и 93, то а ' — подобие между 58 и 21; 3) если а и р — подобия между 21 и 93, 03 и С соответственно, то (5а — подобие между 21 и £. Ясно также,_что если 21 = 55, то мощности множеств А и В равны, т.е. А = В. Однако равномощные множества могут быть не подобны между собой. Например, множества 9Т и 9?, не являются подобными: в 91 есть, а в 9Т, нет наименьшего элемента. Полные порядки. Линейно упорядоченное множество 21 = <А; < > назовем вполне упорядоченным, а порядок < на А — полным, если каждое непустое подмножество В множества А имеет наименьший элемент (естественно, относительно того порядка <, который задан на А). Это в точности первое свойство натуральных чисел для проведения индукции. Очевидно, что всякое непустое подмножество вполне упорядоченного множества само вполне упорядоченно. Другое свойство вполне упорядоченных множеств также почти очевидно: если элемент а е А не является наибольшим, то в А имеется элемент а' непосредственно следующий за а, т.е. а < а', и между ними нет других элементов — надо взять во множестве {х / а < х} наименьший элемент. Это свойство также выделено для натуральных чисел, чтобы использовать индукцию, но здесь оно является легким следствием определения. Порядковые типы вполне упорядоченных множеств носят название ординальных чисел. Порядковый тип конечного множества А = {а0< а2< ... <«„_(} обозначим через п. Для порядкового типа множества 91 = < /V; <> со стандартным порядком уже ввели обозначение — со. В подразд. 4.1 указывалось, как можно задавать порядки на объединении и прямом произведении (лексикографический порядок) частично упорядоченных множеств. В случае вполне упорядоченных множеств определенные таким образом порядки позволяют определить сложение и умножение ординальных чисел. Так получается арифметика ординальных чисел. Попытаемся в какой-то мере представить себе качественное устройство произвольного вполне упорядоченного множества 21 = = <А; <>. Если А = 0, то тут все ясно. Если А ф 0, то по условию оно должно содержать наименьший элрмент, обозначим его через а0о (выбор обозначений для появляющихся элементов множества А будет ясен в ходе его построения). И опять, если я00 — единственный элемент множества А, то картина полностью ясна. Рассмотрим множество А0 = {х / а00 < х}. Если А0 * 0, то в нем есть наименьший элемент, обозначим его через а01. Итак, положим А ~ {%) < floi < Щ- Далее нужно проделать подобный шаг для множества Ах = {х / ат < х}. 98
Продолжая этот процесс, придем к одной из двух возможных ситуаций: а) процесс оборвется на некотором шаге, т.е. какое-то Ап+\ = = 0; тогда А = {а00 < а0] < ... < а0„}; б) процесс не обрывается — каждый раз А„ * 0; тогда А = {%)< я,,, < ... < а0п < ... < С}. В последнем случае рассмотрим множество Вй = {х / айп < х для всех и}. Наименьший элемент множества В0 обозначим через аш. Тогда положим А = {%, < ooi < - < «о« < ■•• < flio < Вх]. Заметим, что для элемента а10 не существует непосредственно предшествующего: между любым а0п и а10 расположен, например, элемент а0п+[. Такие элементы вполне упорядоченного множества, у которых нет непосредственно предшествующего, называются предельными. Кстати, элемент а00 также является предельным. Начальный отрезок о00< а01 < ... < а0„< ... множества А устроен в точности, как множество натуральных чисел N, т.е. имеет тип ю. Процесс перебора по порядку элементов множества А после предельного элемента а10 либо может быть продолжен до того момента, когда он оборвется, либо получим следующее предельное число а2о- Итак, общее устройство вполне упорядоченного множества А имеет следующий вид: А = {а00< ... < а,о < ... < а20< ... < D}. Каждый предельный элемент является началом некоторого множества типа со. Подмножество таких предельных элементов также вполне упорядоченно и их последовательность также имеет указанный вид: {«00 < «10 < «20 < - < ^00 < Ью < ... }. Элемент 60о является в этой последовательности предельным, так сказать второго порядка (первого порядка для предельных элементов ат < О|0 < а2о < ••• )• Этот процесс может итерироваться много раз, в том числе и бесконечное число раз. Схематически можно изобразить устройство произвольного вполне упорядоченного множества А так, как показано на рис. 4.6. Здесь в нижней строчке расположено множество А, на более высоких строчках указаны границы типовых отрезков, символ • отмечает предельные элементы и т.д.; конечно, если множество А «короткое», то не все этажи этой схемы будут использоваться. Посмотрим: можно ли на вполне упорядоченном множестве А проводить индукцию, как на натуральных числах? Ясно, что на каждом ю-образном куске такая индукция возможна: за базу ин- 99
10) »ю 1(0 »Ш ••• »0) »ш 1С0»Ш ...»0)»Ю «ШвЮ ...•0)»(В.. V Рис. 4.6 дукции надо брать начало этого куска, предельный элемент а. От а (по одному шагу) можно «дойти» до любого элемента а этого куска, переходя к непосредственно следующим элементам, как это делается при индукции на натуральных числах. Однако если элемент а расположен, например, в следующем куске после а, то «перепрыгнуть пропасть» от а за следующее предельное число (3, делая допустимые при индукции шаги, не удастся. Во вполне упорядоченных множествах «обратные пути» от больших элементов к меньшим намного «короче», чем «прямые пути» от меньших к большим. Теорема 4.2. Во всяком вполне упорядоченном множестве % - = < А; < > каждая убывающая последовательность элементов ... < а3 < а2 < ах < а0 обрывается через конечное число шагов. Доказательство. Если рассматривать подмножество В= {а0, аи а2, ...}, то оно должно иметь наименьший элемент. ■ В случае вполне упорядоченных множеств для понятия подобия справедливы более «жесткие» условия, чем для просто линейно упорядоченных множеств. Теорема 4.3. Подобие а для вполне упорядоченных множеств 21 = <А; <1>и|В=<5; <2>, если оно существует, определено однозначно. Доказательство. Пусть ос, р — два подобия между 21 = <Л; <!> и 2$ =<В; <2>. Как знаем, отображения а-1 и (З-1 также являются подобиями между <В = < В; <2> и 21 = <А; <, >, а (3"'а, ог'р — подобия между 21 = <А; <,> и 21 = <А; <,>. Если для какого-то х е А было бы справедливо неравенство Р^'(х) < х, то в А можно было бы выделить бесконечную убывающую последовательность ...< р"'оф~'а(х) < р~'а(х) < х, что для вполне упорядоченного множества А невозможно. Итак, х < р~'ос(х) для всех х е А. Если поменять ролями а и р, то должно выполняться х < ог'р(х). Но тогда Р(х) < а(х) и а(х) < Р(х), т.е. а (х) = р (х) для всех х е А. Ш 100
Из этой теоремы и свойств подобия (монотонность), в частности, следует: 1) единственное подобие вполне упорядоченного множества 21 самому себе осуществляется тождественной функцией; 2) никакое вполне упорядоченное множество не может быть подобно своей собственной части; 3) различные начальные отрезки вполне упорядоченного множества не могут быть подобны. Для вполне упорядоченных множеств вместо индукции справедлив другой принцип — принцип трансфинитной индукции. Теорема 4.4. Пусть А — вполне упорядоченное множество и <з0 — его наименьший элемент. Пусть для подмножества 5 с А выполняется условие: если с каждым начальным полуотрезком [а0, а) множество S содержит и элемент а, т. е. если [а0, а) = {х / х < а} с S, то а е S, тогда множество S совпадает со всем множеством А, т. е. S = А. Доказательство. Пусть для S выполняется условие, сформулированное в теореме, но S* А. Тогда во множестве А - S* 0 имеется наименьший элемент о, т.е. {х/ х < а} с Sи по условию а е S, что противоречит выбору а. ■ В отличие от принципа индукции, где индуктивное предположение допускается всего лишь для одного элемента, индуктивное предположение трансфинитной индукции намного информативнее — свойство S предполагается справедливым для целого начального полуотрезка множества А. И вся эта информация используется для проведения индуктивного шага. Метод трансфинитной индукции применяется и для определений новых понятий на вполне упорядоченном множестве, и для различных построений. Указанная схема устройства произвольного вполне упорядоченного множества наводит на мысль, что все вполне упорядоченные множества, по крайней мере их соответствующие начальные отрезки, чрезвычайно «похожи» (подобны) друг на друга. Процесс постепенного построения вполне упорядоченного множества, указанный выше, подсказывает, как можно попытаться найти подобие а для произвольных вполне упорядоченных множеств 21 =<А; <> и 03 = < В; < >. Вначале находим наименьшие элементы а0 и Ь0 множеств А и В. Естественно положить ос(а0) = Ьа. Далее в А - {о0} и В- {Ь0} выбираем наименьшие элементы я, и Ьх. Снова естественно положить а(а{) = Ьх. И вообще, если построим подобие а для начальных отрезков S и Т множеств А и В, то можно положить а (а) = Ь, где а и b — наименьшие элементы множеств А - {S} и В - {Т} соответственно (если они, естественно, существуют). Тем 101
самым продолжим подобие а между Sn Гдо подобия между S и [а] и Г и {Ь}. В доказательстве следующей важной теоремы будет построена с помощью трансфинитной индукции функция, осуществляющая подобие. Теорема 4.5. Для двух вполне упорядоченных множеств 21 = = <А; <!> и 23 = < В; <2> выполняется одно и только одно из следующих свойств: 1) множество 21 =<А; <|> подобно некоторому собственному начальному отрезку множества 23 = < В; <2>; 2) множество 23 = < В; <2> подобно некоторому собственному начальному отрезку множества 21 = < А; <>; 3) множество 21 =<А; <(> подобно множеству 23 = <В; <2>. Доказательство. Будем строить с помощью трансфинитной индукции подходящее подобие а между множествами 21 =<А; <,> и 23 = < В; <2> (или их частей). Для определенности возьмем 21 и 23 такими, что ни одно из них не является подобным собственному начальному отрезку другого. Вначале положим a(aQ) = b0, где aQ и ba — наименьшие элементы множеств А и В. Рассмотрим следующее подмножество Г множества А: Т ={х/хе А и [а0,х] - [b{hy] для некоторого уе В}. Из свойств вполне упорядоченных множеств следует, что для хеТ элемент у е В определяется однозначно. Вот его и обозначим через а(х). Теперь нужно понять, что Т— начальный отрезок множества А Пусть и <| v и v е Т. Тогда [а0, v] = [b0, a(v)], а так как [аа, и] с с [а0, v], то [а0, и] = [b0, t] для некоторого t е В. Итак, и е Т. Рассмотрим образ множества Т при а: а(Т) ={а(х)/х е Г}. Докажем, что и ос (Г) — начальный отрезок множества б. Пусть « <2 v и v е а (Г). Тогда [а0, ar](v)] ~ [&0, f], а так как [Ь0, и] с [60, г>], то [я0, t] с± [й0, и] для некоторого t е А. Итак, и е а(Т). Проверим, что а сохраняет порядок. Если и, v е Т и и <, v, то [я0, «] с [я0, v], тогда [/)0, а(и)] - [а0, и] с [a0, i>] ^ [Z>Q, а(г>)]- Итак, Г=а(Г)иа- подобие. Индуктивное предположение: пусть для а е А выполняется [а0, а] с Т. Индуктивный шаг совершим для доказательства того, что а в Т. Если бы а е Т, то а — наименьший элемент множества А, для которого а не определено. Если бы это случилось из-за того, что В = а(Т), тогда 23 подобно начальному отрезку 21 (что исключено по договоренности). Если же В ф а (Г), то, выбрав в В - а (Г) 102
наименьший элемент b, получим, что [а0, а] = [b0, Ь], что невозможно. Итак, а е Т. Используя трансфинитную индукцию, заключаем, что Т = А. Но тогда 21 подобно либо всему <В, либо его начальному отрезку а (Г). А последний случай также исключен в самом начале доказательства. Итак, 21 подобно всему Ъ. ■ 4.3. Теорема Цермело Возможность проводить трансфинитную индукцию на вполне упорядоченных множествах заставляет обратить пристальное внимание на такие множества. Сразу же возникает естественный вопрос: какие множества можно вполне упорядочить? Если множество натуральных чисел N является основным материалом для так называемых дискретных направлений математики, то множество действительных чисел D играет подобную роль в математических областях, связанных с «непрерывными» процессами, такими, как математический анализ, дифференциальные уравнения, математическая физика, аналитическая геометрия и др. Хотя множество натуральных чисел N, да и все «похожие» на него множества легко вполне упорядочиваются, придумать полный порядок на множестве действительных чисел Показалось очень трудной задачей. Как видели, множество D линейно упорядочено с помощью обычного отношения <, сравнивающего числа по их величине. Однако этот естественный порядок на D является далеко не полным. Возьмем, например, полуотрезок (0, 1]. Здесь нет наименьшего по величине числа. Но может быть все же можно как-то вполне упорядочить множество D? Создатель теории множеств Г. Кантор в течение долгого времени пытался вполне упорядочить множество действительных чисел D. Все его попытки на этом пути воспринимались довольно скептически со стороны современных ему математиков. И действительно, все усилия Г. Кантора не увенчались успехом, несмотря на проделанную огромную творческую работу. В 1904 г. Э. Цермело доказал свою знаменитую теорему о том, что всякое множество (а значит, и D\) может быть вполне упорядочено. Теорема Цермело породила новые аспекты понимания сущности математического мышления, методов и понятий в математике. При доказательстве теоремы Цермело будет существенно использован принцип (или аксиома) выбора: если х — семейство непустых множеств, то можно совершить одновременный выбор по одному элементу а из каждого множества у семейства х. 103
Уже несколько раз отмечалось, что при доказательстве некоторых теорем был исполь- А зован в том или ином виде принцип выбора. Вопрос о том, справедлив ли принцип выбора в той наивной теории множеств, которую пока строим, является спорным. Ряд специалистов-математиков не считают этот принцип достаточно очевидным, как другие интуитивные допущения о множествах, которыми уже пользовались. Более того, оказалось, что в аксиоматической теории множеств ZF (об этой теории несколько раз уже упоминали, и в подразд. 11.2 приведем систему аксиом для этой теории) принцип выбора не может быть доказан и не может быть опровергнут. Эти замечательные результаты принадлежат К. Геделю и П.Коэну. При доказательстве теоремы Цермело будет нужна формулировка принципа выбора (рис. 4.7), эквивалентная предыдущей: пусть А — произвольное множество, тогда можно совершить одновременный выбор по одному элементу ам € М для каждого подмножества М, такого, что М с А. Другими словами, это означает, что существует функция/, которая каждому собственному подмножеству множества М ставит в соответствие элемент f(M) £ М. Такой элемент ам будем называть добавком к множеству М. При доказательстве теоремы Цермело будем последовательно расширять «вполне упорядоченные куски» М множества А, добавляя к этим кускам их добавки М и {ам} и считая, что х < ам для каждого хе М.С учетом специфических обстоятельств, связанных с признанием или не признанием принципа выбора, специально выделим те множества, для которых принцип выбора справедлив, и только для них докажем теорему Цермело. Для тех же, кто признает принцип выбора, получится, что всякое множество можно вполне упорядочить. Назовем непустое множество А селекционным, если для него принцип выбора справедлив, т.е. можно совершить одновременный выбор по одному элементу ам е М для каждого подмножества М, такого, что М с А. Теорема 4.6. (теорема Цермело). Множество А можно вполне упорядочить тогда и только тогда, когда это множество является селекционным. Доказательство. I. Первая часть доказывается довольно просто. Если А — вполне упорядоченное множество, то во множестве А- М можно выбрать наименьший элемент; этот элемент и будет добавком к множеству М. 104
II. По существу, данная часть и является результатом, полученным Цермело. Доказательство этой части требует определенной изобретательности, поэтому разобьем его на более простые пункты. Пусть А — селекционное множество. Зафиксируем тот одновременный выбор элементов-добавков ам для каждого подмножества МсА. 1. Начнем процесс последовательного вполне упорядочивания множества А. Он будет в чем-то напоминать тот процесс описания вполне упорядоченных множеств, который рассматривали ранее. Добавим к множеству М = 0 его добавок а0 (удобнее этот элемент обозначать через а00). Добавим к множеству Л/00 = {%)} его добавок Oqi, положим Мт = {%>< а01}. Продолжим данный процесс, и если он не оборвется из-за того, что исчерпается все множество А, то получим некоторое множество Добавим к этому множеству М его добавок а10. Получим ^10 = {«00 < «01 < - < аюЬ Продолжим этот процесс далее. Если в ходе этого процесса будет получено некоторое вполне упорядоченное множество М, то следующим множеством в данном процессе будет множество М и {ам}. Упорядочивая это новое множество, будем считать, что х < ам для всех х е М, а порядок на элементах из М остается прежним. В дальнейшем будем добавлять лишь еще «большие» элементы, а значит, будем иметь х < ам лишь для элементов х е М. Основная трудность в доказательстве теоремы Цермело, которую предстоит преодолеть, состоит в следующем: каждый ли элемент множества А будет «достижим» в подобном процессе? Другими словами, будет ли в итоге все множество А вполне упорядоченным? 2. В ходе процесса будем получать все большие вполне упорядоченные подмножества (куски) множества А: 0 с Моо с А/щ с ... с Мю а ... . (1) Те множества М, которые когда-нибудь будут получены в ходе процесса, очевидно, имеют следующие свойства: а) М — вполне упорядоченное множество; б) каждый элемент т е М определяет начальный отрезок [<*>, т] в множестве М и т = як т). В дальнейшем доказательстве будет удобнее иметь дело не с множествами из цепочки (1), а с множествами, обладающими указанными выше свойствами а), б). Назовем такие подмножества М множества А правильно построенными. Ясно, что множество М и {ам} будет правильно построенным, если множество М правильно построено. 105
3. Докажем для правильно построенных множеств следующую лемму. Лемма 4.1. Из двух правильно построенных подмножеств множества А одно является отрезком другого. Доказательство. Пусть Р и Q — любые два правильно построенных подмножества множества А (рис. 4.8). Ясно, что у Р и Q имеются некоторые общие начальные отрезки: например, 0, Мт, Мт и др. Обозначим через R = uO — объединение всех общих начальных отрезков для Р и Q. Ясно, что ЛсУиЛс Q: если х е R, то х принадлежит некоторому общему начальному отрезку Г для Р и Q, т.е. х е Р и х е Q. Далее, R — общий начальный отрезок для Р и Q: если у < х и х е R,tox принадлежит некоторому общему начальному отрезку Т для Р и £> и там у < х. Значит, у е Т, так как Г — начальный отрезок. Итак, у е R. С другой стороны, R как объединение всех общих начальных отрезков для Р и Q является наибольшим из всех таких отрезков. И наконец, пусть R а Р и R a Q, a р — наименьший элемент из Р - R ф 0, q — наименьший элемент из Q - Rф <Z w р = ак р) и q = а[оо 9). Из-за того, что Р и Q — правильно построенные множества, имеем R = [оо, р) = [оо, ,?), /? = <7. Итак, в случае R с Z5 и /? с Q имели бы еще больший, чем R, общий начальный отрезок для Р и Q. Но это невозможно, что и доказывает лемму. 4. Теперь рассмотрим V = [JP, где объединение берется по всем правильно построенным подмножествам Р множества Л (рис. 4.9). Упорядочим V следующим образом: если а, b е V, то а е Р и b е Q для некоторых правильно построенных подмножеств Р и Q множества А. Пусть R — наибольший из Р и Q, тогда а, b е /?. 106 Рис. 4.8 Рис. 4.9
Будем считать а < b в V, если а< Ьъ R. Используя лемму, нетрудно доказать, что так введенное отношение будет линейным порядком. Докажем, что этот порядок на Сбудет полным, т.е. V — вполне упорядоченное множество. Доказывать будем от противного: пусть некоторое подмножество Т множества V не имеет наименьшего элемента относительно введенного порядка. Тогда в Т можно выделить бесконечную убывающую последовательность ... < t2 < /, < Го- Элемент t0 принадлежит некоторому правильно построенному множеству Р. Но тогда и вся эта убывающая последовательность будет находиться в Р, чего быть не может, так как Р — вполне упорядоченное множество. Итак, множество V вполне упорядочено. Пусть v е V я v принадлежит некоторому правильно построенному множеству Р. В Р элемент v определяет некоторый начальный отрезок [с*>, v] и v = Я[„ v). Этот же начальный отрезок в Р будет и начальным отрезком в V, определяемым элементом v. Итак, V — правильно построенное множество. Так как V — объединение правильно построенных множеств, да оно и само правильно построено, то V — наибольшее из всех таких правильно построенных множеств. 5. Теперь для окончания доказательства второй части теоремы Цермело надо заметить, что если бы Уф А, то, присоединяя добавок aj/K множеству V, получили бы еще большее, чем V, правильно построенное множество, чего быть не может. Итак, теорема Цермело доказана. ■ Для тех, кто принимает принцип (аксиому) выбора, теперь легко можно доказать теорему о выделении счетного подмножества из любого бесконечного подмножества, а также закон трихотомии для кардинальных чисел. Теорема 4.7. Во всяком бесконечном множестве можно выделить счетное подмножество. Доказательство. Вначале надо вполне упорядочить данное бесконечное множество и далее выбирать для соответствующих подмножеств их добавки. ■ Теорема 4.8 (закон трихотомии). Для любых кардинальных чисел тип справедливо одно из трех соотношений: m < п или m = п, или п < т. Доказательство. Легко следует из того, что, выбрав представителей А и В из мощностей га и п, по теореме Цермело можем эти множества вполне упорядочить. А для вполне упорядоченных множеств как раз выполняется одно и только одно из указанных соотношений (см. подразд. 4.2). 107
4.4. Алгебраические операции Часто функции типа/: А" -»А называют алгебраическими операциями, так как наиболее интересные из таких операций исторически возникли и изучались в алгебре. И по этим же причинам алгебраические системы, в сигнатуре которых имеются только функции, но нет предикатов (заметим, что константы являются 0-местными функциями), называют алгебрами. Построим ряд классических алгебр. Решетки. Рассмотрим в частично упорядоченном множестве 21 = <А; <> некоторое подмножество В с А. Элемент а назовем верхней гранью для множества В, если b < а для любого элемента be В. Элемент с назовем нижней гранью для множества В, если с < Ъ для любого элемента Ъ е В. Заметим, что верхние и нижние грани для множества В, даже если они существуют, не обязаны принадлежать самому множеству В. Если среди всех верхних граней для множества В имеется наименьшая, то она называется точной верхней гранью и обозначается через sup {В}. Если среди всех нижних граней для множества В имеется наибольшая, то она называется точной нижней гранью и обозначается через inf{5}. Если множество В состоит из двух элементов, т.е. В = {а, Ь}, то sup {В} обозначают через a u b, a inf{B} — через аглЬ. Две операции и и п на А формульно определяются так: х = ykj z =у < x&z^ х& Уи[(у < м & г < и) -> х < и]; х = ynz =х < у&х < z&Vu[(u < у & у < z) -» и < х]. На рис. 4.10 можно наглядно представить эти операции. Интересные разновидности частично упорядоченных множеств возникают, если потребовать выполнения некоторых дополнительных условий, связанных с понятиями граней. Так, частично упо- Рис. 4.10 108
ряд очен ное множество 21 = <А; <> называется верхней полурешеткой, если для любых двух элементов а, Ъ е А существует в множестве А их точная верхняя грань а и ft: \/аЬЗх[х = аий]. Частично упорядоченное множество 21 = < А; < > называется нижней полурешеткой, если для любых двух элементов a, b е А существует в множестве А их точная нижняя грань аглЬ: \/ab3x[x = ar\b]. Решетка — частично упорядоченное множество 21 = <А; <>, которое является одновременно и верхней, и нижней полурешеткой: \/ab3xy[x = aKjb&y = аглЬ]. (1) Из определений легко следует единственность точных верхней и нижней граней: УаЬЗ\х[х = а и Ь] и \/ab3\x[x = ar\b]. Для этих операций также справедливы следующие утверждения: УаЬ[а vjb = byja&ac\b = br\a] (2) (коммутативность); УаЬс[а и(Аис) = (йи/))ис&ап (Ьглс) = (апЬ)п с] (3) (ассоциативность); \/ab[(a(jb)na = a&(anb)(jb = b] (4) (поглощение). Решетки можно задавать как алгебры 21 = <А; u, п > с двумя двухместными функциями, для которых выполняются законы коммутативности (2), ассоциативности (3) и поглощения (4). Тогда это множество А можно частично упорядочить, вводя отношение < одним из следующих способов: х < у = х<иу = у или х<у = хпу = х. Доказательство того, что так введенные отношения представляют один и тот же частичный порядок, предоставляется читателям. При таком доказательстве полезно будет использовать следующее утверждение, справедливое в любой решетке: 4ab[a <ub = b<->anb = a]. Решетка 21 = <А; <> называется дистрибутивной, если выполняются следующие дистрибутивные законы: 109
\/abc[{a и b) n с = (a n c) u (b n c)], (5) Vabc[(a n 6) u с = (о и с) n (6 и с)]. (6) Теория решеток находит важные приложения как в самой математике, так и в других науках. Булевы алгебры. Укажем еще один важный вид частично упорядоченных множеств. Дистрибутивная решетка 21 = <А; <> называется булевой алгеброй, если для любого элемента а е А существует элемент а', называемый дополнением для а, удовлетворяющий условиям: для любого b е А (а и а') и b = Ъ, (а п a') u b = b. (7) Можно смотреть на булеву алгебру и как на алгебраическую систему 21 = <А; u, п '>, с двумя двухместными операциями и, п и одной одноместной операцией ', удовлетворяющими соотношениям (2) —(7). Пример 4.1. Классическим эталоном для понятия булевой алгебры является семейство Р(А) всех подмножеств множества А, частично упорядоченное отношением включения с. Теорема 4.9. Модель ф = < Р(А); с> — булева алгебра. Доказательство. 1. Для любых В}, В2 с А имеем sup {Bt, В2} - В] и В2 и inf{B,, Я2} = Й,п 52. Действительно, ^ с 5, u fi2> S2 с fi, и i?2 и fi, n Z?2 с 5Ь fi, п Й2 с cS2. Пусть Я, сС, fi2 с С. Тогда, если х е 5, u /?2, т0 х 6 ^i ИЛИ х е ^2- В обоих случаях х е С. Таким образом, В\и В2а С. Пусть Z) с /?,, D сВ2. Тогда, если х е Д то х е #, и х е й2, т.е. х е ВУГ\ В2. Таким образом, D с 5, п #2. Можно отметить, что в произвольных семействах множеств 21 = = {Д)/б / с отношением включения с всегда существуют sup 21 = (J Л, и infa = r|4. ,w /е/ 2. Дистрибутивность этой решетки следует из того, что для объединения и пересечения множеств выполняются дистрибутивные законы. 3. Дополнение В' множества В до множества А как раз удовлетворяет тем законам, которые должны выполняться в булевых алгебрах. ■ Пример 4.2. Другой важный пример булевой алгебры можно получить с помощью факторизации алгебры высказываний АВ = = <Ф; -I, —>> с помощью того отношения эквивалентности ~, которое вводилось для формул АВ. Напомним, что формулы А(х, у, ..., z) и В(х, у, ..., z) назывались эквивалентными, и обозначалось это через А ~ В, если для любых наборов значений переменных х- а,у-Ь, ..., z= с, где ПО
a, b, ..., се / = {и, л}, значения формул Ф_ А(а, Ь,..., с) и В(а, Ь,..., с) совпадают. Множество формул Ф разобьется на непересекающиеся подмножества (классы, слои) типа [А]. Действительно, если какая-то формула С попадет в классы [А\ и [В], то будем иметь С ~ А и С ~ В. Отсюда следует, что А ~ В (рис. 4.11). Вот такие классы формул типа [А] и будут составлять основное множество М алгебраической системы Lin, называемой алгеброй Линденбаума. В качестве выделенных элементов системы Lin изберем как классы 1 и 0: в класс 1 попадут все тождественно истинные формулы, а в класс 0 — все тождественно ложные формулы. На элементах основного множества Мсистемы Lin (т.е. на классах формул [А]) определим функции, соответствующие логическим связкам -1 и -», и операции иип следующим образом: И1' = Ml; [А] -> [В] = [(А -> В)]; [А] и [В] = [(A v В)]; А] п [В] = [(А & В)}. Здесь, конечно, необходимо проверить корректность так определенных функций, т.е. независимость функций от выбора представителей из классов формул. Это делается довольно просто, если учитывать имеющиеся эквивалентности алгебры высказываний. Из подобных соображений следует, что алгебра Линденбаума Lin = <М; 1, 0; и, п, '> является булевой алгеброй. В литературе известны и другие виды алгебраических систем, так называемые цилиндрические и полиадические алгебры, получающиеся подобно алгебре Линденбаума с дополнительным введением соответствующих операций над классами формул для кванторов V и 3. Полугруппы. Рассмотрим алгебраическую систему 21 =<А; •> с одной двухместной операцией, обычно называемой умножением. Назовем такую алгебраическую систему полугруппой, если для функции • выполняется ассоциативный закон: Vxyz[x(yz) = {xy)-z\. (8) Тогда будем получать подсистемы Ъ = < В; • > полугруппы 21, называемые подполугруппами, если выберем замкнутые подмножества В множества А, т.е. такие множества, что если х, у е В, то х ■ у е В ^ 111
(естественно, на множестве В операция • действует так же, как и на множестве А). Группы. Одним из самых интенсивно развиваемых направлений общей алгебры является теория групп. Группой называется алгебраическая система © = <А; е; -, ~'>, в сигнатуру которой входит константа е, двухместная функция • и одноместная функция ~', удовлетворяющие условиям: \/х(хе = ех = х) (единица); (9) Vxyz[x(y ■ z) =(х -у)- z] (ассоциативность); (10) \fx(x • х~1 = х-1 ■ х = е) (обратный элемент). (11) Будем получать подсистемы Ъ = <В; е; •, "'> группы 21, называемые подгруппами, если выберем замкнутые подмножества В множества А, т. е. такие множества, что ее В, если х, у е В, то х ■ у е В, если х е В, то х~' е В (естественно, на множестве В операции • и "' действуют так же, как и на множестве А). Наиболее продвинутым направлением теории групп является теория абелевых групп, т.е. таких групп, в которых операция • коммутативна: \/ху(х ■ у = у ■ х) (коммутативность). (12) Заметим, что натуральные числа N по сложению +, взятому в качестве операции •, не образуют группы, так как здесь нельзя подобрать обратную операцию "'. Целые числа С, рациональные числа R, действительные числа D и комплексные числа К составляют абелевы группы по сложению (для операции •) и умножению на -1 (для операции "'). Элементами симметрической группы Sn являются подстановки (взаимно-однозначные отображения) конечного множества {0, 1, ..., п - 1} на себя. В общей алгебре известно, что все конечные группы (т.е. группы, содержащие конечное число элементов) с точностью до изоморфизма исчерпываются подгруппами симметрических групп S„. Кольца. Кольцом называется алгебраическая система Я = <А; 0; +, ~', •> с константой 0, двумя двухместными функциями + и •, одной одноместной функцией ~\ такими, что выполняются следующие условия: 1) система 5Н, = <А; 0; +, ~'> является абелевой группой; 2) для + и • выполняются дистрибутивные законы: \fxyz[x ■ (у + z) = (х ■ у) + (х■ z)&(х + у) ■ z = (х■ z) + (у ■ z)). 112
Тогда будем получать подкольца fft, кольца Я, если в качестве основного множества *К, будем избирать замкнутые подмножества В множества А. В качестве примеров колец назовем кольца целых, рациональных, действительных и комплексных чисел. В общей алгебре изучаются многие частные виды колец, такие, как ассоциативные, альтернативные, кольца Ли и др. Для их определений используются некоторые новые дополнительные свойства. Поля. Полем называется алгебраическая система ф = <А; 0, е; +,+"',-, -_|> с константами 0 и е, двумя двухместными функциями + и •, двумя одноместными функциями + ' и • ', такими, что выполняются следующие условия: 1) ф, = <А; 0; +,+"', •> является кольцом с +-1 как обратной операцией для +; 2) ф2 =<А - {0}; е; •, -~'> является абелевой группой с •~1 как обратной операцией для •. В поле ф не существует так называемых делителей нуля, т. е. таких х, у ф 0, что х ■ у = 0. Хотя в кольцах делители нуля возможны. Однако в поле возможна ситуация, когда п■ е - е + е+ +е = 0 п для некоторого натурального числа п. Наименьшее такое п называется характеристикой поля ф. Если же в поле ф п ■ е = е + е +... + е = 0 пу\ п не выполняется ни при каком п, кроме п = 0, то говорят, что поле ф имеет характеристику 0. То, что поле ф имеет характеристику п, где п — конкретное ненулевое натуральное число, можно выразить с помощью формулы соответствующей АПФ. А как записать, что характеристика поля равна 0? Уже несколько раз встречалась подобная ситуация, что правилами построения формул переменная длина формул не допускается. Однако с помощью бесконечного множества формул выразить это утверждение можно. Рассмотрим следующую последовательность предложений: е ф 0, е + еф0, е + е + е ф0, ... По определению поле ф имеет характеристику 0, если на нем выполняются все эти предложения. Алгебраически замкнутые поля. На множестве натуральных чисел N не всегда удавалось решить уравнение а + х = Ь, т. е. для любых a, b е N найти соответствующее х е N. Поэтому пришлось расширять множество N до множества целых чисел С для того, чтобы в новом множестве было возможно решать это уравнение а + х = Ь, 113
т. е. для любых a, be С найти соответствующее хе С. Заметим, что при этом в отличие от N система С стала кольцом. Сходная проблема привела к понятию рациональных чисел: пришлось расширять множество С до множества рациональных чисел R для того, чтобы в новом множестве было возможно решать уравнение ах + b - О, т. е. для любых a, b е R найти соответствующее х е R. Заметим, что при этом в отличие от С система R стала полем. Расширение множества рациональных чисел R до множества действительных чисел D преследовало несколько другую цель: было нужно заполнить промежутки между имеющимися числами так, чтобы новое множество было непрерывным. Теперь, имея поле D, снова не можем в нем решить уравнение х2 + 1 =:0. Приходится расширять D до множества комплексных чисел АГ, чтобы уже в нем такое уравнение было разрешимо. Здесь можно поставить общую проблему. Зафиксируем некоторый многочлен \ f(x) = a0x"+a]x"~]+... + a„_ix + a„, где все а[0, щ, ..., ап е К. Не нужно ли расширять А" до другого поля L так, чтобы уравнение f(x) - О, которое не решается в К, было разрешимо в Z? Основная теорема алгебры утверждает, что такое уравнение f(x) = О всегда разрешимо в поле К\ Итак;, приходим к следующему определению. Поле 21 = <А, о> называется алгебраически замкнутым, если для каждого многочлена ; f{x) = а^х" +ахх"^ + ... + ап_\Х + а„ с коэффициентами из А, т.е. а0, аи ..., ап е А, и а0 ф 0, уравнение f{x) = 0 имело решение в А. Ясно, что для определения алгебраически замкнутого поля придется добавить к аксиомам поля бесконечное множество формул: для каждого конкретного непостоянного многочлена/ Pf = 3x[fix) = 0]. 4.5. Геометрические модели Аксиоматический метод зародился в недрах геометрии. Евклид впервые систематически строил свою геометрию на основе понятий точек, прямых и плоскостей, опираясь чаще всего на их стандартный, интуитивный смысл. При этом, выделив ряд утверждений об этих объектах в разряд аксиом, он предложил считать вер- 114 !
ными утверждениями геометрии только те, которые можно было логически доказать (вывести) из этих аксиом. Как было отмечено во введении, система аксиом Евклида была во многом неполной, иногда в своих доказательствах теорем он опирался на такие утверждения, которых не было в списке аксиом. В течение длительного периода (более 2 000 лет!) основные понятия и концепции геометрии Евклида совершенствовались и пополнялись. В 30-х годах XIX в. Н.И.Лобачевский и Я.Больяй построили новые, имеющие право на существование, геометрии, отличающиеся от геометрии Евклида, в основном, всего одной аксиомой — аксиомой о параллельных (в терминологии Евклида — пятый постулат). Это выдающееся открытие показало, что возможны принципиально различные виды геометрий. Тем самым появилось осознание новых возможностей представлений о реальном пространстве. В книге «Основания геометрии» Д. Гильберт исследовал многие вопросы, относящиеся к обоснованию различных геометрических теорий. Он привел систему аксиом для евклидовой геометрии, которая в настоящее время признается практически всеми специалистами. Попытаемся описать те алгебраические системы, которые возникают в геометрии (в ч. IV будет приведена несколько усовершенствованная система аксиом Гильберта для евклидовой геометрии). Вначале рассмотрим алгебраическую систему 6 для планиметрии {геометрии на плоскости). Для этого зафиксируем некоторую плоскость а, и пусть М — множество точек и прямых, лежащих на плоскости а. Когда будем говорить о стандартном истолковании символов алфавита соответствующего языка, будем иметь в виду именно это основное множество строящейся алгебраической системы. Для того чтобы различать эти элементы множества М друг от друга, рассмотрим следующие предикаты на множестве М, которые в дальнейшем будут считаться основными: гт./ ч [и, если х— точка, Т(х) = [л — в противном случае; _ . . Г и, если х — прямая, Пр(х) = [л — в противном случае. Ясно, что должны быть верными следующие утверждения: Vjc[T(x)vI1p(jc)], Vjc[T(x) -» -.Пр(*)]; Vjc[np(x) -» -, T{x)]. 115
Теперь введем предикат «лежать на» или предикат принадлежности: [и, если х лежит на у; Л(х, у) = \ [л — в противном случае. Считаем, что точка лежит на точке, если они совпадают; аналогично понимаем и выражение «прямая лежит на прямой»; если х лежит на у, то и у лежит на х: Vxy{ [Т(х) & T(j/) & Л(х,у)]-> х = у}, Уху{[Пр(х)&Щ(у)&Л(х,у)}->х = у}, \/ху[Л(х,у)^Л(у,х)]. Для следующих объектов на рис. 4.12 при стандартном понимании объектов и предикатов имеем Т(а) - и, Т(й) = л, Т(с) = л, T(rf) = л, Т(е) = и, Т(/) = л, Пр(а) = л, Пр(й) = и, Пр(е) = л, Пр(а) - и, Л (а, а) = и, Л (о, Ь) = и, Л (я, с) = л, Л (a, d) = л, Л (а, е) = л, Л (а,/) = и, Л(/, а) = и, Л(/, Ь) = и, Л (с, о") = л и т.д. В языке АПФ соответствующей сигнатуры, в которой есть предикаты Т, Пр и Л, можно записывать различные геометрические утверждения. Например, верное при стандартном понимании утверждение, что через две различные точки проходит единственная прямая, записывается так: Vxy{T(x) & Т(у) &х*у^ 3\z№p(z) & Л(х, z) & Л (у, z)]}. Заметим, что это предложение выбирается в качестве аксиомы в аксиоматике планиметрии Гильберта. На множестве М можно задавать и другие предикаты. Например, Кол(х, у, z) = = J(x)ScT(y)&T(z)&3u[Up(u)&n(x, u)&n(y,u)&R(z, и)], Рис. 4.12 Рис. 4.13 116
X У Рис. 4.14 Рис. 4.15 означающий при стандартном понимании то, что точки х, у и z лежат на одной прямой (коллинеарны), рис. 4.13. Одно из основных свойств плоскости а состоит в следующем: существуют три точки, не лежащие на одной прямой, 3xyz[T(x) & Т(у) & T(Z) &^Кол(х, у, z)l Так как предикат Кол формульно определяется через предикаты Т, Пр и Л, его обычно не включают в список основных предикатов, указываемых в сигнатуре строящейся системы 6 для геометрии. Понятно, что в данном выражении надо вместо «метафор- мулы» Кол(х, у, z) вставить ее определение и избежать коллизии переменных. В дальнейшем подобных пояснений делать не будем. Или вот другой очень важный предикат: П(х,у) = Пр(х) & Пр(^) & {х = у v ^3Z[T(z) & Л(г,х) & Л(*,у)]}, означающий, что прямые х и у параллельны. (Заметим, что совпадающие прямые параллельны.) Один из вариантов аксиомы о параллельных Евклида звучит так: через точку, не лежащую на прямой, можно провести единственную прямую, параллельную данной (рис. 4.14). В выбранном языке это запишется так: Евк = Уху{ [Т(х) & Пр(у) & -,Л(х, у)] -» -^3\z[Up(z)&n(x,z)&U(y,z)]}. Принятие этого утверждения Евк в качестве аксиомы характеризует так называемую геометрию Евклида. В геометрии Римана верным является такое утверждение: Рим =Уху{Пр(х) & Пр{у) -> 3z[T(z) & Л(г,х) & Л&У)]}, т.е. «любые две прямые пересекаются», а параллельных прямых (кроме совпадающих) просто не существует (рис. 4.15). В геометрии Лобачевского выполняется другое утверждение: Лоб = Vxy{[T(x) & Пр(у) &-*,П(х,у)] -» ->Эги[г * и &Пр(г) &Пр(и) & Л(х,г) &Л(х,и) & Tl(y,z) & Щу,и)]}, т.е. «через точку, не лежащую на прямой, можно провести две неравные прямые, параллельные данной» (рис. 4.16). 117
У Z Рис. 4.17 Z у Рис. 4.16 Рис. 4.18 В качестве одного из основных предикатов в аксиоматике Гильберта для геометрии выбирается следующий предикат «лежать между» (рис. 4.17): и, если точки х, у и z лежат на одной прямой Меж(х,_у,£) = I и у находится между х и z', л — в противном случае. Из следующих предложений: \/ху1[Меж(х, у, z) -» Меж(z, у, х)], Зху[Т(х) & Т(у) & х Ф у & \fz(T(z) -» ^Меж(х, у, z)] первое является верным, а второе — неверным при стандартном понимании геометрических объектов. Заметим, что первое предложение выбирается Гильбертом в качестве аксиомы для геометрии. Имея основной предикат Меж, можно определить такие понятия, как луч, отрезок, угол, треугольник и др. Система двух точек х, у определяет луч [х, у) и отрезок [х, у] (рис. 4.18): Z е [х, у) = Т(х) & Т(у) & Т(г) & [Меж(х, z, у) v Меж(х, у, z)], Z е [х,у] =Т(дс) & Т(у) & Т(г) &Меж(х, z,y). Точка z — начало луча [х, у), если z = х, и его внутренняя точка, если z ф х & z е [х, у]; точка z — конец отрезка [х, у], если (z = х v z = у), и его внутренняя точка, если z * х & z * У & ге [х, у]. Система из трех точек х, у, z определяет угол Z xyz и треугольник Axyv U Е Zxyz = X^y&X=AZ&{UE [X, у) V [х, z)}', ие Axyz=[x Ф у & у Ф Z&- Z* * х&-,Кол(х,y,z)]Sc{ue [х,у] v и е [y,z] v не [г,х]}. Точка х — вершина, а лучи [х, у) и [х, z) — стороны угла Z xyz- Точки х, у и z — вершины, углы Z xyz, Z. yzx и Z zxy — .углы, а отрезки [х, у], [у, z] и [z, х] — стороны треугольника Axyz- 118
Д. Гильберт рассматривает в качестве основного предиката системы & предикат конгруэнтности и выделяет несколько аксиом, в которых участвует этот предикат. В этих аксиомах записываются основные свойства равенства (в стандартном понимании) отрезков и углов. Удобнее рассматривать два разных предиката конгруэнтности, для каждого из случаев отдельно: К04(х, у, z, и) = и, если х, у, z, и — точки, а отрезок [х, у] конгруэнтен отрезку [z, и], л — в противном случае; КУ6(х, у, z, и, v, w) = и, если х, у, z, и, v, w — точки, а угол Zxyz конгруэнтен углу Zuvw, л — в противном случае. Для наглядности будем писать привычным образом для конгруэнтности объектов: [х, у] = [z, и], Zxyz = Zuvw. Среди аксиом Гильберта имеются утверждения о возможности «откладывания» отрезков и углов (рис. 4.19): «на любом луче [х, у) можно найти точку с, такую, что отрезок [х, с] будет конгруэнтен заданному отрезку [а, />]», Vxyab{[T(x) & Т(у) & Т(о) & T(Z>) & х * у] -»Зс[Т(с) & [х, с] = [а, Ь]}; «для любого луча [х, у) можно найти луч [х, z) так, чтобы угол Z xyz был конгруэнтен заданному углу Z a be», Vxyabc{ [T(jc) & Т(у) & Т(а) & Т(*) & Т(с) & х * у & -, К(о, Ь, с] -> -+3z[T(z)&^z<£ [x,y)&Zxyz= Zabc]}. Рис. 4.19 119
Отношение равенства треугольников можно определить с помощью уже рассмотренных понятий: два треугольника равны, если все углы и стороны одного треугольника равны соответствующим углам и сторонам другого треугольника. Следующее неверное при стандартном понимании геометрических объектов утверждение записывается так: \lxyZUVW [Z XyZ = Z.UVW -» Axyz = Auvw]. С другой стороны, то, что обычно называется первым признаком равенства треугольников: «если две стороны и угол между ними одного треугольника равны соответственно двум сторонам и углу между ними другого треугольника, то такие треугольники равны», формализуется так: \/xyzuvw {([х, у] - [и, v] & [х, z] = [и, w]&Z xyz = = Z.uvw) -^Lxyz = Auvw}. С помощью предиката КО можно определить понятие окружности. Система точки х и отрезка [у, z] задает окружность 0(х, у, z)'- и е 0(х, y,z) = Т(х) & Т(у) & T(z) Т(и) & [х, и] = [у, z]. Итак, моделью планиметрии (геометрии на плоскости) является 6 = <М; Т, Пр, Л, Меж, КО, КУ, КТ>. Алгебраическая система (модель) 6, для стереометрии (геометрия в пространстве) имеет ту же сигнатуру, что и 6, но с добавлением еще одного предиката Пл (выделяющего в пространстве плоскости). Основное множество М, этой системы состоит из точек, прямых и плоскостей фиксированного пространства V. Принципиальных трудностей для записи на соответствующем языке утверждений и понятий стереометрии, отличающих эту геометрию от планиметрии, нет. В гл. 13 приведем список аксиом для евклидовой геометрии, основой для которой являются оригинальные аксиомы Д.Гильберта, а также систему аксиом А. Тарского.
ЧАСТЬ II СИНТАКСИС ГЛАВА 5 ПОСТРОЕНИЕ ЛОГИЧЕСКИХ ИСЧИСЛЕНИЙ 5.1. Язык и формулы исчислений Исчисления (или формальные системы) будут строиться согласно принципам программы Гильберта. Будут приведены определения необходимых понятий и указаны последовательные шаги построения произвольных исчислений. При таком построении будем стараться, чтобы выполнялись в том или ином виде условия, связанные с требованиями финитизма. Это означает, в частности, то, что в тех случаях, когда будем оперировать с бесконечными совокупностями объектов, они будут рассматриваться как потенциально строящиеся, а не окончательно завершенные. Ряд понятий для исчислений будет определяться по образцу, который был указан в гл. 2, когда строили АВ и АПФ. Каждое исчисление Ф (или формальная система) будет строиться с использованием следующих понятий: алфавит, язык, формулы, схемы формул, секвенции, аксиомы, схемы аксиом, правила вывода, выводы, выводы из гипотез, множества выводимых формул. Алфавит для исчисления Ф. Для построения исчисления Ф необходимо указать те символы (буквы, знаки и пр.), которые будем использовать. Пусть а — некоторое множество символов, называемое алфавитом. Единственное требование, которое предъявляем к символам из а, состоит в следующем: нужно уметь отличать символы из а от других символов и различать разные символы из а друг от друга. Множество а чаще всего будет бесконечным, однако в этом случае необходимо учитывать указанные ранее требования финитизма: а не будет рассматриваться как окончательно завершенное, а лишь потенциально строящееся. В исчислениях, которые будем строить, часть символов алфавита будет специализирована в своих названиях. Наиболее типичными частями алфавита а будут: а, = {а, Ь, с, ...} — пропозициональные переменные (или просто переменные); 121
а2 = {х, у, ..., X,, уъ ц, ■■■} — предметные переменные (или просто переменные); а3 = |V> •••> lrr\ — логические связки; а4 = {«о, fli, ...} — константные символы; а5 = |Лт'> •■•■> P™j — предикатные символы; аь = {/"') •••> /"'} — функциональные символы; а7 = {-} — символ равенства; Щ = {(,), [>], (Л, •••} — вспомогательные символы (скобки). Язык над алфавитом а. Словами в алфавите а называются конечные упорядоченные последовательности символов алфавита. Число символов, входящих в слово, называется длиной этого слова. Разрешается и пустая последовательность символов, т.е. последовательность, не содержащая ни одного символа. Длина такого пустого слова равна 0. Напомним, что языком над алфавитом а называлось множество всех слов в алфавите а, и обозначился этот язык через La. Заметим, что хотя не предполагаем алфавит а конечным, слова в данном алфавите обязательно конечны. Это как раз одно из мест, где проявляется финитность, характерная для программы Гильберта. Произведением слов А к В называется слово А В, получаемое приписыванием справа к слову А слова В. Слово В называется подсловом слова А, если А = CBD, где С и D — некоторые слова, возможно пустые. Слово В может входить как подслово в слово А несколько раз. Если /— некоторый символ из а и А = CtD, то говорим о вхождении символа t в слово А. Целесообразно различать различные вхождения символа t в слово А. Метаалфавит. При построении исчислений придется часто использовать символы, не входящие в алфавит а. Это обычно будет встречаться в случаях, когда нужно сообщить факт, относящийся не к конкретным объектам исчисления, а относящийся к некоторой совокупности объектов. Вот, например, была написана фраза: «Произведением слов А и В ...». Здесь речь идет не о конкретных словах А и В, а о произвольных словах алфавита а. Если бы вместо Aw В написали какие-то конкретные слова, то и все дальнейшее, что бы о них говорили, относилось к этим конкретным словам. Нас же интересуют свойства всех слов, и в данной фразе как раз и подчеркиваем это обстоятельство: все, что скажем о слове А, будет справедливым, если вместо А будем брать какое-нибудь конкретное слово. Понятно, что для подобных целей придется иметь запас новых символов, не входящих в алфавит а. Удобно считать, что имеем еще один алфавит, отличный от а, который будем называть мета- алфавитом, а его символы — метасимволами. При построении конкретных исчислений метаалфавит, как правило, не будет указы- 122
ваться. То, что какой-то символ взят из метаалфавита, обычно будет легко понять из контекста. Формулы и схемы формул исчисления Ф. Выделим среди всех слов La некоторое множество, элементы которого назовем формулами. Они будут играть важную роль при построении исчислений. Для описания формул обычно будут указываться правила их построения, носящие индукционный характер. А именно, вначале будут указаны самые «короткие» и простые формулы, называемые атомными формулами. После этого будет сказано, как из уже построенных формул можно строить более сложные («длинные»). Обычно подобные правила построения будут завершаться правилом, которое говорит, что другими способами, отличными от уже указанных, формулы строиться не будут. Такой способ построения позволяет выявлять различные свойства формул с помощью индукции по длине формулы или по какому-нибудь другому параметру, тесно связанному с длиной. Какие требования желательно предъявить к правилам построения формул? Естественным было бы такое требование: по любому слову из La необходимо эффективно определять, является оно формулой или нет. Описанные индукционные правила построения формул чаще всего удовлетворяют подобному требованию. Действительно, если дано «длинное» слово, то оно построено из более «коротких»; тогда надо проверить, по правилам или нет оно построено. Если слово «короткое» (это должно быть видно из правил), то надо узнать, атомная это формула или нет. Множество формул языка Ьа, построенное с помощью правил F, обозначим через FLa. Очень часто рассматриваются не сами формулы, а так называемые схемы формул. Схемы формулы будут строиться по тем же правилам, что и формулы, но при этом могут использоваться метасимволы вместо символов из алфавита а. Конкретная формула может быть получена как вариант соответствующей схемы формулы заменой метасимволов конкретными формулами. Для удобства схемы формул будем также называть формулами. Будем считать, что среди логических связок алфавита а обязательно присутствует символ -. — отрицание. Это требуется для того, чтобы было возможно корректным образом поставить вопросы, связанные с понятием непротиворечивости исчислений. Секвенции. Введем в обращение метасимвол Ьф, который позволит формулировать метаутверждения о выводимости формул в исчислении Ф. Если Г — некоторое конечное множество формул из FLa (возможно, пустое), А — какая-то формула из FLa, то выражение вида ГЬфЛ будем в дальнейшем называть секвенцией. Формулы из множества Г называются гипотезами или посылками, а формула А — следствием данной секвенции. 123
В случае пустого множества гипотез Г секвенцию \-фА удобно называть простой. Допускаем и секвенции вида ГЬФ и даже Ьф. Замечание. Предлагаем прочитывать секвенцию Г\-ФА следующим образом: в исчислении Ф из гипотез Г выводится формула А. Тогда простая секвенция \-фА будет читаться, например, так: формула А выводима в исчислении Ф. Секвенцию П-ф прочитываем следующим образом: система формул Г противоречива. 5.2. Выводимость формул в исчислениях Концепция выводимости в исчислениях является одним из фундаментальных понятий в программе Гильберта, да, пожалуй, и во всей математике. Действительно, понятие выводимости (доказательства теорем!) само становится вполне математическим объектом, что позволяет применять весь арсенал математических средств к таким специфическим понятиям, как доказательство, теорема и пр. Эти понятия сами становятся предметом математического исследования и анализа. Необходимо заметить, что «внутри» исчислений будем использовать понятие выводимости формул в отличие от обычного для математиков понятия доказательства теорем. А «доказывать теоремы» будем о фактах, находящихся «вне» исчислений или же о самих исчислениях. Аксиомы и схемы аксиом исчислений. Каждое исчисление, если оно строится подобным образом, будет определяться своими аксиомами и правилами вывода. С этой точки зрения, аксиомы и правила вывода играют основополагающую роль в построении исчислений. Для задания конкретного исчисления Ф выделим некоторое множество формул 21 из FLa, которые будем в дальнейшем называть аксиомами для исчисления Ф. Никаких предварительных требований к аксиомам, касающихся их простоты и очевидности, предъявлять не можем, так как пока не придаем никакого содержательного смысла символам алфавита, формулам и секвенциям. Однако иногда будем давать некоторые интуитивные содержательные пояснения к аксиомам и другим понятиям и их принятые названия. В принципе в качестве аксиом можно выбирать произвольные подмножества множества FLa. Будем лишь требовать, чтобы существовал эффективный способ, который по любой формуле позволял узнать, является она аксиомой для Ф или нет. Очень часто задаются не сами аксиомы, а схемы аксиом. Схемы аксиом — некоторые схемы формул. Конкретная аксиома может быть получена как вариант соответствующей схемы аксиом заменой метасимволов, обозначающих формулы, конкретными формулами. Схемы аксиом будем также называть просто аксиомами. 124
Строящиеся исчисления чаще всего будут задаваться конечным списком схем аксиом. Ясно, что самих аксиом при этом может оказаться и бесконечно много: каждая схема аксиом порождает много вариантов. Если же какое-то исчисление будем задавать бесконечным списком схем аксиом, то снова должны помнить о требованиях, предъявляемых финитизмом. Правила вывода исчислений. Основным логическим средством получения новых формул в исчислениях являются правила вывода. Правилами вывода называются выражения вида R : (условия), А где А\, ..., Ар и А — некоторые формулы. • Метасимвол R служит для названия или обозначения данного правила. Формулы А\, ..., Ар называются посылками правила R, а формула А — непосредственным следствием посылок по данному правилу R. В заключительных скобках пишутся условия, при которых можно применять правило R к формулам Аи ..., Ар. Эта часть правила может отсутствовать, если никаких условий на формулы не накладывается. Такие правила можно называть безусловными. Заметим, что число посылок у каждого правила вывода всегда конечно, а непосредственное следствие одно. Часто задаются не сами правила вывода, а их схемы. Схема правила — некоторое правило, где вместо формул фигурируют схемы формул. Конкретная аксиома может быть получена как вариант соответствующей схемы правила заменой схем формул, входящих в схему правила, конкретными формулами. Схемы правил будем также называть просто правилами. Строящиеся исчисления чаще всего будут задаваться конечным списком правил вывода. Если же какое-то исчисление будем задавать бесконечным списком правил вывода, то в соответствии с программой Гильберта и этот список должен удовлетворять требованиям финитизма. Для задания конкретного исчисления Ф выделим некоторое множество правил 94, которые будем в дальнейшем называть правилами вывода для исчисления Ф. В принципе в качестве правил вывода для Ф можно выбрать произвольное множество правил. Будем лишь требовать, чтобы существовал эффективный способ, который по любому правилу позволял узнать, является оно правилом вывода для Ф или нет. Также будем требовать, чтобы существовал эффективный способ, который по любой формуле А позволял узнать, является она непосредственным следствием посылок Аь ..., Ар или нет по данному правилу вывода. 125
Снова никаких предварительных требований к правилам вывода, типа простоты и очевидности, предъявлять не можем, так как пока не придаем никакого содержательного смысла символам алфавита, формулам и секвенциям. Иногда будем давать некоторые интуитивные содержательные пояснения к правилам вывода и их принятые названия. Замечание. Предлагаем прочитывать правило вывода Д, ..., А„ R: (условия) А для исчисления Ф следующим образом: в исчислении Ф по правилу вывода R при выполнении указанных условий из посылок А\, ..., Ар выводится формула А. Вывод и выводимость в исчислениях Ф. Пусть имеются некоторые множества схем аксиом 21 = {А{, ..., Л„) и правил вывода ЭТ={Л„ ..., RJ. Выводом в исчислении Ф, заданном схемами аксиом 21 и правилами вывода *Я, называется конечная последовательность формул В\, В2, .., Вр, (1) такая, что для каждого / (1 < / < р) формула Bt есть либо аксиома из 21, либо непосредственное следствие предыдущих формул, взятых как посылки одного из правил вывода из SR. Формулу А называем выводимой в исчислении Ф и обозначаем это обстоятельство через h<j>A, если существует вывод в Ф, оканчивающийся этой формулой. В данном случае считаем секвенцию \-фА выводимой в исчислении Ф. Вывод и выводимость из гипотез в исчислениях. В математике, да и в других науках, очень распространены гипотетические рассуждения: хотим посмотреть на последствия, если допустим некоторые утверждения в виде гипотез. Другими словами, добавляем к уже выбранным аксиомам некоторого исчисления Ф какое-то количество формул (обычно конечное). Рассмотрев новое, более богатое аксиомами исчисление, стараемся в дальнейшем, если это возможно, освободиться от данных гипотез. Такие приемы могут значительно обогатить исследование нашего первоначального исчисления Ф. По существу, сам характер правил толкает к подобным способам: на правило вывода для Ф А, •■■■> А, ! R : (условия) I А \ '■ можно смотреть, как на секвенцию А\, ..., Ар\~фА. Чтобы разумным образом формализовать подобный тип рассуждений, вводим понятие выводимости из гипотез Г в исчислении Ф, где Г — некоторое конечное множество формул. 126
Проще всего можно было бы поступить следующим образом. Выводом из гипотез Г в исчислении Ф, заданном схемами аксиом 21 и правилами вывода ЭТ, назвать конечную последовательность формул Сь С2, ..., Ср, (2) такую, что для каждого / (1 < / < р) формула С, есть либо аксиома из 21, либо одна из формул Г, либо непосредственное следствие предыдущих формул, взятых как посылки одного из правил вывода из 1Н (естественно при выполнении условий на применение этого правила). Однако такое понятие вывода из гипотез могло бы несколько ограничить наши возможности. Представим себе такую ситуацию. Пусть формула Ср из (2) есть непосредственное следствие некоторых предыдущих формул {..., Cj, ...} npuj<p, взятых как посылки одного из правил вывода R из 9t. Но это правило R могло быть устроено так, что для его применения в условии специально оговариваются некоторые ограничения на посылки и непосредственное следствие (именно с такой ситуацией встретимся при изучении исчисления ИПФ). И то, что в данном конкретном выводе правило R было применено, говорит о том, что для таких посылок {..., Cj, ...} и следствия Ср указанное условие выполняется. Но вывод (2), в частности, можно истолковать и так: это — вывод из гипотез Г формулы Ср. А вот для всех гипотез Г и формулы Ср условия для применения правила R не выполняются. И такая несогласованность возникла из-за некоторых гипотез, которые хотя и могут присутствовать в выводе (2), но от которых вывод формулы Ср «не зависит». Что же делать в подобном случае? Тут может спасти следующее: выделим из множества Г те гипотезы, которые «по существу участвуют» в выводе (2) формулы Ср. Для последовательности (2) и формулы Ср построим множество формул Л2 с помощью следующих правил: 1) если Ср — аксиома, то А2(СР) = 0; 2) если Ср е Г, то д2(ф = {ф; 3) если Ср — непосредственное следствие формул {..., С,, ...}, взятых как посылки правил вывода R, то А2(СР) = UA2(Cy). Множество гипотез А2(СР) назовем обоснованием Ср в выводе (2) и скажем, что в этом выводе формула Ср зависит от этих гипотез. Индекс 2 у Д подчеркивает то обстоятельство, что это обоснование связано именно с данным выводом (2). Пишем А2(Су) и для формул Cj, имея в виду часть вывода (2) до формулы Cj. Выводом из гипотез Г в исчислении Ф, заданном схемами аксиом 21 и правилами вывода £Н, называем конечную последовательность формул A, D2, ..., Dp, (3) 127
такую, что для каждого / (1 < / < р) формула Д есть либо аксиома из 21, либо одна из формул Г, либо непосредственное следствие предыдущих формул, взятых как посылки одного из правил вывода «* из 91 При этом в последнем случае для формулы Д и Дз(Д) (т.е. тех гипотез, от которых зависит Д в выводе (3), а не всех формул из Г!) условия для ограничений применения правила R не выполняются. Формулу А называем выводимой из гипотез Г в исчислении Ф и обозначаем это обстоятельство через Г\-ФА, если существует вывод из гипотез Г в Ф, оканчивающийся этой формулой. В этом случае считаем выводимой в Ф секвенцию П-ф/4. Замечание. Анализируя понятие вывода из гипотез в исчислении Ф, можно дать такое интуитивное объяснение. Как и ожидалось, гипотезы Г, в некотором смысле, играют роль новых аксиом, добавленных к аксиомам 21 исчисления Ф. С этой точки зрения становится вполне объяснимым обозначение ЬФЛ, как случай, когда множество гипотез пустое. Нахождение в исчислениях различных выводов и выводов из гипотез оказывается делом довольно трудоемким. Дело в том, что каждый такой вывод необходимо начинать «с самого начала», не используя уже имеющиеся выводы. По этим причинам выводы даже простых секвенций оказываются довольно длинными. Значительные облегчения при нахождении многих выводов доставляют понятия, которые сейчас введем. Выражение вида R : —-—-—- (условия), где £ь ..., Ър и I — некоторые секвенции, назовем допустимым в исчислении Ф правилом вывода, если в Ф из выводимости секвенций I,, ..., Ир следует выводимость секвенции £. И здесь секвенции £ь ..., Ир называются посылками правила R, а секвенция Е — непосредственным следствием посылок по данному правилу R. В теоретических вопросах всегда для выводимых секвенций будем рассматривать их выводы типа (3). Делая конкретные примеры, чаще всего будем указывать так называемые секвенциальные выводы, т.е. последовательность секвенций: 2ь .», £„, (4) такую, что для каждого / (1 < i<ri) секвенция I, есть либо выводимая в Ф секвенция, либо непосредственное следствие предыдущих секвенций, взятых как посылки одного из допустимых в Ф правил вывода. При этом в последнем случае необходимо внимательно следить, чтобы не нарушались соответствующие условия для применения правил вывода. 128
Для секвенциального вывода (4) последнюю секвенцию Е„ также можно считать выводимой в Ф. Совершенно ясно, что, имея некоторый секвенциальный вывод, сможем восстановить и вывод последней секвенции: надо везде в секвенциальном выводе, где пользовались каким-либо допустимым правилом вывода, вставить его вывод. С этой точки зрения каждая секвенция в секвенциальном выводе (4), в том числе и первая секвенция, заменяет собой некоторый «блок». Собирая подобные блоки-выводы для секвенций (которые и сами могут состоять из «блоков»), в конце концов «соберем» и вывод последней секвенции. Здесь опять надо внимательно следить, чтобы при слиянии этих «блоков» не нарушались условия, указанные в правилах. Некоторые общие свойства выводов в исчислениях. Сформулируем в произвольном исчислении Ф несколько общих свойств, связанных с только что определенными понятиями. Прежде всего ответим на следующий вопрос: почему в секвенции \-фА всегда считаем множество Г конечным? Это объясняется тем, что понятия вывода и выводимости носят вполне конечный характер — число формул в выводе конечно. Если бы не ограничивали Г только конечным числом гипотез, то, отбирая все гипотезы из Г, которые использовались в выводе секвенции ГЬФЛ, набрали бы некоторое конечное подмножество Г, с Г. Тогда и этот вывод можно считать выводом секвенции Г \-фА. Везде в дальнейшем Г, Гь Г2, ... — произвольные конечные множества схем формул, возможно пустые; А, В, ..., С, Аь ..., Ар — произвольные схемы формул. Лемма 5.1 (вывод гипотезы). Г, А\~ФА. Доказательство. Вывод состоит из одной формулы А, так как она есть среди гипотез. ■ Лемма 5.2 (перестановка гипотез). Следующее правило Г,,Д В, Г2\-ФС ГиВ,А,Г2\-фС допустимо для любого исчисления Ф. Доказательство очевидно, так как в определении вывода никак не учитывается, в каком порядке заданы гипотезы. ■ Лемма 5.3 (сокращение гипотез). Следующее правило Г,, А, А, Г2ЬФС Г1,А,Г2ЫС допустимо для любого исчисления Ф. Доказательство очевидно, так как для вывода несущественно, сколько раз какая-то формула указана в списке гипотез. ■ 129
Лемма 5.4 (расширение гипотез). Следующее правило Т\-ФА Г, В Ьф А допустимо для любого исчисления Ф. Доказательство. Пусть вывод формулы А из гипотез Г таков: Ви В2, ..., Вр. (5) Вычислим AS(A) = А5(Вр) для этого вывода. Если В е А5(А) (это означает, что формула В есть среди гипотез Г), то данный вывод будет и выводом секвенции Г, В\-ФА. Если же В £ А5(А), то добавление В в качестве гипотезы не может помешать считать имеющийся вывод и выводом секвенции Г, В\-фА. ■ Исчисление, или формальная система. Само исчисление (формальную систему) Ф (21; 9\), заданное схемами аксиом Я и правилами вывода fH, отождествляем с множеством всех выводимых формул в Ф. Итак: А е Ф (21; 9\) тогда и только тогда, когда \-фА. В следующих главах построим два важнейших исчисления — исчисление высказываний (ИВ) и исчисление предикатов и функций (ИПФ), которые станут основой многих фундаментальных математических теорий. В свою очередь, когда какое-то исчисление Ф построено и детально изучено, можно рассматривать его семантические интерпретации. Это будет делаться с помощью конкретных истолкований всех используемых в исчислении Ф символов. Общие идеи интерпретаций исчислений и, в частности ИВ и ИПФ, будут даны вч. III. К
ГЛАВА 6 ИСЧИСЛЕНИЕ ВЫСКАЗЫВАНИЙ 6.1. Построение исчисления высказываний Построим теперь одно конкретное исчисление, которое будем называть исчислением высказываний (ИВ). Как уже знаем, классическая логика, так называемая алгебра высказываний (см. подразд. 2.1), изучает формулы, построенные из элементарных переменных (высказываний) с помощью известных логических связок (функций) -1, -», &, v (имеются и другие варианты выбора основных логических связок). Переменные высказывания могут принимать в качестве своих значений — и (истина) и л (ложь). Тогда всякая формула, как функция от своих переменных, принимает значения и и л при любом распределении значений переменных. Особую роль в алгебре высказываний играют тождественно истинные формулы, т.е. такие формулы (функции), которые при любых значениях своих переменных принимают значение и. Задача — построить исчисление (аксиоматическую теорию), такую, чтобы выводимыми формулами в ней были тождественно истинные формулы и только они. Заметим, что выберем в качестве основных логических связок лишь -1 и -> и не будем вначале совсем использовать логические связки типа &, v. Как и раньше, эти связки будут введены позднее, как некоторые комбинации основных связок. ИВ будет входить во все аксиоматические теории, которые будем строить и использовать. Для исчисления высказываний будем пользоваться правилами построения формул для АВ (см. подразд. 2.1): 1) переменная есть формула; 2) если А и В — формулы, то -. А и {А -» В) — формулы; 3) других формул, кроме построенных по правилам 1, 2, нет. Секвенциями для ИВ будут выражения вида ГЬивА гьив и ьив, где Г — конечное множество формул; А — формула. Нижний индекс ИВ будем опускать. Для исчисления высказываний было предложено много вариантов списков аксиом. Выбираем один из самых простых и экономных вариантов, предложенный Я.Лукасевичем. В некоторых случаях будем указывать названия формул или утверждений, заимствованные из классической логики — АВ. 131
Схемами аксиом для ИВ являются следующие схемы формул (в скобках указаны их названия): L\. [Л -> (В -» А)] (утверждение посылки); L2. {[А -» (В -> С)] -» [(Л -» Z?) -» (у4 -» С)]} (самодистрибутивность —»); L3. [(-1/4 —» -1Я) —> (5 —> А)] (контрапозиция). ВИВ будет одно правило вывода, которое называется modus ропет (это название идет от Аристотеля), сокращенно его будем обозначать через тр: А, (А->В) тр: В правиле тр никаких условий нет. Замечание. Попробуем описать некоторый возможный содержательный смысл правила «modus ponens». При проведении каких-либо рассуждений из цепочки фактов делаем некоторые выводы. Один из распространенных приемов получения новых выводов состоит в следующем. Допустим, заметили, что некоторое свойство В рассматриваемых объектов всегда выполняется, если для них выполняется свойство А; в дальнейшем догадались, что наш объект действительно обладает свойством А. Тогда делаем вывод о том, что этот объект обладает и свойством В. Такой способ рассуждений как раз и формализуется в правиле «modus ponens». Этот простейший способ рассуждений выбран в качестве единственного правила получения новых логических следствий в ИВ. Так как единственное правило вывода «modus ponens» не имеет ограничений на применение, то многие общие понятия для произвольных исчислений в ИВ становятся значительно проще или не нужными. В частности, таким является понятие обоснования в выводе. Напомним, что, согласно общим определениям, выводом в ИВ называется конечная последовательность формул Ви В2, ..., Вр, (1) такая, что для каждого / (1 < / < р) формула Д есть либо аксиома ИВ, либо непосредственное следствие предыдущих формул, взятых как посылки правила «modus ponens». Секвенцию \-А называем выводимой, а формулу А — выводимой в ИВ, если существует вывод, оканчивающийся формулой А. Выводом из гипотез Г в ИВ называется конечная последовательность формул В\, Въ ..., Вр, (2) такая, что для каждого / (1 < / < р) формула Bt есть либо аксиома ИВ, либо одна из гипотез из Г, либо непосредственное следствие предыдущих формул, взятых как посылки правила «modus ponens». 132
Секвенцию Г \-А называем выводимой, а формулу А — выводимой из гипотез Г в ИВ, если существует вывод из гипотез Г, оканчивающийся формулой А. Согласно общим идеям построения исчислений, к ИВ относим все формулы, для которых существует вывод из аксиом Lu L2, Ьъ (т.е. из пустого множества гипотез Г) с помощью правила «modus ponens». Приведем несколько примеров выводов в ИВ. В ряде случаев будем сопровождать шаги выводов краткими пояснениями. Также для выводимых секвенций будем (если это возможно) писать их названия, заимствованные из классической логики — алгебры высказываний. Допустимое в ИВ правило будем просто называть допустимым. Пример 6.1 {рефлексивность импликации). Ь {А —> А). 1. ({А -> [(А -> Л) -» А]} -» {[А -> (А -> А)] -> (А -> А)}) [аксиома L2 — вместо В взято (А -> А), а вместо С взято А]. 2. {А -> [(А -► Л) -» А]} [аксиома Lx — вместо В взято (А -» А)]. 3. {[А->(А^>А)] -»(Л-»Л)} [правило тр, примененное к формулам 2 и 1]. 4. [Л -»(Л -> Л)] [аксиома L, — вместо Z? взято А]. 5.(А-^А) [правило тр, примененное к формулам 4 и 3]. Пример 6.2 {расширение). Правило Г\-А Г\-(В^АУ где В — любая формула, допустимо. Понятно, что последовательность А,...,Ап=А, [А^(В-> А)], (В -> А) г будет выводом (В -> /4) из гипотез Г. Пример 6.3. h [-,-, /1 -^ (-, Л -> Д)]. 1. ({-,-, Л -> [(-, 5 -» -,-, А) -> (-■ Л -» Я)]} -» {[-,-, Л -> -»(-1 5 -> -> -,-, /1)] -> Ь-, А -» (-. Л -» 5)]}) [аксиома L2 — вместо А взято -i-, Л, вместо Z? взято (—iB-*-i—iA), вместо С взято (-. Л -> #)]. 2. [(-, Я -> -,-, А) -> (-, Л -> #)] [аксиома L3 — вместо А взято Д, вместо В взято -> /4]. 3. {-,-, А -» [(-, 5 -» -,-, /4) -> (-, А -> 5)]} [используем пример 6.2]. 4. {[-,-, Л -> (-, S -» -,-, А)] -> [-,-, Л -> (-, Л -» 5)]} [правило тр, примененное к формулам 3 и 1]. 133
5. [-,-, А ^ (-, В-^-,-, А)] [аксиома L, — вместо В взято -, В, вместо А взято -,-, А]. 6. [-,-,/!-»(-, Л-> 5)] [правило тр, примененное к формулам 5 и 4]. По существу, здесь не приведен полный вывод — надо вместо формулы 3 вставить весь ее вывод, указанный в примере 6.2. Будем часто поступать подобным образом. Пример 6.4. -1 [-,-, А -»(-I-, А —> /4)]. 1. ({-,-, Л _>[(_, Л -» -.-.-! А) -> (-,-, Л -> Л)]} -» {[-,-, А -> (-, Л -» ^ _,_,_, л)] _*[-,_, Л -> (-.^ Л -> Л)]}) [аксиома Z2 — вместо /1 взято -.-, А, вместо В взято (-. А -» -» -1-1-1 Л), вместо С взято (-,-, Л -» /4)]. 2. [(-, А -+ -,-■-, Л) —> (—,—. ^4 —> Л)] [аксиома L3 — вместо 5 взято -,-. А]. 3. {-,-, Л _»[(-, Л -»_,-,_, Л) -» (-,-, А -> Л)]} [используем пример 6.2 и формулу 2]. 4. {[-1-1 /1 -»(-, А -» -,-,-, /1)] -» [-,-, Л -» (-,-, Л -> Л)]} [правило тр, примененное к формулам 3 и 1]. 5. Ь-.^^Ьу!-»-.-!-!^)) [это формула из примера 6.3, когда вместо В взято —■ —■ —■ А]. 6. [-,-, Л _»(-,-,>!-» Л)] [правило шр, примененное к формулам 5 и 4]. Пример 6.5 {удаление двойного отрицания). V- (-.-. А —> Л). 1. {[-,-■ /1 -»(-,-■ /1 -» Л)] -> [(-,-> Л -»-,-, Л) -»(-,-, Л -> Л)]} [аксиома L2]. 2. (-П-1У4-»(-,-. у<-»у<)) [пример 6.4]. 3. [(-,-, Л ->-,_, А) -»(-,-, Л -» Л)] [правило тр]. 4. (_,-,yl _»-,-,/!) [пример 6.1]. 5. (-I--Л-> Л) [правило тр]. Пример 6.6 (введение двойного отрицания). \- (А -» -i -, А). !.(-,->-, А->-, А) [пример 6.5]. 2. [(-.-.-. А -> -, А) -> (Л -» ->-! Л)] [аксиома L3]. 3. (Л-»-,-> Л) [правило тр]. Указанные выше примеры показывают, что в ряде случаев удается выводить формулы А -» В и 5 -» Л, когда формулы Аи В эквивалентны в смысле, рассмотренном в АВ. Как увидим позднее (см. подразд. 6.4), это обстоятельство имеет глубокий смысл. 134
6.2. Теорема о дедукции для ИВ Как видно из подразд. 6.1, выводы в ИВ довольно своеобразны и их не так просто найти. Понятие вывода из гипотез в совокупности с теоремой, которую сейчас докажем, позволяют сделать многие выводы более простыми и прозрачными. Замечание. Очень часто в рассуждениях используется следующий прием. Хотелось бы убедиться, что некоторое свойство объектов В выполняется, как только для этих объектов выполняется свойство А. Тогда поступаем так: предполагаем, что свойство А выполняется (гипотетически), и стараемся в этой ситуации доказать и свойство В. Если преуспеем в этом, то заключаем, что требуемая связь между выполнимостью свойств А и В действительно имеет место. Возможность такого способа рассуждений и формализуется в теореме о дедукции. Итак, докажем очень важную теорему о дедукции. В ее доказательстве существенную роль сыграет то, что для правила тр нет условий и ограничений на его применение. Теорема 6.1 (теорема о дедукции). Правило Г, Ah В Т^(А^В) допустимо в ИВ. Доказательство. Пусть Ви В2, ..., Вп (1) есть вывод формулы В из гипотез Г, А. Доказательство проведем индукцией по «длине вывода» п, т.е. числу формул в последовательности (1). База индукции, п = 1. Последовательность (1) состоит только из одной формулы В. Возможны следующие случаи: а) В — аксиома; б) В — одна из формул Г; в) В является формулой А. В случае а) имеем вывод. 1. В [так как В — аксиома]. 2. (А -» В) [пример 6.2]. 3. Г \~ (А -» В) [расширение гипотез]. В случае б) имеем вывод. 1. Г Ь В [вывод гипотезы]. 2. [В -> (А -> В)] [аксиома Ц]. 3. Г Ь [В -»(А —> В)] [расширение гипотез]. 4. Г Ь (А -» В) [правило тр]. И наконец, в случае в) имеем вывод. 135
1. I- (A -» В) [пример 6.1, так как В является формулой А]. 2. Г h (А -» В) [расширение гипотез]. Индуктивное предположение. Будем предполагать, что теорема о дедукции доказана для всех секвенций Г, А V- В, длина вывода которых не больше п. Индуктивный шаг. Пусть секвенция Г, А \- В имеет вывод, длина которого равна п + 1: В\, В2, ..., В„, Вп+]. (2) Секвенция Г, А Ь В„ имеет вывод В\, В2, ..., Вп. Тогда по индуктивному предположению и каждая секвенция Г Ь (А —> В) при / < п имеет некоторый вывод Возможны следующие случаи: а) Ди-i — аксиома; б) й„+1 — одна из формул Г; в) йя+, является формулой А; г) Вп+\ получается из Й, и й,(1 < /', j < п) по правилу тр. Случаи а) —в) рассматриваются так же, как при я = 1. Рассмотрим случай г). Так как i,j < п, то для секвенций Г Ь (А —> -> й() и Г I- (Л -» S7), как уже говорилось, по индуктивному предположению имеются выводы. Можно считать, что й, является формулой (В/ -> В„+,). Тогда имеем вывод. 1. Г Ь (Л -> й,) [индуктивное предположение]. 2. Г I- (Л -> (й, -> йу)). 3. {[А -» (й, -» й„+1)] -> [(/1 -» й,) -» (Л -> йй+1)]} [аксиома L2]. 4. Г h {[Л -> (Я, -> й„+1)] -> [(А -> й,) -> И -> йя+1)]} [расширение гипотез). 5. Г h [(Л -» й,) -^ (А -^ й„+,)] [правило тр]. 6. Г Ь (у4 -» й„+1) [правило тр]. Итак, теорема о дедукции доказана. ■ Теорема о дедукции в каком-то смысле утверждает обратное тому, что утверждает правило вывода «modus ponens». Теорема 6.2 (связь между (- и -»). Справедливо следующее: Г, А Ь й тогда и только тогда, когда Г Ь- (Л -» В), т.е. следующие правила допустимы: Г, Ah В Г h (Л -> й) п-(л-> Я) Г, ЛКЙ Доказательство. Первое правило — теорема о дедукции. Для второго правила (которое можно называть обобщенным правилом 136
«modus ponens») вывод из гипотез Г, А строится из имеющегося по условию вывода из гипотез Г Ви...,Вп = (А^ В) (4) добавлением двух формул Ви ..., Вп = (А^ В), А, В ш (5) Правило исключения выводимой гипотезы. Правило Г,А Ь В: ТУ- А Т\-В допустимо в ИВ. Доказательство. Возьмем вывод Г, А И ВЫВОД А\, ..., Ат = А. В\, ..., в„ = В (о) (7) Если А нет в выводе (6), то этот вывод является и выводом В из гипотез Г. Если же А = Bt в выводе (6), то вставим в этот вывод вместо В, весь вывод (7). В итоге получим вывод В из гипотез Г. ■ Применяя это правило несколько раз, можно исключить из гипотез все лишние в этом смысле формулы. С помощью теоремы о дедукции, обобщенного правила тр и правила исключения выводимой гипотезы нахождение выводов становится более простым и наглядным. Пример 6.7. Вывести секвенции Г, -,-i А\- А и Г, А\- -i-,A. \.Г,-,-,А\--,-,А. 1. Г, А\-А. 2. b(-.-M-»/l). 2. ь (Л-»-,-, Л). 3. Г, _,-,Л|-(-,-,Л-»у4). 3. Г, ЛЬ (Л-»->-. Л). 4. Г,-,-, ЛЬ Л. 4. Г, Ah -,-, А. Пример 6.8. Доказать допустимость следующих правил (транзитивность): Г Ь (Л -> Я), ТУ-(В^С) Г, Л Ь й; Г, Я Ь С Г Ь (А -» С) Г, Л Ь С 1. Г.ЛЬА 2. ГЬЛ(Л^Я). 3. Г, А Ь И -> В). 4. Г, Л Ь Я. 5. Г-,(£-» С). 6. Г, ЛЬ (Д-> С). 7. Г, А Ь С. 8. Г Ь (А -» С). Используя теорему о дедукции, доказывается допустимость и второго правила. 137
Пример 6.9 (контрапозиция). Г, А \- В тогда и только тогда, когда Г, -, В 1- -. А, т. е. допустимы следующие два правила: Г, А\- В Г,-,ДН-нЛ T,-iB<r-iA Г, AVB Действительно, в одну сторону имеем вывод. 1.Т,А\-В. 2. Г г- {А -» б). 3. Ь (В -» -1 -1 й) [пример 6.6]. 4. Г Ь- (А -» -I -, i?) [транзитивность ->]. 5. 1- (-1 -1 А -» /1) [пример 6.5]. 6. ГЬ (-,-./!—>-,-, Б) [транзитивность]. 7. Ь [(-! -1 Л -4 -. -1 5) -> (-1 5 -» -I Л)] [аксиома Z3]. 8. Г I- [(-, -, А -» -, -. 5) -4 (-, Б -» -, А)]. 9. Г h (-.Я-»-1/4)- 10. Г,-, Д h (-! 5->-. у4). 11. Г, -.2? I--, А 12. Г,-, Д1--,А В другую сторону имеем вывод. 1.Г, -, Дг--,Л. 2.ГЬ(-пЛ-»-,Д 3». Ь [(-, Я -4 -, /1) -4 (Л -4 Я)] [аксиома L3]. 4. Г h [(-, В -> -п Л) -> (А -» 5)]. 5. Г Ь (Л -* S). 6. Г, Л г- (Л -> 5). 7. Г, Л h А 8. Г, Л Ь А Пример 6.10. Вывести секвенцию \- (А-* В) -* {-* В-* —> А). \.АУА. 2. (Л -> В) h И -4 В). 3. Л, (Л -» В) f- 5. 4. (/1 -> А), -, В Ь -, А [пример 6.8]. 5. (А -> 5) 1- (-, В -> -, Л). 6. I- (Л -» В) -> (-, В -» -, Л). Замечание. Указанная в данном примере секвенция может рассматриваться как некоторая формализация такого способа рассуждений, как «доказательство от противного», так часто используемого математиками. Допустим, было замечено, что некоторое свойство В рассматриваемых объектов всегда выполняется, если для них выполняется свойство А; в дальнейшем можно догадаться, что наш объект в действительности не обладает свойством В; тогда делаем вывод, что этот объект не обладает и свойством А. 138
6.3. Введение новых логических символов Рассмотрим логические символы, которые будут служить для сокращений записей формул: (А & В) обозначает формулу -i (А -» -, В); (A v В) обозначает формулу (-i А —> В). Символы & (конъюнкция), v (дизъюнкция) не входят в алфавит а, а используются как метасимволы. Замечание. Удобно прочитывать эти формулы следующим образом: (А & В) как «А и В»; (A v В) как «Л или В». При построении других вариантов исчислений высказываний обычно символы & и v сразу включаются в алфавит. Тогда правила построения формул необходимо дополнить случаями, когда из формул А и встроятся формулы (А & В) и (A v В). Уместно заметить, что все рассуждения про строение формул, указанные при построении АВ (см. подразд. 2.1), останутся справедливыми и в этом случае. Список аксиом в этих случаях также должен быть дополнен аксиомами, относящимися к & и V. Рассмотрим еще несколько примеров на выводимость теперь уже с использованием и новых логических символов. Пример 6.11. 1.А,В\-А. 2. A, ->Ah -, В [контрапозиция]. 3. -1 A h (А -» -I В) [теорема о дедукции]. 4. -1 (А -» -л В) h -л -, А [контрапозиция]. 5. -I -1A h А [пример 6.5]. 6. -1 (А -» -1 В) h А [транзитивность Ь]. Учитывая указанное сокращение для &, эту секвенцию можно записать следующим образом: (А & В) h А. Пример 6.12. \.A,^Bh^B. 2.-i/? 1-04-»-. Я). 3. -,(/*-»-, B)h^-tB. 4. -n-iBh В. 5. -, (А -» -, В) h В. В сокращенном виде эта секвенция выглядит так: (А & В) h В. Пример 6.13. Вывести секвенцию А, В h (А & В). l.A,(A->-,B)h-> В. 2. А, -, -, В h -, (А -» -, В). 3.A,-,-iBh(A&. В) [символ &]. А. А, -, (А& В) I--,-,-, В. 5.-.^^Bh-,5. 6.A,-,(A&B)h-, В. l.A, Bh(A& В). 139
Пример 6.14. Вывести секвенции А \- {A v В) и В Ь (A v В). Имеем вывод первой секвенции: 1) -, А, -, В h -, А; 2) А, -, А \- В; 3) Л Ь (-, Л -> В), а это как раз секвенция А \- (A v В); и вывод второй секвенции: 1) Д -, Л I- В; 2) В Ь (-, А -> В), а это — секвенция ВI- (Л v В). Пример 6.15 (доказательство разбором случаев). Правило Ti,A\-C; T2,BhC ruT2,(AvB)^C допустимо. Замечание. Способ рассуждений, формализованный в данном правиле, носит название «доказательство разбором случаев». Здесь, конечно, подразумевается обычное классическое семантическое понимание дизъюнкции, как союза «или». Допустим, хотим убедиться, что для рассматриваемых объектов выполняется некоторое свойство С. При этом для этих объектов возможны два случая: первый — объекты могут обладать свойством А; второй — объекты могут обладать свойством В. Тогда можем разбить рассуждение на два случая и рассмотреть их по отдельности. Теперь достаточно заметить, что: 1) из выполнимости для объектов свойства А следует выполнимость для этих объектов свойства С; 2) из выполнимости для объектов свойства В следует выполнимость для этих объектов свойства С. А теперь получаем вывод указанного правила вывода. 1.Г„ЛЬ С. 2. Г,,-, СЬ-,Л. 3. Г2, В I- с. 4. Г2, -, С \- -1 В. 5. Гь Г2, -, С Ь Ь А & -л В) [пример 6.3]. 6. Г,, Г2,--(-. Л &-. В) Ь-л-, С. 7. Г,, Г2, (-, А -» В) h -, -, С [символ &]. 8.-!-■ С(- С. 9. Г„ Г2, (-, Л -» Я) I- С. В сокращенном виде это есть секвенция Гь Г2, (Л v В) Ь С. Будем называть формулы А и В эквивалентными и обозначать это через А = В, если А\- В и В\- А. Легко доказать, что: А = В тогда и только тогда, когда Ь [(Л -> В) & (В -» Л)]; если /4 = В, то -1 Л s -, В; если Л s В и С s Д то {А -» С) = (В -» D). 140
Пример 6.16. Отметим простую лемму, связанную с возможностью замен эквивалентных формул. Лемма 6.1 (о взаимозаменяемости эквивалентных формул). Пусть А = В. Тогда: 1) если А — подформула формулы С, а С* получается в результате замены некоторого вхождения А в С на формулу В, то С= С*; 2) если T,A\-D,toY,B\- D; 3) если Г h А, то Г \~ В. Доказательство 1) можно провести индукцией по числу шагов построения С из А, доказательства 2), 3) тривиальны. Итак, видим, что формулы, для которых справедливо А = В, взаимозаменяемы, как в случае, когда они являются подформулами каких-то формул, когда они присутствуют среди гипотез, и тогда, когда они являются следствиями секвенций. Это обстоятельство позволяет значительно быстрее находить выводы секвенций. Пример 6.17. Из примеров 6.5 и 6.6 следует, что А = -,-, А Также в дальнейшем будут полезны и такие соотношения: (А -» В) = (-,-, А -» В); (Л -» B)s(A-> -,-, В); (А& В) = (-,-, А & В); (А & B)s(A & -1-1 В); (Av В) = (-,-, A v В); (Л v S) = (^ v -,-, й). Предоставляем читателю самостоятельно найти соответствующие выводы. Отметим еще ряд интересных выводимых секвенций, связанных с символами v и &. Пример 6.18 (закон противоречия). \- -i (А & -. А). Выводимость данной секвенции практически сразу следует из определения символа &. Пример 6.19. (A&^A)h В. Вывод: Y)-, А,-, В )--, А; 2) -, А, А Ь В; 3) (А & -, Л) Ь Л; 4) (Л & -. Л) I- -л Л; 5) (Л & -, Л) 1- Я Замечание. Данная секвенция говорит о том, что если бы ИВ было противоречивым (т. е. в нем можно было бы вывести Атл—,А для некоторой формулы А), то в ИВ можно вывести и любую формулу В. Пример 6.20 (закон исключенного третьего). Ь (A v -. А). Выводимость данной секвенции сразу следует из определения символа v. 141
Замечание. Именно рассуждения, связанные с данным законом исключенного третьего, подверглись ожесточенной критике со стороны ин- туиционистов и конструктивистов. Эту критику можно пояснить следующим образом. Конечно, при классическом понимании логических высказываний каждый объект обладает или не обладает некоторым заданным свойством А. Но в каждой конкретной ситуации нужно эффективно указывать, какая же из этих альтернатив реально выполняется. По мнению интуиционис- тов, рассуждения, не делающие этого, теряют свою ценность и не должны использоваться. Пример 6.21. (доказательство от противного, сведение к противоречию). (-. А -> В) & (-, А -> -н В) Ь А. Имеем вывод секвенции. 1. (->Л-> Д),-,ЛЬ- В. 2. (-, А -> В), -, A h -. А 3. (-, Л-» Д),-, Л h (-. Л & Я). 4. (-, Л -> В), -л /1 Ь -i (-, А -> -, Я). 5. (-. >4 -> 5), (-, /1 -> -. В) \- А. 6. (-, А -» 5) & (-, Л -» -, 5) I- А Замечание. Рассуждения, формализацией которых является данная секвенция, также были подвергнуты критике со стороны логиков, исповедующих идеи интуиционизма и конструктивизма. По их мнению, многочисленные в математике «доказательства от противного» должны быть пересмотрены и от некоторых из них придется отказаться по следующим причинам. Как рассуждает математик в случае, когда он пытается с помощью доказательства от противного убедиться в существовании какого-либо объекта, обладающего свойством А? Он говорит: «Допустим, что для всех рассматриваемых объектов свойство А не выполняется, т.е. для них выполняется свойство -I А. Допустим, что с помощью вполне разумных умозаключений можно одновременно доказать, что для объекта со свойством -, А всегда выполняются как свойство В, так и свойство -i В. Получаем противоречие. Итак, существует такой объект, для которого выполняется свойство А». Заметим, что при подобном рассуждении в действительности конкретно не был указан требуемый объект, только сделан вывод, что несуществование подобного объекта ведет к логическому противоречию. По мнению конструктивистов, этого мало, каждое доказательство существования объекта с заданным свойством должно сопровождаться и эффективной конструкцией его или построением. 6.4. Теорема адекватности для ИВ Докажем важную теорему адекватности, которая фиксирует глубокую связь между выводимыми формулами в ИВ и тождественно истинными формулами АВ. 142
Теорема 6.3 (теорема адекватности для ИВ). 1. Секвенция \-А выводима в ИВ тогда и только тогда, когда формула А является тождественно истинной в АВ. 2. Секвенция ГЬ А выводима в ИВ тогда и только тогда, когда формула А всегда принимает значение и при тех наборах значений переменных, при которых значение всех формул из Г равно и. Доказательство. 1. Вначале докажем оба утверждения в одну сторону. Если формула А выводима в ИВ, то она может быть получена в конечное число шагов из аксиом при помощи правила вывода «modus ponens» (так устроен вывод!). Возьмем аксиому L{ ИВ. Тогда: [А —> (В -> А)] = л тогда и только тогда, когда А = и и (В -» А) = л, (В —> А) = л тогда и только тогда, когда В = и и А = л. Итак, видим, что Lx не может принимать значение л ни при каких значениях переменных, т. е. она всегда принимает значение и, а следовательно, является тождественно истинной. Возьмем другую аксиому L2 ИВ. Тогда: {[А -» (Я -> С)] -» [(А -» В) -> (А -> С)]} = л тогда и только тогда, когда [/!-»(/?-> С)] = и и [(Л -> 5) -» (Л -» С)] = л; [(/1 -» В) —> (А -> С)] = л тогда и только тогда, когда (А ^> В) = и и (А —> С) = л; (А -» С) = л тогда и только тогда, когда /1 = и и С = л. Но при А = и и С = ли(Л->5) = и имеем б = и. А при А = и, #= и, С= л получаем [Л —> (S н> С)] = л. Итак, видим, что и L2 не может принимать значение л ни при каких значениях переменных, т.е. она всегда принимает значение и, а следовательно, является тождественно истинной. И наконец, возьмем аксиому Ь$ ИВ. Опять: [(-1 А —> -1 В) —» (В —> Л)] = л тогда и только тогда, когда (-1 А -н> -1 В) - и и (В -> Л) = л; (5 -» у4) = л тогда и только тогда, когда В - и и А = л. Но при В = и и Л = л имеем (-, А -» -i Z?) = л. Итак, видим, что Z3 не может принимать значение л ни при каких значениях переменных, т.е. она всегда принимает значение и, а следовательно, эта формула является тождественно истинной. Перейдем теперь к правилу вывода «modus ponens»: А, (А -» В) mp: —LJ: -• v В 143
Пусть при некотором выборе значений переменных формулы А и (А —> В) примут значение и. Но тогда при выбранных значениях переменных и формула В примет значение и. ■ 2. Для доказательства утверждений теоремы адекватности в другую сторону предварительно докажем один промежуточный результат. Для формулы А обозначаем через аА формулу А, если а = и, и формулу -1 А, если а = л. Для произвольного набора (аи а2, ..., а„), элементами которого являются значения и и л, соответствующим набором атомных гипотез (литералов) назовем последовательность а\Х\, а2х2, ..., апхп. Пусть А(хх, х2, ..., хп) — произвольная формула, переменными которой являются хь х2, ..., х„. (Некоторые переменные могут быть фиктивными.) Лемма 6.2. ВИВ выводима секвенция а\Х\, а2х2, ..., апхп г~ ал, где а — значение формулы А(хи х2, ..., х„) при значении переменных Х\ = а\, х2 = а2, ..., х„ = а„. Доказательство. Назовем длиной формулы А число вхождений в эту формулу логических связок -., ->. Ведем индукцию по длине формулы А. База индукции. Длина формулы А равна 0. В этом случае А не содержит логических связок -., ->, и значит, А — переменная х Утверждение леммы означает выводимость следующих двух секвенций: х\~ X, -1 х V- -л х, выводы которых очевидны. Индуктивное предположение. Будем предполагать, что лемма доказана для всех формул, длина которых не больше п. Индуктивный шаг. Рассмотрим формулу А, длина которой равна я +1. Возможны два случая: а) А есть -, В; б) А есть (В -» С), для некоторых формул В и С, длина которых меньше п + 1, и, следовательно, можно считать, что для этих формул лемма доказана. Случай а). А есть -i В. Возьмем набор (аи а2, ..., а„), элементами которого являются значения и и л, и соответствующий ему набор атомных гипотез аххх, а2х2, ..., апхп. Пусть а, Ъ — значения формул А(х\, х2, ..., х„) и В{хх, х2, ..., х„) при значении переменных Х\ - ах, х2 = а2, хп = ап. Ясно, что а, Ъ имеют противоположные значения. 144
Если b = и, то а = л. Имеем а\Х\, а2х2, ..., а„х„ \- В, ЙЬ-,-,Д #]Х[, й2х2, ..., апхп г" —i у4. Если b - л, то а = и. Имеем tfl*b fl2X2, •••> йя*л Ь -1 Д й]Х|, а2х2, ..., апхп i /4. Случай б). Л есть (5 -> С). Возьмем набор (аь я2, •••> ал)> элементами которого являются значения и и л, и соответствующий ему набор атомных гипотез а{хи а2х2, ..., а„х„. Пусть а, Ь, с — значения формул Л{хь х2, ..., х„), В(х{, х2, ..., х„) и С{хь х2, ..., х„) при значении переменных х, = оь х2 = а2, ..., х„ = а„. Если b = и, с = и, то о = и. Имеем А]Х|, я2х2, ■■■■> апхп \- с, й\Х\, а2х2, ..., апхп, В \- С, а{хь а2х2, ..., а„х„ Ь (В -» О, fl,Xb fl2*2> •••) апхп 1~ Л. Если 6 = и, с = л, то а = л. Имеем а,х(, я2х2, -, «А Ь Д Ь^ С, а,Хь fl2*2> ■■•> °яхл ^ (В & -1 С), fl,Xb fl2X2, •••> ал*и Н -1 (-1 5 V С), й,хь а2х2, ..., а„х„ Ь -1 (5 -» С), й]Х[, #2х2, ..., апхп \~ —i /L Если b = л, то а = и. Имеем Д]Х], а2х2, ..., апхп \~ —i z>, 6f\Xj, а2х2) ..., апхп, —i С Н —< Д Я]Х|, Ог-^г» • •■» ал*л> В \- С, я,хь й2х2, ..., й„х„ Ь (Я -> С), Й,ХЬ Й2Х2, ..., Й„ХЛ h /1. Итак, лемма полностью доказана. ■ Доказательство второй части теоремы адекватности. 1. Пусть Л(хь х2, ..., х„) — произвольная тождественно истинная формула АВ. Для произвольного набора (аи а2, ..., ап), элементами которого являются значения и и л, значение А равно и. По лемме имеем а]Х], а2х2, ..., ап_\Хп_х, х„ Ь А, 145
d\X[, CI2X2, ..., an-\Xn_\, —1 x„ г A. Доказательством разбором случаев (пример 6.15) получаем й\Х\, Й2Х2> ••••> ап-\хп-Ъ (хп v —' хп) \~ А- Но по закону исключенного третьего (пример 6.20) имеем Ь (х„ v -, х„), и эту формулу можно исключить из гипотез. Таким образом, имеем в\Х\, a-iXi, -.., fl„_iX„^| Ь Л. Продолжая подобный процесс исключения гипотез, придем к следующему: ■J i х, Ь Л, -1 х, \- А, ■.. J (х, v -, х,) 1- Д hi 2. Пусть формулы А и В, ..., С таковы, что при любых наборах значений переменных, при которых значение формул В, ..., С равно и, значение формулы А также равно и. Рассмотрим формулу (В -> (... (С -» А)...)). Ясно, что эта формула является тождественно истинной. По доказанному имеем I-(Я-»(... (С-> Л)...)). Используя несколько раз правило вывода «modus ponens», будем последовательно получать: Д1-(...(С->/*)...), В, ..., С Ь А. ш
ГЛАВА 7 ИСЧИСЛЕНИЕ ПРЕДИКАТОВ И ФУНКЦИЙ 7.1. Построение исчисления предикатов и функций Для формализации различных математических теорий, в частности теорий алгебраических систем, логических средств уровня логики высказываний явно недостаточно. На языке логики высказываний трудно выразить многие математические факты, выходящие за рамки простых суждений. Например, не удастся на этом языке говорить о фактах, где идет речь о всех предметах с данным свойством. Логика предикатов и функций, обогащенная новыми логическими средствами, такими, как кванторы, обладает более сильными возможностями выразительности, чем логика высказываний. Построим конкретное исчисление предикатов и функций (ИПФа) данной сигнатуры: а=<а0,...; />,"', ..., Р?*\ /,"', ..../,"'>, где а0 — константные символы; Р™], ..., Р™* — предикатные символы; /"', ..., /"' — функциональные символы. Напомним, что в а собраны обозначения констант, предикатов и функций с указанием их местностей. Будем часто не указывать эти числа-местности там, где из контекста будет ясно их значение. Аналогично, будем просто писать ИПФ, не указывая сигнатуру, считая, что в данном контексте она зафиксирована. Следуя общим идеям построения логических исчислений, укажем вначале язык этого исчисления. Для ИПФ будем пользоваться правилами построения формул для АПФ (см. подразд. 2.3). Придется еще раз привести определения терма, атомной формулы и формулы с указанием их свободных и связанных переменных. Определение терма сигнатуры о. 1. Предметная переменная, или символ константы, есть терм. 2. Если /,, ..., t„ — термы и/е а, то f(tu ..., /„) есть терм. 3. Других термов, кроме построенных по правилам 1, 2, нет. Все вхождения переменных в терм считаем свободными; связанных переменных в термах нет. Если в сигнатуре о нет функциональных символов, то термами являются только предметные переменные и константы. 147
Определение атомной формулы сигнатуры о. 1. Если tu ..., /„ — термы иРе о, то P(th ..., t„) есть атомная формула. 2. Если t{ и t2 — термы, то /, = t2 есть атомная формула. 3. Других атомных формул, кроме построенных по правилам 1, 2, нет. Все вхождения переменных в атомную формулу считаем свободными, связанных переменных в атомных формулах нет. Определение формулы сигнатуры а. 1. Если А — атомная формула, то она есть формула. 2. Если А — формула, то -i А есть формула. Если вхождение переменной в формуле А свободно (связано), то соответствующее вхождение этой переменной в —iA остается свободным (соответственно, связанным). 3. Если А и В — формулы, то (А -» В) есть формула. Если какое- то вхождение переменной в А или В свободно (связано), то соответствующее вхождение этой переменной в (А —» В) остается свободным (соответственно, связанным). 4. Если А — формула, то УхА есть формула. Логический символ V называется квантором всеобщности. В формуле УхА все вхождения переменной х считаем связанными квантором У, вхождения остальных переменных в формуле УхА носят тот же характер, что и соответствующие вхождения в А. Слово УхА будет считаться областью действия данного квантора V. Переход от формулы А к формуле УхА называем операцией связывания переменной квантором всеобщности. Выражение УхА читается так: «для всех х выполняется А». 5. Других формул, кроме построенных по правилам 1 —4, нет. Ранее обозначали через А(хх, ..., х„) формулу, где хъ ..., х„ — все свободные переменные формулы А (возможно, и фиктивные). Особо выделяем формулы, которые не содержат свободных переменных, их называем предложениями. Через FLa обозначали множество всех формул языка La, а через SFLa — множество всех предложений языка FLa. Как и для ИВ (см. 6.1), можно доказать в И ПФ соответствующие леммы о числе скобок в формуле, о двух формулах и о строении термов и формул. Секвенциями для ИПФ будут выражения вида ГЬИПфД ГЬИПФ и ЬИПф, где Г — конечное множество формул; А — формула. Нижний индекс ИПФ чаще всего будем опускать. Аксиомы и схемы аксиом ИПФ. Введем следующее обозначение, которое будет использоваться в дальнейшем. Пусть А — некоторая формула, х — переменная, t — терм. Будем называть терм / допустимым для подстановки вместо переменной х в формулу А, если никакое свободное вхождение х в А не находится в части У у В, 148
где В — формула (часть формулы А) и у — переменная терма t. Если терм t допустим для подстановки вместо х в формулу А, то через A(t) обозначаем формулу, полученную из формулы А заменой переменной х во всех ее свободных вхождениях термом t. Аналогичным образом понимаем A(tu ..., tn). Как и прежде, используем новые логические символы для сокращений записей формул: {А & В) обозначает формулу -. (А -> -. В), {Aw В) обозначает формулу (-i А -» В), ЗхА обозначает формулу -, \/х-.А Эти новые логические символы называются соответственно конъюнкцией, дизъюнкцией и квантором существования. Формулу ЗхА читаем как «существует х, такое, что выполняется А». Схемами аксиом для ИПФ сигнатуры а являются следующие схемы формул (в скобках указаны их названия). L\. [А —»(В —»А)] (утверждение посылки). L2. {[А —> (В -> С)] -» [(А —> В) -» (А —> С)]} (самодистрибутивность —»). L3- [(-1 Л -> -1 5) -» (S -» Л)] (контрапозиция). L4. (\/хА(х) -> Л(0) (удаление V, где / — терм, допустимый для подстановки вместо х в Д). Л,. Vxx = х (рефлексивность =). Л2. Vx_y(x = j —> j = х) (симметричность =). /?з- ^xyz[(х- у & у = z) -» х = z] (транзитивность =). Rp. Vx, ... хпу\ ... у„{(х{ = yi & ... & х„ = ,у„) н> [Р(хи ..., х„) -> —> /*(_И|, ..., ул)]} (корректность Р относительно =). Rf. Vx, ... х„ух ... y„[(X| = У\ & - & *„ = Л) -> Д*ь -, х„) = = /(У\, ..., у„)] (корректность /относительно =). Первые аксиомы Lx — L3 ИПФ — это те же аксиомы, как и для ИВ. Аксиомы R\ — /?3 описывают свойства равенства =, как отношения эквивалентности. Аксиом Rp столько, сколько предикатных символов в а, а аксиом Rf— сколько функциональных символов в о. Правила вывода ИПФ. В И ПФ будет два правила вывода. А, (А -»В) 1. тр: '-■ 2. вв\/:— (хне входит свободно в В). (В-^УхА(х)) Первое правило называется, как и раньше, modus ponens, а второе — введение V. Как видим, второе правило содержит некоторое условие с ограничениями на его применение. Это условие создаст некоторые трудности в определении вывода из гипотез и при доказательстве ряда утверждений для ИПФ. 149
Вывод и выводимость в ИПФ. Напомним, что, согласно общим определениям, выводом в ИПФ называется конечная последовательность формул Е\, Е2, —, Ер, (1) такая, что для каждого / (1 < i < р) формула Et есть либо аксиома ИПФ, либо непосредственное следствие предыдущих формул, взятых как посылки правила вывода ИПФ. Секвенцию Ь А и формулу А называем выводимыми в ИПФ, если существует вывод, оканчивающийся формулой А. Выводом из гипотез Г в ИПФ называется конечная последовательность формул Е, F2, ..., Fp, (2) такая, что для каждого / (1 < i < р) формула Ft есть либо аксиома ИПФ, либо одна из гипотез из Г, либо непосредственное следствие предыдущих формул, взятых как посылки правила вывода ИПФ. При этом в последнем случае необходимо дополнительное условие для ограничений применения правила «введение V»: а именно, если Fj есть формула вида (В -» А(х)), а формула Fj вида (В -> \/хА(х)), то переменная х не входит свободно в формулы множества A2(Fj) и в формулу В. Здесь множество A2(F,) для последовательности (2) и формулы Fj определяются, как и в общем случае, с помощью следующих правил: 1) если F, — аксиома, то А2(Е,) = 0; 2) если F,e Г, то Д2(/)) = {/)}; 3) если Fj — непосредственное следствие формул F} и Fk по правилу modus ponens, то A2(F,) - A2(Fj) и A2(Fk); 4) если Fj — непосредственное следствие формулы /)• по правилу «введение V», то А2(Е,-) = A2(Fj). Секвенцию Г \-А называем выводимой, а формулу А — выводимой из гипотез Г в ИПФ, если существует вывод из гипотез Г, оканчивающийся формулой А. В подразд. 5.2 указано несколько общих для всех исчислений свойств, связанных с понятием выводимости (см. леммы 5.1 — 5.4). Естественно, что эти свойства можно использовать и для ИПФ. Далее укажем довольно много выводов и выводов из гипотез в ИПФ. В частности, при этом в полной мере будем использовать опыт, накопленный в ИВ. Дело в том, что если в ИВ имеется некоторый вывод (или вывод из гипотез) схемы формулы А, то эту же схему можно тем же способом вывести и в ИПФ, считая формулу А схемой формулы и в ИПФ. Действительно, при подобных выводах использовались лишь средства ИВ (кванторы не применялись), и поэтому нет необходимости следить за ограничениями, возникающими в ИПФ. 150
Однако теорема о дедукции (см. подразд. 6.2) должна быть передоказана для ИПФ, возможно в модифицированном виде, так как другой запас аксиом и правил вывода, да и само понятие выводимости иное. Аналогичная ситуация с общей формой правила тр, где участвуют гипотезы, и правилом исключения выводимой гипотезы. Модифицированные варианты этих результатов будут рассмотрены в подразд. 7.2. Согласно общим идеям построения исчислений, к ИПФ относим все формулы, для которых существует вывод из аксиом (т.е. из пустого множества гипотез Г) с помощью правил вывода. ИПФ будет входить во все аксиоматические теории, которые будем в дальнейшем строить и изучать. 7.2. Теорема о дедукции для ИПФ Учитывая, что в ИПФ имеется правило вывода с условиями, имеющими ограничения на его применения, сама теорема о дедукции, как допустимое правило, также должна быть снабжена некоторым условием. Докажем модифицированную теорему о дедукции. Вместе с тем в этом варианте условий на применение теоремы о дедукции можно не указывать, так как они уже содержатся в посылке данного правила, где утверждается существование некоторого вывода. А по определению вывода в нем мы не могли применять правило «вв V» к свободным переменным формул из А(Б). Теорема 7.1 (теорема о дедукции). Правило Г, AVB Г Ь (А -> В) допустимо. Доказательство. Пусть Вь ..., Bh ..., Вп (1) есть вывод формулы В = В„из гипотез Г, А и A,(5;) — соответствующее этому выводу множество формул. Индукцией по длине вывода п будем строить вывод формулы (А -> Вп) из гипотез Г С], ..., С,-, ..., Lm, (Z) где Ст есть (А -> Вп), а Д2(Л->Яя)сД,(Вя)пГ. (3) Рассмотрим лишь случай, характерный для ИПФ: формула В„ имеет вид (С—» УхВ(х)) и получена из формулы Bh имеющей вид (С-> D(x)) по правилу «вв V». Доказательства остальных случаев не 151
отличаются от соответствующих доказательств теоремы о дедукции в ИВ, а условие (3) очевидно выполняется. По индуктивному предположению существует вывод из гипотез Г (это часть строящегося вывода (2) до места, связанного с формулой Д) ... (А -> Д), (2/) причем выполняется условие Д2/И-> Д)сА,(Д)пГ. (3/) Рассмотрим два случая. Случай l.Ae ЛДД). Переменная х не входит свободно в A2i(A -» —> Д), А и С, иначе в выводе (2) при переходе от Д к В„ она становилась бы связанной. Добавив к выводу (2/) несколько формул, получим вывод секвенции Г> (А -» Д): ... {А -> (С -> £(х)), ((Л & С) -> Д(х)), ((А & С) -> VxD(x)), (Л -> (С -» VxZ)(x)) (4) и А4И -» (С -» Vx£(x))] = А2И -> (С -> Z)(x))] с Д,(В„) п Г. Случай 2. /4 g А,(Д) = А,((С -» £(х))). Тогда можем построить вывод секвенции ГЬ5 Я„ ..., Dp= В (5) с Д5(5) = А2(В). Теперь добавив к выводу (5) две формулы, получим вывод Du ..., Dp =В,(В^(А^ В)), (А -> В), (6) где А6{А -> В) = А5(В) = А2(В) с A,(J5) п Г. Итак, теорема о дедукции доказана. ■ Как и в ИВ, теорема о дедукции в каком-то смысле утверждает обратное тому, что формулирует правило вывода «modus ponens». Теорема 7.2 (связь между Ь и -»). Справедливо следующее: Г, А\- В тогда и только тогда, когда Г1- (А —> 5), т. е. правила Г, ЛИ Г h (Л -» В) Th(A^B) И Г, ЛЬ 5 допустимы. 152
Доказательство. Первое правило — это теорема о дедукции. Для второго правила (которое можно называть обобщенным правилом «modus ponens») вывод из гипотез Г, А строится из имеющегося по условию вывода из гипотез Г Ви ..., Вп = (А -> В) добавлением двух формул В{, ..., Вп = {А -> В), А, В. ш Докажем еще несколько производных правил вывода. Правило исключения несущественной выводимой гипотезы. Если Г, А Ь В и А <£ А(В), то Г Ь В. (Здесь, конечно, имеется в виду множество Д, построенное для данного конкретного вывода секвенции Г, А \~ В.) Доказательство ведем индукцией по длине вывода секвенции Г, А\-В: В\, в2, ..., Вр. Рассмотрим лишь случай, характерный для ИПФ: формула Вр имеет вид (С -» VxD(x)) и получена из формулы Bh имеющей вид (С —> D(x)) по правилу «вв V». При этом переменная х не должна входить свободно в формулы из А(В) и С. Имеем А(ВР) = А(Д) и, так как А & А(Вр), то А & Д(Я,), по индуктивному предположению ГI- В,. Применяя правило «вв V», получим Г h Вр. ш ВИВ была доказана допустимость некоторых правил, в выводе которых использовалась теорема о дедукции. Рассмотрим на примере, что это не сможет повлиять на доказательство допустимости подобного правила в ИПФ. Пример 7.1. Доказать допустимость следующих правил (транзитивность): Г\-(А-+В), Г\-(В^С) Г,А^В, Г,В^С ГЬ(Л->С) и Г, ЛЬС Доказательства не отличаются от подобных в ИВ, так как все ограничительные условия уже содержатся в посылках. ■ Как и прежде, обозначение А = В будет пониматься как А \- В и В Ь А, а формулы А и В в этом случае будут называться эквива- ' лентными. Лемма 7.1 (о взаимозаменяемости эквивалентных формул). Пусть А= В. Тогда: 1) если А — подформула формулы С, а С* получается в результате замены некоторого вхождения А в Сна формулу В, то С= С*; 2) если Г, А \- D, то Г, В \- D; 3) если Г Ь А, то Г Ь В. 153
Доказательство как в ИВ. ■ Итак, видим, что формулы, для которых справедливо А = В, взаимозаменяемы, как в случае, когда они являются подформулами каких-то формул, когда они присутствуют среди гипотез, и тогда, когда они являются следствиями секвенций. Пример 7.2. Доказать, что -iVxA(x) = Зх-А(х) и -ЗхА(х) = Vx-iA(x). Действительно, формула Зх-,А(х) есть сокращение формулы -. А (х) -, -, А (х), т. е. -, Vx У А (х). Пример 7.3. Доказать, что МхА(х) = \/уА{у) и ЗхА(х) = ЗуА(у), если у не входит в А(х) ни свободно, ни связано. Имеем вывод. 1) \/хА{х){~А(у); 2) VxA(x)\-\/yA(y). Все другие случаи рассматриваются аналогично. Пример 7.4. Доказать, что VxVy/Kx,у) = \/уУхА{х,у) и ЗхЗуА(х,у) = ЗуЗхА(х,у). Имеем вывод. 1. УхУуА(х, у)\-МуА{х, у) (аксиома, терм х допустим для подстановки вместо х в А). 2. \/уА(х, у) h А(х, у) (аксиома, терм у допустим для подстановки вместо у в А). 3. УхУуА(х, у)\-А(х, у) (транзитивность). 4. Ух\/уА(х, у) \~ \/хА(х, у) (правило вывода, х не входит свободно в гипотезы). 5. Х/х\/уА(х, у) Ь- \/у\/хА(х, у) (правило вывода, у не входит свободно в гипотезы). Все другие случаи рассматриваются аналогично. Пример 7.5. Следующие допустимые правила вывода называются обобщенными правилами введения и удаления квантора V: ГЬЛ(х) Т\-МхА( \ ^Х не ВХ°ДИТ свободно в формулы из Г), ГЬУхЛСх) . —-—ттт~ (терм /допустим для подстановки вместо хв А). 1 г~ А\1) Первое правило почти «совпадает» с основным правилом вывода. Его допустимость доказывается так. 1. Г\-А(х). 2.r,y = yhA(x). 3. Г\-(у = у->\/хА(х)). 154
4. Г^(у = у->\/хА(х)). 5. Г, y = y<r \fxA(x). 6. ГЬУхЛ(х). Второе правило — это, по существу, аксиома L4. Пример 7.6. Следующие допустимые правила вывода называются обобщенными правилами введения и удаления квантора 3: Г\-А(Г) Г\~ЗхА(х) (теРм ^ допустим для подстановки вместо х в А), Г, А(х) Ь В Г ЧхА(х}\- Я (х не входит свободно в формулы из Г и В). Допустимость первого правила доказывается так. l.r\-A(t). 2.r,Vx-,A(x)\-A(t). 3. Г, А(0\--*Ах->А(х). 4. Г\--,Ух-,А(х). А это и есть Г Ь ЗхА(х). Докажем допустимость второго правила. 1. T,A(x)h В. 2. Г, -пВ\-^А(х). 3. Г, -,B\-Vx->A(x). 4. Г, -, Vx-^A(x)h В. А это и есть Г,ЗхА (х) \- В. С помощью многократного применения правил из примеров 7.5 и 7.6 можно доказать следующую теорему. Теорема 7.3 (о замыкании). Если термы ^допустимы для подстановки вместо х, в А и все х, не входят свободно в формулы из Г и В, то Г Ь Л(хь •••, х„) Г Ь Vx, ... \/х„А(хь ..., х„) Г Ь Vx, ... Vx„^(x,, ..., х„) Г Ь Л(?ь ..., /„) Г \-A(tu ..., t„) r,A(xi,...,x„)t-B Г f-Эх,... Зх„А(Х[, ..., х„) Г, ЗХ[ ...Зх„А(х{, ..., х„) Ь В Применяя несколько раз теорему о замыкании, легко доказать следующую полезную теорему. Теорема 7.4 (о подстановке). Если все х, не входят свободно в формулы из Г, то Т\-А(хи ...,хп) . Г \-A(tlt ...,/„) ' " Лемма 7.2 (о замене константы). Следующее правило Г h Л (о) Th\fuA(u) 155
допустимо, если а — константа, не встречающаяся в формулах из Г, а и — переменная, не входящая в вывод формулы А(а) из Г ни свободно, ни связанно. Доказательство. Рассмотрим вывод Ви ..., В„ из гипотез Г формулы Вп = А (а). Заменим везде в этом выводе константу а на переменную и. Тогда результирующая последовательность будет выводом формулы А (и) из Г. В самом деле, очевидно, что любая аксиома снова перейдет в аксиому того же вида. Если в аксиоме удаления квантора общности терм t содержал константу а, то теперь терм будет содержать новую переменную и, поэтому условие допустимости подстановки по-прежнему будет выполнено. Формулы из Г не изменятся, так как не содержат константу а. И при применении правил вывода изменений не произойдет. Применяя к полученному выводу правило введения V из примера 7.5, получим искомый вывод. ■ Некоторые аксиомы ИПФ говорят о свойствах символа - по отношению к предметным переменным, предикатам и функциям из сигнатуры о. Следующая теорема обобщает эти свойства на произвольные термы и формулы. Теорема 7.5 (оравенстве). Пусть А — формула, а /,, ..., /„ и sh ..., sn — термы, допустимые для подстановки вместо свободных переменных Х\, ..., х„ формулы А. Тогда: !)!-/,■ = /,■; 2) /,■ = (, Vtj= t,\ 3)t/=tj,tJ=tk^ti=tk; 4) /, = sh ..., t„ = s„ \-(P(tu ..., t„) -» PCs,, ..., s„)); 5) f, = sb ..., t„ = s„ \-f(th ..., t„) =f(si, ..., s„); 6) t\ = ж,, ..., t„ = s„ \-{A(tu ..., /„) -> A(sb ..., s„)). Доказательство. Учитывая аксиомы равенства, легко провести индукцию по шагам построения термов и формул. ■ 7.3. Пренексная нормальная форма Выведем в ИПФ еще ряд секвенций и эквивалентностей формул, которые позволят приводить формулы к некоторой нормальной форме. Заметим, что эквивалентность многих формул, которые встретятся, уже выводились в АПФ (см. 2.4). Правда, там эквивалентность формул понималась несколько по-другому: в АПФ формулы А(х, ..., у) и В(х, ..., у) назывались эквивалентными, и это обозначалось через А ~ В, если для любой алгебраической системы 9К соответствующей сигнатуры с основным множеством М для лю- 156
бых наборов значений переменных х = а, ..., у = b из М значения формул А(а, ..., Ь) и В(а, ..., Ь) на Мсовпадают. Во всех последующих примерах будем выводить А = В для формул, для которых известно, что А ~ В. Этот примечательный факт найдет свое объяснение, когда докажем теорему адекватности для ИПФ. Пример 7.7. Если формула В не содержит свободных вхождений х, то (УхЛ(х) v«) = Ух(А(х) v В); (ЗхА(х) v В) = Зх(А(х) v В); (УхЛ(х) & В) = Ух(Л(х) & 5); (ЗхДх) & В) = Зх(Л(х) & 5). Как и в АПФ, данные эквивалентности говорят о том, что кванторы можно «выносить» и «распределять» относительно v и &, если один из членов дизъюнкции и конъюнкции не зависит от переменной, которая связывается квантором. Имеем два вывода первой эквивалентности. 1.\/хА(х)\-А(х). 1. УхЛ(х) vS)h (А(х) v В). 2. А{х) \- (А(х) v В). 2. \/х{А{х) v Д) I- (-, Д -» Мх)). 3. \/хА{х) Ь (А(х) v В). 3. Ух(Л(х) v 5) h (-,5 -» УхЛ(х)). 4. Vx^(x) h Ух(Л(х) v Я). 4. Vx(/l(x) v #) h (УхЛ(*) v B). 5. 5h(^l(x)v5). 6. fih \/x(A{x)v B). 7. (УхЛ(х) vfi)h Ух(Л(х) v B). Другие эквивалентности выводятся аналогично. Пример 7.8. Вывести, что: 1) (УхДх) & Vx£(x)) = Ух(А(х) & В(х)); 2) (ЗхА(х) v ЗхВ(х)) = Зх(Л(х) v В(х)). И здесь квантор V можно «выносить» и «распределять» относительно &, а квантор 3 — относительно v, даже если оба члена зависят от связываемой переменной. Имеем два вывода первой эквивалентности. l.(VxA(x)&VxB(x))\- h \/хА(х). 2. (VxA(x)&\/xB(x))h h Vx5(x). 3. \/xA(x) \-A{x). 4. Vxfi(x) \- B(x). 5. A(x), B(x) \- (A(x) & B(x)). 6. (Vx^(x)&Vxfi(x))h h (A(x) & B(x)). 7. (Vx^(x)&Vxi?(x)l- h Vx(A(x) & B(x)). 1. Ух(Л(х) & fi(x)) h (Л(х) & B(x)). 2. (A(x) & B(x)) h A(x). 3. (A(x) & 5(x)) h 5(x). 4. Ух(Л(х) & 5(x)) h (/*(*)• 5. Vx(yl(x) & B(x)) V- B(x). 6. Vx(/l(x) & B(x)) Ь Vx^(x). 7. \/x(A(x) & B(x)) h \/xB(x). 8. УхЛ(х), VxS(x))b h (УхЛ(х) & Vx£(x)). 9. Ух(Л(х) & B(x)) \- h (УхЛ(х) & Vx£(x)). Другие эквивалентности выводятся аналогично. Пример 7.9. Если оба члена v зависят от связываемой переменной, то квантор V можно только «выносить», но не «распределять». 157
Аналогичное положение с квантором 3 и &. А именно, можно доказать, что: 1) Зх(А(х) & В(х)) \- (ЗхА(х) & ЗхВ(х)); 2) (УхЛ(х) v УхВ(х)) Ь (УхЛ(х) v VxB(x)). Имеем, например, вывод второй секвенции. 1. VxA(x) \-А(х). 2. \/хА(х) \- (А(х) v В(х)). 3. \/хА(х) \- \/х(А(х) v В{х)). 4. УхВ(х) \- В(х). 5. VxB(x) Ь (А(х) v й(х)). 6. \/хВ(х) Ь Ух(А(х) v В(х)). 7. (УхЛ(х) v VxS(x)) h Vx(A(x) v Я(х)). Попытки вывести «обратные» секвенции (ЗхЛ(х) & ЗхВ(х)) \- Зх(Л(х) & Я(х)); Vx(A(x) v В(х)) Ь (Vx^(x) v Vx5(x)) не приводят к успеху. По этой причине квантор 3 нельзя «выносить» из &, а квантор V нельзя «распределять» по v. Замечание. Попробуем «прочитать» секвенцию Vx(A(x) v В(х)) Ь (\/хЛ(х) v \/хВ(х)), вкладывая известный содержательный смысл в логические символы. Пусть формула А{х) на натуральных числах означает, что число х — простое, а формула В(х) означает, что число х — составное. Тогда посылка секвенции \/х(А(х) v В(х)) означает верное в арифметике натуральных чисел утверждение о том, что всякое натуральное число или простое, или является составным (число 0 по договоренности считаем составным числом). Следствие же секвенции (VxA(x) v VxB(x)) означает неверное утверждение, что всякое натуральное число является простым или же всякое натуральное число является составным. Когда будет найдена связь семантики и синтаксиса, увидим, что такой способ рассуждений о невыводимости секвенций имеет под собой веские основания. Пример 7.10. А что можно сказать про «перестановку» кванторов? Можно вывести: 1) VxVyA(x, у) = VyVxA(x, у); 2) ЗхЗуА(х, у) = ЗуЗхА{х, у); 3) ЗхУуА(х, у) I- УуЗхА(х, у). Однако секвенцию \/хЗхА(х, у) I- Зх\/уА(х, у) вывести не удастся. Докажем, например, третью секвенцию. Имеем: 1. \fyA(x, у) h А(х, у). 2. А(х, у) К ЗхА(х, у). 3. VyA(x, у) h ЗхА(х, у). 158
4. ЗхУуА(х, у) h ЗхА(х, у). 5. Зх\/уА(х, у) Ь УуЗхА(х, у). Замечание. Для понимания того, что вряд ли удастся вывести секвенцию УуЗхА(х, у) Ь ЗхУуА(х, у), применим способ «прочитывания» секвенции. Интерпретируя формулу А(х, у) как предикат х = у на натуральных числах, получим: посылка секвенции означает, что для каждого натурального числа у существует равное ему число х; следствие же говорит о том, что есть такое натуральное число х, которое равно любому числу у. Используя эквивалентности из приведенных примеров, можно доказать, что всякая формула ИПФ эквивалентна формуле, записанной в так называемой пренексной нормальной форме, т. е. имеющей вид Qx\Qx2 ... QxkA(xl, х2, ..., xk), где Q/ — один из кванторов V или 3, а формула А{хи х2, ..., хк) не содержит кванторов. Здесь слово Qxx Qx2 ••• Qxk называется квантор- ной приставкой формулы. Как уже говорили при изучении АПФ, в некоторых разделах математической логики «сложность» формулы часто оценивается числом перемен кванторов (переход от одного вида квантора к другому виду) в кванторной «приставке» ее пренексной нормальной формы. Если кванторная приставка имеет п перемен кванторов и начинается с квантора 3, то говорят, что формула относится к классу формул Z„, а если приставка начинается с квантора V, то формула относится к классу формул П„. Как конкретно приводить формулы к пренексной нормальной форме, будет ясно из нескольких следующих примеров. Пример 7.11. [3x\/y3zVuA(x, у, z, и) & Зх\/уЗ£УиВ(х, у, z, и)} = = 3x3vVy3z3w\/и[А(х, у, z, и) & B(v, у, w, и)] (для того чтобы сделать правильные «вынесения», меняли во втором члене конъюнкции переменные: х на v, z на w). Пример 7.12. [3xVy3zVuA(x, у, z, и) v 3xVy3zVuB{x, у, z, и)] = = 3x\/y\/v3z4u\/w[A{x, у, z, и) v B(v, v, z, w)] (и здесь меняли переменную у на v, и на w). Пример 7.13. [3x\/y3zVuA(x, у, z, и) -> 3x\/y3zVuB(x, у, z, «)] = = [\/x3yVz3u-iA(x, у, z, и) v 3xVy3zVuB(x, у, z, и)] = = [\fx3y\/z3u-:A(x, у, z, и) v 3s\/r3v\/wB(s, г, v, w)] = = \/x3y3s\/zVr3u3v\/w[A(x, е, z, и) -» B(s, г, v, w)} 159
(а здесь во втором члене дизъюнкции пришлось поменять все переменные). Понятно, что продемонстрирован лишь один этап приведения формулы к пренексной нормальной форме. Если бы формулы А и В содержали еще какие-то кванторы, то подобный процесс необходимо продолжать. В последнем примере кванторы можно было «выносить» и в другом порядке. Например, эта же формула эквивалентна следующей формуле: УхЗдЛ/^ЗыЗзУгЭгЛ/и^Дх, е, z, и) -> B(s, г, v, w)]. Здесь «вынесли» кванторы сначала первого члена v, а затем второго. Для данной формулы, когда выносили кванторы первым способом, то получили форму с 4 переменами кванторов, т.е. данная формула относится к классу сложности П4. Второй способ вынесения дал форму с 6 переменами, т.е. представление данной формулы в классе П6. В этом смысле первый способ оказался более «экономным».
ЧАСТЬ III СВЯЗЬ СЕМАНТИКИ И СИНТАКСИСА ГЛАВА 8 ИНТЕРПРЕТАЦИИ И СЕМАНТИКИ ДЛЯ ИСЧИСЛЕНИЙ 8.1. Семантика формул Изучая исчисления, смотрят на символы их языка и формулы лишь с синтаксической точки зрения, не интересуясь их конкретным содержанием. Будем теперь придавать некоторый семантический, содержательный смысл символам алфавита а и посмотрим, как при этом можно интерпретировать формулы языка La. Подходящим инструментом для подобных интерпретаций служат алгебраические системы. При этом будем использовать приемы и способы, которые применяли, когда придавали значения формулам из АВ и АПФ в гл. 2. Зафиксируем на дальнейшее две алгебраические системы а = </;и; /*',..., 1к/ >, Ш = <М; а0,...; Р?,...,Р?-, /,\ ...,/,"'> сигнатур \ = <п; /f1, ..., fr >, Будет удобно считать в дальнейшем, что среди элементов множества /всегда есть особый выделенный элемент и (читается «истина»), а среди функций /алгебраической системы 3 обязательно есть одноместная функция -i(.r), называемая отрицанием, и ->(и) ф и. Строя формулы языка La, сигнатуры X и с, будем считать, что в алфавите а: пропозициональные переменные обозначаются символами типа а, Ь, ..., щ, ..., Ь\, ... и принимают в качестве своих значений элементы множества /; предметные переменные обозначаются символами типа х, у, ..., хх, ..., уи ... и принимают в качестве своих значений элементы множества М; 161
логические связки обозначаются символами из сигнатуры А, и интерпретируются как функции /*',...,/*г алгебраической системы 3; константные, предикатные и функциональные символы обозначаются через а0, ..., Р"'1, ..., P™s и /,"', ..., /"' из сигнатуры 0 и интерпретируются как константы а0, ..., предикаты Рр, ..., Pfs и функции /"',..., f"' алгебраической системы 9Л. Пусть А(аь ..., ар, хи ..., х„) означает некоторую формулу языка La, где аи ..., ар — пропозициональные переменные, хь ..., х„ — предметные переменные, среди которых находятся все те переменные, которые были использованы при построении формулы А по правилам построения формул языка La. Естественно, некоторые из переменных а{, ..., ар, хь ..., хп формулы А могут оказаться фиктивными. Придавая пропозициональным переменным аь ..., ар некоторые значения /,, ..., ip из множества /, предметным переменным хь ..., хп некоторые значения ть ..., т„ из множества Л/и выполняя все указанные в А действия (логические из 3, предикатные и функциональные из 9Л), получим одно из значений в множестве /, которое будем обозначать через А(/,, ..., ip, ти ..., т„). Как и в случаях для АВ и АПФ, особую роль будут играть предложения, т.е. формулы, все переменные которых фиктивны. Другими словами, значение предложения А для таких алгебраических систем 3 и 9Л не зависит от значений его пропозициональных и предметных переменных, а имеет постоянное значение. Заметим, что в тех конкретных ИВ и ИПФ, которые были построены, все аксиомы являются тождественно истинными формулами, т.е. значения таких формул всегда равны и. Аналогично, правила вывода для ИВ и ИПФ будут обладать свойством сохранять истинность: если посылки правила при каких-то значениях переменных являются истинными, то и следствие правила будет истинным при этих же значениях переменных. Пару алгебраических систем <3; Ш> при подобном истолковании формул будем называть интерпретацией 9Л с логикой 3 языка La. Итак, каждая формула А(аь ..., ар, хи ..., х„) при интерпретации <3; 9Л>для каждого набора iu ..., ip, mh ..., т„ значений своих переменных будет иметь вполне определенное значение A(iu ..., ip, тъ ..., т„), равное какому-то элементу из /. Формулу А(аи ..., ар, х{, ..., х„) назовем выполнимой, если существует такая интерпретация <3; 9л> и такие значения переменных/,, ..., ip, тх, ..., т„, при которыхА(аь ..., ар, ть ..., тп)-и. Эту интерпретацию <3; 9Л> и значения переменных i{, ..., ip, 162
ти ..., т„ будем называть семантикой для формулы А. Если же А(аь ..., ар, ти ..., т„) ф и, то формула А(аи ..., ар, ти ..., т„) называется опровержимой при интерпретации <J; Tl>. Здесь уместно отметить одно очевидное свойство: формула А(аи ..., ар, хь ..., х„) выполнима при какой-то интерпретации и данных значениях переменных тогда и только тогда, когда формула —, А{аи ..., ар, х{, ..., х„) опровержима при этой же интерпретации. Для предложения А обозначим через Я&(А) класс всех семан- тик для А. Наоборот, для пары алгебраических систем <3; 9Я> обозначим через 1(<3; 9Л>) множество всех предложений А, для которых эта интерпретация является семантикой, т.е. А выполнимо (имеет значение и) при интерпретации <3; 9Л>. Обобщим эти понятия: если 21 — некоторое множество предложений, то пусть Яб(21) — класс всех семантик для 21, т.е. класс всех интерпретаций <3; 9Я>, на которых выполнимы все предложения из 21; Й6(21) называется аксиоматизированным классом с аксиомами 21; если 23 — некоторое множество интерпретаций (с одинаковыми сигнатурами), то пусть 1(03) — множество всех выполнимых на этих интерпретациях предложений, т.е. предложений, для которых все интерпретации из 23 являются семантиками; 1(55) называется элементарной теорий для алгебраических систем из 03. Понятия Я6(21) и 1(23) играют основную роль в изучении аксиоматических теорий. Свойства этих классов будут подробно рассмотрены в ч. IV. Там же укажем и конкретные элементарные теории для классических математических объектов. 8.2. Метасвойства исчислений Для построенных согласно программе Гильберта исчислений (формальных систем) обычно рассматривается ряд вопросов о свойствах, относящихся к их качественной-структуре. Естественно называть эти свойства метасвойствами. Наиболее типичные метасвойства исчислений — непротиворечивость, выполнимость, категоричность, полнота и независимость. Остановимся на каждом из этих свойств отдельно. Непротиворечивость. Допуская значительную свободу в выборе аксиом 21 и правил вывода 23 при построении исчисления Ф(21; ф), должны постараться избежать тривиальных или абсурдных исчислений. Например, если возьмем в качестве аксиом 21 все формулы FLa языка La, то получим крайне неинтересное исчисление, в котором все формулы будут выводимыми. Какая-либо ценность всех таких понятий, как вывод, исчисление и пр., в этом случае просто исчезает. 163
Другой пример: строим некоторое исчисление Фив итоге обнаруживаем, что в исчислении выводима некоторая формула А, а также выводимо ее отрицание, т.е. формула -> А. При всех реальных интерпретациях логических исчислений формулы А и -л А обычно отражают крайне «противоположные» свойства. Итак, в подобном исчислении Ф можем вывести, что некоторое свойство А выполняется и что это же свойство не выполняется. Назовем исчисление Ф противоречивым, если существует такая формула А, что \-фА и \-ф-,А. И наоборот, исчисление Ф непротиворечиво, если для него таких формул не существует. Совершенно категоричное требование, которое предъявлял Д.Гильберт к математическим теориям, и в частности к исчислениям, состояло в том, чтобы они были непротиворечивыми. , Особый интерес представляет вопрос: а как для конкретного исчисления доказывать его непротиворечивость? По мысли Д. Гильберта, такие доказательства должны в основном опираться на средства и понятия самих исчислений или на нечто, тесно с ними связанное. Для многих аксиоматических теорий, построенных в виде исчислений, удалось доказать их непротиворечивость, допустимыми Гильбертом средствами. В частности, так доказана непротиворечивость ИВ и ИПФ. Вместе с тем для многих достаточно богатых и выразительных теорий была доказана лишь их относительная непротиворечивость: данная теория непротиворечива, если непротиворечивы теория ZF или теория АП. Теории ZF и АП подробно рассмотрим в ч. IV. Как отмечалось во введении, для самих аксиоматических теорий ZF и АП доказательства их непротиворечивости, удовлетворяющие требованиям Гильберта, сталкиваются со значительными трудностями и, как доказано К. Геделем, просто невозможны. Это связано с тем, что множествами с отношением принадлежности можно называть (определять!) такие объекты, на которых верны все утверждения теории ZF. Представляется, что выводимые формулы теории ZF вполне адекватно описывают множества, удовлетворяющие наивным и интуитивным представлениям. И тут возникают, по крайней мере, две неприятности. Во-первых, теория ZF может выполняться и на других объектах, совершенно непохожих на множества, которые себе представляли. Эти новые семантики теории множеств могут быть даже не изоморфными! Во-вторых, все, что строили, да и сама теория ZF, опирается на понятие множеств, а множества определяются через теорию ZF. Порочный круг! Аналогичное положение и с натуральными числами, если выберем их в основе всех наших построений. Более того, теорема К. Геделя о неполноте арифметики натуральных чисел АП, о которой много раз упоминается в этой книге, свидетельствует о том, 164
что нет принципиальной возможности исправить эту ситуацию. Для того чтобы доказать непротиворечивость АП, нужно привлечь средства, выходящие за рамки формализма Д.Гильберта. Используя правила вывода с бесконечным числом посылок, Г. Генцен сумел доказать непротиворечивость АП. Другое доказательство непротиворечивости теории АП было также получено П.С.Новиковым. Выполнимость. Построив некоторое исчисление Ф, желательно узнать: существует ли такой «мир объектов», где выполняются все выводимые формулы исчисления Ф, т.е. имеется ли у исчисления Ф хотя бы одна семантика? Естественно, что для противоречивых исчислений подходящих семантик не существует: при любых интерпретациях значения Л(/|, ..., ip, тх, ..., тп) и-, A(ix, ..., ip, тх, ..., тп) противоположны. Противоречивое исчисление не выполняется ни в одном мире объектов! Будет ли непротиворечивое исчисление выполнимым — трудный вопрос, для этого нужно иметь запас алгебраических систем, которые будут претендентами на то, чтобы быть семантиками исчислений. Вместе с тем теорема Геделя о выполнимости, которую докажем в подразд. 10.3, дает универсальный положительный ответ на данный вопрос. Категоричность. Если исчисление Ф выполнимо, то возникает новый вопрос: сколько принципиально различных семантик имеется для Ф? Напомним, что называли две алгебраические системы ЗДТ, и 9Я2 одной сигнатуры изоморфными, если существует такое взаимнооднозначное соответствие а между Мх и М2, что для любых элементов х,, ..., х„ из Мх: 1) а (а,-) = а, для любой константы а, из а; 2) Р(а(хх), ..., а(х„)) = Р(хи ..., х„) для любого предиката из а; 3)/(а(х,), ..., а(х„)) = а/(х,, ..., хп) для любой функции из о. Как говорят, соответствие а сохраняет операции из а, т. е. каждая операция на М, ведет себя согласованно (при таком взаимнооднозначном соответствии) с соответствующей операцией на М2. Назовем пары интерпретаций <3Х, 971, > и <32, Ш2> изоморфными, если 3| и д2, 9Я, и 9д"2 изоморфны. Имеется в виду, что соответствие а переводит /, в /2, а Л/, в М2. Обычно правила построения формул носят индукционный характер (от «коротких» формул переходим к более «длинным»), и по этой причине будет возможным для любой формулы А(ах, ..., ар, X], ..., х„) и любых/,, ..., ip е /, /и,, ..., тп е Мдоказать, что аЛ(/,, ..., ip, тх, ..., т„) = А(а(ц), ..., a(ip), а(/я,), ..., а(т„)). Позднее назовем две интерпретации < 3,, 9Л, > и < 32, Ш2> элементарно эквивалентными, если их элементарные теории 1(<3Х, Шх>) 165
и 1(<32, 9Л2>) совпадают, т.е. эти две интерпретации невозможно отличить друг от друга с помощью логических формул. Естественно, изоморфные интерпретации элементарно эквивалентны. Однако существуют и не изоморфные, но элементарно эквивалентные интерпретации. Называем исчисление Ф категоричным, если любые его семантики изоморфны. Категоричное исчисление в наиболее полной мере характеризует, с точностью до изоморфизма, тот «мир объектов», на котором это исчисление выполняется. Доказывать категоричность какого-либо исчисления дело довольно трудное, так как это свойство исчислений (теорий) встречается довольно редко. Действительно, если данное исчисление имеет неравномощные семантики, то они не могут быть изоморфными. По этой причине рассматривается другое понятие категоричности. Пусть т — какое-то кардинальное число. Назовем исчисление Ф т-категоричным, если любые его семантики, основные множества которых имеют мощность тп, изоморфны. Полнота. Построив исчисление Ф, можем поставить и такой вопрос: а не мало ли выбрали аксиом и правил вывода, чтобы выводимых формул было достаточно для достижения выбранных целей? Ответ на этот вопрос в сильной степени зависит от этих выбранных целей. Если некоторая формула В такова, что ни В, ни -, Вне являются выводимыми в исчислении Ф, то В называется неразрешимой для Ф. Будем называть исчисление Ф полным относительно некоторого множества формул 23, если каждая формула из 33 разрешима для Ф, т.е. может быть подтверждена, или опровергнута в Ф, другими словами, в исчислении Ф либо выводима сама формула В, либо выводимо ее отрицание ->#. Чаще всего в качестве такого множества формул 03 берут некоторое множество предложений. Уже упоминавшийся результат К. Геделя как раз и состоит в том, что для теории АП строятся неразрешимые предложения; по этой причине эта знаменитая теорема и носит название «Теорема Геделя о неполноте арифметики натуральных чисел». Другой аспект понятия полноты исчислений состоит в следующем. Построив на базе аксиом 21 и правил вывода 94 какое-то непротиворечивое исчисление Ф(21; 94), можем задуматься: а нельзя ли добавить к аксиомам 21 еще какую-нибудь неразрешимую для Ф(21; 94) формулу (чаще всего предложение) А, но так, чтобы исчисление Ф(21 и {A}; 94) осталось непротиворечивым? Будем называть непротиворечивое исчисление Ф(21; 94) пополняемым, если существует такая неразрешимая для Ф(21; 94) формула А, что исчисление Ф(21 и {А}; 94) непротиворечиво; в противном случае исчисление Ф(21; 94) называется непополняе- мым. 166
Итак, непополняемые исчисления невозможно без противоречий пополнить (расширить). Это означает, что такие исчисления вобрали в себя довольно компактное (полное) множество формул. Независимость. Часто, но не всегда, строя исчисление Ф, стараются избрать систему аксиом и правил вывода независимыми. Напомним, что построение неевклидовых геометрий (и, в частности, геометрии Лобачевского!) было связано с попытками доказать независимость аксиом Евклида. Формула В называется независимой от аксиом из 21 и правил вывода ф, если в исчислении Ф(21; 91) формула В не является выводимой. Правило вывода R назовем независимым от аксиом из 21 и правил вывода 91, если правило R не является допустимым правилом вывода в исчислении Ф(21; 91). Для доказательства независимости формул полезна следующая лемма. Лемма 8.1. Пусть <3; 9Л> — семантика для Ф(21; 91). Если предложение В не является истинным при <3; 9Л>, то В независима от аксиом 21 и правил вывода 91 Доказательство очевидно. ■ Этот результат дает наилучший способ доказательств независимости: надо строить такую семантику для Ф(21; 91), на которой рассматриваемая на независимость формула В не была бы истинной.
ГЛАВА 9 ИНТЕРПРЕТАЦИИ ДЛЯ ИВ 9.1. Семантики для ИВ Отличительной особенностью ИВ является то, что в алфавите а имеются лишь пропозициональные переменные, логические связки, вспомогательные символы, но нет предметных переменных, константных, предикатных и функциональных символов. Исчисления с подобными алфавитами обычно носят название пропозициональных. По этим причинам понятия интерпретаций и семантик для пропозициональных исчислений можно значительно упростить и модифицировать, в частности, не рассматривать алгебраических систем ПЯ, которые специально введены для интерпретирования предметных переменных, константных, предикатных и функциональных символов. Итак, интерпретацией языка La пропозиционального исчисления Ф назовем алгебраическую систему В формуле А(аи ..., ар) пропозициональные переменные щ, ..., ар будут принимать в качестве значений элементы из множества /, а логические связки будут интерпретироваться как функции /f1, ..., I,*- на множестве /. Логическими связками для ИВ являются -. и -». Далее зафиксируем некоторое подмножество С с I и назовем объекты из С выделенными элементами. Будем также считать, что значения функции -, на элементах из множества С не являются выделенными элементами, т.е. для любого элемента се С имеем-.с г С. Назовем формулу А(аь ..., ар) общезначимой при интерпретации 3 с выделенным множеством С, если при любых значениях /i, ..., ip переменных а\, ..., ар из множества /значение А(/,, ..., ip) принадлежит множеству выделенных элементов С. Как видим, это понятие является обобщением понятия тождественно истинной формулы АВ. Пусть Ф(21; УК) — пропозициональное исчисление, заданное схемами аксиом 21 и правилами вывода УК. Интерпретацию 3 = < /; С; /f', ..., lfr > с выделенными элементами С называем семантикой для исчисления Ф(21; УК) (вносим множество С в запись алгебраической системы 3), если: 168
1) все аксиомы 21 общезначимы при 3; 2) все правила вывода ф сохраняют свойство формул быть общезначимыми при 3, т.е. если посылки какого-то правила из ф общезначимы при 3, то и непосредственное следствие этих посылок по этому правилу вывода также общезначимо; 3) две формулы А и -, А не могут быть одновременно общезначимыми. Конечно, в общем случае конкретное исчисление Ф может иметь несколько различных семантик (или не иметь никаких семантик!). Подбор подходящих семантик для исчислений позволяет решать ряд важных вопросов, связанных с самими исчислениями. Для ИВ построим несколько семантик. Первая семантика для ИВ. Для ИВ изберем следующую интерпретацию З^ = </; С; о>, где / = {и, л}, С = {и}, а = {-., —>}. Функции из о выберем так, чтобы они соответствовали обычным булевым функциям пИ4. Назовем такую интерпретацию 3^ классической. Как знаем, общезначимыми формулами при этой интерпретации 3^ являются тождественно истинные формулы, правило вывода «modus ponens» сохраняет свойство быть общезначимой формулой, а формулы А и -. А не могут одновременно быть общезначимыми. Итак, видим, что интерпретация Зш является семантикой для ИВ, которую также будем называть классической. Вторая семантика для ИВ. Рассмотрим следующую интерпретацию: 3, = </,; С„ о>, где /, = {1, 0}, С, ={1}, а = Ь, ->}, a -. х = 1 - х и (х -»у) - 1 - х + ху. Легко убедиться, что интерпретация 3, также является семантикой для ИВ. Если ее сравнивать с семантикой 3^, то увидим: они отличаются лишь тем, что объекты из множеств /и /,, хотя и обозначены по-разному, ведут себя по отношению к операциям совершенно согласованно. А именно, докажем, что интерпретации З^и 3, изоморфны. Установим взаимно-однозначное соответствие а между множествами /и /, так: а(и) = 1, а(л) = 0. Докажем, что а(-> х) = —, а(х). Действительно, имеем: oc(-i и) = ос(л) = 0 = -1 1 = -1 а(и), a(-i л) = а (и) = 1 = -1 0 = -1 а (л). Для второй операции имеем: а ((и -> и)) = а (и) = 1; (а (и) -> а (и)) = (1 -» 1) = 1; а((и -> л)) = а (л) = 0; (а (и) -» а(л)) = (1 -» 0) = 0; а ((л -> и)) = а (и) = 1; (а (л) -» а (и)) = (0 -> 1) = 1; 169
ос((л -» л)) = а(и) = 1; (а (л) -» а (л)) = (0 —> 0) = 1, т.е. а((х -> у)) = (а(х) -> а(у)). Таким образом, в семантике 3, элемент 1 играет ту же роль, что и элемент и из семантики 3^, роль л играет объект 0. Третья семантика для ИВ. Рассмотрим следующую интерпретацию: 32 = < 12, С2, о >, где /2 = {a u b, а, Ь, а гл Ь}, С2 = {а и />}, о = {-1, -»}, где -1 х = (а и Z>) - х, а (х —> у) - -, х и у. Здесь a, b — некоторые фиксированные непустые, непересекающиеся множества, а -, и, п — обычные теоретико-множественные операции. Заметим, что данная интерпретация не является изоморфной интерпретациям Зш и 3,, так как множество /2 состоит из четырех элементов, а множества /и /, — из двух элементов. Докажем, что 32 является семантикой для ИВ. Заметим вначале, что Xvj^X=aub для любого элемента X множества /2. Аксиома L\ может быть преобразована следующим образом: [A-*(B^A)\=-iA\j(^B\jAJ=a<jb, а это выделенный элемент из С2. Аксиома L2 преобразуется так: {[А -> (Д -» С)] -> [И -> Я) -> И -> С)]} = = -! И -> (Я -» С)] и [-. (Л -» Д) и (-, Л и С)] = = -1[-1/(и(-,ДиС)]и-,(-1^ив)и-,у4иС = = (/1п5ПпС)и(^Ппй)ип/1иС = = (ЛиЛи^ЛиС)п(Ли-,Ди^ЛиС)п п(ДиЛи-1Ли^С)п(Ди^Ди-,ЛиС)п п (-1 Cu/lu-i/lu С) п (-1 Cu-.5u-.v4u С) = a u Ь, а это выделенный элемент из С2. Аксиома L3 преобразуется так: [Ь Л -» -. Д) -» (Я -» Л)] = -, (Л и -л Д) и -, Д и Л = = (-лЛп-,5)и-,ДиЛ = (-,Ли-лДиД)п(-1Ди^ДиЛ) = = avj Ь, т. е. снова выделенный элемент из С2. Итак, видим, что аксиомы ИВ являются общезначимыми при 32. Осталось рассмотреть правило «modus ponens». Если А = a u b и (Л-»2?) = виЛ, то-|Л = апйи-1/4и.5=оиЛ, что может выполняться лишь при Д = flu b. Если какая-то формула Л при некоторых значениях переменных принимает значение a u Ь, то формула -. А при этих же значениях 170
примет значение a n Ь. По этой причине формулы А аи6=1 и -. А не могут быть одновременно общезначимы- /\ ми при данной интерпретации 32. / \ Все вычисления свидетельствуют, что 32 явля- а/ \ь ется семантикой для ИВ. \ / Здесь роль и (истины) исполняет объект a и b, а \ / роль л (лжи) — объект а п Ь. Объекты а, Ъ занима- \/ ют некоторое промежуточное положение по отно- anb=0 шению к истине и лжи — интересно было бы придать им некоторый семантический смысл при подобном содержательном истолковании. Можем смотреть на основное множество /2 = {а и b, a, b, a n Ь) семантики 32 как на частично упорядоченное множество. Граф этого множества показан на рис. 9.1. Итак, объект a n b — наименьший (т.е. он меньше любого другого), а объект a u b — наибольший (т. е. он больше любого другого) элемент при указанном порядке. Обозначим эти объекты через О и 1. При указанном порядке объекты а и b не сравнимы между собой. Если будем вычислять значения логических функций для этих объектов, то -1 0 = 1, -I 1 = 0, —ta = b, -^ b - а; (x->y) = (-ixuy). Четвертая семантика для ИВ. В подразд. 4.4 была построена алгебраическая система, называемая алгеброй Линденбаума для АВ: Lin = < М; И; -., -», > (в действительности там строилась система с несколько другой сигнатурой Lin = < М; 1; 0; п, п, '>, где И надо интерпретировать как 1, а операции пи^ понимать согласно их определениям). Соотношения, указанные для этой алгебры, позволяют легко доказать, что она является семантикой для ИВ. Возьмем, например, аксиому L\ - [А -> (В ~> А)], будем иметь: [[А] -» ([В] -> [А])] = [А^(В^ А)} = И, так как [А —> (В —» А)] — выводимая в ИВ формула. Для аксиом L2 и L3 все делается аналогично. Рассмотрим правило вывода «modus ponens». Пусть [А] = И и ([А] —> [В]) = И. Тогда [(А -» В)] = И. Но значит, формулы А и (А -» -> /?) выводимы. По правилу «modus ponens» и формула 5 выводима, т.е. [В] = И. Имеем И = [(a v -л а)] = [-1 -1 (a v -, а)] = -, [-i (a v -, а)] = = -, [(д&-,йг)] = -,Л; 171
Л = [(а & -■ а)] = [-,-, (а & -, а)] = -,Ь{а&-, а)] = = -, [(a v -, а)] = -, И (здесь, конечно, учитываются известные сокращения для логических связок v и &). Если какая-то формула /1 при некоторых значениях переменных принимает значение И, то формула -, А при этих же значениях примет значение Л. По этой причине формулы А и -, А не могут быть одновременно общезначимыми при данной интерпретации Lin. 9.2. Метасвойства ИВ Исследуем, какие из метасвойств, перечисленные в подразд. 8.2, выполняются для ИВ. Как уже говорили, ИВ относится к пропозициональным исчислениям, т.е. в его алфавите а имеются лишь пропозициональные переменные, логические связки, вспомогательные символы, но нет предметных переменных, константных, предикатных и функциональных символов. Это позволяет значительно упростить понятие интерпретации, так как интерпретировать придется лишь чисто логические понятия. Напомним, что пропозициональное исчисление Ф, в алфавите а которого имеется символ -., называется противоречивым, если существует такая формула А языка La, что \-ФА и \-ф-,А. Если такой формулы не существует, то исчисление Ф называется непротиворечивым. Теорема 9.1. ИВ непротиворечиво. Доказательство. Действительно, если для какой-то формулы А выполняется \-тАи\-т-,А, то по теореме адекватности формулы А и -i А должны быть тождественно истинными в АВ. Но этого быть не может, так как значения формул А и -1 А в АВ противоположны. ■ Напомним, что пропозициональное исчисление Ф называется выполнимым, если для этого исчисления существует некоторая семантика 3, т.е. все выводимые в Ф выполняются (верны) в «каком-нибудь мире объектов»; Ф называется категоричным, если любые его семантики изоморфны. Теорема 9.2. ИВ выполнимо, но не является категоричным. Доказательство. Для ИВ уже построили несколько подходящих семантик, среди которых имеются неизоморфные. ■ 172
Теперь обратимся к вопросу о полноте ИВ. Напомним, что пропозициональное исчисление Ф называется полным относительно некоторого множества формул *8, если каждая формула В из *Б разрешима для Ф, т.е. в теории Ф либо выводима сама формула В, либо выводимо ее отрицание -. В. Конечно, ИВ не является полным по отношению к множеству FLa всех формул соответствующего языка. Действительно, если возьмем любую переменную х, то в И В нельзя вывести ни формулу х, ни формулу -л х, поскольку они обе не являются тождественно истинными. Таким образом, эта формула х неразрешима в ИВ. Неразрешимыми в ИВ будут и все формулы А, которые при интерпретации 4л не являются постоянными, т.е. при некоторых значениях переменных принимают как значение и, так и значение л. Однако если в качестве <Б возьмем как раз тождественно истинные и тождественно ложные формулы, то по отношению к этому множеству 03 ИВ будет полным. Теорема 9.3. ИВ полно по отношению к множеству постоянных формул. Доказательство. Прямо следует из теоремы адекватности. ■ Но при построении ИВ как раз и добивались, чтобы в нем были выводимы все тождественно истинные формулы и только они. В этом смысле выбор аксиом и правил вывода ИВ оказался очень удачным. На очереди стоит вопрос о пополняемости ИВ. Напомним, что непротиворечивое исчисление Ф(21; 1Я) пополняемо, если существует такая неразрешимая для Ф(21; 1Н) формула А, что исчисление Ф({21 и А}; 9\) непротиворечиво; в противном случае исчисление Ф(21; fR) называется непополняемым. Возьмем какую-нибудь неразрешимую для ИВ формулу A(ah ..., а„). Это означает, что формула не является тождественно истинной, т.е. при некоторых значениях /ь ..., /„ переменных аи ..., а„ значение формулы A(iu ..., /„) = л. Зафиксируем на дальнейшее один такой набор /,, i2, ..., /„. Сделаем некоторые подстановки вместо переменных а,, ..., а„ в формулу А: если /, = и, то вместо я, подставляем тождественно истинную формулу (b v -, />); если а, = л, то вместо х-, подставляем тождественно ложную формулу (Ь & -I Ь). Получим некоторую тождественно ложную формулу В{Ь). Если обозначим через ИВ, исчисление, полученное из ИВ добавлением новой аксиомы А(аи ..., а„), то ясно, что ЬИВ|б(6) и \-тГВ(Ь) (вторая формула, как тождественно истинная, выводима даже в ИВ). 173
Случай, когда к ИВ добавляется тождественно ложная формула, получается сразу. Итак, ИВ! противоречиво. Теорема 9.4. ИВ непополняемо. И наконец, обратимся к вопросу о независимости аксиом и правил вывода ИВ. Напомним, что формула В называется независимой от множества формул 21 и правил вывода УК, если в исчислении Ф(21; УК) формула В не является выводимой. Правило вывода R назовем независимым от множества формул 21 и правил вывода УК, если правило R не является допустимым правилом вывода в исчислении Ф(21; УК). Лемма 8.1 (см. подразд. 8.2) полезна при доказательствах на независимость. Переформулировка этой леммы для общезначимых формул выглядит так. Лемма 9.1. Пусть УЯ = < М; С;о> — семантика для пропозиционального исчисления Ф(21; УК). Если формула В не является общезначимой при ОТ = < М; С; о>, то В независима от множества , формул 21 и правил вывода УК. Доказательство очевидно. ■ Для доказательства независимости аксиом ИВ будем строить соответствующие интерпретации 3,- = < /,; С,; -i ->> так, чтобы все схемы аксиом Lj при j ^ / были общезначимы при 3,, а для Lj существовали бы значения переменных, при которых значение L/ не принадлежало Q; при этом правило вывода «modus ponens» сохраняло бы свойство формул быть общезначимыми при данной интерпретации ОТ,. Пример 9.1. Проще всего доказать независимость схемы аксиом L3 от схем аксиом L{ и L2 и правила вывода «modus ponens». Надо взять классическую интерпретацию, но немного «испортить» функцию -I с тем, чтобы 13 не была общезначимой. Строим интерпретацию 33 следующим образом. Положим /3 = = {и, л}, С3 = {и}. Значения функции (х->_у) подсчитываются как и в /ю1. А вот функцию -> х будем считать постоянной, равной л при любых значениях переменной х. Так как аксиомы L, и £2явно не содержат символа -, (конечно, такой символ может входить в формулы А, В или С, но это несущественно), то доказательство их общезначимости при интерпретации 33 такое же, как в случае интерпретации 3^,. Аналогичная ситуация с правилом «modus ponens». Но формула L3 т.е. [(-i А —» -, В) —> (В -н> А)] при А = л и В = и принимает значение л, и значит, не является общезначимой при интерпретации ОТ3. Пример 9.2. Для доказательства независимости формулы /., от остальных аксиом ИВ и правила «modus ponens» понадобится трехзначная интерпретация (она имеет тесную связь с некоторой трехзначной логикой, т.е. в интерпретации 3, множество 1Х будет состо- 174
ять из трех элементов). Будет удобнее эти элементы обозначать через 0, 1, 2, что, естественно, не повлияет на доказательство. При таких обозначениях задание функций, соответствующих логическим символам, и проводимые рассуждения будут более наглядными. Строим соответствующую интерпретацию 3) следующим образом. Пусть /, = {0, 1, 2}, С, = {0,}, -пх=2-х, \2, если х < у; (х -> у) = i [О, если у < х. Аксиома L,, т. е. формула [А-*(В-> А)] при А = 1, В = 0, принимает значение 2, не принадлежащее С{. Таким образом, Lx не является общезначимой при интерпретации 3,. Пусть L2= {[А -> (В -» С)] -> [(А -» В) -» (Л -» С)]} * 0 при некоторых значениях переменных /I, 5, С. Тогда [А -» (5 -» С)] < < [(Л -> В) -> (Л -> С)], а значит, [А -» (В -> С)1 = 0 и [И -> Я) -» -»(Л -> С)] = 2. Далее, (/4 н> В) < (А -> С), т.е. (/1 -> В) = 0 и (Л -» С) = 2, и поэтому В<А<С. Имеем (В -> С) = 2 и (В -» С) < <А, т.е. А = 2. Это противоречит тому, что А < С. Итак, нет таких значений переменных, при которых L2 Ф 0. Таким образом, L2 общезначима при данной интерпретации 3,. Пусть Lt, = [(-. А -»-л В) -> (£> —> А)] ф О при некоторых значениях переменных Л, В. Тогда (-, А -» -, В) < (В —> /1). Таким образом, (В -» у4) ф 0, и значит, В < А. Но тогда -.,4 = 2-Л<2-В = -,В, следовательно, (-. А -> -i В) = 2. Но тогда бы формула [(-. Л -» -, -iB) -н> (В —> Л)] приняла значение 0, что противоречит нашему выбору. Итак, нет таких значений переменных, при которых Ц ф 0. Таким образом, L3 общезначима при данной интерпретации 3,. Наконец, пусть А = 0 и (А -» В) = 0 при любых значениях переменных. Тогда В < А и В = 0. Таким образом, правило вывода «modus ponens» сохраняет свойство формул быть общезначимой при данной интерпретации 3,. Пример 9.3. Схема аксиом L2 независима от остальных аксиом ИВ и правила вывода «modus ponens». Для построения интерпретации 32 возьмем снова трехзначный случай: /2 = {0, 1, 2}, С2 = {0}, -I х = 2 - х, \у - х, если х < у, [ 0, если у < х. Пусть L, = [А —> (В -> А)] ф 0 при некоторых значениях переменных. Тогда А < (В -^ А), т.е. (В-^А) = А-Вф0и В <А. Имеем А < А - В, но такого быть не может. Таким образом, нет таких значений переменных, при которых L, ф 0. Итак, Lx общезначима при 32. 175
Формула L2 = {[A -> (Я -» С)] -> \(А ->В)^(А-> С)]} при А = 1, 5=1, Ct= 2 принимает значение 1. Так как 1 не принадлежит С2, то L2 не является общезначимой при интерпретации 32. Пусть Lt, = [(-1Л -> -1 й) -»(5 ~> Л)] * 0 при некоторых значениях переменных А, В. Тогда (В -> /1) ф 0, и значит, Z? < Л и (В -» А) = = у4 - В. Но тогда -iy4 = 2-/4<2-Z? = -ii?, следовательно, (-. Л -»-. -ifi) = (2 - 5) - (2 - Д) = А - В. Но тогда бы формула [(-, А —> -i В) —> -»(Z? -» Л)] приняла значение 0, что противоречит нашему выбору. Итак, нет таких значений переменных, при которых Z,3 ф 0. Таким образом, Lj, общезначима при данной интерпретации 32. Наконец, пусть А = 0 и (А -^ В) = 0 при любых значениях переменных. Тогда В < А и В = 0. Таким образом, правило вывода «modus ponens» сохраняет свойство формул быть общезначимой при данной интерпретации 32- Пример 9.4. Правило «modus ponens» не зависит от аксиом ИВ. Действительно, так как в ИВ имеется только одно правило вывода, то, если его выбросим, в оставшемся исчислении невозможно вывести ни одной формулы, кроме самих аксиом.
ГЛАВА 10 ИНТЕРПРЕТАЦИИ ДЛЯ ИПФ 10.1. Выполнимость формул ИПФ Для построения конкретной интерпретации с логикой языка La исчисления сигнатуры с необходимо иметь две алгебраические системы 3=</; и; /f',...,/*->, Ш = <М; а0, ...; />,"', ..., Р?*; /,"', ..., /,"<> сигнатур 1 = <п; /f\ ...,lk/>, а = <оо,...; Л"1.-. Т-; /Г,-, /,"'>■ В случае исчисления ИПФ будем использовать классическую логику, т.е. в алгебраической системе 3 множество / = {и, л}, а функции -,, -» есть обычные классические операции отрицания и импликации. По этой причине, говоря об интерпретациях для ИПФ, будем указывать лишь Ш, опуская 3. Тогда символы языка La будут интерпретироваться следующим образом: логические связки — как функции -,, -»; предметные переменные будут принимать в качестве своих значений элементы множества М; константы, предметные и функциональные символы — как конкретные константы, предикаты и функции алгебраической системы 9Л. В этом случае пропозициональных переменных просто нет. Их роль будут исполнять формулы языка La, так как эти формулы будут принимать в качестве своих значений элементы множества /, т.е. и и л. По существу, это будут предикаты на множестве М, но не заданные заранее в ЗЛ, а полученные с помощью логических средств. Теперь предстоит определить значения формул, в том числе значения термов и атомных формул на алгебраической системе 9Jt соответствующей сигнатуры. 177
Начнем с определения значений термов. Понятие терма вводилось индуктивно, идя от коротких термов к более длинным. Также поступим с определением их значений. Пусть t(xx, ..., х„) — терм, построенный из каких-то констант и свободных переменных хх, ..., х„; как известно, связанных переменных в термах нет. Придадим переменным х{, ..., х„ значения тх, ..., т„ е М. Определяем значение t(mx, ..., т„) индуктивно: 1) если / — константа ah то значение t равно а,; 2) если t — переменная х„ то значение / равно т,; 3) если / е о и термы tx, ..., tm имеют значения рх, ..., рт, то значение терма /(/,, ..., tm) равно/(р,, ..., рт). Переходим к определению значения атомной формулы А(хх, ..., х„) при значениях тх, ..., тп ее свободных переменных хх, ..., х„. 1. Пусть А(хх, ..., х„) есть атомная формула P(tb ..., tm) для Peon некоторых термов tu ..., tm и пусть при этих значениях переменных термы имеют значения рь ..., рт. Тогда значение формулы А(ть ..., тп) полагаем равным Р(р{, ..., рт), т.е. и или л. 2. Пусть А(хи ...,х„) есть атомная формула t{ = t2 для некоторых термов t\, t24 пусть при этих значениях переменных термы имеют значения рх и р2. Тогда значение формулы А{ти ..., тп) полагаем равным и, если С\ = с2, и л — в противном случае. И наконец, определим значение формулы А(хи ..., х„) при значениях тъ ..., т„ ее свободных переменных хх, ..., х„. 1. Если А(хь ..., х„) есть атомная формула, то ее значение А(ть ..., тп) уже было определено. 2. Если А(х\, ..., х„) есть -^В(хи ..., х„), то А(ть ..., т„) = -пВ(ти ..., т„). 3. Если А(х\, ..., х„) есть (В(хь ..., х„) —> С(х\, ..., х„)), то А(тх, ..., т„) = (В(ти ..., т„) -> С(ти ..., т„)). 4. Если А(хи .... х„) есть УхВ(х, хх, ..., х„), то А(тх, ..., т„) = и, если при всех значениях т е Мпеременной х значение В(т, тх, ..., т„) = и. Итак, каждая формула А(хх, ..., хп) при значениях ее свободных переменных ти ..., тп на алгебраической системе ЯЯ принимает одно из значений — и или л. В формулах используем и другие символы для логических операций, такие, как &, v и 3. Вспоминая, для каких сокращений эти символы применяют, легко понять: 1) значения формул (А & В) и (A v В) вычисляются по таблицам истинности для конъюнкции и дизъюнкции АВ; 2) если А(хъ ..., х„) есть ЗхВ(х, хь ..., х„), то А(тх, ..., тп) = и, если существует значение т е Мпеременной х, такое, что В(тх, ..., т„) = и. 178
Замечание. В подразд. 2.3 уже объяснялось, почему при вычислении значений формул придаем значения лишь ее свободным переменным. Это связано с тем, что свободные и связанные переменные играют в формулах различные роли. Рассмотрим, например, формулу 3yQ(x, у), где Qe а. Пусть х = b& М. Если придать свободной переменной у формулы Q(x, у) различные значения из множества М алгебраической системы 9Л, то получим осмысленные утверждения об элементах множества М: Р(Ь, /я,), P(b, т2), ... И если для некоторого те М имеем Р(Ь, т) = и, то 3yQ(b, у) = и. Если же придадим связанной переменной у значение т, то будем получать бессмысленные выражения типа: существует элемент т (он конкретно выбран!), такой, что справедливо Р(Ь, т). Связанная переменная перестает «играть роль» переменной, она лишь служит целям описания той функциональной зависимости от свободных переменных, которую стараемся выразить с помощью формулы. Как всегда, особый интерес представляют предложения, т.е. формулы без свободных переменных. На каждой алгебраической системе предложения имеют свое постоянное значение. Если предложение А имеет на алгебраической системе ЯЛ значение и, то его называют выполнимым в системе ЯЛ; если же значение предложения А на ЯЛ равно л, то оно опровергается на системе ЯЛ. Можно говорить о тождественной истинности формул, содержащих свободные переменные: А(хи ..., х„) — тождественно истинная формула, если для любых значений ти ..., т„ переменных X), ..., хп любой системы ЯЛ значение А(ть ..., тп) = и. Другими словами, формула Vx, ... Vx„ А(хъ ..., х„) должна быть тождественно истинной. Последнее предложение называется замыканием формулы А(хи ..., х„). В связи с этим отметим некоторую аналогию понятий тождественной истинности формул и выводимости формул в ИПФ. А именно в ИПФ по теореме о замыкании формула А(хи ..., х„) выводима тогда и только тогда," когда выводимо ее замыкание Vx, ... Vx„ А(хь ..., х„). Пример 10.1. В примере 2.18 был выяснен характер следующих формул: [ЭхУуР(х, у) -» УуЗхР(х, у)]; [3xQ(x, х, х) -» VxQ(x, х, х)]; 3xVy[R(x, х) & -,/?(х, у)]; \/ху(х + у = у + х) по их отношению к выполнимости. 179
При этом первое предложение является тождественно истинным, третье — тождественно ложным. Второе и четвертое предложения выполняются и опровергаются на некоторых алгебраических системах. Пример 10.2. Рассмотрим предложение 3xVy3z{[A(y, z) -> А(х, z)] -*[А(х, х) -> А(у, х)]}, где А — некоторый двухместный предикат. Пусть на какой-то модели ЯЛ = < М; А> формула имеет значение л. Это означает, что для всякого элемента х можно найти такой элемент сс(х) е М, что А(х, х) = и, А(а(х), х) = л и для любого z имеем А(а(х), z) —> А(х, z) = и. Из этого следует, что а(х) * х и А(х, ос(х)) = и. Итак, получили новый элемент а(х), не равный х. Теперь для элемента ос(х) строим этим же путем элемент аа(х). Будем иметь А(х, а(х)) = и, но А(аа(х), а(х)) - л, что означает, что аос(х) *х. По построению аа(х) ^ а(х). Итак, получили новый элемент асс(х), не равный х и ос(х). Продолжая этот процесс, строим некоторое бесконечное множество {х, а(х) аа(х), ...}. Приходим к выводу, что формула выполняется на всякой конечной модели Ш -< М; А>. Пример 10.3. Интересное свойство имеет следующее предложение: (А& В& С), где формула А есть Vx3y(x < у), В есть Vxy[x < у -* -1 (у < х)], & С есть Vxyz[(x < у & у < z) -» х < z]. Ясно, что это предложение выполнимо на алгебраической системе 91 = < N; о, где N — обычные натуральные числа, а предикат х < у означает отношение строгого неравенства. Но интересен несколько другой вопрос: может ли это предложение выполняться на какой-нибудь конечной алгебраической системе? Пусть ОТ = < М; о — алгебраическая система, на которой хотим, чтобы предложение было истинным. Возьмем произвольный элемент т0 е М. Из А следует, что для mQ существует элемент да,, такой, что т0< да,. Из В следует, что это тх не может быть равным т0. Но для т{ существует элемент т2, такой, что да, < т2. Из С следует, что т0< т2. И опять из В следует, что это т2 не может быть равным т0и да,. Продолжая подобный процесс, получим бесконечное множество элементов множества М: т0< W] < т2< ... Итак, формула может быть истинной лишь на алгебраических системах с бесконечным основным множеством. Этот факт примечателен — с помощью финитных средств (формул) можем говорить о бесконечных множествах. 180
По аналогии с понятием выполнимости формул можно ввести понятие выполнимости секвенций. А именно, секвенция Т\- А называется выполнимой на алгебраической системе 9Я, если существуют такие значения переменных, что из выполнимости на ОТ всех формул из Г при данных значениях переменных следует выполнимость на 9Л формулы А при тех же значениях переменных. Секвенция называется тождественно истинной, если она выполняется в любой алгебраической системе при любых значениях переменных. Понятия опровержимых и тождественно ложных секвенций вводятся подобным образом. Легко заметить, что все аксиомы ИПФ являются тождественно истинными. Тождественная истинность аксиом Lx - Ьъ доказывается так же, как в ИВ. Из специфических аксиом ИПФ рассмотрим, например, аксиому L4 [VxA(x)->A{t)], где терм / допустим для подстановки вместо переменной х в формулу А. Пусть на какой-то алгебраической системе 9л формула \/хА(х, уи ..., у„) = и для значений ти ..., тп свободных переменных уи ..., у„ формулы А. При этих значениях переменных терм / имеет некоторое значение с. Но тогда имеем А(с) = и. Правила вывода сохраняют свойство формул быть тождественно истинными. Более того, если посылки какого-то правила вывода выполняются на некоторой алгебраической системе ЗЛ при любых значениях переменных, то и непосредственное следствие этого правила выполняется на той же системе при любых значениях переменных. Для правила «modus ponens» все обстоит как в ИВ. Возьмем правило «введение V» Г h (В -» А(х)) Т\-(В^УхА(х)) где формулы из Г и В не содержат свободных вхождений переменной х Если на какой-то алгебраической системе WI из выполнимости формул из Г при заданных значениях переменных, отличных от х, следует выполнимость формулы [В -> А(х)] независимо от значений переменной х, то ясно, что и формула (В -» VxA(x)) выполнима на 9Я при тех же значениях переменных. Все вышесказанное позволяет доказать следующий результат, из которого прямо следует непротиворечивость ИПФ. По этой причине иногда эту теорему называют леммой о непротиворечивости. Лемма 10.1 (о непротиворечивости для ИПФ). 1. Если формула А выводима в ИПФ, то А — тождественно истинная формула. 181
2. Если секвенция Г Ь А выводима в ИПФ, то формула А выполняется на всякой алгебраической системе, на которой выполняются все формулы из Г. Заметим, что второе утверждение легко следует из первого ввиду теоремы о дедукции. Лемма о непротиворечивости является частью теоремы адекватности для ИПФ. Такие и подобные связи будем рассматривать в подразд. 10.4. 10.2. Выполнимость множеств формул ИПФ Как видели в подразд. 10.1, проверка на выполнимость какой- либо формулы на алгебраических системах является довольно непростым делом. Даже достаточно простые примеры потребовали определенной изобретательности. Что же говорить, если формула окажется по своей структуре сложной и запутанной. Здесь возникает и другая проблема о совместной (одновременной) выполнимости нескольких формул. Пусть даны, например, три формулы А, В, С, и нужно найти такую алгебраическую систему 0Я и значения свободных переменных, чтобы все эти формулы А, В, С выполнялись на ней. Гипотетически представим себе такую ситуацию: для каждой из формул можно построить соответствующий «мир объектов», но что-то мешает всем этим формулам быть одновременно выполнимыми. Самый простой случай: среди формул есть пара противоречащих друг другу формул — D и -, D. Естественно, ни на какой алгебраической системе такая совокупность формул не может быть выполнена. Подобное противоречие может проявить себя и косвенным образом: возможно в ИПФ выводимы секвенции А, В, С h D и А, В, С Ь -, D для некоторой формулы О. Ив этом случае по лемме о непротиворечивости для ИПФ множество формул {А, В, С} не может быть одновременно выполнено. Конечно, можно использовать такой прием: вместо совместной выполнимости множества {А, В, С} рассматривать выполнимость одной формулы (А & В & С). Но вряд ли при этом получим значительные упрощения. Если же будем рассматривать бесконечные множества формул, то даже не сможем свести вопрос к одной формуле, так как нет понятия бесконечной конъюнкции. Обобщим понимание понятия секвенции и символа К Пусть 6 — произвольное множество предложений. Будем писать & \- А, если Аи ..., А„\- А для некоторых формул Аи ...,-А„ из 6. Это вполне согласуется с тем замечанием, в котором объясняли, 182
почему множество гипотез в секвенции всегда можно выбирать конечным (см. подразд. 5.2). Множество предложений & выполнимо (совместно), если существует алгебраическая система 9Л, на которой выполняется любое предложение из 6. В противном случае 6 называется невыполнимым. Назовем множество предложений & противоречивым, если существует такое предложение А, что 6ЬЛи6Ь-,Л (или другими словами, & \- (А & -1 А)). Если такого предложения не существует, то множество в называем непротиворечивым. Ясно, что противоречивые множества невыполнимы (ввиду леммы о непротиворечивости). Другими словами, если 6 выполнимо, то оно непротиворечиво. Оказывается, что и обращение этого факта справедливо. Это составит содержание одной из самых важнейших теорем для ИПФ — теоремы Геделя о выполнимости. Однако доказать теорему Геделя совсем не просто. Вместе с тем, когда теорема Геделя будет доказана, из нее в качестве следствий сможем получить и много других интересных свойств ИПФ. План доказательства теоремы Геделя таков. Пусть задано непротиворечивое множество предложений 6. 1. Постараемся выявить такие дополнительные свойства множества предложений 6, которые гарантировали бы их выполнимость. 2. Будем расширять множество 6 до множества Т, но которое обладало бы этими дополнительными свойствами. Если преуспеем в достижении указанных целей, то получится, что множество Т, а значит, и множество 6 выполнимы. Как всегда зафиксируем на дальнейшее некоторую сигнатуру а = <оь,...; Р7\..., РТ-, /Г1—, /,"'>■ Удобно считать, что в сигнатуре о имеется счетное число символов — констант о0, ••• Назовем множество предложений & полным, если для каждого предложения А соответствующей сигнатуры а выполняется одно из следующих условий: 6 Ь А или 6 Ь -1 А. Заметим, что для непротиворечивых множеств 6 не могут выполняться оба эти условия. Пусть формула вида УхА(х) не выполняется на алгебраической системе 9Л\ Это означает, что А(т) - и не для всех элементов т е М, а для некоторого т0 е М имеем -,А(т0) = и. Скажем, что данное w0является контрпримером опровержения формулы \/хА(х). Скажем, что множество предложений 6 замкнуто относительно опровержений контрпримерами, если для каждого предложения вида \/хА(х), не принадлежащего множеству 6, в S содержится 183
предложение -i Л(а), где at — некоторая константа из о. Таким образом, в этой ситуации контрпримерами опровержений формул вида УхА(х) являются константы. Теорема 10.1 (теорема Линденбаума— Генкина). Всякое непротиворечивое и полное множество предложений в, замкнутое относительно опровержений контрпримерами, выполнимо. Доказательство. Построим соответствующую алгебраическую систему для такого множества предложений 6, не имея по существу никакого материала, не используя для этих целей никаких интуитивно понятных конкретных объектов, таких, как множества, числа, точки, прямые и пр. Эти объекты в дальнейшем определим с помощью логических средств, как такие объекты, на которых выполняются формулы строящихся исчислений. Практически единственными осязаемыми объектами на этом этапе могут служить формулы языка L„. Вот из таких формул, вернее из их части, и будем конструировать нужную алгебраическую систему той же сигнатуры о. Назовем ее системой Линденбаума для 6 и обозначим через 9JtLin. Обозначим через М0 множество всех термов сигнатуры ст, не содержащих переменных (при построении таких термов использовались лишь константы и функции из о). Если в а нет функциональных символов, то термами будут лишь константы, которых в о предусмотрено много — счетное число. Скажем, что tx ~ t2, если 6 Ь tx - t2. По теореме о равенстве для ИПФ заключаем, что данное отношение ~ является отношением эквивалентности на Л/0 Основным множеством М алгебраической системы 9JtLin будет фактор-множество М- М0/~. Итак, элементами множества М являются смежные классы [/] = {?,//-/,}. Определим теперь на множестве М интерпретации сигнатурных символов из о. Пусть я, означает класс [а,]; Р([/|], ..., [?„]) = и тогда и только тогда, когда 6 h P(tu ..., tn); /([/,], ..., [t„]) = [/(/„ -, t„)\. Учитывая, что множество 6 является полным и непротиворечивым, то для любых t\, ..., /„ справедливо ровно одно из двух утверждений: 6 h P(tu ..., tn) или 6 h -, /»(/,, ..., /„), и поэтому значение предиката P{tb ..., t„) однозначно определено. Вот здесь существенно помогла полнота множества &. Еще нужно убедиться в корректности заданий Р и / А именно надо доказать, что если [?,] = [*,], ..., [/„] - [5„], 184
то />([*,], ..., [t„]) = P([Sl], ..., [s„]); f([h], ..., [Q) =/([5,], ..., [sn]). А это опять легко следует из теоремы о равенстве для ИПФ. Итак, полностью определили систему 50tLin. Осталось убедиться в том, что на системе S0TLin выполняются все предложения из 6. Докажем следующее утверждение: А - и на WlLi„ тогда и только тогда, когда Ае &. (1) Проведем индукцию по числу шагов при построении формулы А. База индукции. Пусть А — атомная формула м = t2 или P{tu ..., t„). Тогда нужное утверждение (1) следует из равенства /([о,], ..., [о,-]) = = [t(ah ..., я,)], которое само легко доказывается. Индуктивное предположение. Для предложений с меньшим числом шагов при построении, чем у предложения А, утверждение справедливо. Индуктивный шаг. Возьмем предложение А, которое построено из более коротких формул. Рассмотрим возможные при этом случаи. Случай 1. Если А есть п5и для предложения В утверждение (1) справедливо, то имеем: А = и на Ши„ тогда и только тогда, когда В = л на WlUn, тогда и только тогда, когда В £ & (индуктивное предположение), тогда и только тогда, когда А е & (полнота б). Случай 2. Если А есть (В -» С) и для предложений В и С утверждение (1) справедливо, то имеем: А = л на WlUn тогда и только тогда, когда 5 = и и С=лна MUn, тогда и только тогда, когда В & & и С g 6 (индуктивное предположение), тогда и только тогда, когда (М-,С)е 6 (полнота 6), тогда и только тогда, когда А g 6. Случай 3. Пусть Л имеет вид Vjcfl(jc). Тогда, если А е. 6, то из-за опровержений контрпримерами имеем -. B(aj) е 6 для некоторой константы ау. По индуктивному предположению B{aj) = л на 9JtLin. Согласно правилам определения значений формул, получим УхВ(х) = л, т.е. А - л на 9JtLin. Наоборот, если А = л на 9Яип, то для некоторого t е М0 будем иметь 5([ф = л на ЯЛит т-е- -,-#(И) = и на 9Луп. По индуктивному предположению -,£([?]) е 6. Тогда будем иметь 3x-iB(x) £ в, а это и означает, что А £ &. Теорема Линденбаума—Генкина доказана. ■ 185
10.3. Теорема Геделя о выполнимости Перейдем теперь к исполнению п. 2 плана доказательства теоремы Геделя о выполнимости. Постараемся расширить (вложить) произвольное непротиворечивое множество предложений & до непротиворечивого, полного множества предложений Т, замкнутого относительно опровержений контрпримерами. Проявим некоторую осторожность: расширим несколько сигнатуру о до сигнатуры о,=ои {Ь0, Ьь ...}, добавив новые константы bQ, Ьи ..., отличные от констант а0, аи ... из о. Для множества предложений % алгебраическая система Шш будет иметь сигнатуру оь что не создаст никаких трудностей для множества 6. Теорема 10.2 (о расширении). Всякое непротиворечивое множество предложений 6 сигнатуры о содержится в непротиворечивом, полном множестве предложений 1 сигнатуры аь замкнутом относительно опровержений контрпримерами. Доказательство. Используя произвольное предложение А и некоторые тесно с ним связанные предложения, будем расширять множество б до непротиворечивого множества предложений &*, из которого было бы выводимо одно из предложений А или -.Л, добавляя, если это нужно, опровержение соответствующим контрпримером. Разобьем это построение на четыре случая. Случай 1. Если Л выводимо из 6 и не имеет вида -,VxB(x), то полагаем &* = &. Ясно, что в этом случае 6* осталось непротиворечивым. Случай 2. Если А выводимо из 6 и имеет вид -. \/хВ(х), то полагаем в* = 6 u {-iB(bj)}, где bj — первая из новых констант, не входящая в формулы из 6 и предложение А. Если бы множество 6* оказалось противоречивым, то имели бы: 6, -,Д(*,-) Ь (С&-. С); 6, (Cv^C)h B(bt); е h B(b,); 6Ь \/иВ(и) (лемма о замене константы); 6 \--,А, что означало бы противоречивость множества 6. Итак, и в этом случае 6* осталось непротиворечивым, и в нем появилось опровержение соответствующим контрпримером. Случай 3. Если Л не выводимо из 6 и не имеет вида \/хВ(х), то полагаем 6* = 6 u {—iA}. Если бы множество 6* оказалось противоречивым, то имели бы: 186
б, ^ЛЬ(С&^С); в, (С v-, С) \-А; eh А, что противоречит выбору А. Случай 4. Если А не выводимо из 6 и имеет вид \/хВ(х), то полагаем 6* = 6 и Ь^} и {-,#(£,■)}, где Ь-, — первая из новых констант, не входящая в формулы из 6 и предложение А. Если бы множество 6* оказалось противоречивым, то имели бы: б, -,Л, -,B(bi) Ь (С&^ С); 6, -,Д (Cv^C) \- В(Ы); &,^Ah B(b,); б, -л А V- \/иВ(и) (лемма о замене константы); &,-,А\- А;&,А\-А; &,Av-,A ЬЛ; б h Л, что противоречит выбору /4. Итак, пополнили множество 6 относительно Л, добавив, если это было нужно, опровержение соответствующим контрпримером, и получили непротиворечивое множество 6*. Теперь организуем процесс подобного пополнения множества 6 относительно всех предложений сигнатуры о,. Пусть все предложения сигнатуры с, занумерованы в последовательность Л>> А, А2, ... (1) Существование подобной нумерации следует из того факта, что множество всех предложений сигнатуры О] счетно. Конкретное построение такой нумерации сейчас не понадобится. Исходя из множества 6, строим для предложений At множества 60= 6* и 6/+1 = (в,-)*. Получим последовательность 6с60с6|С ... Осталось объединить все эти множества, т. е. рассмотреть множество Ясно, что б с Т. Докажем ряд утверждений про множество Т. 1. Множество Т непротиворечиво. Действительно, если для какого-то предложения Симели 1 h (С& -. С), то, выбрав те конечные подмножества X, и Т2, для которых 1, Ь Си Т2 Ь -, С, находим такое б,-, что 1, с б, и Т2 с б,. Имеем б,■ 1- Си б, Ь -. С, что означало бы противоречивость множества 6,. 187
2. Множество 1 — полное. Действительно, любое предложение А сигнатуры о, имеет номер в нумерации (1), например /. Но, когда строим &h то пополняем 6,_, либо предложением Аь либо предложением -1/4/. Таким образом, 6, V А или б, I- -,А, а значит, 1\~А или 1 Ь-iA 3. Множество 1 замкнуто относительно опровержений контрпримерами. Действительно, если предложение Д имеет вид УхВ, (х) и Дне попало в X, то в множество 6, попадет как раз предложение Теорема о расширении доказана. ■ Замечание. Отметим «неконструктивность» способа расширений множеств предложений. Действительно, когда строили 60 по 6, пришлось выбирать между двумя случаями: А0 не выводимо из в или -,А0 не выводимо из &. Конечно, по закону исключенного третьего в АВ один из этих случаев должен выполняться. Но нет никаких реальных шансов в самой общей ситуации узнать, какой же из этих случаев в действительности выполняется. Это очень напоминает положение с аксиомой выбора. И действительно, можно доказать, что аксиома выбора и некоторое рассуждение, которое применяем в теореме о расширении, равносильны. Сформулируем и докажем центральный результат в рассматриваемом круге вопросов — теорему Геделя. Часто эту теорему и теорему адекватности для ИПФ называют теоремой Геделя о полноте ИПФ, чтобы отличить ее от другой теоремы Геделя о неполноте арифметики натуральных чисел. Но здесь назовем ее теоремой о выполнимости. А вопросы о полноте ИПФ будут обсуждаться далее. Кстати, когда данную теорему называют теоремой полноты, то имеют в виду другой вид полноты, отличный от определенного нами. В нашем же понимании полноты, как увидим, ИПФ окажется неполным. Теорема 10.3 {теорема Геделя о выполнимости). Множество предложений 6 выполнимо тогда и только тогда, когда 6 непротиворечиво. Доказательство. 1. Было замечено ранее, что выполнимые множества предложений обязательно непротиворечивы. 2. Если 6 — непротиворечивое множество предложений, то по теореме о расширении оно содержится в непротиворечивом множестве Т некоторой расширенной сигнатуры, которое полно и замкнуто относительно опровержений контрпримерами. А по теореме Линденбаума—Генкина такое множество 1, а значит, и множество 6 выполнимы. ■ Теорема Геделя о выполнимости фиксирует глубокую связь между синтаксическими и семантическими понятиями. 188
10.4. Метасвойства ИПФ Здесь докажем несколько важнейших теорем для ИПФ — теорему адекватности, теорему Левенгейма—Скулема, локальную теорему Мальцева, обсудим метасвойства ИПФ и др. Доказательства всех этих результатов будут легко следовать из теоремы Геделя о выполнимости. Но необходимо отметить, что в свое время все эти фундаментальные свойства ИПФ были доказаны самостоятельно, не опираясь на теорему Геделя о выполнимости, и их доказательства были довольно сложными. Формулировка и доказательство теоремы Геделя о выполнимости показывают, что все трудности могут быть сконцентрированы в одной теореме. Авторство всех этих результатов часто приписывается не одинаково. Изберем вариант, который сложился в отечественной математической литературе. Теорема 10.4 (теорема адекватности для ИПФ). 1. Предложение А выводимо в ИПФ тогда и только тогда, когда это предложение А является тождественно истинным. 2. Для конечного множества предложений Г секвенция Г I- А выводима в ИПФ тогда и только тогда, когда предложение А выполняется на всякой алгебраической системе, на которой выполняются все предложения из Г. Доказательство. В одну сторону оба эти утверждения уже были доказаны в лемме о непротиворечивости для ИПФ. Пусть предложение А выполняется на всякой алгебраической системе, на которой выполняются все предложения из Г. Тогда множество 6 = Г u {-i А} невыполнимо, а значит, по теореме Геделя о выполнимости оно противоречиво. Поэтому для некоторой формулы В и некоторого конечного подмножества Г, с Г (в секвенциях и само множество гипотез Г всегда конечно) имеем: Г,,-, ЛЬ (Я&-.Я); Г,, (Я v -, В) Ь А; Г, h А; IV А. ■ Если вспомнить теорему о замыкании, то ясно, что в теореме адекватности можно говорить о произвольных формулах, а не о предложениях. Из теоремы Геделя о выполнимости тривиально следуют такие метасвойства ИПФ: непротиворечивость и выполнимость, некатегоричность и пополняемость. Теорема 10.5 (теорема о непротиворечивости ИПФ). ИПФ непротиворечиво. Доказательство сразу следует из того факта, что выводимыми в ИПФ предложениями являются лишь тождественно истинные. ■ 189
Теорема 10.6 (теорема о выполнимости ИПФ). ИПФ выполнимо. Доказательство. Строим систему Линденбаума для множества всех тождественно истинных предложений ИПФ. ■ Теореме 10.7 (теорема о некатегоричности ИПФ). ИПФ некатегорично. Доказательство. Возьмем две алгебраические системы ЯЛ, и Ш2 соответствующей сигнатуры о, но у которых множество Л/, состоит из одного элемента, а множество М2 — из двух элементов. Ясно, что все выводимые предложения ИПФ выполняются на этих системах. Но из-за разного числа элементов эти системы не могут быть изоморфными. ■ Теорема 10.8 (теорема о пополняемости ИПФ). Множество предложений, выводимых в ИПФ, не является полным относительно множества всех предложений. ИПФ пополняемо. Доказательство. Рассмотрим следующее предложение А: ЗхЗу[х* у& \/z(x= z v у = z)]- Ясно, что предложение А выполняется на алгебраических системах, множество которых содержит ровно два элемента. Таким образом, ни А, ни —,А не являются тождественно истинными, и поэтому не принадлежат множеству 3 всех выводимых предложений ИПФ. Предложение А является неразрешимым для ИПФ. Если добавим к множеству J это предложение А, то 6 = 3 и {А} будет выполнимым множеством, а значит, и непротиворечивым. Итак, ИПФ пополняемо. ■ Выбранная система аксиом ИПФ оказывается зависимой, но не будем здесь заниматься этим вопросом и стараться выбрать другую, независимую систему аксиом для ИПФ. Теорема 10.9 (теорема Левенгейма —Скулема). Множество предложений в выполнимо тогда и только тогда, когда оно выполнимо на счетном или конечном множестве. Доказательство. Рассматриваем алгебраические системы, сигнатура которых содержит не более чем счетное число символов. Если 6 выполнимо, то оно непротиворечиво. Тогда расширяем это множество до полного, непротиворечивого множества предложений X, замкнутого относительно опровержений. При этом сигнатура множества Т будет счетной. Строя для множества 6 систему Линденбаума, не получим более чем счетного множества ее элементов. По теореме Линденбаума — Генкина 1, а значит, и 6 выполнимы в построенной системе Линденбаума. ■ Так как всякое счетное множество — это, по существу, некоторое множество натуральных чисел, теорему Левенгейма—Скулема •можно сформулировать и так: множество предложений 6 выполнимо тогда и только тогда, когда оно выполнимо на некотором множестве натуральных чисел. 190
Замечания. Теорема Левенгейма —Скулема доставляет любопытный феномен, требующий определенного осмысления. Пусть 6 — множество предложений, истинных на обычных действительных числах со сложением и умножением. По теореме Левенгейма—Скулема 6 можно выполнить на натуральных числах. Но как же тогда быть с теоремой Кантора о том, что множество действительных чисел несчетно? Видимо, надо признать, что при ее доказательстве использовали какие-то рассуждения, которые не могут быть формализованы в языке для ИПФ. В теореме Кантора пытаются «подсчитать» мощность множества подмножеств множества натуральных чисел N. Каждое такое подмножество отождествляется с некоторым одноместным предикатом на N, которых континуум. В ИПФ можно получать одноместные предикаты лишь с помощью формул, имеющих одну свободную переменную. Но таких формул, а значит, и «выразимых» в языке одноместных предикатов в действительности не более чем счетное число. Итак, избыток подмножеств получается за счет «формульно невыразимых» подмножеств. Второе замечание относится к ограничению на мощность сигнатур исчислений. Если не вводим подобных ограничений, то в такой ситуации оригинальная формулировка теоремы Левенгейма —Скулема указывает даже на мощность системы Линденбаума. Теорема 10.10 (локальная теорема Мальцева). Множество предложений 6 выполнимо тогда и только тогда, когда выполнимо каждое конечное подмножество множества 6. Доказательство. Если множество предложений 6 выполнимо, то, естественно, выполнимо и каждое конечное подмножество множества 6. Пусть каждое конечное подмножество множества 6 выполнимо, а само 6 невыполнимо. Значит, множество 6 противоречиво. Тогда &\- Аи&У- -,А для некоторого предложения А. В этом случае существуют конечные подмножества X, с & и Х2 с в, такие, что X, I- А и Х2 I- -> А, Хь Х2 Ь А и X,, Х2 Ь -л А. Конечное множество Xj и Х2 противоречиво и невыполнимо. ■ Из локальной теоремы Мальцева вытекают очень любопытные следствия. Следствие 10.1. Пусть множество предложений 6 таково, что для каждого натурального числа п существует алгебраическая система, содержащая более чем п элементов, на которой множество 6 выполнимо. Тогда существует и счетная алгебраическая система, на которой множество 6 выполнимо. Доказательство. Запишем следующие предложения: Е2 = 3X|3x2(X] Ф х2), 191
Ej, = Зх\3х^хъ{х\ Ф х2 & х, Ф х3 & х2 Ф х3), Ясно, что предложение Е„ выполнимо на алгебраической системе ОТ тогда и только тогда, когда ее множество М содержит не менее чем п элементов. Рассмотрим множество [6, Еь Е2, Еъ ..., Е„, ...]. Возьмем какую-то конечную часть этого множества {6Ь Ет, Ег, ..., Es}. По условию для выполнимости этого множества можно найти систему ОТ, основное множество которой содержит более чем т + г + + ... + 5 элементов. Итак, каждая конечная часть множества [6, Еь Е2, Еъ, ..., Е„, ...] выполнима, а значит, и все это множество выполнимо на некоторой системе ОТ,. Но очевидно, что эта система бесконечна. ■ Из данного следствия следует, что невозможно построить множество предложений (аксиом), выполнимое на конечных системах и только на них. Как будем в таком случае выражаться: теория конечных множеств неаксиоматизируемо. Такой феномен справедлив и для многих других специализированных конечных алгебраических структур: теория конечных групп (колец, полей, решеток и др.) неаксиоматизируема. Другое интересное следствие локальной теоремы Мальцева связано с натуральными числами. Пусть 91 = < N; 0, а; X, +, ■ >, где N — натуральные числа; 0, а — выделенные константы; функция Х(х) - х + 1, а функции +, • — обычные операции сложения и умножения. Пусть 6 — множество всех выполнимых на 91 предложений. Трудно себе представить какую-нибудь другую алгебраическую систему 91,, сильно отличающуюся от 91, на которой выполнялись бы все предложения из 6. Прежде всего во всякой системе 9ч( для в выделим «стандартные» натуральные числа: число 0 — константа 0; число 1 — терм Х(0); число 2 — терм АЛ(0); число 3 — терм ХАЛ(О); (Заметим, не можем записать, что какой-то элемент множества Nl является одним из стандартных чисел 0, 1, 2, 3, ... . Для этого было бы нужно прибегнуть к «бесконечной дизъюнкции»: «х = 0 v v х = 1 v ...» или с помощью квантора 3 писать что-нибудь вроде Зп(х = п), где считать, что переменная х принимает значения из области стандартных натуральных чисел. Ни то, ни другое не разрешено — каждая формула имеет конечную длину, а квантор относится ко всей области значений предметных переменных.) 192
Следствие 10.2. Для 6 существует нестандартная система У1Ь на которой существует элемент а, больший всех стандартных натуральных чисел. Доказательство. Рассмотрим следующие предложения: Л0 = 0 < а, А^Ка, А2 = 2 < а, где предикат х < у = 3z[z* 0 & х + z = у]. Пусть & = {Aq, Л\, А2, ...} и 6, = {Ат, Ап ..., As} — некоторое конечное подмножество множества S. На системе 91, где константа а интерпретируется числом, строго большим, чем т + г+ ... + s, все предложения из 6, выполняются. По локальной теореме Мальцева множество 6 выполнимо на какой-то системе 91|. На этой системе выполняются все соотношения обычной (стандартной) арифметики натуральных чисел. Но среди элементов множества N\ имеется такой элемент а, который больше всех обычных натуральных чисел. Естественно назвать этот элемент нестандартным числом. ■ Открытие нестандартных систем для таких хорошо интуитивно понятных структур, как натуральные или действительные числа, привело к возникновению новых теорий. Так возникает нестандартная арифметика, нестандартный анализ и др. Упомянем еще один результат, который справедлив, если снять те ограничения на мощность сигнатур исчислений, которых всегда придерживались: число констант может быть более, чем счетным. Теорема 10.11 (теорема Мальцева о расширении). Если множество предложений 6 выполняется на алгебраической системе с бесконечным основным множеством, то для любого бесконечного кардинального числа m существует семантика для &, мощность основного множества которой больше, чем т. Доказательство. Пусть m < А и а — сигнатура, в которой рассматриваются предложения из 6. Для каждого элемента ае А добавим в сигнатуру о константу Ьа, не входящую в о. Рассмотрим множество предложений 1 = 6 и {Ьа Ф 6р/(х, Р е А и а ф р}. (Здесь произошло значительное увеличение числа констант.) Тогда любое конечное подмножество Т0 с 1 выполнимо, а следовательно, по локальной теореме Мальцева выполнимо и все множество Т. Но у любой семантики для Т основное множество имеет мощность большую, чем т. ■
ЧАСТЬ IV КЛАССИЧЕСКИЕ АКСИОМАТИЧЕСКИЕ ТЕОРИИ Г/fABA 11 ТЕОРИЯ МНОЖЕСТВ I 11.1. Элементарные теории Теперь применим полученные в предыдущих частях книги результаты к конкретным математическим теориям. Задание таких теорий аксиоматическим путем — очень распространенный способ в современной математике. Наша задача — для наиболее известных математических теорий построить соответствующие исчисления, выводимые формулы которых были бы верными утверждениями рассматриваемых теорий. Основная отличительная черта ИПФ состоит в том, что все выводимые в ИПФ формулы являются истинными на любой алгебраической системе соответствующей сигнатуры. Таким образом, ИПФ будет входить во все рассматриваемые аксиоматические теории. Естественно, при этом должны учитывать и определенную ограниченность языка ИПФ. Нередко утверждения относятся не к свойствам рассматриваемых объектов, а к свойствам свойств объектов иди к свойствам семейств объектов. В большинстве случаев такие факты не могут быть прямо выражены средствами языка ИПФ, так как в этом языке логические операции (например, кванторы) можно применять лишь по отношению к объектам. Например, суждение о том, что существует некоторое множество рассматриваемых объектов, естественно записать следующим образом: ':: эр'(-), т.е. как утверждение о существовании некоторого одноместного предиката на данном множестве объектов. Но в языке для ИПФ нет возможности связывать предикаты кванторами. Может быть, каким-либо косвенным, но доступным способом и сможем выразить подобное суждение, однако нет никакой уверенности, что так будет в самой общей ситуации. Щдобные выражения (формулы) относятся к логике более высокого порядка, чем ИПФ. Используемый же язык для ИПФ — язык «первого порядка», или элементарный язык. Конечно, здесь 194
прилагательное «элементарный» говорит об его уровне в иерархии языков, а вовсе не о его простоте. Мы уже неоднократно убеждались, что на этом языке можем выражать многие понятия и утверждения современной математики. Достаточно обширные фрагменты математических наук могут быть соответствующим образом формализованы в языке для ИПФ. В подразд. 8.1 были введены понятия аксиоматизированного класса алгебраических систем и элементарной теории для класса алгебраических систем. Уместно напомнить эти определения, учитывая упрощения, характерные для ИПФ. В дальнейшем, рассматривая множество предложений 6, будет удобным считать его логически замкнутым, т. е. таким, что выполняется следующее условие: если Ах, ..., А„ Ь А и Аи ..., А„ е 6, то А е &. Пусть 21 — некоторое логически замкнутое множество предложений. Обозначим через 21Я(21) класс всех семантик для 21, т.е. класс всех алгебраических систем ЯЯ, на которых выполнимы все предложения из 21; 21й(21) называется аксиоматизированным классом алгебраических систем с аксиомами 21. Пусть 03 — некоторое множество алгебраических систем (с одинаковыми сигнатурами). Обозначим через Т(*В) множество всех выполнимых на этих системах предложений, т.е. предложений, для которых все системы из Ъ являются семантиками; 1(25) называется элементарной теорией для алгебраических систем из *В. Заметим, что из-за теоремы адекватности для ИПФ множество Т(25) обязательно будет логически замкнутым. Если возьмем две алгебраические системы Ш1, = <МЛ; а> и Т12 = = <М2; а>, то может оказаться, что элементарные теории %(ffl\) и 1(ОТ2) совпадают. Это означает, что с помощью формул языка ИПФа не сможем отличить эти системы друг от друга — любое предложение, выполняющееся на одной системе, обязано выполняться и на другой. Такие алгебраические системы называются элементарно (логически) эквивалентными. Один из возможных путей (но не единственный) получения элементарно эквивалентных систем состоит в построении изоморфных систем. Уже видели, что всякое предложение, выполнимое на одной системе, обязательно должно быть выполнимым и на другой системе, изоморфной первой. Итак, всякие изоморфные алгебраические системы элементарно эквивалентны. Но оказывается, что в ряде случаев и неизоморфные системы могут оказаться элементарно эквивалентными. Уже видели, что арифметика натуральных чисел имеет нестандартные семантики. Причины этого будут подробно рассмотрены в подразд. 12.1, где будет изучаться элементарная теория для такой арифметики. 195
Чтобы специально выделить эти особые случаи, было введено понятие категоричных теорий — в таких теориях все семантики изоморфны. Объекты, которые изучает математика, обычно очень трудно определить или описать. Понимание таких концепций, как множество, натуральное число, точки и прямые, часто носят интуитивный характер, не поддающийся строгому и точному анализу. Это хорошо видели, когда пытались как-то объяснить, что такое множество. При этом основная трудность состояла в том, что избрали такое понятие в качестве первичного, т.е. не было более простых понятий, с помощью которых могли бы определить понятие множества. Похожая ситуация характерна для арифметики, геометрии и других математических наук. Чтобы разрешить эти проблемы, программа Гильберта предлагает сделать первичным понятие исчисления (формальной системы), а через эти исчисления определять объекты, которые исследуют эти математические науки. Поясним это на примере теории множеств. Возьмем алгебраическую систему (см. подразд. 3.1, 3.2) 6 = < Set; е >, где Set — семейство множеств, двухместный предикат принадлежности х е у, означает, что элемент х принадлежит элементу у. Уже научились на языке сигнатуры о =< е > записывать различные утверждения и понятия для таких «множеств», хотя довольно плохо понимаем, о каких объектах идет речь, так как есть только интуитивные представления об этих объектах. По этой причине, развивая на интуитивной основе теорию множеств, то и дело будем натыкаться на непреодолимые препятствия и парадоксы, связанные с этим непониманием. Еще сложнее пытаться построить элементарную теорию множеств Т(6). Будет трудно узнать для некоторых утверждений, принадлежат ли они %(&) или нет. Возьмем, например, утверждение А, формализующее принцип (аксиому) выбора. Наивные представления о множествах не позволяют четко ответить на поставленный вопрос: А е 1(6) или -,А е Т(б)? И так обстоит дело со всеми другими проблемами теории, т.е. с утверждениями, которые еще пока никем не доказаны и не опровергнуты в рассматриваемой теории. Тут имеется замечательная возможность, предлагаемая программой Гильберта, определить, что же такое множество: давайте пойдем не от алгебраической системы 6 к ее теории 1(6), а, наоборот, — от некоторой специально выбранной теории Т к алгебраическим системам. Будем называть множествами объекты любой алгебраической системы 9Я, являющейся семантикой для Т. 196
Как же выбрать подходящую теорию Т для теории множеств? Можно строить формальную систему (исчисление) Ф(21), выбрав некоторый набор 21 предложений в качестве аксиом (естественно, удовлетворяющих всем требованиям, предъявляемых к аксиомам). Во-первых, это.Ф(21) более обозримо, чем элементарные теории 1, — для исчислений дана четкая и строгая концепция синтаксически выводимых формул. Во-вторых, нужно будет проверять на выполнимость на алгебраических системах лишь аксиомы из 21, так как правила вывода ИПФ сохраняют истину. Может возникнуть желание объявить все предложения из Х(6) аксиомами! Но этого просто не сможем сделать из-за того требования, которое предъявляли к списку аксиом, — должен быть эффективный способ, узнающий по любой формуле, относится она к аксиомам или нет. Но как же быть с теми утверждениями-проблемами, которые еще не доказаны и не опровергнуты в теории множеств? По этой причине желательно при определении элементарных теорий не использовать алгебраические системы. Элементарной теорией Т сигнатуры о назовем произвольное логически замкнутое множество предложений данной сигнатуры. Как видно из этого определения, сразу же относим к элементарной теории и все те предложения-следствия, которые могут быть выведены из формул этой теории. Если 1 = Ф(21) для некоторого множества предложений 21, где Ф(21) — множество формул, выводимых в ИПФ, и множества формул 21, то 21 называется системой аксиом для элементарной теории Т. А вот теперь класс алгебраических систем Я назовем аксиоматизируемым, если существует элементарная теория Ф(21), такая, что все алгебраические системы из Я и только они являются се- мантиками этой теории. В дальнейшем потребуется еще несколько полезных понятий. Рассмотрим две алгебраические системы Ш?, =<Л/,; о> и Ш2 = = < М2, а>. Может так оказаться, что у системы 9Я2 = < М2\ о> есть некоторая подсистема 9Я3 =<А/3; о> изоморфная системе Шх = = < Л/,; о>. В этом случае скажем, что система 9Л, -<МХ', о> вложи - ма в систему Ш2 = < М2, а >. Если система *ГЯ] -<МХ; о> вложима в каждую систему 9Л2 = = < М2, о> из некоторого класса Я алгебраических систем сигнатуры о, то система Шх = < Л/,; а > называется минимальной в классе Я. Далее приведем примеры систем аксиом для классических элементарных теорий — теории множеств, арифметики натуральных чисел, геометрии и др. В некоторых случаях будем доказывать, что интересующая алгебраическая система является минимальной в аксиоматизируемом классе. Также будут указаны, если это будет возможно, и метасвойства элементарных теорий для таких алгебраических систем. 197
11.2. Теория множеств ZF Для теории множеств были предложены различные варианты систем аксиом. Одна из самых популярных из таких систем разработана Е. Цермело и усовершенствована А.Френкелем. Ее классическое название — теория множеств Цермело— Френкеля ZF. Однако различные авторы, описывая теорию ZF, часто выбирают другой набор аксиом, отличный от того, который указан Цермело и Френкелем. Конечно, исходный набор аксиом ZF остается базой для этих новых модификаций, и по этой причине они также носят название ZF. Единственным сигнатурным символом теории ZF будет двухместный предикат, обозначаемый е, т. е. выбранная сигнатура — а = < е >. Предметные переменные будут принимать в качестве своих значений объекты, называемые множествами. На этапах построения теории ZF обычно не приписываем какого-либо содержательного смысла этим объектам. Но когда будет нужно перейти к интерпретациям и семантикам теории ZF, то объекты этих семан- тик, естественно, и будут называться множествами, а предикат е будет пониматься как отношение принадлежности одного множества в качестве элемента другого множества. Все логические аксиомы ИПФ данной сигнатуры автоматически включаются в систему аксиом теории ZF. Здесь выпишем лишь ту специфическую аксиому равенства, в которой говорится о связи равенства = с предикатом е: ZFe = \/xyuv{(x = у & и = v) -» (х е и<н>у е v)}. (I) Одной из самых первых аксиом теории ZF объявляется аксиома объемности: Z¥o5 = yxy[(\fz(ze x^ze у)^х = у)], (2) говорящая о том, что два множества х и у равны, если они состоят из одних и тех же элементов. Аксиома объемности ZFo6 включается во все другие аксиоматики теории множеств. Другим вариантом аксиомы объемности можно взять формулу ZF<- = \/xy[x = y<^(x^y&y^x)], (3) где х с у означает двухместный предикат, реализуемый формулой Vz(z е х -> z е у). Эта формула служит для определения отношения включения множеств с (а также понятий подмножеств и надмножеств). Уже привыкли, что в формулах часто используем метасимволы для предикатов, не входящих в сигнатуру, но реализующихся формулами языка. Так и здесь надо вставить в формулу (3) вместо предиката с его реализующую формулу, сделав соответствующие переобозначения переменных (кстати, здесь неплохо побеспокоиться об устранении возможных коллизий переменных). 198
В дальнейшем будем свободно употреблять в формулах подобные сокращения. Другая аксиома, называемая аксиомой выделения (иногда ее называют аксиомой свертывания), говорит о том, как можно собирать новые множества из различных элементов уже имеющегося множества: ZFBbW(y4) = Vm, ... u„x3yVz[z е y^(ze х & A(z, щ, ..., и„))],(4) где A(z, их, ..., ип) — произвольная формула языка, среди свободных переменных которой имеется z, но переменные х и у не входят в эту формулу свободно. Формула A(z, щ, ..., и„) формализует некоторое свойство множеств z (при фиксированных значениях других свободных переменных щ, ..., и„). Итак, смысл формулы ZFBbia(A) состоит в следующем: из всех элементов z множества х отбираем только те, для которых свойство A(z, иь ..., и„) выполняется; все такие отобранные элементы собираем в множество у. Формулу [z е у<г^ (ге х & A(z, иь ..., ип))} можно назвать определением множества у, и это позволяет вернуться к записи задания множества в виде у= {z/ ze x&A(z, щ, ..., ип)}. Отметим несколько принципиальных особенностей аксиомы выделения. Такой отбор делаем не для всех мыслимых свойств, а лишь для «определимых» в языке, т.е. тех, которые могут быть выражены с помощью формул соответствующего языка; все элементы множества у выбираются не из универсума, а из уже имеющегося множества х. Важно также заметить, что указана схема аксиомы выделения, в действительности таких аксиом бесконечно много — для каждой формулы А требуемого вида имеется своя аксиома выделения ZFBm(A). Первые же применения аксиомы ZFBbia дают интересные результаты. Пример 11.1. Обычное определение {у / \/z(z<£ у)} пустого множества 0 не имеет вида, требуемого в ZFBbW. Чтобы применить ZFBbW, возьмем формулу z Ф Z в качестве предиката A (z) в аксиоме ZFBbw: \/x3yVz[z е У<-+ (z е х & z * z)]. Из аксиомы равенства Ух (х = х) следует, что ze у всегда ложно. Таким образом, у = 0 для любого х. Итак, определили пустое множество 0: у = 0 = \/z(z е y&z* Z) = Vz(Z £ У). То, что два пустых множества совпадают, следует из ZFo6. Имеется необходимость введения аксиомы, утверждающей существование хоть одного множества. В качестве такого исходного 199
множества как раз и выберем пустое множество. Аксиомой пустого множества будет: ZF0=3y(y = 0) = 3y\/Z(z£y). Пример 11.2. Пусть даны два множества а и Ъ. Применяя аксиому ZFBbIfl к множеству а (как к множеству х) и условию A(z) = Z е Ъ, определим y = {z/z^a&zeb}. Видим, что элементами множества у являются такие множества z, которые принадлежат как множеству а, так и множеству Ь. Так определенное множество раньше называли пересечением й и Ьн обозначали через an Ь: у = ac\b = 4z[z£ У <-» (ze a&z.£ b)]. Единственность множества а п Ъ следует из его определения. Итак, в теории ZF выводится формула УаЬЗ\у(у = аслЬ). Пример 11.3. Казалось бы, что определение объединения двух множеств: у =aub = {z / Z£ av ze Ь} не сильно отличается от определения пересечения. Однако условие (zeav^ei) не имеет того вида, который требуется в аксиоме ZFBbW — здесь непонятно из какого множества х выбираются элементы z- Претендентом для такого х могло бы стать множество а и Ь, но это-то множество и хотим построить. По этой причине здесь нужно вводить специальные аксиомы для определения такого множества. Одной из таких аксиом является следующая: ZFcyM = УуЗх\/и[ив х <-» 3z(ze у&ие z)], (5) она называется аксиомой суммы, или объединения, и говорит о том, что из элементов, входящих в элементы множества у, можно образовать новое множество х. Такое множество раньше называли объединением элементов множества у и обозначали через и у. Единственность и у снова следует из определения. Итак, в теории ZF выводима формула \/у31х(х = и у). Но для определения объединения двух множеств потребуется еще одна аксиома. Назовем аксиомой пары следующую формулу: ZFnapb, =Vyz3x\/u[u ex<r*(u = yvu = z)]- (6) Она говорит о том, что из двух множеств у и z можно образовать множество х, имеющее пару (два) элементов yuz- Если y-z, 200
то эта пара будет одноэлементным множеством, т.е. состоит из одного элемента. Легко доказать единственность такого множества. Как видим, определение этого нового множества х не имеет того вида, который указан в ZFBbW. Такое множество-пару обозначали в наивной теории множеств через {у, z}- Определение множества-пары легко извлекается из аксиомы пары ZFnapb]. Итак, в теории ZF выводится формула Vyz3\x(x = {y,z})- Пример 11.4. Если применим ZFcyM к множеству-паре у = {а, Ь}, то результирующее множество х, которое можно обозначить а и Ь, будет определяться так: х = aub ={z/ z& av г е b). Пример 11.5. Ранее называли множество х упорядоченной парой и обозначали его через <у, z>, если множество х является парой {{у}, {У, z}} Для некоторых множеств ynz- Понятно, как это определение формализовать в нашем языке. Аналогично можно определить упорядоченные п-ки {кортежи длины п) отдельно для каждого п. Пример 11.6. Назовем множество / одноместной функцией, если элементами/являются упорядоченные пары и при этом выполняется условие однозначности значений: «/-функция» = F{f) = Vx{[x е / -» 3yz(x = = < У, Z >]& \/uvw[(< и, v > е f& <и, w >е f) ^ v = w]}. Для функции / назовем областью определения множество b(f) = {x/3y(<x, y>zf} и областью значений множество p(f)={y/3x(<x, у>е/}. Будем писать в привычной манере у =/(х), если <х, у>е / Аналогично определяются п-местные функции и понятия, с ними связанные. Еще для одной операции из наивной теории множеств укажем специальную аксиому. Аксиома степени (или множества подмножеств) ZFCTen = \/y3x\/z(z £ х <-» zc у) (7) говорит о том, что для любого множества у можно образовать множество х, элементами которого являются в точности все подмножества множества у. Ранее обозначали такое множество х через Р(у) и называли его множеством подмножеств множества у. В литературе множество Р( у) часто также называют множеством-степенью множества у. Видели в теории множеств, какую важную роль играет переход от множества к его множеству-степени. Особенно это проявлялось, 201
когда с помощью понятия мощности давали количественную оценку множеств. В аксиоме выделения ZFBbW собирали в новое множество у все элементы уже имеющегося множествах, которые имеют свойство А. Теперь хотим собрать в новое множество у все значения функции, определяемой формулой А, на элементах уже имеющегося множества х: ZF3aM(^) = Vx{Vyzu[y ех& А(у, z) & А(у, и)-> z = u]-> —> 3vVw[we v <-» 3t(te x&A(t, w))]}. (§) Это и есть схема аксиомы, называемая аксиомой замены (или подстановки). Все варианты ZF3aM(/4) для каждой формулы А включаются в список аксиом теории ZF. Если проанализируем аксиомы ZFBbW и ZF3aM, то увидим, что вновь строящееся там множество у «имеет не больше элементов», чем исходное множество х. Действительно, аксиома ZFBbia поставляет в множество у лишь только некоторые элементы z множества х, а аксиома ZF3aM — f(z) лишь только для некоторых элементов z множества х. Однако у этих отобранных множеств z число элементов может «превосходить» число элементов множества х. И вот этот процесс «спускания вниз» может продолжаться и дальше. Чтобы каким-то образом ограничить этот «бесконечный» рост числа элементов, Д. фон Нейман предложил специальную аксиому регулярности (или иногда ее называют аксиомой фундирования): ZFpeT=Vx[x*0->3y(yex&xny = 0)]. (9) Указанный в (9) элемент у является в каком-то смысле «наименьшим» из всех элементов множества х. Пример 11.7. Выведем в теории ZF формулу Уи(ие и). Применим аксиому ZFpei к одноэлементному множеству {и}. Тем у, существование которого утверждается в ZFper, может быть только само множество и. Таким образом, {и} п и = 0, а значит, и е и. Пример 11.8. Выведем в теории ZF формулу \/uv(u <£ v v v <£ и). Применим аксиому ZFper к паре {и, v). Пусть тем у, существование которого утверждается в ZFper, является, например, множество и. Таким образом, {и, v) п и = 0, а значит, v <£ и. Пример 11.9. Оказывается в теории ZF (по крайней мере, с теми аксиомами, которые уже указаны) парадокс Рассела невозможен. Вопрос заключается в следующем: можно ли собрать в одно множество у все такие множества z, для которых справедливо zi Z? Докажем, что предложение ЗхУу(уе х о yi у) тождественно ложно. 202
Пусть данная формула верна на какой-то семантике теории ZF. Возьмем множество х, существование которого утверждается в указанной формуле. Учитывая пример 11.7, получим, что в х попадут все множества, в том числе и само х. Таким образом, х е х. Но этого быть не может! Осталось указать последнюю аксиому теории ZF, называемую аксиомой бесконечности. Необходимость подобной аксиомы объясняется следующими обстоятельствами. Анализируя уже введенные аксиомы для теории ZF, можно понять, что, имея в запасе лишь конечные множества (даже в наивном понимании), не удастся построить ни одного бесконечного множества. Действительно, все эти аксиомы в какой-то степени «ограничивали размеры-мощности» вновь строящихся множеств. И даже переход к множеству всех подмножеств (а как знаем из наивной теории множеств, эта операция сильно увеличивает мощность) из конечного множества продуцирует также конечное множество. Аксиома бесконечности ZF6ecK = 3х[0 ЕХ&\/у(уех^уи{у}ех] (10) указывает один из путей построения бесконечного множества в любой семантике теории ZF: начинаем с множества 0, которое имеется, строим 0U{0}, 0u{0}u{0u{0}}, ... Итак, полностью указали все аксиомы {ZFo6, ZFBbW, ZF0, ZFcyM, ^-^парьи ^^стсги ^^зам) ^^peri ^^беск) ТеОрИИ Z^r. Развивая теперь теорию ZF, сможем вывести многие утверждения той наивной теории множеств, которая рассматривалась в гл. 1, 3. Более того, называем множествами всякие объекты, на которых выполняются все указанные аксиомы. Теперь можно изучить метасвойства теории ZF. Наиболее трудная ситуация связана с вопросом непротиворечивости этой теории. Казалось бы на этот вопрос ответить просто — надо взять какую-нибудь семантику для ZF и тогда по теореме Геделя о выполнимости сделать вывод, что теория ZF непротиворечива. Но где брать такую семантику? Все конкретные алгебраические системы строились на базе системы 6 = < Set; е >, но объекты из Set и предикат е определялись через теорию ZF. По этой причине доказательство непротиворечивости ZF таким семантическим путем невозможно! Остается одно — искать какое-нибудь синтаксическое доказательство непротиворечивости ZF: доказать, что ни для какого предложения А нельзя в теории ZF найти выводы и формулы А, и формулы -л А. Так, по мысли Д. Гильберта, и должны выглядеть все доказательства непротиворечивости формальных систем. Однако К. Гедель указал такую формулу Consist, которую невозможно вывести в теории ZF, если эта теория непротиворечива. Но 203
эта замечательная формула Consist так своеобразно устроена, что она по существу и утверждает факт непротиворечивости теории ZF!!! Итак, если теория ZF непротиворечива, то это невозможно доказать в самой этой теории. Конечно, практически все верят, что теория множеств непротиворечива. Эта теория лежит в основе всех математических наук. Тысячелетний опыт работы математиков ни разу не давал повода для сомнений в непротиворечивости математики (частью которой является теория множеств). Были, конечно, примеры, когда возникала ситуация, подобная парадоксу Рассела. Но при внимательном анализе таких парадоксальных ситуаций всегда находились способы их избежать, уточнив интуитивные представления об изучаемых объектах, и усовершенствовать методы рассуждений. Ситуация, созданная формулой Consist, в какой-то мере неисправима. Она показывает, что корень проблемы лежит в самом понимании способов и методов математических доказательств. И надо искать выход в этом направлении. Для того чтобы доказать непротиворечивость теории ZF, нужно привлечь средства, выходящие за рамки формализма Д. Гильберта. Как уже говорили, используя правила вывода с бесконечным числом посылок, Г.Генцен сумел доказать непротиворечивость арифметики натуральных чисел, теории, очень близко стоящей к теории ZF. Вопрос о выполнимости для теории ZF тесно связан с вопросом о ее непротиворечивости. Обратимся теперь к вопросам полноты и пополняемости. Конечно, имеются предложения-проблемы в теории множеств, т.е. такие предложения А, для которых сегодня еще неизвестно, верны они или опровергаются в теории множеств. Каждая такая проблема может быть претендентом на то, чтобы с ее помощью доказать неполноту ZF, так как ищем такое А, чтобы в ZF не были выводимы оба предложения Aw -у А. Теория ZF неполна: в этой теории формула Consist неразрешима, ее нельзя подтвердить (вывести) и опровергнуть (вывести ее отрицание). Эту формулу или ее отрицание можно добавлять к теории ZF,jh если ZF была бы непротиворечива, то и эти две новые теории 1акже окажутся непротиворечивыми. А как еще можно пополнять теорию ZF? Долгое время дискутировался с этой позиции вопрос о принципе (аксиоме) выбора Vx{ У у (у е х -> у Ф 0) ->3/ [«/-функция» & \/z(z ех^ -»3u(«6z&« = /<*)))]}. Будем обозначать это предложение через АкВыб. Как видели в гл. 4, с помощью АкВыб доказываются очень важные теоремы теории множеств. Вопрос же о справедливости самой АкВыб в наивной теории множеств долгое время оставался открытым. 204
Аналогичная ситуация создалась и с другой проблемой, так называемой гипотезой континуума (обозначим ее через ГипКон), утверждающей, что между кардинальными числами Х0 и с не существует промежуточных кардинальных чисел. Эти проблемы удалось условно решить (в предположении непротиворечивости теории ZF) только в терминах аксиоматических теорий. А именно, К. Гедель доказал, что добавление к ZF ГипКон или АкВыб не делают новые теории противоречивыми, если исходная теория ZF непротиворечива. Другими словами, в ZF нельзя опровергнуть (т.е. доказать отрицание) ни ГипКон, ни АкВыб. П.Коэн доказал, что добавление к ZF формул -i ГипКон или -1 АкВыб также не делают новые теории противоречивыми. Другими словами, в ZF нельзя доказать ни ГипКон, ни АкВыб. Итак, если теория ZF непротиворечива, то, добавляя к аксиомам теории ZF одну из формул ГипКон, АкВыб, -. ГипКон или -1 АкВыб, снова будем получать непротиворечивые теории.
ГЛАВА 12 ЧИСЛОВЫЕ ТЕОРИИ 12.1. Арифметика Пеано Теперь рассмотрим элементарные теории, связанные с натуральными числами. Возьмем алгебраическую систему т = < N; 0; X, +, ■ >, где на множестве обычных натуральных чисел N выделена константа 0 и заданы операция Х(х) = х + 1 и обычные операции сложения и умножения. Назовем эту алгебраическую систему стандартной арифметикой натуральных чисел. Эта система изучалась в подразд. 3.3, но там в сигнатуре не было константы 0 и операции X. (Заметим, что 0 и X логически определяются через + и •. В принципе они лишние, однако удобнее их зафиксировать в сигнатуре.) Через Х(9Т) обозначалось множество всех выполнимых на этой интерпретации 91 предложений, т.е. предложений, для которых интерпретация 91 является семантикой; 1(91) можно назвать элементарной теорией для арифметики натуральных чисел 91. В 1(91) попадут практически все известные теоремы о натуральных числах, выразимые в языке для ИПФ сигнатуры а = <0; X, +, • >. Как отмечали, в Т(91) будут находиться и все утверждения, верность которых пока не установлена, но когда-нибудь будет доказана. Так, упоминавшаяся ранее четная проблема Гольдбаха о том, что всякое четное число, не равное 2, есть сумма двух простых чисел, легко записывается предложением G на языке ИПФ. Усилия многих математиков (до настоящего времени безуспешные!) сосредоточены на том, чтобы узнать, какое же из предложений из G или -1 G принадлежит теории Х(9Т). А можно ли построить другую алгебраическую систему 91, = < TV,; 0; X, +, ■ >, логически эквивалентную 91, т.е. такую, что ее объекты и функции отличались бы от обычных натуральных чисел с их стандартными операциями, но так, чтобы элементарная теория 1(910 совпадала с элементарной теорий Т(9Т)? Конечно, это легко сделать: надо взять любую систему 91], изоморфную системе 9Т. Действительно, изоморфные системы являются логически эквивалентными, т.е. их нельзя отличить с помощью формул соответствующего языка. 206
Трудно представить другие объекты, принципиально отличные от натуральных чисел, но с совершенно теми же логическими свойствами, как и у обычных натуральных чисел. Но как видели в под- разд. 10.4, некоторая элементарная теория, не сильно отличающаяся от 1(91) (по существу лишь одной лишней константой а), имеет нестандартные системы, т. е. не изоморфные системе У1. По этой причине не можем на уровне ИПФ вполне адекватно описать с точностью до изоморфизма даже такие хорошо знакомые и интуитивно ясные понятия, как натуральные числа. Выход один: называем натуральными числами всякие объекты с определенными на них операциями 0, X, +, •, элементарная теория которых совпадает с элементарной теорией для арифметики натуральных чисел Т(9Т). Попробуем задать элементарную теорию для арифметики натуральных чисел 91 в виде формальной системы. Для этого нужно подобрать подходящую систему аксиом. Наиболее известным аксиоматическим фрагментом элементарной теории Т(9Т) является исчисление АП, основанное на аксиомах Пеано. Сигнатура аАП = < 0; X, +, • > состоит из константы 0, одноместной функции X и двух двухместных функций + и •. В ИПФ уже есть аксиомы, утверждающие корректность = по отношению к функциям X, + и -. По этой причине их не выписываем еще раз. Система аксиом Пеано состоит из следующих формул: 1) АП, = \/ху[Х(х) = Х(у) -+х = у], 2) АП2 =Vx[A.(jc)*0], 3) АП3 =Ух[хФ0^3у(х = Х(у)], 4) АЩ=Ух[х + 0 = х], 5) АП5=Уху[х + Х(у) = Х(х + у)], 6) АП6 =Vjc[*-0 = 0], 7) АП7 =\/ху[х-Х(у) - х-у + х], 8) АПл = ({ДО) & Ух[А(х) -» А(Х(х))]} -> Vx/4(x)), f где А(х) — любая формула сигнатуры оАП, среди свободных переменных которой есть х. Сделаем несколько комментариев к системе аксиом Пеано. Аксиомы АП!—АП3 формализуют интуитивные представления о построении натуральных чисел в процессе счета, т. е. перехода от натурального числа х к следующему натуральному числу х + 1; на стандартных натуральных числах функция Х(х) интерпретируется функцией х + 1. Аксиомы АП4, АП5 и АП6, АП7 формализуют так называемые рекурсивные определения сложения и умножения. В них указывается, как производить эти операции, когда второй аргумент равен 0 или же оно является следующим числом за таким числом, для которого уже умеем совершать операции. На стандартной арифметике 207
натуральных чисел функции + и • интерпретируются обычными операциями сложения и умножения. Аксиомы АПл (их бесконечно много — для каждой формулы А(х), где х — одна из ее свободных переменных) называются аксиомами индукции. Эти аксиомы формализуют известный метод математической индукции. Заметим, что при обычном использовании метода математической индукции предикат А рассматривается как произвольное подмножество. Так, что прямая формализация метода индукции должна бы носить следующий вид: \/А{...}, а, как уже несколько раз говорили, такое связывание квантором в ИПФ недопустимо. По этой причине приходится выписывать все случаи использования индукции для каждого одноместного предиката, выразимого в языке ИПФ. Это значительно ослабляет метод индукции, так как если какое-то свойство (одноместный предикат) невыразимо в языке ИПФ, то при формальных доказательствах (выводах) не можем к нему применить индукцию. Легко понять, что все аксиомы Пеано выполняются на стандартной арифметике натуральных чисел т = < /V; 0; Ц +, • >, т.е. 9Т является семантикой для АП. Эту систему будем называть стандартной моделью АП. Все семантики для теории АП, не изоморфные 91, получают название нестандартных моделей АП. Систематическое построение исчисления АП показывает, что значительное число теорем теории чисел могут быть формально выведены в АП. Не будем проводить здесь детального исследования в этом направлении. Докажем лишь несколько теорем. Приведенные доказательства могут быть легко переделаны в формальные, т.е. в выводы в исчислении АП. Можно здесь воспользоваться теоремой адекватности, так как эти теоремы являются логическими следствиями аксиом Пеано. Пример 12.1. АП \- \/ху [ Цх) + у = Цх + у)]. Зафиксируем некоторое х и рассмотрим для этого х следующий одноместный предикат: Ах(у)=Ц(х) + у = Цх + у)). Имеем Ах(0), так как Х(х) + 0 - Цх) = Х(х + 0). Пусть есть Ах(у). Тогда для Ах(Х(у)) имеем Цх) + Цу) = ЦЦх) + у) = ХЦх + у) = Х(х + Цу)). Итак, АП h УуАх(у), а значит, и АП Ь \/хуАх(у). Пример 12.2. АП \- \/х(х + 0 = 0 + х). Пусть А(х) = (х + 0 = 0 + х). Имеем Л(0), так как 0 + 0 = 0 + 0. Пусть есть А(х). Тогда для А(Цх)) имеем Цх) + 0 = Х(х + 0) = Ц0 + х) = 0 + Цх). 208
Пример 12.3. АП V- Уху(х + у = у + х). Зафиксируем некоторое х и рассмотрим для этого х следующий одноместный предикат: Ах(у)={х + у = у + х). Имеем Ах(0), так как х + 0 - 0 + х. Пусть есть Ах(у). Тогда для Ах{Х(у)) имеем х + Х(у) = Х(х + у) = Х(у + х) - Х(у) + х. Пример 12.4. АП Ь- Vxyz[x + (у + z) = (х + у) + z]. Зафиксируем некоторые х и у и рассмотрим для этих х и у следующий одноместный предикат: Axy(z) = (х + (у + z) = (х + у) + z). Имеем Аху(0), так как х + (у + 0) = х + у = (х + у) + 0. Пусть есть Axy(z). Тогда для Axy(k(z)) имеем х + (у + Uz)) = x + X(y + z) = Цх + (у + z)) = Щх + у) + z) = = (x + y) + X(z). Пример 12.5. АП Ь Уху [к(х) ■ у = х ■ у + у]. Зафиксируем некоторое х и рассмотрим для этого х следующий одноместный предикат: АХ(У) = (Цх)-у = х-у + у). Имеем Ах(0), так как Х(х) -0 = 0 = х-0 + 0. Пусть есть Ах(у). Тогда для Ах(Х(у)) имеем Х(х) ■ Х(у) = Х(х) ■ у + Х(х) = х ■ у + у + Х(х) = х ■ у + Х(у + х) = = х ■ у + Х(х + у) = х-у + х + Х(у) = х ■ Х(у) + Х(у). Пример 12.6. АП h Vx (х ■ 0 = 0 • х = 0). Рассмотрим следующий одноместный предикат: А(х)=(х-0 = 0-х). Прих = 0 имеем 0 0 = 0 = 0 0. Пусть есть А(х). Тогда для А(Х(х)) имеем Цх) 0 = 0 = х0 + 0 = 0х + 0 = 0- Х(х). Пример 12.7. АП h Уху (х • у - у ■ х). Зафиксируем некоторое х и рассмотрим для этого х следующий одноместный предикат: Ах(у)=(ху = у-х). Имеем Ах(0), так как х-0 = 0-х . 209
Пусть Ах(у). Тогда для Ах(Х(у)) имеем х ■ Х(у) - х ■ у + х = у-х + х - Х(у) ■ х. Аналогично в АП выводятся следующие формулы: \/xyz[x ■ (у + z) = (х ■ у) + (х ■ z)Y, Vxyz[x ■ (у ■ z) = (х ■ у) ■ z\; Vxy[jt + 3; = 0-»(x = 0&j/ = 0)]; Vxy[x-y = 0->(x = Ovy = 0)]; Vxyz[x + z = y + Z-> x = у]; Vxyz [z * 0 -> (x ■ z = У -z -> x = y)] и другие хорошо знакомые арифметические законы. Пример 12.8. Определим с помощью формул следующие предикаты: х< y=3z[x + X(z) = у] и x<y = 3z[x + z = y]- Доказывается, что предикат < является отношением линейного порядка, а именно в АП выводятся следующие формулы: \/х(х < х), Уху [(х < у & у < X) -4 х = у], Vxyz[(x < у & у < z) -> х < z], Vxy[x <yvx = yvy<x]. Докажем, например, последнюю формулу. Зафиксируем некоторое х и рассмотрим для этого х следующий одноместный предикат: АХ(У) =[х < у V х = у v у < х], говорящий о том, что объект у сравним по < с объектом х. Имеем Ах(0), так как если х = 0, то х = у, а если х = X(z), то у - = X(z) = х, что означает у < х. Пусть есть Ах(у), т.е. у сравним с х. Докажем, что и Х(у) сравнимо с х, т.е. Ах(Х(у)).. Если х < у, то х + X(z) = у. Имеем Х(у) = Х(х + X(z)) = х + XX(z). Если х - у, то имеем Х(у) = Х(х) = Х(х + 0) = х + Х(0). Если у < х, то у + X(z) = х для некоторого z- Если это z = 0, то Х(у) = х. Если же z - Х(и) для некоторого и, то имеем Х(у) + Х(и) = Х(у + Х(и)) = у + ХХ(и) = у + X(z) = х. Рассмотрим термы сигнатуры оАП = <0; X, +, •> специального вида: А0 = 0; Д„+1 = Х(А„). 210
Кстати, уже несколько раз объяснялась похожая ситуация, когда не можем в выбранном языке записать, что какой-то терм имеет вид А„. По этой причине приходится отдельно определять каждый такой терм для конкретного п. Следующие результаты показывают, что такие термы ведут себя подобно обычным натуральным числам. Пример 12.9. Для любых натуральных чисел пит: АП 1- Ап - Ат тогда и только тогда, когда п = т; АП Ь Д„ + Ат = Ап + т; АП h Д„ • Am = А„.т; АП Ь Д„ < Ат тогда и только тогда, когда п < т; АП I- Ух [х < А„ -»(х = А0 v х = А\ v ... v х = Д„)]; АП hVx (х< Д„ vA„ < jc). Для доказательства, например, последней формулы надо взять множество А ={х / х < Ап v А„ < х} ис помощью индукции вывести \/х(х е А). Возьмем произвольную модель АП 91, =<N{; 0; X, +, ■>. Выделим из множества всех элементов Л^ подмножество объектов М, интерпретирующих термы Д„. Тогда алгебраическая система WI = = <М; 0; X, +, •> будет подсистемой 91,, изоморфной стандартной модели арифметики натуральных чисел 91 = < N; 0; X, +, ■ >. По этой причине можно сказать, что стандартная модель 91 вложима в любую модель АП, и, значит, является минимальной в классе 2Ш(АП). Те элементы N{, которые не попали в М, называются нестандартными. Более того, учитывая введенный линейный порядок <, можем элементы Nx расположить в последовательность: Д0 < А] < А2 < ... < х < ..., где вначале идут стандартные натуральные числа (вернее, наши термы, заменяющие в Ni натуральные числа), а уже после них идут все нестандартные элементы (если они, конечно, есть). Вместе с тем, если бы имели возможность использовать в полной мере (а не только для логически определимых множеств) метод математической индукции, то смогли бы доказать изоморфизм любых моделей АП. Проведем одно рассуждение о двух моделях АП: 91, =<NX; 0; X, +, •> и 9Т2 = < N2; 0; X, +, ■>. Почему его не будем формулировать в виде теоремы, будет ясно из дальнейшего. Будем строить некоторую функцию а: /V, -» N2 следующим образом: ос(0) = 0, а(Х(х)) = Ха(х). Докажем, что а осуществляет взаимно-однозначное соответствие между /Vj и N2. 211
1. Пусть М с N], такое, что для всех х е М функция а(х) определена. Имеем О е М, если х е М, т.е. значение а(х) определено, то и значение а(Х(х)) определено, т.е. Х(х) е М. Если здесь воспользуемся принципом обычной индукции для натуральных чисел (а ведь /V, — один из возможных вариантов множества натуральных чисел), то получим, что М= TV,. 2. Пусть />с N2 — множество таких х, что ровно для одного у е N{ имеем а(у) = х. Опять воспользуемся принципом обычной индукции для натуральных чисел (а ведь N2 — один из возможных вариантов множества натуральных чисел), чтобы доказать равенство Р - N2. Действительно, О е Р, так как а(0) = 0, и если бы а(Х(у)) = О для некоторого у е Л',, то имели бы 0 = Ха(у), что противоречит аксиоме АП3. Пусть х е Р, т.е. а(у) = х выполняется ровно для одного у е Л',. Рассмотрим элемент Цх). Ясно, а(Цх)) = Ха(у) = Цх). Если бы a(v) - Цх) для v Ф Х(у), то v = Х{и) для некоторого и. Имеем и Х(и) = a(v) = Цх), т.е. х = и. 3. Соответствие корректно по отношению к функциям X, +и •. Нужно доказать три формулы: а(Цх)) = А,а(х), а(х + у) = а(х) + а(у), а(х • у) = а(х) • а(у). Первая формула — просто определение а. Вторую и третью формулы будем доказывать снова с помощью принципа индукции. Зафиксируем х и рассмотрим два множества: Rx = {у /а(х + у) = а(х) + а(у)} и Sx = {у/а(х- у) = а(х)а(у)}. Имеем 0 е Rx n Sx, так как а(х + 0) = а(х) = а(х) + а(0), а(х-0) =а(0) = а(х)-а(0). Пусть у е Rxn Sx. Тогда имеем а(х + Х(у)) = аХ(х + у) = Ха(х + у) = Х[а(х) + а(у)] = - а(х) + Ха(у) = а(х) + иХ(у), а(х • Х(у)) = а(х ■ у + х) = а(х • у) + а(х) = а(х • у) + а(х) = = а(х) • Ха(у) = а(х) • аХ(у), т.е. Х(у)е Rxr<Sx. Итак, построили изоморфизм моделей 91] и 912! А как же быть с существованием нестандартных моделей арифметики? Секрет этой парадоксальной ситуации объясняется просто. Во всех пунктах рассуждения применялся принцип индукции к некоторым множествам (М, Р, R, S), которые не были логически (формул ьно) выразимыми в нашем языке (всегда использовались пред- 212
метные переменные, значения которых выбирались из двух различных систем). А в теории АП такое применение принципа индукции не разрешено. Переходя к метасвойствам теории АП, должны констатировать, что здесь ситуация полностью совпадает с теорией ZF. Вопрос о непротиворечивости АП также невозможно решать посредством теоремы Геделя о выполнимости, так как стандартные натуральные числа в той же степени труднопонимаемы, как и множества. В рамках формализма Гильберта доказательство непротиворечивости АП невозможно — формула Геделя Consist строилась в действительности для теории АП, ее построение как раз и составляет содержание теоремы Геделя о неполноте арифметики натуральных чисел. Теория АП неполна: в этой теории формула Consist неразрешима, ее нельзя подтвердить (вывести) и опровергнуть (вывести ее отрицание). Если теория АП непротиворечива, то, добавив к ее аксиомам одну из формул Consist или -, Consist, снова получим непротиворечивую теорию. Итак, аксиоматическая теория АП определяет класс алгебраических систем 21Я(АП), каждую систему из этого класса справедливо назвать арифметикой натуральных чисел. Стандартная модель является минимальной системой класса 21Я(АП), она вложима в любую систему из этого класса. 12.2. Другие числовые теории Имея натуральные числа, смогли построить и другие разновидности чисел: <£, £Н, Э, Я — арифметики целых, рациональных, действительных и комплексных чисел. Попробуем посмотреть на теории этих арифметик с аксиоматической точки зрения. Целые числа. Алгебраическая система С = < С, +, • > получалась из арифметики натуральных чисел У1 = < N,+, • > с помощью перехода к фактор-системе (см. подразд. 3.4). Система аксиом Пеано и теория Пеано АП определили класс 2Ш(АП) алгебраических систем, а стандартная система 91 оказалась минимальной системой в этом классе, она вложима в любую систему из класса 21Л(АП). Как увидим далее, положение с целыми числами очень похоже на случай натуральных чисел. Выделим некоторую систему аксиом 21, на базе которой будем строить формальную систему Ф(21) и класс 21Я(Ф). Будем считать цель достигнутой, если окажется, что арифметика целых чисел <£ = < С; 0,1; <; +, ■ > будет минимальной в классе 51Я(Ф). Заметьте, что немного изменили сигнатуру у С, добавив константы 0 и 1 и предикат <; конечно, они логически определимы в нашем языке 213
так, что в € они интерпретируются, как обычные 0 и 1 и предикат неравенства. Также не включили в сигнатуру функцию к. При необходимости ее определим, как функцию х + 1. Аксиоматическим фрагментом теории 1(£) будет исчисление УК — теория упорядоченных коммутативных колец с 1 без делителей 0. В ИПФ есть аксиомы, утверждающие корректность = по отношению к <,+,-. По этой причине их не выписываем еще раз. Система аксиом для УК состоит из следующих формул: 1)ук, = (о* О; 2) У К2 = Уху[х + у = у + х&ху = ух]; 3) УК3 = Vxyz[x + (у + z) = (х + у) + z & х ■ (у ■ z) = (х ■ у) ■ z\; 4)УК4 =Ух[х + 0 = 0&х \ = х]; 5)УК5 = Vxyz[x■(y + z) = (x-y) + (x- z)Y, 6)yKb=Vxy3\z[x + z = y]; 7) УК7 = \/xv[x ■ у = 0 -»(х = 0 v у = 0)]; 8) УК8 == Vx(x < х); 9) УК9 = \/ху[(х <у&у<х)^х = у]; 10) УК10 ^ Уxyz[(x < у & у < z) ^ х < zV, 11)УК|, =yxyz(x<yvy<x); 12) УК|2 = Mxyz (x<y->x + z<y + z); 13) УК|3 = Vxyz[(z *0&x<y)^>x-z<y-z]. Сделаем несколько комментариев к системе аксиом для УК. Аксиома УК] говорит о том, что объекты 0 и 1 различны. Таким образом, всякая семантика для УК содержит, по крайней мере, два элемента, интерпретирующие константы 0 и 1. Аксиомы УК2—УКб являются аксиомами коммутативного кольца с 1 (0 и 1 являются «единичными» элементами для операций + и ■). Аксиома УК7 утверждает отсутствие делителей 0. Аксиомы УК8— УК,з формализуют свойства предиката < по отношению к + и •. Легко понять, что все аксиомы для УК выполняются на системе 1 = < С; 0,1; <; +, ■ >, которую будем называть стандартной моделью для арифметики целых чисел. Все семантики для теории УК, не изоморфные 6, получают название нестандартных моделей для арифметики целых чисел. Если будем развертывать исчисление УК, то увидим, что значительное число теорем о целых числах могут быть формально выведены в теории УК. Рассмотрим термы сигнатуры оук = <0,1; <; +, •> специального вида: А0 = 0; Д„+1 = ЦД„). По аксиоме УК6 для каждого А„, называемого положительным натуральным числом, существует единственное z, такое, что 214
А„ + z = 0. Такой объект z будем называть отрицательным числом и обозначать его через (-Л„). Кстати, если (-Л„) + и = 0, то и = Ап. Возьмем произвольную модель для арифметики целых чисел €х = < С,; 0,1; <; +, • >. Выделим из множества С] подмножество М, элементы которого интерпретируют термы А„ и (-Л„). Пример 12.10. Для любых натуральных чисел пат имеем: 1) УК Ь Д„ = Ат тогда и только тогда, когда п = т; 2) УК (- (-Д„) = (-Лт) тогда и только тогда, когда п = т; 3) УК 1- А„ = (-А,„) тогда и только тогда, когда п = т = 0; 4) УК Ь А„ + Ат = Ди+т& А„-Ат = А„.т; 5)ук1-ля + (-дЯ1) = {^-; если т^ { (-Аи_„), если п < т; 6) УК Ь (-AJ + (-А„) = (-Ля+„); 7) УК Ь Дя-(-Ая) = (-Дл.„); 8) УКк (-Дя)-(-Аи)= А„.т; 9) УК h Д„ < Дт тогда и только тогда, когда п < т; 10) УК Ь (-Дя) < (-Д,„) тогда и только тогда, когда т < п. Докажем, например, восьмую формулу УК V (Д„) • (-Дт) = А„ ,т. Имеем 0 = [Дя + (-Дя)] ■ [Ат + (-А,,,)] = А„ ■ А,„ + (-Дя) • Ат + + А„ • (-Am) + (-А„) • (-Д„) = Апт + (-Апт) + {-Апт) + (-А„) • (-Ат) = = (-A„J + (-A„H-Aj- Итак, (-A„)-(-A„) =Ая.т. Видим, что система 9Я = <М; 0,1; <; +, •> изоморфна стандартной модели для арифметики целых чисел. Таким образом, стандартная модель £ = < С; 0,1; <; +, • > вложима в любую модель для арифметики целых чисел и является минимальной в классе 21Я(£). Рациональные числа. Здесь возьмем алгебраическую систему 9\ = < R; 0,1; <;+,•> — арифметику рациональных чисел из под- разд. 3.4 (опять с некоторым расширением сигнатуры). Аксиоматическим фрагментом теории X(9t) будет исчисление УП — теория упорядоченных полей. В ИПФ есть соответствующие аксиомы о корректности = по отношению к основным предикатам и функциям. Система аксиом для УП состоит из следующих формул: 1) УП, ^ (0 * 1); 2) УП2 з \/ху[х + у = у + х&ху = у-х]\ 215
3) УП3 = \/xyz[x + (у + z) = (х + у) + z&х■ (у■ z) = (х■ у)■ zY, 4) УП4 = Vx[x + 0 = О & л- • 1 = х]; 5) УП5 = Vxyzlx (y + Z) = (xy) + (x- z)Y, 6) УП6 =Vxy3\z[x + z = y]; 7) УП7 = Vxy[x * О -> 3lZ(x ■ z = у)]; 8) УП8 = Vx(x < х); 9) УП9 s Уху[(х <у&у<х)->х = у}; 10) УП|0 =\fxyz[(x<y&y<z)^x<z\; 11) УП,, =\fxyz(x<yvy<x); 12) УП12 s Vxyz(x< у->х + г< у + г); 13) УП|3 eVi^Kz^O&xS^^i-z^^]. Отметим, что заменили аксиому УК7 (которая в полях автоматически выполняется, т.е. может быть выведена из аксиом поля) на аксиому УП7, говорящую о том, что в поле деление определено и однозначно. Легко понять, что все аксиомы для УП выполняются на системе 91 = <R; 0,1; <; +, •>, которую будем называть стандартной моделью для арифметики рациональных чисел. Все семантики для теории УП, не изоморфные 91, получают название нестандартных моделей для арифметики рациональных чисел. Выделим в произвольной арифметике рациональных чисел 5Hi =<R\, 0,1; <; +, •> множество элементов М, которые интерпретируют термы А„ и элементы (-Дт). Для таких элементов будем применять запись еД„, имея в виду, что е означает «знак» этого целого числа. По аксиоме УП7 для каждых е„Д„ и етАт, и если е„Д„ * 0, суще- 8 Д ствует элемент z, который будем обозначать через т т , такой, что е„Д„ • z = гтАт. И снова можно вывести в УП формулы, свидетельствующие о том, что множество М таких объектов . замкнуто относитель- но сигнатурных операций, а система 9Я =< М; 0,1; <; +, • > изоморфна стандартной арифметике рациональных чисел. Итак, стандартная система 91 вложима в любую арифметику рациональных чисел и является минимальной в классе 21 Я. (91). Действительные числа. Стандартная арифметика действительных чисел £> <D; 0,1; <;+,•> (с изменениями в сигнатуре, см. подразд. 3.5) строилась из рациональных чисел с помощью некоторого вида предельного перехода (сечения Дедекинда). По этой причине резко увеличивается мощность основного множества системы (от К0 до с). При этом выразимых свойств в языке ИПФ остается счетное 216
число (из-за конечности или счетности сигнатуры), хотя самих этих свойств (подмножеств множества D) становится 2е. Должны ожидать, что элементарная теория 1(D) станет более обозримой, хотя объекты, изучаемые этой теорией, более сложны, чем рациональные числа. Аксиоматическим фрагментом теории Т(Э) является исчисление ВЗУП — теория вещественно-замкнутых упорядоченных полей (в отечественной литературе действительные числа часто называются вещественными). Сигнатура о языка для ЗТ(Э) такая же, как и у ранее рассмотренных теорий для числовых систем. Упорядоченное поле Р называется вещественно-замкнутым, если каждый многочлен нечетной степени р(х) с коэффициентами из Р имеет в поле Р корень, т. е. такой элемент аеР, что р(а) = 0, и из каждого положительного элемента можно извлечь квадратный корень. То, что стандартная арифметика действительных чисел является вещественно-замкнутым полем, следует из одной алгебраической теоремы о том, что всякий многочлен нечетной степени с действительными коэффициентами имеет действительный корень. Извлечение квадратного корня из положительного числа также всегда осуществимо в области действительных чисел. Система аксиом для ВЗУП получается из системы аксиом для УП (ynt —УП13) добавлением аксиомы ВЗУП14 = Vjc[0 < х -> Зу(х = у2)] и бесконечного списка аксиом вида ВЗУП (/>(.*)) = За(р(а) = 0) для каждого многочлена р(х) - а0х2п+' + ахх2п + ... + а2„х + а2п+1 нечетной степени 2« + 1, где все а, е Р и я0 ф 0. Оказывается, что теория ВЗУП является полной, т. е. для любого предложения А сигнатуры о в ВЗУП выводится либо А, либо -л А. Таким образом, все семантики для ВЗУП логически эквивалентны. Это позволяет предложить алгоритм для решения вопроса о выводимости в ВЗУП любого предложения А. Теории, для которых подобные алгоритмы существуют, называются разрешимыми. В теории алгоритмов подробно изучаются как разрешимые, так и неразрешимые теории. В чем состоит простейший алгоритм для ВЗУП: надо постепенно порождать все выводы в теории ВЗУП и ждать, когда же будет выведено А или -. А. Полнота теории означает, что такой момент обязательно наступит. Этим теория действительных чисел принципиально отличается от теорий натуральных, целых и рациональных чисел, для кото- 217
рых доказано, что подобных алгоритмов не существует, т.е. эти теории неразрешимы. Комплексные числа. Стандартная арифметика комплексных чисел Я = < К; 0,1; +, • > (с изменениями в сигнатуре, см. подразд. 3.5) строилась на парах действительных чисел D2 с помощью задания на них операций сложения и умножения. Заметим, что в данном случае не рассматриваем на множестве К предикат <, так как на комплексных числах невозможно ввести удовлетворительным образом порядок, согласованный с операциями + и •. Аксиоматическим фрагментом теории Т(Л) является исчисление АЗП0 — теория алгебраически замкнутых полей характеристики 0. Поле Р называется алгебраически замкнутым, если каждый многочлен Р(х) с коэффициентами из Р имеет в поле Р корень, т. е. такой элемент а е Р, что Р(а) - 0. Поле Р имеет характеристику 0, если для любого натурального числа п ф 0 всегда я • 1 * 0. То, что стандартная арифметика комплексных чисел является алгебраически замкнутым полем, следует из основной теоремы алгебры: всякий многочлен с комплексными коэффициентами имеет комплексный корень. Характеристика поля К, очевидно, равна 0. Система аксиом для АЗП0 получается из системы аксиом для полей, которые обозначали через УП! —УП7 добавлением бесконечного списка аксиом вида АЗПоОКх)) = За(р(а) = 0) для каждого многочлена р(х) = а0х" + Oijc"-1 +... + ап_{х + а„, где все а,- е Р и а0 ф 0, и бесконечного списка аксиом 1 + 1 *0, 1 + 1 +1 ф0, ... Оказывается, что и теория АЗП0 является полной, т.е. для любого предложения А сигнатуры о в АЗП0 выводится либо А, либо -, А. Это следует из алгебраической теоремы о том, что всякие равно- мощные алгебраически замкнутые поля одной и той же характеристики и одинаковой несчетной бесконечной мощности изоморфны, т.е. здесь наблюдается m-категоричность для кардинального числа т. Таким образом, все семантики для АЗП0 логически эквивалентны. Из-за полноты теория АЗП0 также разрешима.
ГЛАВА 13 ГЕОМЕТРИЧЕСКИЕ ТЕОРИИ 13.1. Аксиомы Д.Гильберта для геометрий В подразд. 4.5 рассматривались некоторые геометрические модели, навеянные аксиоматикой Д. Гильберта для евклидовой и других геометрий. В связи с тем что аксиоматический метод зародился при построении геометрии, да и в дальнейшем геометрия служила основным полигоном при рассмотрении различных модификаций и усовершенствований аксиоматического метода, было бы не справедливым не указать какую-нибудь из современных геометрических систем аксиом. Выбираем из таких систем две наиболее интересные — оригинальную систему аксиом Д. Гильберта и чрезвычайно любопытную систему, разработанную А. Тарским и его учениками. Аксиоматика Д. Гильберта указана в его книге «Основания геометрии» (издание этой книги относится к 1899 г., на русском языке книга вышла в 1948 г.). Заслуга Д. Гильберта состоит в том, что ему удалось в доступном и достаточно полном виде систематизировать все имеющиеся в его время исследования в данном направлении, привести их в порядок, поставить и решить многие вопросы обоснования геометрии. После построения исчисления для геометрии можно искать его семантики, и тогда назвать те объекты из этих семантик точками, прямыми и плоскостями. Основной моделью для стереометрии в подразд. 4.5 была выбрана следующая: 6 = < Л/,; Т, Пр, Пл, Л, Меж, КО, КУ >, где основное множество Мх этой модели будет состоять из точек, прямых и плоскостей фиксированного пространства V, а сигнатурные предикаты будут интерпретироваться следующим образом: Т(х) означает, что х есть точка; Пр(х) означает, что х есть прямая; Пл(х) означает, что х есть плоскость; Л(х, у) означает предикат принадлежности х к у; Меж(х, у, z) означает, что точки х, у и z лежат на одной прямой и у находится между х и z', КО(х, у, z, и), КУ(х, у, z, и, v, w) означают предикаты конгруэнтности (равенства) отрезков и углов. Сами понятия отрезков и углов будут определены в языке соответствующей сигнатуры через основные предикаты. 219
Как уже отмечали, у Д. Гильберта был всего один предикат конгруэнтности, относящийся и к отрезкам, и к углам. Однако так как эти предикаты зависят от разного числа переменных, все же удобнее рассматривать два отдельных предиката конгруэнтности. Для наглядности будем писать привычным образом для конгруэнтности объектов: [х, у] = [z, и], если КО(х, у, z, и), Z xyz = ^ uvw, если КУ(х, у, z, и, v, w). Система аксиом Д.Гильберта G состоит из пяти однородных групп: аксиомы соединения (или принадлежности), аксиомы порядка, аксиомы конгруэнтности, а также аксиома о параллельных и аксиомы непрерывности. Обозначим через AG систему аксиом из первых этих трех групп и назовем исчисление, порожденное AG, абсолютной геометрией. Причины, по которым не включаем в абсолютную геометрию аксиому о параллельных и аксиомы непрерывности, будут указаны, когда будем формулировать эти аксиомы. Для того чтобы аксиомы G были более короткими и обозримыми, вначале введем еще одну группу аксиом, в которую войдут аксиомы, говорящие о возможности применимости основных предикатов. Заметим, что Гильбертом подобные аксиомы не указывались, а лишь подразумевались. Также заранее выпишем определения ряда вспомогательных понятий, которые будут использоваться как формулы-сокращения в аксиомах. Это делается для того, чтобы излишне не утяжелять формулы, реализующие аксиомы. Естественно, что не дословно будем следовать изложению Д. Гильберта. Ряд аксиом, которые не будут включены в группы I —III, относим в группу аксиом о применимости основных предикатов. Некоторые из аксиом Гильберта были значительно усложнены из-за желания сделать их независимыми. Так как такой цели не ставим, удается несколько упростить аксиомы. Группа аксиом о применимости основных предикатов. | G, =Ух{[Т(х) ^ (-лПр(х)&-.Пл(х)]& [Пр(х) ^ | <-+ ЬТ(х) & -нПл(х))] & [Пл(х) ^ (-Т(х) & -,Пр(х))]} (эта аксиома говорит о том, что все множество объектов разбивается на три непересекающиеся семейства (множества) — точки, прямые и плоскости); G2 =\/х]у1х2у2{[Я(х],у1)&х1 = х2 &у{ = у2] -> Л(х2,у2)}, G3 sVxly\Zix2y2Z2{[Me>£(x{,yuZ\)&. х, = х2 &у{ = у2 &z{ = z2] -> -» Меж(х2,y2,z2)}, 220
G4 = Vx, yx z\ щ x2y2Z2u2 {([xi, yx ] = [г,, щ ] & xi = = x2 & У\ = y2 & Z\ = Z2 &Щ = u2) ->[x2,y2] = [z2,u2]}, G5 =\/X\y\Z\U]VxW\X2y2Z2U\V\Wx{ {Zxxyxz = Zu^Wi &x, = x2 & Ji = = y2&Z\ = Z2 &-Щ = U2 &V\ = V2 & W, = W2) —> ZX2J2^2 = Zu2v2w2} (эти аксиомы говорят о корректности = по отношению к основным предикатам, они входят в обязательный набор аксиом ИПФ соответствующей сигнатуры, для полноты картины все же указываем их и здесь); G6 ^ху{Я(х, у) -»([Т(х) & Т(у) -» х = у] & [Пр(х) & Пр(^) -> -» х = у] & [Пл(х) & Пл(у) -> х = у] & Щу, х))} (эта аксиома говорит о том, что если одноименные объекты принадлежат друг другу, то они равны); G7 =\/xyz{ Меж(х,у, z) -> ([Т(х) & Т(у) & Т(г) & х Ф у & у Ф ФZ&zФx& Меж(г, у, х)] & Зи[Пр(и) & Л(х, и) & Л(у, и) & Л(г, и)])}, G8 = Vxyzu{[x,y] = [z,u] -> (Т(х) & ТОО & Т(г) & Т(и))Ь G9 з \fxyzuvw {Z xyz - Z uvw —> (T(x) & T(y) & T(z) & &T(m)&T(i;)&T(w))} (эти аксиомы говорят, что все эти три предиката применимы только к точкам); G10 s \fxyz{[x,x] = [у,у] & Zxyy = Zzuu}, G,, s \/xyz{[x,y] = [x,y\ &Zxyz = Zxyz}, Gl2 = Vxyzuvw{([x, y] = [z, u] -» [z, u] = [x, y]) & &(Zxyz = Zuvw -» Zuvw = Zxyz)}, G13 = \/xyzuvw{([x, y\ = [z, u] & [z, u] = [v, w] -> [v, w] = [x, y]) & &(Z xyz = Z uvw & Z Mfw = Z abc —» Z xj^ = Zайс)} (это рефлексивность, симметричность и транзитивность предикатов КО и КУ). Определения вспомогательных понятий. G,4 з Пер(х, у) = 3z( Т(г) & Л(г, х) & Л(г, у)) (эта формула определяет пересекающиеся в общей точке объекты); G15 = Кол(х,у,^) = Т(х)& Т(у)&T(z)& & Зы[Пр(ы) & Л(х, и) & Л(у, и) & R(z, и)] (эта формула определяет коллинеарные точки, т. е. такие, которые лежат на одной прямой); 221
G16 = Щх, у) = Пр(х) & Пр(у) & 3Z[lhi(z) & Л(х, z) & Л(У, z)] & &{х = у v -,3и[Т(и) & Л(и, х) & Л(ы, у)]} (эта формула определяет параллельные прямые, лежащие в одной плоскорти; заметим, что считаем совпадающие прямые параллельными);: G,7 = z е [х,у) =Т(х) & Т(у) & T(z) & [Меж(х,г,у) v Меж(х,y,z)], G,8 = г е [х, у] ^ Т(х) & Т(^) & Т(г) & Меж(х, z, у) (эти формулы определяют луч [х, у) и отрезок [х, у]; х — начало луча [х, у) и отрезка [х, у]; у — конег< отрезка [х, у]); G19 = и е Z хуг = x#y&x*?&{«e[xj)v[x^)} (эта формула определяет угол Z xyz', точка х — вершина, а лучи [х, у) и [х, г) — стороны угла Z хуг); G20 =ие Лхуг = [x^y&.y^z&Z^x& &-,Kon(x,y,z)]&{u<= [x,y]vwe [y,z]vue [z,x]} (эта формула определяет треугольник л xyz; точки х и у — вершины; Z xyz, Z у^х и Z zxy — углы, а отрезки [х, у], [у, г] и [z, х] — стороны треугольника A xyz); G21 = и £ 0(х, у, г) = Т(х) & Т(у) & T(z) & Т(ы) & [х, и] = [у, г] (эта формула определяет окружность 0(х, у, г) с центром х и радиусом [у, г]). Итак, приступаем к формулировке аксиом Д. Гильберта для геометрии. Каждая аксиома имеет двойной индекс i.j, где /' указывает номер группы, aj — номер аксиомы в этой группе. После аксиомы коротко объясним ее содержание, основанное на обычных интуитивных представлениях. Группа I. Аксиомы соединения (принадлежности). G,., = Vxy{[T(x) & ТОО & х ф у) -> 3!г[Пр(г) & J\(x,z) & Jl(y,z)]} (для любых двух неравных точек существует единственная прямая, проходящая через них); G,.2 s Vx{nP(x) -> 3yZ[T(y)& T(z)&y*z& Л(у,х)& Л(г,х)]} (на каждой прямой существуют, по крайней мере, две разные точки); 1 G,.3 = 3xyz[T(x) & ТОО & T(z) & -К(х, у, z)] (существуют три точки, не лежащие на одной прямой); G,.4 = Vxyz{[T(x) & Т(у) & T(Z) & ->VL(x,y,z)] -» 3!и[Пл(и) & Л(х,и) & Л(у,и) & H(z,и)]} 222
(любые три неколлинеарные точки определяют единственную плоскость, на которой они лежат); G..5 - Vx{Ibi(x) -> Зу[Т(у) & Я(у,х)]} (на каждой плоскости существует, по крайней мере, одна точка); G16 = Vxyz»{[T(x) & Т(у) & Rp(z) & Пл(и) & Л(х, z) & Л(у,z) & & Л(х, и) & Щу, и)} -» \/v[(T(v) & Щу, z)) -> J\(v, и)]} (если две точки прямой лежат в плоскости, то и вся прямая, т.е. всякая ее точка, лежит в этой плоскости); G17 s Уху{[Пл(х) & ПлОО & Эг[Т(г) & Жг,х) & Л(г,у)] -> -» ЗиГГ(и)&u±z&Щи,х)& Л(и,>>)]} (если две плоскости имеют общую точку, то они имеют и еще одну общую точку); G,.8 = 3xyZu{T(x) & Т(у) & Т(г) & Т(и) & Vu[Ibi(v) -> -» [-. Л(х, i>) v -, Л(;у, v) v -, Л(г, v) v -, Л(и, я)Ш (существует четыре точки, не лежащие в одной плоскости). Как отмечает Д. Гильберт, из аксиом группы I можно вывести, например, утверждения: 1. Две неравные прямые, лежащие в одной плоскости, либо имеют одну общую точку, либо параллельны. 2. Две плоскости либо не имеют ни одной общей точки, либо имеют общую прямую и никаких других (не лежащих на этой прямой) общих точек. 3. Плоскость и не лежащая на ней прямая либо не имеют общей точки, либо имеют одну общую точку. 4. Через прямую и точку, не лежащую на ней, так же как через две различные прямые, имеющие общую точку, всегда можно провести плоскость и притом только одну. Группа П. Аксиомы порядка. G2.i = Vxy{[T(x) & Т(У) &х±у}-^ 3z(T(z) & Меж(х,у, z))} (для любых двух неравных точек существует, по крайней мере, еще одна точка, не лежащая между ними); G22 s \/xyzhK(x,y,z)^3lи[Пл(и) & Л(х,и) & Щу,и) & Л(г,и)]} (любые три неколлинеарные точки определяют единственную плоскость); G23 = VxyZu{[T(x) & Т(у) & T(z) & -nK(x,y,z) & Пр(и) & 8с^Щх,и) &-,Щу,и) &-^Щ^и) & Зь[Шж(х,р,у) & Щу,и)\ -» -» 3>у[Л(м>, и) & (Меж(х, w, z) v Меж(д>, w, z))]} 223
(аксиома Паша — если прямая «входит во внутрь треугольника», то она также и «выходит» из этого треугольника, рис. 13.1). Как отмечает Д. Гильберт, из аксиом — групп I и II можно вывести, например, утверждения. 1. Среди трех точек на прямой всегда Рис. 13.1 существует ровно одна из них, лежащая между двумя другими. 2. Между любыми двумя точками на прямой существует бесконечно много точек. 3. Каждая плоскость разбивает точки пространства на две такие области, что любой отрезок, концы которого принадлежат разным областям, обязательно пересекает эту плоскость. Группа III. Аксиомы конгруэнтности. G3.i = Vxyzu{[T(x) & ТОО & T(z) & Т(и) & х * у] -> -^ Зу[Меж(х,у,у) v Меж(х,у,у)& [x,v] - \z,u]} (возможность «отложить» от конца луча отрезок, конгруэнтный данному); G3.2 = Vxyzuvw{(MeK(x, у, z) & Меж(и, v, w) & [х, у] = [и, v] & &[y,z] = [v,w]) -* [x,z] = [u,w]} (возможность «складывать» отрезки); G33 = Vxyzuvw{[T(x) & T(y) & 7(z) & Т(и) & T(v) &x*y& &Z* u&z* v]—> 3w\T(w) & x * w & Zxyw = Zzuv]} (возможность «откладывать» углы); G34 = \fxyzuvw{[[x,у] = [и, v] & [x,z] = [u,w]&.Zxyz = Zuvw] -> -»[Zyxz = Zvuw& Zzyx = Zwvu]} (зависимость конгруэнтности отрезков и углов треугольника). Итак, указаны все аксиомы абсолютной геометрии AG. Развивая эту геометрию AG, Д.Гильберт получает значительное число теорем из стандартной геометрии. Отметим лишь самые значительные из них. 1. Признаки конгруэнтности (равенства) треугольников. 2. Существование прямых углов и их конгруэнтность. 3. Теорема о внешнем угле треугольника. 4. Свойства равнобедренных треугольников. Особенно важно при этом, что здесь им собраны те теоремы, для доказательства которых не нужно прибегать к аксиоме о параллельных или ее многочисленным эквивалентным утверждениям. 224
Приведем две самые известные интерпретации для абсолютной планиметрии плоскости AGruiaH (надо рассматривать лишь точки и прямые, заданные на фиксированной плоскости, и не учитывать аксиомы, где речь идет о плоскостях). Первая 6 = < Мх\ Т, Пр, Л, Меж, КО, КУ > имеет дело с нашими стандартными (интуитивными) представлениями о точках, прямых и плоскостях. Аксиомы AGnjiaH составлялись так, что все они выполняются в этой интерпретации. Таким образом, она является семантикой для AGnjiaH. Другая интерпретация Я = < К; Т, Пр, Л, Меж, КО, КУ > принадлежит Ф. Клейну. Пусть множество К состоит из внутренних точек и хорд (без концов) зафиксированной окружности а (рис. 13.2). Здесь а, Ь, с — точки; d, e,f— прямые, а сигнатурные предикаты интерпретируются стандартным образом. Можно проверить, что все аксиомы AGnjia„ выполняются в модели Я, т. е. Я является семантикой AGnjiaH. Также должны отметить, что всякое предложение А, не выполняющееся на модели Я, не будет выводиться из аксиом AGnj!aH. Другими словами, такое предложение А независимо от аксиом AGnjiaH. Это представляет особый интерес в многовековой дискуссии о зависимости постулата Евклида о параллельности от других аксиом. Теории AG и AGnj]aH не являются полными; как увидим, для них имеются неразрешимые предложения. Одним из таких примеров неразрешимого предложения является формула Евк, реализующая «пятый постулат» Евклида, которую будем называть аксиомой о параллельных. Аксиома о параллельных выделена в особую группу, к которой переходим. Группа IV. Аксиома о параллельных. G4.i = Евк = Vxy*{[T(jc) & ПрОО & Пл(г) & Л(х, z) & Щу, z) & & -, Л (х, у)] -> 3! и[Пр(и) & Л (и, z) & Л(х, и) & Щх, у)]}. Здесь формализован «пятый постулат» Евклида — через точку, не лежащую на прямой, можно провести единственную прямую, параллельную данной; в случае планиметрии тут надо выбросить все упоминания о плоскости. 225
^--""~" ~-~^ Если рассмотрим интерпретацию / ^^ Клейна, то убедимся, что это предло- г~— х ^—-\ жение на неи не выполняется (рис. 13.3). {^S^---^111^^^^—^ Итак, G4.i не выводима в абсолют- \~р 7 ной геометрии AGnJ,aH (независима от X. у/ AGnjiaH). Это открывает неограниченные ^~~~-— -^"^ возможности для существования различных неевклидовых геометрий. Рис. 13.3 Вместо аксиомы Евк принимались и другие утверждения, при этом получались различные геометрические системы. В основе всех этих необычных геометрий (ломающих интуитивные представления о реальном пространстве) лежит абсолютная геометрия AG, а различаются они лишь разным пониманием возможностей построения параллельных прямых. Как уже говорили (см. гл. 4), если примем другую аксиому для планиметрии (поэтому в ее записи не будут фигурировать плоскости) Лоб = Vxy{[T(x)&ПрОО&-,Л(х,у)] -> 3zu[z *и&Up(z)&Пр(ы)& &J\(x,z) & Я(х,и) &U(y,z) &Щу,и)]}, выполнимую на интерпретации Клейна, то получим новую геометрию Лобачевского. В связи с существованием семантик для геометрии Евклида (AG + Евк) и геометрии Лобачевского (AG + Лоб) можно заключить, что эти теории непротиворечивы. Конечно, здесь имеется в виду их относительная непротиворечивость (при условии, что арифметика действительных чисел непротиворечива). Сам Д.Гильберт предлагал интерпретировать геометрию в арифметике действительных чисел, считая точку парой <х, у> ее координат на декартовой плоскости, а прямые — отношением трех действительных чисел (u:v: w). Тогда принадлежность точки <х, у> прямой (и: v: w) понимается как выполнение следующего равенства их + vy + w = 0. Особое место занимают так называемые аксиомы непрерывности, которые Д. Гильберт выделил в отдельную группу. Дадим эти аксиомы в словесном виде, так как они не могут быть формализованы в языке ИПФ. Группа У. Аксиомы непрерывности. G5.i = Арх = Откладывая на прямой отрезок [х, у] целое число раз, можно «превзойти» любой отрезок [х, z] на этой прямой (рис. 13.4). Это есть аксиома измерения, или аксиома Архимеда. Уже неоднократно встречались с тем, что в языке ИПФ нет прямой воз- 226
можности говорить о произвольном на- • * • ... ,, Г\, _ л У Уп Z 7и+1 туральном числе п объектов наших алгебраических систем и моделей, в этом Рис. 13.4 как раз и состоит затруднение при записи этой аксиомы в языке ИПФ. Сам Д. Гильберт, а также его ученики и последователи провели много исследований так называемых неархимедовых геометрий, т. е. таких геометрий, где данная аксиома не выполняется. В эту группу Д. Гильберт включил и следующую аксиому линейной полноты: G5 2 = Точки прямой образуют систему, которая не допускает никакого расширения, т. е. к этой системе точек невозможно добавить еще точки так, чтобы в новой системе выполнялись ряд аксиом из групп I —III, а также аксиома Архимеда. Данной аксиомой Д.Гильберт почти никогда не пользовался, она введена им в целях придания некоторой законченности всего построения аксиоматической геометрии. Позднее было доказано, что аксиому линейной полноты можно заменить на аксиому Кантора: G5.3 = Кан = Пусть на прямой задана бесконечная последовательность отрезков \х\, У\]Лх2, У2], -, [хп, Уп], -, каждый из которых лежит внутри предыдущего и для любого заданного отрезка [х, у] найдется такое п, что [хп, уп] < [х, у]. Тогда существует на этой прямой точка х, принадлежащая всем отрезкам [хп, уп]. Конечно, здесь опять встречается та же трудность — как записать на языке ИПФ то, что говорим про натуральное число п. То, что длина одного отрезка меньше длины другого отрезка (это встречается в Кан), легко может быть формализовано. Система аксиом Гильберта G категорична и полна в том смысле, что любые ее семантики изоморфны. Эта теория оказывается разрешимой — алгоритм для G извлекается из алгоритма, принадлежащего А.Тарскому, для арифметики действительных чисел. 13.2. Аксиомы А.Тарского для элементарной планиметрии В 1926 г. А. Тарский предложил совершенно новую систему аксиом для элементарной геометрии (планиметрии). Хотим, хотя бы в самых общих чертах, указать эту аксиоматику, так как на русском языке эта система аксиом никогда не публиковалась. 227
Объекты будут состоять только из точек. Поэтому нет необходимости рассматривать прямые — понятие прямых можно определить через основные предикаты. Основных предикатов всего два — Въ и Z)4, которые будут интерпретироваться на стандартной модели евклидовой геометрии следующим образом: В (х, у, z) означает, что точка у лежит между точками х и z', D (а, Ь, с, d) означает, что точка а отстоит от точки Ъ на таком же расстоянии, что и точка с от точки d {«равенство отрезков» [а, Ь\ - [с, d]). В первоначальном варианте в системе Тарского было 24 аксиомы. После детального анализа ученики Тарского исключили ряд предложений из списка аксиом, так как они оказались зависимыми от остальных. Итак, приведем известный вариант системы аксиом, относящийся к 1965 г. и состоящий из 12 предложений (причем все они имеют сложностной тип кванторной приставки V3), и аксиомы непрерывности, которая, как и в варианте Гильберта, не может быть выражена на языке И ПФ. Вначале несколько предварительных определений. Система из двух неравных точек определяет прямую: хе Щу,z) = y*Z& [В(х,у,z) v В(у,х,z) v В(у,z,x)], а предикат Цх, у, z) = B(z, х, у) v В(х, z, у) v В(х, у, z) определяет коллинеарные точки, т.е. точки, лежащие на одной прямой. Две неравные точки хну определяют отрезок: ze [х,у] = B(x,z,y). Аксиомы А. Тарского для евклидовой геометрии: Т, е \/аЬс[В(а,Ь,с) -» В(с,Ь,а)] (симметричность предиката В); Т2 s Vabcd{[B(a,b,d)&.B(b,c,d)} -» B{a,b,c)} (транзитивность предиката В); Т3 s\/abD(a,b,b,a) (симметричность равенства отрезков); Т4 = Vabc[D(a,b,c,c) -» а = Ь] (нулевой отрезок); 228
T5 =\/abcdpq{[D(p,q,a,b)& D(p,q,c,d)] -> D(a,b,c,d)} (транзитивность равенства отрезков); Т6 = V' abcdaxbxcxdx{[а ф b&b фс & В(а,Ь,с) & В(ах,Ь\,сх) & & D(a,b,ax,b\)&D(b,c,b\,C\)&.D(b,d,bbdx) & D(a,d,ax,dx)] -> D(c,d,cx,dx)} (конструкция из пяти отрезков, рис. 13.5); Т7 = Vabpq3c[B(a,b,c)& D(b,c,p,q)] (откладывание отрезка); Т8 = УаЬЗс[В(а, с, Ь) & D(a, с, с, Ь)\ (деление отрезка пополам); Т9 = Babe —I L(a, b, с) (существование неколлинеарных точек); Тш =yabcpq{[D{a, p,a,q) & D(b, p,b,q) & D(c, p,c,q)] -> -> [B(a, b, c) v B(b,c,a) v B(c,a,b)]} (перпендикуляр к середине отрезка, рис. 13.6); Т,, =Vabc{[-lB(a,b,c)&-,B(b,c,a)&-iB(c,a,b)] -» -> Э/>[£(/>,а,р,b) & D{p,а,р,с)]} (центр описанной вокруг треугольника окружности); Р\ Рис. 13.6 Рис. 13.7
Т12 = Vabaxpc{[B{a,р,ах) & B(b,ahc)] -» -^3b,[B(b,p,b,)&B(a,buc)]} (аксиома Паша, рис. 13.7). Аксиома непрерывности у А. Тарского также формализуется оригинальным способом в виде схемы аксиомы: пусть F{x) и F,(xi) — произвольные формулы с одной свободной переменной, тогда T(F,/i) s {3ayPPl[(F(p)&Fl{pl)) -* В(а,р,Р])] -> -» 3b\/pPl[(F(p) & F,(/>,)) -> *(/>, 6, Л)]}- Представляется, что указанная аксиоматика для элементарной геометрии найдет самое широкое применение как в теоретических исследованиях, так и в преподавании геометрии на разных уровнях. СПИСОК ЛИТЕРАТУРЫ 1. Александров П. С. Введение в общую теорию множеств и функций. — М. : Гостехиздат, 1948. 2. Гильберт Д. Основания геометрии. — М.: ОГИЗ, 1948. 3. Ершов Ю.Л. Математическая логика/Ю.Л.Ершов, Е.А. Палютин. — М. : Наука, 2004. 4. Клини С. Введение в метаматематику. — М.: Иностранная литература, 1957. 5. Колмогоров А. Н. Математическая логика / А. Н. Колмогоров, А. Г. Дра- галин. - М.: УРСС, 2004. 6. Куратовский К. Теория множеств / К. Куратовский, А. Мостовский. — М. : Мир, 1970. 7. Лавров И. А. Задачи по теории множеств, математической логике и теории алгоритмов/ И.А.Лавров, Л.Л.Максимова. — М. : Наука, 2002. 8. Мальцев А. И. Алгебраические системы. — М.: Наука, 1970. 9. Мендельсон Э. Введение в математическую логику. — М. : Наука, 1984. 10. Новиков П. С. Элементы математической логики. — М.: Наука, 1973. 11. Справочная книга по математической логике : в 4 т. — М. : Наука, 1982, 1983. 12. Френкель А. Основания теории множеств /А. Френкель, И. Бар-Хил- лел. — М.: Мир, 1966. 13. Шенфилд Дж. Математическая логика. — М.: Наука, 1977. 14. TarskiA., Givant S. Tarski's system of geometry//The Bulletin of Symbolic Logic. - 1999. - V. 5. - № 2.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абстракция актуальной бесконечности 10 — потенциальной осуществимости 11 Аксиома 4 — 8, 197 — Архимеда 226, 227 — бесконечности 68, 203 — выбора 25, 67, 68, 71, 88, 103, 104, 107, 188, 196, 204 — выделения 57, 199 — замены 202 — Кантора 227 — контрапозиции 132, 149 — линейной полноты 227 — множества подмножеств 59 — о параллельных 13, 14, 115, 117, 118, 220, 225, 226 — объединения 61, 200 — объемности 58, 198 — пары 64, 200 — Паша 5, 224, 230 — подстановки 202 — пустого множества 200 — равенства 198 — регулярности 202 — самодистрибутивности 132, 149 — свертывания 199 — степени 59, 201 — суммы 61, 200 — удаления V 149 — утверждения посылки 132, 149 — фундирования 202 Аксиомы Гильберта для геометрии 5, 13, 115-121, 219-227 — для АЗП0 218 ВЗУП 217 ИВ 132, 162 ИПФ 148, 149, 162, 198, 214, 221 УК 214 УП 215, 216 AG 13, 14, 220-227 ZF 56-68, 88, 91, 198-205 — Евклида 5, 13-15, 115, 167, 225 — индукции 208 — исчисления 124, 125, 166, 197 — класса 195 — конгруэнтности 5, 220, 224 — корректности 221 — непрерывности 13, 220, 226, 228, 230 — о применимости 220 — Пеано 207-213 — порядка 220, 223 — принадлежности 220, 222, 223 — равенства 149 — соединения 220, 223 — Тарского для геометрии 121, 227— 230 — теории 7, 197 Алгебра 27 — булева ПО — высказываний АВ 31—45 — Линденбаума 111, 171 — предикатов и функций АПФ 46 — 55 — Алеф-нуль 25 Алгоритм 15 — для АЗП0 218 — для ВЗУП 217 полных теорий 15 — Тарского для арифметики действительных чисел 227 Алфавит 121, 161 — для АВ 33 АПФ 46 ИВ 168, 172 ИПФ 147, 177 пропозиционального исчисления 168 Антисимметричность 92 Аргумент существенный 22 — фиктивный 22 Арифметика 41 — действительных чисел 14, 15, 85, 191, 216, 226, 227 — кардинальных чисел 86, 90 — комплексных чисел 85, 218 — натуральных чисел 68, 70, 213 нестандартная 193 Пеано (АП) 13, 14, 206-213 231
стандартная 206 — ординальных чисел 98 — рациональных чисел 77, 216 — целых чисел 75, 214 Ассоциативность 40, 59, 60 Бесконечность завершенная 10, 11 — потенциально становящаяся 11 Вариант правила 125 — схемы аксиом 124, 125 формулы 123 Введение двойного отрицания 134 — фиктивного аргумента 22 — V 149, 154 -Э 155 Вложимость 107 — в АП 211 УК 215 УП 216 Вхождение свободное 47, 48, 147, 148 — полслова 122 — связанное 47, 48, 147, 148 — символа 122 Вывод 7 — в исчислении 11, 123, 126 -в ИВ 132 ИПФ 150 — гипотезы 129 — из гипотез 126—128 в ИВ 132 ИПФ 150 — секвенциальный 128 — секвенции 128 — формулы 126, 128 Выводимость в исчислении 124, 126 ИВ 132 ИПФ 150 — из гипотез 126—128 множества формул 182 Выполнимость исчисления 8, 165, 172 ИВ 172 ИПФ 190 — множества предложений 183, 190, 191 — одновременная 182 — предиката 20, 21 — предложения 51, 179 — секвенции 181 — совместная 182, 183 — формул 162, 182 — АП 213 — УК 214 — УП 216 — ZF 204 Высказывание 31—33, 131 — переменное 32, 33 Геометрия 4, 5, 8, 13, 14, 114-120, 219-230 — абсолютная AG 13, 14, 220, 224, 226 — в пространстве 120 — евклидова 13-15, 114, 115, 117, 219-230 — Лобачевского 14, 15, 117, 167, 226 — на плоскости 115 — неархимедова 227 — неевклидова 14, 15, 115, 167, 226 — Римана 117 Гипотеза 10, 123, 126 — континуума 88, 205 — секвенции 123 Грань 108 Граф 93 Группа 112 — абелева 112 — симметрическая 112 Делители нуля 113, 214 Диаграмма Венна 17 Дизъюнкция 39, 139, 149, 178 — бесконечная 53, 192 — элементарная 44 Дискретность 78, 79 Дистрибутивность 40, 62 Длина вывода 135 — кортежа 21, 64, 201 — слова 122 — формулы 144, 192 ДНФ43 Добавок 104 Доказательство 7, 11, 124 — непротиворечивости 12, 164 — от противного 138, 142 — разбором случаев 140 — существования 10, 142 Дополнение 61, 110 Закон двойного отрицания 37, 40, 61 — двойственности 42 — де Моргана 41, 62 — исключенного третьего 10, 41, 141 — поглощения 41, 62 — противоречия 41, 141 — расширения 62 — трихотомии 87, 107 Замыкание формулы 51, 179 Значение атомной формулы 49, 178 — истинное 32 232
— истинностное 32 — константы 49 — ложное 32 — переменных 36, 49, 161, 168, 177 — предиката 20, 21 — предложения 162, 179 — свободной переменной 49, 50, 178 — связанной переменной 50, 179 — символа сигнатуры 49 — терма 49, 178 — формулы 32, 36, 49, 50, 162, 168, 178 — функции 21, 49, 67 Изоморфизм интерпретаций 8, 165 — систем 30, 165 — линейно упорядоченных множеств 97 — моделей АЗП0 218 АП 211-213 G 227 — частично упорядоченных множеств 95 Импликация 33, 47 Индукция 69, 71, 72, 97, 208 — трансфинитная 101 Интервал 83, 94 Интерпретация 7, 12, 130 — геометрическая для действительных чисел 81 комплексных чисел 85 натуральных чисел 72 рациональных чисел 77 целых чисел 74 -для ИВ 168 классическая 169, 177 ИПФ 177 AG 225 Клейна 225, 226 стандартная 225 — пропозиционального исчисления 168 — с логикой 162, 177 — трехзначная 174, 175 — сигнатурных символов 49, 161, 162, 168, 177, 184 — символов языка 49 — формулы 159, 161 Интерпретации элементарно эквивалентные 165 Интуиционизм 9—11, 142 Истина 20, 21, 131, 161 Исчисление 8, 121 — 130 — ИВ 9, 131-146 — интуиционистское 11 — ИПФ 9, 147-160 — пропозициональное 168 Категоричность 8, 13, 165, 172, 196 — т-категоричность 14, 166 — аксиом Гильберта 227 — АЗП0 218 Квантор всеобщности V 47, 48, 148 — единственного объекта В! 50 — существования 3 50, 149, 178 Класс аксиоматизированный 163, 195 — аксиоматизируемый 197 — алгебраических систем 28, 195 — семантик 163, 195 — смежный 29 — эквивалентности 29 КНФ44 Коллизия переменных 48 Кольцо 112 Коммутативность 40, 59, 60 Конгруэнтность отрезков 119 — углов 119 Константа 24, 27 Конструктивизм 10, 142 Континуум 25 Контрапозиция 132, 138, 149 Контрпример опровержения 183 Конъюнкция 38, 139, 149, 178 — элементарная 42 соответствующая 43 Корректность 149 Кортеж 21, 64, 201 Лемма о взаимозаменяемости эквивалентных формул 141, 153 двух формулах 35 замене константы 155 — о непротиворечивости ИПФ 181 строении термов и формул 36 числе скобок 34 Литерал 34, 144 Ложь 20, 21, 131 Луч 118, 222 Местность предиката 20, 21 Метаалфавит 122 Метаматематика 7 Метасвойства 163 -ИВ 172-176 — ИПФ 189-193 Метасимвол 33, 122 Метатеория 7 Метод аксиоматический 4, 114, 219 — диагональный 26 — доказательства от противного 9 — математической индукции 71, 208 233
— трансфинитной индукции 101 — финитный 1 1 Минимальность модели 197 для АП 211 УК 215 УП 216 Множества непересекающиеся 59 — подобные 97 — равномощные 24, 67 — равные 16 — эквивалентные 24, 67 Множество 16, 56, 164, 196, 198, 203 — бесконечное 10, 11, 24, 25, 67 — вполне упорядоченное 95 — всех множеств 19 — л-элементное 63, 201 — действительных чисел 17, 78 — 84 — дискретное 79 — завершенное 11 — замкнутое 28 — конечное 6, 10, 11, 25, 67 — континуальное 25 — линейно упорядоченное 97 — натуральных чисел 17, 68 — 72 — непрерывное 80 — основное 28 — пара 201 — плотное 77 — подмножеств 20, 201 — потенциально становящееся 11 — правильно построенное 105 — предложений выполнимое 183 замкнутое логически 195 относительно опровержений контрпримерами 183 — пустое 20, 57, 199 — рациональных чисел 17, 75 — 77 — селекционное 104 — степень 201 — счетное 25 — целых чисел 17, 72 — 75 — частично упорядоченное 92 Модель 27 — арифметики натуральных чисел нестандартная 208, 212 целых чисел 214 рациональных чисел 216 — геометрии 114—120, 219 — теории множеств 56, 196 Мощность 24 — алгебраической системы 28 — континуума 25 — множества подмножеств 26 — сигнатуры 193 - п 24, 25 - Щ 25 - с 25 Набор атомных гипотез 144 Надмножество 19, 58, 198 Надсистема 29 Невыполнимость 8, 183 Независимость 15, 167 - аксиомы выбора 205 - гипотезы континуума 88, 205 -для ИВ 174-176 Некатегоричность 13 - АП 14 -ИВ 172 - ИПФ 190 - AG 14 Неконструктивность 188 Неполнота 166 - АП 14, 213 -ИВ 173 - ИПФ 180 -AG 14, 225 - ZF 204 Непополняемость 15, 166, 173 -ИВ 174 - ИПФ 190 Непрерывность 80, 81 Непротиворечивость 11, 163, 172, 183 - АП 13, 164, 165, 204, 213 - геометрии Евклида 226 Лобачевского 226 - исчисления 12, 164, 172 - ИВ 12, 164, 172 - ИПФ 12, 164, 181, 189 - относительная 13, 164 - ZF 13, 164, 203-205 Неравенство строгое 92 Неразрешимость 15 Область действия квантора 48, 148 - значений функции 67, 201 - определения функции 67, 201 Обоснование в выводе 127 - математики 11, 13 Объединение 60, 200 - элементов множества 60, 200 Объект абстрактный 11, 19, 32 - идеальный 11 Объекты пересекающиеся 221 - принадлежащие друг другу 221 Окружность 120, 222 Операция алгебраическая 108 - связывания квантором 48, 148 234
Определение вспомогательных понятий 221 — рекурсивное 207 Опровержение 6, 12 — контрпримером 183 Откладывание отрезка 119, 224, 229 — угла 119, 224 Отношение 20, 21 — бинарное 21 — включения 19, 68, 198 строгое 19, 58 — л-местное 21 — принадлежности 4, 16, 56, 116, 164, 198 Отождествление аргументов 23 Отрезок 83, 94, 95, 118, 222, 228 Отрицание 12, 33, 47, 123, 161, 164, 177 Пара 64, 201 Парадокс Рассела 18, 56, 202, 204 Переменная 33, 121, 122 — предметная 46, 122, 161 — пропозициональная 121, 161 — свободная 47, 48, 147, 148 — связанная 47, 48, 148 — существенная 22 — фиктивная 22, 34 — формулы 33 Переобозначение аргументов 22 — переменных 48 Пересечение 59, 60, 200 Перестановка гипотез 129 — кванторов 54, 158 Планиметрия 115, 225, 227 Плоскость 4, 219, 220 Плотность 77 — 80 Поглощение 109 Подмножество 19, 58, 198 — замкнутое 28 — собственное 20 Подобие 97, 100 Подсистема 28 Подслово 33, 122 Подстановка 22 Подформула 33, 48 Покрытие 29 Поле 113 — алгебраически замкнутое 113, 114, 218 — вещественно замкнутое 217 — упорядоченное 215, 216 Полнота 14, 15, 166, 183 — аксиом Гильберта 227 -АЗП0218 — ВЗУП 217 — исчисления 14, 166, 173 -ИВ 173 Полугруппа 111 Полуинтервал 83, 94 Полуось 83 Полуотрезок 83, 94 Полурешетка 109 Понятие семантическое 7 — синтаксическое 7 Пополняемость 15, 166, 173 — АП 213 -ИВ 174 — ИПФ 190 — ZF 204, 205 Порядок линейный 97 — лексикографический 96 — на действительных числах 79, 80 кардинальных числах 86 — 88 натуральных числах 70 рациональных числах 76 целых числах 74 — плотный 77, 80 — полный 98 — частичный 92 на объединении 95 прямом произведении 96 Построение конструктивное 10 Посылка правила 125, 128 — секвенции 123 Правило вывода 6, 125 безусловное 125 введения V 149, 154 3 155 для ИВ 132 ИПФ 149 допустимое 128 исключения выводимой гипотезы 137, 153 modus ponens 132, 133, 137, 149 независимое 167, 174 удаления V 154 3 155 Правила построения формул 123 — для АВ 33 АПФ 47, 48 ИВ 131 ИПФ 147 Предикат 20, 21, 27 — бинарный 21 — выразимый 191, 208 — конгруэнтности 119, 120, 219, 220 — лежать между 118, 219, 228 235
— лежать на 116 — «-местный 21 — принадлежности 16, 56, 116, 164, 198, 219 Предложение 50, 148, 162, 179 — неразрешимое 14 для АП 166 ИПФ 190 AG 225 — опровержимое 51, 179 — разрешимое 14 — тождественно истинное 51 ложное 51 Представитель 29 Принцип выбора 25, 87, 104, 107, 196, 204 — индукции 71, 97 — трансфинитной индукции 101 Приставка кванторная 55, 159 Проблема непротиворечивости 7 Программа Гильберта 6—15, 121, 122, 124, 125,. 163, 196 Продолжение подобия 102 Произведение действительных чисел 85 — кардинальных чисел 89 — комплексных чисел 85 — натуральных чисел 70 — прямое 65 — рациональных чисел 76 — слов 122 — целых чисел 73 Прообраз полный 23 Противоречивость 12, 164, 172, 183 Противоречие 6, 9, 38 Прямая 4, 115, 219, 220, 228 Прямые параллельные 117, 222 Равенство множеств 16, 58 Равномощность множеств 24, 67 Разбиение 29 Разность множеств 61 Разрешимость 15, 217 — АЗП0 218 — арифметики действительных чисел 15 — ВЗУП 217, 227 — аксиом Гильберта 15, 227 Рассуждение гипотетическое 121 Расширение 133 — гипотез 130 — исчисления 15, 167 Реализация предиката 33, 51 Рефлексивность 92 — импликации 133 Решетка 108, 109 — дистрибутивная 109 Самодистрибутивность 41, 132, 149 Сведение к противоречию 142 Свойство 20, 21 — выразимое 199, 216 Связка логическая 33, 122, 162 Связь выводимости с импликацией 136, 152 СДНФ 43 Секвенция 123 -ИВ131 — ИПФ 148 — выводимая 126, 128, 129, 133 -в ИВ 132, 133 ИПФ 148, 150 — выполнимая 181 — опровержимая 181 — простая 124 — тождественно истинная 181 ложная 181 Семантика 8, 12, 18, 163, 168 — для геометрии 9 ИВ 168-172 ИПФ 190 исчисления 168 AG 14, 225 ZF 164 пропозиционального исчисления 168 — формулы 163 Семантики изоморфные 8, 165 — неизоморфные 8, 166 — неравномощные 166 Сечение Дедекинда 78 — 80, 216 Сигнатура 28, 46, 147 Символ алфавита 12! — вспомогательный 33, 47, 122 — константный 46, 122, 147, 162 — логический 47 — переменной 46, 121, 122, 147, 162 — предикатный 46, 122, 147, 162 — равенства 47, 122 — функциональный 46, 122, 147, 162 Симметричность 28 Синтаксис 13, 121 Система алгебраическая 27 — 30 — АП нестандартная 193 — для теории множеств 196 — формальная 8, 121—130, 196 — Линденбаума 184 Системы элементарно эквивалентные 195 236
СКИФ 44 Скобки 33, 47, 122 Следствие непосредственное 123, 125, 128 Слово 33, 47, 122 — пустое 33, 122 Сложность формулы 55, 159 Сокращение гипотез 129 Совокупность объектов 16 завершенная 10, 11, 121 потенциально становящаяся 11, 121 Соответствие взаимно-однозначное 21, 24, 67 Сохранение истинности 7, 8, 162 — операции 165 Способ эффективный 124, 125 Степень кардинального числа 90 — множества прямая 65 Стереометрия 120, 219 Стык сечения 78 Сумма действительных чисел 84 — кардинальных чисел 88 — комплексных чисел 85 — натуральных чисел 70 — рациональных чисел 75 — целых чисел 73 Суперпозиция 22 Схема аксиомы 124, 125 — правила 125 — формулы 33, 123 Таблица истинности 37 Тавтология 38 Теорема 5, 6, 124 — адекватности для ИВ 143 ИПФ 182, 188, 189 — Геделя о выполнимости 165, 183, 186, 188, 189, 203, 213 неполноте АП 13—15, 164, 166, 188, 213 — Кантора 26, 67, 91, 191 — Кантора—Бернштейна 87 — Левенгейма—Скулема 190, 191 — Линденбаума— Генкина 184 — Мальцева локальная 191 — 193 — Мальцева о расширении 193 — о дедукции для ИВ 135, 136 ИПФ 151 замыкании 155 подстановке 155 равенстве 156 расширении 186 — Цермело 103-107 Теория аксиоматическая 7, 8, 151, 164, 194 — алгоритмов 3, 15, 217 — АП 13, 69, 164, 206-213 — АЗП0 113, 218 -ВЗУП217 — групп 112 — доказательств 7, 11 — конечных систем 192 — множеств Кантора 6, 18 — множеств наивная 19, 68, 104, 196 — неаксиоматизируемая 192 — ординалов 68 — полугрупп 111 — типов 19 — УК 214 -УП 215 — элементарная 195—197 класса алгебраических систем 163 -AG 13, 220-225 — ZF 13, 19, 50, 56-68, 88-104, 164, 198-205 Терм 47, 147 — допустимый для подстановки 148 Тип системы 28 — порядковый 97 — я 99 -ш97 Точка 4, 115, 219, 220, 228 Точки коллинеарные 117, 221, 228 Транзитивность 92, 137, 153 Треугольник 118, 222 Трихотомия 87, 107 Угол 118, 222 Удаление двойного отрицания 134 — фиктивного аргумента 22 — V 149, 154 — 3 155 Универсум 56 Условие корректности 30 — правила 125 Утверждение посылки 132, 149 Фактор-множество 29 — система 28 — 30 Финитизм 11, 121 Форма дизъюнктивная нормальная 43 — конъюнктивная нормальная 44 — пренексная нормальная 54, 159 — совершенная дизъюнктивная нормальная 43 конъюнктивная нормальная 44 Формализм Гильберта 6—15, 165, 203 Формула 32, 123 237
— АВ 32, 33 — АПФ 47, 48 — атомная 34, 47, 123, 148 -ИВ 131 — ИПФ 148 — двойственная 42 — зависящая от гипотез 127 — независимая 167, 174 — неразрешимая 166 для ИВ 173 ИПФ 190 AG 14 ZF 204 — общезначимая 168 — опровержимая 163 — разрешимая 14, 166 — тождественно истинная 38, 131 ложная 38 — Consist 203, 204, 213 Функция 21, 22, 27, 66, 201 — обратная 24 — одноместная 201 — и-местная 22, 66 Цепь 97 Число вещественное 217 — действительное 78 — 85, 216 — кардинальное 24, 86 — комплексное 85, 218 — натуральное 11, 14, 17, 25, 68, 69, 206-213 нестандартное 14, 193, 211 стандартное 14, 192 — непосредственно предшествующее 71 следующее 71, 98 — ординальное 98 — перемен кванторов 55, 159 — предельное 99 — рациональное 17, 75 — 77, 215 — целое 17, 72-75, 213-215 Шкала кардинальных чисел 91 Эквивалентность 28, 40, 42 — множеств 24, 67 — формул 40, 52, НО, 140, 156 Элемент выделенный 161, 168 — максимальный 93 — минимальный 93 — множества 16 — наибольший 93 — наименьший 93 — непосредственно следующий 98 — нестандартный 14, 211 — предельный 99 стандартный 14 — универсума 56 Элементы несравнимые 93 — сравнимые 97 Язык 7, 121, 122, 161 -АВЗЗ — АПФ 46 -ИВ131 — ИПФ 147, 194 — первого порядка 194 — теории множеств 198 — элементарный 194
СОДЕРЖАНИЕ Предисловие 3 Введение. Программа Д.Гильберта построения аксиоматических теорий 4 ЧАСТЬ I СЕМАНТИКА Глава 1. Алгебраические системы 16 1.1. Множествам предикаты 16 1.2. Функции и взаимно-однозначные соответствия 21 1.3. Алгебраические системы 27 Глава 2. Логические системы 31 2.1. Алгебра высказываний 31 2.2. Логические эквивалентности в АВ 38 2.3. Алгебра предикатов и функций 46 2 4. Логические эквивалентности в АПФ 52 Глава 3. Классические алгебраические системы 56 3.1. Модель для множеств 56 3.2. Операции над множествами : 63 3.3. Натуральные числа 68 3.4. Целые и рациональные числа 72 3.5. Действительные и комплексные числа 78 3.6. Арифметика кардинальных чисел 86 Глава 4. Системы из общей алгебры и геометрии 92 4.1. Частичные порядки 92 4.2. Линейные и полные порядки 97 4.3. Теорема Цермело 103 4.4. Алгебраические операции 108 4.5. Геометрические модели 114 ЧАСТЬ II СИНТАКСИС Глава 5. Построение логических исчислений 121 5.1. Язык и формулы исчислений 121 5.2. Выводимость формул в исчислениях 124
Глава 6. Исчисление высказываний 131 6.1. Построение исчисления высказываний 131 6.2. Теорема о дедукции для ИВ 135 6.3. Введение новых логических символов 139 6.4. Теорема адекватности для ИВ 142 Глава 7. Исчисление предикатов и функций 147 7.1. Построение исчисления предикатов и функций 147 7.2. Теорема о дедукции для ИПФ 151 7.3. Пренексная нормальная форма 156 ЧАСТЬ III СВЯЗЬ СЕМАНТИКИ И СИНТАКСИСА Глава 8. Интерпретации и семантики для исчислений 161 8.1. Семантика формул 161 8.2. Метасвойства исчислений 163 Глава 9. Интерпретации для ИВ 168 9.1. Семантики для ИВ 168 9.2. Метасвойства ИВ 172 Глава 10. Интерпретации для ИПФ 177 10.1. Выполнимость формул ИПФ 177 10.2. Выполнимость множеств формул ИПФ 182 10.3. Теорема Геделя о выполнимости 186 10.4. Метасвойства ИПФ 189 ЧАСТЬ IV КЛАССИЧЕСКИЕ АКСИОМАТИЧЕСКИЕ ТЕОРИИ Глава 11. Теория множеств 194 11.1. Элементарные теории 194 11.2. Теория множеств ZF 198 Глава 12. Числовые теории 206 12.1. Арифметика Пеано 206 12.2. Другие числовые теории 213 Глава 13. Геометрические теории 219 13.1. Аксиомы Д. Гильберта для геометрий 219 13.2. Аксиомы А.Тарского для элементарной планиметрии 227 Список литературы 230 Предметный указатель 231