Концепции современной математики - Стюарт Я.

Автор: Стюарт Я.

Теги: математика

Год: 1980

Похожие

Концепции современной математики

Современная математика и ее творцы

Случайный Бог или божественная случайность? Математика неопределённости

Мысли о современной математике и ее изучении

Текст

КОНЦЕПЦИИ
СОВРЕМЕННОЙ
МАТЕМАТИКИ
Ян Стюарт
Ян Стюар-
КОНЦЕПЦИИ
СОВРЕМЕННОЙ МАТЕМАТИКИ
Перевод с английского
Минск, «Вышэйшая школа», 1980
ББК 22.1 Г
С 88
УДК 51(023)
Ian Stewart
Concepts of Modern Mathematics Penguin Books
Перевод с английского H. И. Плужниковой (предисловие, гл. 1—5, 9—14, 16—20, примечания, указатель) и Г. М. Цукерман (гл. 6—8, 15); предисловие к русскому изданию Э. И, Зверовича, д-ра физ.-мат. наук, проф.
Я с н о н и. п и
Г1 К] Ч( и:
ее
ж
м (< гл
ПС 141 Of м<
20201—009
С М 304(05)—80 28—79
1702010000
Copyright (g) Ian Stewart, 1975 (^Предисловие к русскому изданию, перевод на русский язык, издательство «Вышэйшая школа», 1980
। е с к ПС пс ль 14 с я су
Предисловие к русскому изданию
Предлагаемая вниманию советских читателей книга Яна Стюарта при сравнительно небольшом объеме отличается очень широким охватом материала. В ней автор на конкретных математических объектах и в популярной форме излагает основные понятия, а также некоторые идеи и методы современной математики. Книга состоит из 20 небольших глав, первая из которых имеет характер введения и посвящена общим вопросам методологии математики (абстрактность и общность, интуиция и формализм, цели математики, ее полезность и другие). В остальных 19 главах книги рассматриваются более конкретные вопросы. Во второй главе автор обсуждает геометрические преобразования (в основном, движения) и показывает их роль при доказательстве геометрических теорем. В следующей главе рассматривается арифметика вычетов и некоторые ее теоретико-числовые приложения. Глава 4 посвящена изложению теоретико-множественного языка и элементов алгебры множеств. В главе 5 обсуждается общее понятие отображения (функции) и связанная с ним терминология. Две следующие главы посвящены элементам общей алгебры. Здесь вводятся понятия кольца и поля, приводятся примеры и даются интересные приложения. Понятие группы и элементы теории групп обсуждаются на примере групп симметрий, демонстрируются методы теории групп, позволяющие классифицировать группы с точки зрения изоморфизма. В главе 8 на геометрическом ма-гериале обсуждается аксиоматический метод в математике, рассматриваются понятия непротиворечивости, независимости и полноты систем аксиом. В следующей главе рассматривается понятие мощности конечных и бесконечных множеств, устанавливается существование трансцендентных чисел. Главы 10— 14 посвящены популярному изложению топологии. Обсуждается топологическая эквивалентность, топологические теоремы существования, теорема Эйлера о многогранниках и ее прило-
Be книга Это ; с гуде ся сс нрепс
жения к теории графов и к проблеме четырех красок. Дале, рассматриваются топологические инварианты поверхностей эйлерова характеристика и свойство ориентируемости, на этс| основе дается топологическая классификация конечных поверх костей. Затем автор переходит к элементам алгебраическо! топологии. Вводится понятие гомотопных путей, гомотопические классов, фундаментальной группы топологического простран ства, показывается ее топологическая инвариантность, рассматриваются примеры на вычисление фундаментальных групп Рассмотрены также формула Эйлера для пространств высшие размерностей, гомотопические группы высших размерностей Эта часть книги окажется наиболее интересной для советской; читателя, так как наша научно-популярная литература по то пологий крайне бедна, особенно в той части, которая касаетс! алгебраической топологии. Остальные главы книги посвящень соответственно элементам линейной алгебры, вещественной, анализа, теории вероятностей, вычислительным машинам i программированию, некоторым приложениям современной ма тематики (линейное программирование, катастрофы) и осно ваниям математики. Каждая из перечисленных дисциплин са ма по себе достаточно обширна, однако автор касается не столько наиболее ярких, сколько некоторых популярных во-просов этих наук. Очевидно, по своим научным интересам автор стоит ближе к алгебре и топологии, поэтому последние пять глав книги читаются с меньшим интересом, чем предыдущие.
Не все в книге представляется бесспорным. Например, в первой главе автор утверждает, что математическая теория проходит путь, начиная от задачи, которую «математик решает ра< ди удовольствия», и до приложений ее в практике, в производстве. Здесь автор склонен идеализировать ситуацию пренебрегая тем фактом, что задача, которую «математик ре шает ради удовольствия», сама в конечном счете появилась ич практики (возможно, в результате относительно самостоятельного развития математики).
Книга написана простым, ясным языком, хорошо иллюстрирована и не лишена юмора. Удачен подбор примеров, на кото рых демонстрируются математические понятия и идеи. Все это делает чтение книги не только полезным, но и увлекательным.
Докт наук.
Ввиду разнообразия материала и доступности изложения
ьл,-е книга, несомненно, будет с интересом встречена читателями.
I —
ТС .1 фХ-коп ких
Это учащиеся и преподаватели средних учебных заведений, студенты и преподаватели вузов и вообще все, кто интересуется современными концепциями математики и вопросами ее । [реподавания.
ISH-ма-inni НИХ гей.
Доктор физико-математических наук, профессор
Э. И. Зверович
ог) то тс я
ны ОГС|
1 I ма •
I о-са-н во-:ам ив цы-
ер-ро-ра-
V !1Ю, ре и 1 ль-
ри-то эт« ка-
Е
ПОСТ Мат пред она
и ни
Когда-то давным-давно родители могли помогать своим детя1 делать уроки. «Модернизация» школьного курса математик! сильно уменьшила эту возможность: родителям, которые во же не захотят отказаться от таких намерений, придется сами» осваивать массу нового материала, который будет казаться им как правило, странным и ненужным. Один мой друг — учц тель — рассказывал, что его ученики шумно требовали, чтоб! их учили «настоящей математике,— той, которой учили их ма1 и пап». Этот интересный факт, кстати, проливает дополнитель ный свет на то, как у детей формируются мнения. Многие учи теля тоже считают, что научиться математике нового стил
ком, зани ческ ренг
1
очень трудно.
И это весьма печально. Новые программы по математик вводились с целью содействовать лучшему пониманию этоп предмета взамен бездумного манипулирования символами Ведь настоящий математик работает не с числами, а с поня тиями.
Данная книга — попытка рассеять предубеждение. Пр| встрече с неизведанным всегда возникают опасения, и лучший способ их побороть состоит в том, чтобы посмотреть, как эт новое работает, что оно умеет делать и почему ему это удается Когда новое становится привычным, страхи рассеиваются са ми собой. Разумеется, эта книга не есть «справочник по соврс менной математике». Автор попытался описать цели, методы проблемы и применения современной математики, раскрыт повседневную деятельность работающего математика.
Я предпочел бы не требовать от читателя никаких предвл рительных знаний из области математики, но здесь мне при шлось пойти на компромисс. Читателю понадобится кос-каке» знакомство с алгеброй, геометрией и тригонометрией, а такж некоторое представление о графиках. Я старался избегать диф ференциального и интегрального исчисления; хотя оно кое-гд
и упоминается, это несущественно для изложения.
етяь Ithki
5 ВС fiMIIA Ч им учи тобь
ма»
Важнее любых предварительных знаний я считаю готовность воспринимать новые идеи и искреннее желание понять. Математика не относится к числу легких предметов — стоящие предметы не бывают легкими, зато как щедро вознаграждает она усвоившего! Математика стала частью нашей культуры, и никто не вправе считать себя истинно образованным человеком, не имея представления, что такое математика и чем она снимается. Более того, математика — наука глубоко человеческая, в ней есть свои триумфы и падения, крушения и озарения.
Итак, приступим!
Автор
учи тпл
тик, ?ТО: < !ам>1 'Оня
Пр 1ШИ1 1 эт< *тся
са >вр< рдь ЭБ Г
га
П[ ч а ко |КЖ( 1иф гд
Благодарности
Цитата в гл. 2 из книги А. Милна «Винни-Пух» и эпиграф к гл. 9 из книги того же автора «Дом на Пуховой опушке» (A. A. Milne, Winnie-the-Pooh; The House at Pooh Corner) приведены с разрешения издательства Methuen and Co. Ltd н г-на I\. P. Милна, которому принадлежит авторское право на эти произведения. Эпиграф к гл. 8 из книги Ст. Темерсона «Фактор Т» (Stefan Themerson, Factor Т) печатается с разрешения издательства Gaberbocchus Press Ltd. Классификация поверхностей в гл. 12 приводится в сокращенном виде по книге Э. К. Зимана «Введение в топологию» (Е. С. Zeeman, Introduction to Topology), которая готовится к изданию, и включена с разрешения проф. Зимана, однако любые неточности, которые могли возникнуть в результате сокращения, лежат на совести автора. Всем упомянутым лицам и издательствам автор выражает свою искреннюю благодарность.
Глаза 1 МАТЕМАТИКА В ЦЕЛОМ
Трудно дать представление о том, сколь обширна современная математика.
А. Кэли, из речи 1883 г.
Внезапный переход в наших школах к «современной математике» мог создать впечатление, что математика утратила контроль над собой, отбросила все свои традиционные идеи и понятия и вместо них вывела на сцену странные и нелепые создания, которые вряд ли кому-нибудь и когда-нибудь понадобятся.
Это не совсем точная картина. Большая часть «современной математики», которой сейчас учат в школах, существует, по самым скромным оценкам, уже более века. Дело в том, что в математике как науке новые идеи естественным путем развивались из старых и впитывались постепенно с течением времени. В школьные же курсы целый ряд новых понятий был введен сразу и, как правило, без всякого обсуждения их связи с традиционными понятиями.
Абстрактность и общность
Одна из наиболее заметных особенностей современной математики — это тенденция ко все более высокой степени абстракции. Каждое сколько-нибудь важное понятие охватывает не один, а много различных объектов, которые, однако, имеют какое-то общее свойство. Абстрактная теория выводит следствия из этого свойства, которые затем можно применить к любому из рассматриваемых объектов.
Так, например, понятие «группы» относится и к жестким движениям в пространстве, и к симметриям геомет
рических фигур, и к аддитивной структуре на множестве целых чисел, и к деформациям кривых в топологическом пространстве. Общим свойством во всех перечисленных случаях является возможность составить такую комбина-цию двух данных объектов, которая дает в результате объект той же природы. Два жестких движения, выполненные последовательно одно за другим, снова дают жесткое движение; сумма двух целых чисел — целое число; две кривые, смыкающиеся концами, образуют новую кривую.
Абстракция и обобщение идут рука об руку. Главным достоинством обобщения является экономия работы. Нелепо доказывать одну и ту же теорему четыре раза в четырех разных ситуациях, когда ее можно доказать один раз в общей постановке, не зависящей от конкретного типа объектов.
Вторая характерная черта современной математики — широкое использование в ней языка теории множеств. В сущности это всего лишь здравый смысл, облеченный в математические символы. Математику, в особенности когда она становится более общей, интересуют уже не столько конкретные объекты, сколько их совокупности. То, что 5=4+1, не так уж важно. А вот то, что всякое простое число вида 4п+1 является суммой двух квадратов, — гораздо более содержательно. Это последнее утверждение касается всей совокупности простых чисел, а не какого-то отдельного простого числа.
Множество — это и есть совокупность. Другое слово используется скорее из психологических соображений, чтобы избежать ненужных ассоциаций *. Множества можно различными способами комбинировать и получать другие множества, подобно тому как разные операции над числами (сложение, вычитание, умножение...) приводят к другим числам. Общую теорию арифметических операций называют алгеброй; по аналогии можно разработать алгебру множеств.
Множества имеют перед числами определенные преимущества, особенно с точки зрения обучения. Они могут оказаться более конкретными. Скажем, нельзя показать ребенку какое-то число («Я держу в руках число 3»), зато можно показать ему какое-то число определенных предметов: три конфетки, три шарика, т. е. по существу множество конфет, множество шариков. И хотя, как правило, рассматриваемые в математике множества не конкретны — обычно это множества чисел или функций,— основные операции теории множеств можно продемонстрировать на конкретном материале.
Теория множеств играет в математике более существенную роль, чем арифметика, и хотя основные принципы — не всегда лучшая отправная точка, для понимания современной математики без теории множеств не обойтись. По этой причине в гл. 4 и 5 обсуждаются основные понятия теории множеств, а в последующих главах свободно используется язык теории множеств, хотя я старался держаться на самом элементарном уровне. Но было бы неправильно переоценивать теорию множеств саму по себе: это всего-навсего удобный язык, и если вы в совершенстве владеете им и больше ничего из математики не знаете, едва ли от вас будет много проку. Наоборот, если вы знаете «много математики» и совсем незнакомы с теорией множеств, вы, возможно, достигнете крупных успехов. Но если вы знаете что-то и из теории множеств, вы будете значительно лучше понимать язык математики.
Интуиция и формализм
Тенденция ко все большей общности сопровождается ростом требований, предъявляемых к логической строгости. Евклида теперь критикуют за отсутствие в его системе аксиомы о том, что всякая прямая, проходящая через точку внутри треугольника, должна где-то пересечь тре
угольник. Эйлерово определение функции как «кривой, свободно проведенной от руки» портит математикам всю игру и страдает к тому же неопределенностью (что такое «кривая»?). Однако в заботе о логической безупречности легко хватить через край, заменив словесные рассуждения потоком логических символов и слепым применением стандартных приемов. В этом направлении можно далеко зайти (а тут и не слишком далеко — уже весьма далеко) и вместо того, чтобы углубить понимание, начисто его утратить.
В то же время требование большей строгости — не пустая прихоть. Чем сложнее и обширнее становится предмет, тем важнее выработать критический подход к нему. Социолог, пытающийся осмыслить массив статистических данных, вынужден отказаться от тех из них, которые получены в результате недобросовестных экспериментов или сомнительных выводов. То же происходит и в математике. Слишком часто «очевидное» оказывалось неверным. Существуют геометрические фигуры, не имеющие площади. Согласно Банаху и Тарскому2, можно разрезать круг на пять частей и сложить из них два круга того же размера, что исходный. С точки зрения понятия площади это невозможно, но дело в том, что эти части не имеют площади.
Логическая строгость оказывает сдерживающее воздействие, неоценимое в опасных обстоятельствах, а также тогда, когда речь идет о тонкостях. Существуют теоремы, в справедливости которых убеждены большинство математиков, и тем не менее, пока их кто-нибудь не докажет, они останутся необоснованными предположениями и могут применяться только в роли предположений.
Особое внимание к строгости необходимо при доказательстве невозможности чего-либо. То, что невозможно сделать одним способом, иногда легко выполнить другим, поэтому на всех этапах такого рода доказательств требуется большая аккуратность. Существуют доказатель
ства неразрешимости в радикалах уравнений пятой степени и доказательства невозможности трисекции угла при помощи циркуля и линейки. Это важные теоремы, так как они перекрывают пути бесполезных изысканий. Но если нам нужна уверенность в том, что подобные поиски действительно бесплодны, наша логика должна быть безупречной.
Доказательства невозможности весьма характерны для математики. Ведь это, пожалуй, единственный предмет, который полностью отдает себе отчет в своих ограничениях. Временами это становится наваждением, и люди тратят больше сил на то, чтобы доказать невозможность какого-то построения, чем на то, чтобы найти способ его выполнить! Если бы самопознание было добродетелью, математики могли бы образовать племя святых.
Однако логика — это еще не все. Никакая формула сама по себе никогда еще ничего не подсказала. Логика может применяться для решения задач, но она не подскажет нам, какие задачи стоит решать. Никому еще не удалось формализовать значение. Чтобы понять, что имеет значение, а что нет, требуется опыт, а еще то трудно определимое качество интеллекта, которое называют интуицией.
Я не могу объяснить, что я сам понимаю под интуицией. Просто это то, чем живет настоящий математик (или физик, инженер, поэт). Интуиция позволяет ему «ощущать» свой предмет, видеть, что теорема верна, еще не зная ее формального доказательства, а потом придумывать это доказательство.
Практически каждый человек в какой-то мере обладает математической интуицией. Ею наделен ребенок, складывающий картинку из кубиков, ею обладает всякий, кому удалось уложить вещи в багажник автомобиля, перед тем как всей семьей отправиться на нем в отпуск. Главной целью подготовки математиков следовало бы сделать оттачивание их интуиции до такой степени, что
бы она превратилась в управляемое орудие исследования.
Много бумаги истрачено на споры о преимуществе строгости перед интуицией и, наоборот, интуиции перед строгостью. Обе эти крайности бьют мимо цели: вся сила математики — в разумном сочетании интуиции и строгости. Контролируемый дух и вдохновенная логика! Все мы знаем людей блестящих способностей, идеи которых никогда не воплощались в конкретные результаты, и других — организованных и аккуратных, которые так и не создали ничего стоящего, потому что были слишком заняты тем, чтобы все было аккуратно и организованно. Надо избегать обеих крайностей,
О картинках
При изучении математики психологический аспект часто важнее логического. Мне приходилось присутствовать на лекциях, в которых все было потрясающе логично, но слушатели ничего не понимали. Интуитивные соображения должны выступать первыми и лишь потом подкрепляться формальным доказательством. Интуитивные рассуждения позволяют нам понять, почему должна быть верной та или иная теорема, а затем уже при помощи прочных логических обоснований можно убедиться, что она действительно справедлива.
В последующих главах я буду стараться подчеркивать интуитивную сторону математики. Вместо строгих доказательств я попытаюсь дать читателю представление о лежащих в их основе идеях. В хороших учебниках должно было бы быть и то, и другое, но, к сожалению, лишь немногие из них отвечают этому идеалу.
Некоторые математики, может быть 10 из 100, мыслят формулами. Такова их интуиция. Но остальные мыслят образами: их интуиция геометрическая. Картинки несут гораздо больше информации, чем слова. В течение мно
гих лет школьников отучали пользоваться картинками, потому что «они не строгие». Это печальное недоразумение. Да, они не строгие, но они помогают думать, а такого рода помощью никогда не следует пренебрегать.
Зачем!
Имеется множество причин для занятий математикой, и едва ли кто-нибудь из читателей станет требовать, чтобы ему тут же немедленно доказали правомерность существования математики, а не то он дальше читать не будет. Математика красива, стимулирует интеллектуально и даже полезна.
Большинство вопросов, которые я собираюсь рассмотреть, взяты из чистой математики. Чистая математика ставит перед собой в качестве цели не практические применения, а интеллектуальное удовлетворение. Этим она напоминает изящные искусства: мало найдется людей, которые требовали бы практической пользы, например, от живописи. (Однако в отличие от искусства в математике существуют повсеместно принятые критерии.) Но вот что замечательно: почти вопреки самой себе чистая математика полезна! Позвольте привести пример.
В начале 18 в. математики затратили много усилий на изучение волнового уравнения — уравнения в частных производных, описывающего колебания струны или распространение волн в жидкости. Несмотря на физическое происхождение, это была чисто математическая задача — о практическом применении волн никто не думал. В 1864 г. Максвелл предложил систему уравнений для описания электрических явлений. Из этих уравнений путем несложных преобразований получилось уже известное волновое уравнение. На основе этого факта Максвелл предсказал существование электромагнитных волн. В 1888 г. Герц экспериментально подтвердил предсказание Максвелла, осуществив в своей лаборатории прием
радиоволн. И, наконец, в 1896 г. произошла первая радиопередача.
Ход событий весьма типичен: именно таким путем, как правило, становится полезной чистая математика. Все начинается с задачи, которую математик решает ради удовольствия. Затем приходит теоретик, который применяет математический результат, но не делает никаких попыток проверить свою теорию. Его сменяет ученый-экспериментатор, который подтверждает теорию, но не предлагает ей никакого употребления. И наконец, появляется человек практики, который на этой базе выдает товар жаждущему миру.
Та же последовательность событий наблюдалась при открытии и разработке атомной энергии, теории матриц (которая нашла применение в технике и экономике), теории интегральных уравнений.
Обратите внимание на интервалы времени: от волнового уравнения до радиопередатчика— 150 лет; от дифференциальной геометрии до атомной бомбы — 100 лет; от первого появления матриц (в работах Кэли) до их применения экономистами — 100 лет. Интегральным уравнениям понадобилось 30 лет, чтобы пройти путь от момента, когда Курант и Гильберт превратили их в полезный математический инструмент, до момента, когда они пригодились в квантовой теории, а это произошло за много лет до того, как сама квантовая теория нашла практические применения. В те времена никто и подумать не мог, что математика, которой они занимаются, понадобится столетие или более спустя!
Означает ли это, что надо приветствовать занятия любыми математическими задачами, даже теми, которые сейчас кажутся не представляющими ни малейшего интереса, ибо есть небольшой шанс, что именно они понадобятся физикам к 2075 г.?
И волновое уравнение, и дифференциальная геометрия, и матрицы, и интегральные уравнения признавались
важными в математике уже в то время, когда они только появились. Математика устроена так, что ее части тесно связаны между собой, и развитие одной части затрагивает другие. Это позволяет говорить о некоем «теле» математики, имеющем свои главные и второстепенные «органы». Важным признается то, что затрагивает главную часть «организма». Даже совсем новые методы доказывают свою важность на проблемах «главного направления». Почти вся математика, нашедшая практические применения, относится именно к главной части организма.
Получается, что торжествует математическая интуиция? Или просто то, что не признано важным, никогда не развивают до такого уровня, когда бы оно могло стать полезным? Не знаю. Однако бесспорно, что те математические теории, которые по единодушному мнению математиков считаются тривиальными или несущественными, никогда не окажутся полезными. Теория обобщенных левых псевдоскопищ не держит в своих руках ключей от будущего.
И все же некоторые очень изящные и важные математические результаты не находят практического применения просто потому, что реальный мир устроен иначе. Один физик-теоретик заработал себе прочный авторитет тем, что, исходя из весьма общих математических соображений, вывел формулу для радиуса Вселенной. Это была очень впечатляющая формула, щедро начиненная константами е, с, h, несколько раз в ней встречалось число л и много квадратных корней. Поскольку он был убежденным теоретиком, его не беспокоили численные значения. Прошло несколько лет, пока нашелся человек, которому захотелось узнать, чему равен радиус Вселенной.
Оказалось, 10 сантиметрам.
Глава 2
ДВИЖЕНИЕ БЕЗ ПЕРЕМЕЩЕНИЯ
Геометр — разновидность гусеницы.
Старый словарь.
Геометрия — одно из самых мощных средств человеческого мышления. Мы воспринимаем окружающий мир в основном при помощи зрения, а геометрическая интуиция тесно связана со зрением. В геометрии часто в буквальном смысле можно увидеть то, что происходит. Например, теорема Пифагора становится почти очевидной, если посмотреть на рис. 1.
Более того, вызываемое этой картинкой интуитивное ощущение справедливости теоремы нетрудно превратить в логически строгое доказательство, и благодаря привлечению на помощь интуиции это доказательство очень убедительно.
Геометрия в стиле Евклида (а до недавнего времени только с ней и сталкивалось большинство людей) не одобряет обращения к картинкам и пользуется вместо этого высокопарными рассуждениями по существу алгебраического характера, основанными на понятии конгруэнтности треугольников. В итоге все геометрические идеи сводятся к свойствам треугольников.
Понятие конгруэнтности достаточно наглядно: два треугольника конгруэнтны, если они одинаковой формы и одного размера. Однако дети часто находят трудными те рассуждения с конгруэнтными треугольниками, которые применяются для доказательства теорем. Первая «трудная» теорема евклидовой геометрии стала камнем преткновения как раз из-за сложных манипуляций конгруэнтными треугольниками в ее доказательстве. (Были и другие проблемы; в 50-е годы 18 в. от школьников требовалось не только воспроизводить доказательства самого
Евклида, но и пользоваться его обозначениями на чертежах.)
Оказывается, у Евклида были веские причины избегать картинок. Его переполняло желание вывести всю геометрию чисто логически из нескольких простых основных принципов. Правда, позднее в его логике обнаружи-
Рис. 1.
лись пробелы, но их удалось заполнить. Однако большинство детей не способны оценить эту жажду строгих доказательств. При занятиях математикой на любом уровне за «логически строгое» принимается то, что «убеждает», хотя, конечно, требуется немало работы, чтобы «убедить» профессионального логика! Значительная часть обучения • математике состоит в том, чтобы выявить дефекты вполне убедительных на вид рассуждений и показать ученику, что они не должны его убеждать. Если мы хотим научить детей геометрии, нам придется либо снизойти до таких доказательств, которые они найдут приемлемыми, либо быть готовыми потратить много времени на усовершенствование их критического мышления, причем в последнем случае больше пользы, возможно, принесет не курс геометрии, а курс логики!
Однако объяснять ребенку доказательство, которое лишь выглядит убедительным, а потом оказывается в корне неверным, — очень вредно. Это только выработает замешательство и недоверие. Нужны такие способы убеждения, которые позднее удастся превратить в строгие доказательства. Примером того, что я имею в виду,
служит приведенный выше рисунок. Его можно превратить в строгое доказательство теоремы Пифагора, после того как будет разработано понятие площади. Иными словами, математика должна отражать интуицию.
Евклид (кто бы он ни был), несомненно, обладал сильно развитой геометрической интуицией, иначе его книга никогда не была бы написана. Но он не владел еще средствами, пригодными для прямого выражения его интуитивных идей. И тогда с гениальной изобретательностью он пустил в ход атрибуты конгруэнтности и т. д. Теперь такие средства есть. Появившись в математике 19-го в., они проникли сейчас в новые школьные программы под названием «геометрия преобразований» или «геометрия движений».
Опрокидывая Евклида
Теорема, которую мы упомянули выше как «первую трудную теорему у Евклида», гласит: в равнобедренном треугольнике углы при основании равны. Я хочу привести сначала доказательство самого Евклида. В отличие от обычного школьного доказательства в нем не применяются никакие построения, связанные с серединой основания, ибо в том месте, где Евклид ее доказывает, еще не установлено, что отрезки имеют середины, и поэтому понятием середины пользоваться нельзя.
На рис. 2 мы продолжили АВ до некоторой точки D, а АС— до точки Е, причем так, что AD = AE. Затем провели отрезки DC и ЕВ. Дальше доказательство Евклида строится так.
1. Треугольники ACD и АВЕ конгруэнтны (по двум сторонам и углу между ними).
2. Следовательно, 2.ABE=ZACD.
3. Значит, DC=EB.
4. Поэтому конгруэнтны треугольники DBC и ЕСВ (по трем сторонам).
5. Отсюда Z.DCB=Z_EBC.
6. Из 5 и 2 вычитанием получаем, что Z.ABC= г^АСВ, что и требовалось доказать.
Отдельные шаги доказательства, возможно, станут яснее, если составить из них не- л
что вроде комикса, как на рис. 3. Л
Сразу бросается в глаза (осо- / \
бенно на комиксе), что все здесь / \
встречается парами. Сторона АВ J. \
слева, АС справа, и они равны. J \
Треугольник ACD слева, АВЕ / \
справа, и они конгруэнтны, и т. д. р/ \
Наконец, Z.ABC слева, Z.ACB / \ справа: они равны, и теорема до- / \
казана. / s' X. \
Возникает твердое ощущение, rJs' 'Д
что если найти способ превращать правое в левое, а левое в правое, 2-то все станет очевидным. Доказательство прямо-таки требует этого. Но как это осуществить?
Когда вопрос поставлен так, ответ простой: перевернем треугольник. Сделайте из картона равнобедренный треугольник, обведите его контуры, затем переверните и приложите к рисунку. Вы увидите, что он точно занял свое прежнее место. Можно и не экспериментировать, а рассуждать следующим образом: перевернем треугольник так, чтобы точка А осталась на месте, а сторона АС легла на прежнюю сторону АВ\ тогда, поскольку угол А, в каком направлении его ни измеряй, равен самому себе, сторона АВ ляжет на бывшую сторону АС. Так как расстояния АВ и АС равны, новая точка С совпадет с прежней точкой В, а новая точка В — с прежней точкой С. Таким образом, В и С поменялись местами. Теперь все определено и новые стороны совпали со старыми. Новый ЕАВС лег точно поверх старого Е_АСВ, следовательно, они равны.
а. Эти два треугольника конгруэнтны, поэтому отмеченные углы равны.
б. Следовательно, эти два треугольника конгруэнтны, и отмеченные углы равны.
в. Сравним отмеченные углы ...
г. ... и убедимся, что они равны. Что и требовалось доказать.
Доводы против перемещения
Ч. Л. Доджсон в одной из своих математических работ 1 приводит следующую беседу:
МИНОС: Предлагается доказать [эту теорему], взяв равнобедренный треугольник, перевернув его и опустив на самого себя ЕВКЛИД: В таком доказательстве слишком много нелепицы, чтобы его можно было поместить в строго философском трактате; не напоминает ли оно о том человеке, который спускался вниз по собственной глотке?
МИНОС: Я полагаю, защитники этого доказательства могут сказать, что треугольник оставляет за собой след и что перевернутый треугольник кладется на этот след.
Так можно «расправиться» с одним из возможных возражений. Но имеется другое, более глубокое возражение, которое, вероятно, казалось древним грекам особенно веским: само понятие перемещения из-за парадоксов Зенона несет в себе неясность. Возможно, именно поэтому Евклид обратился к более надежному понятию конгруэнтности.
Зенон перечислил четыре парадокса. Чтобы передать их специфику, достаточно привести здесь один 2. Допустим, нам надо попасть из точки А по прямой в точку В. Для этого сначала надо попасть в точку С на полпути между А и В. Но прежде чем попасть в С, надо достичь точки D на полпути между А и С, и так до бесконечности... Создается впечатление, что движение никогда не сможет начаться!
Проблема не так проста, как кажется, и древние греки это хорошо понимали. Получается, что всякая ссылка на движение в строгом доказательстве выглядит как его изъян. В реальном мире перемещения, конечно, происходят, однако экспериментальное подтверждение не является логически строгим доказательством.
Поправка к понятию движения
Мы сможем полностью обойти проблемы, поднятые парадоксами Зенона, если позаботимся о более аккуратных формулировках.
Возьмите свой картонный треугольник, переверните его и положите на прежнее место. Зависит ли приведенное выше доказательство от того, где он побывал в промежутке между действиями? Зависит ли что-нибудь от того, как вы его перевернули: ловко подбросив, как блин, или помахав им сначала в воздухе, или покружившись по комнате в вальсе «Голубой Дунай»? А если вы выйде-
Рм. 4.
те из дому, доедете поездом до Ливерпуля, вернетесь оттуда на попутной машине и только после этого положите свой треугольник на место, что-нибудь изменится?
Коль скоро треугольник лег на прежнее место, не имеет никакого значения, где он побывал до этого. Ему вообще не надо было никуда деваться: взмахните волшебной палочкой, — и он мгновенно перейдет из одного положения в другое. Выразим эту мысль точнее: раз нам не важно, где треугольник побывал, то нечего и говорить об этом, а следовательно, нечего и предполагать, что он где-то побывал. Все, что нам действительно нужно знать, — это куда в конце концов попала каждая его точка.
Для этого нужно придумать какой-то способ пометить все точки треугольника, а еще проще — пометить раз и навсегда все точки плоскости, чтобы для какого-нибудь
другого случая не пришлось делать все заново. В принципе не очень важно, какой способ выбрать, но особенно удобно воспользоваться координатами: каждая точка евклидовой плоскости задается парой своих координат (х, у) относительно двух фиксированных осей.
Рис. 5.
Допустим для определенности, что наши оси размечены в сантиметрах, и мы хотим передвинуться на 5 см вправо. Куда попадет данная точка (х, г/)?
Посмотрим на рис. 4. Легко заметить, что координата у не изменилась, а координата х увеличилась на 5. Таким образом, на 5 см вправо от точки (х, у) находится точка (х + 5, у).
Теперь заметим, что точка (х, у) на самом деле никуда не переместилась. Взгляните на точку (2, 3), а затем на точку (7, 3). Разве точка (2, 3) после этого куда-то делась? Ничего подобного. И это для нас очень существенно. Точки плоскости не перемещаются, перемещается наш взгляд. Если бы треугольник с вершинами (1,1), (2,1) и (1,4) сдвинулся на 5 см вправо, его вершинами стали бы (6,1), (7,1) и (6,4), как на рис. 5.
Теперь у нас не один треугольник, а целых два, причем один лежит на 5 см правее другого. Переводя взгляд с одного треугольника на другой, мы без всякого перемещения достигаем того же эффекта, что и при реальном
перемещении. (Между прочим, это помогает понять высказанную Миносом мысль о том, что треугольник оставляет «след». Мы пошли еще дальше и сохранили весь треугольник!)
Способ, которым мы переводим взгляд, можно описать такой схемой:
(1. 1)
(2, 1)->(7, 1)
(1, 4)->(6, 4)
и вообще
(х, {/)->(% +5, у).
Введем для обозначения выражения «точка на 5 см вправо от» специальный символ, скажем, Т. Тогда формула
Г(1, 1) = (6, 1)
читается так: «точка на 5 см вправо от (1,1) есть (6,1)», а формула
Т(х,у) = (х + 5,у) (*)
читается так: «точка на 5 см вправо от (х, у) есть (х + 5, у)».
Этот новый символ Т по существу равносилен команде: «подвинься на 5 см вправо», но на самом деле он ничего не двигает. Он лишь сообщает нам, где какие точки оказались бы, если бы они и впрямь вздумали перемещаться. Все, что нам нужно знать о Т, заключено в формуле (*), которую можно рассматривать как определение Т, т. е. определение действия: «подвинься на 5 см вправо».
Символы действия, подобные Т, называются преобразованиями плоскости. Преобразование F считается заданным, если для каждой точки (х, у) известна точка F(x, у). Можно задавать преобразование формулой вроде ( * ) или любым другим, но четко определенным спо-
собой нахождения F(x, у), Всякому перемещению (в ип< туитивном смысле) соответствует преобразование F такое, что
F(x, гД=точка, в которую переместится объект, расположенный в точке (х, у).
Преобразования обладают тем преимуществом, что, возникнув благодаря идее перемещения, они потеряли с ней прямую связь, и потому им не угрожает опасность парадоксов Зенона. Пользуясь преобразованиями, можно создать такую разновидность математики, в которой действие: «перевернем треугольник и опустим его на самого себя» — имеет четкую интерпретацию, не опасную никакими логическими ловушками.
Свойство жесткости
Интересно разобраться, какие преобразования каким движениям соответствуют. Например, зеркальному отражению относительно оси х отвечает преобразование G:
6(х, у) = (х, -у),
а повороту на 90° по часовой стрелке — преобразование Н:
Н(х, у) = (у, -х).
Это легко установить по рис. 6 и 7.
Можно, наоборот, сначала задать преобразование, а потом выяснить, какое движение ему отвечает. Например, если
К(х, у)=(х+3, у-2), то преобразованию К соответствует движение, которое перемещает все точки на 3 см вправо и на 2 см вниз.
Для исследования более сложных преобразований полезно отметить на чертеже, куда перешли несколько выбранных точек. Так, для J:
У) = (х2, ху)
можно сосчитать: /(1,1) = (1, 1), /(2, 3) = (4, 6) и т. д. и нанести полученные точки на лист в клеточку. Это преобразование переводит квадрат с вершинами (1, 1), (1, 3), (3, 1) и (3, 3) в фигуру, показанную на рис. 8.
Мы видим, что преобразование / искажает форму фигур, закручивая и растягивая их. В обычной геометрии
такие преобразования не рассматриваются. Если допустить изгибания и растяжения, то треугольники будут свободно переходить один в другой, и ничего хорошего не получится.
Нам нужны такие преобразования, которые соответствуют жестким движениям, не изменяющим форм фигур и их размеров. Наши рассуждения о равнобедренном треугольнике потеряют силу, если перевернутый треугольник окажется другой формы. Определенные выше преобразования G, Н, К соответствуют жестким движениям, а преобразование J — нет.
Основное свойство жесткого движения состоит в том, что оно ничего не вытягивает и не сжимает. Никакие две точки не сближаются и не отдаляются, т. е. остаются одна от другой на том же расстоянии. При помощи координат на евклидовой плоскости это свойство можно выразить алгебраически. Расстояние между двумя точками (х, у) и (и, v) определяется по формуле
V +
которая выводится из теоремы Пифагора. Если при преобразовании F
F(x, у) = (х', у'), F(u, v) = (u', v'), то расстояние между F(x, у) и F(u, v) равно
Если F соответствует жесткому движению, эти два расстояния должны быть равными для любых выбранных точек (х, у) и (и, v). Записывая это равенство и возводя в квадрат обе его части, получаем, что для всех (х, у) и (и, v)
(x-u)2+(y-v)2=(x'-u')2 + (y'-v')2.
Преобразование F соответствует жесткому движению тогда и только тогда, когда оно удовлетворяет этому урав
нению, пели угодно, это свойство можно рассматривать как определение жесткого движения, отождествляя тем самым формальное понятие с интуитивным.
Поработав над этим уравнением, можно было бы получить более простые определяющие свойства жестких движений. Однако это завело бы нас в сторону от основного пути. Здесь нам важно то, что жесткое движение можно охарактеризовать как преобразование некоего определенного вида.
Параллельный перенос, вращение, зеркальное отражение
Рассмотрим теперь три частных вида жестких движений.
Параллельный перенос (или сдвиг) перемещает каждую точку на заданное расстояние в заданном направлении (рис. 9).
Вращение поворачивает каждую точку вокруг некоторой фиксированной точки Р (центра вращения) на заданный угол 6 (рис. 10),
Зеркальное отражение (осевая симметрия) отражает каждую точку плоскости относительно некоторой фиксированной прямой I (оси симметрии) так, как будто вдоль этой прямой поставлено зеркало (рис, 11).
Пользуясь координатным методом, легко записать соответствующие преобразования. Например, повороту
на угол 6 относительно начала координат отвечает преобразование R.
R(x, У) = (х cos Q—y sin 6, х sin Q+y cos 6),
По формулам для трех перечисленных преобразований легко проверить различные их свойства, подсказываемые интуицией: то, что они действительно задают жесткие движения, что вращение на угол 6, а затем на угол <р дает вращение на угол 6 + <р, и т. д.
Мы выделили именно эти три типа движений потому, что они действуют по-разному, имеют довольно простой вид и отвечают преобразованиям с простыми формулами. Оказывается, никаких других и не нужно: любое жесткое движение плоскости можно получить при помо-

щи последовательного выполнения параллельных переносов, вращений и зеркальных отражений. Наглядно в этом можно убедиться при помощи рис. 12.
1. Начнем с произвольного треугольника АВС и произвольного жесткого движения С.
2. При помощи параллельного переноса Т можно совместить Т(А) и U(А).
3. Вращение S вокруг точки U(A) позволяет совместить Т(В) и U(B).
4. Наконец, зеркальное отражение относительно прямой U(A) U(В) переводит S(T(C)) в U(C).
(Конечно, в некоторых случаях какой-то из этих шагов, возможно, не понадобится.)
Мы не случайно воспользовались треугольником. Дело в том, что плоскость двумерна, и потому всякое жесткое движение на ней однозначно определено, если известно, куда оно переводит некоторый (невырожденный) треугольник3. Итак, мы показали, что всякое жесткое движение на плоскости можно получить при помощи последовательного выполнения параллельного переноса, вращения и зеркального отражения (причем некоторые из них могут не понадобиться).
Ясно, что зеркальное отражение потребуется только тогда, когда движение переворачивает фигуры. Поэтому движения, при которых этого не происходит, получаются лишь переносом и вращением. (Дальнейшие исследования позволят выяснить нечто большее.) Допустим, что выполняются два зеркальных отражения относительно двух (быть может) различных прямых. Первое все опрокидывает, а второе переворачивает обратно, и в итоге все остается неперевернутым. Отсюда видно, что результат двух отражений можно получить переносом и вращением. Этот факт менее очевиден, чем упомянутые выше, однако и он без труда выводится из наших рассуждений.
Полученный выше результат можно выразить так: для каждого жесткого движения U найдется такой па
раллельный перенос Т, такое вращение S и такое зеркальное отражение R, что для любой точки Х=(х, у)
U(X) =R(S(T(X)))
(с обычной оговоркой, что в некоторых случаях любое из R, S, Т может отсутствовать). Здесь напрашивается более краткое обозначение. Пусть заданы два преобразо-вания Е и F, Определим преобразование ЕЕ формулой
EF(x, y)=E(F(x, у)).
Если Е соответствует жесткому движению (которое мы тоже обозначим Е), a F — жесткому движению F, то ЕЕ отвечает движению: «сначала F, потом Е». (Это объясняется тем, что, когда мы ищем E(F(x, у)), мы сначала находим Е(х, у), а потом уже E(F(x, у)). Жаль, конечно, что движения выступают не в том порядке4. Подобное же явление происходит при вычислении log sin х: сначала мы находим sin х, а затем его логарифм.)
Выше мы рассмотрели два жестких движения, которым соответствовали преобразования G, ЕЕ
G(х, у) = (х, -у), Н(х, у) = (у, -х).
Найдем GEE
GH(x, y) = G(H(x, y))=-G(y, -х) = (у, х),
(Чтобы получить последнее равенство, нужно помнить, что символы хи у совершенно произвольны: с тем же успехом можно написать G(u, v) = (u, —v) и затем подставить у вместо и и х вместо и.)
Сделав чертеж, мы обнаружим, что GEE соответствует зеркальному отражению относительно диагонали у=х (рис. 13).
Обозначим его D-.
D(x, у) = (у, х).
Мы доказали, что для любой точки (х, у) GH(x, y)=D(x, у).
В этом смысле мы и будем понимать равенство
GH=D.
Если вернуться к соответствующим движениям, то можно проверить его экспериментально: вращение на 90° по часовой стрелке и зеркальное отражение относительно оси х приводят к тому же результату, что и отражение относительно прямой у=х. Наши вычисления согласуются с экспериментом!
Теперь вместо GH рассмотрим HG:
HG(x, y)=H(G(x, у))=Н(х, -у)={-у, -х).
Это преобразование отвечает отражению относительно другой диагонали у =—х. Заметим, что GH=^HG. На самом деле нет никаких причин (кроме привычки) думать, что они должны совпадать. Данный пример это подтверждает. Поэтому-то нужно твердо знать, что означает EF: «сначала F, потом Е» или наоборот.
Теперь мы можем переписать прежнее равенство U(X) =R(S(T(X))) в очень простой форме
U=RST,
Тот факт, что удалось определить «произведение» EF, наводит на мысль о построении «алгебры» преобразований. Развитая в одном направлении, эта идея приводит к линейной алгебре, которую мы обсудим в гл. 15, а в другом — к теории групп (гл. 7).
Назад к теореме
Мы немного отклонились от равнобедренных треугольников, которые толкнули нас на этот путь, зато построили аппарат, который позволит теперь сделать вполне респектабельным «опрокидывающее» доказательство. Тому, кто имел дело с преобразованиями, достаточно того, что уже сказано. Более предусмотрительно следовало бы рассуждать примерно так.
Существует преобразование Т, отвечающее зеркальному отражению относительно биссектрисы угла ВАС. Поскольку при жестких движениях не меняются расстояния (а значит, и углы), Т(А)=А, Т(В) = С и Т(С)=В. Следовательно, применение Т к углу АВС дает угол АС В. Так как величины углов не меняются, то
ZABC=Z_T(A)T(B)T(C) = ААСВ,
что и требовалось доказать.
Это доказательство, когда оно станет для вас обычным, проще того, которое дал Евклид, потому что в нем логика следует за интуицией.
Теперь, владея аппаратом преобразований, мы можем спокойно говорить о движениях, не ощущая за спиной призрака Зенона. Это открывает доступ к новым, более простым доказательствам многих теорем стандартного курса геометрии. Приведем два примера.
1. Если в треугольнике два угла равны, то он равнобедренный.
Пусть в треугольнике АВС равны углы А и В. Выполним зеркальное отражение относительно перпендикуляра, проведенного через середину стороны АВ. На первый взгляд, должно получиться то, что изображено на рис. 14.
Однако из равенства углов А и В следует, что преобразованный треугольник ляжет точно поверх прежнего,
так что АС совпадет с ВС. Значит, треугольник равнобедренный.
2. Равным дугам окружности соответствуют равные хорды.
Пусть А, В, X, У — точки на окружности с центром О и дуга АВ равна (по длине) дуге XY (рис. 15).
Рис. 14.
Выполним вращение вокруг точки О, так чтобы точка А перешла в X. Тогда в силу равенства длин дуг точка В совпадет с У и, значит, хорда АВ совпадет с хордой XY, откуда видно, что они равны.
Теперь вы наверняка вспомните и другие теоремы из геометрии, которые можно доказать таким путем. Если бы мы задумали провести эту программу для всей геометрии, пришлось бы более тщательно сформулировать основные понятия; при этом выяснилось бы, что далеко не каждая геометрическая теорема есть прямое следствие свойств жестких движений. Те теоремы, которые могут быть сразу доказаны, исходя из этих свойств, станут тривиальными, и мы сможем сосредоточить внимание на более тонких геометрических результатах. Так применение жестких движений помогает нам отсеять тривиальное и заняться тем, что по-настоящему интересно.
Глава 3 кратчайшие пути
В ВЫСШЕЙ АРИФМЕТИКЕ
Поразительно, до каких премудростей могут дойти математики, чтобы только поменьше трудиться.
Мэтью Пордейдж
Представление о числах впервые возникло у первобытных людей скорее всего из желания как-то уследить за важными событиями их жизни. Сколько у меня овец, наконечников для стрел, жен? Скоро ли наступит весеннее половодье? Подобные вопросы фокусируют внимание на именованных числах, которые первыми нашли практическое применение. Абстрактное понятие «отвлеченного числа» сложилось значительно позднее. Тот факт, что две овцы и две жены имеют нечто общее — то что их «две» — совсем не очевиден. Очень маленькие дети этого еще не понимают, хотя они прекрасно отличают одну овцу от двух овец.
По мере развития человечества к этим первым. числам для счета предметов добавились другие. Каждая эпоха изобретала числа, отвечающие ее нуждам. Индусы изобрели нуль. Чтобы сделать возможным деление на части, пришлось ввести дроби. Затем понадобились отрицательные числа. В результате сложилась сначала система целых чисел: ..., — 3, —2, — 1, 0, 1, 2, 3, ... , а затем, после введения отрицательных дробей, система рациональных чисел, т. е. чисел вида p/q с целыми р и q, например 1/2, 17/25, — 11/292. Геометрия (та, что была разработана еще греками), а затем потребности анализа (дифференциального и интегрального исчисления) привели к понятию действительного числа, вобравшему в себя и те числа, которые не являются рациональными (например,
V2). Наконец, попытки научиться решать алгебраические уравнения породили уже вовсе загадочные комплексные числа, для создания которых пришлось считать, что существует квадратный корень из — 1.
Каждый шаг по ступеням этой лестницы сопровождался бурными дебатами о том, являются ли эти новомодные штуки числами.
Комплексные
Действительные
Рациональные
Дрова
Целые
Натуральные
Именованные^
Рис. 16,
Оказалось, что все эти числа укладываются в одну стройную схему (рис. 16).
Стрелки, ведущие от одной системы чисел к другой, означают, что вторая содержит все числа из первой и какие-то еще.
Более того, в каждой из этих систем можно выполнять арифметические действия. Это в какой-то мере объясняет, почему столь разные объекты упорно называли числами. Выбор такого названия все же в большой степени произволен, однако позднее об этом забыли и «числу» стали приписывать мистические качества сродни божественному откровению.
Ни одно из чисел ни одной из этих систем не сущест
вует в реальном мире. Я еще никогда не встречал в своих путешествиях число 2. Как-то я проходил мимо двух овец и, насколько я понял, их поведение вполне отвечало свойствам этого числа, но самого числа я так и не видел. В то же время числа удачно описывают некоторые свойства реального мира; поэтому они и были выделены как абстрактные понятия, отражающие его поведение.
Различные физические ситуации требуют разного математического описания. Чтобы сосчитать своих жен, человеку хватит натуральных чисел; чтобы взвесить свое золото, он воспользуется дробями. Греческому геометру, который захотел узнать, чему равна гипотенуза равнобедренного прямоугольного треугольника, понадобились числа вроде У2, а математик эпохи Возрождения, решавший кубическое уравнение1, нашел применение числу
Существует много важных математических объектов, которые по каким-то историческим или психологическим причинам не называют числами, хотя они и возникли из столь же практических потребностей. Эти объекты обладают многими свойствами чисел и даже применяются для их исследования. Различие между числовым и нечисловым столь же иллюзорно, как и вера в то, что числа даны нам богом.
Арифметика в миниатюре
Интересную математическую систему представляет собой так называемая арифметика вычетов.2 Подобная система возникает тогда, когда мы рассматриваем циклически повторяющиеся события: чередование дней недели, часов в течение суток, величин углов по окружности (при этом дни недели повторяются каждые 7 дней, время дня — каждые 24 часа, а углы по окружности — каждые 360°).
Занумеруем дни недели от 0 до 6, начиная от воскре
сенья, и расположим цифры по кругу, как на рис. 17. Если мы будем продолжать нумерацию, то 7-й день снова окажется воскресеньем, 8-й — понедельником, 9-й — вторником и т. д. Таким образом, в каком-то смысле 7 = 0, 8=1, 9 = 2 и т. д„ хотя, конечно, знак равенства здесь нужно понимать не совсем так, как обычно! Можно
пойти в обратном направлении и установить, что -1-й день, предшествующий воскресенью,— суббота, так что — 1 = 6; аналогично —2=5. В итоге вся совокупность целых чисел «наматывается» на круг дней недели, как показано на рис. 18.
Нетрудно вывести общий признак, какие числа какому дню отвечают.
Воскресенье: ..., —14, —7, 0, 7, 14.. т. е. числа
вида 7/г.
Понедельник: ..., —13, —6, 1, 8, 15, ..., т. е. числа вида 7п+1.
Вторник: ..., —12, —5, 2, 9, 16, ..., т. е. числа вида 7м 4-2.
Среда: ..., —11, —4, 3, 10, 17, ..., т. е. числа вида 7п+3.
Четверг: — 10, —3, 4, 11, 18. т. е. числа вида
7п+4.
Пятница: ..., — 9, ~—2, 5, 12, 19, ..., т. е. числа вида 7п + 5.
Суббота: — 8, — 1, 6, 13, 20, ..., т. е. числа вида
7п + 6.
(Числа вида 7п+7 суть вида 7(п + 1), т. е. 7п.)
Итак, день недели, соответствующий данному числу, определяется по остатку при делении на 7. Такими остатками могут быть только 0, 1, 2, 3, 4, 5, 6. А теперь построим для них «арифметику остатков (вычетов)». Условимся понимать формулу
4+5=2
в том смысле, что «если к четвертому дню прибавить пять дней, то получится второй день». Такая интерпретация вполне естественна и позволяет нам построить следующую таблицу сложения «чисел» от 0 до 6:
-р | 0 1 2
о
1
2
3
4
5
0
1
2
3
4
5
1 2
2 3
3 4
4 5
5 6
6 0
0 1
3 4 5 6
3 4 5 6
4 5 6 0
5 6 0 1
6 0 12
0 12 3
12 3 4
2 3 4 5
Эта таблица отражает структуру 7-дневного цикла. Допустим, нас интересует, какой день недели наступит через 751 день после вторника. Сформулируем задачу так:
4 + 751 = ?
Числа 751 в нашей таблице нет, но мы замечаем, что 751 = 7- 107+2 = 7п+2,
т. е. 751 =2. Итак задача принимает вид
4+2=?
и из таблицы мы находим, что ? = 0, т. е. через 751 день после вторника наступит суббота.
Это «сложение» имеет свои причуды: например,
1 + 1 + 1 + 1 + 1 + 1 + 1=0,
однако если истолковать эту формулу так, как сказано выше, то смысл ее ясен, и к подобным причудам можно быстро привыкнуть.
Воодушевленные своими успехами, попробуем ввести для этой системы умножение. Конечно, трудно приписать какой-нибудь смысл умножению воскресенья на понедельник, но мы и не собираемся этим заниматься 3. Чтобы произведение 3-6 имело хоть какой-то смысл, оно должно равняться 6+6+6, т. е. 4 по нашей таблице. Поэтому мы, по определению, полагаем
3-6=4.
Не менее разумно потребовать, чтобы 3-6 равнялось З+З + З + З + З+З. Не приведет ли это к другому ответу? Нет, мы снова получаем 4. Можно еще рассуждать так: поскольку 3= 10, 3-6 должно равняться 10-6, или 60,— но 60 снова равно 4. Итак, как бы ни называлось это действие, оно по крайней мере приводит к согласованным результатам, и это очень приятно.
Построим теперь таким же способом (повторным сложением) таблицу умножения (проверьте ее!):
х | о 1 2 3 4 5 6
о
1
2
3
4
5
6
О О
О 1
О 2
О 3
О 4
О 5
О 6
ООО
2 3 4
4 6 1
6 2 5
1 5 2
3 1 6
5 4 3
О О 5 6 3 5
1 4 6 3
4 2
2 1
Конечный результат наших усилий — числа от 0 до 6 и две таблицы — называют системой целых чисел по модулю 7 или для краткости числами по модулю 7. Затейливое словечко «модуль» употреблено здесь только для того, чтобы отметить роль числа 7. Вместо 7 можно, разумеется, взять любое другое целое число. Если исходить из чисел на циферблате часов, получится арифметика по модулю 12 (или по модулю 24, если часы электронные). В общем случае годится любое целое число. Нужно только вообразить «неделю» с таким числом дней и дальше поступать точно так же, как выше.
Сравнения
В 1801 г. Карл Фридрих Гаусс, которого считают одним из трех самых великих математиков, когда-либо живших на земле, опубликовал свои «Арифметические исследования» (Disquisitiones Arithmeticae). Это был трактат по теории чисел, т. е. речь шла о свойствах обычных целых чисел. Гаусса интересовали, конечно, более глубокие идеи, чем те несложные вычисления, которые составляют элементарную арифметику. Поскольку теория чисел занимается лишь целыми числами, можно поду
мать, что это очень простая наука. Дело обстоит как раз наоборот. Теория чисел — одна из самых трудных областей математики, изобилующая нерешенными проблемами.
Вводный раздел своего трактата, на котором основано все дальнейшее, Гаусс начинает таким определением:
Если некоторое число а лепт разность чисел b и с, будем называть b и с сравнимыми 4 относительно а ... Число а называется модулем.
(Под «числом» Гаусс понимает «целое число».)
Если b и с сравнимы по модулю а, будем писать b=c (mod а)
или просто Ь==с, если ясно, о каком модуле идет речь.
Посмотрим, как это связано с тем, что мы делали выше. Пусть b и с сравнимы по модулю 7. Тогда существует такое целое число k, что
b — c=7k или b = 7k+c.
Мы видим, что числа, сравнимые по модулю 7 с заданным числом с,— это числа вида 7k + с и только они. Например, с 1 сравнимы числа вида 7&+1.
Любое заданное число b можно разделить на 7 и найти остаток г:
b = 7q + r\
отсюда следует, что b сравнимо с г (mod 7). Так как остатками могут быть только числа от 0 до 6, мы заключаем, что любое целое число сравнимо по модулю 7 с одним из чисел 0, 1,2, 3, 4, 5, 6.
Посмотрим еще раз на рис. 18. Числа, лежащие на спирали над нулевым днем, воскресеньем, имеют вид 7п, т. е. сравнимы с 0. Числа, лежащие над первым днем, сравнимы с 1, и вообще числа, лежащие над d-м днем, сравнимы с d.
Далее оказывается, что сравнения можно складывать
и перемножать, совсем как обычные равенства. Точнее, если
ct^a' (mod m); Ье==Ь' (modm), то
a+b=a'+b' (mod m)'j ab = a'b' (modm),
Давайте это докажем. Для этого не требуется ничего, кроме самой элементарной алгебры. Из двух первых сравнений мы знаем, что существуют целые / и k, для которых
а = т] + а', b = mk+b't (*)
Чтобы убедиться в сравнимости а-\-Ь и а'^-Ь', нужно показать, что их разность
(а + Ь) - (а'+Ь')
делится на т. Подставим выражения для а и b по формулам ( * ). Получим m(j—k), т. е. число, явно делящееся на т. Чтобы доказать второе утверждение, нужно рассмотреть разность ab — a'b', которая равна
mfka+jb—jkm)
и, следовательно, тоже делится на т.
Из двух доказанных утверждений следует, например, что если 1 = 8 и 3^ 10 (mod 7), то 1 + 3=4 сравнимо с 8+10=18, а 1-3 = 3 сравнимо с 8-10 = 80. И действительно, обе разности 14 и 77 делятся на 7.
Полученное нами раньше, в арифметике дней недели, «равенство» 4+5 = 2 теперь можно сформулировать более точно
4 + 5=2 (mod 7),
И наши таблицы сложения и умножения относятся по существу к сравнениям. Например, 4-5=6 означает, что если какое-то число, сравнимое с 4, умножается на число, сравнимое с 5, то их произведение сравнимо с 6. Ариф
метика сравнений по модулю 7 позволяет нам отбрасывать при желании часть, кратную 7, и это находит применение в тех случаях, когда продвижение на 7 позиций вперед возвращает нас к исходному положению.
При помощи сравнений по модулю 10 легко объяснить, почему все полные квадраты кончаются на 0, 1, 4, 5, 6 или 9 и не могут кончаться на 2, 3, 7 или 8. Любое целое число сравнимо по модулю 10 с одним из чисел от 0 до 9 поэтому все квадраты сравнимы с квадратами этих чисел. Квадраты чисел от 0 до 9 сравнимы соответственно с 0, 1, 4, 9, 6, 5, 6, 9, 4, 1. Только этими цифрами и может кончаться любой квадрат, поскольку остаток от деления целого числа на 10 равен его последней цифре (в десятичной системе записи).
Подобным же образом можно объяснить и многие другие арифметические закономерности.
Деление
В арифметике по модулю п числа можно складывать и умножать почти так же, как в обычной арифметике, А вот проблема деления намного интереснее, потому что ответ зависит от того, какой взять модуль.
Допустим, мы хотим придать смысл дроби 4/3 (mod 7). Пока этот символ не имеет никакого смысла, и мы вольны приписать ему любое значение, какое нам заблагорассудится. Однако мы пожелали, чтобы он имел какое-то отношение к делению, а это уже налагает на наш выбор определенные ограничения. Наиболее естественно было бы определить 4/3 как любое число х, удовлетворяющее сравнению
Зх=4 (mod 7).
Из соответствующей таблицы умножения находим единственное подходящее значение х, а именно х=6, Поэтому
в арифметике по модулю 7 можно положить по определению
4/3 = 6.
Точно так же для любых других двух чисел р и q от О до 6 естественно полагать p/q равным такому у, для которого
ЯУ—Р (mod 7).
Число qy стоит в нашей таблице на пересечении строки q и столбца у. Для того чтобы это сравнение имело решение у, где-то в строке q должно встретиться число р. А для того чтобы решение было единственным, это число р должно встретиться в строке q ровно один раз. (Если решений будет несколько, мы не будем знать, какое из них взять в качестве p/q.)
Таблица умножения по модулю 7 устроена так, что в каждой ее строке, за исключением строки 0, каждое число встречается один и только один раз. Значит, для любого ненулевого q наше сравнение имеет единственное решение. Поэтому мы можем определить p/q при любом <7=7^0. Последнее условие не является серьезным ограничением, поскольку мы и не надеялись найти способ делить на 0.
А что произойдет в арифметике по модулю 6? Вот соответствующая таблица умножения:
X 0 1 2 3 4 5
0
1
2
3
0 0 0 0 0 0
0 1 2 3 4 5
0 2 4 0 2 4
0 3 0 3 0 3
4 0 4 2 0 4 2
5 0 5 4 3 2 1
Здесь дело обстоит по-другому.
Все числа встречаются
только в строках 1 и 5. В строке 2 стоят только 0, 2 и 4, причем каждое из них дважды. В строке 3 — только О и 3. Следовательно, на 5 и на 1 делить можно, а вот определить 1/2 или 3/4 не удастся. На роль 4/2 имеются два кандидата (2 и 5), а на роль 3/3 — целых три. Ну и кутерьма! И ничего похожего на предыдущий случай!
Из этой дилеммы нет выхода. Приходится признать, что в случае модуля 6 деление возможно не всегда. Ситуация гораздо хуже, чем с обычными целыми числами (правда, не при всех модулях). Хотя при делении одного целого числа на другое и не всегда получается снова целое число, систему целых чисел можно расширить до системы рациональных чисел, в которой деление выполнимо. Более того, в этой расширенной системе выполняются все те же «законы арифметики» (вроде a + b = b + a), что и в системе целых чисел.
Систему целых чисел по модулю 6 не удастся так расширить, чтобы стало возможным деление и выполнялись законы арифметики (о которых мы еще будем много говорить в гл. 6). Под словом «расширить» я понимаю «добавить еще несколько «чисел». Заметим, что эту систему нельзя расширить до множества всех обычных целых чисел, ибо тогда пришлось бы изменить таблицы сложения и умножения, а это было бы уже не расширением, а уничтожением.
В чем же здесь дело? А в том, что в таблице умножения слишком много нулей. Иногда нулю равно произведение двух чисел, отличных от нуля, например 2-3=0 (mod 6).
Допустим, нам удалось расширить систему так, что в ней можно определить число 1/2, скажем 1/2 = а. Тогда по законам 6-арифметики должно быть
3=l-3=(a-2)-3=a-(2-3)=a-0=0 (mod 6), что неверно. Таким образом, в расширенной системе законы 6-арифметики не выполняются,
Та же неприятность ожидает нас в случае любого модуля т, для которого произведение ненулевых сомножителей может обращаться в нуль.
Выписав таблицы умножения для модулей 2, 3, 4, 5, нетрудно убедиться, что для модулей 2, 3, 5, 7, 11, 13, 17, деление возможно всегда (кроме деления на нуль), а для модулей 4, 6, 9, 10, 12, 14, 15, 16, ...— не всегда. Не обязательно быть гением, чтобы обнаружить здесь закономерность. Первая последовательность состоит из простых чисел (которые не имеют делителей, кроме самих себя и 1), вторую образуют составные числа (которые разлагаются в произведение меньших чисел).
Легко доказать, что в случае составного модуля деление возможно не всегда. Допустим, что модуль m имеет вид m=a-b, где a<m, b<m. Тогда ни а, ни b не сравнимо с 0 по модулю т, а их произведение а- b сравнимо с 0 (точно так же, как 2'3=0 (mod 6)). Подобно тому как раньше мы вывели, что в 6-арифметике нельзя определить 1/2, можно убедиться, что в этом, более общем, случае нельзя определить 1/и (или 1/й).
Итак, с составными модулями все ясно, а как быть с простыми? Пока мы знаем только, что несколько первых простых модулей годятся для определения деления, а вдруг для какого-то очень большого простого числа (слишком большого, чтобы составить для него таблицу умножения) все будет по-другому?
Возьмем какое-нибудь простое число р. Пусть t несравнимо с 0 (mod р). Вспомним, что деление на t возможно тогда и только тогда, когда каждое число по модулю р встречается ровно один раз в строке t таблицы умножения. Установим сначала, что ни одно из чисел не встречается в ней дважды. Допустим, что это не так и какое-то из чисел (mod р) встретилось дважды. Тогда найдутся два различных числа (mod р), скажем и и о, для которых
tu^tv (mod р).
откуда
t(u — и)=0 (mod р).
В применении к обычным числам это означает, что произведение t(u— v) делится на р. Но если произведение делится на простое число, на него должен делиться один из сомножителей. Если t делится на р, то (mod р), что невозможно в силу нашего выбора t. Если и—v делится на р, то (mod р), что тоже невозможно. Итак, наше предположение, что какое-то число встречается в строке t дважды, привело к противоречию. Следовательно, оно неверно, и остается единственная возможность: ни одно число не встречается дважды в строке t.
Но в строке t имеется ровно р мест, на каждом из которых должно стоять одно из чисел 0, ..., р— 1. Поскольку ни одно из них не может встретиться дважды, остается единственный способ их размещения: каждое по одному разу. (Это соображение называют «принципом ящиков (или клеток)» Дирихле.) Итак, в строке t каждое из чисел по модулю р встречается точно один раз. Но тогда из сказанного выше следует, что деление на t однозначно определено.
Л вот любопытное приложение этого факта к знаменитым «числам Ферма». В 1640 г. Ферма высказал утверждение5, что все числа вида
22П+1
простые, однако отметил, что доказать это он не может. Первые числа такого вида 3, 5, 17, 257 и 65 537 действительно простые. В 1732 г. Эйлер показал, что Ферма ошибся: следующее число в его последовательности 232+1 делится на 641. Эйлер обнаружил это прямым вычислением. Теперь, когда ответ известен, можно прийти к нему более простым способом,
Заметим, что число 641 простое и что 641 = 24+54= = 1+5-27. В арифметике по модулю 641
27=-1/5,
так что
28s-2/5,
откуда
2з2=(_2/5)4=24/54^-1
(последнее получается, если воспользоваться равенством 641 =24 + 54). Следовательно, 232+1 делится на 641.
Две знаменитые теоремы
Сравнения применяются не только для вычислений. Они играют очень важную роль в теории чисел. В качестве иллюстрации я приведу здесь доказательства двух знаменитых теорем. Эти доказательства нетрудно понять, стоит только увидеть их, но, как сказал Э. Т. Белл, «... можно смело держать пари, что среди миллиона людей любых возрастов с нормальными умственными способностями не наберется и десяти таких, которые, зная математику лишь в объеме обычной средней школы, сумеют найти доказательство за разумное время, скажем за год6».
Если составить ряд степеней какого-нибудь числа по модулю 7, то обнаружится, что в нем все время повторяется одна и та же последовательность. Например, степени числа 2 равны
2°н=1, 23=1, 28=1, 91 = 9 94 = 9 97 =9 22=4; 25=4,’ 28=4,’... (mod 7);
здесь повторяется набор 1, 2, 4. В последовательности степеней числа 3 повторяется набор 1, 3, 2, 6, 4, 5, и лег
ко проверить, что подобный набор есть и для любого другого числа.
Ясно, что если какая-то степень оказалась равной 1, то дальше все начнет повторяться. Поскольку 36== 1, то 37= 31, 38=32 и т. д. В случае модуля 7 любое число, кроме 0, удовлетворяет сравнению
л6=1 (mod 6)
(хотя при некоторых значениях х единица получается и для меньших степеней).
Проделав вычисления, можно убедиться, что в случае mod 5 всякое отличное от нуля число удовлетворяет условию
x4==l (mod 5),
для mod 11
х10=1,
а для mod 13
х'М.
Я останавливаю внимание на простых модулях, поскольку здесь лучше видна закономерность. Итак, очень похоже на то, что для любого простого р и любого целого х, не сравнимого с 0 (mod р),
(mod р).
Поясним на примере модуля 7 один из способов доказательства этого утверждения. Отличные от 0 числа (mod 7) таковы:
1, 2, 3, 4, 5, 6.
Удвоив каждое из них, получим
2, 4, 6, 1, 3, 5,
т. е. те же числа в другом порядке. Значит, произведения 1-2-3-4-5-6; 2-4-6-1 -3-5
сравнимы по модулю 7. Но второе из них сравнимо также с произведением
(1 -2) (2-2) • (3-2) • (4-2) • (5-2) - (6-2) (mod 7), которое можно записать как
26 • (1 2 • 3 • 4 5 6) (mod 7).
Отсюда 1-2-3-4-5-6=26 • (1-2-3-4-5-6) (mod 7), и после деления получим
1=26 (mod 7) ,
То же самое произойдет, если утроить все числа:
3, 6, 2, 5, 1, 4;
аналогичные рассуждения покажут, что 1==36 (mod 7).
Теперь перейдем к общему случаю модуля р. Поскольку р простое, в строке х таблицы умножения по модулю р каждое число встречается ровно один раз. Поэтому числа
(1 -х), (2-х), ..., ((р-1) -х)
есть 1, ..., р—1, взятые в другом порядке. Перемножая их, получим
ХР-1 • (1 • 2 <... • (р— 1)) = 1 • 2 •... • (р— 1) (mod р);
деление обеих частей на 1 • 2 •... • (р — 1) дает хг-'sl (mod р), и теорема доказана.
При помощи этой теоремы можно, к примеру, сразу, не выполняя никакого деления, сказать, что число
7|8-1 = 1 628 413 597 910 448
делится на 19. В общем виде эта теорема широко применяется в исследованиях по теории чисел 1. Ее называют теоремой Ферма (не путать со знаменитой последней теоремой Ферма!8).
Вторая теорема относится больше к произведению
1-2..... (р-1),
которое встретилось в доказательстве теоремы Ферма, Можно ли вычислить его по модулю р?.
При р = 7 это есть произведение
1 • 2 • 3 • 4 • 5 • 6.
Переписав его в виде
Ь (2-4) • (3-5) -6, обнаружим, что оно сравнимо с
1’Ы. (-1),
т. е. с — 1. Мы специально собрали в пары те числа, которые дают в произведении 1.
То же самое можно проделать в случае модуля 11;
1• 2 • 3 • 4 • 5 • 6 • 7 • 8 9 • 10 =
= 1 • (2-6) • (3-4) • (5-9) - (7-8) • 10= = 1 • 1 • 1 • 1. 1 • (-1) = -1
или модуля 13:
1 • 2 • 3 4 • 5 • 6 • 7 • 8 • 9 10 11 • 12 =
= 1 • (2-7) • (3-9) • (4- 10) • (5-8) (6 - 11) -12 = = 1 . 1 . 1 . 1 . 1 . 1 . (-1) = -1.
В общем случае возьмем числа 1, 2, ,,р—1 и разобьем их на пары взаимно обратных, т. е. дающих в произведении 1. Тем самым мы избавимся от всех чисел, кроме тех, которые совпадают со своими обратными, т. е. удовлетворяют условию
х=1/х (mod р),
или
х2=1 (mod р),
или
х2 —1 = 0 (mod р),
откуда
(х—1)(х+1)=0 (mod р).
Таким образом, либо х=1, либо х= — 1. Поэтому можно написать.
1 -2-....(p-l)Sb (?.?).....(?•?)• (-1)^-1.
Мы доказали, что для любого простого р
1-2 •... • (р—1)е= — 1 (mod р)}
эта теорема известна под названием теоремы Вильсона.
Для составного числа пг теорема не верна. В самом деле, раз m составное, у него есть делитель d^m— 1. Он должен содержаться в произведении 1 • 2-...• (m— 1). Но тогда число 1 2 •... • (т— 1) +1 при делении на d даст остаток 1, а отсюда следует, что это число не делится на т.
Теоретически мы получили признак простых чисел. Чтобы узнать, простое или не простое данное число q, мы находим
1-2-...- (<7-1) + 1
и делим на q. Если делится без остатка, то q — простое, если получается остаток,—-составное. Так, число
1 • 2 - 3 • 4 - 5 - 6+ 1 =721
делится на 7, значит, 7 — простое. Число
1 -2-3-4-5+1 = 121
не делится на 6, значит, 6 — составное. Правда, даже для сравнительно небольшого числа 17 приходиться находить
число 1 • 2 ... • 164-1 =20 922 789 888 001 и затем делить его на 17. Поэтому такой критерий не имеет практической ценности даже при применении ЭВМ с очень большим быстродействием.
Однако он представляет собой замечательный теоретический результат, ибо с его помощью можно установить, простое заданное число или нет, даже не пытаясь искать его делители.
Глава 4
ЯЗЫК МНОЖЕСТВ
Почти каждая книжка по «современной математике» толкует о множествах и пестрит странными символами вроде С , s, J, П, 0. Не будет исключением и эта, хотя я и старался вводить как можно меньше символов. Такое нашествие множеств имеет свои причины. Дело в том, что теория множеств — это своего рода математический язык. Без него невозможно не только заниматься математикой, невозможно даже объяснить, о чем вообще идет речь. Это все равно, что изучать французскую литературу, совсем не зная французского языка. В остальной части книги мы не сумеем обойтись без языка теории множеств, поэтому и понадобилась эта глава.
Множество — это некоторый набор объектов; например, множество всех графств Англии, множество всех эпических поэм, множество всех рыжеволосых ирландцев. Объекты, принадлежащие множеству, называются его элементами. Так, «Потерянный рай» — это элемент множества всех эпических поэм, а Кент — элемент множества всех графств Англии. Если для первоначального ознакомления с теорией множеств удобно работать с конкретными множествами, элементы которых — реальные объекты, то в математике интерес представляют множества, состоящие из абстрактных математических объектов: множество всех окружностей на плоскости, множество точек на сфере, множество всех чисел.
Многие понятия теории множеств наглядно иллюстрируются при помощи несложных приспособлений. Достаточно иметь несколько маленьких предметов (карандаши, ластик, точилку, несколько бусинок, сахарного мышонка и т. д.). Эти предметы (или часть из них) будут
элементами множества; само множество будет состоять из выбранных предметов, помещенных в мешок (крайне важно иметь мешок). Чтобы узнать, является ли данный предмет элементом множества, нужно просто заглянуть в мешок и посмотреть, лежит он там или нет. По этой причине самый лучший мешок—полиэтиленовый! Для дальнейшего изложения он будет весьма полезен.
Мы будем строить алгебру множеств. Как и в обычной алгебре, множества и их элементы обозначаются буквами. Мы используем маленькие буквы для обозначения элементов, а большие — для обозначения множеств, однако строго придерживаться этого’правила невозможно, ибо множества сами могут стать элементами других множеств (вложите один мешок в другой). Если X — множество всех эпических поэм, а х — «Потерянный рай», то х является элементом X. Фраза «является элементом» повторяется столь часто, что удобно заменить ее каким-то символом. Общепринятым является символ СТаким образом,
х € X
означает, что «х является элементом X».
Множество считается известным, если мы знаем его элементы или в принципе можем их найти. Задать множество можно многими способами; простейший из них — перечислить его элементы. Так список избирателей определяет множество лиц, имеющих право голоса. Перечень элементов множества заключают обычно в фигурные скобки. Например, {1, 2, 3, 4} —это множество, элементами которого являются числа 1, 2, 3, 4 и только они; {весна, лето, осень, зима} — это множество времен года. На рис. 19 изображено множество {карандаш, бусинка, сахарный мышонок}; фигурные скобки играют здесь роль полиэтиленового мешка.
Два множества равны, если они состоят из одних и тех же элементов. В полиэтиленовый мешок мы можем положить два карандаша, но не можем дважды поло-
жить один и тот же карандаш (не вынув его предварительно оттуда). К сожалению, взятие в фигурные скобки
не создает такого чисто физического ограничения, и вполне можно написать что-нибудь вроде {1, 2, 3, 4, 4, 4}.
Буквально это означает множество, элементы которого 1, 2, 3, 4, 4 и 4. В книге про Винни-Пуха 2 есть место, где
Кролик перечисляет жителей Леса и Пух несколько раз повторяет: «И еще Иа, я про него чуть было не позабыл». И хотя об Иа упоминают несколько раз, в Лесу есть всего один Иа. Точно так же, хотя число 4 написано несколько раз, в нашем множестве всего одно чи-
Рис ело 4, т. е. это множество
равно {1, 2, 3, 4}. При использовании фигурных скобок подразумевается, что элементы, указанные более одного раза, входят в множест-
во один раз.
Далее, предметы в мешке никак не упорядочены, а фигурные скобки вводят искусственный порядок, поскольку мы читаем слева направо. Множество {1, 3, 2, 4} состоит из тех же самых элементов, что и {1, 2, 3, 4}, и, следовательно, это то же самое множество, т. е. порядок внутри фигурных скобок не имеет никакого значения.
Может возникнуть вопрос: что, если включить в множество два карандаша? Если это разные карандаши — пожалуйста, кладите их оба. Поскольку они разные, вам не придется класть какой-то предмет дважды, вы положите просто два сходных предмета. Если же это один и тот же карандаш, то у вас нет двух карандашей.
Эти соглашения в высшей степени разумны. В самом деле, если ваше имя дважды встретилось в списке избн-
рателей, разве это дает вам два голоса? И разве порядок в этом списке предполагает какие-нибудь привилегии?
В более общем случае символ
{все эпические поэмы}
означает множество всех эпических поэм. То же самое множество можно обозначить еще так:
{х | х — эпическая поэма}.
Вертикальную черту можно читать как «такой, что»; тогда множество всех х, таких, что х — эпическая поэма, совпадает с множеством всех эпических поэм, Множество
{п | п — целое число и 1^н^4} совпадает с множеством
{1, 2, 3, 4}.
Итак, вместо того чтобы перечислять все элементы множества, мы указываем свойство, в точности определяющее, какие элементы мы хотим в это множество включить. Если делать это аккуратно, заботясь о том, чтобы точно указать требуемое свойство, то этот способ ничуть не хуже предыдущего и, как правило, удобнее. Множества, содержащие бесконечно много элементов, например {все натуральные числа}, вообще невозможно задавать первым способом; то же относится к множествам с конечным, но достаточно большим числом элементов.
Слово «набор» наводит на нежелательные ассоциации. Математическое понятие множества допускает множества, состоящие из одного элемента, и даже множества, вообще не имеющие элементов, в то время как «набор», «совокупность», «коллекция» всегда подразумевает какое-то довольно большое количество предметов. Вы были бы, вероятно, разочарованы, если бы вас пригласили посмотреть коллекцию марок и оказалось бы, что она состоит всего из одной марки (а если бы ею оказалась
та самая, выпущенная в 1856 г. в Британской Гвиане черно-красная марка в один цент, только один экземпляр которой известен?).
Если мы задаем множество каким-то свойством, потом может оказаться, что этим свойством обладает лишь один объект, а то и вообще такого объекта нет. Но сразу это может быть не оче-видно, и глупо было бы \ л J иметь какие-то перемен-J'A / рЛ f чивые «множества», ко-
[ Г // I \ торые при ближайшем
\J ) { J \ рассмотрении могут не
J оказаться множествами.
Так, множество {п\п — х Iх* натуральное число, боль-
Рис. 20. пие 1 и такое, что уравне-
ние xn+yn=zn имеет решение в ненулевых целых числах} содержит по крайней мере один элемент, а именно 2, но есть ли у него еще элементы, никто не знает. Это очень трудная проблема теории чисел 3, уже более 300 лет остающаяся нерешенной. Является такое множество собственно множеством или нет, не должно зависеть от решения этой проблемы, а если она когда-нибудь будет решена, может оказаться, что 2 — единственный элемент. Поэтому нам придется
допустить множества, состоящие из одного элемента.
Такие множества не следует путать с самим этим элементом: х и {%} — не одно и то же. В этом легко убедиться при помощи аналогии с мешком (рис. 20). Кроме того, это подтверждается и таким соображением: {х} состоит ровно из одного элемента, а х может содержать сколько угодно элементов — ведь он сам может оказаться множеством!
Пустое множество
По тем же причинам, которые заставили нас признать множества из одного элемента, мы должны допустить и множества, не имеющие вообще ни одного элемента. Насколько мне известно, таковым является множество всех единорогов, обитающих в настоящее время в окрестностях Бексхилла.
Множество, не содержащее ни одного элемента, называется пустым. (Представьте себе пустой полиэтиленовый мешок.)
А теперь многие, наверное, удивятся] существует только одно пустое множество, т. е. все пустые множества равны между собой (полная демократия!). Вспомним, что два множества равны, если они состоят из одних и тех же элементов. Если они не равны, значит, они состоят не из одних и тех же элементов, т, е, в одном из них должен содержаться по крайней мере один элемент, которого нет во втором. В данном случае одно из множеств должно содержать элемент. Если они оба пусты, это невозможно, следовательно, ойи не являются неравными. Отсюда вытекает, что они равны.
Странно, не правда ли? Это рассуждение часто применяется в математике и не содержит ничего непонятного. Тривиальные идеи иногда трудно осознать. Мы думаем, что ищем что-то существенное, а на деле там ничего нет, и тогда кажется, что мы не нашли того, что искали. Любые два пустых множества равны потому, что нет элементов, по которым их можно было бы различить (ведь содержимое двух пустых мешков одинаково).
Но тогда получается, что сахарный мышонок, который тоже не имеет элементов, равен пустому множеству? Нет, не получается. Доказательство относится только к множествам. Вот если сахарный мышонок — это какое-то множество и если (что выглядит вполне правдоподоб-
ным) оно не имеет элементов, тогда оно равно пустому множеству.
Установив, что имеется одно-единственное пустое множество, можно ввести для него специальное обозначение. Сейчас, как правило, для этого используется символ 0 (знак диаметра) или 0 (перечеркнутый нуль).
Нельзя сказать, что пустое множество — это «ничто» или что оно не существует. Оно существует точно так же, как любое другое множество, не существуют его элементы.
Не следует путать его с 0, ибо 0 — число, а 0 — множество 4.
Пустое множество широко используется в математике. В частности, оно применяется для того, чтобы выразить в компактной форме отсутствие чего-либо. Пусть 17 — множество единорогов, обитающих в Бексхилле. Тогда равенство U=0 говорит нам о том, что в Бексхилле нет единорогов.
Подмножества
Нередко одно множество оказывается частью (не путать с элементом!) другого множества. Так, множество всех женщин составляет часть множества всех людей, а множество всех четных чисел — часть множества целых чисел. Слово «часть», как мы увидим ниже, не совсем удобно, и математики вынуждены были придумать для точного обозначения этого понятия новый термин.
Множество S называется подмножеством множества Т, если каждый элемент S является элементом Т. Так, элемент множества IV всех женщин — женщина, т. е. человек, а следовательно, элемент множества Н всех людей. Значит, W—подмножество множества Н. Для
обозначения этой ситуации используется специальный символ £= : запись5
W^H
означает, что W является подмножеством Н, или, как иногда говорят, W содержится в Н.
Воспользуемся снова полиэтиленовым мешком. Здесь все уже не совсем так просто, как в наших прежних примерах. Допустим, что S состоит из карандаша и ластика, а Т содержит тот же карандаш и ла
стик и вдобавок три бусин-рис 21. ки. Тогда прямая иллюстра-
ция, как на рис. 21, никуда не годится. В самом деле, по
этой картинке можно подумать, что у нас есть одно множество, элементами которого служат: 1) три бусинки; 2) множество, состоящее из карандаша и ластика.
Рис. 22 дает картинку получше, хотя для ее практического осуществления нужны «взаимопроникающие» мешки.
Из самого определения «подмножества» сразу вытекает несколько следствий. Всякое множество есть подмножество самого себя, ибо все его элементы являются
3 Я- Стюарт
65
его же элементами. Пустое множество является подмножеством любого множества, какое бы вы ни назвали. В этом можно убедиться опять при помощи примененного выше рассуждения. Если бы оно не было подмножеством какого-то заданного множества S, оно содержало бы некоторый элемент ; 0 < не принадлежащий S. Поскольку 0 не содержит элементов, это невозможно. (По этим двум причинам неудобно слово «часть»: получается, что часть может совпасть с целым, а может оказаться пустой.)
Вот еще приятное свойство подмножеств: подмножество подмножества само является подмножеством, т. е. если A s В и В £ С, то А <= С. Действительно, если каждый элемент А является элементом В, а каждый элемент В является элементом С, то каждый элемент А есть элемент С.
Когда в начале гл. 3 мы говорили о «системах» чисел, на самом деле речь шла о множествах и подмножествах. В дальнейшем мы будем пользоваться следующими стандартными обозначениями6 числовых множеств!
N — множество натуральных чисел 0, 1, 2, 3, ...|
Z — множество всех целых чисел ...—2, —1, О, 1,2, ...;
Q — множество рациональных чисел (вида plq, где р и q целые и ^у=0);
R — множество действительных чисел (представимых в виде десятичных дробей, не обязательно конечных и не обязательно периодических; чисел вроде J/2 или л);
С — множество комплексных чисел (о нем тоже следует здесь упомянуть, хотя дальше оно встречается редко).
Все эти множества фигурировали выше, где мы говорили о «системах», а «стройную схему», в которую они все укладываются, теперь можно представить в виде
N <= Z c= Q c= R <= c.
Отсюда по доказанному выше свойству получаем NeQ, Z s R и т. n.
Очень важно не путать символы и С . Соответствующие понятия имеют мало общего. Подмножества множества {1, 2, 3} — это множества 0 ,{1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3} и {1, 2, 3}; его элементы — это 1, 2 и 3. Кроме того, утверждение: если А С В и В£С, то А б С, пе имеет места7.
Объединения и пересечения
Множества можно комбинировать между собой и получать другие множества. Среди бесчисленного количества мыслимых способов комбинирования очень мало таких, которые оказались полезными, и самые замечательные из них — объединение и пересечение.
Объединением двух множеств S и Т называется множество, элементами которого являются элементы S и элементы Т. Это обозначается так:
SUT.
Например, если S={1, 3, 2, 9}, а 7={1, 7, 5, 2}, то SU^ = {К 3, 2, 9, 7, 5}.
Если
Р = {все женщины моложе 35 лет}, Q = {все кондукторы автобусов},
то Р J Q — множество всех людей, каждый из которых представляет собой либо женщину моложе 35 лет, либо кондуктора автобуса (либо и то, и другое).
Пересечением S{\T называется множество, состоящее из общих элементов множеств S и Т, т, е, элементов, при
надлежащих обоим этим множествам. В приведенных выше примерах
Sf]T = {l, 2},
Р П Q = {все женщины моложе 35 лет, работающие кондукторами автобуса}.
Рис. 23.
Рис. 25.
Рис. 24.
Для множеств S и Т на рис. 23 SIJT получится, если сложить все предметы в один мешок (рис. 24), a SC|T состоит из предметов, лежащих в обоих мешках (рис. 25).
Можно нарисовать мешки не сбоку, а сверху (рис. 26). Тогда SJT и SQT—множества объектов в заштрихованных областях на рис. 27.
Теперь можно забыть о содржимом мешков. Общая картина объединения и пересечения двух множеств S и Т выглядит так, как показано на рис. 28.
Такого рода диаграммы, на которых множества представлены в виде кругов и те области, где лежат нужные элементы, заштрихованы, называют диаграммами Венна по имени их изобретателя.
Операции (J и f] подчиняются некоторым общим законам, подобно тому как обстоит дело со сложением
Рис. 26.
SnT
Рис. 27.
и умножением чисел. Так, например, каковы бы ни были множества А и В, всегда
A (J В = В (J А,
ЛПВ = ВПЛ.
Действительно, A (J В состоит из всех элементов А и всех элементов В, а это все равно, что все элементы В и все элементы А. Если нарисовать диаграмму Венна, то на ней оба множества A U В и В U А изображаются областью, которая получится, если заштриховать оба круга, соот
ветствующие множествам А и В. Точно так же А П В и В А изображаются областью, общей для А и В.
Если А, В, С — три множества, то
(Л U В) U С = A U (В U С),
ИПВ)ПС = ЛП(ВПС).
Первое из этих равенств означает, что, когда мы объединяем элементы трех множеств, безразлично, в каком по-
SuT
SnT
Рис. 28.
рядке это делать; точно так же не играет никакой роли порядок и тогда, когда берутся элементы, общие для всех трех множеств. Можно нарисовать соответствующие диаграммы Венна. На этот раз понадобится три пересекающихся кружка. Я проиллюстрирую этот метод на примере другого закона.
Существует два закона, связывающие между собой операции J и П • Для любых трех множеств А, В, С
(Лий)ПС=(ЛПС)и(ВПС),
И пв)ис = (xuc)n(B'uQ.
Диаграммы Венна, демонстрирующие первое равенство, показаны на рис. 29.
Есть и другой способ проиллюстрировать теоретикомножественные законы — при помощи специальных таблиц8. Элемент содержится в S(JT, если он входит в S, или в Т, или в оба эти множества. Он содержится в
Рис. 29.
SftT, если входит и в 5, и в ву I (от in), если элемент и букву О (от out), если не ставить такие таблицы:
Т. Будем писать бук-входит в множество, входит. Тогда можно со-
st । s и т
I I I
I 0 I
0 I I
О 0 0
S Т | S n 7
I I I
I О О
О I о
0 0 о
(Скажем, третья строка таблицы S (J Т читается так: если элемент не входит в S, но входит в Т, он входит в SU71.)
Чтобы доказать второй закон, связывающий U и f] • (ЛПВ)иС -=(ЛиС)П(ВиС), рассмотрим восемь различных возможных вариантов вхождений элемента в Л, В и С и составим таблицы для левой и правой частей написанного равенства. Получим
А в с лрв (Лрв)ис
I I I I I
I I О I I
1 О I О I
I О О О О
О I I О I
О I О О О
О О I О I
О О О О О
А в с | (Лис) (BUQ (ЛиС)П(ВиС)
I I I I I I
I I О I I I
I О I I I I
I О О I О О
О I I I I I
О I О О I О
О О I I I I
О О О О О О
Заметим, что два последних столбца совпадают. Это означает, что если некоторый элемент входит в (Л П В) JC, то он входит ив (Л UC) П (BUQ, а если не входит в (ЛПВ)иС, то не входит и в (Л J Q П (SUQ- Следовательно, эти множества совпадают, и равенство доказано.
На диаграммах Венна (если вы поняли, как они представляют множества общего вида) можно увидеть, почему выполняется то или иное тождество, а таблицы вхождений позволяют доказать его.
Дополнения
Еще один полезный метод комбинирования двух множеств— взятие их разности А —В, которая состоит из элементов, лежащих в А, но не лежащих в В. Диаграмма Венна для разности показана на рис. 30. Соответствующая таблица принадлежности выглядит так;
А В
А—В
J I
I О О I о о
о
I
о о
Рис. 30.
Рис. 31.
Дополнением S' некоторого множества S называется множество всех элементов, не лежащих в S. Если обозначить через V множество всех на свете элементов — всего, что могло бы быть элементом какого-то множества, то дополнение S' окажется равным V—S. Таким об
разом, S' изображается заштрихованной областью на рис. 31.
Как-то страшновато представить себе это множество V! Так много всего там содержится! Все числа, все собаки, кошки, люди, книги, все возможные понятия, все множества. А так как и само V может быть элементом какого-то множества, то и V содержится в V. Во многих отношениях V слишком велико. Так, если разговор идет о собаках и кому-то захотелось высказаться обо всех, кроме овчарок, то не стоит беспокоиться о верблюдах.
В каждой конкретной задаче множества, имеющие к ней отношение, лежат обычно в некотором универсальном множестве, уже не являющемся столь необъятным. Когда мы говорим о собаках, разумно считать таким универсальным множеством множество всех собак; это удобнее, чем рассматривать множество всех животных. Для выбора универсального множества нет какого-то раз и навсегда установленного способа. Но если выбор сделан, этим множеством можно пользоваться вместо V. Тогда дополнение S7 состоит из тех элементов универсала ного множества, которые не лежат в S, т. е. тех элементов рассматриваемого типа, которые не вошли в S. Если универсальное множество указано, никаких недоразумений не возникнет.
Когда берутся дополнения множеств, отношения включения между ними меняются на противоположные: если S^T, то Т's S'. В самом деле, в Т содержится больше элементов, чем в S, значит, элементов, которые не входят в Т, меньше, чем тех, которые не входят в S. На диаграмме Венна это сразу видно (рис. 32).
Взятие дополнений тесно связано с отрицанием утверждений. Поэтому с помощью теории множеств удается решить некоторые логические задачи. Рассмотрим такой набор утверждений:
1. Животные, которых не видно в темноте, серы.
2. Соседи не любят тех, кто не дает им спать.
3. Кто крепко спит, громко храпит.
4. Соседи любят животных, которых видно в темноте.
5. Все слоны крепко спят.
6. Кто громко храпит, не дает спать соседям.
Рис 32.
Эти утверждения можно перевести на язык теории множеств, если ввести следующие обозначения:
А = множество тех, кто будит соседей,
В = множество тех, кто крепко спит,
С=множество тех, кто громко храпит,
D = множество животных, которых видно в темноте,
Е = множество слонов,
/^множество тех, кого любят соседи,
G = множество тех, кто серы.
Тогда в утверждении 1) говорится, что не лежащее в D содержится в G, т. е.
1. D'<= G.
Остальные утверждения принимают такой вид:
2. A^F',
3. В<=С,
4. DsF,
5. Е<=В,
6. С е А.
Взяв дополнения D и F, из (4) можно вывести, что F'^ Е D'. А теперь соединим все утверждения в цепочку;
EczB<=C<=A<=F' sD’ sG.
Так как подмножество подмножества само является подмножеством, из этой цепочки получим, что Е s G, т. е. все слоны серы.
Связь между теорией множеств и логикой гораздо шире. Исследованием этой связи впервые занимался Джордж Буль (1815—1864), работы которого вылились в теорию, называемую ныне булевой алгеброй9.
При помощи дополнений можно объяснить одно явление, на которое вы, возможно, уже обратили внимание. Различные теоретико-множественные тождества, или «законы», встречаются как бы парами. Если взять какой-нибудь закон, содержащий знаки (J и П, и заменить все [J на П, а все f] на (J, получится другой закон. Упомянутые выше законы, в которых речь шла об объединениях и пересечениях, были выписаны как раз такими парами.
Таким образом, наша работа по доказательству теорем сокращается вдвое: доказав одну, мы одновременно доказываем и вторую.
Это отнюдь не совпадение, а следствие двух других тождеств, называемых законами де Моргана: для любых двух множеств А и В
(A U В)' = А' П В',
(дпв)' = л'и в'.
И опять пара. Далее, все, что не не лежит в S, лежит в S, и наоборот. Поэтому (S')' = S. Следовательно, можно переписать наши тождества в виде
лив = Ц'пв/)'.
ЛПВ=(Л'иву.
Возьмем теперь любой теоретико-множественный закон, скажем,
(лие)пс = ипс)и(впс).
Поскольку это справедливо для любого набора множеств А, В, С, то оно справедливо и для их дополнений А', В', С':
(А'I) В') ПС' = (А' ПС') U (В' ПС').
Теперь возьмем дополнения с обеих частей последнего равенства:
((Л' U В') 0 С')' = ((Л' П С') U (В' 0 С'))'
и упростим полученные выражения, пользуясь законами де Моргана в форме (*). Левая часть примет вид
(Л'J ВТ U С,
и окончательно
(лпв)ис
(нужно вспомнить, что (А')' = А, (В')' — В, (С'У = С). Правая часть примет вид
(А' П СТ П (В' (}С'У
или
(ЛиС)П(В11С).
Итак, мы показали, что
(ЛПВ)иС=(ЛиС)П(ВиС),
т. е. доказали закон, в котором знаки (J и (] поменялись местами по сравнению с исходным законом. Тот же метод применим к любому другому закону, содержащему только объединения и пересечения.
Геометрия как теория множеств
Евклид пытался дать определения некоторых основных геометрических объектов, таких, как «точка» или «прямая». Например, точка — это нечто, имеющее опре
деленное положение, но не имеющее размеров. Однако если проанализировать понятие «положение», окажется, что дать его определение ничуть не легче, чем дать определение точки, и два эти определения кругами ходят друг за другом.
Ведь всякое определение должно на чем-нибудь основываться. В словаре английского языка the определяется как the definite article, и если вы не знаете, что такое the, это вам мало поможет 10. Евклид пытался соотнести своим идеализированным точкам и линиям объекты физического мира, но, к сожалению, ничто в реальном мире не ведет себя точно так, как его идеальные объекты. Даже совсем маленькие элементарные частицы имеют какие-то размеры. (И если права квантовая теория, то на очень маленьких расстояниях само понятие размера становится туманным: физически невозможно измерять расстояния, меньшие, скажем, одной триллионной сантиметра. Это потребовало бы такой огромной энергии, что вы бы разнесли на куски то, что измеряли.) Наилучший способ обойти это затруднение — считать понятия точки и прямой неопределимыми исходными понятиями, а затем сформулировать их свойства. Такова современная версия аксиоматического метода, о котором мы еще будем говорить в гл. 8.
Очень привлекательно понятие плоскости, составленной из отдельных точек. Другой способ сделать эти понятия логически ясными — определить их при помощи уже известных математических объектов. Нельзя определить нечто, являющееся плоскостью в физическом смысле, однако можно определить объект, который ведет себя так, как должна была бы вести себя идеализированная евклидова плоскость.
Как мы уже отмечали в гл. 2, метод координат позволяет сопоставить каждой точке плоскости единственную пару (х, у) координат. Таким образом, таинственный объект «точка» становится просто «парой действи
тельных чисел», и эти последние ведут себя именно так, как требуется от таинственных точек. Если мы не хотим удариться в мистику, мы можем по определению считать точкой пару (х, у) действительных чисел. А раз плоскость состоит из всевозможных точек, мы можем определить ее как множество всех пар действительных чисел.
А как быть с прямыми? И здесь на помощь приходит метод координат. Оказывается, всякая прямая состоит из таких точек (х, у), которые удовлетворяют уравнению вида
ах+Ьу=с
с некоторыми фиксированными а, Ь, с. Например, урав-нение 1 • х+ ( — 1) • у=0 определяет диагональ, проходящую через начало координат из положения снизу слева в направлении вправо вверх. Значит, прямую можно определить как множество всех пар (х, у), удовлетворяющих какому-нибудь уравнению указанного вида. Подобным же образом для определения геометрического понятия окружности можно воспользоваться задающим ее уравнением.
Точка лежит на прямой, если она является элементом множества точек этой прямой. Точка лежит на двух прямых L и М, если она является элементом множества L и элементом множества М, т. е. элементом их пересечения L Q М. Значит, геометрическое пересечение соответствует теоретико-множественному.
Продолжая рассуждать таким образом и черпая вдохновение из источника, который открывает метод координат, можно сформулировать всю евклидову геометрию как часть теории множеств. Задавшись определенным набором требований к поведению геометрических объектов, можно построить чисто математическую теорию. И теперь, вместо того чтобы погрузиться в бездну метафизических рассуждений о «реальной» геометрии, можно сказать; вот некоторая математическая теория. Она опе-
рирует объектами, которые я называю «точками» и «прямыми». Я думаю, что примерно так в реальном мире ведут себя очень маленькие точки и очень тоненькие прямые. После этого, чтобы узнать, так это или нет, можно делать эксперименты. И даже если при помощи очень точных измерений будет установлено, что вы ошибались, у вас все-таки останется красивая теория.
В
(ДХ)
(Д,$) ca.fiCoJ)
ЛхВ
Рис. 33.
Теперь я хочу обобщить понятие пары чисел. Важно отметить, что те пары, которые мы рассматривали выше, упорядочены., т. е. пара (1, 3) — это не то же самое, что пара (3, 1). Отметим их на миллиметровке. (Здесь дело обстоит не так, как при рассмотрении множеств {1, 3} и {3, 1}. Эти множества, как мы выше условились, совпадают.) Для любых двух заданных множеств А и В мы можем определить11 упорядоченные пары (а, Ь), где а £А и Ь£В. «Упорядоченные» .означает, что
(а, Ь) = (с, d)
тогда и только тогда, когда а = с и b = d. Затем определим декартово произведение А х В множеств А и В как множество всех упорядоченных пар (а, Ь), где а б А
и b £ В. (Оно называется так в честь Декарта, который придумал метод координат.)
Допустим, что А = {Л, □, Q) и В={£,$) . Множество А х В можно изобразить, как на рис. 33.
Заметим, что АхВ не совпадает с ВхА, ибо последнее содержит, например, элемент (£, д) , который не входит в Ах В.
Вспомним обозначение R для множества действительных чисел; в свете сказанного выше плоскость — это множество RXR. Принято пользоваться более простым обозначением R2. Тогда евклидову геометрию можно представлять себе как изучение подмножеств плоскости R2.
Глэвэ S
ЧТО ТАКОЕ ФУНКЦИЯ!
В элементарной математике мы встречаемся с разными объектами, которые называют словом «функция»: логарифмическая функция, тригонометрическая функция, показательная функция. Эти объекты характеризуются одним общим свойством: для каждого числа х функция принимает некоторое определенное значение, а именно log х, sin х, cos х, tg x, ex и т. д.
Кроме того, нас учат строить графики функций: над точкой х отмечать значение функции в ней. На рис. 34 показаны графики четырех общеизвестных функций.
Рис. 34.
По традиции х называют переменной (или аргументом), и функция сопоставляет каждому значению переменной х некоторое значение у. Если функция обозначается каким-то символом, например f, то мы пишем y=f(x).
Если под f понимается функция log, то y = logx, если f — функция sin, то г/ = sin х.
Ни х, ни у не являются функциями, и очень трудно точно сказать, что они собой представляют. Не является функцией и f(x), ибо это есть значение функции в х. Функция — это f. «Переменные» х и у существуют только затем, чтобы сообщить нам, что делает f. Так, например, функция «возведения в квадрат» принимает значение х1 2 для любого заданного значения х. Это обстоятельство можно кратко выразить формулой
У=х2,
однако если нам заранее не скажут, то мы не будем знать, что это за формула — определение функции или уравнение, которое нужно решить.
О формулах
Большинство функций в школьной математике выражаются какой-нибудь формулой: у = х2, у = Д/гх, у = |х| или посложнее
1 + X
Отсюда берет начало заблуждение, что математика — это формулы, а смысл жизни математика — выводить все более сложные формулы и применять их для все более трудных вычислений. Это совсем не так. Более того, бездумная манипуляция формулами не раз приводила к разным нелепостям. Я приведу один пример из дифферен-
циального исчисления, но пусть не пугается тот, кто не знает, что это такое,— он тоже сможет уловить суть дела.
Когда-то я давал своим ученикам такую задачу: продифференцировать функцию
z/ = log (log (sinx)).
Если, не думая, следовать стандартным правилам дифференцирования, в ответе получится
1 1
• • COS X log (sin х)--sin х
или
ctg х log (sin x)
Большинство учеников были очень довольны таким ответом. Когда же я просил их нарисовать график функции log (log (sinx)), они пугались, поскольку тут выяснялось, что формула не имеет смысла. В самом деле, sin х при любом х не превосходит 1 и, значит, log (sin х) ^0, а так как логарифм отрицательного числа не определен, то log (log (sin х)) не существует; формула оказывается с подвохом.
С другой стороны, полученная «производная» ctg x/Iog (sin х) имеет смысл для тех значений х, для которых sin х>0.
Некоторым, может, и нравится жить в мире, где из несуществующих функций получаются существующие производные, но я не из их числа.
Любая данная формула может не иметь смысла для некоторых значений переменной х. Так, 1/х не определено при х=0, log х не определен при х^О, a tg х не определен при значениях х, равных нечетным кратным 90°. Для более сложной формулы условия, при которых она не имеет смысла, могут оказаться более хитрыми. Например, выражение
log(x2— 1)
x'1 — 5x + 6
не определено, когда — l^x^l, или х=2, или х=3.
К тому же есть много полезных функций, которые нелегко задать формулами. (И тут возникает еще вопрос: какими формулами? Скажем, для функции «синус» при-
шлось придумать специальный символ sin.) Широко применяются в математике такие функции, как, например, «целая часть х», обозначаемая [х]:
[х] = наибольшее целое ^х,
или функция, изображенная на рис. 35:
при х < — 1,
при — 1 ^х 1,
при 1 < х.
В теории рядов Фурье встречаются функции наподобие квадратной волны (рис. 36).
Математики долго спорили, считать ее функцией или нет. Она не похожа на привычные функции, и для нее,
как будто бы, нет подходящей формулы. Положение ухудшилось, когда удалось доказать, что бесконечный ряд
sin х+ -o-sin Зх+ sin 5х+... о о
можно просуммировать, и его сумма будет как раз такой квадратной волной. Подумать только, как могли такие приятные и понятные тригонометрические функции породить это нелепое угловатое создание!
Чтобы уладить этот спор, потребовалось больше ста лет. Отчасти это было вызвано тем, что проблема: «Функция это или нет?» — переплеталась с другими подобными проблемами, например: «Что такое бесконечный ряд?» Однако главная причина состояла в том, что каждый математик по-своему представлял себе функции и не соглашался с другими.
Белее общие функции
Мы уже видели, что функция f не обязательно определена при всех значениях переменной х. Если значение f(x) задается формулой, эта формула при некоторых х может не иметь смысла.
Значения х, при которых функция определена, образуют подмножество множества R действительных чисел. Это подмножество называется областью определения функции f; оно сообщает нам, к каким значениям х можно применять функцию f.
Из всех свойств, общих приведенным выше примерам функций, выделим одно, особенно важное: каждому элементу х области определения функции f сопоставлено единственное значение f (х).
Кроме области определения, с каждой функцией связано еще одно множество — область значений. Оно состоит из всех значений, которые функция принимает на
элементах своей области определения. Так, область значений функции sin состоит из всех действительных чисел от —1 до +1, а областью значений функции «возведения в квадрат» является множество всех неотрицательных действительных чисел.
Область значений даже простой функции может оказаться очень сложной. Например, функция f, определенная на множестве положительных целых чисел формулой
/ (л) = УхГ
(положительный квадратный корень), имеет в качестве области значений множество всех квадратных корней из факториалов. Трудно придумать более «удобное» описание множества, не правда ли?
По этой причине нас не будет особенно интересовать точная область значений заданной функции. Часто важнее знать, куда попадают эти значения, т. е. уметь назвать какое-нибудь удобное множество Т, в котором они все содержатся. В таком случае мы будем говорить, что f есть функция из области определения D в множество Т.
Итак, понятие функции состоит их трех неотъемлемых частей:
1) области определения D;
2) множества Т, содержащего область значений;
3) правила, которое для каждого х £ D задает единственный элемент f (х) С Г.
Суть дела изложена в пункте 3. Важно, что f(x) определено однозначно, так что с ним не связано никакой неопределенности. Взятие квадратного корня не определяет функции, пока не сказано, какой берется корень — положительный или отрицательный. Важно также, что f(x) определено для каждого х из D. Знание области определения говорит нам о том, где безопасно применять функцию f В то же время необязательно знать точную область значений f: часто ее трудно описать, а мы хотим пользоваться функцией f, не занимаясь подобными проб
лемами. Поэтому нам предоставлена возможность выбирать Т любым удобным способом.
Осталось еще одно слово в пункте 3, которое требует пояснения: «правило». Пока будем считать, что все мы знаем, что такое «правило»: некий способ получить f(x) для заданного конкретного х. К этому нужно добавить следующее: достаточно, чтобы f(x) в принципе можно было вычислить по х. Практически такое вычисление может оказаться невыполнимым: либо слишком трудоемким, требующим слишком много времени, либо связанным с решением какой-то очень трудной задачи.
До сих пор область определения и область значений были у нас множествами действительных чисел. Однако понятие функции в смысле 1, 2 и 3 пригодно для любых множеств D и Т. Более того, правила, предусмотренные в пункте 3, совершенно естественно проявляются во многих ситуациях, когда D или Т не являются множествами действительных чисел. Это замечание весьма важно для всего последующего, поэтому я приведу несколько примеров.
1. Пусть D—множество всех окружностей, а Т — множество действительных чисел. Для каждой окружности х положим
f(x)= радиус х.
2. Пусть D — множество положительных целых чисел, а Т включает в себя все множества, составленные из простых чисел. Для любого х € D положим
f(x) = множество простых делителей X.
3. Пусть D — некоторое множество на плоскости, а Т — вся плоскость (подразумевается множество R2). Для х £ D положим
Дх)=точка, лежащая на 5 см вправо от х.
4. Пусть D — множество всех функций, a Т — множество всех множеств. Для любой функции х положим
f(x) = область определения х.
В каждом из этих примеров указано лишенное двусмысленности правило, по которому определяется f(x). Особенно интересен пример 3. В гл. 2 мы определили преобразование Т:
Т(х, у)= (х+5, у).
То же самое правило определяет функцию f в примере 3: по существу между Т и f нет никакой разницы.
Современное понятие функции сформулировано так, что оно подходит ко всем этим примерам. Отныне функцией будем считать все, что удовлетворяет условиям 1, 2 и 3, где D и Т могут быть множествами вполне общего вида. Наши прежние функции относились к специальному типу функций действительного переменного — их области определения и значений принадлежат множеству действительных чисел.
Функция [, для которой f (х, у) = (х+5, у), зависит от двух переменных. Таким образом, функции двух переменных, известные из анализа, тоже подходят под наше общее определение. Для них областью определения служит множество пар (х, у) действительных чисел, т. е. подмножество из R2.
В связи с такой «всеохватностыо» понятие функции служит серьезным претендентом на роль самого важного понятия в современной математике. По мере нашего продвижения вперед понятие функции будет снова и снова появляться перед нами в своих разнообразных обличьях, поэтому стоит остановиться на некоторых относящихся к функциям общих понятиях.
Сзойстза функций
Если область определения и область значений функции не являются подмножествами R, то график такой функции нарисовать невозможно. Да и вообще график не
слишком помогает при работе с нашим обобщенным понятием функции. Лучше представлять себе функции так, как показано на рис. 37. Стрелки на рисунке соответствуют правилу, задающему Не-
общепринятое обозначение, отражающее тот факт, что f — функция из D в Т, таково:
/: D->T,
и здесь стрелка используется в том же качестве.
На рис. 37 мы видим, что в Т есть элемент, на который не указывает ни одна стрелка. Это свидетельствует о том, что область значений f не заполняет все Т. Если область значений f совпадает с Т, то говорят, что f — функция из D на Т. Такую функцию называют также сюръективной (или сюръекцией). На рисунке в таком случае к каждому элементу Т ведет хотя бы одна стрелка (рис. 38),
При этом к некоторым элементам Т могут вести несколько стрелок. Если же к любому элементу Т ведет не более одной стрелки, то f называется инъективной (или инъекцией). Инъективные функции не обязательно сюръективны (стрелки ведут не ко всем элементам Т, как на рис. 39),
Рис. 39.
Если функция f: D->T одновременно инъективна и сюръективна, то стрелки соединяют по два элементы D и Т. При этом выполняются следующие условия. Никакие два элемента из D не соединяются с одним и тем же элементом Т, ибо / инъективна. Никакие два элемента из Т не соединяются с одним и тем же элементом D по условию 3 определения функции (из-за требования единственности). Каждый элемент из D попадает в такую пару, поскольку D •—область определения. Наконец, каждый элемент из Т тоже участвует в одной из пар, ибо f сюръективна. Хотя это и не очевидно из наших обозначений, роли D и Т совершенно одинаковы, и если повернуть все стрелки вспять, получится другая функция g: T->D, которая тоже инъективна и сюръективна (рис. 40).
Функции, допускающие такое обращение, будут играть большую роль в некоторых наших дальнейших исследованиях. Их называют биекциями или взаимно однозначными соответствиями.
Ничто не мешает нам попробовать повернуть все стрелки обратно и в том случае, когда f не биективна. Однако при этом функция не получится. Если f не инъек-тивна, то от некоторого элемента из Т начнутся две стрелки, и «обращенная» функция не будет однозначно определенной, если же f не сюръективна, то в Т найдутся элементы, в которых она вообще не определена.
Рис. 40.
В гл. 2 мы рассматривали композицию преобразований F и G: новое преобразование FG, состоящее в том, что сначала выполняется G, а затем F. Но преобразования — это разновидность функций. Нельзя ли тем же способом комбинировать функции?
Возьмем две функции f и g и попробуем определить функцию fg. Как и в случае преобразований, мы хотим, чтобы
fg(x)=f(g(x)).
Эта формула имеет смысл, если выполняются несколько условий. Во-первых, чтобы было определено g(x), 1. х должно лежать в области определения g.
Во-вторых, чтобы можно было образовать f(g(x)), 2. g (х) должно лежать в области определения /. Допустим, что /: А -> В и g: С D. В силу условия (1)
Рис. 41.
самое большее, на что можно надеяться, —это что fg имеет область определения С. Чтобы fg была определена на всем С, для всех х € С должно выполняться условие (2). Иными словами, область значений функции g должна лежать в области определения А функции /. Если это так, то fg, определенная написанной выше формулой, будет функцией из С в В (рис. 41).
Итак, функция fg реализует идею: «применяй g, затем применяй f». Если у нас есть три функции f, g и h и их области определения и области значений нужным образом соответствуют друг другу, мы можем применять по порядку все три: сначала h, затем g, затем f. При этом можно двумя способами комбинировать их в пары: применить h, а затем fg либо применить gh и затем f, что соответствует выражениям
(fg)h и f(gh).
К счастью, результат не зависит от выбранного способа (рис. 42). Проверим это:
(fg)h(x) = (fg) (h(x)) = f(g(h(x))), f(gh) (x)4(Sh(x)4(g(h(x))).
Итак, всегда
(fg)h^f(gh),
Будем говорить, что операция композиции функций удовлетворяет закону ассоциативности.
________g/t Выше было сказано, LJ— . 5»Z-A что f, g н h можно комби-
\ \ нировать, при условии
х^£^ / \ что их области определе-
^xV^, уГ ния и области значений
\ нужным образом соответ-
/8 х. \ ствуют друг другу. Легко
/ понять, что это означает:
Q область значений h долж-fg на быть подмножеством
рис 42 области определения g, а
область значений g —• подмножеством области определения f, Вернемся к нашей «незаконной» формуле
log (log (sin х)).
Она отвечает композиции функций sin, log и снова log. Положив /i = sin и f"=g = log, получим log(log(sin х)) = ^fgh(x).
Область определения синуса —• все множество R, а область значений — множество действительных чисел от — 1 до +1. Область определения логарифма — множество положительных действительных чисел, его область значений— все множество R. Таким образом, условия позволяющие составлять композицию функций, нарушаются сразу в нескольких местах: область значений синуса не содержится в области определения логарифма, а область значений логарифма не содержится в его области определения. Не удивительно, что формула бессмысленна!
Наконец, вернемся к идее обращения стрелок и придадим ей строгую математическую форму.
На любом множестве D определена функция, называемая тождественной. Она обозначается 1D, имеет область определения D, область значений D и задается формулой
1 £> (х) = х для всех х б D.
Ее действие состоит в том, что она оставляет все на своих местах. Много ли проку от такой функции? Конечно, это не слишком сложная функция. Но она нам очень пригодится именно тогда, когда мы захотим выразить то, что какая-то композиция функций оставляет все на своих местах.
Выше мы рассмотрели биекцию /: D-*-T. Обратив все стрелки, мы получили другую функцию g: T->D. Если выполнить сначала g, а затем /, то все останется, как было: каждый элемент «пропутешествует» по одной и той же стрелке туда и обратно и вернется на свое прежнее место. Этот факт и выражается формулой
fg= It-
Точно так же (*)
Два этих равенства означают, что fug получаются одна из другой обращением стрелок. В этом случае f называют обратной функцией Kg (a g — обратной к f). Легко показать, что обратная функция единственна: имеется только один способ обращения стрелок.
Выводы
Эта глава носила несколько учебный характер. Перечислим основные моменты, которые важно помнить.
Функция определена на некотором множестве.
Она принимает значения в некотором множестве. Она задана, если известно правило, позволяющее
найти ее значение на каждом элементе, причем единственным образом.
Биекции, или взаимно однозначные соответствия,— это те и только те функции, для которых существуют обратные.
Я не стал распространяться здесь по поводу слова «правило». Более изощренное теоретико-множественное определение функции помещено в примечаниях *, ибо оно представляет интерес лишь с чисто формальной точки зрения.
Глава 6
ОСНОВЫ АБСТРАКТНОЙ АЛГЕБРЫ
С самого начала изучения алгебры возникает потребность упрощать выражения типа 2x4-(у—х). Постепенно приобретаются навыки в такого рода вычислениях, и вам уже достаточно взглянуть на это выражение, чтобы, не задумываясь, написать х+у.
С привычкой приходит пренебрежение. Вы забываете, как много трудных этапов пришлось пройти, как много сложных идей потребовалось воспринять, прежде чем вы обрели эту легкость. Если попытаться выписать подробно все шаги, необходимые для упрощения выражения 2x4- (у—х), их окажется порядочно.
Вот как я упрощаю это выражение (со всеми подробностями) :
2х 4- (у — х) = 2х 4- (у + (— х)) (1) = 2х 4- ((- х) +у) (2) = (2х 4- (—х)) 4- У (3) = (2х 4-(—1)х) 4-у (4) -(2 + (-1))х4-«/ (5) = 1-х 4- У (6)
= х 4 у. (7)
(1) и (4) —второстепенные шаги, состоящие в использовании определений элементов ( —х) и (у—х), а шаг (6) — это простая арифметика. Но каждый из остальных шагов использует справедливость некоторых общих арифметических законов (вероятно, их было бы лучше назвать алгебраическими). На шаге (2) я предполагаю, что а + Ь = Ь + а. На шаге (3) использую закон, согласно которому а+(Ь + с) — (а + Ь)+ с, на шаге (5) —правило ах + Ьх— (а + Ь)х, а на шаге (7) —-правило 1 -х = х.
Мы можем перечислить самые важные из этих законов, оставляя пока в стороне законы, связанные с делением:
(1) закон ассоциативности сложения:
(а + b) +с=а+ (Ь + с)-,
(2) закон коммутативности сложения: a + b = b + a;
(3) существование нуля:
существует число 0, такое, что a+0=a=0+fl для любого числа а;
(4) существование обратного по сложению:
для любого числа а найдется число —а, такое, что а+(-а) =0= ( — а) +а-
(5) закон ассоциативности умножения:
(ab)c = a(bc)\
(6) закон коммутативности умножения: ab = ba-t
(7) существование единицы:
существует число 1, такое, что 1о = а1 = с для любого числа а;
(8) законы дистрибутивности:
a(b + c) =ab+ac, (a + b)c=ac + bc.
Такое обилие законов не усложняет алгебру. На самом деле, чем больше законов, тем лучше, потому что у нас больше способов упрощать выражения.
На справедливости этих законов основаны даже некоторые из наших алгебраических обозначений, Мы можем, не опасаясь двусмысленности, писать
а -|- b -|- с
лишь потому, что выполняется закон ассоциативности. Большую часть элементарной алгебры составляет доказательство различных формул с помощью этих законов (хотя она не всегда предстает перед нами в этом свете), Формулу
(х+у)2=х2+2ху+у2
можно вывести следующим образом. Отметим сначала, что для любого числа с мы определяем а2 как а • а, а 2а — как а + а. Далее, а + Ь + с — это сокращенная запись для (а + b) +с. Теперь сам процесс вычисления:
(обозначение) (закон 8) (закон 8)
(обозначение) (закон 6) (закон 1) (закон 1)
(обозначение) (обозначение)
(х+у)2 = (л'+у) (х+у)
= (х(х+у)) + (у(х+у)) = (хх+ху) + (ух+уу) = (х2+ху) + (tjx+y2) = (х2+ху)+)ху+у2) = ((х2+ху) +ху) +у2 = (х2 + (ху + ху)) +у2 = (х2+2ху) +у2 =х2 + 2ху+у2
Приложив чуть больше усилий, мы могли бы доказать, что обычные формулы верны и для (х+у)3, (х+у)4, и даже вывести формулу бинома (для целых показателей) — и все это лишь с помощью законов (1) — (8),
Кольца и поля
Обычные числовые системы (Z, Q и R) —это еще не все системы, в которых выполняются законы (1) — (8). Они также, например, справедливы (хотя я пока не буду приводить доказательство) для целых чисел по модулю 6. Рассмотрим несколько выражений:
(1+4)+3=5 + 3=2= 1+ 7= 1 + (4 + 3), 2-5=4 = 5-2,
1.4 = 4 = 4- 1,
3(2 + 5) =3- 1 = 3=0 + 3= (3-2) + (3-5).
Как следствие для целых чисел по модулю 6 справедлива формула (х+у)2 = х2 + 2ху+у2 (ведь для ее вывода использовались лишь правила (1)- (8)).
В числе 6 нет ничего особенного. Целые числа по модулю 2, 3, 4, 5, 6, 7, наконец, по модулю п для произвольного п удовлетворяют законам (1) — (8). И для всех этих систем справедлива формула (х+у)2~ = х2 + 2ху+у2, причем с тем же доказательством.
Математики в глубине души — лентяи. Труд, затраченный на доказательство данной формулы в каждой из систем целых чисел по модулю 2, по модулю 3, по модулю 4, по модулю 5, ..., кажется неоправданно большим по сравнению с результатами, особенно, если для всех случаев годится одно и то же доказательство. Почему бы не сказать просто, что это доказательство проходит во всех системах, удовлетворяющих требованиям (1) — (8)? А чтобы еще прояснить ситуацию, почему бы как-нибудь не назвать такие системы, и тогда не надо будет перечислять каждый раз все эти восемь правил.
Общепринятое название для таких систем —• коммутативное кольцо с единицей — термин несколько громоздкий. Кольцо — это множество S с двумя определенными на нем операциями + и •, такими, что если s и t лежат в S, то $ + / и s • t тоже лежат в S, и выполняются законы (1) — (5) и (8). Дальше мы будем писать st вместо s • t. Кольцо называется коммутативным, если выполняется еще закон (6). Оно обладает единицей, если выполняется закон (7). Наиболее короткий термин «кольцо» используется для объектов, с которыми мы сталкиваемся чаще всего. Но в этой книге некоммутативные кольца встречаться не будут, поскольку область, из которой мы черпаем примеры, весьма ограниченна.
Использование символов ху и ху для «сложения»
и «умножения» в кольце — это всего лишь соглашение — хотя очень удобное! Если бы мы взяли вместо + и • символы □ и з, то потребовали бы, чтобы выполнялись соответствующие законы: закон (8) в этом случае выглядел бы так:
аз (Ь □ с) = (а з Ь) □ (а з с),
(а □ Ь) з с = (а э с) □ (Ь з с).
Исходное множество S для кольца не обязательно должно быть множеством чисел. Даже когда рассматриваются целые числа по модулю 7 и в качестве S берется множество {1, 2, 3, 4, 5, 6, 0}, то его элементы — не настоящие числа; на самом деле не важно, что собой представляют эти элементы, если сложение и умножение для них задано с помощью таблиц на с. 42 и 44. Можно, например, рассмотреть произвольное множество Т и взять в качестве S множество всех его подмножеств. Определим операции так:
а + b = (a [J b)\(a fi b), ab = а Ь, где а, b € 5 (рис. 43).
Остается проверить, что все законы (1) — (8) для этих операций на S выполняются,— это громоздкое, но простое упражнение по теории множеств. Пустое множество 0 играет роль 0 в правиле (3), в. то время как все Т—это 1 в законе (7). Обе части равенства (1) представлены на рис. 44.
Что такое в этом кольце х2? Напомним, что х2 = хх. Элементы множества хх — это те, которые лежат одновременно в х и в х, т. е. все элементы из х. Таким образом, хх—х. Это кольцо обладает любопытным свойством — в нем х2 = х для всех элементов! Если в качестве Т мы
взяли множество, содержащее ровно п элементов, то X содержит 2П элементов, и у нас получилось кольцо, в котором квадратное уравнение
х2 — х=0
имеет 2п решений. Если Т бесконечно, то это уравнение имеет бесконечно много решений!
а + Ь
Рис. 43.
ab
Рис. 44.
Мы говорили выше, что в любом кольце справедливо равенство (х-\-у)2=х2-\-2ху+у2. Если же каждый элемент рассматриваемого кольца удовлетворяет условию х2=х, то указанное равенство примет вид
х+у = х + 2ху+у,
а отсюда (с помощью законов (4), (1) и (3)) получается, что
2ху = О
для любых х, у. На самом деле в нашем кольце верно и более сильное утверждение. Для любого элемента х из 5
2х — х -j- х = (х U х) — (х[}х) — х — х = 0 =0.
Ну и, разумеется, 2хг/=0. Хотя это кольцо обладает многими специфическими свойствами, обычная формула для (х+у)2 ничему не противоречит.
Ветвь математики, известная под названием теории колец, состоит из всех утверждений, которые можно вывести из законов (1) — (5) и (8),— это те теоремы, которые верны для всех колец. Если в ходе своих исследований математик наталкивается на систему, удовлетворяющую всем этим требованиям, он говорит себе: ага, кольцо! — и понимает, что из этого замечания уже вытекает определенный набор свойств. (Правда, это редко решает все его проблемы.)
Если мы введем в рассмотрение деление, то появятся еще два важных закона:
(9) существование обратного по умножению:
если а 7^=0, то существует элемент а~1 , такой, что аа~~1 = 1 = а~1а;
(10) 0 7^=1. (Это для того, чтобы исключить некоторые тривиальные системы.)
ЛЪюжество S, обладающее операциями сложения и умножения, которые удовлетворяют законам (1) — (10), называется полем. Результаты гл. 3 о делимости показывают, что целые числа по модулю п образуют поле тогда и только тогда, когда п — простое число. Таким образом, возникает масса примеров колец, не являющихся полями,— сюда относятся все кольца целых чисел по модулю п, где п не является простым числом.
Исторически понятия кольца и поля возникли при изучении алгебраических чисел, т. е. чисел, удовлетворяющих уравнениям, левые части которых являются многочленами, таким, например, как х2 — 2 = 0 или 17х23 — 5х5 4- 439= 0. Первому из них удовлетворяют числа ±1^2 (относительно решения для второго у меня нет никаких соображений!), и на некотором этапе развития теории полезно рассмотреть всю совокупность чисел вида a -f- b | 2 для целых а и Ь. Поскольку
(а 4- b Y2)(с 4- d ]/2) = (ас 4- 26d) 4-
+ (ad + be) 1 2,
оказывается, что они образуют котьца.
Если считать теперь а и b рациональными, то для любого элемента мы сможем найти обратный:
Таким образом, мы получили поле. С помощью теории колец и теории полей были обнаружены многие глубокие свойства алгебраических чисел. В частности, эти теории применяются в современных изложениях неразрешимости в радикалах уравнения общего вида степени 5 *.
Применение к геометрическим построениям
Серьезное исследование уравнения пятой степени увело бы нас слишком далеко в сторону. Но некоторые возможности названных выше теорий можно проиллюстрировать на примере проблемы, использующей менее сложный аппарат. У древних греков существовала известная геометрическая задача (ее часто приводят в виде легенды, связанной с оракулом острова Делос2): как построить отрезок длины -j/ 2, если дан отрезок длины 1? Построение должно быть выполнено лишь с помощью циркуля и линейки (платоново ограничение). Греки не смогли найти решение этой задачи (хотя открыли полезное коническое сечение).
Мы покажем, что такое построение осуществить невозможно.
Если даны отрезки длины г и s, то указанным на рис. 45 способом можно построить отрезки длины r+s, г—s (если r^s), rs и r/s. (Мы считаем, что отрезок длины 1 задан, чтобы фиксировать масштаб.)
Будем говорить, что число а можно построить, если можно построить отрезок длины |а|. Множество К всех таких чисел является подмножеством множества R всех действительных чисел. Нетрудно видеть (см. рис, 45), что, не выходя за пределы этого множества, его
Рис. 45.
элементы можно складывать, вычитать, перемножать, и делить друг на Друга; отсюда легко получить, что К — поле. Оно является подполем поля R.
Кроме того, в рамках этого множества можно извлекать корни из его положительных элементов, как показано на рис. 46.
Если начать с отрезка заданной длины 1, то, исполь. зуя указанные на рис. 45 построения, мы сможем по-
112
строить числа 2, 3, 4, ... , -у, -р ... , и вообще
любые положительные рациональные числа. Далее, для любого такого числа г мы можем построить ]/7”(рис. 46). Тогда можно построить все числа вида
p + qVr
для любых рациональных р и q. Множество всех чисел такого вида образует поле (обозначим его через Ех), поскольку формула
(р+9 щг'- М-М+
\ ра — rq* ] \ р2 — rq2 )
обобщающая соответствующую формулу для р + q ]/?, позволяет находить обратный по умножению элемент.
Теперь можно повторить этот процесс, начиная с положительного элемента s С Ех, и построить J/^s, а затем все числа вида p-}-q]fs, где р, q принадлежат Тем самым мы получим большее поле F2. Проведя этот процесс еще раз, но уже исходя из поля Е2, мы получим поле F3. Вообще получается возрастающая последовательность полей
Q — Л — ^2 — ^3 — ••• — Pk — Fk-\A — • • I
и любое число из любого поля Fi может быть построено.
Существуют ли еще какие-нибудь числа, которые можно построить?
Конечно, мы могли бы брать различные элементы г, s, .... когда строили квадратный корень. Но это ведет лишь к аналогичной последовательности полей. Есть ли числа, которые можно построить, но с помощью нашей процедуры получить нельзя?
Любое геометрическое построение можно разбить на последовательность шагов следующих трех типов:
1) нахождение точки пересечения двух прямолинейных отрезков, концы которых уже построены;
2) нахождение точки (точек) пересечения прямолинейного отрезка и окружности, если уже построены концы отрезка, центр окружности и отрезок, длина которого равна радиусу окружности;
3) нахождение точки (точек) пересечения двух окружностей, если уже построены их центры и отрезки, длины которых равны их радиусам.
Исследуя все это с помощью метода координат, мы видим, что шаг 1 позволяет найти числа, которые можно получить из уже построенных чисел с помощью сложения, вычитания, умножения и деления. Шаги 2 и 3 позволяют находить квадратные корни из известных положительных чисел, но ничего больше. Таким образом, любое число, которое можно построить, лежит в одном из полей Fi при подходящем выборе чисел г, st ..., из которых мы извлекаем квадратный корень.
Теперь мы переходим к задаче построения j^2. Если это возможно, то 1^2 лежит в одном из полей F.. На первый взгляд, непохоже, чтобы 1^2 можно было выразить, используя лишь квадратные корни, но внешность бывает обманчива. Уверены ли вы, что не существует какого-либо сложного выражения, вроде
з + -у- /(5 + 6]/7) - VТз, которое равно у42?
Это, конечно, маловероятно, потому что корень-то кубический. Кубические корни и квадратные корни — вещи разные. Это различие и надо использовать.
Сначала докажем, что |/2 — не рациональное число. Доказательство очень похоже на стандартное доказательство того, что ]/г2 — не рациональное число.
3 Л
Предположим, напротив, что число у 2 рационально, и, следовательно, существуют целые числа с, d, для которых 3 г— у 2 — ad.
Возможно, что с и d имеют общие делители. Если это так, сократим на них. Иными словами, мы можем найти целые числа е, f, не имеющие общих делителей, и такие, что
1/2 = elf.
Возведя это равенство в куб и умножив на /3, получим, что
2/3 = е3.
Значит е3—четное число. Куб нечетного числа нечетен, поэтому е не может быть нечетным числом. Таким образом, е четно и существует такое целое число g, что
e = 2g.
Тогда
2р = е3 = (2g)3 = 8g3, Р = 4g3,
т. е. р четно. Отсюда, как и выше, получаем четность числа f. Значит, существует целое число А, для которого f=2h.
Но тогда e( = 2g) и [( = 2Л) имеют общий делитель 2, а е и f не имеют общих делителей!
Если ей/ существуют, то они обладают свойствами, которые противоречат друг другу. Следовательно, их не существует, но тогда не существует и чисел с и d, а отсюда следует, что число ]/2 не рационально. Допустим
теперь, что у 2 может быть построено. Мы уже видели, что это не рациональное число. Значит, оно должно лежать в поле Fk при подходящем выборе элементов г, s, ... Без ограничения общности можно взять k наименьшим из возможных.
Запишем х=]Л2. Поскольку х С Fk, то
х = Р + <7 УК
где р, q и t лежат в Fk^\, а УТ—нет, (Если J/Тлежит в Е*-!, то Fk — Fk-i, а значит, х С Fk-i, что противоречит нашему выбору наименьшего k.) Элемент х удовлетворяет уравнению
х3 —2 = 0.
Подставляя сюда его выражение из (»), получаем, что а + b J/7" = 0, где
а=р3 + 3р<72^—2, & = Зр2<7 + <?3/.
Это означает, что и а, и b должны быть равны нулю, по* скольку если бы b было отлично от нуля, то выполнялось бы равенство
УТ ~ — alb,
т. е. yt лежал бы в Fk—i. Но мы уже отмечали, что Уt не лежит в Fk-i. Значит, b = 0. Но тогда и а = 0. Рассмотрим теперь число
У = P — qyt.
Нетрудно убедиться, что
у3—2 = а —Т>]/7,
где а и b те же, что и выше. Но они оба равны нулю, следовательно,
у3—2 = 0.
Это означает, что у — другой кубический корень из 2. Как х, так и у — действительные числа, но существует лишь один действительный кубический корень из 2. Остается лишь возможность х=у, но тогда
p + qVt=p — qVi,
так что <7 = 0. Из (*) мы теперь получаем, что х=р, но р лежит в Fk-t. Таким образом, х лежит в F^-i- Но это снова противоречит нашему выбору наименьшего возможного k.
Действуя в согласии со строгой логикой, мы пришли к противоречию. Единственное сомнительное место — это з,-
предположение, что число у 2 —может быть построено, значит, здесь и находится источник наших затруднений: мы можем избежать противоречия, лишь отказавшись от
з.—
этого предположения. Итак, у 2 нельзя построить.
Другие задачи о геометрических построениях можно рещать подобным же образом. Задача о трисекции угла 60й ведет к построению такого х, что
х3 — Зх= 1,
и аналогичные рассуждения показывают, что это невозможно сделать.
Задача о квадратуре круга требует построения х=л. Поскольку элементы из F{ получаются с помощью извлечения лишь квадратных корней, то можно убедиться, что они должны удовлетворять некоторому уравнению типа апхп + an-ixn~l + +aix+ao = O,
коэффициенты сц которого рациональны. Любопытная и трудная теорема Линдемана 3 показывает, что л не удовлетворяет никакому уравнению такого вида. Иначе говоря, нельзя построить квадрат, площадь которого равнялась бы площади данного круга.
В этой связи следует упомянуть задачу о построении по
правильных многоугольников. Построение правильного п-угольника тесно связано с уравнением типа
хи-Ч-хи-2+ ... +%+1 = 0.
Глубокое исследование показывает, что правильный п-угольник можно построить тогда и только тогда, когда п = 2а-р1-...-рь,
где Рг — различные нечетные простые числа вида
22С + 1.
Известны лишь простые числа этого вида с с = 0, 1, 2, 3, 4, а именно: 3, 5, 17, 257, 65 537. Правильные многоугольники с таким числом сторон можно построить. 17, 257 или 65 537 сторон — это впечатляет!
Все эти замечания относятся к теоретически точным построениям. Для практических же целей нужны лишь хорошие приблизительные построения, которые существуют для всех разумно малых п, например достаточно малых для того, чтобы сторону получающегося многоугольника можно было разглядеть.
Снова сравнения
Теперь я хочу доказать, что арифметика по модулю п определяет кольцо.
Одно препятствие сразу бросается в глаза — законы кольца основаны на равенствах, а у меня пока есть лишь сравнения. Но если я сумею получить равенства вместо сравнений, останется еще одна задача — доказать, что законы кольца здесь справедливы.
Как обычно, рассмотрим частный случай арифметики по модулю 7. В гл. 3 мы установили, что множество Z целых чисел разбивается на семь подмножеств, соответствующих семи дням недели. Среда, например, соответствует множеству чисел {..., —11, —4, 3, 10, 17, ...}, состоящему из чисел вида 7п+3,
Это в точности числа, сравнимые с 3 по модулю 7, Если обозначить через [х] множество чисел, сравнимых с х. то множества чисел, соответствующие дням недели, будут выглядеть так: [0]. [1], [2], [3], [4], [5], [6]. Множества И называются классами вычетов. Кроме того, [7]=[0], [8]=[1], [9] = [2] и т. д., поскольку число сравнимо с 7 тогда и только тогда, когда оно сравнимо с 0.
В гл. 3 у нас встречались «равенства» вроде 7 = 0, 8 = = 1, 9 = 2; но мы отмечали, что « = » — нс настоящее равенство. Но вот [7] = [0] — действительно равенство: множества [7] п [0] совпадают. Это наводит на мысль, что, поставив всюду квадратные скобки, мы превратим сравнения в равенства.
Flo тогда надо определить сложение и умножение классов вычетов. Это намерение может показаться слишком смелым. С другой стороны, в этой главе мы уже вводили подобные операции на подмножествах некоторого множества Т, так что мысль складывать и умножать множества не совсем неожиданна.
Чтобы определить эти операции, воспользуемся таблицами умножения и сложения по модулю 7, только расставим везде квадратные скобки. Тогда
[4] + [5] = [2], [3]+[1]=[4], [5]Х[2]=[3]
и т. д.
Это шаг в правильном направлении, но в таком виде незаметно одно важное упрощение. Ведь [2] — это то же самое множество, что и [9], так что [4]+[5]=[9]. А [3] = = [10], значит, [5] X [2] = [ 10]. И мы возвращаемся к обычной арифметике. Вообще
[а]+[Ь] = [а+й], (**)
[а]Х[6]=[а6].
Можно проверить, что в результате получаются те же
таблицы сложения и умножения, что и раньше. Если вы все аккуратно проделаете, то убедитесь, что даже вычисления в обоих случаях проводятся по существу одинаково, только в одних есть скобки, а в других •— нет.
Не прошли лй мы весь этот путь лишь для того, чтобы в конце концов вернуться к обычной арифметике? К счастью, нет. Законы сложения и умножения здесь такие же, как в обычной арифметике, но есть еще дополнительные свойства, такие, как [7]=[0], т. е. мы имеет обычную арифметику плюс право отбрасывать числа, кратные 7. А это и есть арифметика по модулю 7.
Теперь мы знаем, что арифметика по модулю 7 подчиняется по существу тем же законам, что и обычная арифметика. Поэтому неудивительно, что возникает кольцо. Чтобы доказать справедливость закона (8), проведем такие вычисления:
[а]- ([й] + [с]) =[а] • ([й + d) (определение сложения) = [а(й + с)] (определение умножения)
= [ай + ас] - (закон 8 для обычных целых чисел)
=[ай]+[ас] (определение сложения) ь= ([а] • [й] + ([а] • [с]). (определение умножения)
Другие законы проверяются столь же легко. Все сводится к обычным целым числам.
Те же рассуждения подходят и для модуля п при любом п. Сначала определяем классы вычетов [х], затем — сложение и умножение, пользуясь ( **), и, наконец, проверяем правила (1) — (8).
Надо отметить, что правила ( »* ) коварнее, чем может показаться. По ним получается, что [1]+[3] = [4]. Но по ним же получается, что [8]+[10]=[18]. А так как [1]= =[8] и [3] = [10], то наступает опасный момент—- у нас есть два значения одной и той же суммы. Но — и здесь можно вздохнуть с облегчением — [4] = [18], так что в конечном счете ответ лишь один.
Не всегда дело обстоит так удачно. Если разбить Z на два подмножества Р и Q, где
Р = {целые числа 0}, Q= {целые числа > 0},
и определить [х] как то из этих двух множеств, которому принадлежит х (это похоже на то, как мы выбирали в качестве [х] тот класс вычетов, которому принадлежал х), то сразу же возникнут неприятности.
Используя формулы (** ), чтобы найти P + Q, получаем
P + Q=[-5]+[l]=[-5+l]=[-4]=F, P+Q = [-3]+[6]=[-3+6] = [3]=Q.
Таким образом, для этих Р и Q определение ( * * ) абсолютно бессмысленно. Это вообще не определение!
Однако для классов вычетов ( * * ) не приводит к неоднозначности. Проверить это можно без особых усилий. Действительно, если в арифметике по модулю п имеем [а] = [а'] и [й]=[й/], то a~a'=jn и b — b'=kn, где / и k — целые числа. Значит, (п-рй) — (a' — b') = (j + k)n, откуда [о + й]=[п' + й'], и все в порядке. Операции + и • для классов вычетов определены корректно.
Введение в комплексные числа
Комплексные числа 4 появляются при попытке решить уравнение х2 + 1 = 0. Мы вводим новое число i такое, что р= — 1. Чтобы складывать и умножать, нам необходимы числа вида a + bi для действительных а и Ь. Наконец, заметим, что если предположить, что для них выполняются обычные законы арифметики, то уже никаких неприятностей возникнуть не должно. И, более того, в этой системе мы сможем также делить.
Все это очень хорошо, но не слишком обоснованно, не доказано даже, что законы арифметики действи
тельно должны выполняться. И само число i кажется таинственным: почему действительные числа названы действительными, а мнимые — мнимыми? Это очень печально — не столько потому, что в этих названиях выражено неуважение к мнимым числам, сколько из-за того, что они приписывают действительным числам значительность, которой те никоим образом не заслуживают!
Существует способ введения комплексных чисел, который ставит их наравне с целыми числами по модулю п. Поскольку для целых чисел по модулю 7 нам требуется равенство 7 = 0, то мы рассматриваем сравнения по модулю 7. В системе комплексных чисел мы хотим, чтобы х2+. + 1 = 0, значит, надо брать сравнения по модулю х2 + 1. Такова во всяком случае общая идея. Теперь нам надо найти нечто, на чем можно рассматривать сравнения.
Это «нечто» должно содержать х. Мы хотим, чтобы в окончательную систему входили действительные числа, значит, их надо сразу включить в рассмотрение. Поскольку мы хотим задать арифметику, нам нужно определить х+х, ххх, xxxx+lx—З и тому подобное. Эти выражения похожи на многочлены (и на самом деле ими являются) от х с действительными коэффициентами. Мы уже знаем, как складывать, вычитать и умножать многочлены, и знаем, что для них выполняются законы арифметики. Во всяком случае мы всегда предполагали, что они выполняются, хотя это и не одно и то же! Но, если захотим, мы можем доказать, что они выполняются. Это означает, что многочлены образуют кольцо. Мы обозначим это кольцо через R[x], Здесь R показывает, что коэффициенты — действительные числа, а х — что именно берется в качестве переменной, но квадратные скобки не имеют отношения к сравнениям.
В кольце R[x] мы можем взять сравнения по модулю х2 + 1. Скажем, что два многочлена сравнимы, если их разность делится на х2+1. Каждый многочлен сравним со своим остатком от деления на х2+1, Например,
х3+х2-2х+3=(х2+1) (х+1)+ (-Зх+2), так что
х3+х2 —2х+3= —Зх+2 (modx2 + l).
Действительно, каждый многочлен сравним с единствен-ным многочленом вида ах+Ь, где а и Ь — действительные числа. Все члены более высокой степени можно исключить, вычитая подходящие кратные х2+1.
Многочлены-константы практически не отличаются от обычных действительных чисел, несмотря на то что введены сравнения по модулю х2 + 1. Многочлен х удовлетворяет условию
х2= —1 (modx2+l)
и, значит, ведет себя как мнимое число I. Тогда многочлены ах+Ь ведут себя именно так, как должны вести себя комплексные числа ai+b.
Законы (1) — (8) для классов вычетов по модулю х2 + + 1 можно проверить точно так же, как и для классов вычетов по модулю п, с тем лишь исключением, что здесь мы опираемся на соответствующие законы кольца многочленов R[x],
Наконец, заметим, что
(ах + Ь) (—ах + Ь) — —а2х2+Ь2=в
= a2+b2 (modx2 + l), и, таким образом, если ах + Ь += 0, то мы можем найти для него обратное
Это уже просто подарок, так как кольцо R[x], с которого мы начинали, не является полем. Но то же самое происходило, когда мы рассматривали сравнения по модулю п. Мы начинали с кольца Z, не являющегося полем, а затем обнаружили, что, когда п — простое число, целые чи-
ела по модулю п образуют поле. И практически так же обстоит дело здесь: многочлен х2+1 прост в кольце многочленов, его нельзя разложить на множители.
Мы могли бы продолжить рассмотрение и вывести все обычные свойства комплексных чисел.
Я не утверждаю, что изложил наилучший способ введения комплексных чисел в школе. Но для тех, кто свободно владеет арифметикой по модулю п и имеет опыт работы с комплексными числами, этот подход многое может прояснить.
Я могу даже так сформулировать: комплексные числа — это классы вычетов кольца многочленов по модулю х2 + 1. Немножко непривычно, но в сущности ничего непостижимого!
В более легком жанре
Теория колец и полей может быть полезна и в областях, весьма далеких от абстрактной алгебры.
Для игры в солитер, как вы, вероятно, знаете, нужна доска с отверстиями, образующими такую конфигурацию:
ООО ООО
О О О О ООО-ООО О О О О О О О О О О О ООО ООО
В начале игры в каждое отверстие, кроме центрального, вставлен колышек. Играющий может переносить любой колышек в свободное отверстие через любой соседний по горизонтали и по вертикали, причем последний при этом
вынимается из своего отверстия. Движения по диагонали не допускаются. Цель игры — освободить все отверстия, кроме одного. Обычно требуют, чтобы последний колышек находился в центральном отверстии. Любой, кто достаточно много играет в солитер, заметит, что, если и не требовать, чтобы последний колышек оказался в центре, представляется маловероятным, чтобы он мог оказаться в любом другом месте. Существует ограниченное число окончательных позиций.
В каких же отверстиях может находиться последний колышек? Мы ответим на этот вопрос с помощью метода де Брёвна 5, использовавшего поле из четырех элементов. Это элементы 0, 1, р и q со следующими таблицами сложения и умножения:
+ 1 о 1 р q X 0 J Р q
0 0 1 р q 0 1 1 0 q р . 1 р р q о 1 р <7 <7 р 1 0 q 0 0 0 0 о 1 р q о р q 1 о q 1 р
Мы не будем проверять здесь, определяют ли эти таблицы поле, но это так. Проделайте соответствующие вычисления, если не верите.
Заметим, что имеет место равенство
р2+р+1=0. (***)
(Именно поэтому мы и выбрали такое поле.) Действительно,
p2+p+\ = q+P+ I
= 1 + 1
= 0.
Поставим в соответствие отверстиям на доске целочисленные координаты следующим образом:
(—3,1) (-2,1)
(—3,0) (—2 0)
(-3,-1) (-2, -1)
(-1.3)
(-1.2)
(-1.1)
(-1.0)
(-1.-1) (-1, -2) (-1,-3)
(0.3) (0,2)
(0,1) (0,0) (0,-1) (0,-2) (0,-3)
(1,1) (2,1)
(1.0) (2,0)
(1,-1) (2,-1) (3,-1)
(1,-2)
(3,1) (3,0)
(1.-3)
Ситуация определяется как некоторое множество колышков на доске. Определим значение для каждой ситуации S по формуле
A (S) =
где знак S означает, что мы складываем все рк' 1 для всех координат (k, I) колышков из S. (Отметим, что А— функция с множеством возможных ситуаций в качестве области определения и с полем из четырех элементов в качестве области значений.) Таким образом, ситуация (колышки отмечены черным)
ООО
О О Ф о о о о о о о
о о © в о в о
о ф о в о о о
ООО ООО
описывается множеством 5 = {(-2, -1), (-1, 0), (0, (0, -1), (2, 0), (1, 2)} и
/1(5') =р-2~!+р-1+0 + р0+°+ р0-1 -рр2 + 0_|_р1+2
= Р“3 + р"1 +р° + р~1+р2+р3 ^l+q+1+q+q+l = l + q
Функция А обладает очень хорошими свойствами: если допустимое преобразование переводит ситуацию 5 в ситуацию Т, то A(S) = A(T). Значение ситуации не меняется при допустимых преобразованиях и остается, следовательно, постоянным на протяжении всей игры.
Чтобы убедиться в этом, рассмотрим «прыжок» влево. Колышки в (k, /) и в (k — 1, /) заменяются одним колышком в (k—2, 1\. Значение ситуации изменяется на
ph-2+l _ — ph+1 —
=pft+'(p-2-p-1-l)
= pft+1(p2+p2 + l)
= 0 (в силу ( * * * )).
Аналогично рассматриваются «прыжки» вправо, вверх и вниз.
Существует еще одна функция, обладающая этим свойством, а именно
В (S) = 2рк~1
(суммирование также проводится по (k, I) из S). Значит, каждой ситуации мы можем поставить в соответствие пару
B(S))
элементов нашего поля. Существует 16 таких пар, и каждую из них можно получить, подобрав соответствующим образом ситуацию <S. Они разделяют ситуации на 16 множеств, так что никакая последовательность «прыжков» не выводит ситуацию за пределы множества, которому она первоначально принадлежала.
Для исходной позиции нашей игры A(S) = B(S) = 1. Поэтому для любой позиции, которая может возникнуть в течение игры, = B(S) = 1. Для единственного колышка (k, I) получим:
ZlfS)=pM' B(S)=p^',
т. е.
дй-Н = р*-Г — J
для любой допустимой конечной позиции. Степени элемента р, которые равны 1, это р~6, р~3, р°, р3, и вообще р3п. Значит, k + l и k — I кратны трем. Отсюда следует, что k п I также кратны трем. Таким образом, мы можем прийти лишь к следующим пяти позициям с единственным колышком: ( — 3, 0), (0, 3), (3, 0), (0, — 3) и (0, 0).
Эти рассуждения не показывают, что все эти позиции достижимы, но они в сущности исключают возможность, чтобы какая-либо из них оказалась недостижимой. И в действительности все они достижимы.
Подобные рассуждения годятся для досок любой формы, лишь бы отверстия располагались по строкам и столбцам. Можете, если хотите, рассмотреть точно так же трехмерные доски.
Глава 7
СИММЕТРИЯ: ПОНЯТИЕ ГРУППЫ
И теперь мы можем решить задачу вообще без всякой математики — с помощью одной лишь теории групп.
Профессор из Кембриджа,
В природе существует много видов симметрии, и обнаружены они были в самые древние времена. Человеческая фигура приблизительно симметрична относительно вертикальной оси (точнее, вертикальной плоскости), и это одна из причин, почему нам кажется, что зеркало меняет местами правое и левое. Этот вид симметрии известен как зеркальная симметрия.
Символ острова Мэн, изображающий три бегущие ноги, обладает поворотной симметрией (рис. 47).
Фигура может быть симметричной относительно нескольких прямых одновременно или обладать одновременно зеркальной и поворотной симметриями. Квадрат обладает зеркальной симметрией относительно диагоналей и относительно прямых, проходящих через его центр параллельно какой-нибудь из его сторон; его можно также поворачивать на 90°.
©Совсем другой вид симметрии демонстрируют настенные орнаменты, которые целиком можно перемещать в различных направлениях, так, чтобы на вид ничего не изменялось. Тот факт, что объект симметричен, необычайно важен с точки зрения математики.
Рассмотрение равнобедренных треугольников в гл. 2 сводится к Рис. 47. утверждению, что они обладают зер-
калькой симметрией. В математической физике законы типа закона сохранения энергии вытекают из априорного предположения о симметрии Вселенной. Такое важное свойство, как симметрия, должно поддаваться математическому анализу и поддается ему на самом деле. Прежде всего нужно выработать рабочее определение
Рис. 48.
симметрии, чтобы быть уверенными, что все мы говорим об одном и том же. Иначе мы можем спутать, например, «симметричный» с «красивый». Симметрия фигуры описывается теми движениями, в результате которых она совмещается сама с собой. Отдельные точки при этом, однако, могут смещаться. Если повернуть квадрат ABCD вокруг его центра на 90°, как это показано на рис. 48, то вершина А переместится в В, В — в С, С — в D и D — в А.
Важно здесь не положение точек, а операция, их передвигающая. «Вращение на 90°» описывает симметрию квадрата, и ее же описывает «отражение относительно вертикальной прямой». Но это то, что мы раньше называли жесткими движениями. Их можно описать как некоторые функции, у которых как область определения, так и область значений совпадает с плоскостью R2.
Таким образом, для любого подмножества S плоскости R2 можно определить его симметрию как сохраняющую расстояние биекцию f: R2->R2, такую, что f(x), т. е.
результат применения f к точке х, принадлежит S для любого х £ S. Последнее условие можно переписать так: f (S) — S На языке геометрии симметрия подмножества А— это жесткое движение плоскости, которое оставляет S на месте, хотя может перемещать отдельные точки из S.
Нет необходимости ограничиваться рассмотрением плоскости, трехмерное пространство ничем не хуже.
Для «бегущих ног» существует очевидная симметрия— вращение на 120° вокруг центра, скажем, по часовой стрелке. Обозначим соответствующую функцию (или жесткое движение) через w. Другая симметрия, скажем, v — это вращение на 240°. На первый взгляд этим исчерпаны все возможные симметрии, но мы всегда должны помнить также о тривиальном случае. Это третья симметрия; тождественная функция. При ней все точки остаются на месте, и, значит, она подходит под наше определение. Для нее мы используем символ I, напоминающий о природе этой функции. Таким образом, {/, w, tz} — множество симметрий для «бегущих ног».
Повернуть на 240° — это все равно, что дважды повернуть на 120°. Иными словами, ге = и, где умножение определено, как в гл. 5. Чтобы упростить обозначения, будем писать w2 вместо ww, w3 вместо www и т. д., т. е. ьу2 = о. Аналогично t|2 = w: дважды повернуть на 240° — это все равно, что повернуть на 120°, поскольку 360° — это полный поворот, в результате которого все точки возвращаются на свои места. На самом деле, произведение любых двух симметрий из этих трех — снова одна из этих симметрий.
Приведем таблицу:
X | I w у
I I W V
ull W V I
О V I W
Из этой таблицы видно, что w3 — I. И это правильно, так как в результате трех последовательных вращений на 120° все точки возвращаются в исходное положение.
Тот факт, что произведение двух симметрий также является симметрией, обычно формулируют так; множество симметрий замкнуто относительно умножения. Если бы мы не включили в число симметрий /, то лишились бы этого свойства. Это было бы нечто вроде арифметики, в которой сумма двух чисел не обязательно является числом. Иными словами, мы могли бы обойтись без I, но удобнее этого не делать.
Это множество симметрий
X
Рис. 49.
: заданным на нем умножением представляет собой пример математической структуры, именуемой «группой». Группа будет определена позже, пока же нам нужен лишь термин. Мы нашли группу симметрии «бегущих ног».
Каждая фигура имеет группу симметрии. Человеческая фигура имеет две симметрии: тождественное преобразование и отражение относительно вертикальной прямой. Вот соответствующая таблица умножения:
г
г
I
и снова множество симметрий замкнуто относительно умножения. Рассмотрим более сложный пример. Равносторонний треугольник (рис. 49) имеет шесть симметрий.
Это тождественное преобразование вращения но часовой стрелке w и v на 120° и 240° соответственно, а также отражения х, у, z относительно прямых X, Y, 1 (предполагается, что при движениях треугольника прямые остаются неподвижными). Когда мы рассматриваем «бегущие ноги», отражений не возникает, так как после отражения ступни окажутся направленными не в ту сторону.
Множество w, v, х, у, z} симметрий замкнуто относительно умножения (если симметрии перемножать как функции), и мы получаем такую таблицу:
X ] I w у х у z
I I W V
w w v I
V V / W
X X у Z
У У г х
Z Z X у
X У Z Z X у у Z X
I W V V I W
W V 1
Что такое, например, wx (проделать wx — это сначала проделать х, а затем да)?
Треугольник
А
С В
переходит при х в
А
В С
а затем при w — в
В
С А
Но это все равно, что применить г. Таким образом,
wx=z.
Рассмотрим теперь yz. При z наш треугольник пере
ходит в
В
С А
а при у переходит в
С
В А
(вспомним, что прямые X, У, Z остаются на месте). Но то же действие производит и w, т. е. yz=w.
Теперь уже можно проверить, что таблица составлена правильно. Для большей наглядности сделаем треугольник из картона и пометим его углы. Обведем его контуры на листе бумаги и нарисуем на этом листе прямые X, У, Z.
Вообще, чтобы определить группу симметрии некоторой фигуры, надо
1) отыскать все ее симметрии;
2) составить для них таблицу умножения.
Всякий раз мы будем убеждаться, что полученное множество замкнуто относительно умножения. Исключений здесь нет. Если f и g — жесткие движения, то жестким движением будет и fg. Если как f, так и g оставляют S на месте, то и fg оставляет S на месте, поскольку f(g(S)) =f(S) =S. Если применение f и g по отдельности не меняет очертания фигуры, то его не изменит и применение их обоих.
Те же соображения применимы и к более сложным фигурам. Куб имеет 24 поворотные симметрии или 48, если считать отражения. Мы можем перевести каждую вершину в любую другую и повернуть ребра, исходящие из этой вершины, тремя способами. Додекаэдр имеет 60 поворотных симметрий или 120, если считать отражения. Естественно, здесь уже невозможно выписывать таблицы умножения. Вычислить все возможные произведения симметрий — это не единственно возможный способ выразить отношения между ними. Но мы не будем здесь углубляться в этот вопрос
Понятие группы
Понятие группы возникает на основе рассмотренных выше, а также других примеров таким же образом, как при рассмотрении арифметик возникло понятие кольца. Вместо того чтобы ходить вокруг да около, я приведу сначала определение, а уже затем мы будем его обсуждать.
Группа состоит из:
(1) множества G;
(2) операции *, которая ставит в соответствие любым двум элементам х и у из G элемент х * у, также принадлежащий G.
Эта операция удовлетворяет трем следующим законам:
(3) она ассоциативна: для любых х, у, z^G
(4) существует единичный элемент I такой, что
I *х = х = х*1
для любого х £ G;
(5) существуют обратные элементы: для любого X £ G существует х' € G такой, что
х*х'=1—-х' *х.
Группы возникают в самых разнообразных ситуациях. Вот несколько примеров:
a) G — множество симметрий «бегущих ног», а * — умножение симметрий, указанное в табл, на с. 125. Нетрудно проверить свойства (1)—(5). Выполнение свойства. !1) очевидно — мы взяли в качестве G множество. Пункт 2) имеет место, поскольку наше множество замкнуто относительно умножения. Операция ассоциативна, так как операция умножения ассоциативна для любых функций — выполняется (3). Что касается пункта (4), то тут
мы предвосхитили события, обозначив через I тождественную функцию. Наконец, пункт (5): можно положить /'•=/, v'=w, w'=v;
б) Пусть О — множество целых чисел, G = Z. Тогда выполняется (1). В качестве * возьмем операцию сложения +,. Тогда справедливо (2), поскольку сумма а+Ь двух целых чисел а и b — целое число. Условие (3) — это закон (1) арифметики (с. 98), (4) — это закон (3) (где О играет роль /), а (5) — это закон (4);
в) Пусть G — R, т. е. G — множество действительных чисел, а *—это + . Рассуждения проводятся так же, как в предыдущем примере;
г) Пусть G — множество ненулевых рациональных чисел, а * — операция умножения. G является множеством, а произведение двух ненулевых рациональных чисел — ненулевое рациональное число. Это относится к пунктам (1) и (2). Условие (3) —просто закон (5) со с. 98, который справедлив для рациональных чисел, а (4) —это закон (7) (где 1 играет роль /). Рациональные числа образуют поле, а условие (5) — это закон (9) (см. там же), который справедлив в любом поле;
д) Пусть S — произвольное подмножество плоскости, G — множество его симметрий, а * — умножение функций. Тогда, как и в примере «а», легко убедиться, что G — группа.
Следует подчеркнуть, что если не соблюдено хотя бы одно из перечисленных пяти условий, то рассматриваемый объект не есть группа.
Если взять в качестве G множество целых чисел между — 10 и 10, а в качестве * —сложение, то закон (2) не будет выполняться: 6 + 6 не является элементом множества G.
Множество целых чисел, больших 1, с операцией сложения не обладает элементом / из пункта (4).
Множество целых чисел с операцией вычитания не
удовлетворяет условию (3), так как вычитание неассоциативно:
(2—3)—5 = —6^4 = 2—(3—5).
Множество всех рациональных чисел с операцией умножения — не группа. Единственный элемент, пригодный на роль I,— это 1, Но тогда мы не сможем найти элемент О', такой, чтобы 0'0=1; поскольку гХ0 = 0 для любого рационального г, то 0'0 равно 0, а не 1.
Таким образом, ни в одном из рассмотренных случаев мы не получаем группы.
Хотелось бы остановиться подробнее на операции *. Для любой пары элементов (х, у), где х, у £G, мы получаем единственный элемент х * у С G. Это означает, что * задает функцию с областью определения G*G (множество всех пар (х, у)) и областью значений, лежащей в G (на самом деле совпадающей с G).
Операцию можно определить как функцию
*: G х G —> G,
если воспринимать х * у как сокращение для *(х, у), При таком определении условие (2) выполняется автоматически, и его можно опустить, но в каждом конкретном случае необходимо проверять, что * действительно является функцией из GXG в G.
Коль скоро эти понятия усвоены, можно упростить обозначения и писать вместо х * у просто ху (но следует помнить, что это не обязательно обычное умножение) и х-1 вместо х'. Если мы употребляем эти обозначения, но имеем дело с группой целых чисел относительно сложения, то ху означает х+у, а х-1 означает —х. Тут важно не запутаться!
Подгруппы
Если из шести симметрий треугольника отобрать три:. I, w и v, то легко убедиться, что они составляют меньшую группу, лежащую в большей группе. Мы можем прове-рить это как с помощью таблицы умножения, так и о с помощью геометрических соображений: это симметрии, которые не переворачивают треугольника, и если мы перемножаем две такие симметрии, то снова получаем симметрию, которая также не переворачивает треугольника.
Эта меньшая группа в большей дает пример подгруппы. Если G — группа с операцией * , то подмножество Н из G является подгруппой, если оно образует группу относительно операции *.
Не каждое подмножество Н оказывается подгруппой. Совокупность Н={х, у, ?} не будет группой, так как xy=w, a w не лежит в Н. Если h и k лежат в подгруппе Н, то должны выполняться такие условия:
a) h*k £ Н-,
б) h~l е н, а отсюда следует, что
в) I = h*h~1 С Н.
Обратно, если выполняются условия «а», «б», то можно утверждать, что Н — подгруппа, поскольку закон ассоциативности обязательно выполняется в Н, если он выполняется в G.
Подгрупп чрезвычайно много. Группа целых чисел относительно сложения содержит подгруппы, состоящие из всех четных чисел, из всех чисел, кратных 3, из всех чисел, кратных 4, из всех чисел, кратных 5, ... Каждая группа G является своей собственной подгруппой. Подгруппой в любой группе оказывается множество {/}, со
стоящее из одного элемента, с тривиальной таблицей умножения
х | /
Группа симметрии равностороннего треугольника обладает шестью разными подгруппами:
{/, w, v, х, у, z},
{I, w, v}, {1,4, {Л у}, {1, г}, {/}•
Число элементов группы (если их конечное число) называется порядком группы. Мы уже нашли группу порядка 6 с подгруппами порядков 1, 2, 3 и 6. Не требуется особых способностей, чтобы заметить, что все эти числа делят 6.
По рассмотрении еще ряда примеров естественно предположить, что порядок подгруппы всегда делит порядок группы.
Это предположение верно: соответствующая теорема была доказана Лагранжей раньше, чем возникло абстрактное понятие группы!
Пусть К = {/, w, v, х, у, z), и рассмотрим подгруппу J — {/, х). Для любого элемента а £ К определим смежный класс J*a как
{I * а, х » о}, т. е. умножим каждый элемент из J на а и объединим полученные элементы в одно множество. Выпишем их все:
/ * х — {/, х}, J *z = {v, z}, / * y={w, у}.
] * /={/,х}, J * v= {v, z}, J * ЙУ= {w, у),
Отметим, что:
а} существуют лишь 3 различных смежных класса;
б) один из смежных классов — сама подгруппа /;
в) никакие два различных смежных класса не имеют общих элементов:
г) каждый элемент из К лежит в некотором смежном классе;
д) все смежные классы содержат одинаковое число элементов.
Из пунктов «б» и «д» следует, что все смежные классы содержат по 2 элемента. Из пунктов «в» и «а» вытекает, что все смежные классы вместе содержат 2-3 = 6 элементов. В соответствии с пунктом «г» К состоит из 6 элементов. Это не только объясняет, почему порядок подгруппы J делит порядок К, но и показывает, что частное от деления равно числу смежных классов.
Доказательство теоремы Лагранжа идет по тому же пути. Сначала доказывается, что пункты «а»—«д» справедливы для любой группы К и любой подгруппы J (за исключением того, что в пункте «а» фигурирует какое-то число с смежных классов). Если порядок подгруппы J равен /, а порядок группы К равен k, то k — jc. Таким образом, / делит k. Свойства «б»— «д» получаются из аксиом группы с помощью не очень сложных рассуждений.
Это замечательная теорема. Из не очень на первый взгляд ясных (но на самом деле сверхточных) абстрактных понятий группы и подгруппы мы извлекли конкретные численные соотношения. Если дана группа порядка 615, то без всякой информации об ее таблице умножения можно сказать, что порядками ее подгрупп могут быть лишь числа 1, 3, 5, 15, 41, 123, 205 и 615.
Возникает вопрос, все ли эти числа действительно оказываются порядками каких-либо подгрупп. Порядок группы вращений додекаэдра равен 60, но она не имеет подгрупп порядка 15, хотя 15 делит 60. Все, что
мы знаем по этому Поводу в общем Случай,*— это теорема Силова-. если Й**-степень простого числа и делит порядок группы 6, то О имеет подгруппу порядка h. Таким образом, наша группа порядка 60 обязательно имеет подгруйпы порядков 2, 3, 4 и 5, а любая группа порядка 616 имеет подгруппы порядков 3, 5 и 41,
Изоморфизм
Существуют другие способы построения группы из 6 элементов. Для множества S = {а, Ь, с} имеется 6 биекций S->S, а именно функции р, q, г, s, t, и, записанные в следующей таблице:
| р q г s t и
a a a b b с с
b b с а с а b
с с b с а Ь а
где, например, значение s(b) функции s на элементе b —• это элемент й-й строки и s-го столбца, т. е. с.
Биекции множества на себя называются перестановками этого множества.
Эти шесть биекций образуют группу относительно обычного умножения функций с такой таблицей умно* жения:
X р q г s t и р р q г s t и q q р t и г s г г s р q и t s s г и t р q t t и q р s г и и t s г q р
Например, чтобы найти rs, проведем следующие вычисления:
rs(cz) =r(s(a)) =r(b) =а, rs(fe) =r(s(b)) = г(с) =с, rs(c) =r(s(c)) = r(a) = b,
t. e, rs действует на всех элементах как q. Таким образом, rs*=q.
Эта группа не совпадает с группой симметрии правильного треугольника, поскольку у нее другие элементы, Но между этими группами есть большое сходство, помимо того, что они обе имеют порядок 6.
Каждая симметрия правильного треугольника переупорядочивает вершины А, В, С следующим образом!
I
А В С
А
В
С
w v х у г
В С А С В С А С В А А В В А С
Это наводит нас на мысль сопоставить движения с перестановками (заменяя заглавные буквы А, В, С строчными а, Ь, с):
р q г s t и
1 t t t t f
;+!!!!
/ X Z W V у
Если переписать таблицы умножения для обеих групп так, чтобы соответствующие друг другу элементы при этом сопоставлении стояли на одинаковых местах и в верхней строке и в самом левом столбце таблиц, а затем вписать в таблицы значения произведений, взятые из исходных таблиц, то получим;
X I I W V X у 2
I I W V X у z
W W V I Z X у
V V 1 w у Z X
X X у Z I W V
у у z x v I w 2 z x у w v 1
X | p s t q U
p p s t q и
s s I p r q
t t p s и r
q q a r p s
и и r q t p
r r q и s t
r
r
и
<1 t
s
P
В этих таблицах соответствующие друг другу элементы стоят на одинаковых местах не только в верхней строке и левом столбце, но и в основной части таблицы, Например, I и р расположены так:
*
*
*
*
«
а х, q — так:
*
*
«
*
*
Это не должно вас удивлять, поскольку способ перемножения перестановок очень близок к способу перемножения симметрий. Таким образом, две группы могут иметь одинаковую структуру, не будучи тождественны одна другой. Разница состоит в наименованиях элементов.
Чтобы эти соображения приняли более строгую
форму, рассмотрим функцию f, которая устанавливает соответствие между элементами двух рассматриваемых групп, такую, что f(I)=p, f(x)=q, ... Областью определения функции / служит первая группа, а областью значений — вторая. Пусть аир — элементы первой группы. На пересечении строки а и столбца р лежит элемент а * р. На пересечении соответствующих строки f (а) и столбца f (Р) находится элемент f(a)*f(P). Но это, как мы уже отмечали, должен быть элемент, соответствующий элементу а * р, т. е. f(a*p). Таким образом, тот факт, что соответствующие элементы стоят на одинаковых местах, означает, что
Р)=/ (а) 4(₽) (*)
для любых а и р из первой группы.
Конечно, формулу (*) гораздо удобнее использовать, так как она не зависит от «геометрии» таблицы умножения. Две группы G и Н называются изоморфными, если существует биекция f; G-> Н, такая, что для всех а, р б G выполняется (*). Изоморфные группы имеют одинаковую абстрактную структуру и различаются лишь элементами. Так как вся существенная информация о структуре группы заключена в способе перемножения ее элементов, то в большинстве случаев изоморфные группы можно не различать.
Мы уже знаем, что первая из рассматриваемых нами групп имеет 6 подгрупп. Из этого непосредственно вытекает, что вторая, изоморфная ей, группа тоже содержит 6 подгрупп. Например, подгруппе {I, w, v} первой группы во второй группе соответствует подгруппа {Р. s.t}.
Группы одного порядка не всегда изоморфны. Рассмотрим еще одну группу порядка 6, а именно группу целых чисел по модулю 6 относительно сложения. Ее таблица «умножения» — это таблица сложения по модулю 6, т. е.
4» j О 1 2 3 4 5
0 0 1
1 1 2
2 2 3
8 3 4
4 4 5
5 5 0
2 3 4 5
3 4 5 0
4 5 0 1
5 0 12
0 12 3
12 3 4
Обозначим эту группу через Л1. Будет ли она изоморфна группе симметрий К равностороннего угольника?
Один из способов решить такую задачу — просмотреть все биекции из М в К и выяснить, выполняется ли для какой-нибудь из них равенство ( *). Попробуем задать f так:
f(0)=7, f(V)=w, f(2)=v, f(3)=x, f(4) =y, f(5)=z. Тогда
f (1+2) (3) =x,
f(l) * f(2) — wv = I.
Это означает, что функцию мы выбрали неудачно. Перебрать нужно всего лишь 720 биекций. Так можно было бы осуществить этот первый подход.
С другой стороны, можно попытаться найти свойство группы М, не зависящее от наименований ее элементов. Одно из них мы знаем — это число подгрупп в группе. Нетрудно убедиться, что подгруппами группы М будут {0}, {0, 2, 4}, {0, 3} и М. Значит, М имеет всего четыре подгруппы и не может быть изоморфной группе /С, у которой 6 подгрупп.
Это приятнее, чем исследовать 720 функций. Но существует еще более простой способ. Сложение по модулю 6 удовлетворяет закону коммутативности (см. закон (2) на с. 98), а + р = р а. Предположим, что f: М -> — изоморфизм. Тогда
f («+P)=F (Р + а)>
так что, согласно (*), f («)f (₽)=/ (₽)f (a).
Иными словами, группа К также должна удовлетворять закону коммутативности, только относительно умножения. Но vx=y, xv = z, что ему противоречит. Таким образом, между группой М и группой симметрии К нель-зя установить изоморфизм.
Изоморфизмы позволяют во многих случаях значительно упростить ситуацию. В математике очень важно иметь возможность выяснить, когда две на первый взгляд различные задачи по существу совпадают. Если в двух задачах возникают изоморфные структуры, то это может навести на мысль о связи между двумя указанными задачами.
В предыдущем примере мы установили изоморфизм, используя уже известную нам связь между симметриями треугольника и перестановками на множестве из трех элементов. Иногда МЫ сталкиваемся с противоположной ситуацией: мы видим, что группы изоморфны, и хотим понять, почему это так. С общим уравнением пятой степени можно связать некоторую группу перестановок на множестве из пяти элементов. (Переставляемые элементы — это 5 корней рассматриваемого уравнения.) Эта группа содержит 60 элементов. Группа вращений додекаэдра тоже состоит из 60 элементов. Можно показать, что две эти группы изоморфны. Отталкиваясь от этого совпадения, Феликс Клейн раскрыл глубокие связи между тремя теориями:
уравнений пятой степени,
групп вращений,
комплексных функций.
Среди прочего это объяснило один уже отмеченный факт: уравнение пятой степени можно решить с помощью особого рода комплексных функций—-так называемых эллиптических функций, До открытия Клейна
это можно было доказать лишь «неизящными вычисле* ниями, и выглядело все это случайным, КдеЙН^рбъясниЛ^ почему так происходит.
Классификация орнаментов
Теория групп возникает везде, где мы сталкиваемся с симметриями. Она позволяет описывать симметрии объекта с помощью подходящей группы. Например, говоря о додекаэдральной симметрии данного объекта, мы имеем в виду, что его группа симметрии изоморфна группе симметрии додекаэдра.
Но, кроме того, она позволяет нам классифицировать симметрии. В некоторых ситуациях можно утверждать: здесь возможны эти и только эти симметрии.
Рисунки (орнаменты) на обоях — это в сущности просто симметричные конфигурации на плоскости. Группа симметрии такого орнамента состоит из некоторых жестких движений и является подгруппой группы всех жестких движений плоскости. Здесь нам следует более строго определить, что мы понимаем под орнаментами: они должны простираться как угодно далеко и быть дискретными в том смысле, что самосовмещение происходит «скачками». (Существует точное, но формальное математическое описание.) Можно провести классификацию соответствующих групп и убедиться, что существует всего 17 типов таких плоских орнаментов (9 из которых подходят скорее для бордюров, чем для обоев). Некоторые из них изображены на рис. 50—52.
Когда вы держите в руках каталог обоев — сотни и сотни различных узоров,— вам трудно представить себе, что их можно каким-нибудь разумным образом классифицировать. Их так много! Но если отвлечься от расцветки, размера, качества бумаги (все это относится к практической стороне производства обоев!) и сконцентрировать внимание лишь на основной структуре, то мож-
Рис. 50.
Рис. 51.
Рис, 52.
но убедиться, что имеется лишь 17 существенно различных типов структур. Говорят, что в работах арабских гончаров встречаются все 17 видов. Было бы интересно изучить современные каталоги обоев и выяснить, столь же ли они исчерпывающи. Вероятно, нет.
Аналогичная задача в трехмерном пространстве (здесь получается 230 возможных групп симметрии3) очень важна в кристаллографии: с помощью этих групп можно описывать молекулярное строение кристаллов.
Глава 8
АКСИОМАТИКА
Лишь слоны и киты производят на свет детенышей, которые весят больше 70 кг. Президент весит 75 кг. Значит, его мать — либо слониха, либо китиха.
Стефан Темерсон
Математика насчитывает много уровней. Ребенок чйтся решать задачи с одним или несколькими числами. Позднее он изучает общие свойства всех чисел ( в некотором смысле объект его изучения изменился, это уже не Число, а кольцо Z всех целых чисел). Далее, в теории колец он вместо одного конкретного кольца изучает классы колец. Целая область математики становится Одним объектом, а он, в свою очередь, является лишь одним из многих объектов другой области. И так далее.
В этой главе мы поднимемся на ступеньку выше. Объектами наших рассмотрений будут целые теории: теория колец, теория полей, теория групп, геометрия.
В наших определениях группы, кольца, поля много общего. Вводятся основные понятия. Эти понятия никак не определяются, Вместо этого перечисляется ряд законов, которым они должны удовлетворять. Эти законы суть аксиомы, а вся система в целом — аксиоматическая система.
Не требуется «верить» аксиомам. Даже поднимать этот вопрос и бесполезно, и бессмысленно — ведь за ними не стоит никакой реальности.
Всякий раз, когда вы сталкиваетесь с некоторой аксиоматической системой, кто-то другой сообщает вам, какими свойствами он наделил эту систему. Аксиомы —
это как правила игры. Если их изменить, вы будете играть уже в другую игру.
Основываясь на некоторой системе аксиом, можно далее строить некоторые логические выводы. Все они (явно или неявно) принимают такую форму: если данные аксиомы выполняются, то выполняется что-то еще. «Истинность» аксиом не обсуждается. Тот факт, что Римская империя распалась, не имеет отношения К дискуссии о том, что могло бы произойти, если бы она не распалась. Обсуждению подлежит лишь правильность вывода.
Можно обсуждать также пригодность данных аксиом в каждом конкретном случае. Соответствует ли происходящее в реальном мире тому, что утверждают аксиомы,— это уместный вопрос, когда речь идет о попытке применить соответствующую теорию к реальному миру, но этот вопрос не является частью рассматриваемой теории. Ответить на него можно лишь с помощью эксперимента. Аналогично, чтобы применить теорию групп к какой-либо ветви математики, необходимо проверить, являются ли соответствующие объекты группами. Если это не так, то теорию групп применять нельзя, Но на саму теорию групп это не оказывает никакого влияния. Верны ли аксиомы теории групп — бессмысленный вопрос, Аксиомы не являются истинными ни в каком абсолютном смысле; но они могут быть истинными в некоторых конкретных ситуациях.
Сила аксиоматического метода состоит в том, что он позволяет построить из небольшого числа допущений огромное здание теории. Если нечто удовлетворяет этим допущениям, то оно должно удовлетворять и всем заключениям, которые из них выводятся. Мы можем применить все результаты нашей теории для получения различных свойств: нам не надо заново проделывать всю работу для каждого приложения.
Представление об аксиоматической системе как о
чем-то оторванном от реальности сложилось сравнитель-но недавно. По-видимому, древние греки, устанавливая аксиомы геометрии, считали, что они выражают подлинные физические истины, хотя и для несколько идеализированной природы. Разумеется, аксиома определялась как очевидная, не требующая доказательства истина, и сейчас еще в имеющемся у меня словаре приводится такое определение, Но в математике это слово приобрело совсем иное значение. Обратимся к аксиомам группы. Очевидны ли они?
Аксиомы Евклида
Евклид дал список аксиом геометрии. Вот наиболее важные из них'
(1) Через любые две точки можно провести прямую
(2) Любые две прямые имеют не более одной общей точки.
(3) Любой конечный отрезок прямой можно неограниченно продолжать.
(4) Вокруг любой точки можно описать окружность произвольного радиуса.
(5) Ёсе прямые углы равны между собой.
(6) Для любой прямой и любой точки, не лежащей на этой прямой, существует прямая и притом единственная, параллельная первой и проходящая через эту точку.
(Формулировки не совсем такие, как были у Евклида.)
В течение долгого времени считалось недостатком, что аксиома (6) выглядит не вполне очевидной. Было предпринято множество попыток доказать ее, основываясь на других аксиомах, и все безрезультатно.
Позже мы увидим, что доказать таким образом аксиому (6) невозможно. Но вот существенный вопрос-истинна ли эта аксиома в реальном мире? Этот вопрос выходит за рамки математики. Чтобы ответить на него,
надо провести эксперимент. Вообразим, однако, что такой эксперимент осуществляют древние греки. Они проводят две «параллельные» прямые, например меридианы, через Рим и Афины, и те сходятся в Южном полюсе. В геометрии поверхности земного шара аксиома о параллельных неверна.
На самом деле это жульничество: мы знаем, что земной шар круглый, а евклидова геометрия прилагается к плоскости, а не к сфере. В действительности, если всерьез задуматься, наша уверенность, что земной шар круглый, основана именно на том, что на нем нарушаются законы евклидовой геометрии. Значит, если Евклид был неправ, то, быть может, земной шар совсем и не обязан быть круглым.
Более правильный эксперимент можно было бы поставить с помощью лазерных лучей или еще чего-нибудь подобного. Вы направляете лучи лазеров в межзвездное пространство, причем настолько параллельно, насколько сможете, и затем пытаетесь выяснить, пересекаются ли они. К сожалению, подобный эксперимент невозможно осуществить на практике. (А если верны некоторые космологические теории, то и его осуществление не подтвердило бы справедливости евклидовой геометрии.)
Похоже на то, что Евклид гораздо лучше понимал, что он делает, чем те, кто позднее его критиковали. Он, по всей видимости, подозревал, что аксиому о параллельных доказать нельзя, и потому явно ее сформулировал.
Непротиворечивость
Приступая к разработке аксиоматической теории, вы имеете в своем распоряжении лишь аксиомы (постольку, поскольку это касается логических выводов; психологически у вас могут быть некоторые интуитивные соображения о том, как должна развиваться эта теория). Вы их используете, чтобы доказать некоторые теоремы, а затем
Применяете $Ти теоремы для доказательства других. Аксиомы становятся источником широко распространяющейся волны теорем, каждая из которых в конечном счете от них зависит.
Все идет хорошо до тех пор, пока вы не получите на э^ом пути две противоречащие друг другу теоремы. Но если в вашей теории можно доказать две противоречащие друг другу теоремы, то вся она бесполезна. Ведь тогда в ней можно доказать все, что угодно.
Когда однажды на обеде известный математик Дж. Харди сделал подобное замечание, кто-то из присутствующих потребовал обосновать его: предположив, например, что 2 + 2 = 5, доказать, что Мак-Таггарт — папа римский. Харди ненадолго задумался и ответил: «Мы знаем также, что 2 + 2=4, значит, 5 = 4. Вычитая 3, получаем 2=1. Мак-Таггарт и папа римский — это два человека, следовательно, Мак-Таггарт и папа римский — это один человек».
Чтобы перейти к более общей ситуации, надо вспомнить, прежде всего, метод доказательства от против,-ного. Мы хотим доказать утверждение р. Начнем с предположения, что р неверно, и выведем из него два противоречащих друг другу утверждения. Но этого не может быть. Значит, наше предположение, что р неверно, является ошибочным. Законность этого метода основывается на современной математической логике. Мы использовали з — его в гл. 6 для доказательства иррациональности | 2 . Предположим теперь, что в некоторой аксиоматической системе можно вывести две противоречащие друг другу теоремы г и s. (Например, г—«масло дешево», as—«масло не дешево».) Этим можно воспользоваться, чтобы получить противоречие в предыдущем доказательстве, каково бы ни было р. Теоремы г и s можно вывести из р, поскольку их можно вывести из аксиом. Мы не обязаны действительно использовать р в этом выводе.
Например, чтобы доказать утверждение «страна разоряется», предположим противное, т ё. что она не разоряется. Выведем теперь оба противоречащих друг другу утверждения «масло дешево» и «масло не дешево». Тогда наше предположение оказывается неверным, и страна разоряется.
Совершенно так же можно доказать, что страна не разоряется, предположив, что она разоряется, и проведя 'те же самйе рассуждения.
Это полная катастрофа. Быть может, и возможно примириться с оракулом, который время от времени дает Два ответа: «да» и «нет» на один и Тот же вопрос. Но что за польза от оракула, который на все вопросы отвечает «да»?
Система аксиом, из которой нельзя вывести противоречащих друг другу утверждений, называется непротиворечивой, Непротиворечивость — важнейшее свойство аксиоматической теории. Его важность была впервые дтмечена Давидом Гильбертом, основоположником современной формальной аксиоматики.
Противоречивость противоречивой теории не всегда очевидна, Это очень тонкий вопрос. Аксиомы поля непротиворечивы. Но если слегка видоизменить закон (9), потребовав, чтобы каждый (а не каждый ненулевой) элемент имел обратный по умножению, то система станет противоречивой. Действительно, если бы 0 имел обратный О-1, то
(о-о) • о-1=о • о-1=1,
О - (О- О-1) =0- 1=0,
что противоречит закону ассоциативности, поскольку аксиома (10) на с. 103 утверждает, что 0=^=1. (Вот почему вы никогда не станете делить на нуль! Это нарушает законы арифметики.)
Таким образом, произведя очень небольшие изменения, мы превратили непротиворечивую систему в противо-150
речивую. И противоречивость второй системы неочевидна (если вы не знаете заранее, где должны возникнуть неприятности). Каким бы безобидным ни показалось заданное множество аксиом, непременно возникает вопрос об их непротиворечивости.
Модели
Гильберт сформулировал также еще два важных для аксиоматических систем свойства: полноту и независимость.
Для того чтобы объяснить, что такое полнота, надо ввести понятие доказательства в аксиоматической системе. Если р — некоторое утверждение этой системы, то его доказательством называют конечную последовательность утверждений, каждое из которых является либо аксиомой, либо логическим следствием некоторых из предыдущих, утверждений этой последовательности, причем последним в этой последовательности стоит р. Примером может служить доказательство утверждения
(х+у)2 = х2 + 2ху+у2
в гл. 6. Система полна, если для каждого утверждения р в ней можно найти или доказательство этого утверждения, или доказательство утверждения не -р. Иными словами, в нашем распоряжении имеется достаточно аксиом, чтобы доказать истинность или ложность любого мыслимого утверждения этой системы.
К полной системе никоим образом нельзя добавить еще одну аксиому — или она будет следствием из уже имеющихся (т. е. лишней), или будет им противоречить (т. е. система станет бессмысленной).
Множество аксиом независимо, если ни одну из этих аксиом нельзя вывести из других.
Доказать полноту системы (если она действительно волна) всегда нелегко, поскольку нужно рассмотреть все
возможные доказательства. Но существуют простые методы, позволяющие доказать независимость (при подходящих условиях), а иногда и непротиворечивость. Связаны они с понятием модели.
Модель аксиоматической системы — это некоторый объект, в котором аксиомы этой системы при подходящей интерпретации истинны. Любая группа является моделью для аксиом группы: абстрактная операция из этих аксиом интерпретируется как некоторая вполне определенная операция в рассматриваемой конкретной группе. Это может быть, например, сложение или умножение функций. Аналогично любое кольцо — это модель для аксиом кольца, а поле — модель для аксиом поля. Аналитическая геометрия на плоскости дает алгебраическую модель аксиом евклидовой геометрии, если интерпретировать точки как пары (х, у) действительных чисел, а прямые, окружности и т. п.— обычным образом.
Если для некоторой системы аксиом можно подобрать модель, то эта система должна быть непротиворечивой. Таблица умножения любой группы определяет некоторую модель; можно взять самый тривиальный пример:
X 1
1 I
Если бы система аксиом была противоречивой, то можно было бы доказать любую теорему, например, что каждая группа имеет 129 элементов. И так как эти аксиомы выполняются в нашей модели, то и все следствия из них также выполняются. Таким образом, наша модель должна содержать 129 элементов. Понятно, что это не так. Значит, система была непротиворечивой.
Это можно подтвердить и несколько иначе: любое противоречие между теоремами, выведенными из аксиом, найдет отражение в модели. Мы сумеем доказать и то,
что модель обладает некоторым свойством, и то, что она им не обладает. Но это невозможно — модель или обладает данным свойством, или нет, и одновременно обладать и не обладать им она не может.
Модели бывают полезны и для доказательства независимости. Чтобы доказать, что закон ассоциативности умножения в группе независим от других аксиом группы, надо лишь найти модель, в которой закон ассоциативности не выполняется, а все остальные аксиомы группы справедливы. Если бы закон ассоциативности выводился из других аксиом, то можно было бы доказать ассоциативность умножения в выбранной модели, но она выбиралась именно так, чтобы умножение не было ассоциативным,
Мы построим необходимую нам модель с помощью таблицы умножения. Нужно, чтобы в ней были справедливы аксиомы (1), (2), (4), (5) со с. 128, но не (3).
Для аксиомы (1) нам необходимо множество G. Чтобы облегчить задачу, возьмем маленькое множество, но не слишком маленькое, чтобы иметь некоторую свободу действий. Попробуем взять G= {о, Ь, а}.
Аксиома (4) утверждает существование единичного элемента. Если мы примем за единицу элемент а, то тем самым определим часть таблицы умножения:
X | а Ь с
а а b с b b с с
Далее, согласно аксиоме (5), у каждого элемента должен быть обратный. Наш единичный элемент а уже имеет обратный, так как а2 = а. Если положить be = cb = а, то тем самым определятся обратные для b и с. Теперь наша таблица выглядит так:
a b с a b с b a c a
и аксиомы (1), (4) и (5) выполняются.
Чтобы выполнялась аксиома (2), нужно определить произведение для любых двух элементов. Для этого нам осталось лишь заполнить пустые места в нашей таблице с помощью элементов а, b и с, причем неважно, как именно мы их расположим. По нам еще нужно, чтобы была неверна аксиома (3), и именно на это последнее требование мы будем ориентироваться, производя выбор. Поставить на оба оставшихся места элемент с нельзя — у нас получилась бы такая же таблица умножения, как для симметрий «бегущих ног», а умножение этих симметрий удовлетворяет закону ассоциативности, Попробуем сделать так:
X а Ь с а а Ь с b b Ь а с с а b
После нескольких
попыток найдем
(cc)b = bb=bf c(cb) =са—с,
то, что нам нужно:
т, е. закон ассоциативности не верен.
Таким образом, нужная модель построена. Построение моделей — это скорее искусство, чем наука. Оно требует опыта, склонности и «нешаблонности мышления» де Боно. Наилучший способ научиться строить модели — это пытаться их строить.
К вопросам непротиворечивости и полноты мы вер-
немея в гл. 20. Наша ближайшайЗщдГ^Нрйменйть метод моделей к вопросу о евклидовой аксиоме о параллельных.
Евклид был лрав
Проблему можно сформулировать так: является ли аксиома Евклида о параллельных независимой от других его аксиом? Сформулировав таким образом, мы ее уже наполовину решили, так как наибольшая трудность заключается в том, чтобы осознать возможность независимости этой аксиомы. МоЖет оказаться, что она выводится из других аксиом, может оказаться, что не выводится, но этим еще не исчерпываются все возможности.
Чтобы приступить к решению этого вопроса, необходимо сделать одно допущение, а именно — предположить, что аксиомы евклидовой геометрии непротиворечивы. Ведь мы собираемся использовать евклидову геометрию как «сырье» для модели. И если ее аксиомы противоречивы, то вопрос независимости отступает на второй план.
Построение моделей — это, как я уже говорил, искусство, но в данном случае искусство становится магией: мне не остается ничего иного, как взмахнуть волшебной палочкой и извлечь из шляпы кролика.
Проведем на плоскости окружность Г. Наша модель —-это та часть евклидовой геометрии, которая попадает внутрь круга, ограниченного этой окружностью. Чтобы избежать путаницы, для обозначения интерпретаций в модели стандартных понятий евклидовой геометрии мы будем использовать курсив:
точка — точка плоскости, лежащая внутри Г;
прямая — часть некоторой прямой на плоскости, лежащая внутри Г;
окружность — часть некоторой окружности на плоскости, лежащая внутри Г;
прямой угрл — обычный црдмой угол внутри Г;
(Вер это изображено на рис. 53.)
Проверим аксиомы (см. с. 146).
(Г) Через любые две точки можно провести прямую. Это верно. Любые две точки внутри Г — это точки на плоскости. Соединим их прямой на плоскости, а затем
Рис. 53.
ртбросим ту часть, которая не лежит внутри Г, и тем самым получим прямую (рис. 54).
(2) Любые две прямые имеют не более одной общей точки. Это верно. Две прямые являются частями двух прямых на плоскости, которые имеют не более одной общей точки, а значит, и не более одной общей точки (рис. 55).
(3) Любой конечный отрезок прямой можно неограниченно продолжать. Это уже не столь бесспорное утверждение. На первый взгляд кажется, что это просто неверно, поскольку как только прямая выходит за пределы Г, она перестает быть прямой. Но ведь и Евклид не имел
б виду, чтобы прямую продолжали за пределы плоскости — за край, так сказать. Построение должно ограничиваться рассматриваемой областью, т. е. мы должны рассматривать понятие продолжения, а не продолжения. Смысл аксиомы (3) состоит в том, что если у нас есть отрезок прямой с концами, его можно продолжить за эти
Рис. 54.
концы. Эго также верно в нашем круге, если, говоря «внутри» Г, мы исключаем из рассмотрения все точки, лежащие на Г. Действительно, как показано на рис. 56, мы можем последовательно продолжать отрезок прямой до точек 1, 2, 3, 4, 5, ..., и этот процесс никогда не прекратится
Сама прямая не имеет концов: те точки, которые могли бы служить ее концами, лежат на окружности Г, а не внутри нее и, значит, не являются точками. В этой модели все прямые продолжаются неограниченно,
(4) Вокруг любой точки можно описать окружность произвольного радиуса, Это следует из соответствующей
аксиомы для плоскости (как всегда, отбрасывается все, что находится на окружности Г и вне ее. Конечно, окружность уже не всегда будет «круглой» (рис. 57),
Но это не влияет на истинность аксиомы.
(5) Все прямые углы равны между собой опять-таки потому, что на плоскости все прямые углы равны между собой.
Таким образом, аксиомы (1) — (5) в рассматриваемой модели выполняются. Однако аксиома (6) в ней не выполняется: на рис. 58 показаны прямая, точка и несколько прямых, параллельных первой и проходящих через данную точку. Здесь, разумеется, мы «параллельные» понимаем как «непересекающиеся». И неважно, что если продолжить наши прямые за пределы рассматриваемого круга, то они пересекутся,— все точки, находящиеся вне круга, не принадлежат нашей модели.
Отсюда следует, Чтд аксиома (6) ревЫвддима из аксиом (1) — (Б), Если бы она была выводима из них, то поскольку аксиомы (1) — (5) в рассматриваемой модели истинны, то и аксиома (6) как их логическое следствие должна была быть истинной в этой же модели. Но это не так. Можно провести рассуждение несколько иначе{ любое доказательство аксиомы ----jt
(6) в евклидовой геометрии ста-Йовится доказательством этой Z— аксиомы в рассматриваемой мо-дели, если ааменить везде «точ- Г
ка» на «точка», «прямая» на I I
«прямая» и т. п. Так как аксио- V /
ма (6) в модели ложна, То пред- \ "у
полагаемое евклидово доказа-тельство Не может существовать, lot факт, что «точки» — это не рис. 58. то же самое, что «точки», ничего не меняет! ведь аксиомы (1) — (5) для них истинны.
Это я имел в виду, когда озаглавил раздеЛ «Евклид был прав». Не то, что евклидова геометрия — единственно возможная, а что Евклид был совершенно прав, введя свою аксиому о параллельных как исходную посылку, невыводимую из его остальных аксиом.
Другие геометрии
Выбрав другую модель, можно несколько улучшить доказательство, сделав, в частности, аксиомы (3) и (4) более убедительными. Для этого нужно так переопределить понятие длины внутри Г, чтобы все прямые стали бесконечно длинными (однако тогда они должны стать кривыми). Подробнее см. книгу Сойера2.
Можно устроить и так, чтобы параллельных прямых не было вовсе. Такая модель построена Клейном, В этой модели мы используем прописные буквы,
Рассмотрим сферу S в трехмерном пространстве. (Она будет играть ту же роль, что и внутренность Г.) Пусть
ПРЯМАЯ — это большая окружность на S (т. е. та окружность, центр которой совпадает с центром самой сферы);
ТОЧКА — пара диаметрально противоположных точек на 2.
Рис. 60.
Проверим аксиомы. Аксиома (2) истинна, поскольку любые два больших круга пересекаются в двух диаметрально противоположных точках. Другие аксиомы (1), (3), (4), (5) тоже выполняются (без всяких тонкостей по поводу (3)). Но поскольку любые две большие окружности пересекаются, параллельных прямых нет вообще! (См. рис. 59.)
Теперь в нашем распоряжении три различных рода геометрии: евклидова геометрия, гиперболическая геометрия, где через точку проходит много различных параллельных прямых, и эллиптическая геометрия, где параллельных прямых не существует.
Риман ввел общую геометрию, которая может быть эллиптической в одних областях и гиперболической в других. Ее двумерный вариант можно представлять как геометрию некоторой искривленной поверхности (рис. 60).
Возле точки А геометрия эллиптическая, а возле В — гиперболическая. (Это объясняет терминологию: сечение
рассматриваемой поверхности возле точки А близко к вллипсу, а возле точки В — к гиперболе.)
Идея Римана развивается дальше. Существуют пространства размерности (три или более), геометрия которых также меняется от точки к точке: «искривленное» пространство! Согласно Эйнштейну, обычное пространство — время имеет именно такую геометрию. Мы можем считать, что кривизна вызывается гравитационным полем вещества или же, наоборот, вещество и тяготение есть следствие искривления пространства.
Если геометрия пространства — времени в некоторой области эллиптическая, то не исключена возможность отправиться в путь по прямой и в конце концов вернуться в исходную точку. Хуже, если это случается со временем: вы можете вернуться раньше, чем выйти. Это кажется неправдоподобным. Но некоторые астрономы заявляют, что слишком большое количество радиозвезд расположено в диаметрально противоположных точках неба, чтобы это могло оказаться случайным. Быть может, такая пара звезд — это одна звезда, видимая с двух противоположных направлений.
6 Я. Стюарт
Глава 9
СЧЕТ. ПОНЯТИЕ О БЕСКОНЕЧНОМ
«Четырнадцать»,~~ сказал Пух. «Входите. Четырнадцать. Или пятнадцать? Ох. Я совсем за* путался».
А. А. Милн
Никто не станет учить ребенка считать, объясняя ему, что такое число. Вместо этого ему будут показывать двух собак, два яблока, две книги, и постепенно он выделит свойство, общее всем этим примерам, и сам выработает какое-то свое представление о «числе».
Числа — это свойства множеств. Из двух элементов состоит множество яблок, собак и т. д., и в процессе счета мы как раз устанавливаем количество элементов множества. Когда математики всерьез задумались над вопросом, что же такое число, они прежде всего обнаружили этот факт. Кроме того, им стало ясно и другое: легче установить, совпадают или нет два числа, чем сказать, каковы они.
Если ребенок видит две чашки, каждую со своим блюдцем, то наступит день, когда он поймет, что и блюдец тоже два. Если у нас семеро гостей, а стульев всего шесть,— кто-то останется без стула. Если администратор театра видит, что каждое кресло занято одним зрителем, он понимает, что зрителей ровно столько, сколько мест в зале, и для этого ему не надо знать само количество мест.
Это означает, что понятие «равные числа» не связано с понятием «число» (несмотря на причуды языка). Подобным же образом, приложив друг к другу два куска веревки, можно установить, что они имеют одинаковую длину, так никогда и не узнав, чему она равна, или при
помощи равноплечих весов убедиться, что два тела имеют одинаковую массу,
Во всех этих случаях легче сказать, обладают или нет два данных объекта общим свойством, чем объяснить в общем виде, что это за свойство. Все, что требуется,— придумать способ сравнения объектов по отношению к этому (пока не определенному) свойству.
Метод сравнения длин или масс выбрать нетрудно, а как сравнивать числа?
Вернемся к примеру о зрителях в театре. Чтобы знать наверное, что число зрителей в точности равно числу мест в зале, нужно знать две вещи:
а) каждый зритель занимает ровно одно место;
б) каждое место занято ровно одним зрителем.
Пусть S—множество мест, а Р—множество зрителей и выполнены эти условия. Тогда для каждого зрителя р С Р мы можем определить f(p)£S как место, которое он занимает. Тем самым будет задана биекция /: P->S. В самом деле, во-первых, f—функция: Р—ее область определения, S — множество, содержащее ее область значений, и указанное выше правило однозначно (в силу условия «а») задает f (р) для каждого р. Во-вторых, f сюръективна, так как, по условию «б», каждое место занято, и инъективна, так как, по тому же условию, каждое место занято только одним зрителем.
И в общем случае два множества имеют равное число элементов тогда и только тогда, когда между ними существует биекция (взаимно .однозначное соответствие), Эту ситуацию иллюстрирует рис. 61.
Во избежание лингвистических проблем назовем два множества равночисленными, если между ними существует биекция. Тогда станет несколько яснее, что, говоря о «равных числах», можно пока не знать, что такое число. Подобно тому как мы разбивали целые числа на классы сравнимых по некоторому модулю, разобьем теперь множества на классы равночисленных: два мно
жества отнесем к одному классу тогда и только тогда, когда они равночисленны. Каждый класс можно задать, указав один из его членов. Например, класс, содержащий множество {a, b, с, d, е), включает в себя любое равночисленное с ним множество, а таковыми являются те и только те множества, которые состоят из пяти элементов. Эту ситуацию иллюстрирует рис. 62.
Рис. 61,
Рис. 62.
В этом смысле число 5 будет задано, если
а) задано некоторое множество и сказано, что оно состоит из 5 элементов;
б) сказано, что любое множество, равночисленное с заданным, тоже состоит из 5 элементов.
Как заметил Фреге, мы попадаем в весьма занятную ситуацию. С одной стороны, имеется загадочное и удивительное понятие: «число», которому мы не можем дать определение. С другой стороны, есть вполне земное понятие: класс, к которому относится данное множество. Двум множествам отвечает одно и то же число тогда и только тогда, когда они из одного класса. Отсюда следует, что если знать все о классах, то будешь знать все и о числах.
На этом этапе можно занять одну из следующих двух позиций:
А) каковы бы ни были эти дурацкие классы, я прекрасно знаю, что они не числа, а только ведут себя, как числа;
В) я не знаю, что такое числа, я просто пользуюсь этим словом. Эти классы ведут себя точно так же, как мои гипотетические числа, и имеют то преимущество, что я знаю, что они такое. Я мог бы сказать, что классы и есть числа.
Какую именно из этих позиций занять,— не очень существенно, важно только понимать, что позиция «В» имеет одну привлекательную сторону: классами можно воспользоваться для определения чисел, и это определение будет вполне удовлетворительным *. И действительно, показывая ребенку двух собак, два яблока, две книги, мы как раз и демонстрируем ему элементы класса, отвечающего числу 2.
Вот все, что нам требуется знать о числах: каждому множеству отвечает нечто, называемое числом, причем двум множествам отвечает одно и то же число тогда и только тогда, когда они равночисленны.
Существование чисел можно принять за аксиому, А дальше можно построить всю арифметику. Сначала определим несколько чисел:
О отвечает пустому множеству 0
1 отвечает множеству {х},
2 отвечает множеству {х, у},
3 отвечает множеству {х, у, z},
4 отвечает множеству {х, у, г, ш}
Конечно, все х, у, z, w, ... выбираются различными.
Затем введем сложение и умножение. Вспомним, как это делают в начальной школе: чтобы сложить 3 и 2, берут три фишки, потом еще две, выкладывают их все в ряд и считают, сколько получилось (рис. 63).
Важно, чтобы фишек хватило! Если две новые взять из трех старых, ответ получится неправильный!
Таким же способом можно определить сложение любых двух чисел. Возьмем два числа т и п. Найдем отвечающие им множества М и N (соответственно), причем такие, которые не пересекаются, т. е. не имеют общих элементов (в теории множеств это обозначается так!
MHN=0 )• Образуем объединение Л4 (J N. Ему отвечает
какое-то число. Это число и будем, по определению, считать суммой т + п (рис. 64).
По поводу этого определения нужно сделать два замечания. Во-первых, всегда можно найти непересекаю-щиеся множества М и N. В самом деле, если они пересекаются, можно заменять по одному общие элементы другими, и сам способ замены определяет биекцию между старым и новым множеством, которая гарантирует, что они остаются в одном классе.
Во-вторых, сложение должно быть «корректно определено». Взяв другие множества М' и N', отвечающие числам т и п, придем ли мы к тому же результату? Если нет, то наше определение бесполезно. Что же это за сложение, если одним способом получается 2 + 2 = 4, а другим 2+2 = 5?
Допустим, что выбраны другие множества М' и N', которые не пересекаются и отвечают числам т и п. Тогда М и М' отвечают одному и тому же числу, и, значит, существует биекция /: М-^-М'. По той же причине существует биекция g: N->N'. Тогда можно построить биекцию h: М (J N -> М' (J N', если положить
лж = Jпри хеМ’
1 g (х) при х 6 N.
(Нужно еще проверить, что это действительно биекция. Интуитивно это очевидно из рис. 65.)
Теперь у нас достаточно информации, чтобы доказать знаменитую теорему: 2+2 = 4.
Сначала нужно найти непересекающиеся множества Л4 и 7V, каждое из которых отвечает числу 2. По определению, можно взять М — {х, у}. В качестве N возьмем множество {а, Ь}, где х, у, а, b все различны. Существует биекция f: М -> N, при которой f (х) = a, f (у) = Ь, так что М и N равночисленны. Значит, N тоже отвечает числу 2. Затем образуем М (J N = {х, у, а, Ь}. Существует биекция
между этим множеством и множеством {х, у, г, го}, определенная формулами g (л) = х, g (у) = у, g (о) = z, g (b) — w. Множество {x, у, г, то}, по определению, отвечает числу 4, значит, и Л4 J N отвечает числу 4. По определению сложения, 2 4-2 = 4.
Схема этого рассуждения представлена на рис. 66.
Немного легче определить умножение, поскольку при этом не придется заботиться о том, чтобы соответствующие множества не пересекались. Чтобы перемножить числа т и п, возьмем соответствующие множества М и N, построим их декартово произведение MxN (гл. 4) и отвечающее ему число будем, по определению, считать произведением тп. В том, что это правильное определе-
Рис. 66.
ние, можно убедиться при помощи рис. 67. (Здесь снова необходимо проверить, что при другом выборе Л'1 и N получится тот же ответ, и это нетрудно сделать.)
Еще более впечатляет то, что при таком подходе можно доказать законы арифметики, по крайней мере для положительных целых чисел (а из них уже можно
Рис. 67.
вывести эти законы для отрицательных целых, для рациональных и для действительных чисел 2), Возьмем, к примеру, закон дистрибутивности:
(т + п)р = тр + пр.
Пусть множества А4, N, Р отвечают числам т, п, р причем М и N не пересекаются. Тогда (т + п) р отвечает множеству (Л! U N) х Р, а тр + пр — множеству (Л1 х xP)U(-MxP). Но эти два множества совпадают: первое состоит из всех упорядоченных пар (х, у), где М или х С N, а у £Р', второе состоит из всех упорядоченных пар (х, у), где х 6 М и у£Р или N и у 6 Р (рис. 68).
Раз эти множества совпадают, то между ними существует биекция, определяемая в данном случае тождественным отображением. Следовательно, они равно
численны, отвечающие им числа равны, и закон дистрнч бутивности доказан.
Аналогично доказываются другие законы арифмв*
тики.
В заключение этого раздела попробуем по-новому истолковать способ счета,, применяемый ребенком*

Рис. 68.
Обычно он указывает по очереди на каждый предмет и произносит: «один, два, три, ...». Если в качеств^ стандартных множеств для определения чисел мы возьмем 0 ,{1}, {1, 2}, {1, 2, 3},{1, 2, 3, 4} и т. д. (где 1, 2, 3,
Рис. 69.
...— какие-то символы), то этот детский счет удивительно нй'поминает установление биекции между данным множеством предметов и одним из наших стандартных множеств (рис. 69).
Арифметика бесконечного
Все предыдущие рассуждения, как обнаружил Георг Кантор, пригодны не только для конечных, но и для бесконечных множеств. (А мы нигде и не говорили, что рассматриваем лишь конечные множества, но умышленно приводили конечные примеры.) Понятие биекции вполне подходит для бесконечных множеств, поэтому можно говорить об их «равночисленности», а это позволяет ввести бесконечные «числа», считая, как раньше, что равночисленные множества определяют одно и то же число, и наоборот.
Чтобы никого не шокировать, математики придумали для этих «чисел» другое слово, точнее, воспользовались уже существующим словом «мощность». Их называют также кардинальными или трансфинитными числами, а вместо слова «равночисленные» пользуются термином «равномощные». Для конечного множества мощность — это число его элементов; мощность бесконечного множества также обладает многими свойствами, напоминающими о происхождении этого понятия. Данные выше определения сложения и умножения также годятся и для кардинальных чисел, и для них справедливы законы коммутативности, ассоциативности и дистрибутивности, Однако за выход в бесконечность приходится кое-чем и поступиться.
Одно любопытное свойство кардинальных чисел было отмечено Галилеем в 1638 г.: оказывается, существует биекция между бесконечным множеством и его меньшим подмножеством. Например, функция f, для которой f (п)=п2} является биекцией между множеством N нату«
ральных чисел и его подмножеством — множеством полных квадратов. Значит, бесконечное множество может иметь ту же мощность, что и какая-то его часть. Таким образом, евклидов принцип: целое больше своей части — следует несколько уточнить: целое больше или равно своей части (где под «равно» понимается «равномощно»)
Изменив немного наши прежние диаграммы для функций, мы получим подходящий способ изобразить эту биекцию:
0 1 2 3 4 5 6 ... п ...
t t t t t ♦ t t
444**44 *
0 1 4 9 16 25 36 ... n2 ...
Существуют и другие подобные биекции: между N и множеством четных натуральных чисел, или нечетных, или всех целых, или простых. Вот эти биекции:
0 1 2 3 4 5 6 ...
t t t t t t t
i i ♦ i i * 4
0 2 4 6 8 10 12 ...
0 t 4
1
12 3 4
5 t г
11
6 ...
t
i
13 ...
t
3
t i 5
t
4
7
t 4
9
0 t
4 0
1 t I 1
2 3 4 5 6 ..
1 1 t 1 г
4 4 4 4 1
— 1 2 —2 3 —3 ...
0 1
t t 4
2 3
2 t
4
5
3
1
4
7
4 5 6 ...
t t t
4 4 4
ll 13 17 ...
Это означает, что все перечисленные множества имеют одну и ту же мощность. Мощность множества N нату
ральных чисел обозначается (алеф-нуль). Кантор предполагал, что имеется целая система бесконечных кардинальных чисел Ко К* , из которых Ко “ наименьшее.
Всякое множество мощности Ко называется счетным (поскольку биекция с N позволяет его «пересчитывать», хотя этот счет никогда не кончится). Бесконечные множества, которые не являются счетными (а бывают и такие), называются несчетными.
Только что мы показали, что множества А и В четных и нечетных чисел оба счетны. Они не пересекаются, и их объединение есть N. По определению сложения кардинальных чисел, мощность N равна сумме мощностей А и В. Но N тоже счетно, поэтому
Ко+Ко = Ко •
Итак, мы удвоили Ко , а оно осталось тем же. Это еще одна жертва, которую приходится принести, если мы хотим рассматривать бесконечные множества. (Заметим, что отсюда не следует равенство Ko=Q поскольку вычитать мощности мы не умеем.)
Большие и маленькие бесконечности
Мощности можно сравнивать по величине. В случае конечных множеств М и N, если в М меньше элементов, чем в N, существует инъекция М в N (как на рис. 70).
Обобщим этот факт. В случае бесконечных кардинальных чисел аир будем говорить, что а меньше или равно р, если найдутся такие множества А и В мощностей соответственно а и р, для которых существует инъекция /: А-+В. Иначе говоря, это условие означает, что некоторое множество мощности а можно поставить во взаим
но однозначное соответствие с подмножеством некоторого множества мощности р. Как обычно, мы пишем
Будем говорить, что а меньше р, если а р и а р.
Это отношение порядка кардинальных чисел обладав ет несколькими приятными свойствами:
а) аа для любого а;
б) если а^р и Р^у, то
в) если а^р и р^а, то а=р.
Свойство «в» доказать очень нелегко. Оно составля-ет содержание известной теоремы Шредера Бернштейна 3.
i 4г
ООО
Рис. 70.
До сих пор мы познакомились только с одним бесконечным кардинальным числом . Существуют ли другие?
Можно было бы думать, что множество Q рациональных чисел имеет большую мощность; ведь между любыми двумя целыми числами лежит бесконечно много рациональных. Однако это не так.
Представим себе, что все рациональные числа p/q (g^O) расположены в виде бесконечной квадратной таблицы;
1 ! | 1 1
• • • 3/—3 3/-2 3/-1 3/1 3/2 3/3 • . •
• • • 2/—3 2/—2 2/-1 2/1 2/2 2/3
• • • 1/-3 1/-2 1/-1 1/1 1/2 1/3
».. 0/—3 0/—2 0/-1 0/1 0/2 0/3
•.« —1/—3 -1/-2 -1/-1 -1/1 —1/2 -1/3
• • • —2/—3 —2/—2 -2/-1 —2/1 —2/2 —2/3
• « • —3/—3 —3/—2 —3/—1 -3/1 —3/2 —3/3
А теперь пойдем по спиральному пути, начиная от точки 0/1 (рис. 71),
Двигаясь по этому пути, мы рано или поздно достигнем любого рационального числа p/q. Определим функцию f: N -> Q так: положим f(n) равным n-му по порядку числу вдоль нашего пути, считая только те рациональные числа, которые не встретились раньше. Это правило однозначно определяет f (п) и, еле- рис_ 71 довательно, задает функцию.
Она сюръективна, так как путь проходит через каждое рациональное число, и инъективна, так как учитываются только различные рациональные числа. Значит, установлена биекция между N и Q, а следовательно, мощность
Q тоже равна .
Несколько первых рациональных чисел на нашем пути таковы: 0/1, 0/2, 1/2, 1/1, 1/—1, 0/—1, — 1/—1, —1/1, -1/2, -1/3, 0/3, 1/3, 2/3, 2/2, 2/1, .„ Некоторые из них
повторяются: 0/1 =0/2 = 0/—3 = 0/3 = 0; 1/1 = — 1/—3=
= 2/2=1 и т. д. Исключив эти повторения, получим
0123 4 5 6 78...
ftttf t t ft
I I t I I 4 4 II
0 1/2 1 —1 —1/2 —1/3 1/3 2/3 2 ...
Закономерность, по которой нижняя строка получается из верхней, не очевидна, но мы тем не менее знаем, как продолжить эту строку, двигаясь дальше по спирали. Получить формулу n-го рационального числа трудно, но, поскольку функция не обязательно должна задаваться формулой, нас это не волнует.
Другой возможный кандидат на роль множества, мощность которого больше ,— множество R дейст-
вительных чисел. Поскольку каждое действительное число допускает приближение рациональными числами с любой точностью, можно было бы думать, что мощности этих множеств одинаковы. Однако на этот раз это не так. Мощность множества R — обозначим ее с — больше, чем Ко1.
Это доказывается методом от противного. Допустим, что существует биекция между множествами N и R. Каждое действительное число записывается в виде
где А — целое, а каждое а, равно одному из чисел от 0 до 9. При этом следует помнить, что в десятичной записи имеется неопределенность: 0,1 000... = 0,0999... . Она возникает тогда, когда бесконечно повторяются нули или девятки, поэтому давайте договоримся не пользоваться записью с повторяющимися девятками. Тогда каждое действительное число будет единственным образом записываться в указанном виде.
Биекция N->R выглядела бы так:
Оч- 1 Р с? к? о «я
1ч > В, bL b2 Ь3 Ьц Ь6
2 ч- Су Сл
Зч- -+-D, d1 d2 d3 dt d6
4ч- £> C2 ^3 ^4 ^6 '
где слева стояли бы все числа из N, а справа — все числа из R.
Теперь мы выпишем число из R, которого справа нет. Возьмем число
О, Z1Z2Z3Z4Z6...,
ГДе Zi отлично от ab z2 отлично от b2, z3 отлично от с3 и т. д., z„ отлично от n-й цифры после запятой числа, стоящего напротив п—1. Кроме того, во избежание неопределенности будем выбирать наши zb z2, ... отличными от 0 и 9.
Полученное число будет действительным. Однако оно не совпадает ни с одним из чисел правого столбца, поскольку отличается от каждого из них хотя бы в одном десятичном знаке: от первого — в первом, от второго — во втором и т. д., от н-го (стоящего напротив и—1) — В /1-м.
Итак, мы нашли число, которое не вошло в нашу диаграмму. Но мы утверждали, что в нее входят все действительные числа. Значит, мы пришли к противоречию.
Остается сделать вывод, что такой диаграммы не существует, а значит, не существует биекции N~>R. Отсюда видно, что мощность множества R не равна ^0. Но существует очевидная инъекция N—>R (тождественное отображение N), так что ^0^с, Хо*с то есть $о<с. Таким образом, судя по мощностям,
действительных чисел больше, чем рациональных, а рациональных ровно столько же, сколько целых.
Итак, у нас появилось новое кардинальное число с, большее, чем .Не является ли это с канторовским ?Ответ зависит от того, существует или нет кардинальное число, меньшее, чем с,но большее, чем .Эта г» проблема была решена Коэном в 1963 г., но решение Оказалось настолько неожиданным, что мы отложим разговор о нем до гл. 20.
Существуют кардинальные числа, большие с. Самого большого кардинального числа вообще нет: для любого кардинального числа а можно найти большее кардинальное число.
Возьмем какое-нибудь множество А мощности а. Пусть Р — множество всех его подмножеств и 0 — мощность Р. Покажем, что 0>а.
Сначала заметим, что формула f (х) — {х} определяет инъекцию А->Р. Поэтому заведомо а^0. Если а == то существует биекция h: А->Р. Для каждого х£ А элемент h(x) является подмножеством А. При этом х либо принадлежит h (х), либо не принадлежит. Определим множество Т условием Т = {х| х не принадлежит й(х)}. Это подмножество множества А, так что Т € Р. Поскольку h— биекция, найдется t^A, для которого h(t) = T.
Посмотрим теперь, принадлежит t множеству /i(/) или нет. Если да, то Т. Но Т состоит из тех х, для которых х£ h (х), откуда следует, что h(f). С другой стороны, если то t удовлетворяет условию, опреде-
ляющему Т, и, значит, Т. Но Т = h(t), поэтому h(t).
В любом случае мы приходим к противоречию. Следовательно, неверно исходное предположение о существовании h. Тогда 0=^=а, и остается единственная возможность: а<0.
Этот факт позволяет дать другое доказательство несчетности множества R. Всякому подмножеству S мно
жества натуральных чисел можно поставить в соответствие действительное число
О,
где а„=1, если п С S, и ап = 2, если п С S. При этом разным подмножествам S соответствуют разные числа. Значит, определена инъекция множества подмножеств множества N в множество R. Но мощность множества подмножеств N больше , следовательно, и мощность R больше .
Трансцендентные числа
Если бы бесконечные кардинальные числа годились только для того, чтобы доказывать теоремы о бесконечных кардинальных числах, вряд ли они бы кого-нибудь особенно заинтересовали. Обратить на них внимание заставила математиков возможность применять их для доказательства теорем, не относящихся к кардинальным числам.
Некоторые действительные числа удовлетворяют уравнениям вида
апхп + On-iX”-1 +... + а0 = О, где в левой части стоит многочлен с целыми коэффициентами az . Например, число ~]/~2 удовлетворяет уравнению
х2—2 = 0.
Такие числа называются алгебраическими. Любое действительное число, не являющееся алгебраическим, называется трансцендентным.
В гл. 6 мы отмечали, что все числа, для которых возможно построение, удовлетворяют уравнению такого вида, но с рациональными коэффициентами. Умножив
такое уравнение на общий знаменатель всех коэффициентов, мы получим уравнение с целыми коэффициентами. Следовательно, всякое такое число является алгебраическим. Кроме того, мы там утверждали, что число л не удовлетворяет никакому уравнению такого вида, иначе говоря, оно трансцендентно.
Математики в течение многих лет подозревали, что л трансцендентно, но не могли это доказать. Хуже того, ни для каких чисел вообще не удавалось доказать, что они трансцендентны. Затем в 1844 г. Лиувилль доказал теорему, которая давала способ построения трансцендентных чисел. Это доказательство отнюдь не отличалось простотой! В 1873 г. Эрмит доказал трансцендентность числа е (основания натуральных логарифмов), а в 1882 г. Линдеман установил трансцендентность числа л.
И вот в 1874 г. Кантор нашел очень простой способ доказать существование трансцендентных чисел, не указывая ни одного из них. Он воспользовался бесконечными кардинальными числами.
Допустим, что задан многочлен
апхп +ап-iXn~ * +... + Gq.
Назовем его высотой числа
| ао | + | 1 +... + | ап | + п.
Например, высота многочлена х2 — 2 равна
|-2| + |1|+2 = 2+2+1 = 5.
Всякий многочлен с целыми коэффициентами имеет конечную высоту. Более того, имеется только конечное число многочленов любой заданной высоты h. В самом деле, степень п меньше высоты, а каждый коэффициент может принимать лишь одно из значений — h, —h + 1, ..., — 1, 0, 1, 2, ..., h. Итак, многочленов высоты h во всяком случае не больше, чем
(2h+1 )'*+>,
(Эту оценку можно было бы улучшить, но здесь нас устраивает любая оценка.)
Таким образом, все многочлены с целыми коэффициентами можно расположить в последовательность: сначала перечислить многочлены высоты 1 (в любом порядке), затем высоты 2, высоты 3 и т. д. Поскольку многочленов каждой высоты конечное число, мы не застрянем навсегда на какой-то определенной высоте, и каждый многочлен с целыми коэффициентами где-то в нашей последовательности обязательно появится.
Многочлены высоты 1—это 1 и —1. Многочлены высоты 2 —это 2, —2, х, — х; высоты 3 — это 3, —3, 2х, —2х, х+1, х—1, — х+1, — х— 1, х2, — х2. Значит, наша последовательность начинается так: 1, —1, 2, —2, х, —х, 3, —3, 2х, —2х, х+1, х—1, —х+1, —х—1, ... . Обозначим n-й многочлен в этой последовательности рп(х); тогда она примет вид:
Pi(x), Рг(х), Рз(Х), ..., рп(х), ....
причем здесь встречается каждый многочлен с целыми коэффициентами.
Алгебраические числа — это корни уравнений
Рп(х)=0.
Если степень многочлена рп(х) равна d, это уравнение имеет не более d корней, которые можно написать в каком-нибудь порядке:
«1... CLd-
Записав подряд корни каждого многочлена Рп(х), мы получим новую последовательность, содержащую каждое алгебраическое число:
Pi, р,, Р<+1, ••• Р/, •••» Ра , .... Р/, ... корни корни корни
А (*) = 0 р2 (х) = 0 рп (х) = 0
При stom, конечно, всякое алгебраическое число может встретиться в этой последовательности не один раз.
Теперь для всякого натурального т определим f(m) как (m-f-l)-e число в нашей последовательности, считая только различные алгебраические числа. Тем самым будет задана функция f из N в множестве алгебраических чисел. Она сюръективна, потому что в нашу последовательность входит каждое алгебраическое число, и инъективна, потому что учитываются только различные алгебраические числа. Значит, / — биекция, откуда следует, что множество алгебраических чисел имеет мощность $0, т. е. счетно.
Но, как мы знаем, множество действительных чисел несчетно. Значит, некоторые действительные числа не являются алгебраическими. Тем самым доказано существование трансцендентных чисел.
Короче; трансцендентные числа существуют, потому что действительных чисел больше, чем алгебраических.
Перед нами пример чистого доказательства существования. Из него мы не узнаем ни одного трансцендентного числа. В частности, оно не поможет установить статус л. Из него понятно лишь одно: невозможно, чтобы трансцендентных чисел совсем не было.
На самом деле оно показывает, что трансцендентных чисел больше, чем алгебраических. Если бы их было столько же, т. е. их число равнялось бы , то поскольку каждое действительное число либо алгебраическое, либо трансцендентное, выполнялось бы равенство
t^o + Ko = C,
где с — мощность R. Но мы уже знаем, что а не равно с.
До того как Кантор доказал свою теорему, математики привыкли думать, что трансцендентные числа —
большая редкость, поскольку они, казалось, почти не рспользущтся. Выло настоящим ударом узнать, что они весьма обычны и что почти все действительные числа Франсцендентны. Если вы наугад выберете какое-то Действительное число, оно почти наверняка окажется 1*рансцендентным,
Глава 10
топология
«Тополог — это тот, кто набивает чучела?» Из разговоров
Одним из самых неожиданных явлений в развитии математики 20 в. стал головокружительный взлет науки, известной под названием топология. Желая пояснить, что такое топология, иногда говорят, что это «геометрия на резиновой поверхности». Это малопонятное и туманное описание позволяет тем не менее уловить суть предмета. Топология изучает те свойства геометрических объектов, которые сохраняются при непрерывных преобразованиях. Непрерывные преобразования характеризуются тем, что точки, расположенные «близко одна к другой» до преобразования, остаются такими и после того, как преобразование закончено. При топологических преобразованиях разрешается растягивать и изгибать, но не разрешается рвать и ломать. (Однако, с одной оговоркой: когда речь идет о преобразованиях, нас не интересует, что происходит в процессе этих преобразований, важны только начальное положение и конечный результат. Поэтому допускаются, скажем, разрезы по каким-то линиям, которые потом склеиваются по тем же линиям. Например, если шнурок завязан узлом и его концы соединены, можно разрезать его где-то, развязать узел и снова соединить на месте разреза. В этом смысле выражение «геометрия на резиновой поверхности» не слишком удачно.) Можно было бы дать строгое определение «непрерывности», однако пока мы ограничимся интуитивным представлением о ней. Этот вопрос будет поднят еще раз в гл. 16.
Какого рода свойства являются топологическими? Ясно, что не те, которые изучаются в обычной евклидо-
вой геометрии. Прямолинейность не есть топологическое свойство, потому что прямую линию можно изогнуть, и она станет волнистой. Треугольность — тоже не является топологическим свойством, ибо треугольник можно непрерывно деформировать в окружность (рис. 72).
Итак, в топологии треугольник и окружность — одно и то же. Длины отрезков, величины углов, площади — все эти понятия изменяются при непрерывных преобразованиях, и о них следует забыть. Очень немногие привычные понятия геометрии годятся для топологии, поэтому приходится искать новые. Этим топология трудна для начинающего, пока он не постигнет сути дела.
Образцом топологического свойства объекта служит наличие дырки у Рис 72 бублика (причем довольно тонкая сторона этого дела — тот факт, что дырка не является частью бублика). Какую бы непрерывную деформацию ни претерпел бублик, дырка останется. Другое топологическое свойство — наличие края. Поверхность сферы не имеет края, а пустая полусфера имеет, и никакое непрерывное преобразование не в состоянии это изменить.
Существует очень много различных непрерывных преобразований, поэтому топологам что бублик, что какая-нибудь другая штука с одной дыркой — все едино (в этом мы убедимся в следующем разделе). У тополога меньше объектов изучения, и в этом смысле предмет изучения в топологии проще1 чем в большинстве других разделов
математики (хотя сама топология как предмет отнюдь не проще других). В этом одна из причин того, что топология превратилась в мощный инструмент математики в целом: ее простота и общность обеспечили ей широкий круг применений.
Топологическая эквивалентность
Основные объекты изучения в топологии называются топологическими пространствами. Интуитивно их можно представлять себе как геометрические фигуры. Математически это — множества (иногда — подмножества евклидова пространства), наделенные дополнительной структурой под названием топология, которая позволяет формализовать понятие непрерывности. Поверхность сферы, бублика (правильнее — тора) или двойного тора — это примеры топологических пространств (рис. 73),
Рис. 73.
Два топологических пространства топологически эквивалентны, если можно непрерывным образом перейти от одного из них к другому и непрерывным же образом вернуться обратно, Часто говорят, что тополог не отли
чает бублика от кофейной чашки. Это как раз и есть пример топологической эквивалентности (рис, 74),
На языке теории множеств можно сказать, что у нас есть два топологических пространства А и В и требуется, чтобы существовала функция fi А -+В, удовлетворяющая условиям:
a) f биективна,
б) f непрерывна,
в) обратная к f функция тоже непрерывна.
Нам приходится вводить требование непрерывности как функции f, так и обратной к ней, по следующей причине. Возьмем два куска глины и слепим их вместе. Та-
Рис. 74.
кое преобразование непрерывно, поскольку близкие друг к другу точки останутся таковыми (рис. 75). Однако при обратном преобразовании один кусок распадается на
Рис. 75.
Рис. 76.
два (рис. 76), и, следовательно, близкие точки по разные стороны от линии раздела окажутся далеко друг от друга, т. е. обратное преобразование не будет непрерывным. Такие преобразования нам не подходят.
В качестве упражнения попытайтесь разбить топологические пространства, изображенные на рис. 77, на классы топологически эквивалентных.
Рис. 77.
Некоторые необычные пространства
Если бы все топологические пространства были такими удобными, как сфера или тор, вряд ли стоило бы заниматься топологией. Несколько более экзотических примеров, возможно, помогут разбудить вашу интуицию.
Вы, наверное, слышали о ленте (или листе) Мёбиуса, которую можно получить из бумажной полоски, склеив ее края после поворота на 180° (рис. 78).
Лента Мёбиуса топологически не то же самое, что цилиндрическая лента, склеенная из той же полоски. Она имеет только один край (посчитайте!). Поскольку коли-
Рис. 78.
чество краев — топологическое свойство, а цилиндрическая лента имеет два края, эти две ленты топологически неэквивалентны.
Известно еще одно свойство ленты Мёбиуса — то, что она имеет лишь одну сторону. Цилиндрическую ленту можно раскрасить двумя цветами — одну сторону красным, другую синим. Проделать то же самое с лентой Мёбиуса не удастся.
К сожалению, свойство односторонности трудно описать математически строго и в то же время достаточно наглядно. Ведь наша лента не имеет толщины, и каждая ее точка находится «на» обеих сторонах, подобно тому как каждая точка плоскости лежит «на» обеих ее сторонах. В топологии мы должны рассматривать эту ленту как некое пространство, а не подмножество евклидова пространства, и тогда не совсем очевидно, является ли количество сторон топологическим свойством.
Чтобы пояснить эту мысль, позвольте мне задать вопрос: сколько сторон у трехмерного евклидова пространства?
Думаю, большинство ответит: «ни одной». Ведь наше пространство продолжается до бесконечности в любом направлении, какие же у него могут быть стороны?
Но представьте себе, что вы плоское существо, живущее на двумерной плоскости и не имеющее больше ни о чем понятия, Сколько сторон у вашего «пространства»?
_____ Если вы раньше ответили S’"1 (^*4 «ни одной», вы непременно
( \ 1 д должны повторить тот же
I v—x r—J j ответ и теперь: ведь плос-
। ) х. 1 кость тоже продолжается и
I f A. I продолжается во всех на-
\ I \ J правлениях.
Иначе говоря, количество
Рис. 79. сторон зависит от того, рас-
сматривать ли плоскость саму по себе или как часть трехмерного пространства. То же самое относится и к трехмерному пространству: если в качестве четвертого измерения ввести время, то окажется, что наше пространство имеет две стороны — прошлое и будущее.
Надеюсь, теперь понятно, насколько трудно даже объяснить, что понимается под числом сторон, не говоря уж о том, чтобы понять, топологическое это свойство или нет.
Однако существует все-таки одно явление, которое могут наблюдать воображаемые жители ленты Мёбиуса, не выходя за пределы своего «пространства», и которое позволяет дать математическое описание «односторонности». Предположим, что эти создания имеют две руки, причем их большие пальцы направлены в разные стороны. Тогда им доступны понятия «правый» и «левый». Кроме того, допустим, что они носят варежки (рис. 79).
Однажды просыпается такое существо и видит, что все его правые варежки куда-то подевались и остались одни левые. Проявив находчивость, оно берет одну ва
режку и переносит ее вдоль ленты, как показано на рис. 80.
К большому нашему (но не его!) удивлению, левая варежка превратилась в правую. Правда, при этом и левая рука воображаемого существа превратилась в правую, а правая — в левую, но зато оно получило годную пару варежек.
Рис. 80,
Можете сами убедиться в этом, склеив ленту Мёбиуса из бумаги (и тогда, чтобы увидеть, что делается «на другой стороне» бумаги, придется смотреть на свет сквозь нее), а лучше из прозрачной пленки. Вместо этого можете воспользоваться своими двумя руками и воображаемой лентой Мёбиуса. Поскольку руки не двумерны, следите только за их очертаниями. Держите руки перед собой ладонями наружу, пальцы вверх, большие пальцы прижаты друг к другу. Левую руку оставьте на месте, а правую двигайте вдоль воображаемой ленты Мёбиуса следующим образом. Поднимите правый локоть, чтобы ладонь наклонилась, затем поворачивайте ее вниз от себя, поднимайте локоть еще выше, пока рука не окажется в положении тыльной стороной к вам, пальцами вниз. Теперь сдвиньте ее влево на уровень левой руки и отведите от себя большой палец, чтобы ладонь стала к вам ребром. В идеале следовало бы поворачивать и дальше нравую руку, но анатомия не позволяет, поэтому повер-
ните левую руку большим пальцем к себе и соедините ладони ребром к ребру, левая вниз, правая вверх.
Вот это неудобное положение и получается после того, как ваша правая рука опишет ленту Мёбиуса (а левая немного продвинется ей навстречу). Чтобы стало полегче, держите руки в том же положении одну относительно другой, но передвиньте правую немного вправо, а левую за ней следом. Теперь нужно перевернуть правую руку снизу вверх на поверхности ленты Мёбиуса. Для этого опустите правый локоть, продолжая держать руку ладонью наружу. Теперь обе кисти направлены вверх, левая ладонью внутрь, правая — наружу. Сложите их вместе. Вы убедились в том, как точно они совпали. Если говорить только об очертаниях, то ваша правая рука, описав ленту Мёбиуса, стала левой (а заодно вы получили превосходный пример стиля рассуждений, известного у математиков под названием «размахивание руками»).
Жители двустороннего мира (к которым относимся и мы с вами, согласно современным представлениям науки) не смогли бы проделать этот фокус с варежками: для них правая останется правой, а левая — левой. Для существа с ленты Мёбиуса понятие правого и левого имеет смысл лишь до тех пор, пока предметы не передвигаются, и невозможно дать определение правого и левого, которое годилось бы для всей поверхности в целом. В таком случае говорят, что эта поверхность неориенти-руема. А пространство вроде нашего, в котором можно дать глобальное определение правого и левого, называется ориентируемым. Ориентируемость соответствует двустороннее™, а неориентируемость — односторонности, и оба этих свойства являются внутренними топологическими свойствами, не зависящими ни от какого внешнего пространства.
Если соединить края двух лент Мёбиуса, получится поверхность, называемая бутылкой Клейна (рис. 81).
У нее нет краев, и она неориентируема, потому что не-ориентируемы ленты Мёбиуса. Кроме того, ее нельзя вложить в трехмерное пространство так, чтобы не было самопересечений.
Бутылку Клейна можно описать по-другому: представьте себе квадрат, стороны которого склеены так, как
Рис. 82.
показывают стрелки на рис. 82. (Сначала верхняя сторона склеивается с нижней и получается цилиндр. Затем, чтобы правильно склеить края цилиндра, его надо согнуть и протолкнуть сквозь самого себя.) При помощи этой же диаграммы можно убедиться в том, что бутылка Клейна действительно получается из двух лент Мёбиуса: разрежем ее, как показано на рис. 83.
+
Рис. 83.
Иногда можно услышать какие-то утверждения о внутренней и наружной стороне бутылки Клейна. Они бессмысленны: в трехмерном пространстве ее построить нельзя, а в четырехмерном (о котором мы будем гово
рить в гл. 14), где ее можно сделать без самопересечений, говорить о внутренности бутылки Клейна — все равно, что говорить о внутренности окружности в трехмерном пространстве,— можно в нее войти и из нее выйти без всяких препятствий.
Склеиванием сторон квадрата можно получить еще два интересных пространства: тор и проективную плос-
кость (называемую так из-за ее связи с проективной геометрией) (см. рис. 84).
О торе мы уже говорили — это ориентируемая поверхность. Проективная плоскость, подобно бутылке Клейна, не имеет края, неориентируема и не допускает вложения в трехмерное пространство.
Проективная плоскость представляет собой ленту Мёбиуса, приклеенную край в край к кругу. Чтобы построить ее в трехмерном пространстве, надо превратить край ленты Мёбиуса в окружность. Лента при этом будет перекручиваться и самопересекаться, образуя так называемый скрещенный колпак (рис. 85). Закрыв его отверстие, получим проективную плоскость (рис. 86).
Наконец, познакомимся еще с одним занятным пространством — рогатой сферой Александера (рис. 87). Оно строится так. Вытянем из сферы два рога, расщепим надвое их концы и переплетем их между собой, расщепим надвое новые концы и снова переплетем их, и так далее до бесконечности. Хотите — верьте, хотите — нет, но то,
что получается, топологически эквивалентно сфере: спо-
соб вытягивания рогов можно задать при помощи подходящей функции, которая определяет топологическую эквивалентность. Однако наружное пространство рогатой
сферы уже не будет топологически эквивалентно пространству вне обычной сферы.
В самом деле, с обычной сферы соскакивает любая
надетая на нее петля
Рис. 86.
Рис. 88.
Рис. 89.
может запутаться в рогах (рис. 89). И здесь снова заботы причиняет не сама поверхность, а окружающее ее пространство.
Теорема о волосатом шаре
Рис. 90.
Мы немного поговорили о понятиях, которые вводятся в топологии, и объектах, которые в ней изучаются. Теперь приведем пример топологической теоремы.
Если внимательно посмотреть, как растет шерсть у собаки, можно обнаружить, что вдоль спины она разделяется «на пробор», а другой «пробор» идет вдоль живота. С точки зрения топологии собака — это шар (если считать, что пасть у нее закрыта, и пренебречь внутренними органами); чтобы в этом убедиться, достаточно «втянуть» ей ноги и немного ее «раздуть» (рис. 90).
Можно задаться таким вопросом: удастся ли так «причесать» собаку, чтобы не стало «проборов». В результате получился бы волосатый шар, не имеющий ни «проборов», ни «макушек», изображенный на рис. 91.
Этот вопрос относится к топологии, ибо при любой непрерывной деформации такого шара гладкая шерсть
Рис. 91.
останется гладкой, а «пробор» останется «пробором». Топологические методы позволяют установить (хотя это нелегко), что гладко причесать шар невозможно. (В правильной формулировке задачи говорится о «векторных полях» на сфере, но этому вполне соответствует интуитивное представление о волосатом шаре.)
Рис. 92.
Лучшее, чего можно добиться,— причесать волосы так, что останется лишь одна «макушка» — точка, в которой нарушается гладкость (рис. 92).
Не будем углубляться здесь в доказательство этой теоремы, однако заметим, что ее значение выходит далеко за рамки причудливых применений к воображаемым гладким собакам.
Рис. 93.
Поверхность Земли представляет собой сферу. Если для какого-то момента времени изобразить на сфере направления воздушных потоков в атмосфере Земли, т. е. направления всех ветров, дующих над поверхностью Земли, то получится своего рода «прическа» на этой сфере, где роль волос будут играть линии, изображающие пото-
Рис. 94.
ки. Наша теорема утверждает, что не существует гладкой системы ветров (за исключением случая полного безветрия, что, однако, невозможно, но по другим причинам), т. е. где-то всегда есть циклон.
Таким образом, зная только форму Земли, мы уже можем делать заключения о поведении ветров без всяких сведений о том, куда они дуют на самом деле.
А вот на тороидальной планете возможен постоянный ветер без циклонов, поскольку волосатый тор можно причесать требуемым образом (рис. 93).
Дальнейшее изучение, основанное уже на более подробных сведениях о ветрах, показывает, что гладкий поток скорее будет обвиваться вокруг тора, кац на рис. 94.
Известны и многие другие приложения теоремы о волосатом шаре. Например, в алгебре она применяется для доказательства теоремы о том, что каждое уравнение, левая часть которого — многочлен, имеет корни в поле комплексных чисел (так называемая «основная теорема алгебры»),
Глава 11
УМНЫЙ В ГОРУ НЕ П ЖДЕТ
Идти напролом — не всегда самый быстрый путь к успеху. Иногда лучше обойти препятствие, чем очертя голову бросаться ему навстречу. Так же обстоит дело и в математике. Часто задача кажется неодолимой, и даже хорошо представляя себе, каким должен быть ответ, никак не удается придумать способ решения. В таком случае все может изменить какая-то новая точка зрения, свежая идея.
Где же взять эту свежую идею?
Первопроходец, пробивающий путь в джунглях, обычно видит лишь то, что его непосредственно окружает. Если у него на пути оказывается гора, он взбирается на нее, если река,— переплывает через нее. Позднее, когда люди начинают прокладывать через джунгли дороги, они не обязательно идут теми же тропами. У них есть карты. Они знают, где река, а где гора, и потому обойдут гору, а на реке найдут удобное место для постройки моста. Если бы первопроходец имел более широкий обзор местности, например с борта самолета, он сэкономил бы массу усилий и, возможно, преуспел бы там, где без этого потерпел неудачу.
В математике очень легко сосредоточиться на какой-то конкретной задаче. Если ваши методы к ней не подходят, а вы продолжаете упорно ломать над ней голову, то в конце концов возникает ощущение растерянности и поражения. В таком случае иногда полезно отступить, забыть о конкретной задаче, осмотреться и подумать: нет ли в близлежащих областях каких-то общих признаков, особенностей, которые могут пригодиться для выбора правильного направления.
Грефы
Известна одна старая задача, которая в одном из ва-
риантов формулируется так. Имеется три дома и три колодца (рис. 95). Можно ли проложить дорожки от каж-
дого из трех домов к каждому из трех колодцев так, чтобы они не пересекались между собой?
Взяв карандаш и бумагу, вы довольно скоро убедитесь, что сделать это каким-нибудь простым способом не удается. Однако, если вы
попытаетесь доказать, что
Рис. 95.
В решения не существует, вы столкнетесь с трудной проблемой: ведь способов проводить линии так много! Кто
знает, может, если сначала
одну линию заставить описать шесть или семь петель, то это приведет к цели. Вроде нет, но как это доказать?
Перед нами как раз такая ситуация, о какой говорилось выше, и лучший способ дальнейших действий — спокойно сесть и оглядеться.
Тогда станет ясно, что для задачи неважно, дома это или не дома, и рядом они с колодцами или за тридевять земель. Отбросив лишние подробности, условие можно сформулировать так: есть два множества на плоскости, каждое из трех точек; нужно соединить каждую точку одного с каждой точкой другого так, чтобы линии соединения не пересекались одна с другой.
Такого рода задачами занимается раздел математики, известный под названием теории графов.
Граф состоит из двух главных частей:
1) некоторого множества N, элементы которого называются узлами или вершинами-,
2) некоторого способа установить, когда две вершины соединены одна с другой.
При помощи теории множеств это абстрактное определение можно было бы сделать более строгим. Однако понимать различные утверждения о графах намного проще, если изображать вершины в виде точек на
Рис. 96.
плоскости и соединять их линиями. Последние называются ребрами графа. Точное расположение точек и линий несущественно, но важно, чтобы соединения были сделаны правильно.
Две фигуры на рис. 96 служат изображениями одно
Рис. 97.
го и того же графа (вершины отмечены кружочками; пересечение без кружка на второй фигуре не считается). Каждая фигура имеет четыре вершины, и каждая пара вершин соединена линией. Передвинув вершины и линии, как показано на рис. 97, можно перевести одну фигуру в другую.
Совсем не обязательно проводить прямолинейные от
резки; фигуры, показанные на рис. 98,— это изображения того же самого графа.
Топологическая структура графа — вот что существенно.
Нарисовать граф на плоскости так, чтобы его ребра пересекались только в вершинах, не всегда возможно. Графы, для которых это возможно, называются плоскими.
Рис. 98. Рис. 99.
Теперь нашу задачу о домах и колодцах можно сформулировать так: плоский или нет граф, одно из изображений которого дано на рис. 99?
Для того чтобы ответить на этот вопрос, нужно изучить свойства плоских графов.
Формула Эйлера
Маршрутом на графе между вершинами а и b называется последовательность ребер с началом в а и концом в Ь, в которой каждое следующее ребро начинается там, где кончается предыдущее. На рис, 100, например, суще-
Рис. 100.
ствует маршрут между точками а и Ь, но не существует маршрута, связывающего асе, потому что с лежит в той части графа, которая никак не связана с другими его областями, где находится а. Граф, в котором для любых двух вершин найдется соединяющий их маршрут, называется связным. Это означает, что он не распадается на два (или больше) отдельных куска.
Рис. 101.
Любой граф состоит из связных кусков. Поэтому достаточно изучить связные графы.
Далее мы будем рассматривать только конечные, связные, плоские графы. «Конечный» означает, что число вершин и ребер конечно. Такой граф показан на рис. 101.
Любой граф такого вида делит плоскость на конечное число областей, которые мы назовем гранями. Граф на рис. 101 имеет 8 граней, 14 вершин и 21 ребро.
Интересующие нас графы (конечные, связные, плоские) напоминают карту некоего воображаемого острова, поэтому будем ради краткости называть такие графы картами.
Нарисуйте теперь несколько карт и сосчитайте число граней (Г), вершин (В) и ребер (Р). Для начала займитесь теми, которые показаны на рис. 102.
Составьте таблицу результатов:
Г В Р
8 14 21
4 6 9
4 6 9
6 10 15
Подметили вы какую-нибудь связь между этими числами?
Сразу видно, что Р всегда наибольшее из них. Числа Г и В меньше, но в сумме они дают примерно то же, что и Р: 22, 10, 10, 16. Эти суммы на 1 больше соответствующего Р, и похоже, что для всякой карты выполняется равенство
Р+В=Р+1
или
В —Р + Г=1. (*)
Первым, кто доказал, что эта формула имеет место для любой карты, был Эйлер (1707—1783). На первый взгляд нет никаких оснований ожидать, что Г, В и Р как-то связаны между собой. Но если не полениться и посчитать их для дюжины карт, появится уверенность, что формула («) ив самом деле выполняется. Однако это нисколько не поможет ее доказать.
Если подумать, само выражение В — Р+Г подсказывает способ действий. Раз оно одно и то же для всех карт, значит, оно не меняется, когда вместо одной карты берется другая.
Рассмотрим простейшие случаи, когда не меняется В — Р+Г; во-первых, если Р и Г оба уменьшаются на 1,
и во-вторых, если В и Р оба уменьшаются на 1 (в обоих случаях их разность не изменится).
Первому случаю соответствует удаление одной из граней путем стирания одного из ограничивающих ее ребер (рис. 103).
Второй осуществится, если убрать вершину, которая «болтается» на конце одного ребра, как на рис. 104.
Эти операции назовем стягиваниями. Наше наблюдение состоит в том, что величина В — Р+Г не меняется при
Рис. 104.
двух типах стягиваний; значит, она не меняется и в результате любой последовательности стягиваний.
Допустим теперь, что океан, омывающий наш остров, очень суров. День за днем он разрушает береговую линию, вызывая стягивания то одного, то другого вида. Все это время величина В — Р + Г невозмутимо сохраняет
с с
О
©
Рис. 105.
свое значение. Океан продолжает свою разрушительную работу..., пока не останется никакого острова.
Я сказал никакого острова? Это было неосторожно. Давайте посмотрим на рис. 105.
На самом деле остров превратился в точку: 1 вершина, 0 ребер, 0 граней. Значит, В — Р + Г= 1 — 0 + 0= 1. Но величина В — Р+Г не изменялась при стягиваниях. Следовательно, формула В — Р+Г=1 выполнялась и для исходного острова!
По существу мы провели доказательство. Каждую карту при помощи стягиваний можно превратить в точку, не меняя величины В — Р+Г, а для точки она равна 1. Следовательно, формула ( ) имеет место для любой карты. Эта формула — так называемая формула Эйлера — имеет удивительно широкий круг очень ценных применений. Прежде всего рассмотрим ее применение к задаче о трех домах и трех колодцах.
Неплоские графы
Итак, наша задача — узнать, плоский или нет граф, изображенный на рис. 99.
Применим прием, который на языке шахмат можно было бы назвать «гамбитом математика»: пожертвуем утверждением, что этот граф не плоский, а на основе этой жертвы попробуем прийти к противоречию. Если это удастся, отсюда будет следовать, что он не плоский.
Для этого графа В = 6, Р = 9. Число граней сосчитать невозможно, поскольку понятие грани введено только для плоских графов (карт), а у нас нет плоского изображения этого графа. Но если бы оно у нас было в какой угодно форме, оно имело бы Г граней, где
6 —9+Г=1.
Значит, Г<=4.
Теперь, хотя мы и не будем пытаться нарисовать плоское изображение нашего графа, нам придется все же выяснить кое-что о его гранях.
Каждая грань плоского графа окружена замкнутой цепью, или циклом, из его ребер (рис. 106). Цикл обра-< зован периметром этой грани (береговой линией). Нетрудно проверить, что циклы графа на рис. 99 состоят либо из 4, либо из 6 ребер. Перечислим все возможные случаи:
4 4 4 4
4 4 4 6
4 4 6 6
4 6 6 6
6 6 6 6.
А теперь посчитаем ребра другим способом. Каждое ребро, за исключением наружных, принадлежит двум
граням. Допустим, что наружная часть — это еще одна очень большая грань; она тоже имеет 4 или 6 ребер, и мы получаем 5 граней:
4 4 4 4 4
4 4 4 4 6
4 4 4 6 6
4 4 6 6 6
4 6 6 6 6
6 6 6 6 6
причем каждое ребро принадлежит двум из них. Тогда сумма ребер, принадлежащих всем граням, равна удвоенному общему числу ребер, и, значит, число ребер в
указанных выше случаях должно равняться соответственно 10, 11, 12, 13, 14, 15. Но, как мы знаем, Р = 9.
Итак, получено противоречие. Значит, наше допущение неверно, и рассматриваемый граф не является плоским. «Гамбит математика» снова окупился. Таким образом доказано, что задача о трех домах и трех колодцах не имеет решения.
В этом доказательстве замечательно то, что не делается никаких попыток разобраться, как могли бы проходить линии соединения. Оно оставляет подобные заботы в стороне, сначала допуская возможность проведения та-
ких линий, а затем показывая, что она неосуществима.
Подобным образом можно поступить и с графом, показанным на рис. 107. Для него В = 5, Р=10, и, значит, если бы он был плоским, Г должно было бы равняться 6 (или с учетом дополнительной внешней грани 7). Далее, каждая грань ограничена по крайней мере тремя ребрами, а каждое ребро принадлежит двум граням, поэтому общее число ребер должно быть больше, чем (3-7) : 2=21 : 2, т. е. больше 10. Но мы уже знаем, что их ровно 10. Таким образом, снова получено противоречие, и данный граф не плоский.
Два рассмотренных графа — важные прототипы всех неплоских графов. Как показал Куратовский, всякий неплоский граф обязательно содержит в себе один из этих двух графов. Результат в принципе прост, но несколько страниц занимает проверка разных случаев, и мы не станем приводить здесь его доказательство '.
Способы установления, плоский граф или нет, находят практическое применение к электронным схемам, в частности к печатным схемам и микроминиатюрным интегральным схемам, однако там приходится учитывать и другие факторы: например, иногда имеет значение длина соединительных линий, а в некоторых случаях компоненты схемы могут взаимодействовать, хотя они и не пересекаются.
Другое применение формулы Эйлера
Из формулы Эйлера можно извлечь почти все, что известно к настоящему времени о знаменитой (или скорее бесславной?) проблеме четырех красок: можно ли любую заданную карту раскрасить четырьмя красками так, чтобы никакие две соседние (имеющие общее ребро) страны (грани) не были одного цвета?
Четыре краски понадобятся наверняка (рис. 108). Кроме того, можно показать, что не существует карты,
209
L
имеющей 5 граней, каждая из которых граничит по ребру с остальными четырьмя. Однако из этого еще не сле-
дует, что четырех красок хватит.
Известно, что пяти красок достаточно, а вот запол-
нить дыру между 4 и 5 никак не удается. (Прежде чем
вы побежите пробовать, позвольте вас предостеречь, что
Рис. 108.
это очень тонкая задача. Думаю, она не устоит лишь перед очень глубоким пониманием теории плоских графов.)
Под картой до сих пор понималась карта на плоскости в нашем прежнем смысле. Од
нако задача на плоскости име-
ет тот же ответ, что и задача на сфере. В этом можно убедиться с помощью приема, который мы назовем «трюк с апельсиновой коркой». Если задана карта на сфере, делаем дырочку на одной из граней и раскрываем сферу на плоскость. С другой стороны, если есть карта на плоскости, свертываем ее в сферу, и та область, которая лежала вне исходной карты, образует лишнюю грань. Если каждую карту на плоскости можно раскрасить четырьмя красками, то же самое верно для сферы и наоборот. По той же причине, по которой нам пришлось в предыдущем разделе ввести лишнюю грань, удобнее рассматривать сферу, а не плоскость. Появление еще одной грани отражается на формуле Эйлера: она принимает вид
В-Р+Г=2.
Докажем, что пяти цветов достаточно для раскрашивания любой карты на сфере (а значит, и на плоскости). Доказательство будет построено следующим образом: сначала мы найдем способы превращать данную карту в новую карту с меньшим числом граней, при которых можно получить нужную окраску исходной карты из окраски
новой; проделав несколько таких превращений, мы придем к карте с 5 или меньше гранями, которую заведомо можно раскрасить в 5 цветов. Вернувшись к исходной карте, получим ее окраску в 5 цветов.
1. Можно исключить вершины, где сходятся более трех граней. Если в какой-то точке сходятся четыре гра
Рис. 109.
Рис. ИО.
ни или больше, среди них найдутся две, которые больше нигде не примыкают друг к другу, и их можно слить в одну (рис. 109). Если новая карта допускает раскраску в 5 цветов, та же раскраска годится для старой карты, ибо эти две грани могут быть одного цвета.
Если вершина, с которой мы начали, окружена большим количеством граней, нам придется много раз выполнить эту операцию, до тех пор пока останутся только три грани.
2. Можно исключить треугольные грани (ограниченные тремя ребрами), сливая их с одной из соседних (рис. ПО). Из раскраски новой карты получается раскраска старой, если выбрать для треугольной грани цвет, не совпадающий с тремя окружающими.
3. Точно так же можно слить четырехугольные грани с одной из соседних. Для раскрашивания исключенной области воспользуемся пятым цветом, отличным от четырех занятых (рис. 111).
4. В итоге у нас получится карта на сфере, все грани которой окружены не менее чем пятью ребрами. Дока
жем, чти по крайней мере одна грань имеет ровно 5 ребер.
Пусть у нашей карты В вершин, Р ребер и Г граней. Согласно шагу 1, в каждой вершине встречаются три ребра, а каждое ребро принадлежит двум граням, поэтому
Рис. 111.
ЗВ = 2Р=аГ, где а — среднее число ребер у грани, Поскольку
В—Р + Г=2,
имеем
откуда
т. е. а меньше шести. Если среднее число ребер у грани меньше шести, то найдется грань, у которой меньше шести ребер. Но каждая грань имеет не меньше пяти ребер. Значит, есть грань, у которой ребер ровно 5.
5. Рассмотрим такую грань Р с 5 ребрами и обозначим соседние с ней грани Q, R, S (рис. 112).
Среди них найдется пара несоприкасающихся граней; выберем наши обозначения так, чтобы это были Q и S. Сольем теперь грани Р, Q и S (рис. 113).
Если полученную в результате карту можно окрасить в 5 цветов, то можно окрасить и исходную: после слияния грани Q и S стали одного цвета, значит, грань Р окружена 4 цветами и на нее можно истратить пятый.
6. После каждого слияния количество граней уменьшается. В конце концов мы получим карту с 5 или меньше гранями. Такую карту, разумеется, можно раскрасить
5 красками: достаточно выбрать свой цвет для каждой грани.
Проделав теперь все перечисленные шаги в обратном порядке, получим требуемую раскраску исходной карты.
Итак, наши действия, коротко говоря, сводятся к следующему. Мы применяем к исходной карте процесс ре
Рис. 113.
дукции, в результате которого она постепенно упрощается. На каждом шаге этого процесса, если мы умеем раскрашивать новую карту, то умеем раскрашивать и старую. Доказательство гарантирует, что в конце концов получится новая карта, которую мы сумеем раскрасить. Значит, мы сможем раскрасить и предыдущую, и ту, из которой получилась предыдущая, и т. д. В итоге мы сумеем раскрасить и исходную карту.
Чтобы понять, как работает этот процесс, нарисуйте какую-нибудь карту (не берите слишком много граней!) и, следуя указанным путем, найдите способ ее раскрашивания.
Для поверхностей, отличных от сферы, анало-ичная проблема решена. Мы кратко расскажем об этом в гл. 12. Однако для сферы — простейшей из поверхностей — известно только, что 5 цветов достаточны, а 4 необходимы.
В каком-то смысле было бы жаль, если бы эту задачу удалось решить. Мы лишились бы великолепного примера задачи, которую так легко сформулировать и так невообразимо трудно решить 2,
Глава 12
ТОПОЛОГИЧЕСКИЕ ИНВАРИАНТЫ
«Настоящий традиционный пончик имеет топологию сферы. Дело вкуса — считать, что у него есть внешняя и внутренняя поверхности. Важно лишь то, что пространство внутри должно быть заполнено душистым малиновым вареньем. Но это тоже дело вкуса».
П. Б. Фелгет
Если два топологических пространства топологически эквивалентны, то обычно доказать это нетрудно. Все, что требуется, — найти между ними нужное соответствие.
Гораздо труднее доказать, что два неэквивалентных пространства действительно неэквивалентны. Ведь для этого нужно убедиться в том, что из бесконечного множества всевозможных функций ни одна не удовлетворяет требуемым условиям. Так, например, две поверхности, изображенные на рис. 114, явно топологически различны, но как это доказать?
Мы видим, что тор имеет дырку, а сфера — нет. Но трудность состоит в том, что дырка эта вовсе не на са-
Рис. 114.
мом торе, а в окружающем его пространстве, а мы уже знаем, как опасно делать заключения, основанные на свойствах окружающего пространства. Как топологическое пространство, рассматриваемое само по себе, тор не содержит ничего такого, что можно было бы назвать
Рис. 115.
дыркой, и эта дырка, которую мы видим, не является его частью.
Единственный способ различить два неэквивалентных топологических пространства — найти какое-то тополо-
Рис. 116.
гическое свойство, которым обладает одно из них и не обладает второе. Например, всякая замкнутая кривая на сфере разделяет ее на два куска (рис. 115), а на торе есть замкнутые кривые, которые не разрезают его на отдельные куски (рис. 116).
Такие свойства, как замкнутость кривой, связность,
несвязность, являются топологическими. Значит, мы доказали, что сфера и тор топологически различны.
Подобным же, но более тонким методом можно было бы, скажем, отличить поверхность с 19 дырками от поверхности с 18 дырками, однако для этого пришлось бы проделать много «грязной» работы и, хуже того, убедиться, что такой метод не вполне удовлетворителен.
Обобщенная формула Эйлера
Свойство сферы, состоящее в том, что В—Р+Г=2, является топологическим. Любое непрерывное преобразование сферы переводит всякую заданную на ней карту в другую карту с теми же значениями В, Р и Г,
Если мы попробуем рисовать карты на торе, то обнаружим, что В—Р+Г уже не равно 2. Например, для карты, показанной на рис. 117, В=4, Р=8, Г=4, так что
В—Р + Г=о.
То же равенство выполняется для любой другой карты на торе, в основном по тем же причинам, по которым
Рис. 117.
для любой карты на плоскости и на сфере имеет место формула Эйлера. Это свойство карт на торе также является топологическим.
Подобные формулы можно получить для широкого
класса топологических пространств, называемых поверхностями.
И сферу, и тор можно триангулировать, т. е. покрыть треугольниками, примыкающими друг к другу вдоль сторон (рис. 118).
Рис. 118.
Неважно, что эти треугольники не плоские, а их стороны не прямолинейны; требуется только, чтобы они были топологически эквивалентны обычным треугольникам.
Любое пространство, которое можно построить из конечного множества треугольников, причем так, что два треугольника могут иметь общими либо одну (целую) сторону, либо одну вершину, называется триангулируемым. Поверхность — это топологическое пространство, которое:
а) триангулируемо;
б) связно (т. е. состоит из одного куска, как в случае графов);
в) не имеет края.
Сфера, тор, бутылка Клейна, проективная плоскость— все это примеры поверхностей. На рис. 119 показана триангуляция проективной плоскости.
Лента Мёбиуса не является поверхностью в этом смысле, так как у нее есть край. Плоскость тоже не является поверхностью, ибо ее нельзя построить из конечного числа треугольников.
На любой поверхности, точно так же как на сфере, можно рисовать карты и считать количество вершин, ребер и граней. Можно доказать, что для каждой данной поверхности S число В—Р + Г не зависит от выбранной карты. Оно называется эйлеровой характеристикой поверхности S и обозначается % (S). Поскольку оно не зависит от выбранной карты, это число будет одним и тем же для всех топологически эквивалентных пространств,
' т. е. оно является топологическим инвариантом. (Топологический инвариант — это общее свойство всех топологически эквивалентных поверхностей.)
Еще один топологический инвариант — ориентируемость Тор не эквивалентен бутылке
Рис. 119. Клейна, так как он ориенти-
руем, а бутылка Клейна — нет
Эти два инварианта—эйлерова характеристика и ориентируемость — позволяют различить все поверхности, о которых мы до сих пор упоминали:
S
Сфера
Тор
Двойной тор
Проективная плоскость Бутылка Клейна
I Ориенти-
I руема?
Да Да Да
Нет Нет
1
О
Построение поверхностей
Наша конечная цель — классифицировать все возможные поверхности с точностью до топологической эквивалентности. Первым шагом будет построение набора стандартных поверхностей.
Рис. 120.
Методика нашего построения известна под названием хирургиш мы будем разрезать пространства на куски, а затем соединять в одно целое. Такие приемы оказываются очень полезными в топологии.
Стандартные ориентируемые поверхности получаются пришиванием ручек к сфере. За исходную поверхность берем сферу без ручек. Чтобы пришить ручку, мы вырезаем в сфере две дырки и вшиваем в нее цилиндр, соединяя его края с краями дырок (рис. 120).
Одна ручка дает тор, две ручки — двойной тор и т. д. Стандартная ориентируемая поверхность рода п — это
Рис. 121.
сфера с п пришитыми к ней ручками. (Слово род служит просто-напросто гвоздиком, на который можно «повесить» число п.)
Стандартные неориентируемые поверхности получаются пришиванием лент Мёбиуса. Для этого в сфере вырезаем одну дырку. У нее один круглый край, у ленты Мёбиуса тоже один круглый край, и мы соединяем их вместе. Если пытаться сделать это в трехмерном пространстве, то лента Мёбиуса будет пересекать самое себя, образуя скрещенный колпак. Однако мы рассуждаем абстрактно и можем не беспокоиться об этом( рис. 121).
Пришивая одну ленту Мёбиуса, получаем проективную плоскость (как на рис. 86), две — бутылку Клейна (как на рис. 83).
Эйлерова характеристика стандартной поверхности
Наш следующий шаг — найти эйлерову характеристику стандартных поверхностей. В ориентируемом случае действуем так: считаем вырезанные из сферы два кружка гранями некоторой карты (ее часть показана на рис. 122).
Для этой карты В—Р + Г=2, ибо все происходит на сфере. Добавление ручки, как показано на рис. 123, меняет дело: мы теряем две грани на сфере, зато получаем две грани на ручке с темп же вершинами, но с двумя новыми ребрами. Итак, эйлерова характеристика уменьшается на 2. То же самое происходит при добавлении
Рис. 122.
каждой новой ручки, значит п ручкам соответствует уменьшение на 2п. Таким образом, эйлерова характеристика стандартной ориентируемой поверхности рода п равна
2—2п.
В частности, это показывает, что стандартные ориентируемые поверхности разных родов не являются топологически эквивалентными, поскольку имеют разные эйлеровы характеристики.
Рис. 123.
Рис. 124.
Теперь займемся неориентируемым случаем. Допустим, что вырезанный кружок есть часть карты, изображенной на рис. 124.
Пришивание ленты Мёбиуса (рис. 125) ликвидирует одну грань на сфере и добавит одну грань и одно ребро
на ленте. Поэтому теперь эйлерова характеристика для каждой новой ленты Мёбиуса уменьшается на 1 и, следовательно, для стандартной неориентируемой поверхности рода п она равна
2—п.
Это позволяет различать стандартные неориентируемые поверхности.
Рис. 125.
Эти два инварианта вместе — эйлерова характеристика и ориентируемость — показывают, что все стандартные поверхности топологически различны. Теперь покажем, что всякая поверхность топологически эквивалентна одной из стандартных.
Классификация поверхностей
Метод доказательства, которым мы воспользуемся, принадлежит Э. К. Зиману *. При помощи «хирургического вмешательства» мы разрежем заданную поверхность на куски, из которых затем соберем стандартную поверхность, причем и разрезать, и собирать будем так, чтобы не терять топологическую эквивалентность, т. е. все куски будем соединять по линиям разрезов.
Пусть S — некоторая поверхность. Нарисуем на ней
замкнутую кривую (если это возможно), не разбивающую S на два куска. (Если это не удастся, остановимся.)
Узкая полоска поверхности по обе стороны от такой кривой топологически эквивалентна полосе со склеенными концами, следовательно, это либо цилиндр, либо лента Мёбиуса.
Рис. 126.
Теперь начнем «операцию». Если полоска цилиндрическая, удалим ее и вошьем по кружочку в каждую из двух образовавшихся дырок. Чтобы не забыть, как вставить цилиндр обратно, пометим каждый кружок стрелкой. Если полоска представляет ленту Мёбиуса, удалим ее и вошьем один кружок.
При помощи тех же рассуждений, что и выше, при вычислении эйлеровой характеристики стандартных поверхностей (только в обратном порядке), можно убедиться, что каждая «операция» увеличивает эйлерову характеристику: на 2 в случае цилиндра и на 1 в случае ленты Мёбиуса. Теперь сошлемся на
Недоказанное утверждение А. Эйлерова характеристика любой поверхности не превосходит 2.
Отсюда вытекает, что последовательность «операций» после конечного числа шагов оборвется. Но она обрывается только тогда, когда больше не удается найти замкнутую кривую, не разбивающую поверхность.
Недоказанное утверждение В. Поверхность, кото-
рую каждая замкнутая кривая на ней разбивает на отдельные куски, топологически эквивалентна сфере.
Теперь проделаем обратную процедуру. При этом потребуются три типа «операций».
Рис. 127.
1. Имеются два кружка с противоположно направлен' ными стрелками, и вместо них пришивается цилиндр. Это все равно, что пришить ручку (рис. 126).
2. Имеется один кружок, и вместо него пришивается лента Мёбиуса.
3. Имеются два кружка с одинаково направленными стрелками; в таком случае пришить обратно цилиндр — это все равно, что пришить бутылку Клейна (рис. 127), а это в свою очередь равносильно пришиванию двух лент Мёбиуса (см. рис. 83). Таким образом, операцию третьего типа можно заменить двумя операциями второго типа.
Если исходная поверхность ориентируема, то потребуются только операции первого типа. Значит, в результате мы придем к сфере с каким-то количеством ручек, т. е. к стандартной ориентируемой поверхности. Все, что мы делали, — разрезали S на куски и потом складывали их обратно, следя за тем, чтобы они правильно соединялись. Значит, S топологически эквивалентна стандартной сфере с ручками.
Если исходная поверхность неориентируема, то могут
потребоваться операции всех трех типов. Третий тип можно исключить так же, как выше. Поскольку рассматривается неориентируемый случай, потребуется по крайней мере одна операция второго типа. Далее, если возникнет ситуация первого типа (два кружка с противоположно направленными стрелками), можно взять и пронести один из кружков по ленте Мёбиуса. Как и в случае с варежкой (гл. 10), направление стрелки изменится на противоположное, и мы окажемся в ситуации третьего типа. Но операцию третьего типа можно заменить двумя операциями второго типа. Таким образом, все сведено к операциям только второго типа — пришиванию ленты Мёбиуса, и в результате получается стандартная неорп-ентируемая поверхность.
Итак, опираясь на два недоказанные утверждения, мы показали, что всякая поверхность топологически эквивалентна стандартной ориентируемой поверхности рода п^О или стандартной неориентируемой поверхности рода п^1. (Значение п=0 во втором случае рассматривать не нужно, ибо ему отвечает сфера, которая ориентируема и охватывается первым случаем.)
Утверждения А и В мы не доказали, потому что не хотели прерывать ход изложения. Теперь настало время ими заняться.
Доказательство утверждения А
Эйлерову характеристику графа N можно определить как
%(N)=B—P,
поскольку граф сам по себе не имеет граней. (Грани можно определить только тогда, когда граф нарисован на некоторой поверхности, поэтому мы их не принимаем в расчет.)
Покажем, что эйлерова характеристика всякого графа N не превосходит 1.
Если N содержит циклы, один из них можно разорвать, отбросив одно ребро. При этом Р уменьшится, и, следовательно, % (N) увеличится. Повторяя эту операцию до тех пор, пока не останется ни одного цикла, мы получим граф без циклов. Такой граф ? л называется деревом (рис. 128).
о [у Теперь воспользуемся стяги-
X. / f / ваниямй (как в гл. 11). Отбросив веРшинУ ни конце «ветки» и при-/\. летающее к ней ребро, мы не
\ уменьшим эйлерову характери-
I стику. После достаточного числа
I стягиваний останется одна точка,
а для точки эйлерова характери-стика равна 1 — 0=1. Итак, пре-/ ь Ъ образуя исходный граф W, мы
сначала увеличивали % (7V), а за-Рис. 128. тем оставляли ее без изменения.
Следовательно, % (N) 1.
Отсюда видно также, что эйлерова характеристика любого дерева равна 1.
Теперь вернемся к нашей поверхности S и докажем, что %(S) =С2. Она триангулируема, значит, на ней можно нарисовать карту с треугольными гранями. Определим новую, двойственную к ней карту, так, как показано на рис. 129: поместим вершину в центре каждого треугольника и соединим ребрами каждые две вершины, лежащие в смежных треугольниках.
Вершины и ребра двойственной карты образуют граф. Это-f граф содержит деревья (например, каждая отдельная вершина является деревом). Среди всех этих деревьев выберем максимальное, т, е. дерево, которое нельзя увеличить так, чтобы оно осталось деревом. Назовем его максимальным двойственным деревом. (Пример та
кого дерева нарисован жирными линиями на рис. 130.)
Максимальное двойственное дерево содержит все вершины двойственной карты. В самом деле, если это не так, можно присоединить к нему новую вершину при помощи какого-нибудь маршрута. Этот маршрут достигнет
Рис. 129.
Рис. 130.
двойственного дерева в какой-то вершине Р, а предшествующая вершина Q ему не принадлежит. Тогда, добавляя к дереву вершину Q и ребро PQ, мы вновь получим дерево, что противоречит максимальности нашего исходного двойственного дерева. Значит, ему уже принадлежат все вершины двойственной карты.
Та часть двойственного графа, которая не вошла в максимальное дерево, не может развалиться на отдельные куски, ибо это означало бы, что наше дерево полностью окружило какую-то часть двойственного графа, а тогда оно должно было бы содержать цикл. Но деревья не содержат циклов.
Допустим, что М — максимальное двойственное дерево, а С — остальная, не вошедшая в него часть двойственного графа. Тогда имеют место биекции между:
а) гранями на S и вершинами М\
б) ребрами на S и ребрами М и С (поскольку каждое ребро определяет единственное двойственное ребро, а М и С вместе исчерпывают двойственный граф);
в) вершинами на S и вершинами С. (Каждая вершина на S соответствует грани двойственной карты, и в точности одна вершина этой грани принадлежит С, так как, если бы их было больше одной, можно было бы увеличить М.)
Это означает, что
x(S)=xW+x(Q.
Поскольку М — дерево, % (М) = 1. Граф С связен, поэтому х(О^1- Следовательно,
x(S)^2,
что и требовалось доказать.
Доказательство утверждения В
Пусть S •— поверхность, которую любая замкнутая кривая на ней разбивает на отдельные части. Покажем, что S — сфера.
Сначала докажем, что x(\S) = 2. Пусть М и С обозначают то же, что и выше. Тогда из равенства следует, что если х(5)¥=2, то Х(С)¥=1» т. е. С не является де- Г \
РеВ0М ’ \ \ уГ)
Значит, С содержит цикл. Этот \ | ya^^Z^ цикл является замкнутой кривой \ Х_\
на S и, по предположению, разби- —“X | Г\”/
вает S на куски. Каждый кусок 1 (
обязательно содержит двойствен- /z"'z\ \ ную вершину. Эти вершины дол- [ Г | \
жны быть соединены маршрутом I А | J
в М, значит, этот маршрут где- х—/
то пересечет цикл, принадлежа- Рис- 131-щий С. Но множества М и С, по определению, не пересекаются. Таким образом, мы пришли к противоречию. Следовательно, предположение % (S) 2
неверно, поэтому х (•$) = 2.
Отсюда видно также, что x(Q) = l> т. е. С—-дерево. Если взять какое-то дерево и немного его «раздуть», как на рис. 131, то полученная фигура будет топологически эквивалентна кругу: достаточно, чтобы ветки «съежились» по направлению к некоторой заданной точке.
Разобьем S на два подмножества X и У: к первому отнесем те точки, которые лежат ближе к М, чем к С, а ко второму — те, которые ближе к С, чем к М.
Тогда X и У—«раздутия» М и С, т. е. топологически — круги. Края X и У совпадают. Следовательно, поверхность S топологически эквивалентна двум кругам, сшитым друг с другом по краям, а это и есть сфера.
Раскрашивание карт на поверхностях
Посмотрим теперь, сколько нужно красок для раскрашивания карт на стандартных поверхностях.
Можно показать (примерно тем же способом, каким мы доказали, что для сферы достаточно пяти красок), что в случае эйлеровой характеристики
(а это верно для всех поверхностей, кроме сферы) достаточно иметь
4 (7 + V 49 —24п )
красок.
По этой формуле, например, для тора (п = 0) получаем число 7. Такое количество красок является и необходимым, как показывает рис. 132.
В результате недавних исследований2 установлено, что эта формула дает точное число красок во всех случаях, кроме двух. Для сферы она дает ответ 4 — то ли правильный, то ли нет, неизвестно 3. Для бутылки Клейна получается ответ 7, заведомо неверный: для нее требуется только 6 красок.
Эти результаты ставят проблему четырех красок в довольно странное положение: точный ответ неизвестен только для сферы — простейшей из поверхностей,
Глава 13
АЛГЕБРАИЧЕСКАЯ ТОПОЛОГИЯ
Эйлерова характеристика представляет собой численный инвариант, позволяющий различать топологически не эквивалентные пространства. При поисках других инвариантов открылась замечательная связь между двумя областями современной математики — топологией и абстрактной алгеброй. Оказалось, что с топологическими пространствами связано огромное количество алгебраических инвариантов. Чаще всего пространству ставится в соответствие некоторая группа, причем так, что топологически эквивалентным пространствам отвечают изоморфные группы.
Поиски инвариантов ведутся в надежде на то, что когда их накопится очень много, удастся классифицировать большие совокупности топологических пространств. За исключением поверхностей (где оказалось достаточно эйлеровой характеристики и ориентируемости), построить классификацию не удалось, однако в процессе этих поисков математики, как никогда, приблизились к истинному пониманию возникающих здесь задач.
Дырки, пути и петли
Предположим, что мы хотим найти различие между кругом и кругом с дыркой.
Нетрудно заметить, что в круге любой замкнутый путь можно стянуть в точку; если же в круге есть дырка, то никакой замкнутый путь вокруг дырки стянуть в точку не удастся — дырка помешает.
«Стягиваемость» замкнутой кривой — это, безусловно, топологическое свойство, и наша цель достигнута: мы
сумели отличить круг от круга с дыркой. Попробуем теперь развить дальше содержащуюся здесь ключевую идею: пользоваться для обнаружения дырок изучением путей в пространстве и способов их деформации.
Во-первых, приведем в порядок нашу терминологию. Путь в топологическом пространстве — это линия, соеди-
Рис. 133.
няющая две точки пространства. Неважно, насколько она извилиста и есть ли на ней самопересечения. Важно только, чтобы она не разрывалась: мы хотим, чтобы пути были непрерывны.
Однако если путь имеет самопересечение, нужно указать, каким способом его проходить: два пути на рис. 133 следует рассматривать как разные.
Рис. 134.
Это важно: ведь мы хотим при помощи путей обнаруживать дырки, а способ обхода влияет на то, как путь обвивается вокруг дырки. Например, на рис. 134 один путь можно «сдвинуть» с дырки, а другой — нет.
Простейший способ задать обход пути — вообразить движущуюся по нему точку. В момент времени t точка занимает положение p(t). Она начинает двигаться в некоторый момент t0, а заканчивает в момент Поскольку путь нигде не разрывается, тем самым задается непрерывная функция р, область определения которой —
Рис. 135.
множество действительных чисел в интервале
а область значений лежит в данном топологическом пространстве. Каждая такая функция определяет некоторый путь, а каждый путь — такую функцию.
Если конец одного пути совпадает с началом другого, можно составить композицию этих путей, пройдя сначала один, а потом другой, как показано на рис. 135.
Для путешествия из А в В воспользуемся путем р; затем установим на часах время отправления для q и продолжим движение из В в С. Пройденный в результате путь обозначим
/’* Я-
Если р определен на интервале a q — на ин-
тервале t2^.x^.t3, то р* q определен на интервале — t2+t3 в результате того, что мы перевели часы в точке В.
Композиция * определяет операцию на множестве путей. Она приводит к другому пути, следовательно, множество путей замкнуто относительно этой операции. Далее, операция * ассоциативна (рис. 136).
Пройти от Л к В, а затем от В к С и к D (т. е. р *(q *г)) — это все равно, что пройти от А к В и С, а затем от С к D (т. е. (р * q) * г). (Это напоминает ситуацию с композицией функций, которая тоже ассоциативна. Однако следует заметить, что р * q для путей — совсем не то же самое, что pq для функций. Обла-
Рис. 136.
сти определения и значений для р и q не соответствуют друг другу, и композицию pq вообще нельзя определить.)
Не всякие два пути допускают композицию: конец одного должен совпадать с началом другого. Поэтому сделаем так: выберем некоторую точку А — она называется отмеченной точкой — и сосредоточим внимание на петлях в А, т. е. путях с началом и концом в А. Теперь у нас нет никаких забот: всякая петля начинается и кончается в А, так что можно составить композицию любых двух петель. Множество петель в А замкнуто относительно операции*, и выполнен закон ассоциативности.
Итак, выполнены аксиомы (1), (2), (3) группы (см. гл. 6). Значит, мы уже получили какую-то алгебраическую структуру. Легко видеть, что выполняется и аксиома (4): тривиальная петля, которую мы опишем, если просто останемся в точке А и не затратим на обход никакого времени, в композиции с любой другой петлей даст эту последнюю,
Единственное, чего нам еще не хватает,— аксиомы (5) о существовании обратного элемента. Но что такое обращение? Это способ сделать что-то в обратную сторону. Тогда естественно попробовать обойти петлю в обратном направлении.
К сожалению, это не очень помогает. В самом деле, композиция р-1 с р должна давать тривиальную петлю. Но обход тривиальной петли не занимает времени, а для того, чтобы пройти по петле р * р~1, требуется уж во всяком случае не меньше времени, чем для того, чтобы пройти по р.
Обойти эту трудность, выбрав другой единичный элемент, не удастся: ведь если р * х должно равняться р, то обход по х не должен занимать времени, иначе мы не успеем обойти р.
И все-таки то, что мы получили, так похоже на группу! Неужели нельзя найти какой-то выход из создавшегося положения?
Г омотопия
Вспомним, что в кольце Z целых чисел нет обратных элементов по умножению. Однако стоит разбить его на классы чисел, сравнимых по какому-нибудь простому модулю, как обратные элементы неким загадочным образом появляются.
Сейчас мы попали в аналогичную ситуацию: обратных элементов нет, а нам они очень нужны. Попробуем выйти из положения таким же способом: разбить множество петель на какие-то классы и затем оперировать этими классами.
Требуется ввести нечто вроде «конгруэнтности» петель, хотя конгруэнтность в смысле евклидовой геометрии здесь явно не подойдет. Подсказку надо искать в том, для чего мы вообще занялись петлями: чтобы с их
помощью обнаруживать дырки. Вспомните: когда речь шла о дырке в круге, мы говорили о «стягивании» петель.
Назовем две петли в пространстве S гомотопными, если одну из них можно непрерывно деформировать в другую, оставаясь в S.
На этот раз нам нужны действительно деформации, а не просто непрерывные функции. Здесь уже не важно,
что способ вложения в окружающее пространство может изменить всю картину. Ведь наши петли уже вложены в S, а нас интересует само пространство S.
Понятие гомотопии легче пояснить не для петель, а для путей общего вида. Определение остается тем же, только гомотопные пути должны, конечно, иметь одни и те же концы. Пример гомотопных путей приведен на рис. 137. (Последовательность пунктирных линий изображает деформацию.)
Пути на рис. 138 не гомотопны: дырка мешает деформировать их один в другой.
Вместо путей мы будем рассматривать их гомотопические классы. Для данного пути р обозначим через [р] множество всех путей, гомотопных р. Это и есть гомотопический класс пути р. Такие классы ведут себя подобно классам целых чисел, сравнимых по некоторому модулю.
Если р~1 — путь р в обратном направлении, то путь
р *р~х, хотя и не равен тривиальной петле, зато гомотопен ей. Как показано на рис. 139, мы можем постепенно стягивать р * р~1 к отмеченной точке, двигаясь по нему все быстрее и быстрее. В конце концов получится путь, , который так и не выходит из этой точки и не требует совсем никакого времени для своего обхода. (Для ясности мы на рисунке слегка раздвинули р и р~1.)
Рис. 139.
Ну вот, почти все и сделано. Композицию гомотопических классов определяем формулой
fph[<7]=[p *9]
(и проверяем, имеет ли определение смысл). А затем убеждаемся, что множество гомотопических классов образует группу относительно операции * .
Эта группа называется фундаментальной группой пространства S и обозначается л (S). Построил ее Пуанкаре.
Если S и Т — топологически эквивалентные пространства, то, как мы знаем, существует такая функция f: S Т, что и она сама, и обратная ей функция g обе непрерывны.
Непрерывная функция переводит пути в пространстве S в пути в пространстве Т. Понятие композиции путей является топологическим, понятие гомотопии тоже. По
этому f определяет функцию F на множестве гомотопических классов:
F([p])=[f(p)]-
При этом
F([p]‘ Ы)= F(W)*F([?]), (*)
Подобным же образом функция g: Т -> 5 определяет функцию G, которая является обратной к F. Поэтому F — биекция, а из формулы (») следует, что F — изоморфизм.
Итак, группы л(5) и л(Т) изоморфны, и в этом смысле л (S) — топологический инвариант.
С группой л (S) связаны и числовые инварианты, например ее порядок, однако, если ограничиться лишь числовыми инвариантами, можно потерять много ценной информации.
Фундаментальная группа окружности
Мы не сможем эффективно пользоваться фундаментальными группами, если не научимся их вычислять. В общем случае это не простая задача, и для ее решения и обобщения требуется много теории.
Для некоторых пространств, таких, как R, R2, круг, шар и т. д., найти фундаментальную группу легко. Это пространства без дырок, и любая петля в них стягивается в тривиальную (рис. 140).
Поэтому их фундаментальная группа — тривиальная группа, состоящая из одного элемента /, такого, что 72 = /.
Воспользовавшись «трюком с апельсиновой коркой» (см. с. 210), можно вычислить л (S) для сферы S. Выберем на S какую-нибудь петлю р и не лежащую на ней точку и вырежем из сферы маленький кружок с центром в этой точке, не пересекающийся с р. Оставшуюся часть сферы можно «расплющить» в круг. Внутри этого круга
путь р стягивается в точку. «Завернув» круг обратно, мы получим способ стягивания р в точку на S. Значит, п (S) тоже тривиальна.
Другой простейший случай — когда S — окружность. Любая петля на S оборачивается вокруг S то или иное число раз. Это число называется степенью петли. Петли на рис. 141 имеют соответственно степени 1, 2 и 0 Если условиться считать положительным направление против часовой стрелки, то обратные им петли имеют степени -1, -2, 0.
Мы покажем, что степень петли определяет ее гомотопический
класс: две петли гомотопны тог- Рис да и только тогда, когда они имеют одинаковые степени.
Интуитивно это понятно: не видно, как можно было бы изменить степень петли простой деформацией. Тривиальная петля, разумеется, имеет степень 0; третью петлю на рис. 141, тоже имеющую степень 0, можно стянуть в точку.
Чтобы получить доказательство, введем вспомогательное пространство, в котором хорошо видны гомотопические свойства и которое тесно связано с окружностью. Это поможет нам вывести гомотопические свойства окружности.
Представим себе кривую L, восходящую над окружностью подобно винтовой лестнице, и отметим над точкой А на окружности точку О на кривой. Любую петлю в S можно «поднять» и получить некоторый путь в L, Действительно, возьмем какую-нибудь точку .в S и лежащую над ней точку в L. Когда первая описывает пет
лю в S, вторая, двигаясь точно над первой, описывает непрерывный путь в L. Например, петлям на рис. 141 соответствуют пути, изображенные на рис. 142.
Поднятый путь не обязательно кончается в точке О, но всегда точно над (или под) ней на спирали. Количество витков, на которое он поднимается (или опускается), равно в точности степени соответствующей петли. Если угодно, можно считать это определением.
Теперь настал решительный момент: два пути в S гомотопны тогда и только тогда, когда их «поднятия» гомотопны в L. В самом деле, имея гомотопию в L, мы можем
«спроектировать» ее и получить гомотопию в S. И наоборот, любую гомотопию в S можно поднять в L: деформируя путь в S, мы деформируем соответствующий путь в L.
Но в L гомотопические свойства тривиальны, поскольку L — линия, и мы уже знаем, что группа л(Ь) тривиальна. Два пути в L гомотопны тогда и только тогда, когда они имеют одни и те же концы. Ясно, что это условие необходимо; ввиду тривиальности л(Ь) оно является и достаточным.
Все поднятые в L пути начинаются в О. Концы их совпадают, когда они делают одинаковое число витков над (или под) О. Но это происходит тогда и только тогда, когда соответствующие петли в S имеют одну и ту же степень.
Возьмем петлю в S степени п и составим ее композицию с петлей степени т; мы получим петлю, которая делает сначала п оборотов по окружности, а потом еще т оборотов. Значит, ее степень равна п + т. Отсюда видно, что группа л(5) изоморфна группе Z целых чисел по сложению.
Проективная плоскость
Возьмем в качестве S проективную плоскость. Ее фундаментальная группа n(S) состоит из двух элементов:
I 1 г
1 1 г
г г 1
Элемент г — это гомотопический класс пути, показанного на рис. 143. (Вспомним, что проективную плоскость можно представить как квадрат с отождествленными диаметрально противоположными точками.)
Соотношение г2=/ означает, что, хотя путь на рис. 143 не стягивается в точку, путь, который получается, если пройти по нему дважды, обладает этим свойством.
В этом можно убедиться геометрически (рис. 144£; возьмем один экземпляр нашего пути и вытянем его по направлению к левому верхнему углу; пройдя через край квадрата, он в силу наших отождествлений вернется через правый нижний угол в обратном направлении, и мы стянем его к отмеченной точке.
Этот забавный факт имеет некоторое отношение к «фокусу с глубокой тарелкой». Возьмите глубокую тарелку, желательно не из фа
мильного сервиза, и держите ее перед собой на кончиках пальцев правой руки. Опускайте локоть и двигайте его назад, пронося тарелку под мышкой. Продолжайте выворачивать руку в том же направлении и поднимайте локоть, пока тарелка не займет исходное положение. Теперь ваша рука вывернута локтем вверх.
Но вы на этом не останавливайтесь. Продолжайте тем же способом выворачивать руку, пронося тарелку над головой, а локоть перед собой. Вы вернетесь в исходное положение. На полпути рука была вывернута. Казалось бы, после следующего оборота должно стать еще хуже. Но этого не случилось: вы вернулись в исходное положение с невывернутой рукой.
Именно это происходит на проективной плоскости: после одного оборота все закручивается, а после второго — приходит в нормальное состояние.
Глава 14
В ГИПЕРПРОСТРАНСТВО
Меня спрашивают: «Можете вы показать нам это четвертое измерение?» А я отвечаю- «А вы можете показать мне первое, второе и третье?» Аноним
Часто случается так, что какое-то математическое обобщение, которое сначала развивают ради него самого, позднее приобретает важное значение для математики в целом.
В гл. 4 мы установили, что евклидову плоскость можно представлять как множество всех упорядоченных пар действительных чисел, которое мы обозначили R2. Подобным же образом трехмерное пространство можно рассматривать как множество R3 всех упорядоченных троек (х, у, х) действительных чисел. Наконец, линия R — это одномерное пространство. Таким образом, мы получаем:
1-мерное пространство= R = множество действительных чисел х,
2-мерное пространство= R2 = множество пар действительных чисел (х, у),
3-мерное пространство = R3 = множество троек действительных чисел (х, у, г). На этом реальные пространства кончаются. Но реальность так часто разочаровывает... А что, если попытаться уйти от нее:
4-мерное пространство = R4 = множество четверок действительных чисел (х, у, г, и),
5-мерное пространство = RE = множество пятерок дей
ствительных чисел (х, у, z, и, v),
и вообще
«-мерное пространство= Rn = множество «-наборов ("М, Хп).
В самом деле, почему бы и нет? Мы вольны давать любые определения, какие захотим. Правда, говоря о пространствах, обычно подразумевают не просто множества точек. В пространствах определено расстояние между точками.
Так, расстояние d между двумя точками (х4, х2) и (i/i, У2) по теореме Пифагора определено формулой
d2= (xi-t/i)2+ (х2-у2)2.
Соответствующая формула в 3-мерном пространстве имеет вид
d2= (м-!/1)2+ (Хг-р2)2+ (Хз-Уз)2.
И в 1-мерном пространстве можно написать такую же формулу
d2= (М-У1)2.
Если мы на верном пути, то, вероятно, в 4-мерном пространстве расстояние между (хь х2, х3, х4) и (z/i, у2, уз, у4) должно определяться формулой
d2 = (xi-tji)2+ (х2-у2)2+ (хз-уз)2+ (х4-у4)2, и аналогичную формулу мы вправе ожидать для «-мерного пространства.
Вопрос не в том, верна эта формула или нет. Поскольку о 4-мерном пространстве нам ничего не известно, у нас нет возможности проверить ее справедливость. Мы находимся во владениях абстрактной математики и можем пользоваться любой формулой, какой захотим. Правильнее поставить вопрос так: «Все это прекрасно, и я согласен, что напрашивается именно такая формула,
но можно ли с ее помощью получить что-нибудь разумное?»
Для того чтобы некую величину можно было считать «расстоянием», она должна удовлетворять трем условиям:
1) расстояние между любыми двумя точками положительно;
2) расстояние от точки А до точки В равно расстоянию от В до Л;
3) расстояние от А до В не превосходит суммы расстояний от Л до С и от С до В.
Условие 3 говорит о том, что сторона треугольника меньше суммы двух других его сторон, н, грубо говоря,
оно отражает наше представление, что «прямая определяет кратчайшее расстояние между двумя точками».
Проверим, удовлетворяет ли наша формула этим условиям.
Условие 1 выполняется, если для определения d взять положительный квадратный корень, причем извлечение корня допустимо, так как правая часть есть сумма квадратов и, следовательно, неотрицательна.
Условие 2 заключается в том, что d не изменится, если поменять местами все Xi и у,. Но (х, —у,)2= = (yi — Xi)2, поэтому условие 2 выполнено.
Условие 3 приводит к важному алгебраическому неравенству. Рассмотрим частный случай п = 2. Из рис. 145 видно, что дело сводится к доказательству неравенства
V а2 + b2 +V с2 + d2 > V(а + с)2 + (b + d)2.
Возведя его в квадрат, получим неравенство 246
а2 + ь2 + С2 + d2 + 2 / (й2 + Ь2) (с2 + d2) >(й + с)2 + (b + d)2,
которое верно при условии, что
2 V (a2 + b2) (c2 + d2) > 2 (йс + bd).
Последнее в свою очередь верно, если
(й2 + &2) (c2+d2) (ac+bd)2,
или, что то же самое,
(й2 + 62) (c2 + d2) — (ac + bd)2^0.
Преобразуем левую часть и убедимся, что она равна (ad—be)2.
Но квадрат всегда неотрицателен. Поэтому в 2-мерном случае условие 3 выполняется.
В n-мерном случае проводятся аналогичные, но более громоздкие выкладки. Таким образом, наша попытка обобщения сразу привела к важному неравенству.
Это означает, что наше определение расстояния по крайней мере не лишено смысла. Свойства абстрактного 4-мерного пространства начали изучать геометры 19 века (которым стало почти нечего доказывать в пространствах меньшей размерности). К своей великов радости они обнаружили, что концепция 4-мерного пространства не только не бессмысленна, но и весьма плодотворна и приносит с собой много красивых идей и теорем.
Политопы
В 3-мерном пространстве существуют ровно 5 правильных многогранников: тетраэдр, куб, октаэдр, додекаэдр, икосаэдр. Соответствующий объект в 4-мерном
пространстве называется правильным политопом. Его «грани» — трехмерные правильные многогранники, грани последних — правильные многоугольники. Расположение «граней» одинаково в каждой вершине. Во избежание путаницы будем называть эти трехмерные «грани» ячейками, а название «грани» сохраним за двумерными гранями этих ячеек.
Геометры (в частности, Шлефли) установили, что в 4-мерном пространстве имеется ровно 6 правильных политопов:
Число ячеек Число граней Число ребер Число вершин Тип ячеек Название поли топа
5 10 10 5 Тетраэдр Симплекс
8 24 32 16 Куб Гиперкуб
16 32 24 8 Тетраэдр 16-ячейка
24 96 96 24 Октаэдр 24-ячейка
120 720 1200 600 Додекаэдр 120-ячейка
600 1200 720 120 Тетраэдр 600-ячейка
(К вопросу о закономерностях появления этих чисел мы вернемся позднее.)
В пространствах более высоких размерностей — 5-мерном, 6-мерном и т. д.— насчитывается всего три правильных политопа: это аналоги тетраэдра, куба и октаэдра.
Итак, числа правильных фигур в пространствах размерности 1, 2, 3, 4, 5, ... равны соответственно оо, 5, 6, 3, 3, ...
Политопы невозможно нарисовать на бумаге. Но и 3-мерные фигуры тоже невозможно нарисовать на бумаге. При изображении 3-мерных объектов на плоском листе мы пользуемся определенными соглашениями, которые обусловлены анатомическим строением нашего глаза. Можно научиться делать изображения и 4-мерных
фигур, однако без достаточной практики их трудно будет «читать», подобно тому как трудно понять технический чертеж, не будучи инженером.
Четырехмерные изображения
Четырехмерные фигуры можно, например, изображать с помощью проекции. Именно таким способом художник рисует трехмерную натуру на двумерном холсте. При этом «натура» сплющивается либо радиально, либо перпендикулярно (рис. 146).
Рис. 146.
Аналогичным способом можно строить проекции 4-мерных фигур в 3-мерное пространство. Чтобы получить плоское изображение, приходится преодолеть еще одну трудность: полученную 3-мерную проекцию спроектировать в 2-мерное пространство. На рис. 147 показаны две проекции гиперкуба.
При интерпретации этих картинок следует принимать во внимание действие перспективы. Маленький кубик внутри левого рисунка на самом деле того же размера, что и внешний куб. Однако из этой картинки легко видеть, что гиперкуб составлен из 8 кубов (на левой кар-
249
L
тинке: из одного маленького, одного большого и шести искаженных, которые выглядят как усеченные пирамиды). Каждый из этих кубов соприкасается с 6 другими — по каждой своей грани, и к каждой вершине примыкают 4 куба.
Существуют программы для вычислительных машин, которые выдают на экран проекции 4-мерных фигур.
Рис. 147.
Оператор может менять направление проекции, «поворачивая» фигуру. Говорят, что по мере накопления опыта оператор начинает угадывать, как будут выглядеть проекции после поворота,— он начинает думать в 4-мерном пространстве. Топологи, изучающие пространства высших размерностей, также овладевают этим уменьем.
Есть еще один, по-видимому более наглядный, способ изображать 4-мерные объекты: при помощи поперечных сечений. Подобным способом изображаются на карте горы и долины: местность расслаивается воображаемыми горизонтальными плоскостями и на карту наносятся контуры пересечений (рис. 148),
Вырезав из картона куски в форме этих контуров и расположив их друг над другом на правильной высоте, можно восстановить форму поверхности.
Жители 2-мерного мира могли бы пользоваться этими сечениями для изображения 3-мерных объектов, а обитатель 1-мерного пространства при помощи ряда линейных
сечений мог бы составить представление о форме плоской фигуры.
Во всяком случае сечение уменьшает размерность. Сечения 4-мерной фигуры 3-мерны.
Обобщив алгебраическое определение сечения в трехмерном пространстве, можно точно сказать, что пони-
Рис. 148.
мается под сечением объекта в R4, R5 и т. д. В некоторых случаях по аналогии можно угадать, как выглядят эти сечения, а затем проверить правильность догадки при помощи алгебры. Мы здесь не будем морочить себе голову алгеброй.
Сечениями сферы являются окружности, вырастающие от точки до большого круга и затем стягивающиеся
Рис. 149.
ОЙО(Э
Рис. 150.
снова в точку. Значит, сечениями гиперсферы (4-мерного аналога сферы) будут сферы, вырастающие от точки до максимума и затем сжимающиеся, как на рис. 149.
Сечения куба (параллельные граням) всегда квадраты, поэтому сечениями (аналогичными) гиперкуба должны быть кубы (рис. 150).
Укладка сечений
Поскольку мы живем в 3-мерном пространстве, наша главная проблема — мысленно уложить сечения в одно целое. Здесь снова помогает аналогия с воображаемыми обитателями плоскости. Как они стали бы укладывать двумерные сечения?
Они могли бы, например, считать, что секущая плоскость равномерно движется. В каждый момент времени t в сечении получается некоторый двумерный объект. Если бы удалось снять кинофильм, в котором чередование кадров соответствовало бы последовательным моментам времени, его можно было бы использовать для воссоздания трехмерной картины. Эти существа представляли бы себе шар как вырастающий из точки кружок, который затем снова сжимается в точку.
Подобным образом могли бы поступать и мы: укладывать 3-мерные сечения 4-мерных объектов во времени, создавая 3-мерный кинофильм. Гиперсфера тогда выглядела бы как растущий, а затем снова сжимающийся пузырь. Вместо гиперкуба перед нами внезапно возникал бы куб, который, пробыв некоторое время без всяких изменений, внезапно исчезал бы. А если бы вдруг появилась сфера, побыла некоторое время, а потом пропала, мы знали бы, что это был гиперцилиндр со сферическим сечением.
Это уже лучше, но еще не совсем то, что нужно. Нам приходится смотреть этот кинофильм в строго определенной последовательности, и мы попадаем в положение
слепого, которому разрешено ощупывать предметы лишь одним движением — сверху донизу. А хотелось бы поводить руками вверх и вниз, изучить подробнее каждую непонятную (или особенно интересную) деталь.
Короче говоря, требуется машина времени — или по крайней мере кинопроектор с обратным ходом и разными скоростями.
Рис. 151.
Эта машина должна иметь педаль управления временем и особый экран для воспроизведения 3-мерных изображений. К счастью, нас устроит воображаемая машина: двигайте ногой, как будто нажимаете на педаль, и представляйте себе изображения!
Изменяя степень нажима на педаль, вы сможете перемещаться во времени. В качестве первого упражнения в управлении педалью развяжем в 4-мерном пространстве узел, не разъединяя концов шнура. Для простоты займемся самым простым узлом, хотя годится и любой другой. В кадре А на рис. 151 изображен такой узел; он «обитает» в 3-мерном пространстве в момент времени t = 0.
Схватите шнурок покрепче вблизи точки самопересечения X. Ослабьте нажим на педаль и продвиньтесь немного вперед во времени, протащив за собой малую петлю шнура, но так, чтобы большая часть узла осталась в прежнем положении во времени и пространстве (показанном пунктиром), как в кадре В. Теперь опустите эту петлю ниже того места, где раньше был другой
Рис. 152.
участок шнура, как в кадре С. Наконец, вернитесь обратно во время t=Q, захватив с собой все ту же петлю. В результате (кадр D) узел будет развязан.
В качестве второго упражнения попробуйте вложить без самопересечений в 4-мерное пространство бутылку Клейна. Начните с рис. 81 в момент t=0. Возьмите участок «трубки» около пересечения и немного передвиньте его во времени.
А теперь попытаемся сцепить окружность со сферой. Сначала воспользуемся аналогией: рассмотрим две сцепленные окружности в 3-мерном пространстве (для удобства одну из них сделаем прямоугольной, см. рис. 152)« Введем временную ось, как показано на рисунке.
Можно считать, что это зацепление получилось так: в момент t=0 точка начала двигаться из центра окружности вперед во времени, в сторону в пространстве, назад во времени до момента, предшествующего t=0, снова в сторону в пространстве до некоторой точки, лежащей
непосредственно под центром окружности (относительно оси времени), и, наконец, вперед во времени, после чего петля замкнулась.
Чтобы сцепить в 4-мерном пространстве сферу с окружностью, поступим аналогично. Вообразим сферу в момент £=0. Пусть точка начинает движение из центра сферы. Она перемещается вперед во времени (не пересекая сферы, которая исчезла, как только точка пошла вперед), огибает сферу во времени и в пространстве, достигая точки, лежащей непосредственно под центром сферы относительно оси времени, и, наконец, двигается вперед во времени, замыкая окружность.
Вместо зацеплений можно рассматривать заузлива-ния. Сфера в 4-мерном пространстве может быть завязана в узел, точно так же как окружность в 3-мерном пространстве. Топологи потратили много усилий на решение такой задачи: может ли заузливаться m-мерная сфера в n-мерном пространстве? В момент написания этой книги первый, еще не решенный случай касался 10-мерной сферы в 17-мерном пространстве.
Космонавты в 24-мерном пространстве
Представьте себе маятник, качающийся с небольшой амплитудой. В любой данный момент времени t он занимает некоторое положение р, и его скорость равна q. Если нарисовать график зависимости р от q (выбрав для измерения времени некоторую подходящую единицу), получится окружность, и, когда маятник качается, точка (Р> У) движется по окружности равномерно (рис. 153). В точке А у нас р = 0, 9>0; в точке В имеем q = 0 и р>0; в точке С — снова р = 0, но 9<0; в точке D — наоборот, 9=0, а р<0; все это согласуется с колебаниями маятника (рис. 154).
График зависимости р от q называют фаговой диаграммой, а плоскость (р, q) -— фазовым пространством.
В рассматриваемом случае оно 2-мерно, так как состояние маятника определяется двумя величинами; координатой и скоростью.
Любой динамической системе соответствует фазовое пространство, размерность которого определяется количеством пространственных координат и составляющих скорости.
Рис. 153.
Так, например, динамическая система, состоящая из Солнца, Луны и Земли, движущихся по законам гравитационного притяжения, имеет 18-мерное фазовое пространство: по три пространственные координаты и по три составляющие скорости для каждого из трех небес-
Рис. 154.
ных тел (ибо в 3-мерном пространстве и положение, и скорость задаются тремя координатами). Состояние этой системы в целом в каждый момент времени задается одной-единственной точкой фазового пространства. При
изменении времени эта точка описывает некоторую тра екторию, полностью задающую движение всей системы
Чтобы вычислить орбиту космического корабля, движущегося в этой системе, нужно добавить еще 6 измерений (положение и скорость корабля), и тогда получится задача 24-мерной геометрии! Такой подход позволяет не только описать задачу. Последовательно и основательно разработанный, он становится мощным математическим методом:
геометрической динамикой. Рис. 155.
Движение заданной ди-
намической системы может начинаться различными способами. Например, космический корабль можно запускать из любых начальных положений с разными начальными скоростями. Каждому начальному состоянию отвечает некоторая точка фазового пространства. Когда система движется, эта точка описывает некоторую траекторию; так мы получаем семейство траекторий — по одной для каждого начального состояния. Вообразим, что фазовое пространство заполнено жидкостью, причем каждая частичка жидкости соответствует некоторому состоянию системы. Тогда жидкость будет течь по траекториям. Для нашего маятника линиями тока служат концентрические окружности, а стационарная точка в центре отвечает вертикально висящему маятнику, находящемуся в состоянии покоя (рис. 155).
Из ньютонова закона сохранения энергии следует, что эта воображаемая жидкость ведет себя в точности, как настоящая; более того, она несжимаема. Это позволяет применять к общей теории динамических систем методы гидродинамики. Без использования многомерной геометрии такое применение было бы неосуществимо.
Дальнейшее обобщение формулы Эйлера
Формула Эйлера сначала давала нам соотношение
между числом граней, числом ребер и числом вершин карты на плоскости. Затем мы обобщили ее на другие поверхности. Теперь посмот-
Рис. 156.
рим, нельзя ли обобщить ее на пространства высших размерностей.
«Карта» в «-мерном пространстве состоит из «-мерных «областей» с («— 1)-мерными «гранями»; последние имеют (п—^-мерные «грани» и т. д. вплоть до вершин, которые представляют собой 0-мерные «грани», Обозначим число «-мерных «граней» карты символом Fn. Например, для политопа в 4-мерном
пространстве Fq — число вершин, Fi •— число ребер, Fz — число граней, F$—число ячеек и Ft — число 4-мерных
областей, которое для правильного политопа равно 1.
В 2-мерном случае формула имела вид
В-Р+Г=1
или в новых обозначениях
F9-Fi+F2~1.
Вспомним, как доказывалась эта формула: посредством «стягиваний» мы добивались того, чтобы изменения числа «граней» соседних размерностей компенсировали друг друга. Это наводит на мысль рассмотреть в 4-мер-ном пространстве выражение
Fo—Fi +F2—F3 + F4.
Рис. 157.
Испробуем его на правильных политопах, помня, что для них +4=1. Воспользовавшись таблицей на с. 248, найдем:
5-10+10-5+1 = 1, 16-32 + 24-8+1 = 1, 8-24 + 32-16+1 = 1, 24-96+96-24+1 = 1, 600-1200 + 720-120+ 1 = 1, 120-720 + 1200-600+ 1 = 1.
Невероятно, что это простое совпадение.
Для 3-мерной карты соответствующее выражение имеет вид
Fo~ Fi +F2—F3.
Испробуем его на чем-нибудь не очень правильном (рис. 156). Имеем Fa — 14, Fi = 22, Р2= И, Fs=2 и
14-22 + 11-2=1.
И опять это мало похоже на совпадение.
Итак, естественно ожидать; что для карты в «-мерном пространстве выполнена формула
Fo~ Fi + F?—...±Fn= 1.
Ее нетрудно доказать все тем же методом стягиваний, Можно одновременно избавиться от вершины и ребра, или от ребра и грани, или от грани и ячейки и т. д., т. е. от m-мерной и (т +1)-мерной «граней» (рис. 157).
Каждое такое стягивание не меняет левой части формулы. В конце концов мы приходим к одной точке, для которой эта левая часть равна 1. (Чтобы такое доказательство работало, нужно еще делать стягивания в правильном порядке, но мы хотели лишь дать главную идею.)
Итак, в этом случае допускают обобщение и сама теорема, и метод ее доказательства.
Впервые «-мерный вариант формулы Эйлера доказал Пуанкаре, поэтому ее называют формулой Эйлера — Пуанкаре.
Еще немного алгебраической топологии
Понятия гомотопии и фундаментальной группы (гл. 13) допускают обобщения на пространства высших размерностей. Для получения «путей» вместо отрезка используется «-мерный гиперкуб. Вместо соединения конца с концом используется соединение грани с гранью, как
показано на рис. 158. Чтобы получить группу, мы рассматриваем гиперкубы, граница которых стягивается в одну точку.
В результате соответствующего обобщения понятия гомотопии получается группа, состоящая из гомотопических классов n-мерных «путей». Она называется n-й го-
Рис. 158.
мотопической группой itn(S) пространства S. Фундаментальная группа л(3) становится, таким образом, группой Л](S)—первым членом целой последовательности алгебраических инвариантов.
Высшие гомотопические группы способны обнаруживать такие различия между пространствами, которые не улавливает группа Ль Допустим, что из большего шара выброшен шар поменьше, т. е. пространство S представляет собой'что-то вроде утолщенной апельсиновой корки. Тогда любая петля соскользнет с дырки, и группа Я1(5) тривиальна. Но если мы окружим дырку квадратом из пленки, граница которого стянута в точку (так сказать, упрячем дырку в пакет), то нам не удастся стянуть его в точку внутри S. Таким образом, группа яг(5) нетривиальна и обнаруживает дырку, которую «пропустила» группа ль
Казалось бы, зная все гомотопические группы яДЗ), Лг(3), мы должны были бы знать, что представляет
собой пространство 5 с точностью до топологической эквивалентности. К сожалению, это не так. Пуанкаре высказал гипотезу, что верен хотя бы частный случай этого утверждения; если пространство 5 имеет ту же последовательность гомотопических групп, что и «-мерная сфера, то S и есть n-мерная сфера. В случае п=2 это наше утверждение В из гл. 12. При п^5, как доказал Смейл *, это тоже верно. Однако справедлива или нет эта гипотеза при п=3ип=4 — никто не знает.
Выходит, что топология в больших размерностях иногда проще, чем в меньших! И правда, в топологическом фольклоре самой плохой считается размерность 4. Что такого особенного в 4-мерном пространстве — неразгаданная тайна.
Глава 15
ЛИНЕЙНАЯ АЛГЕБРА
Задача
В школе на уроках алгебры нас учат решать системы уравнений вроде
х + 2у = 6, Зх — у = 4
следующим методом (или какой-нибудь его разновидностью): умножить первое уравнение на 3, получив
Зх+6у= 18,
и вычесть из него второе уравнение. В результате мы приходим к уравнению
7у=14,
откуда у=2. Далее надо подставить это значение в первое уравнение и получить х=2.
Теперь предположим, что вместо рассмотренной системы нам задали уравнения'
х + 2у = 6, Зх + бу = 4.
Согласно изложенному методу, умножаем первое уравнение на 3, получив
Зх+6у= 18,
и вычитаем из него второе. Это дает равенство
0=14.
(1)
(2)
Мы пытаемся найти из него у и впадаем в уныние.
В школе с нами такого не случалось: нас оберегали от такого рода неприятностей, тщательно подбирая уравнения. Не сталкивались мы и с ситуацией, которая возникает при решении уравнений
х + 2у = 6, |
Зх + бу = 18. J W
Здесь обычный метод дает
0=0.
Мы могли бы покачать головой, заявить, что системы уравнений типа (2) и (3) бессмысленны, и не обращать на них больше внимания. Но всегда ли мы сумеем во-время догадаться, что возникнет такая бессмыслица?
Во всех рассмотренных случаях нетрудно дать объяснение происходящему. Уравнения (2) противоречат друг другу, поэтому-то решения и не существует. В системе (3) второе уравнение по существу совпадает с первым, т. е. на самом деле у нас есть лишь одно уравнение с двумя неизвестными. Это не значит, что система (3) не имеет решений: напротив, их много. Например, х=2, у=2\ х=4, у=1; х=6, у=0; х = 1/2, у=11/4. С другой стороны, не всякая пара чисел годится: х=1, у= 1 не будет решением. Полное множество решений можно найти так: выбрать х произвольным образом, скажем, взять х—а, а тогда у=1/г(6 —а). И это будут все решения.
Итак, система может:
{иметь единственное решение, не иметь решений, иметь бесконечно много решений, и этим исчерпываются все возможности. Не существует системы уравнений, которая имела бы точно 2 решения, или точно 3, цли 4, или вообще какое-нибудь конечное число (кроме 0 и 1) решений, (Я ие хочу проводить
здесь доказательство, но из дальнейших рассуждений будет ясно, что это так.)
Аналогично ведут себя системы с большим числом неизвестных, но это значительно труднее обнаружить.
Вполне простительно, имея дело с системой уравнений
х 4- 4у — 2z 4~ 3/ = 9,
2х— у —z — t = 4, 5х + Ту + г — 2/ = 7, Зх— 2у —8г + 5/ = 21, не сразу заметить, что удвоенное первое уравнение плюс утроенное второе минус третье равно
Зх—2у—8г + 5/=23, а это уравнение противоречит четвертому. Если же заменить в четвертом уравнении 21 на 23, то у нас по существу получится система из трех уравнений с четырьмя неизвестными, 'Которая, как выясняется, имеет бесконечно много решений.
Но, вообще говоря, если у системы больше неизвестных, чем уравнений, то это еще не значит, что у нее есть решения: система
2х 4- 2у 4- 2г + 2/ = О J решений не имеет.
Таким образом, системы уравнений оказываются совсем не такими «ручными», как мы думали. Их поведение «дико» и (на первый взгляд) непредсказуемо. Если бы мы были уверены, что все системы уравнений, которые встречаются на самом деле, имеют единственное решение, мы могли бы не обращать внимания на эти неприятности. К сожалению, это не так. Но системы уравнений, по счастью, обладают некоторыми тайными признаками, которые позволяют разрешить большую часть проблем.
Геометрическая точка зрения
Обратимся к графическому изображению уравнений. Это поможет нам разобраться, в чем состоит разница между системами (1), (2) и (3). На рис. 159 изображены прямые, соответствующие уравнениям системы (1): точка пересечения этих прямых и есть единственное решение рассматриваемой системы.
Уравнения системы (2)
определяют две параллельные прямые (рис. 160), которые никогда не пересекутся.
Соответствующие системе (3) прямые совпадают, и, таким образом, все их точки определяют решения системы (рис. 161).
Очевидно, что этим исчерпываются все возможности взаимного расположения двух прямых. Теперь ясно, почему система должна или не иметь решений совсем, или иметь одно решение, или иметь их бесконечно много. При изучении общей задачи более полезным оказывается другой геометрический подход к системам уравнений. Введем две си
стемы координат: (х, у) и (X, Y). Каждой точке (х, у) по-ставим в соответствие точку (X, Y) такую, что
х -\-2у — X, 1 Зх— 2у = У. J
Чтобы решить систему (1), надо найти такую |очку (х, у), чтобы для соответствующей ей пары (X, Y) выполнялось равенство (X, У) =(6,4).
Что получается? Вычислим (X, Y) для некоторых (х, у)'.
(х, у) (X У)
(0,0) (0,0)
(0,1) (2,-1)
(0,2) (4,-2)
(1,0) (1,3)
(1,1) (3,2)
(1,2) (5,1)
(2,0) (2,6)
(2,1) (4,5)
(2,2) (6,4)
Ясно, что преобразование (х, у) в (X, Y) превращает квадраты на (х, у)-плоскости в параллелограммы на (X, У)-плоскости.
Последняя строчка выписанной выше таблицы дает решение нашей системы: Х—6, У=4 при х=2, у=2. Но так вышло случайно. Гораздо большую ясность вносит рисунок. Рассмотрим произвольную точку (а, р) на (X, У)-плоскости. Очевидно, что некоторая точка (х, у)-плоскости переходит в (а, Р), поскольку мы нашу плоскость лишь несколько растянули и повернули. Параллелограмм, содержащий (а, р), получился из некоторого квадрата, и одна из точек этого квадрата переходит в (а, Р). Например, пусть (а, Р) = (472, 3) —центр одного
из изображенных на рис. 162 параллелограммов. Центр соответствующего квадрата — это (Р/г, Р/г), И, конечно, единственным решением системы
х + 2t/ = |
Зх — у = 3 J
будет х=Р/2,у=Р/2.
Рис. 162.’
Далее ясно, что это решение должно быть единственным, поскольку преобразование квадрата в параллелограмм происходило так, что две различные точки (х, у)-плоскости не могли перейти в одну. Построенное преобразование не производит склейки.
Однако когда мы переходим к системам (2) и (3), то должны положить
х+2 у=JC,
Зх+6у= У,
Нетрудно видеть, что все получающиеся таким путем точки (X, Y) лежат на прямой, а именно на прямой У=ЗХ (рис. 163).
Соответствующее преобразование стягивает всю
(х, у)-плоскость в единственную прямую. В системе (2) у нас Х = 6, У=4. Но точка (6, 4) не лежит на полученной прямой. Значит, решения не существует, так как все точки (х, у) отображаются только в эту прямую. С другой стороны, для системы (3) Z=6, У= 18, и эта точка лежит на полученной прямой. Более того, в нее стянулось бесконечно много точек (х, у).
Рис. 163.
Далее все возможные значения (х, у) образуют на (х, гд)-плоскости прямую, задаваемую уравнением x+2z/=6.
Таким образом, особенности поведения рассматриваемых систем зависят от геометрических свойств преобразования Т такого, что
Т(х, у) = (X, У) = (х+2у, Зх-у), и преобразования S такого, что
S(x, у) = (X, У) = (х+2у, Зх+бу).
Чтобы исследовать систему уравнений общего вида ax -j- by = X, | сх + dy = У, J
нужно рассмотреть преобразование
U(x, у) = (ax+by, cx+dy).
Для системы из трех уравнений с тремя неизвестными
ах 4- by 4- cz — X, )
dx 4- еу 4- fz = Y, >
gx + hy 4- kz— Z J
нам потребуется преобразование
V(x, у, z) = (ax + by+cz, dx+ey+fz, gx+hy+kz).
Все это так называемые линейные преобразования; их изучением занимается линейная алгебра.
Некоторые соображения о поведении систем
Используя введенное выше преобразование Т, мы можем найти для системы (1) теоретико-множественную формулировку: является ли точка (6,4) элементом области значений преобразования Т? Напомним, что областью значений преобразования Т называется множество значений Т(х, у), которые принимает Т. Таким образом, точка (6,4) лежит в этой области в том и только в том случае, если найдутся х и у такие, что (6, 4) = = Т(х, у) — (х+2у, Зх—у), и это иная формулировка системы (1).
Аналогично обстоит дело с двумя другими системами: они выясняют, принадлежат ли точка (6,4) или точка (6, 18) области значений линейного преобразования 3.
Поскольку Т преобразует квадраты в параллелограммы, то из геометрических соображений ясно, что областью его значений является вся плоскость. Как мы уже установили, областью значений преобразования 3 служит одна прямая.
Чтобы изучать системы уравнений общего вида, надо попытаться побольше разузнать об областях значений
линейных преобразований. Мы уже знаем, что ими могут быть плоскости и прямые. Есть ли другие возможности? Да. Тривиальная системй
Ох + Оу = X, 1
Ох 4- Оу = Y J
соответствует линейному преобразованию F такому, что F(x, у) = (0, 0). Его область значений — единственная точка {(0, 0)}. (Область значений — это множество, поэтому мы, как это принято в теории множеств, заключили (0, 0) в фигурные скобки.)
Однако теперь для системы из двух уравнений с двумя неизвестными исчерпаны все возможности. Соответствующая область значений — это или плоскость, или прямая, или точка. Разумеется, если она является плоскостью, то это вся плоскость R2.
Если область значений соответствующего преобразования оказывается плоскостью, то решение системы существует, и оно единственно. Если область значений — прямая, то система может иметь решения и может их не иметь; они существуют тогда и только тогда, когда (X, У) лежит на этой прямой, и при фиксированной паре (X, У) сами решения составляют прямую. Если область значений — точка, то решения существуют только при (X, У) = (0, 0), и тогда они составляют целую плоскость, т. е. решением служит любая точка из R2.
Будем называть множество решений системы (если они у нее есть!) пространством решений. Тогда описанные выше сЛучаи можно свести в такую таблицу;
Область значений
Плоскость
Прямая
Точка
Пространство решений
Точка
Прямая
Плоскость
Естественно ожидать, что для систем трех уравнений а тремя неизвестными области значений и пространства решений могут быть точками, прямыми, плоскостями или всем пространством R3. И это действительно так. Все возможные случаи отражены в следующей таблице(
Область значений
R8
Плоскость Прямая Точка
Пространство решений
Точка
Прямая
Плоскость
R8
Иначе говоря, чем меньше область значений, тем больше пространство решений, но, с другой стороны, чем меньше область значений, тем меньше шансов, что система вообще имеет решение.
Так же обстоит дело и в общем случае. Если все происходит в Rn, то можно доказать, что сумма размерностей области значений и пространства решений равна п. Таким образом, если линейное преобразование в пространстве R7 имеет трехмерную область значений, то соответствующее пространство решений должно иметь размерность 4.
Конечно, мы до сих пор не определили точно, что такое размерность. Здесь действительно начинается линейная алгебра, но подробнее об этом лучше прочитать в специальном учебнике *, Однако теперь уже ясно, что кажущаяся «дикость» поведения систем уравнений укладывается в четкую схему,
Матрицы
Существует очень удобный способ записи линейных преобразований (ввел его Кэли), Если Т[х, у) = [Х, У), где
ax + by => X, 1 ex -f- dy = Y, j
(4)
то, отделив коэффициенты при неизвестных и записав их в виде квадратной таблицы, получим
/а
\е d/
Такое выражение называется матрицей, в данном случае это матрица преобразования Т. Если она известна, то известно и Т при условии, что мы знаем, какие используются неизвестные х, у, X, Y. Их тоже можно включить в нашу схему, введя вектор-столбцы
(Й и
и записать (4) в следующей компактной форме:
(°d)Q=(v). <5>
где, по определению, «произведение» в левой части есть вектор-столбец
lax -р Ьу\ + dy/’
а два вектор-столбца равны тогда и только тогда, когда совпадают их компоненты.
Это обозначение легко распространить на случай трех или более неизвестных. Система общего вида из трех уравнений с тремя неизвестными примет вид
а b о\ (х\ (Х\
d е f Ь = Г . ,g h k) \z J \Zj
Часто нам приходится последовательно применять несколько преобразований. Пусть, например, имеются
другие переменные X и Y и преобразование U такое, что U(X, У) = (X, Y), где
АХ + BY = X, 1
CXA-DY—Y j
(6)
или в матричных обозначениях
(А В\(Х\ /Х\ D)\Yj = \Y/
Мы уже определили произведение преобразований!
UT(x, y) = U(X, У) = (X, Y),
Теперь UT в свою очередь можно представить матрицей. Из систем (6) и (4) получаем
X=AXa-BY=
’=*A(ax + by') A-B(cxA-dy) =*
•= (AdA-Bc)x + (Ab + Bd)y, Y=CX+DY=
= C(ax+by) +D(cx+dy) =
= (Ca+Dc)x+ (Cb+Dd)y.
Отделив коэффициенты при неизвестных, можно записать
(Ad + Вс Ab + Bd\ (х\ /Х\
tCa + De Cb + Dd) \y) ~ \Y)>
т. e. матрицей преобразования UT служит
Ad -|- Be Ab -J" Bd\ Cd A- De Cb A- Dd)‘
С другой стороны, мы можем, поступив формально, получить из систем (5) и (7) уравнение
(A B\(d b\(x\ _ /Х\ Dj[c d)\y) [Yp
и это nodcKd3bieder нам, что если определить произведение матриц по формуле
1А В\ (d b\ _ (Ad + Вс Ab + Bd\
\С D) V? d) ~ \Cd A- De Cb A- Dd)>
то получится корректная алгебраическая операция. Например, в гл. 2 у нас появились преобразования G и Н, где G(x, у) = (х, -у) и Н(х, у) = (у, —х). Если (X, У) = = Н (х, у), то
Х=»/ = 0-х+1-у,
У = — х= ( — 1) - х + 0-t/,
и матрицей преобразования Н служит
( 0 П
1 о/-
Если G(X, У)-(Х, Y),to
Х = Х=ЬХ+0-У,
У=-У = 0-Х+(-1)-У,
и матрицей преобразования G будет
/1 0\
\0 —1/
По нашей формуле матрицей GH должна служить
Л 0J 0 1\
V) —1Д—1 от-
равная
/1 • 0 + 0 • (—1) 1 • 1 + о . о \
^0 - О + (—1) • (—1) О - 1 +(-!)• 0)’
или после упрощения
/0 1\
\1 о}
Получилось GH(x, у) = (у, х), так что
Х = 0-х +1 -у,
Y = 1 -x+0-y,
а это проверяется.
Фактически, вводя такое определение, мы получаем удобную алгебру, что позволяет нам производить вычи
сления с линейными преобразованиями. Я не хочу говорить об этом подробнее, поскольку уже существует замечательное изложение этих вопросов, принадлежащее Сойеру 2.
Однако мне хочется проделать еще одно вычисление и показать, какую пользу можно извлечь из матриц в тригонометрии. В гл. 2 я привел формулу для поворота на угол 6. В матричной форме она приобретает вид
/cos 0 —sin 0\
\sin0 cos О/"
Тогда произведение поворота на угол 6 и поворота на угол ф имеет матрицу
/costp —sin ф\/cos О —sin 0\
\sin ф СОБфДзшб COS0/
или
/cos ф cos 0 — sin ф sin 0 —cos ф sin 0 —з!пфсо5 0\ \sin ф cos 0 -ф- cos ф sin 0 — sin ф sin 0 -|- cos ф cos 0/'
Но, разумеется, это произведение означает поворот на угол ф -ф 0 и имеет матрицу
/cos (ф -j- 0) — sin (ф -ф 0)\
\sin (ф -ф- 0) cos (ф -ф 0)/"
Сравнение двух полученных матриц дает равенства cos (ф4-0) = cos ф cos 0 —sin ф sin 0, sin (ф4-0) =sin ф cos 04-cos ф81п 0,
т. е. формулы сложения из курса тригонометрии.
Абстрактные формулировки
В настоящее время изучение линейных преобразований составляет часть абстрактной алгебры. Это произошло из-за желания избежать применения координат.
Если заданы две точки (р, q) и (г, s) из R2, то можно определить их сумму формулой
(Р, Р) + (г, s) — (p + q, r+s).
Если а — действительное число, то можно также определить произведение
а (р, q) = (ap, aq).
С помощью этих операций мы можем охарактеризовать линейные преобразования: это такие функции Т (R2->R2), что для всех р, q, г, s и а
q) + (r, s)) = T(p, q)+T(r, s), T(a(p, q)) = аЦр, q).
(Можете проверить это, если хотите.) Первое равенство очень напоминает условие, которому подчиняется изоморфизм в смысле теории групп. Это наводит на мысль, что абстрактный подход с позиций, близких к теоретикогрупповым, может оказаться полезным. Основываясь на свойствах сложения и умножения на действительные числа в R2 и на свойствах аналогичных операций в R3, R4, R5, .... математики дали следующие ниже определения.
Векторное пространство над R — это множество V с двумя операциями, называемыми сложением и умножением на скаляры. Если и и v — элементы из V, а а — действительное число, то результаты этих операций обозначаются через
u + v, а и,
где u + v и а и — элементы множества V.
Кроме того, должны выполняться следующие аксиомы:
(1) V — коммутативная группа относительно сложения с единичным элементом О,
(2) ссО = 0 для всех а Q R,
(3) Оц = 0 для всех v С V,
(4) lo — v для всех о £ V,
(5) (а + Р) v = ао -J- ро для всех а, р £ R, о С V, (6) а (о + w) = ао + aw для всех а С R, о, w С V, (7) аро = а (Ро) для всех а, р £ R, о g V.
Можно привести много примеров векторных пространств. Самые обычные — это R, R2, R3, ... , но есть и другие. Кольцо многочленов R[x] от одной переменной является векторным пространством, векторными пространствами будут и R[x, у], R[x, у, г] ... . Это бесконечномерные пространства. Векторные пространства возникают при решении дифференциальных уравнений, в некоторых разделах теории групп и в современных изложениях математического анализа.
Линейное преобразование теперь определяется как функция Т: V -> IF, где V и W — произвольные векторные пространства, со следующими свойствами:
Т (u+v) ==Т (и) +Т (у), Т(аи) = аТ (w)
для всех и, v £ V, а С R.
В этой абстрактной форме можно доказать все необходимые теоремы о линейных преобразованиях. Поскольку не выбираются конкретные координаты, доказательства изящны и естественны.
Однако при выполнении вычислений в конкретных случаях используют матричные обозначения.
Для глубокого, понимания линейной алгебры необходимо совместить все три подхода:
1) основные геометрические обоснования;
2) абстрактное алгебраическое изложение;
3) технику теории матриц.
Поначалу это затрудняет изучение предмета. Вероятно, поэтому большинство учебников концентрирует внимание на каком-нибудь одном аспекте. Но из-за такой одно
сторонности по мере продвижения встает больше проблем, чем решается: вид студента, сражающегося с громадными матрицами, в то время как несложные геометрические соображения позволяют решить задачу в две строчки, отнюдь не воодушевляет,
Глава 16
ВЕЩЕСТВЕННЫЙ АНАЛИЗ
В математике едва ли есть хоть один бесконечный ряд, сумма которого была бы строго определена.
Н. Г. Абель, в письме 1826 г.
Алгебра, топология и анализ являются тремя краеугольными камнями современной математики. (Математическая логика — это скорее строительный раствор, который их скрепляет.) Я довольно подробно остановился на двух первых; теперь не грех сказать что-нибудь и о третьем.
Печальный факт состоит в том, что об анализе нельзя говорить сколько-нибудь содержательно, не введя предварительно большого количества технических понятий. Наивный подход к анализу наталкивается на непреодо-, лимые препятствия — в истории математики есть немало тому примеров.
Анализ можно описать как исследование бесконечных процессов, таких, как бесконечные ряды, пределы, дифференцирование, интегрирование. Маячащий перед нами призрак бесконечного — вот что вызывает трудности.
Бесконечное сложение
Бесконечными рядами называются выражения типа 1 +4* + ~Г + 4" + — w
Самое существенное здесь — многоточие. Эти точки как будто приглашают нас прибавлять все новые члены, и так до бесконечности. Здравый смысл заставляет нас отнестись к подобному выражению скептически, ибо оно
требует, казалось бы, невозможного: ни человек, ни самая быстродействующая ЭВМ не в состоянии произвести бесконечно много сложений за конечное время. На память приходит парадокс о включении и выключении света: если включить свет через секунду, выключить через полсекунды, снова включить через четверть секунды, выключить через одну восьмую секунды, что будет через две секунды — включен свет или выключен?
Таким образом, у нас нет никакой гарантии, что выражение (1) вообще что-нибудь означает, однако это простое соображение ускользнуло от внимания почти всех, кто занимался этим предметом в 18 в. Тогда казалось, что любая комбинация математических символов имеет математический смысл,— наивное представление, с которым математикам пришлось со временем распрощаться, причем совсем не безболезненно.
Если выражение (1) что-нибудь и означает, то, конечно, наилучшей отгадкой служит число 2, ибо
1 + 2 + 4 + 8 + + 2Л 2”'
Если считать, что эта сумма равна 2, то, остановившись на (п+1)-м члене, мы сделаем ошибку 1/2”. С ростом п знаменатель 2" растет еще сильнее, и 1/2” быстро уменьшается. Взяв п достаточно большим, мы можем сделать 1/2” сколь угодно малым.
В 18 в. рассуждали бы примерно так. В формуле для суммы п + 1 членов положим п = оо. Тогда левая часть есть сумма оо + 1 членов, и так как оо-Н = оо, это есть
не что иное, как ряд (1), С другой стороны, правая часть равна
2----L = 2----5-= 2—0 = 2.
2°° оо
Тем самым доказано, что сумма равна 2.
На самом деле ровным счетом ничего не доказано, по крайней мере по трем причинам. Во-первых, нужно предположить, что (1) принимает какое-то значение. Во-вторых, нужно предположить, что над бесконечными суммами можно производить алгебраические операции так же, как над конечными. В третьих, такое использование символа оо предполагает, что он ведет себя, как число, но законно ли такое предположение?
Бездумная манипуляция бесконечными рядами приводит ко всякого рода парадоксам; некоторые из них просто прелестны, но математически они все губительны. Пусть, например,
5=1-1 + 1 — 14-1 — 1+’..;
Тогда
S= (1-1) + (1-1) + (1-1) +.., =о+о+о+. .. = 0.
Запишем иначе:
s = i- (i-i) - (1—1) - (1-1>-„.
— 1 — (0 + 0 + 0 + ...)
= 1-0=1,
Или
1 — S = 1 — (1 — 1 +1 — 1 + 1 — 1 + ...) = 1 —1+1—1 + 1—1+.., = S,
откуда S= 1/2.
Один подающий надежды умник заявил, что полу-
ценное при помощи S равенство 0 и 1 символизирует сотворение из ничего, и это не только служит обоснованием всяческих манипуляций бесконечными процессами, но дает математическое доказательство существования бога!
На заре анализа у математиков было гнетущее ощущение, что все эти три значения S в каком-то смысле «правильны». Математика не сразу научилась отметать подобный вздор. Постепенно было осознано, что сами по себе бесконечные процессы ничего не означают, пока им не придан какой-то определенный смысл. Как только это сделано, на выражения, которые встречаются в этих процессах, можно налагать определенные ограничения. Кроме того, нельзя считать, что для них выполняются обычные законы действий, хотя, к счастью, кое-что и удается спасти.
Что такое предел!
Рассмотрим подробнее этот причиняющий столько хлопот ряд S. Подсчитаем суммы одного, двух, трех, четырех, пяти его членов:
1 =1,
1-1 =0,
1-1 + 1 =1, 1-1 +1-1 =0,
1 —1 + 1 —1 + 1 = 1.
Мы видам, что они поочередно принимают значения 0 и 1. С ростом п эти суммы не «успокаиваются» на каком-то «предельном» значении, а продолжают весело перепрыгивать от 0 к 1 и обратно.
Если счесть эту сумму равной 1, то при четном количестве членов получится ошибка, равная 1; если счесть ее равной 0, ошибка, равная 1, получится при нечетном
количестве членов. Тогда уж лучше считать ее равной 1/2 — по крайней мере ошибка будет минимальной!
Запишем бесконечную сумму в общем виде!
а1 + й2 + йз +
где а,— действительные числа. «Приближенные» суммы равны
bi = «i, Й2 = О1 Ьз = О[ Ч-йг + йз, ^4 = 1 Т ^2 Т «3 “Ь ^-4,
Если значения Ьп стремятся к некоторому «пределу», когда п становится очень большим, то этот предел мож-. но было бы, по определению, считать значением бесконечной суммы. Что же понимается под «пределом»?
Первая мысль — посмотреть, какую ошибку мы совершаем, останавливаясь на сумме п членов: если предел существует, эта ошибка должна становиться очень ма< лой. Но ошибка равна
Un+I +йП4-2 + йп+з +... ,
т. е. опять бесконечному ряду. Пока что это нам не помогает.
Итак, нужно сосредоточить внимание на последовательности частичных сумм
bi, b2, Ь3, Ь4, ...
и подумать, нельзя ли придать смысл «пределу» этой последовательности.
Выражение (1), пожалуй, может помочь, поскольку мы вправе ожидать, что этот ряд имеет сумму и она равна 2. Для него
Ьп = 2 • •
Разность bn — 2 можно сделать сколь угодно малой, выбрав п достаточно большим. Например, чтобы выполнялись неравенства
_____1 I) ________2 < -I_____1
1 000 ООО *=* " ~ 1 000 000 ’
достаточно взять н^>21, и тогда
1 'Г' 1
2«_i j ооооОО •
А чтобы выполнялись неравенства
_________!_____<; __2 < -I________-_____
1 000 000 000 000 п ^5 г ! ооо 000 000 000’ достаточно взять и^41, и т. д.
Подобные примеры подсказывают общее определение. Последовательность Ьп называется стремящейся к пределу I, если разность
Ьп I
можно сделать сколь угодно малой, выбрав п достаточно большим
Последовательность, которая ртремится к какому-то пределу, называется сходящейся. (Предел I должен быть действительным числом; пока мы не говорим о оо.)
Определив понятие предела последовательности Ьп, мы можем придать значение бесконечному ряду
+ П2 + П3 + П4 + ...
Им будет предел I последовательности частичных сумм Ьп при условии, что этот предел существует. Если это так, ряд называется сходящимся. Как показывает пример ряда S, предел частичных сумм существует не всегда.
Теперь мы можем говорить о сумме бесконечного ряда, но только после того, как докажем, что этот ряд сходится. (Существуют, правда, другие, менее естествен
ные определения, позволяющие приписывать суммы и таким рядам, которые в нашем смысле не сходятся. Например, в некоторых из таких теорий ряд S оказывается вполне благополучным и имеет сумму 1/2. Однако здесь мы не будем обсуждать эти теории.)
Раз можно говорить о суммах, посмотрим, как обстоит дело с законами алгебры. Можем ли мы поставить скобки, где захотим, или поменять местами какие-то из слагаемых?
Даже для сходящихся рядов это возможно не всегда. Например, можно доказать, что ряд
д=1_____L + J___L + J____± +
Х 2 Г 3 4 г 5 6
сходится к числу In 2, которое равно примерно 0,69. А теперь найдите ошибку в следующей выкладке 2: 9А'_О 2 । 2 2 । 2 2i2 2i2 2 ।
2 2 г 3 4 г 5 6'7 8'9 10 + •"
__ ___1-Д-—_L । 2___1__i_ __L л 2___!_i_
Z 1 г 3 2'5 3 + 7 4'9 5 *"
e 1__L_lJ__L + _L
2'3 4 5
= к,
откуда следует, что 1,38=0,69.
Аксиома полноты
Наше определение сходимости обладает одним недостатком — прежде чем доказать сходимость ряда, мы должны угадать предел I, к которому он сходится. Так, сравнительно легко доказать сходимость ряда (1) после того, как мы угадали, что его пределом должно быть число 2. А кроме угадывания предела, никакого другого способа убедиться в сходимости ряда у нас нет,
Вернемся снова к «ошибке»
йп+1 + йп+г + йп+з+... ,
которую мы выше сочли бесполезной. В случае сходящегося ряда такие ошибки «малы». Можно ли сделать это соображение точным и положить его в основу критерия сходимости?
Попробуем приближенно найти ошибку. (Казалось бы, такая попытка обречена на неудачу, ибо тогда при* дется учитывать ошибку уже в этом приближении, но все-таки посмотрим, что из этого выйдет.) Получим
Йп+Ь
йп+1 +Пп+2,
• йП4-1 + Пп+2 + йп+3»
йп+1 + .-. + йп+т-
• а w9 я « S
йп+1 +... +йп+т.
Допустим, что все эти суммы малы, т, е. существует малое положительное число k такое, что
— йп+1 + ... + йп+т^Й
при любом т. Тогда имеет смысл говорить о «малой» ошибке, не превосходящей k.
Иными словами, всякий сходящийся ряд обладает таким свойством. Пусть задано некоторое fe>0. Найдется такое целое п (зависящее от /г), что при любом т «приближенная ошибка»
йп+1 + ... + йп+т
меньше k.
Если это свойство выполняется для некоторого ряда, то ошибки становятся произвольно малыми, и естественно ожидать, что этот ряд сходится.
Приятная сторона этих рассуждений состоит в том, что в них не участвуют бесконечные суммы и что не надо угадывать предел. Речь идет только о конечных суммах
членов ряда. Правда, взамен приходится прибегать к утверждению с довольно сложной логикой, но это не страшно.
Вот здесь-то и вступают в игру действительные числа. Если бы мы думали, что все числа рациональны, мы могли бы определить предел последовательности рациональных чисел как такое рациональное число /, к которому сколь угодно близко подходят члены последовательности. Могли бы мы провести и анализ ошибки.
Но рассмотрим десятичное представление числа 2 : /Т = 1,414213
которое можно считать суммой бесконечного ряда
1 1__4 1__!__1 4 I 2 I__________1 _|____3_____,
г 10 г100“г 1000 “ 10 000 *" 100000 "г 1 000 ООО ‘г •"
Оценим теперь ошибку, которая получается, если остановиться на сумме п членов. Она не превосходит числа
0,00 ... 099 ... 9,
п тп
которое меньше 1/10", как бы велико ни было т. Но 1/10" при достаточно большом п становится сколь угодно малым. Поэтому естественно ожидать, что этот ряд сходится.
С другой стороны, если он сходится, в пределе должно получиться У" 2, что не является рациональным числом.
Итак, все члены нашего ряда рациональны, и мы в своем невежестве полагаем, что и сумма его рациональна, но это, увы, не так. Интуитивное ощущение подсказывает нам, что это происходит из-за отсутствия среди рациональных некоторых чисел, вроде V 2 . Чтобы восполнить эти пробелы, и вводятся действительные числа.
Ради логической строгости к аксиомам рациональных чисел добавляется еще одна, называемая аксиомой полноты. Она гарантирует существование действительного числа, которое является пределом заданной последовательности, если для этой последовательности «ошибка» становится произвольно малой. '
Непрерывность
В главе, посвященной топологии, мы уже коснулись понятия непрерывности функции. В анализе это понятие приобретает первостепенную важность.
Посмотрим на график какой-нибудь функции, вроде f (х) = 1 — 2х—х2
(рис. 164). Мы увидим, что этот график — плавная кривая, не имеющая «скачков». X >
С другой стороны, если по- / \
строить, скажем, график поч- / \
товых сборов за отправление ----- / ------1 V- •-
заказных писем в зависимости / \
от веса, такой график содер- / . \
жит определенное число скач- / \
ков (рис. 165). / . \
Первая из этих функций не- 1 прерывна, вторая разрывна. На заре анализа ученые думали, что любая функция, опре- рис. 164. деленная красивой формулой, обязательно непрерывна. Праведная, но тщетная надежда! Посмотрите на изображенный на рис. 166 график функции
g (х) = х 4- V (х — 1) (х — 2) .
Итак, следует соблюдать осторожность в подобных
высказываниях. Эйлер пытался определить непрерывную функцию как «кривую, которая рисуется свободным движением руки», но такое определение не слишком подходит. Коши сначала определял ее как «функцию, для которой бесконечно малое изменение аргумента приводит к бесконечно малому изменению значения»,
Рис. 165.
Это прекрасно, если вы знаете, что такое «бесконечно малое», однако тогда этого никто не знал. Наивные попытки оперировать этим понятием попали в водоворот парадоксов, точно так же, как это случилось с понятием бесконечного.
Определение, которым пользуются сейчас, опирается на идею «отсутствия скачков».
Со скачками дело обстоит так же, как с ребенком служанки: маленький он или большой — одинаково плохо! Иными словами, разглядывая скачки, мы разрешаем себе, образно говоря, пользоваться микроскопом. Под микроскопом всякий скачок выглядит примерно так, как показано на рис. 167.
Этот скачок имеет определенную ширину w. Поэтому, если мы возьмем точку р0 немного левее х и точку pi немного правее, значения f (ро) и f (pi) будут различаться примерно на w. Если же взять точки р0 и pi далеко друг от друга, то о f (р0) и f (pi) едва ли удастся что-нибудь сказать.
Стандартное определение непрерывной функции на множестве действительных чисел формулируется так, чтобы исключить скачки. Функция f называется непрерывной в точке х, если путем выбора р0 и pi достаточно близкими к х можно добиться того, чтобы f (ро) и f (pi) были сколь угодно близки друг другу 3. Функция f называется непрерывной, если она непрерывна во всех точках х.
Преимущество этого определения перед определением Эйлера состоит в том, что оно позволяет доказать непрерывность той или иной функции. Рассмотрим, например, функцию
f (х) =х2
и докажем ее непрерывность в точке 0. Заметим, что если выбрать р0 между —k и 0, a pi — между 0 и k (k — некоторое положительное число), то
--2k2 :С Ро-Р1 :С 2А2.
Таким образом, размер разности не превосходит 2k2, и, выбирая k достаточно малым, мы можем сделать ее меньше любого наперед заданного числа, Например,
чтобы выполнялось неравенство 1/1 000 000, достаточно взять 1/10 000, и т. д. Проделав то же самое для каждой точки х, а не только для точки 0 (вычисления немного более громоздкие, но проводятся так же легко), можно убедиться в непрерывности функции f.
Функции могут быть в одних точках непрерывны, а в других разрывны. Например, функция почтового сбора разрывна при х = 2, 4, 6, 8, 10, 12, 14, 16, 24, 32 унциям и непрерывна во всех других точках в пределах от 0 до 32 унций.
Однако есть функции, которые ведут себя очень странно, и отсюда видно, что, хотя наше определение и хорошее, оно не совсем такое простенькое, как может показаться. Так, например, функция
, , f 0, если х иррационально, и W — ( j/g, если х _ р/д рационально, согласно этому определению, непрерывна во всех иррациональных точках и разрывна в рациональных. А функции, непрерывной во всех рациональных точках и разрывной во всех иррациональных, не существует!
Конечно, это весьма необычайная функция.
Оказывается, несмотря на такие странности, данное определение непрерывности вполне пригодно для того, чтобы построить весь аппарат анализа. Однако не исключено, что существует лучший способ действий. Не так давно при помощи одной довольно сложной конструкции из математической логики удалось формализовать понятие «бесконечно малого» и тем самым сделать строгим определение Коши. Тем не менее я не советовал бы учить школьников так называемому «нестандартному анализу» с его слишком уж тонкой логикой.
На самом деле вполне удовлетворительный способ строгого изложения анализа, особенно на школьном уровне, еще не найден.
Доказательство теорем в анализе
Известна следующая занимательная задача. Ровно в 0 часов утра в понедельник один человек начинает взбираться на гору и в 6 часов вечера достигает горной хи-?кины, где остается ночевать. На следующее утро в 9 часов он начинает спускаться по той же тропе и в 6 ча
сов вечера прибывает на то место, откуда начал восхождение. Требуется доказать, что в какой-то момент времени первого дня и в тот же момент второго дня он находился в одном и том же месте.
Немного подумав, можно прийти к такому решению. Допустим, что на второй день в гору поднимается призрак, который делает все то, что человек в первый день. Так как призрак двигается вверх, а человек — вниз, они неизбежно где-то встретятся — это и будет искомый момент времени.
За этим рассуждением скрыта теорема анализа, ибо предполагается, что продвижение человека непрерывно. Если бы при помощи какого-нибудь чуда техники он мог перепрыгивать с одной части горы на другую, минуя промежуточные участки, ему удалось бы избежать встречи с призраком.
Нарисуем график продвижения человека в первый и
второй день (рис. 168). На нем легко проследить идею доказательства: эти две кривые обязательно пересекаются.
Для разрывных кривых это не обязательно (рие. 169), Однако картинки обманчивы, и в анализе нельзя на них опираться. Наши выводы должны логически следо
Рис. ПО.
вать из определений (о картинке, конечно, тоже не надо забывать!). Теорема, которую нам хочется установить, должна звучать примерно так: допустим, что заданы две непрерывные функции f и g, определенные на действительной прямой и такие, что в двух точках а и b выполнены неравенства
f(a)<g(a), f(b)>g(b)-
тогда в некоторой точке с между а и b имеет место равенство (рис. 170)
f(c)=g(c).
Эту теорему можно было бы доказать так. Разделим интервал между а и b на 10 частей. На некоторых из них f меньше g (рис. 171.) Возьмем первый из малых интервалов, где f становится больше g, и разобьем его на 10 частей. Выберем среди них первый интервал, где
f становится больше g, разделим его на 10 частей, ... и т. д. Концы выбранных интервалов образуют последовательность pi, р2, рз, и в силу аксиомы полноты эта последовательность сходится к некоторому действительному числу р между а и Ь. Воспользовавшись определением непрерывности и еще немного поработав, убедимся, что f(p)=g(p).
Допустим, что 61=0, Ь = 1 (см. рис, 171), Тогда
pi = 0,5, р2=0,58, рз = 0,583,
* • я f
и наша процедура приводит, вообще говоря, к бесконечной десятичной дроби
р = 0,583...
Аксиома полноты как раз и узаконивает бесконечные десятичные дроби. И, разумеется, деление на 10 частей делалось только для того, чтобы удобно было пользоваться десятичной записью. С таким же успехом можно было делить на 2 части, или на 19, или 1066.
Аксиома полноты используется здесь по существу; над полем рациональных чисел теорема неверна. Рассмотрим, например, функцию
f (х) = 1 — 2х —х2.
Она непрерывна на множестве рациональных чисел, f(0) = l, f(l) = —2. Если бы теорема была верна для рациональных чисел, то между 0 и 1 нашлось бы рациональное число р такое, что
1- 2р-р2 = 0.
Но р = V 2— 1, а это число не рационально. Таким образом, без полноты нам не обойтись.
Можно было бы, конечно, счесть излишним строгое доказательство: если теорема геометрически очевидна,
зачем ее доказывать? Именно такая позиция была принята в 18 в. Результатом явились неразбериха и путаница в 19 в., ибо не подкрепленная логикой интуиция обычно создает впечатление, что все обстоит гораздо более «гладко», чем на самом деле.
В математике никогда не следует отвергать хорошие идеи только потому, что для них еще нет строгого обоснования. Однако, пока обоснование не найдено, нельзя позволять им «заходить слишком далеко» — обычно это плохо кончается.
Статистика — это ветвь теологии
Ученый муж из Кембриджа
Источниками теории вероятностей послужили задачи, связанные с азартными играми. При каких условиях я имею большую вероятность выиграть в карты, в кости? Каковы шансы?
Поскольку игры, как правило, конечны, для решения подобных вопросов требуются комбинаторные методы, т. е. методы, основанные на подсчете количества вариантов, Если, например, мы хотим найти вероятность того, что при выбрасывании монеты три раза подряд выпадает «орел», мы перечисляем все возможности:
ООО, OOP, ОРО, ОРР, POO, POP, РРО, РРР.
Их восемь, и только одна из них нас устраивает; значит, вероятность равна 1/8.
При таком рассуждении, конечно, предполагается, что выпадения «орла» или «решки» равновероятны. Понятие «равновероятны» нельзя определить словами «с вероятностью 1/2» пока не определено, что означают эти слова, а последнее нельзя сделать, не определив понятия «равновероятны». Так по крайней мере выглядит эта ситуация на первый взгляд.
Пытаясь обойти эту трудность экспериментальным путем, мы сталкиваемся с другой трудностью. Если выпадения «орла» и «решки» равновероятны, то естественно ожидать, что в длинной серии бросаний выпадет примерно одинаковое число «орлов» и «решек». Конечно, не точно одинаковое: если число бросаний нечетно, то равенство вообще невозможно, но и при четном числе
бросаний будут небольшие расхождения. Подбросьте монету 20 раз и посмотрите, выпадет ли «орел» ровно 10 раз. (А если это случится, повторите этот эксперимент еще несколько раз и посмотрите, как часто это происходит.)
Можно надеяться лишь, что в пределе отношение числа «орлов» к числу «решек» стремится к 1. Однако горе в том, что этот «предел» не является пределом в смысле анализа. Даже если монета правильная, мыслим и такой случай, когда вся последовательность состоит из одних «орлов». Конечно, это маловероятно. Но чтобы ввести понятие «предела», не исключающее и такую возможность, требуется установить точно, что понимается под «маловероятным», а для этого, как видно, опять-таки нужно дать определение «вероятности».
С этими трудностями удалось справиться только в 30-е годы нашего века, когда была разработана аксиоматическая теория вероятностей. Отдельно от приложений математику можно развивать без малейших логических изъянов, и уже потом опытным путем проверять, насколько она отвечает фактам. Аксиоматическая теория вероятностей достигла успехов по тем же причинам, что и аксиоматическая геометрия.
Комбинаторная вероятность
Допустим на время, что нам известно, что понимается под словом «равновероятны». Тогда «грубое рабочее» определение вероятности р(Е) некоторого события Е таково:
/р, _ Число исходов, когда реализуется событие Д
' ' ' Общее число возможных исходов
(при условии, что все исходы равновероятны).
Так, например, при выбрасывании двух игральных костей общее число возможных исходов равно 36, при
чем в 5 из них в сумме получается число 6 (1 + 5, 2 + 4, 3 + 3, 4+2, 5+.1). Значит, вероятность этого события (т. е. что выпадет сумма 6) равна 5/36.
Поскольку рассматриваемые числа неотрицательны, а число исходов, при которых реализуется событие Е, не превосходит общего числа исходов, р(Е) всегда удовлетворяет неравенствам
0Cp(£)<Sl.
Равенство /?(£)= О означает, что событие Е невозможно, а равенство р(Е) = 1—что оно происходит всегда.
Методы комбинаторной вероятности относятся в основном к разным комбинациям событий. Допустим, например, что есть два различных события Е и F. Какова вероятность того, что происходит Е или £?
Рассмотрим выбрасывание игральной кости. Пусть событие Е состоит в том, что «выпало число 6», a F — что «выпало 5». Тогда фраза «произошло Е или £» означает, что «выпало 6 или 5». Этому отвечают два случая из шести, следовательно,
р(Е или F) = 1/3.
Вообще пусть N(E) (соответственно N(F)) — число исходов, в которых реализуется событие Е (соответственно F), а Т — общее число исходов. Тогда
р(Е или F)=N (Е или F)IT,
Чему равно N (Е или £)? Допустим, что события Е и F «не перекрывают» одно другое (позднее мы к этому вернемся). Тогда
N (Е или £)=/V (£)+#(£),
так что
р{Е или F) = (N(E)+N (F))/T= =N(E)/T+N(F)/T= ~p(E)+p(F). (1)
Если же Е и F «перекрываются», то все, что входит в их общую часть, считается в N(E)+N(F) дважды, а в N(E или F) — только один раз.
Допустим, например, что
Е = «выпало простое число»,
F—«выпало нечетное число».
Тогда Е осуществляется тремя способами: 2, 3, 5 (заметьте, что 1, по определению, не является простым числом), a F — тоже тремя способами: 1, 3, 5. Однако Е или F реализуется четырьмя способами: 1, 2, 3, 5. Поэтому
р(Е)=1/2, р(Г) = 1/2, р(Е или Е)=2/3,
В общем случае имеет место формула
N (Е или F)=A'(E)+/V(F)-7V(E и F), (2)
ибо, вычитая N (Е и F), мы как раз избавляемся от удвоения. В нашем примере Е и F осуществляются двумя способами: 3, 5, и формула дает
4 = 3 + 3—2,
т. е. правильное равенство.
Разделив (2) на Т, получаем соотношение для вероятностей:
р(Е или F) = р(Е) +p(F) — р(Е и F). (3)
Вмешательство теории множеств
Все перечисленные выше понятия гораздо лучше выражаются на языке теории множеств. Всевозможные исходы бросания кости образуют множество
Х={1, 2, 3, 4, 5, 6}.
События Е и F отвечают подмножествам (рис. 172): Е={2, 3, 5}, Е={1,3, 5}.
Событие «Е или F» отвечает множеству {1, 2, 3, 5} — объединению EIJF. Событие «£ и £» отвечает множеству {3, 5} — пересечению Ef\F. Вероятность р—это функция, определенная на множестве Е всех подмножеств множества X, со значениями в R, а точнее, в отрезке [О, 1], т. е. множестве всех действительных чисел между 0 и 1.
Рис. 172.
Исходя из этих соображений, можно ввести более абстрактное понятие конечного вероятностного пространства. Оно состоит из:
а) конечного множества X;
б) множества Е всех подмножеств множества X;
в) функции р:£->[0, 1], обладающей тем свойством, что дл я всех Е, F £Е
р(Е[)Е) = р(Е) + p(F) — p(E(]F).
Аксиоматическая теория вероятностей и занимается вероятностными пространствами. Однако для того, чтобы рассматривать бесконечное вероятностное пространство, нужны более тонкие определения. Во многих практических приложениях требуются бесконечные множества X;
например рост человека может измеряться любым действительным числом (в определенных пределах), и в этом случае имеется бесконечно много возможностей.
Независимость
Другая важная операция в теории вероятностей — определение исхода двух последовательных испытаний: какова вероятность того, что результатом первого испытания будет событие Е, а второго — событие F? Например, дважды выбрасывается кость и спрашивается: какова вероятность того, что сначала выпадет 5, а затем 2?
Из 36 возможных комбинаций нас устраивает только одна: 5, затем 2. Значит, вероятность равна 1/36.
Если Е и F — события, рассмотренные в предыдущем разделе, то каждому из трех способов реализации Е соответствует один из трех способов реализации F, так что всего благоприятных исходов 3-3 = 9. Следовательно, вероятность того, что сначала происходит событие Е, а затем F, равна 9/36=1/4.
В общем случае допустим, что первый опыт имеет Ту возможных исходов и в N (Е) из них происходит событие Е, а второй имеет Т2 исходов и в N (F) из них происходит событие F. Тогда два этих опыта в совокупности имеют ТуТ2 исходов, так как за каждым из Ту исходов первого может следовать каждый из Т2 исходов второго. По той же причине число исходов, при которых сначала происходит Е, а затем F, равно N(E)-N(F). Поэтому р (Е, следом за ним F) = •—• ДД- =
= р(Е)р(Е). (4)
При этом подсчете мы должны предполагать, что Е и F независимы, т. е. что исход первого опыта не влияет на вероятности исходов второго.
Если бы второе событие F состояло в том, что в сумме выпало число 4, это условие не соблюдалось бы. В самом деле, если бы при первом бросании выпало 4 или больше, вероятность успеха при втором была бы равна 0, а если бы при первом выпало 1, 2 или 3, вероятность успеха при втором бросании равнялась бы 1/6.
В теории вероятностных пространств понятию независимости можно дать строгое определение. В приложениях независимость изучаемых событий реального мира вводят в качестве предположения, затем применяют теорию, а потом проверяют полученные результаты экспериментально.
Парадоксальные кости
Когда дело касается вероятностей, интуиция часто нас обманывает. Допустим, например, что 4 игрока А, Б, В, Г бросают каждый свою кость, причем кости помечены следующим образом:
А- 0 0 4 4 4 4
Б: 3 3 3 3 3 3
В: 2 2 2 2 7 7
Г: 1 1 1 5 5 5
(порядок граней не имеет значения).
Какова вероятность того, что при одном бросании игрок А выбросит число большее, чем игрок Б? Игрок Б всегда выбрасывает число 3. У Л четыре раза из шести выпадает 4, и в этих случаях он побеждает Б. Если же выпадает 0, что происходит два раза из шести, он проигрывает. Следовательно,
А выигрывает у В с вероятностью 2/3.
Если Б соревнуется в В, он выиграет, когда В выбросит 2, и проиграет, когда В выбросит 7. Следовательно,
Б выигрывает у В с вероятностью 2/3.
Если В играет с Г, дело несколько осложняется. С ве* роятностью 1/2 у Г выпадает 1, и в этом случае В всегда выигрывает; если же Г выбрасывает 5 тоже с вероят* ностью 1/2, то В победит в случае, когда он выбросит 7, т. е. с вероятностью 1/3. Таким образом, вероятность того, что выиграет В, равна
i
2
1 1 _ 2
2 3 “ 3 '
Следовательно,
В выигрывает у Г с вероятностью 2/3.
Наконец, допустим, что Г выступает против А. Если он выбросил 5 с вероятностью 1/2, он наверняка выиграл. Если же он выбросил 1 тоже с вероятностью 1/2, он выиграет, когда у А выпадет 0, что происходит с вероятностью 1/3. Вероятность выигрыша Г равна
+ 1 2
2 ‘ 2
3 3 •
Итак,
Г выигрывает у А с вероятностью 2/3.
Будем считать ту кость, которая чаще выигрывает, чем проигрывает, «лучше» той, которая чаще проигрывает. В этом смысле
А лучше Б, Б лучше В, В лучше Г, Г лучше А.
Все наши вычисления правильны. Попробуйте сыграть в эту игру! Предоставьте противнику выбирать кость, которую он захочет, и тогда вы всегда сможете выбрать ту из остальных, которая даст вам шанс выиграть 2:1.
Казалось бы, последовательность «Л лучше Б лучше В лучше Г» должна означать, что А лучше Г, но это не так. Значение слова «лучше» зависит здесь от выбора костей; на самом деле играются 4 разные игры. Ситуация такая же, как если бы, скажем, Альфред выиграл у Бертрана в теннис, Бертран — у Вильяма в шахматы, Вильям — у Грегори в бадминтон, а Грегори обыграл Альфреда в орлянку.
На это явление стоило бы обратить внимание тем экономистам, которые считают, что товары можно упорядочить по принципу их предпочтения большинством.
Биномигшьцсг смещение
Представим себе неправильную монету, которая вместо того чтобы с одинаковой частотой падать то «орлом», то «решкой», отдает предпочтение одной из своих сторон.
Такая монета служит моделью многих вероятностных процессов. Если, к примеру, бросая кость, мы заинтересованы лишь в выпадении 6, то в сущности мы имеем дело с неправильной монетой, для которой р(«орел») = 1/6, р («решка») =5/6. Если нас интересует пол новорожденных младенцев, то р (мальчик) =0,52, р(девочка) = = 0,48.
В общем случае положим
р = р(«орел»)
<7=р («решка»).
Разумеется, р + <7=1, так как, согласно приведенной выше формуле (1),
р(«орел») +р(«решка») =р(«орел» или «решка») = 1.
Применяя теорию независимых событий, легко вычислить вероятности конечных последовательностей выпадения «орла» и «решки»:
О poo р2 ООО р3 Р q OP pq OOP p2q PO pq OPO p2q PP q2 OPP pq2
POO p2q POP pq2 PPO pq2 PPP q3
Какова вероятность того, что выпадет заданное число (О, 1,2 или 3) «орлов»? Сгруппируем вместе последовательности с одинаковым количеством «орлов». Тогда для выпадения двух «орлов» при трех бросаниях получаем три последовательности OOP, ОРО, РОО, каждая с вероятностью p2q. Следовательно, вероятность выпадения двух «орлов» при трех бросаниях равна 3p2q. Аналогичные вычисления приводят к такой таблице:
(q+p)x = q+p, (q+pr=q2+2pq+p2, (q+p)3=q3+3pq2 + 3p2q + p.
Члены правых частей как раз и стоят в нашей таблице. Следующая строка, должно быть, выглядит так:
(<7+Р)4=<74+4р<?3+6p2q2+4p3q+р^,
и убедиться в этом было бы хорошим упражнением.
Вообще, n-ю строку таблицы составят члены разложения бинома
('7+Р)п-
Это, конечно, не простое совпадение, и его легко объяснить. Чтобы разложить, скажем (q+p)5t нужно выполнить умножение
lQ+P) (<7+р) (q+p) (q+p) (q+p).
Члены, содержащие ровно 3 сомножителя q, получаются из следующих произведений:
q q q р р q q р q р q q р р q q р q q р q p q p q q p p q q p q q q p p q p q q p p q q q
Эти произведения как раз соответствуют 10 возможным последовательностям трех «решек» и двух «орлов»:
Р Р Р О О Р Р О Р О Р Р О О Р Р О Р Р о Р О Р О Р Р О О Р Р О Р Р Р о О Р Р О Р О Р О Р Р О О Р Р Р
Та же картина наблюдается и в общем случае. Обозначим число последовательностей из п букв О и Р, со дер-
жащих г букв О и (п— г) букв Р, через ^.J. Тогда роятнссть г «орлов» при п бросаниях равна
ве-
Нетрудно выяснить, чему равно —число способов выбрать г предметов из их общего числа п, т. е. число сочетаний из п по г. Можно показать, что
_п(п—1)(п — 2) ... (п — г + 1)
~ 7(г— 1)(г —2) ... 1 '
Отсюда для последовательностей двух «орлов» и трех «решек» получаем

5 • 4
2 • 1
= 10,
и это число совпадает с полученным нами раньше. Разложение бинома в общем случае выглядит так:
(<7 + Р)п = дп + npqn-' + ... + [Р] prqn~' ... + рп.
В этом состоит биномиальная теорема, приписываемая обычно Ньютону. Совпадение это или нет, но одно время Ньютон занимал пост начальника монетного двора!
По этой формуле можно найти среднее число «орлов», выпадающее при п бросаниях, которое оказывается равным пр. Таким образом, частота, с которой выпадает «орел», равна пр/п, т. е. р. Итак, описав полный круг, мы вернулись к представлению о вероятности как о «средней частоте появления». Соответствующая теорема, выраженная в строгой форме, называется законом боль
ших чисел-, она наглядно показывает, как математические модели устанавливают связи с наблюдениями из окружающей действительности.
Случайные блуждания
В заключение этой главы я хочу рассмотреть еще один тип теоретико-вероятностных задач. Такие задачи возникают при изучении движения электрона в кристалле или частицы в жидкости.
Представим себе частицу, начинающую двигаться из точки х = 0 на оси х в момент времени 1=0. В момент t=l она оказывается в точке х= — 1 с вероятностью 1/2 либо в точке х= + 1 с вероятностью 1/2. Если в момент t она находилась в положении х, то в момент 1+1 она с вероятностью 1/2 переходит либо в положение х— 1, либо в положение х+1. Что можно сказать о последующем движении такой частицы?
Например, она может двигаться вправо и влево в со ответствии с последовательностью
лппппллплплллпллллллпплпп
и тогда ее путь, для ясности слегка вытянутый в направлении t, будет выглядеть, как показано на рис. 173. Это довольно типичный путь. Если хотите, можете сами построить другие пути, воспользовавшись для выбора направления подбрасыванием монеты.
Вместо движения по прямой можно рассмотреть движение по плоскости: на единицу длины вверх, вниз, вправо либо влево с вероятностью 1/4 или изучить трехмерное блуждание в шести возможных направлениях, в каждом с вероятностью 1/6.
Особенно интересен такой вопрос: пусть задана любая другая точка X; какова вероятность того, что части
ца в конце концов (не важно, сколько времени для этого потребуется) достигнет точки X?
Казалось бы, эта вероятность должна уменьшаться по мере удаления X от начала координат. Ничего подобного! Она одинакова для всех X. Если случайное блуждание происходит достаточно долго, всякая точка для него так же хороша, как и любая другая.
Рис. 173.
Для одномерных и двумерных случайных блужданий эта вероятность равна 1, т. е. частица почти наверняка достигает любой заданной точки X. (Я говорю «почти», поскольку может оказаться, что это и не так: частица может «кинуться» вправо и навеки исчезнуть. Однако вероятность такого события равна 0. Для бесконечных процессов утверждение, что «с вероятностью 1» означает «наверняка», а «с вероятностью 0» — «никогда»,—уже не совсем верно 2.)
Однако в трехмерном пространстве эта вероятность
равна уже только 0,24, Если вы заблудитесь в одномерном или двумерном пространстве и начнете случайно блуждать, то с вероятностью 1 вы найдете в конце концов дорогу домой. В трехмерном пространстве ваши шансы вернуться домой меньше, чем 1 : 4.
Однако во всех случаях вам потребуется для этого бесконечное время. Точнее, выберем любой отрезок времени t0 — возможно, 5 секунд, а может быть, 3000 лет. Тогда, продолжая блуждать, в большинстве случаев вы будете находиться вдали от дома в течение большего промежутка времени, чем tQ.
Один специалист по гидродинамике, читая научную статью в переводе с английского, был весьма озадачен упоминанием о какой-то «водяной овце». Оказалось, что перевод был выполнен при помощи компьютера, а речь шла о «гидравлическом таране» (hydraulic ram, ram — баран)
Из поучительных историй
Строго говоря, вычисления при помощи компьютеров не относятся к математике, а составляют отдельную научную дисциплину. Вычислительная машина — это не понятие современной математики, а продукт современной техники. Тем не менее во многие школьные программы по математике сейчас входят элементы программирования и методы вычислений, и это совершенно правильно, ибо компьютеры — мощное средство применения математики в современном мире, имеющее громадное практическое значение.
В теоретической математике компьютеры не играют почти никакой роли. Чтобы иметь возможность передать задачу машине, необходимо в принципе уметь точно описать каждый шаг ее решения. С теоретической точки зрения это означает, что задача уже решена, особенно если главной заботой было — найти метод. Однако для получения конкретных результатов (которые в практических применениях являются, конечно, главной целью) создания метода, пригодного в принципе, недостаточно: нужно, чтобы он работал на практике. Ценность компьютеров в том и состоит, что они способны «возвести мост»
над пропастью между принципиальным и практическим решением задачи.
Но компьютеры представляют интерес для математика еще и потому, что их действие основано на определенных математических идеях.
В этой главе я хочу дать небольшое представление как о математических, так и о практических соображениях, которые лежат в основе конструирования и применения компьютеров. Технические подробности читатель найдет в специальных книгах
Двоичная запись
Компьютер — это прежде всего устройство для вычислений. Иначе говоря, в него вводятся данные — обычно в числовой форме, указывается, как с ними обращаться, и он, поработав, выдает результаты. В настоящее время применяются в основном электронные цифровые компьютеры, где для запоминания и операций над числами в цифровой форме используются электронные схемы. Однако имеются и другие возможности: бывают оптические компьютеры (в них используются пучки света), струйные компьютеры (в которых используются струи жидкости или газа). А немного ниже я собираюсь проиллюстрировать некоторые идеи устройства компьютеров на простом механическом устройстве с шариком.
Никакой компьютер не может оперировать непосредственно числами, поскольку числа как таковые не существуют в реальном мире. Чтобы ввести числа в машину, их нужно представить в какой-то конкретной физической форме. В аналоговых компьютерах число х представляется, например, величиной силы тока — ему соответствует х единиц силы тока. Однако такие машины действуют недостаточно быстро, не обладают необходимой гибкостью и зависят от точности физических измерений, которую трудно поддерживать на должном уровне. Поэто
му аналоговые компьютеры годятся лишь для ограниченного круга задач. Необходимо было придумать нечто более совершенное.
Простейшее устройство, способное представлять числа, — это устройство, которое имеет два устойчивых состояния. Например, выключатель может быть либо включен, либо выключен. Ток может либо идти, либо нет. Магнит может быть намагничен двумя способами! север — юг или юг — север. Использование таких устройств для запоминания чисел и действий над ними возможно благодаря двоичной системе записи.
В повседневной жизни мы применяем для записи чисел десятичную систему. Так,
365= (3-102) +(6-10)+ (5-1), 1066= (1 • 103) + (0-102) + (6-10) + (6-1).
Степени числа 10 выступают здесь скорее по традиции, чем по необходимости. Для этого нет никаких особых причин. С тем же успехом можно взять, скажем, число 6 и получить натуральный ряд в виде
1=(1-1),
2= (2-1), 3= (3-1), 4= (4-1), 5= (5-1), 10= (1-6) + (0-1), 11= (1-6) + (1-1), 12= (1-6) + (2-1), 55= (5-6) + (5-1), * 100= (1-62) + (0-6) + (0-1),
Такую систему могли бы выдумать существа, у которых не 10, а только 6 пальцев.
Простейшей системой такого типа является двоичная
система, в которой для представления чисел используются степени двойки. Такую систему мы бы давно изобрели, если бы считали не на пальцах, а на своих двух руках. В двоичной системе нужны только две цифры О и 1, а последовательность натуральных чисел выглядит следующим образом;
1 = (1 1) [= 1]
10 = (1 • 2) + (0 • 1) [= 2]
11 = (1 • 2) + (1 • 1) [= 3]
100 = (1 - 22) + (0 2) + (0 - 1) [= 4]
101 = (1 - 22) + (0 • 2) 4- (1 • 1) [= 5]
110 = (1 • 22) 4- (1 • 2) 4- (0 - 1) [= 6]
111 = (1 • 22) 4- (1 • 2) 4- (1 1) [= 7]
1000 = (1 • 23) 4- (0 • 2я) 4- (0 2) + (0 • 1) [= 8]
1001 = (1 • 23) 4- (0 22) 4- (0 - 2) 4- (1 • 1) [= 9]
(числа в квадратных скобках справа даны в обычной десятичной системе).
В двоичной системе применимы все обычные приемы сложения, вычитания, умножения, только все, что больше 1, остается «в уме». Вся информация, необходимая для сложения, содержится в таблице
0 + 0=0, 1+0=1, 0+1 = 1, 1 + 1 =0 (1 в уме).
Таблица умножения еще проще:
0-0=0, 0-1 = 0, 1-0=0, 1-1=1.
(+)
(X)
Если бы дети учились считать в двоичной системе, им не пришлось бы мучиться с таблицей умножения!
На основе этих двух таблиц можно выполнить любые арифметические расчеты. Умножим, например, 11 011 на 1010, как обычно, столбиком:
11 ОН'
1010
11011
11011
100001110 ни
(маленькие единички внизу — это единицы, которые мы при сложении держим «в уме», а затем переносим в другой разряд).
Для проверки переведем эти числа в десятичную систему: 11011 = 16 + 8 + 2 + 1=27, 1010=8+2=10,
100 001 110 = 256 + 8 + 4 + 2 = 270.
Таким образом, арифметика в двоичной и десятичной системах различается лишь способом записи: в обоих случаях речь идет об одних и тех же числах.
Компьютер на шариках
Я хочу продемонстрировать, как можно было бы выполнять на машине сложение и умножение, задаваемые таблицами (+) и (X). Чтобы не засорять голову премудростями электроники, воспользуемся механическим устройством, в котором катаются шарики. Общие принципы здесь те же, что и в ЭВМ, только в ЭВМ вместо шариков применяются электрические импульсы.
Сначала нужно изобрести элемент, который будет действовать в соответствии с таблицей ( + ). Он должен иметь два устойчивых состояния (которые мы для удобства обозначим 0 и 1) и должен реагировать на «входные
сигналы», тоже принимающие значения 0 и 1, следующим образом:
На входе Начальное состояние Конечное состояние На выходе
0 0 0 0
0 1 1 0
1 0 1 0
1 1 0 1
(Начальное состояние представляет одну из цифр, которые складываются, на вход подается вторая цифра, конечное состояние задает сумму, на выход поступает цифра, которая переносится в следующий разряд.)
Допустим, что цифре 1 на входе отвечает 1 шарик, а цифре 0 — отсутствие шарика. Тогда устройство, изображенное на рис. 174, будет осуществлять нужное нам сложение. Оно снабжено заслонкой в виде буквы Т, которая может находиться в одном из двух положений, отвечающих прибавляемой цифре. Движение шарика происходит под действием силы тяжести.
Легко видеть, что:
а) если устройство находится в состоянии 0 и на входе тоже 0 (шарик не подается), то оно остается в состоянии 0;
б) если оно находится в состоянии 1, а на входе 0, оно остается в состоянии 1;
в) если устройство находится в состоянии 0, а на входе 1, то в него вкатывается шарнк, опрокидывает заслонку и выкатывается через канал сброса; на выходе, как и в предыдущих случаях, остается 0;
г) если устройство находится в состоянии 1 и на входе тоже 1, то шарик переводит заслонку в положение 0 и выкатывается через канал выхода, т. е. на выходе получается 1.
Итак, наше устройство точно выполняет все требуемые действия.
Теперь, соединяя вместе нужное количество таких «суммирующих элементов», можно построить «полномасштабную» машину для сложения. Будем изображать суммирующий элемент так, как показано на рис. 175.
Рис. 174.
Рис. 175.
Тогда «цепь» таких элементов, представленная на рис. 176, будет действовать как сумматор.
Допустим, мы хотим сложить числа ПОПОООи НО НО, которые выше перемножили. Первое число введем в машину, приводя суммирующие элементы в состояния, от-

Рис. 176.
вечающие его цифрам, а цифры второго подадим на входы соответствующих элементов (рис. 177).
Представим себе, что шарики последовательно вкатываются по одному в соответствующие элементы справа налево. Это даст нам возможность проследить каждый шаг вычисления суммы. В первый справа желобок шарик
17 0 7/0
Рис. 177.
не поступает, и состояние первого элемента не меняется Во второй вкатывается шарик, изменяет 0 на 1 и выкатывается через канал сброса, оставляя машину в состоянии
0 110 110 10.
То же самое происходит на третьем шаге, после которого устанавливается состояние
0 110 11110.
На четвертом шаге ничего не меняется. В пятый желобок вкатывается шарик, изменяет 1 на 0, проходит через канал выхода в шестой элемент, изменяет 0 на 1 и сбрасывается:
0 110 0 1110, о 1 1 Го 1 1 1 0.
Наконец, шарик, падающий в шестой желобок, вызывает следующую серию изменений:
0 110 0 1110,
0 10 0 0 1110,
1<-
0 0 0 0 0 1 1 1 0,
Го 0 0 0 1 1 1 0,
и мы получили правильный ответ.
Читателю рекомендуется проверить, что перечисленные операции точно соответствуют обычному сложению столбиком, и испробовать несколько других примеров. Интересно также решить практическую задачу: найти такое взаимное расположение элементов, чтобы машина работала только за счет силы тяжести. Такую машину действительно можно построить.
Разумеется, в электронных компьютерах вместо шариков используются электрические импульсы, а вместо Т-образных заслонок — электронные приборы. Однако их действие основано на том же принципе.
На такой машине можно выполнять и умножение (например, путем многократного сложения). Используя небольшое количество многократно повторяющихся
основных элементов, можно создать счетную машину с довольно широкими возможностями, а поскольку электронные приборы действуют весьма быстро, то эта машина будет также и быстродействующей.
Структура SBM
Идеи, которых мы коснулись выше, позволяют сконструировать арифметическое устройство. Но одно арифметическое устройство не обладает достаточной гибкостью и еще не составляет ЭВМ как таковую. ЭВМ состоит из следующих основных частей:
t
АРИФМЕТИЧЕСКОЕ УСТРОЙСТВО
Память ЭВМ выполняет две функции. Во-первых, в ней хранятся числа, поданные на вход, промежуточные результаты вычислений и окончательные результаты, которые вот-вот попадут на выход. Во-вторых, в ней хранится программа, из которой машина «узнает», как и в какой последовательности должны выполняться вычисления. Машина, так сказать, «считывает» команду, содержащуюся в программе, выполняет ее и запоминает ответ; затем она переходит к следующей команде и т. д.
Эти команды должны быть сформулированы на машинном языке, т. е. в специальном коде, «понятном» машине. Формулировки должны быть очень конкретными и точными, например: «Взять содержимое ячейки 17 из памяти и поместить его в арифметическое устройство»;
«Сложить два разряда в арифметическом устройстве» и т. п Даже для перемножения двух чисел требуется множество команд на машинном языке.
По этой причине для программирования были придуманы другие языки, более близкие к тому, которым обычно описываются соответствующие действия. Например, инструкция
С=А + В
должна сообщить машине, что требуется сложить два числа, хранящиеся в ячейках А и В, и поместить результат в ячейку С. Для этого машина снабжается специальной программой-компилятором, написанной на машинном языке и переводящей каждую инструкцию с языка более высокого уровня в серию команд на машинном языке.
Сейчас известно много разновидностей языков программирования, носящих экзотические названия, вроде АЛГОЛ, ФОРТРАН, КОБОЛ (для коммерческих задач). Машины поступают от изготовителя вместе с нужными программами-компиляторами.
Именно использование программ придает ЭВМ большую гибкость. Машина выполняет последовательность инструкций, которую задает ей программист. Поэтому одна и та же машина может «решать» много различных задач. Программист должен выучить один или несколько стандартных языков программирования, что не так уж трудно. Гораздо труднее овладеть искусством программирования, т. е. умением применять эти языки экономно и продуктивно.
Составление программы
Предположим, что вы выучили какой-нибудь из языков программирования и у вас есть задача, которую вы хотите решить при помощи ЭВМ, Как составить программу?
Первый шаг состоит в том, чтобы выделить в процедур ре решения отдельные блоки, доступные машине, а затем приступить к написанию программы, связывающей их воедино.
Допустим, например, что вы хотите решать при помощи машины квадратные уравнения. Известно, что корни уравнения
ах2 + Ьх+с = 0
задаются формулой
— b + У Ь2 — 4ас * =--------------'•
Однако в качестве инструкции для ЭВМ эта формула не подходит. Ведь может случиться, что разность Ь2 — 4ас отрицательна, а ЭВМ этого «не поймет» и будет пытаться извлечь корень. Или а может обратиться в 0, и тогда деление на а утратит смысл.
Предположим, что наша ЭВМ умеет выполнять все арифметические действия, включая извлечение квадратных корней, и может различать положительные и отрицательные числа. Тогда процесс вычислений, расчлененный на отдельные блоки, можно представить в виде диаграммы, изображенной на рис. 178. Такая диаграмма называется блок-схемой.
В блок-схеме предусмотрено несколько различных ситуаций: если а = 0, то наше уравнение, возможно, линейное; может не быть действительных решений, или быть одно действительное решение, или два действительных решения.
Следующий шаг — превратить процедуру, представленную блок-схемой, в программу. Здесь имеются трудности, ибо программа должна состоять из определенной последовательности инструкций, а в нашей процедуре имеются разветвления и альтернативы. Чтобы выйти из положения, различным частям программы присванвают-
Рис. 175.
ся буквенные индексы (А, В, С, D, Е в описываемом ниже примере) и машине даются специальные инструкции о том, как переходить от одной части программы к другой в зависимости от того, какой ответ: ДА или НЕТ — получен на тот или иной вопрос.
Сейчас мы приведем одну из возможных программ для нашего примера, записанную на некоем гипотетическом языке типа АЛГОЛа. Его нетрудно понимать, если поглядывать иногда на блок-схему.
ПРОГРАММА РЕШЕНИЯ КВАДРАТНЫХ УРАВНЕНИЙ
А: начало действительные а, b, с, k, и, и, w, х, у ввести а, Ь, с если а = 0, то перейти к В у = Ь2 — 4ас если у 0, то перейти к С напечатать ДЕЙСТВИТЕЛЬНЫХ КОРНЕЙ НЕТ конец
В: если b = 0, то перейти к Е
х = —с/Ь напечатать х конец
С: если у — 0, то перейти к D
k = / у и = (—b + k)i"2a v = (—b — k)/2a напечатать и напечатать ИЛИ напечатать v конец
D: w = —Ы2а
напечатать w конец
Е: напечатать КОРНЕЙ НЕТ
конец
Инструкцию «действительные a, b, с, k, и, v, w, х, у» называют описанием- она указывает машине, какие символы заняты для чисел и какие рассматриваются числа (действительные). Инструкция «ввести» предписывает считать значения, а, Ь, с с приготовленной заранее ленты данных. Инструкция: «если Р, то перейти к X» означает, что в случае ситуации Р нужно перейти к части программы, помеченной символом X. Если же ситуация Р не осуществилась, то выполняется следующая строка программы. Остальные инструкции очевидны: машина выполняет их строка за строкой по порядку, за исключением случаев, когда ей предписывается перейти к другой части программы.
Это довольно типичная простая программа, и я привел ее для того, чтобы объяснить, как составляются программы. Читателю рекомендуется выбрать несколько вариантов конкретных значений а, Ь, с и посмотреть, как эта программа справляется со своей задачей.
Дальнейшие подробности, касающиеся программирования на специальных языках программирования, читатель найдет в многочисленных руководствах, посвященных этим вопросам 2.
Применения компьютеров
Говоря попросту, компьютеры можно применять тогда, когда требуется выполнить большой объем вычислений, которые допускают точное описание. А вот вопрос о том, нужно ли их применять, решается обычно исходя из экономических соображений: поскольку это дорого, окупит ли полученный результат необходимые затраты?
Компьютеры используются в бизнесе и в управлении, в основном для ведения счетов и накопления информации. Об этих применениях я говорить не буду, замечу только, что распространенное оправдание «ошибка ком
пьютера» на деле часто оказывается «ошибкой программ миста».
Ученые-исследователи могут с успехом пользоваться компьютером для обработки опытных данных, вычерчивания графиков, расчета таблиц результатов, применения статистических методов. Они могут решать численными методами «неприступные» уравнения. Есть даже опасность, что под впечатлением огромного потока информации, которую можно получить в результате машинных вычислений, утратится трезвый взгляд на вещи: никакое количество вычислений самих по себе не приведет к полезным результатам, если задача или эксперимент плохо поставлены. И все же возможности, которые предоставляют компьютеры, поистине огромны. Они позволили нам заглянуть в структуру белка, раскрыть генетический код, изучать свойства элементарных частиц и строение звезд. Они помогли человеку осуществить посадку на Луну.
Даже в области чистой математики на счету у компьютеров имеется ряд замечательных достижений, особенно в теории конечных групп. Однако в этой области мало задач, пригодных для машинных вычислений, и даже среди этих немногих большинство требует для решения слишком много времени; быстродействия современных (а скорее всего, и завтрашних) компьютеров для решения таких задач еще недостаточно.
Применение компьютеров не ограничивается числовыми задачами. Существуют программы, позволяющие компьютерам играть в шашки (хорошо), в шахматы (плохо), переводить с одного языка на другой (отвратительно), сочинять музыку (в некотором роде) и стихи. Некоторые недавние достижения в производстве «умных» машин весьма впечатляющи.
Это, естественно, заставляет меня обратиться к традиционному вопросу: могут ли машины мыслить? Как сказал бы Подай, все зависит от того, что понимается под
словом «мыслить». Пока что компьютеры умеют выполнять некоторые функции человеческого мозга быстрее и точнее, а другие не могут выполнять вообще. Но если поставить вопрос так: существуют ли в способе мышления человека какие-то особенности, которые никакая машина в принципе никогда не сможет воспроизвести? — то, по моему личному мнению, на него нужно ответить: нет.
Разумеется, в настоящее время мы не умеем дублировать функции мозга, и сходство между мозгом и существующими компьютерами примерно такое же, как между коровой и автоцистерной «Молоко». Быть может, наша техника так никогда и не приблизится к созданию «мыслящей» машины: не исключено, что человеческий мозг для этого слишком «глуп». Однако я не думаю, что существуют принципиально непреодолимые препятствия, не позволяющие создать машину, выполняющую функции человеческого мозга, такие логические препятствия, которые мешают У 2 быть рациональным числом и не дают человеку поднять самого себя за шнурки ботинок. И вот почему: ведь человеческое тело явно представляет собой некую машину в том смысле, что оно состоит из той же материи, что и все остальное, и подчиняется тем же законам движения материи. Это очень сложная и удивительная машина, в которой мы еще мало что понимаем. Однако, если бы существовали принципиальные препятствия для создания машин, ведущих себя, как люди, то и люди никогда бы не появились.
Это утверждение вовсе не сводит человека до уровня простейшего механизма. Многие люди настойчиво проповедуют, что сложность человеческого поведения, его эмо-, циональные, творческие и духовные атрибуты определяются чем-то «высшим», нежели физические законы. Это замечательная концепция. Однако насколько более замечательно было бы, если бы даже эти свойства были следствиями физических законов. Это нисколько не унизило бы человечество, зато как возвысило бы физику!
Глава 19
ПРИМЕНЕНИЯ СОВРЕМЕННОЙ
МАТЕМАТИКИ
Хотя выше я вел речь о различных разделах математики — алгебре, анализе, логике, геометрии, теории чисел, топологии, теории вероятностей — однако надо иметь в виду, что никаких четких границ между ними провести нельзя и что такое разделение во многом условно. Когда Декарт впервые установил связь между геометрией и алгеброй, это было встречено с удивлением. Когда Галуа применил теорию групп к алгебраическим уравнениям, это тоже было удивительно. Когда Адамар и Валле Пуссен, используя анализ, доказали важные гипотезы о простых числах, это опять вызвало удивление. Теперь математики больше не удивляются таким событиям. Наоборот, они намеренно ищут встречи с ними. Стало уже обычным, когда, начав с какой-то задачи анализа, ее превращают в топологическую, затем сводят к алгебраической и, наконец, решают при помети теории чисел.
Именно это единство позволяет говорить о «теле математики», как в гл. 1. Отдельные его части столь тесно связаны, что любое серьезное изменение в одной из них оказывается важным для всего «организма». Математика есть гармоничное целое, несмотря на то что это незавершенная гармония, ибо в наших знаниях всегда есть пробелы, и на каждом этапе мы смутно догадываемся о новых и новых взаимосвязях.
В этом смысле любое применение какого-либо раздела математики есть применение математики в целом. Если придерживаться той точки зрения, что математика оправдывает свое существование в той мере, в какой она находит применение, тогда следует признать, что лю
бое применение какой бы то ни было ее части оправдывает существование всего остального. Не станем же мы утверждать, что скрипачу нужно ампутировать ноги, на том основании, что для игры на скрипке они ему не нужны. По тем же соображениям не стоит отвергать теорию групп только потому, что она «не рентабельна».
По традиции выделяют два вида математики — «чистую» и прикладную. У тех, кто занимается «чистой математикой», мысли витают в облаках абстракций, они изучают науку ради нее самой, не интересуются применениями и не придают им значения. Те же, кто занимается прикладной математикой, прочно стоят на земле и приносят пользу обществу.
Как и в большинстве других традиций, в этой традиции есть доля разумного. Математика столь обширна, что каждый математик вынужден ограничиться определенным направлением исследований. Если выбранное направление не имеет непосредственных применений в сегодняшнем реальном мире, то его отнесут к «чистым» математикам, если же имеет, он попадет в категорию «прикладников». Но очень часто оказывается, что результаты «чистой» математики находят важные практические применения, а результаты, задуманные как прикладные, не находят вообще никаких применений. Мне вспоминается человек, который разрабатывал математическую теорию малярной кисти. Чтобы написать уравнения, которые он смог бы решить, ему пришлось ввести предположение, что каждый волосок кисти представляет собой бесконечную полуплоскость. Таким образом, его теория утратила всякую связь с реальной кистью. В то же время она не имела почти никакой ценности и для математики, поскольку он умышленно выбирал такие уравнения, которые можно было решить уже известными методами.
Я бы предпочел сказать иначе: имеется математика и применения математики. Дело математиков — создавать
мощные средства для решения математических задач, и эти задачи могут быть выдвинуты возможными применениями (потребностями практики), могут возникать в ходе абстрактных исследований в виде камней преткнове* ния при разработке каких-то математических методой или, наконец, это могут быть важные нерешенные задачи. Как я уже говорил в гл. 1, обычно применения находятся с большим запозданием: чистая математика Одного столетия может оказаться теоретической физикой следующего. Конечно, применения важны, но в этом вопросе необходимо проявлять достаточную дальновидность.
Я хочу привести ниже три примера применений современной математики, Первый показывает, как можно использовать линейную алгебру для решения некоторых типов экономических задач; правда, к вопросам рентабельности он имеет примерно такое же отношение, как теория групп. Второй иллюстрирует современные применения теории групп к исследованию физических свойств элементарных частиц. Третий пример — совсем новая теория скачкообразных (разрывных) процессов, которая основана на совсем свежих математических результатах. Может оказаться, что она получит важные применения в биологии и медицине; она уже с успехом использовалась для изучения распространения нервных импульсов.
Эта последняя теория столь нова, что многое в ней пока чисто умозрительно и большая ее часть еще требует разработки. Чтобы преодолеть «эффект запаздывания применений» и предсказать будущее, мне придется воспользоваться магическим кристаллом. Однако вспомним, что анализ был разработан в основном для изучения непрерывных процессов и в течение двух столетий считался главным средством всей теоретической науки. Сейчас в науке имеется огромная необходимость постигнуть именно разрывные, скачкообразные процессы, которые встречаются в физике, химии, технике, метеорологии.
биологии, экономике, социологии, политике, геофизике, аэродинамике и т. д„ поэтому следует признать по меньшей мере правдоподобным, что теория таких процессов имеет большое будущее.
Как добиться максимальной прибыли
Предположим, что некий завод выпускает два вида изделий: «штучки» и «дрючки». Каждое сначала обтачивается на токарном станке, а затем на сверлильном в нем проделывают отверстия. Обработка каждого изделия на каждом станке требует определенного времени, причем каждый из станков можно занимать только установленное время (в неделю). Известна также прибыль от продажи каждого вида изделий. Сведем все эти данные в таблицу:
Обработка Штучка Дрючка Время доступа к станку
Обточка 3 5 15
Сверление 5 2 10
Прибыль с одного изделия 5 3
Требуется выяснить, как сделать прибыль максимальной.
Предположим, что каждую неделю выпускается х штучек и у дрючск. Тогда, исходя из затрат времени, получаем следующие условия:
3.v + 5y<15, 1 (1)
5л -Ь2«/< 10; J (2)
при этом, разумеется,
х>0, (3)
f/^0. (4)
Прибыль от продажи изделий за неделю равна 5х+3г/. (5)
Задача состоит в том, чтобы найти максимум выражения (5) при выполнении условий (1) — (4).
Мы не знаем методов решения неравенств, поэтому нарисуем график. Точки (х, у), удовлетворяющие усло-
вие. 179.
ВИЯМ (1) —(4), лежат в заштрихованной области на рис. 179. Последние два условия означают, что х и у положительны, условие (1) говорит о том, что точки (х, у) лежат ниже прямой 3x+5z/= 15, а условие (2) — что они лежат левее прямой 5х + 2у= 10.
Прямая 5х+3у — р, отвечающая некоторому конкретному значению прибыли р, показана на рисунке. Когда р меняется, прямая перемещается параллельно самой себе, оставаясь под тем же наклоном к оси. Чем левее прямая, тем меньше прибыль.
Наша задача состоит в нахождении наибольшего зна
чения р, при котором прямая проходит через заштрихованную область, поскольку только в этой области лежат допустимые точки (х, у). Ясно, что этому значению р отвечает прямая, проходящая через точку А на рисунке — правый верхний угол заштрихованной области.
Чтобы найти точку А, решим систему уравнений
5х 4- 2у = 10, 1
Зх -j- 5 у = 15. J
Получим
х=20/19, г/=45/19.
Тогда прибыль за неделю равна 5х+3у, т. е.
100+ 135 235.
19 “ 19'
Итак, чтобы получить максимальную прибыль, завод должен выпускать 20 штучек и 45 др точек каждые 19 недель.
Аналогичные соображения применимы в масштабах целой отрасли хозяйства или экономики всей страны, хотя в реальных ситуациях число изделий и машин будет очень велико. В общем случае задача сводится к нахождению максимума некоторой линейной комбинации неизвестных, удовлетворяющих системе линейных неравенств. Эти неравенства определяют некоторую область в многомерном пространстве. Можно показать, что:
а) эта область выпукла;
б) максимальное значение, если оно существует, прибыль принимает в одном из углов этой области.
Для доказательства этих утверждений не обойтись без линейной алгебры; она требуется и для нахождения того угла, в котором принимается максимальное значение. При большом числе неизвестных эти вычисления проводятся при помощи ЭВМ.
Чтобы достаточно полно и подробно изучать экономику всей страны, нужно составить так много уравнений, что даже самые быстродействующие из существующих
ЭВМ. едва ли справятся с этой задачей. Поэтому придется сделать упрощающие предположения, а тогда появятся сомнения в достоверности результатов.
Подобные методы, известные под названием линейного программирования, широко применяются в экономике; их описание можно найти во многих учебниках по математической экономике
Восьмеричный путь
Когда-то теория атома была довольно проста. Считалось, что все атомы состоят из трех различных видов элементарных частиц: протонов, нейтронов и электронов. В результате более тонких исследований обнаружилось существование уймы других элементарных частиц: нейтрино, пионы, мюоны и т. п. Однако теории, которая позволяла бы их как-то систематизировать, не было.
В 1964 г. было обнаружено, что для такой систематизации может быть использована теория групп. Приводимое ниже описание этой идеи по необходимости очень сжато, поэтому не надейтесь извлечь из него больше, чем самое общее понятие о том, как это делается.
Технической основой для осуществления этой идеи послужили представления групп. Для данной группы G ее представления находятся так: ищется векторное пространство V, допускающее некоторые линейные преобразования, составляющие группу G', изоморфную G. Эта группа G' (или, точнее, этот изоморфизм) и называют представлением группы G.
Рассмотрим, например, группу G, состоящую из двух элементов {I, г}, причем г2 = 1. В качестве V возьмем плоскость R2 и рассмотрим зеркальное отражение Т от-носительно некоторой фиксированной прямой, проходящей через начало координат. Присоединив к нему тождественное отображение I, получим группу {/, Т} линейных преобразований пространства V, Более того, Т2—1,
поэтому группа G'= {I, 7} изоморфна G, т. е. является ее представлением.
Размерность пространства V называют размерностью представления (на страх педантам).
В квантовой механике данный физический объект может существовать в различных энергетических состояниях Например, в атоме водорода, состоящем из протона и электрона, энергия электрона может принимать бесконечно много значений, хотя весь набор этих значений можно вполне точно рассчитать. Электрон может переходить из одного энергетического состояния в другое, поглощая или испуская фотон, так что сохраняется полная энергия системы.
Из законов квантовой механики вытекает такое математическое следствие: возможные состояния физического объекта точно описываются представлениями его группы симметрий.
Например, один атом, находящийся в некоторой точке Р пустого пространства, обладает полной поворотной симметрией: его группа симметрий — это группа О3 всех жестких движений 3-мерного пространства, оставляющих на месте точку Р. Эта группа имеет 3-мерное представление (физики называют его триплетным представлением), поскольку она сама уже является группой линейных преобразований 3-мерного пространства (ибо жесткие движения — это линейные преобразования).
Если теперь приложить магнитное поле, симметрия нарушится: направление поля выделит в 3-мерном пространстве некоторую прямую, и группой симметрий станет группа О2 вращений, оставляющих неподвижной эту прямую. Оказывается, что при этом триплетное представление группы О3 распадается на 3 различных 1-мерных представления группы О2. Спектроскопическое исследование показывает, что одиночная спектральная линия, наблюдаемая в отсутствие магнитного поля, расщепляется при включении поля на 3 расположенные поблизо
сти одна от другой линии. Соответствующие энергии можно вычислить, и они согласуются с экспериментальными данными.
Такое применение теории групп в квантовой механике общепринято. Оно позволило предсказать в 1938 г. существование и различные свойства пионов. Пионы были об-
наружены экспериментально в 1947 г., и оказалось, что предсказанные свойства вполне отвечают действительности.
Среди известных элементарных частиц имеется некоторое количество более тяжелых, чем остальные. Эти тяжелые частицы образуют семейство, известное под общим названием барионы. В семейство барионов входят: нейтрон п°, протон п+ и ряд более загадочных, называемых по присвоенным им греческим буквам Л (ламбда), 3 (кси), 2 (сигма) и Д (дельта). Каждая из частиц обла
дает определенными массой и электрическим зарядом, всегда целым кратным основной единице заряда, которая равна 4'1 для протона и 0 для нейтрона (заряд электрона равен —1, но электрон не относится к семейству барионов).
Элементарные частицы обладают и другими физическими характеристиками, менее наглядными, чем масса и заряд. Вот некоторые из них: спин, изотопический спин, гиперзаряд, странность.
Наиболее известно семейство 8 барионов, состоящее из Е-дуплета, 2-триплета, А-синглета и n-дуплета. Их массы, заряды, изотопические спины (/) и гиперзаряды (У) указаны на рис. 180.
Это семейство может быть описано на языке представлений некоторой группы, называемой SU3. Ее наиболее естественное представление имеет размерность 8. Поскольку в природе идеальная 5Д3-симметрия всегда несколько нарушена, группа симметрий сводится к некоторой подгруппе U2, а исходное 8-мерное представление распадается на 4 части размерностей соответственно 3, 2, 2, 1. Эти части в точности соответствуют 2-триплету, Е- и n-дуплетам и Д-синглету.
Далее было замечено, что наблюдаемые значения У, I, массы и заряда согласуются с предсказываемыми 5{73-теорией. Получается, что все эти барионы — как бы различные состояния одной элементарной частицы, которая превратилась в 8 разновидностей вследствие асимметрий в природе.
Эта теория известна под названием «восьмеричный путь».
Была осуществлена решающая проверка. Следующее представление группы SU3 имеет размерность 10. Сведенное к U2, оно распадается на 4 части размерностей 4, 3, 2 и 1. Девять известных частиц отвечали этой ситуации: Д-квадруплет, 2-триплет и Е-дуплет (рис. 181). (Массы частиц 2 и Е несколько отличаются от тех, ко
торые указаны на рис. 180, поскольку здесь мы рас-сматриваем другие состояния.)
Знак вопроса в верхнем кружке относится к частице, которой недоставало для полноты картины. Теория предсказала несколько ее характеристик: она должна была иметь заряд —1, гиперзаряд —2, изотопический спин 0,
г - ...W г- ' -'I
-1 О 1 +2
заряд
Рис. 181,
массу около 1700 МэВ. Совершенно неожиданная комбинация!
В феврале 1964 г. в специально разработанном экспе-рименте эта частица была найдена. Ей дали название омега-минус (Q-).
Так, теория, основанная на свойствах абстрактных групп, правильно предсказала существование ранее неизвестной элементарной частицы 2.
Теория катастроф
Не всегда бывает так, что непрерывные воздействия приводят к непрерывным изменениям. Чтобы зажечь свет, вы плавно переводите выключатель из положения «выключен» в положение «включен», но на этом пути он проходит через точку, когда внезапно вспыхивает свет. Непрерывное движение по краю скалы может оборваться, если вы свалитесь вниз.
До недавнего времени большинство исследований в математике и почти все в физике были посвящены непрерывным изменениям. Однако один ИЗ выдающихся математиков нашего времени Рене Том разработал глубокую теорию скачкообразных изменений, которые он назвал катастрофами3.
Возможные применения такой теории широки и разнообразны. Самым важным полем применения станет, вероятно, биология. Вспомним, что по мере своего развития зародыш претерпевает много скачкообразных изменений: в результате деления клеток начинают формироваться конечности, образуются нервы, кости и мышцы. Выяснение механизма этих процессов могло бы привести к небывалым успехам биологии. И, возможно, наступит день, когда мы окажемся в состоянии применить эти новые знания в медицине, и в частности научимся предотвращать врожденные уродства.
Такие применения, если они окажутся возможными, далеко впереди — это дело десятилетий или даже столетий. Однако пока теория Тома — единственная теория, позволяющая хоть как-то исследовать скачкообразные процессы, и потому заслуживает того, чтобы заняться ее разработкой.
Читателю будет значительно легче понять дальнейшее, если он построит или хотя бы вообразит машину Зимина4, схематически представленную на рис. 182. Она состоит из вращающегося диска, к краю которого при-
креплены две одинаковые пружины: конец одной закреплен в точке F, коней другой можно свободно перемещать, каждый раз фиксируя ее положение. (Диск можно сделать из картона и приколоть в центре булавкой к деревянной доске. Если диаметр диска 5 см, то точка F должна быть примерно в 12 см от центра. Тогда пру-
жины нужно взять примерно по 8 см и не слишком тугие. Желательно, чтобы устройство, закрепляющее пружины на краю диска, свободно вращалось вместе с диском.)
Путем экспериментов с этой машиной можно обнаружить, что существует ромбовидная область PQRS со следующим свойством: когда свободный конец пружины находится вне этой области, у диска есть лишь одно положение равновесия; когда же этот конец попадает внутрь области, положений равновесия два.
Более того, диск можно заставить перескочить из одного положения равновесия в другое непрерывным перемещением свободного конца пружины. Например, в случае, показанном на рис. 183, диск поворачивается скачком, когда свободный конец выходит из области
Рис. 182.
PQRS (однако когда он входит в эту область, ничего подобного не происходит).
Чтобы установить причину этого явления, проанализируем изменение энергии натяжения пружин. Допустим, что мы силой вывели диск из положения равновесия, повернув его на некоторый угол 6. Когда мы его отпу-
стим, он скачком вернется в некоторое положение равно-
весия. Это происходит потому, что система, в которой энергия запасена в растянутых пружинах, стремится перейти в состояние с минимальной энергией (или, говоря более строго, в состояние со стационарной энергией в том смысле, как это поясняется ниже).
Вне области PQRS график энергии в зависимости от угла 0 выглядит так, как показано на рис. 184. Кривая имеет единственный минимум, чтб и соответствует одному положению равновесия.
Внутри области PQPS график энергии выглядит, как показано на рис. 185. На этот раз имеется два минимума, соответствующих двум разным углам 6; отсюда и два положения равновесия.
Между двумя минимумами отвечает равновесию, но не
устойчивому. Даже слабый толчок приведет к тому, что система «покатится вниз по склону», т. е. энергия устремится к минимуму. Теоретически иголка может стоять на
острие, однако такое положение равновесия для нее неустойчиво.
Когда свободный конец пружины проходит путь, показанный на рис. 183, кривая энергии претерпевает ряд изменений (рис. 186). Поведение диска иллюстрирует шарик, катающийся по желобку. Сначала он пребывает
LW
Рис. 186.
«на дне», в минимуме, и остается там до тех пор, пока этот минимум существует. Когда этот минимум исчезает, шарику не остается ничего другого, как скатиться в единственную оставшуюся ямку. Так же и диск срывается в другое положение равновесия, вынужденный к тому не зависящими от него обстоятельствами.
Поведение диска можно описать более наглядно, если нарисовать в 3-мерном пространстве график, изображающий возможные равновесные состояния для разных положений свободного конца. Можно доказать, что он имеет такой вид, как показано на рис. 187. На рисунке отмечены точка Р и часть ромбовидной области (которая для большей ясности повернута). Над точками области, ограниченной кривой К с острием, мы видим три положения равновесия; одно на верхнем слое складки,
одно посредине и одно на нижнем слое. Среднее положение неустойчиво. Над точками вне этой области лежит один слой поверхности.
Когда свободный конец пружины, пересекая кривую К, входит во внутреннюю область, диск «старается» сохранить равновесие, отвечающее верхнему слою склад-
Рис. 187.
кн. Когда же он выходит из области, диск «срывается с края» и перепрыгивает в другое положение равновесия.
Все это можно описать количественно. Выберем систему координат (а, Ь) с началом в точке Р. Введем третью переменную х, описывающую угол поворота диска в равновесном состоянии. Для малых а, Ь, х энергию натянутых пружин можно считать равной
V = -^-х* +-^-ах2 + Ьх.
Чтобы найти состояния равновесия, нужно определить стационарные значения энергии. Это те точки, где
кривая энергии горизонтальна, т. е. максимумы, минимумы и так называемые «точки перегиба». Все эти возможности иллюстрирует рис. 188. Из дифференциального исчисления известно, что стационарные значения соответствуют тем точкам, в которых производная обращается в нуль:
~ = х3 + ах + b = 0.
Рис. 188.
Если нарисовать «график» этого уравнения, выбирая значения а и b и откладывая соответствующие значения х, получится поверхность, изображенная на рис. 187.
Рене Том исследовал общую ситуацию, с точки зрения которой все описанное выше — лишь частный случай. Он рассматривал любую динамическую систему, поведение которой можно измерять переменными
х, у, z, ...
и которая «управляется» другим набором переменных а, Ь, с, ...
Переменные х, у, г, ...— это, так сказать, координаты пространства поведения (внутренние переменные), а, Ь, с, ...— координаты пространства управления (внешние переменные). Поведение системы задается ее потенциа
лом (или энергией). В общем случае рассматривается потенциал вполне общего вида
V=V(x, у, z, ..., а, Ь, с, ...), подчиненный лишь таким условиям, которые позволяют применять к функции V операции дифференциального и интегрального исчисления.
В случае машины Зимана мы имеем дело с системой, у которой одна внутренняя переменная х и две внешние а, Ь; потенциал V этой системы задается написанной выше формулой.
Ясно, что подобную систему можно построить для любого потенциала V, и, значит, существует бесконечное множество различных систем такого рода. Однако многие из них переходят одна в другую при «замене координат». Например, в случае машины Зимана, если заменить х на 2Х, то потенциал V станет другим:
4Х4 + 2аХ+Ь,
но если мы узнали все о новой системе, нам станет изве-стно все и о старой, ибо такие изменения несущественны. Простейший способ избавиться от несущественных различий — обращать внимание только на топологические свойства соответствующих поверхностей.
Все события в физическом мире можно описывать при помощи 4 переменных: трех пространственных координат и одной временной. Поэтому, если иметь в виду физические применения, достаточно ограничиться 4-мерным пространством управлений.
Для этого случая Том доказал удивительную теорему: в динамической системе с 4 внешними переменными могут встретиться ровно 7 топологически различных типов скачка. Любое физическое нарушение непрерывности относится к одному из 7 типов.
Том перечислил эти 7 типов и назвал их элементарными катастрофами. Вот они:
Название Потенциал V
Морщина — л3 + ах 3
Складка -L х* + - - ах2 + Ьх
Ласточкин хвост -1. х5 + -L ах3 +-L Ьх2 + с О о Z
Бабочка —L х6 + —1- axi +—L. Ьх3 + J— сх2 + d 6 4 3 2
Гиперболическая омбилика Эллиптическая омбилика Параболическая омбилика х3 + у3 + ах + by + сху х3 — Зхг/2 + сх + by + с (х2 + у2) х2у + yi + ах + by + сх2 + dy2
Эта таблица не подсказывает никакой очевидной закономерности, никакой очевидной причины, почему встречаются только эти 7 катастроф. В доказательстве Тома существенно используются весьма глубокие результаты топологии, анализа, абстрактной алгебры — как я уже говорил, математика есть гармоничное целое — и даже если все это знать, оно очень трудное.
Геометрические формы элементарных катастроф очень красивы. На рис. 189 показано построенное компьютером сечение части параболической омбилики 5.
Легко видеть, что машине Зимана соответствует вторая катастрофа — складка. Эта же катастрофа позволяет показать, как можно было бы применить теорию Тома в биологии.
Живая клетка есть не что иное, как трехмерная капелька вещества. Для простоты будем считать, что это двумерная капелька — тогда легче рисовать картинки.
Соответственно будем предполагать, что клетка живет в двумерном внешнем пространстве.
Мы будем наблюдать за поведением клетки, измеряя концентрацию в ней некоторого химического соединения (неважно, какого — это может быть хлорид натрия, ДНК или что-нибудь другое). Поскольку клетки претерпевают
Рис. 189.
скачкообразные изменения (именно это нас и интересует), то в способе зависимости химической концентрации от внешних параметров должна проявляться одна из катастроф Тома. Возможной моделью служит складка.
С течением времени концентрация фиксированного вещества в клетке постепенно изменяется («дрейфует»). Этот процесс можно описать как медленное движение клетки в пространстве управления. На рис. 190 показаны 4 стадии развития клетки.
Положения клетки показаны на нижних рисунках, поверхность со складкой представляет ее химическое состояние. На последнем рисунке вдоль клетки проходит четкая линия раздела. Та часть, которая лежит слева от этой линии, отвечает верхнему листу поверхности и, следовательно, имеет высокую концентрацию рассматриваемого вещества. Часть, лежащая справа, имеет низкую концентрацию.
Но такая резкая разница концентраций может означать только одно: фактически клетка разделилась на две различные клетки.
Как уже говорилось, это очень грубая и упрощенная модель. Процесс деления клетки совсем не так прост. Однако он относится к скачкообразным процессам типа рассмотренных Томом и, значит, на каждой стадии должен описываться одной из 7 элементарных катастроф.

Рис. 190.
Это позволяет совершенно по-новому ответить на вопрос: почему делятся клетки? Потому что топологические свойства описывающей их химическое состояние поверхности таковы, что не делиться им невозможно.
Представим себе картину развития зародыша: вот он медленно скользит по немыслимо изогнутой поверхности своих химических изменений, испытывая новые и новые деления; там начинают формироваться клетки конечностей, тут — нервов, мышц или костей. И каждая ступень этого процесса происходит одним из 7 различных спо* собов!
Рассказывают, что однажды астроном, физик и математик проводили отпуск, путешествуя по Шотландии. Выглянув из окна вагона, они увидели черную овцу на лугу. «Как интересно! — заметил астроном.— Оказывается, в Шотландии все овцы черные!» «Э, нет! — отозвался физик.— В Шотландии некоторые овцы черные». На что математик скорбно воздел глаза к небу и тоном проповедника провозгласил: «В Шотландии есть по крайней мере один луг, на котором пасется по крайней мере одна овца, у которой по крайней мере один бок черный».
Математики (когда они говорят всерьез) предпочитают выражаться осторожно. Вот перед математиком теорема, которая по всем признакам должна быть верной. Он вспомнит множество случаев, когда «очевидное» оказывалось неверным, и затрепещет от страха. И кто осудит его за это, если в его науке можно построить (с циркулем и линейкой) правильный 17-угольник и нельзя построить правильный 19-угольник, если сферу можно вывернуть наизнанку *, а рациональных чисел столько же, сколько целых? Нет уж, он лучше подождет, пока теорема будет доказана.
Я должен, однако, добавить, что не все математики проявляют подобную предусмотрительность и меньше других — некоторые из самых великих (как в минувшие времена, так и теперь) 2. Но даже они обычно понимают, что стоят на зыбком основании. И, кроме того, есть большая разница между сомнением в справедливости теоремы и ее игнорированием. Каждый изучающий математику должен быть готов к тому, чтобы сказать: «Я не совсем понимаю, почему это так, но допустим, что это действительно так, и посмотрим, куда это нас приведет».
Иногда трудность легче понять, если продвинуться вперед и посмотреть на нее издали. Тот, кто настаивает на полном понимании каждого мелкого шага рассуждений и не хочет без этого двигаться дальше, рискует попасть в положение человека, который слишком пристально разглядывал, куда ступить, и не заметил, что идет не в ту сторону. Вначале всегда позволительно игнорировать частные трудности: так легче понять генеральную стратегию атаки. А потом, когда станет ясно, что в целом она правильна, можно вернуться к проработке деталей.
Настало время и нам заняться обсуждением деталей некоторых наших предыдущих рассуждений. Овца с одного боку белая, с другого черная — большая редкость, да и вообще не так уж важно, является ли данная овца такой, какой она кажется. Однако математике свойственна устрашающая тенденция громоздить умозаключения одно на другое, сооружая нечто вроде карточных домиков. Выньте одну карту — и постройка рухнет. Когда в США начинали разрабатывать программу космических исследований, был такой случай: одна ракета стоимостью в несколько миллионов долларов, как показала проверка, должна была взорваться сразу же после запуска. Выяснилось, что в записанной на пленку программе управления полетом (которая выполняется при помощи компьютера) пропущена точка с запятой. Чем сложнее сооружение, тем более ужасными могут оказаться последствия даже самой мелкой ошибки.
На рубеже 19 и 20 вв. у математиков возникли сомнения в прочности фундамента их науки. Сейчас модно рассуждать о «пирамидальных» структурах. Математика напоминает пирамиду, стоящую на своей вершине. Почти все ее результаты покоятся на небольшом числе исходных предположений. Обыкновенное благоразумие требует присмотреться к ним повнимательнее и сделать их настолько прочным фундаментом, насколько это возможно.
Получерная овца в стаде
В гл. 9 мы упоминали о попытке Фреге поставить на твердое основание понятие числа. До тех пор адекватная трактовка этого понятия в математике отсутствовала. В качестве краеугольного камня было взято разбиение множеств на классы равномощных. Согласно прагматической позиции В, эти классы ведут себя, как числа, и потому можно считать, что они и являются числами.
Однако мы не приняли эту позицию и предпочли считать существование чисел аксиомой. Это было удачно, потому что, как выяснилось, рассматривать множество всех множеств, обладающих определенным свойством,— совсем не такое безобидное дело, как кажется. Бертран Рассел указал Фреге на это обстоятельство сразу, как только тот закончил свой шедевр.
Представим себе огромную библиотеку. Среди книг, стоящих на полках, есть каталоги, в которых перечисляются книги стихов, справочники, книги по математике, книги нестандартного размера и т. д. В некоторые из каталогов (например, в каталог справочных изданий) входят и они сами, другие (например, каталог стихов) сами себя не включают. Библиотекарь решает навести полный порядок и составить еще один каталог (обозначим его С) всех каталогов, не включающих самих себя.
Возникает вопрос: включает ли каталог С сам себя?
Если включает, то он входит в С и, значит, сам себя не включает. Если нет, то С является каталогом, который сам себя не вктючает, и, значит, он должен содержаться в С.
Помните деревенского брадобрея? 3
Если бы этот парадокс касался только библиотекарей, мы не стали бы особо огорчаться и попросту выбросили бы из математики любые упоминания о них. К сожалению, это явно не так: ведь любое множество — это по существу каталог его элементов.
Теоретико-множественная формулировка этого парадокса такова: пусть В — множество всех множеств, которые не содержат себя как элемент множества. Содержит множество В себя в качестве элемента или не содержит? Рассуждение такое же, как и в случае каталогов, и что бы мы ни предположили, мы выведем противоположное.
Итак, теория множеств в том виде, в каком ею пользовался Фреге, противоречива. Худшая судьба не может постичь теорию!
У нас есть только один выход: отказаться от предложенной Фреге наивной теории множеств и найти ей непротиворечивую замену. В наивной теории мы позволили себе слишком много вольностей, вот и получили по заслугам.
Два выхода
Чтобы обойти парадокс Рассела, нам придется так изменить ход рассуждений, чтобы к подобным выводам невозможно было прийти. Однако наши новые правила не должны вводить слишком много ограничений, иначе нам грозит опасность вместе с водой парадоксов выплеснуть и математического ребенка.
В приведенном выше рассуждении есть по крайней мере два места, где логика чуточку сомнительна.
Во-первых, возможно, что мы позволили себе слишком большую свободу в построении множеств. Ведь если В не является множеством, то теряет смысл вопрос о «вхождении» В в В, и рассуждение не может продолжаться.
Во-вторых, возможно, что доказательство от противного не заслуживает такого полного доверия, какое мы ему оказали. Ведь если двойное отрицание не-не-р не совпадает с р, то доказательство от противного рушится: в этом случае мы доказали только, что В не содержится
в В и не не содержится в В, но второе нисколько не про-, тиворечит первому.
Приверженцы второго тезиса, так называемые интуи-ционисты, особенно подняли голос в ЗО-е годы. Предложенный ими выход был весьма радикальным; отбросив доказательства от противного, математика понесет огромные потери. Интуиционисты предприняли большие усилия по перестройке математики без использования доказательств от противного, и можно только удивляться, сколь многое удалось спасти. Однако потери все же есть. Например, в такой математике все функции непрерывны.
Рассуждения интуиционистов строятся примерно так. На первый взгляд правдоподобно, что не-не-р — это то же самое, что р. Иначе эту мысль можно выразить так: верно в точности одно из двух
либо р, либо не-р.
Разумеется, если р относится лишь к конечному числу объектов, то это так и есть, и мы можем просто проверить р для каждого из имеющихся объектов. Закончив проверку, мы либо убедимся в том, что все они удовлетворяют р, и тогда р имеет место, либо найдем такой объект, который не удовлетворяет р, и тогда р неверно, т. е. имеет место не-р.
Но если объектов бесконечно много, такой перебор уже невозможен. Мы проверим р на любом количестве объектов, найдем, что оно верно для этих объектов, и все же не получим никакого способа узнать, не нарушается ли р для тех, для которых оно осталось непроверенным. Если не удастся найти доказательства р (или не-p), относящегося ко всем объектам, то все пропало. Мыслима и такая ситуация, когда р верно для каждого объекта, но каждый раз по разным причинам (нечто вроде бесконечного числа совпадений). Если так, мы не сможем опровергнуть р, но не сможем и доказать, поскольку нельзя написать бесконечно длинное доказательство.
В качестве примера рассмотрим известную гипотезу Гольдбаха: каждое четное число, большее 2, является суммой двух простых. Это утверждение не было ни доказано, ни опровергнуто. Если начать проверять его на первых четных числах, кажется, что оно верно:
4 = 2 + 2
6 = 3 + 3
8 = 3+5
10 = 3 + 7
12 = 5+7
14 = 3+11
16=5+11
18 = 5+13 20 = 7+13 22 = 3+19
24 = 5+19 26=3 + 23 28 = 5+23
30 = 7+23
С другой стороны, уловить здесь какую-то закономерность не удается. Весьма возможно, что никакой закономерности и не существует, а гипотеза тем не менее верна.
Сама эта возможность уже означает, что наше уверенное утверждение: либо верно р, либо верно не-р — относится скорее к метафизике, чем к математике. Оно основано на предположении, что бесконечно много объектов ведут себя так же, как и их конечное число. А нам уже известно достаточно примеров (особенно из гл. 9) странного поведения бесконечных множеств, чтобы признать такое предположение сомнительным.
Если это предположение неверно, то парадокс Рассела становится просто одной из теорем, которую нельзя ни доказать, ни опровергнуть. Конечно, и сам смысл слова «неверно» в таком контексте становится предметом исследования, ибо неясно, есть ли в нем какое-нибудь полезное содержание.
Интуициониста радуют высказывания типа «всякое четное число, меньшее 10'100, является суммой двух простых», и он согласен, что они либо верны, либо неверны. Но высказывание типа «всякое четное число есть сумма двух простых» с его точки зрения не может быть ни вер
ным, ни неверным; оно попадает в новую категорию истин сомнительных.
Менее радикальной кажется идея ограничить свободу образования множеств. В одной из разновидностей теории множеств 4 различают два типа объектов, подобных множествам. Первые называют классами-, они имеют элементы и во многом напоминают наивные множества. Однако класс не обязательно способен быть элементом другого класса. Тс классы, которые на это способны, являются множествами.
Это означает, что определение класса в форме С = {х | х обладает свойством Р}
нужно интерпретировать так: С есть класс всех множеств х, обладающих свойством Р. Если х обладает свойством Р, отсюда еще не следует, что х С С; мы не можем сделать такой вывод, если не знаем, что х — множество.
В рассуждении, которое привело к парадоксу Рассела, показывалось, что если В б В, то В само обладает тем свойством, которое определяет его элементы (а именно, не быть элементами самих себя), и, следовательно, лежит в В. В повой теории множеств к такому выводу прийти нельзя—ведь В может не быть множеством.
Тем самым мы поставили на место парадокс Рассела: он доказывает (методом от противного) всего-навсего то, что В не является множеством. В самом деле, если бы оно было множеством, парадокс вступил бы в действие, и мы бы пришли к противоречию.
Классы, которые не являются множествами, называют собственно классами. Парадокс Рассела доказывает, что они существуют. С другой стороны, о существовании множеств нам ничего не известно.
Единственный способ приобрести уверенность в их существовании — написать аксиомы, которые это утверждают. В простых аксиомах, необходимых всякой теории
множеств, говорится о том, что 0 является множеством, что объединение двух множеств есть множество и пересечение двух множеств есть множество. Таким путем Строится аксиоматическая теория множеств.
Фреге создал свою наивную теорию множеств по образцу поведения совокупностей реальных объектов. Мы не ждем от реального мира, что он станет противоречить самому себе (убеждение, которое может оказаться столь же необоснованным, как и многие другие взлелеенные человечеством принципы), поэтому мы надеемся, что теория Фреге непротиворечива. Напрасно, потому что это не так. Правда, в конечном итоге это случилось с ней потому, что она заблудилась и вышла за пределы реального.
С другой стороны, аксиоматическая теория множеств не претендует ни на какую связь с реальным миром. Прежде чем она сможет стать приемлемым фундаментом для математики, следует убедиться в ее непротиворечивости. Реальный физический мир не дает нам никакой уверенности на этот счет. Требуется доказательство непротиворечивости,
Программа Гильберта
Прежде всего нужно было решить, какие методы доказательства непротиворечивости считать допустимыми. Ведь ясно, что нельзя пользоваться методами, которые сами вызывают сомнения.
Давид Гильберт, который первым занялся этим вопросом, пришел к заключению, что удовлетворительным будет лишь такое доказательство, которое расчленяется на конечное число шагов (как мы теперь сказали бы, его может проводить компьютер). Не должно быть никакой неопределенности, каждый шаг должен быть совершенно ясен и все возможности учтены.
Кроме того, Гильберт понял, что для получения такого доказательства нужно отказаться от приписывания со
держательного смысла математическим символам и действовать чисто формально, как бы играя в некую игру по определенным правилам. Например, правило может говорить нам, что последовательность символов 1 + 1 допускается заменять символом 2. Если удастся показать, что никакая последовательность дозволенных ходов никогда не приведет к комбинации символов вида
0^0,
и если это будет установлено конечным числом конструктивных шагов, то тем самым будет получено доказательство непротиворечивости.
Если же комбинация 0=^=0 встретится в нашей игре, то приведшие к ней ходы можно интерпретировать как шаги доказательства того, что 0 0, и тогда аксиомати-
ческая теория множеств окажется противоречивой. С другой стороны, если аксиоматическая теория множеств противоречива, то существует доказательство того, что 0^=0; его шаги дадут нам те ходы, которые приводят к такой комбинации символов в нашей игре.
На основе этих соображений Гильберт сформулировал полную программу проведения такого доказательства. После этого, чтобы дать математике столь желанный прочный логический фундамент, оставалось лишь выполнить эту программу.
Гильберта интересовал еще другой вопрос: всякая ли задача может быть в принципе решена? Он возник в связи с убеждением интуиционистов, что это не так. Программа Гильберта предусматривала еще и получение ответа на этот вопрос. Он считал, что существует совершенно определенная процедура, позволяющая узнать заранее, разрешима или нет данная задача, и надеялся, что ее удастся найти.
В то время Гильберт был признанным лидером математического мира. Но один никому не известный молодой человек Курт Гёдель (инженер по образованию) пришел
к выводу, что Гильберт нс прав. В 1930 г. он направил в печать работу5, которая превратила программу Гильберта в руины. Другой великий математик Джон фон Нейман читал тогда курс лекций о программе Гильберта. Прочитав работу Гёделя, он тотчас перестроился и посвятил ей оставшиеся лекции.
Гёдель доказал две вещи:
1) если аксиоматическая теория множеств непротиворечива, то существуют теоремы, которые нельзя ни доказать, ни опровергнуть;
2) не существует никакой конструктивной процедуры, при помощи которой можно было бы доказать непротиворечивость аксиоматической теории множеств.
Первый результат показывает, что не всякая задача разрешима даже в принципе, второй полностью зачеркивает предложенную Гильбертом программу доказательства непротиворечивости. Говорят, что, услышав о работе Гёделя, Гильберт «очень рассердился».
В дальнейшем выяснилось, что нанесенный ущерб был даже больше, чем воображал Гёдель. Любая аксиоматическая система, достаточно обширная, чтобы содержать формализованную арифметику, страдает теми же недостатками, и, значит, в этом «виновата» не та или иная конкретная аксиоматизация, а сама арифметика!
Гёделезские номера
В этом и следующем разделах дается краткий обзор доказательства теоремы Гёделя. Те читатели, у которых кет желания в этом разбираться, могут спокойно их пропустить.
Начнем с простого вопроса: много ли существует арифметических формул? (Под «арифметической формулой» я понимаю любую комбинацию символов +, —, X,:, (,),=, 0, 1,2, 3, 4, 5, 6, 7, 8, 9.)
Ясно, что таких формул бесконечно много. Однако,
вспомнив о том, что говорилось в гл. 9, мы сразу спросим: а какова эта бесконечность — счетна или несчетна? Оказывается, множество таких формул счетно: существует биекция между ним и множеством N натуральных чисел.
Чтобы установить эту биекцию, начнем с того, что «закодируем» символы:
+ — ><:()= 0 1 2 3 4 56 78 9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
(под каждым символом стоит его код). Далее, чтобы закодировать цепочку символов, например
4 + 7=11,
образуем число
2’2-3*-515-77-119-139,
где 2, 3, 5, 7, 11, 13, ...— последовательность простых чисел, а показатели степени 12, 1, 15, 7, 9, 9 — коды символов 4, +, 7, = , 1, 1, составляющих нашу цепочку.
Таким способом каждой цепочке можно поставить в соответствие ее код, который является натуральным числом.
Поскольку всякое натуральное число единственным способом разлагается на простые множители, цепочку можно восстановить по ее коду. Допустим, например, что кодом является число 720. Разлагаем его на множители:
720 = 24-32-51.
Числа 4, 2 и 1 являются кодами символов :, —, +. Значит, 720 есть код цепочки
: - +
(хоть и не очень содержательная, но все же цепочка). Такие коды называют гёделевскими номерами^
Для более сложных цепочек номера становятся очень большими, но всякая цепочка имеет некоторый номер, и различным цепочкам отвечают разные номера. Расположив цепочки в порядке возрастания номеров, можно убедиться, что множество цепочек счетно.
В аксиоматической теории множеств у нас становится больше символов: добавляются С , U > П, { , }• Кроме того, появляются еще символы «переменных» х, у, z, ... Однако применима та же процедура: кодируем символы, затем при помощи простых чисел кодируем цепочки. Таким образом, в аксиоматической теории множеств множество цепочек тоже счетно.
Доказательства теорем Гёделя
В этом разделе мы будем «работать» с двумя различными системами: некоторой аксиоматической теорией множеств (обозначим ее М) и обычной арифметикой А. Система Л1 будет представлять собой формализацию арифметики. В М будут входить некоторые символы, из них мы будем строить цепочки. Правила обращения с этими цепочками мы узнаем из аксиом системы М.
Предположим, что система М устроена так, что в нее входят все арифметические символы, которые подчиняются тем же правилам, что и в арифметике; так, например, цепочка 2 + 2 = 4 имеет две интерпретации: а) как цепочка в М, лишенная всякого значения; б) как арифметическая формула. Далее, если некоторая последовательность допустимых преобразований цепочек в М привела нас, скажем, к цепочке 2 + 2=4, то соответствующая последовательность арифметических формул в А составит доказательство равенства 2 + 2 = 4.
В системе М имеются цепочки, содержащие одну числовую переменную х, например
х+1 = 1+х, х(х— 1) =хх—х, х+х=43, (*)
Именно такие цепочки нас особенно интересуют. Цепочки, содержащие одну числовую переменную для краткости будем называть сайнами.
Если а — некоторый сайн, a t — положительное целое число, то можно образовать новую цепочку [а : /], подставив в а вместо х число t (которое рассматривается адесь как цепочка символов 0, 1,2, 3, Пусть, например, а — сайн х+1 = 1 +х, а ?=31; тогда [ct: 31] — это цепочка 31 +1 = 1 + 31.
Каждый сайн имеет определенный гёделевский номер. Расположим их по порядку, и пусть
R(n)
есть n-й сайн. Тогда всякий сайн совпадает с некоторым R(n), отвечающим какому-то п.
Определим теперь в А множество К, состоящее из натуральных чисел, удовлетворяющих следующему условию: п£К. тогда и только тогда, когда цепочка [7? (п): и] недоказуема в М.
Выясним, к примеру, верно ли, что З^К. Для этого найдем R (3); пусть это будет сайн х + 4 — 0. Подставив в него 3 вместо х, получим 3 + 4 = 0. Если эта цепочка недоказуема в М, то 3 С К.
Теперь формулу х С К из А можно формализовать в М\ получится некоторая цепочка S в М. Она содержит одну числовую переменную и, значит, является сайком. Для любого конкретного значения п цепочка [S: п] является формальной версией арифметического утверждения п£ R.
Поскольку S —сайн, найдется такое q, что S=R{q\. Покажем, что цепочка
(1) недоказуема в М и что в то же время ее отрицание не-[/?(/7) : <?] (2)
тоже недоказуемо в М,
Если бы (1) можно было доказать в М, то в Л была бы верна ее интерпретация, поскольку М является формализацией А. Значит, q^K. Но, по определению множества Л, цепочка (1) недоказуема в М.
Если бы (2) можно было доказать в Л4, то в 4 было бы верным утверждение не - (q С Л')- Тогда q £ К, и неверно, что [A* (q) : q] недоказуема в М; значит, [R(q): q] доказуема в М. В предположении непротиворечивости М отсюда вытекает, что (2) недоказуема в М.
Итак, цепочка [R(q) : </] (вполне определенная цепочка в М) дает нам теорему, которую нельзя ни доказать, ни опровергнуть в М. Тем самым доказана первая теорема Гёделя.
«Распутав» цепочку [R(q) : 9], можно обнаружить, что она по существу как бы сама утверждает свою недоказуемость. Ведь она звучит примерно так: «эта теорема недоказуема», почти совсем как «это утверждение неверно». Однако высказывание «эта теорема недоказуема» нельзя формализовать в М, поэтому нам и приходится метаться из М в А и обратно.
Теперь попробуем доказать вторую теорему Гёделя. Пусть Т — цепочка [R(q) : q], которая, как мы видели, утверждает свою собственную недоказуемость. Пусть W — любая формула в М, утверждающая непротиворечивость М. Мы хотим показать, что W нельзя доказать в М.
Первая теорема Гёделя говорит: «если М непротиворечива, то Т недоказуема в М». Это высказывание можно выразить внутри системы М. «Л1 непротиворечива» — это наша формула W\ «Т недоказуема в М»— это сама цепочка Т, раз она утверждает свою недоказуемость. Значит, первая теорема Гёделя внутри системы М принимает вид
W влечет за собой Т.
Если бы W можно было доказать в М, то это позволило
бы доказать Т. Но мы знаем, что Т недоказуема; значит, нельзя доказать и №. Поскольку W утверждает непротиворечивость М, отсюда следует, что доказать непротиворечивость М, оставаясь в рамках самой этой системы 7И, невозможно. Это доказывает вторую теорему Гёделя.
Неразрешимость
Полное доказательство теорем Гёделя (включая подробное описание того, что понимается под «конструктивной процедурой») удовлетворяет самым высоким требованиям строгости6. Хотя вторая теорема означает полный крах программы Гильберта, первая теорема интереснее. Она показывает, что в самой обычной арифметике существуют утверждения Р, для которых нельзя доказать ни Р, ни не-Р. Такие утверждения называются неразрешимыми.
В каком-то смысле это подтверждает правоту интуи-ционистов, но лишь до тех пор, пока мы приравниваем «истинное» к «доказуемому». А доказательство теоремы Гёделя сохраняет силу и для интуиционистской математики.
Участь, постигшую проблему непротиворечивости арифметики, разделили с ней и некоторые другие из проблем, поднятых Гильбертом, например проблема разрешимости диофантовых уравнений. Диофантовым уравнением называется алгебраическое уравнение наподобие
х2 + </2 = гз/31
для которого ищутся целочисленные решения. Гильберт поставил задачу придумать такой метод, который позволял бы для каждого данного диофантова уравнения определять, имеет оно решение или нет. Как показал недавно Ю. Матиясевич7 (следуя более ранней работе Дэвиса, Путнама и Робинсона), такого метода не сущест
вует: вопрос о том, имеет или нет решение данное диофантово уравнение, может оказаться неразрешимым.
Из доказательства Матиясевича вытекает любопытное следствие: существует многочлен
Р(*ь х2...х2з)
от 23 переменных такой, что если вместо переменных подставлять в него положительные целые числа, будут получаться простые числа и только они. Выходит, что найдена «формула простых чисел»! 8 В принципе возможно выписать этот многочлен в явном виде, однако практически очень трудно сделать больше, чем описать процедуру, посредством которой можно было бы получить явную формулу. И главное, весьма маловероятно, что такая формула пригодится в теории простых чисел.
В гл. 9 мы упоминали о такой проблеме; является ли мощность с множества действительных чисел кардинальным числом, следующим за jf > ? В этом состояла так называемая гипотеза континуума. Проблему: верна или нет гипотеза континуума —• Гильберт включил в свой знаменитый список 23 наиболее актуальных, по его мнению, проблем математики (хотя первым этот вопрос поставил Кантор). Ответ был получен П. Коэном9 в 1963 г. и оказался таким: и да, и нет. Гипотеза континуума не зависит от других аксиом теории множеств. Вы можете добавить аксиому, утверждающую, что гипотеза континуума верна, и теория не станет от этого противоречивой (если она была непротиворечивой с самого начала!), а можете добавить аксиому, утверждающую, что гипотеза континуума неверна, и это тоже не нарушит непротиворечивости. Получился вариант неевклидовой геометрии 20 в.: отвергая гипотезу континуума, можно строить неканторовы теории множеств,
Эпилог
Быть может, следовало с самого начала понять, чтр программа Гильберта обречена на неудачу. Уж слишком она похожу на попытку поднять самого себя за шнурки ботинок! Существуют ли вообще знания, истинные в абсолютном смысле? Но в том-то и дело, что значение работы Гёделя выходит за рамки подобных умозрительных рассуждений: она доказывает невозможность арифметического доказательства непротиворечивости самой арифметики.
Это не значит, что нельзя найти другие пути доказательства непротиворечивости арифметики. И действительно, Генцен 10 доказал ее, но его методы основаны на трансфинитной индукции. Я не стану объяснять здесь, что это такое, но вопрос о непротиворечивости самой трансфинитной индукции остается открытым.
Итак, математика по-прежнему стоит на шатком основании, несмотря на все усилия укрепить его. Быть может в один прекрасный день кто-нибудь найдет такое неразрешимое противоречие, что рухнет все здание целиком. Но даже тогда найдутся неутомимые математики, которые, копаясь среди руин, что-то разыщут, как-то починят и вернут к жизни все, что смогут.
Истина состоит в том, что интуиция всегда будет сильнее логики. Если теоремы хорошо согласуются между собой, углубляют понимание и дают пищу любознательности, никто не решится отбросить их только потому, что они немного грешат против логики. В таких случаях всегда возникает ощущение, что можно изменить саму логику, а теоремы лучше не трогать.
Когда-то Гаусс назвал математику «королевой наук». Я скорее дал бы этому предмету титул короля. И даже если когда-нибудь обнаружится, что этот король голый, все равно он будет одет лучше, чем его придворные.
Примечания
Глава I. Математика в целом
1. Мне рассказали, что в голландском языке привилось как раз другое употребление: там, где мы говорим «множество», используется слово, соответствующее нашему слову «совокупность».
2. См. W. Sierpinski, On the congruence of sets and their equivalence by finite decomposition, Lucknow University Studies, 1954, а также E Kasner, J. Newman, Mathematics and the imagination, Bell, 1949.
3. Чтобы решить в радикалах алгебраическое уравнение
ап хп+... + а^х 4- По=О, нужно найти формулу, выражающую его корни через коэффициенты а0, аь ..., ап с использованием только операций сложения, вычитания, умножения, деления и извлечения корня. Примером служит стандартная формула корней квадратного уравнения
ах2+йх + с=0, имеющая вид
— b + Д/b2— 4ас
Было установлено, что для корней общего уравнения 5-й степени (и выше) такой формулы не существует. Доказательство проводится средствами теории Галуа и требует солидных познаний в области абстрактной алгебры. Подробнее см. Е. Artin, Galois theory, Notre Dame, 1959; I. T. Adamson, Introduction io field theory, Oliver and Boyd, 1964; Ian Stewart, Galois theory, Chapman and Hall, 1973.
(См. также: M. M. Постников. Основы теории Галуа,— М., Физмат-гиз, 1960.— Перев.)
Глава 2. Движение без перемещения
1. С. L. Dodgson, Euclid and his modern rivals, Macmillan, London, 1879, p. 48. (4. Л. Доджсон более известен советскому читателю под псевдонимом Льюиса Кэррола как автор книг «Алиса в стране чудес» и «Алиса в Зазеркалье».— Перев.)
2. Остальное можно найти в работах: F. Cajory, The history of
Zeno’s arguments on motion, American Mathematical Monthly, 22, 1915, E. Kasner and J Newman, Mathematics and the imagination, Bell, 1949; Russel, Mysticism and logic.
3 Поясним это утверждение. Пусть заданы три точки А, В, С (все три различные и не лежащие на одной прямой) и три расстояния а, Ь, с. Тогда существует не более чем одна точка, лежащая на расстояниях а от А, b от В и с от С. В самом деле, окружности радиуса а с центром А и радиуса Ь с центром В пересекаются не более чем в двух точках, которые находятся на разных расстояниях от С. Значит, не более чем одна из них находится от С на расстоянии с. Поскольку жесткие движения пе меняют расстояний, отсюда следует, что, зная, куда переходит какой-нибудь треугольник, мы знаем эго и про все остальные точки.
В 3-мерном пространстве понадобится еще одна точка, так как придется рассматривать сферы.
4. Это неудобство можно обойти, если писать преобразование справа; XT плп (Х)Т. Тогда можно, по определению, положить
(X)EF=((X)E)F,
и все станет па свои места: ЕЕ будет означать «сначала Е, затем F». К этому нужно немного привыкнуть (хотя такая запись для некоторых преобразований давно применяется, например п!). Матема тики часто пользуются этим приемом.
Глава 3. Кратчайшие пути в высшей арифметике
1. Хотя в нынешние времена мы впервые встречаемся с комплексными числами при решении квадратных уравнений вида
№+3=0,
когда обычная формула дает ответ х = + V—3, исторически комплексные числа впервые привлекли к себе внимание при решении ку бических уравнений.
Формула Тартальн для корней кубического уравнения
Xs + рх + q = 0
имеет вид
«-|/ ?+/£+£
В случае уравнения
х3 — 7х + 6 = 0 (,)
мы имеем р = —7, q — 6, и получается ответ
Юг з/Т ’
где
С другой стороны, уравнение (*) можно разложить на множители:
(х—1) (х—2) (х+3) =0,
и, значит, его корнями являются х=1, 2 и —3.
Чтобы «примирить» эти два результата, допустим, что с i можно обращаться, как с неким числом. Тогда можно извлечь кубические корни. В самом деле,
2i 3 • 2i 3 + 4i2 ( 8i3
1 + УТ/ = 1 + У~+ 3 + 3 УТ =
= 1-4 +
18 — 8
ЗТ/Т
i = — 3
10t зут
и аналогично
1 21 \3 о 10t'
Уз) зУ з '
Подставив эти значения кубических корней в выражения для х, получим
т. е. один из корней уравнения. А где два других? Они получатся при другом выборе значений кубического корня: в области комплексных чисел каждая величина имеет три кубических корня.
Итак, использование комплексных чисел позволило прийти к правильному результату в области действительных чисел. Это впечатляющее достижение подсказывало, что комплексные числа стоит изучать
2. Эта фраза — образец стиля современных школьных учебников.
3. Это проще простого. Мы вольны давать любые определения, ^ажно только потом строго их придерживаться. Во всяком случае умножение или вычитание натуральных или отрицательных чисел вводятся тем же методом: забудьте, откуда они возникли, действуйте по аналогии и затем убедитесь, что получаются согласованные результаты.
4. В понятии сравнимости есть нечто общее с конгруэнтностью треугольников: в обоих случаях не принимаются во внимание раз-
.чичия определенного вида. Треугольники одинаковы, если они получаются один из другого жестким движением, а числа — если дают один и тот же остаток при делении на фиксированный модуль.
5. Нетрудно видеть, что если k не является степенью числа 2, то 2'4-1—не простое. Быть может, именно это обстоятельство ввело в заблуждение Ферма. Из всех сделанных Ферма недоказанных утверждений только про одно известно, что оно неверно, и надо сказать, оно же — единственное, в котором Ферма сомневался.
6. Е. Т. Bell, Men of Mathematics, v. 1, Penguin Books, 1965, p. 73.
7. Cm. Hardy and Wright, An introduction to the theory of numbers, Oxford University Press, 1962, ch. 6
8. «Последняя теорема» Ферма (называется так потому, что это его последняя теорема, о которой еще неизвестно, верна она или нет) утверждает, что при целом и>2 уравнение
xn+</n=zn
не имеет ненулевых целочисленных решений. При ге=2 существует бесконечно много решений, например 32+42=52. Известно, что при л^25 ООО теорема верна (см. Selfridge and Pollock, Notices of the American Mathematical Society, 11, 1964, p. 97).
Глава 4. Язык множеств
1. Символ € представляет собой стилизованный вариант греческой буквы е (эпсилон) — начальной буквы слова «элемент». Во многих книгах (особенно более старых) использована сама эта буква.
2. А. А. Милн. Винни-Пух и все остальные. М., 1960, гл. 7.
3. Это снова последняя теорема Ферма См. примечание 8 к гл. 3.
4. В некоторых арифметических теориях 0 определяется как 0, 1 — как {0}, 2 — как {0,{0}} и т. д. Поэтому утверждение, что 0 и 0 — разные вещи, не совсем верно. Однако мы думаем о них, несомненно, по-разному, а здесь нам только это и важно.
5. Символ с произошел от но был специально искривлен, чтобы напомнить, что речь идет не о числах, а о множествах. В некоторых книгах вместо него используется символ с.
6. Обозначения N, R и С происходят от начальных букв латинских названий соответствующих чисел. Буква Z — от немецкого слова Zahl — число. Обозначение Q, я думаю, произошло от слова quotient -— отношение. Иногда вместо N используют букву Р — от слова positive (положительный).
7. Рассмотрим множество С = {{1, 2},{3, 4}}. Тогда 1 С {1, 2} и {1, 2}ёС, но ЙС.
8. Единственное место, где я видел напечатанными таблицы принадлежности,— это статья «Venn Vili They Ever Learn?» Фрэнка Эллиса (Frank Eliis, Manifold 6, 1970, p. 44).
9. Булева алгебра применяется при разработке логических схем компьютеров (см., например, Rutherford, Introduction to lattice theory, Oliver and Boyd, 1965, pp. 31—40, 58—74). Кроме связи с теорией множеств, она имеет мало отношения к основному руслу математики. Тем не менее существует глубокая теория булевых алгебр. См. Р. R. Haimos, Lectures on Boolean algebras, Van Nostrand, 1963.
10. Существует даже такая игра «visli» (сокращение от «vicious circle»- порочный круг): берут наугад какое-нибудь слово в толковом словаре, из его дефиниции выбирают какое-нибудь другое слово и т. д. Выигрывает тот, кто раньше вернется к исходному слову.
I1. Первое удовлетворительное определение упорядоченной пары было дано К. Куратовским в 1921 г. Трудность состояла в том, чтобы избежать ссылок на способ изображения такой пары в виде (а, Ь). Нельзя говорить «а — левый элемент», потому что «левый» не является понятием теории множеств. Ранние философы совершенно запутались в этом вопросе (см. Russel, The principles oj Mathematics, 1903).
«Является ли упорядочение свойством а?» Нет, оно зависит также и от Ь, ибо, скажем, упорядочения (1, 2) и (3, 1) различны. «Является ли оно свойством й?» Нет, по той же причине. «Тогда это свойство а и Ы» Тоже нет, потому что а и b не отличается от b и а, и тогда получается, что (а, Ь) и (Ь, а) — одно и то же.
Требуется как-то избавиться от симметрии между а и Ь. Философы оказались здесь бессильны, потому что не понимали разницы между х и {х}. Они не хотели различать эти вещи. Однако стоит только осознать эту разницу, как открывается целый ряд разнообразных путей решения задачи. Например, можно, по определению, положить
(а, Ь)={{а}, {а, Ь}}.
Асимметрия в правой части гарантирует, что (а, Ь) равно (с, d) тогда и только тогда, когда а —с и b=d-, это вытекает из элементарных теоретико-множественных соображений. Поскольку в этом состоит единственное важное свойство упорядоченных пар, такое определение является вполне подходящим, хотя психологически не особенно привлекательным.
Глава 5. Что такое функция?
1. Используя понятие упорядоченной пары можно дать чисто теоретико-множественное определение функции. Обычно оно с трудом 372
воспринимается учащимися, ибо па первый взгляд лишено всякой связи с идеей «правила» и, кроме того, очень непривычно, поскольку до этого они встречались лишь с числовыми функциями, которые задавались формулами.
Проблема состоит в том, чтобы построить единый объект f, который однозначным образом связывает с каждым элементом х области определения соответствующее f(x) Для каждого конкретного х это достаточно хорошо осуществляет упорядоченная пара (*,
если, например, у нас есть пара (7, 24), то мы знаем, что /(7) =24. Чтобы задать f на всей области определения D, можно воспользоваться множеством, состоящим пз всех пар (х, f(x)), где х пробегает всю область D.
Если Т — множество, в котором лежат все f(x), то множество упорядоченных пар (х, f(x)) является подмножеством декартова произведения D'/. T. В силу свойства (3) функций, это подмножество удовлетворяет двум условиям:
1) для всякого х £ 7) существует y(LT такое, что пара (х, у) содержится в рассматриваемом подмножестве;
2) если (х, у) и (х, г) содержатся в этом подмножестве, то f/=z.
Условие (1) говорит о том, что [(х) определено для всех х, а условие (2) обеспечивает однозначность.
Теперь начнем с конца. Для заданных множеств D и Т определим функцию из D в Т как подмножество f произведения D X Т, удовлетворяющее условиям 1 и 2. Если нам задано х С D, мы найдем f (х) так: сначала найдем какое-нибудь у, для которого (х, у) g f (это возможно в силу 1), а затем положим
f(x)=y,
что однозначно определяет f(x) в силу условия 2.
Иными словами, любое «правило» эквивалентно некоторому множеству упорядоченных пар. Это ие сразу очевидно (было бы ужасно, если бы все на свете стало очевидным), однако, как говорил один известный политик, «это делает свое дело».
Дальнейшую информацию можно получить из книг: Halnios, Naive set theory. Van Nostrand, 1964; Hamilton and Landin, Set theory, Prentice Hall, 196 k
Глава 6. Основы абстрактной алгебры
1. См. примечание 3 к гл. 1.
2. См. Rouse Ball, Mathematical recreations and essays, Macmillan 1959, ch. 12. (См. также: Ф. Кымпан. История, числа л.— М„ Наука, 1971, с. 214,— Перев.)
3. Линдеман доказал свою теорему в 1832 г. См. Stewart, Galois theory, Chapman and Hall, 1973, p. 74. (См. также указанную выше книгу Ф. Кымпана.— Перев.)
4. Читателям, которые незнакомы с комплексными числами, рекомендуется обратиться к книге W. W. Sawyer, Mathematician’s delight. Penguin Books, 1943. (См. также: А. И. Маркушевич. Комплексные числа и конформные отображения.— М., Физматгиз, 1960.— Перев.)
5. См. de Bruijn, A Solitaire game and its relation to a finite field, Journal of recreational Mathematics, 5, 1972, p 133.
Глава 7. Симметрия; понятие группы
1. См., например, Ledermann, Introduction to group theory, ОИ« ver and Boyd, 1973.
В журнале Bulletin of the London Mathematical Society l,pp. 79—• 88, 1969, опубликована статья Конвея (J. H. Conway) под названием «Группа порядка 8 315 553 613 086 720 000». Такую группу едва ли можно определить при помощи таблицы умножения! (Однако не следует думать, что математики специально проводят время, строя все большие и большие группы. Сам по себе размер группы Конвея неважен, важны те несколько замечательных свойств, которыми она обладает.)
2. См. Klein, Lectures on the icosahedron and the solution of equations of the fifth degree, Kegan Paul, 1913 (имеется также издание 1956 г.).
3. См. Г. С. М. Кокстер. Введение в геометрию. Пер. с англ.— М., 1966, с. 404. В этой интересной книге содержатся также сведения о 17 типах симметрии на плоскости (см. с. 85—99).
Глава 8. Аксиоматика
1. В реальном мире точки в конце концов становятся настолько близкими, что различить их невозможно. Однако можно пустить в ход алгебру. Рассмотрим для простоты радиальную прямую и предположим, что радиус Г равен d. Любая точка, лежащая строго внутри Г, находится от центра на некотором расстоянии е, где е строго меньше d. Отсюда следует, что точка, находящаяся от центра на расстоянии, скажем, (e+d)/2, все еще лежит строго внутри Г, хотя уже дальше от центра, чем на е. В самом деле,
d — -j- (е + d) = -у (d — е) > 0, -у- (е + d) — е = (d — е) > 0.
2. У. У. Сойер. Прелюдия, к математике. Пер. с англ.— М., 1965, с. 135.
Глава 9. Счет. Понятие о бесконечном
1. С точностью до некоторых теоретико-множественных трудностей, о которых пойдет речь в гл. 20.
2, Отнюдь не без тяжкого труда! См. Hamilton and Landin, Set theory, Prentice Hal!, 1961, pp. 133—238.
3. Birkhoff and MacLane, A survey of modern algebra, Macmillan, 1963, p. 362.
Глава 10. Топология
1. В предположении, что все материалы, из которых сделаны эти предметы, имеют толщину, а все внутренние полости чем-нибудь заполнены, получим такую классификацию: А, Е, G, 1 — шары; С, D и F — заполненные торы; В, Н — двойные заполненные торы. Если (как это чаще бывает в реальной жизни) A, D и Е полые внутри, а коробка / пустая, то различных топологических типов становится больше: А, Е, I — сферы; G — по-прежнему шар; С и F— заполненные торы; D — полый тор; В и Н — по-прежнему двойные заполненные торы. Если придумать еще больше подробностей, например дырочки в хлебе, придется делать еще больше различий.
2. У Дж. Гамова есть научно-фантастический рассказ (G. Ga-mow, The heart on the other side, in The expert dreamers, Gollancz, 1963), в котором предполагается, что реальная Вселенная неориенти-руема. Герой пытается произвести революцию в обувной промышленности, но попадает в беду, когда все белки его организма превращаются в свои зеркально симметричные формы.
Ориентируема или нет физическая Вселенная, сказать трудно. Дело здесь в том, что ориентируемость — это такое свойство, которое топологи называют «глобальным»: чтобы его обнаружить, нужно посмотреть на все пространство. Лента Мёбиуса локально почти не отличается от цилиндра: вблизи каждой точки их свойства практически одинаковы. Вселенная так велика, что у нас очень мало сведений о ее глобальной структуре. Но если астрономические наблюдения, о которых говорилось в конце гл. 8, подтвердятся, то она, скорее всего, неориентируема!
Глава 11. Умный в гору не пойдет
1. См. Ore, The four-colour problem, Academic Press, 1967.
2. [По-видимому, автор настоящей книги был сильно огорчен, когда узнал, что проблему четырех красок удалось решить при по
мощи компьютера; см. К. Appel and W. Flaken, Every planar map is four colorable. Bulletin of the American Mathematical Society, 82, 1976. См. также: Наука и жизнь, № 3, 1979, с. 80.— Перев.)
Глава 12. Топологические инварианты
1. См. Е. С. Zeeman, Introduction to topology, Penguin Books. Я признателен проф. Зимапу за разрешение изложить здесь некоторые его идеи.
2. См. статьи Рингеля и Янгса в Proceedings of the National Academy of Science (USA), 1968, а также книгу: A. T. White Graphs, groups and surfaces, Amsterdam, London and New York, 1973. (Ha русский язык переведена книга Г. Рингеля «Теорема о раскраске карт».— М., 1977. См., кроме того, примечание 2 к гл. 11.— Перев.)
Глава 13. Алгебраическая топология
1. Другой важный класс алгебраических инвариантов образуют группы гомологий, впервые увидевшие свет в рудиментарной числовой форме под названием числа Бени.
Глава 14. В гиперпростраиство
1. См. К. Рурк, Б. Сандерсон. Введение в кусочно линейную топологию. Пер. с англ.— М., 1974.
Глава 15. Линейная алгебра
1. Учебников по линейной алгебре очень много. Хорошее несложное введение имеется в книге У. Сойера «Путь в современную математику». (Пер. с англ.— М., 1972.) С практи щекой точки зрения много полезного содержится в книге: Fletcher, Linear algebra through its applications, Van Nostrand, 1973. (См. также: А. И. Мальцев. Основы линейной алгебры.— М., Наука, 1970; А. Г. Курош. Кура высшей алгебры.— М., Физматгиз, 1963.— Перев.)
2. У. У. Сойер. Прелюдия к математике. Пер. с англ.— М., 1965, гл. 8.
Глава 16. Вещественный анализ
1. Подозрительно нечеткие фразы типа «сколь угодно малый» или «достаточно большой» иа самом деле имеют вполне точный смысл. Первая означает, что, каково бы ни было положительное число е, мы можем сделать Ьп—1 меньше е. Для этого нам нужно
взять п большим некоторого числа N, зависящего от е. Таким образом, точная формулировка сходимости последовательности такова: hn стремится к пределу I, если для всякого 8>0 существует такое N, что при всех n>N
2. Перестановка членов ряда предполагает справедливость такого закона, который нарушается даже для некоторых сходящихся рядов,— это наглядно демонстрирует приведенный парадокс!
Для сходящихся рядов с положительными членами перестановка членов допустима.
3. Как и в примечании 1, от кажущейся нечеткости можно избавиться, если пользоваться обычным формальным определением: функция f непрерывна в точке х, если для всякого е>0 найдется такое б>0, что при
|х-р| <6 мы имеем
Отсюда понятно, почему учащиеся считают анализ трудным. Ведь такое определение непрерывности весьма далеко от интуитивного представления о непрерывной кривой как «состоящей из одного куска». Однако е-6-определение окупается тем, что позволяет доказывать непрерывность различных функций, таких, как х2 или sin х; поэтому его и применяют. Придумать более простой подход к этому вопросу, не впадая при этом в серьезные логические ошибки, никому пока не удалось. Отсюда, разумеется, не следует делать вывод, что применяемая сейчас теория непрерывности — последнее слово в этой области.
Глава 17. Теория вероятностей
1. См. W. Weaver, Lady Luck, Doubleday, 1963, и D. Huff, How to take a chance, Penguin Books, 1965.
2. Рассмотрим, к примеру, опыт, состоящий в том, что выбирается наугад число на действительной прямой. Вероятность выбрать любое конкретное число, скажем 2 или л, равна 0. Тем не менее это событие — выбор числа 2 или числа л — не является невозможным.
Глава 18. Компьютеры и их применение
1. Большое количество интересного материала имеется в сборнике Computers and computation, Freeman, San Francisco.
2. По поводу, языка ФОРТРАН см. Kreitzberg and Schneiderman,
The elements of Fortran style, New York, 1972, или McCracken, A guide to Fortran programming, New York, 1961. По поводу языка АЛГОЛ см. Wooldridge and Ratcliffe, An introduction to Algol programming, English Universities Press, 1963.
Глава 19. Применения современной математики
1. См., например, Allen, Mathematical analysis for economists, Macmillan, 1970, и A. Battersby, Mathematics in Management, Penguin Books, 1966.
2. Подробнее об этом см. в статье Ф, Дайсона «Математика в физических науках».— Математика в современном мире, М., 1967, с. 111—127. (Сборник представляет собой перевод на русский язык тематического номера журнала Scientific American.— Перев.)
3. См. R. Tom, Stabilite structurelie et morphogenese, Reading, Massachusetts, 1972 (готовится английский перевод).
4. См. Poston and Woodcock, Zeeman's catastrophe machine, Proceedings of the Cambridge Philosophical Society, 74, 1973, pp. 217—226. (На русском языке описание машины Зимана приводится в журнале «Наука и жизнь», 1977, № 12, с. 82—87. Кроме того, готовится русский перевод посвященной теории катастроф книги Т. Постона и Я. Стюарта «Теория катастроф и ее приложения».— Перев.)
5. Большое количество сделанных компьютером рисунков катастроф приводится в книге: Woodcock and Poston, A geometrical study of the elementary catastrophes, Lecture Notes in Mathematics, Springer, 1974. (См. также T. Брекер, Л. Ландер. Дифференцируемые ростки и катастрофы. Перевод с англ.— М., 1977.— Перев.)
Глава 20. Основания математики
1. См. A. Phillips, Turning a surface inside out, Scientific American, May 1966, pp. 112—120.
2. Об их именах мы скромно умолчим!
3. Который бреет всех тех, кто сам не бреется. Кто побреет брадобрея?
4. А именно, теория фон Неймана — Бернайса — Гёделя. См. Bernays and Fraenkel, Axiomatic set theory, North Holland, 1958, p. 31
5. Uber forma! unentscheidbare Satze der Principia Mathematica und verwandter Systeme I, Monatshefte file Mathematik und Physik 38, 1931, pp>. 173—198. См. примечание 6.
6. Статья Гёделя вместе с комментариями вышла под оригинальным названием в английском переводе (Oliver and Boyd, 1962),
7. См. 10. В. Матиясевич. Диофантовость перечислимых множеств. ДАН СССР, 191, 1970, с. 279—282. Диофантово представление множеств простых чисел. ДАН СССР, 196, 1971, с. 770—773.
8. На поиски формул, дающих все простые числа или хотя бы принимающих только простые значения, были затрачены огромные усилия. Это пытался сделать Ферма, предложивший формулу 22п+1, а также Эйлер. Его формула
n2-79п + 1601
принимает простые значения при п=0, .... 79 (однако при я=80 получается составное число). Разные истолкования слова «формула» дают большой простор всякого рода «жульничеству». См. об этом Dudley, History of a Formula for Primes, American Mathematical Monthly 76, 1969 p. 23.
Такие формулы вряд ли пригодятся при изучении простых чисел, потому что из них мало что можно увидеть: как правило, они еще более «неподатливы», чем простое бесформульное определение. Результаты Матиясевича свидетельствуют скорее о сложности многочленов, чем о «доступности» простых чисел.
9. На самом деле Гёдель доказал, что гипотеза континуума не приводит к противоречивости теории множеств (см. К. Гёдель, Совместимость аксиомы выбора и обобщенной континуум-гипотезы с аксиомами теории множеств.— Успехи математических паук, 3, 1948, Кб 1, с. 96—149). Коэн же доказал, что предположение о неверности гипотезы континуума тоже не приводит к противоречиям (П. Дж. Коэн. Теория множеств и континуум-гипотеза. Пер. с англ.— М., 1969).
10. См. Mendelson, Introduction to mathematical logic, Van Nostrand, 1964.
Обозначения
(mod с) € сравнимость (целых чисел). по модулю с. принадлежность (элемента множеству). множество, состоящее из элементов ...
W-J 0 с N Z R С и л / 5' лхв (а, Ь) R’ х! f-.D-+T fg Id К л W RM £ Ж / х', X-1 «0 • а^₽ а<р множество всех х таких, что ... пустое множество. включение множеств. множество натуральных чисел. множество целых чисел. множество действительных чисел. множество комплексных чисел. объединение. пересечение. разность (множеств), дополнение множества S. декартово произведение множеств, упорядоченная пара. евклидова плоскость. х факториал (= 1 -2 - 3 •... (х— 1) • х). функция [ из D в Т. композиция функций. тождественная функция па D. множество чисел, которые можно построить» 3,14159... множество целых чисел, сравнимых с х. множество многочленов от переменной х. знак суммирования. операция в группе. единичный элемент группы, элемент, обратный х. бесконечные кардинальные числа. неравенство для мощностей. строгое неравенство для мощностей.
с е И мощность множества действительных чисел 2.7J828... абсолютная величина х (=л, если х^О, =— х
Г В Р x(S) l(N) [-.] Р*<7 М R3, R4, лп(3) С 5) (?) (?) если х<0). число граней карты. число вершин карты. число рсбер карты. эйлерова характеристика поверхности S. эйлерова характеристика графа N. наибольшее целое, не превосходящее... композиция путей. гомотопический класс пути р. Фундаментальная группа пространства 3. К , R" евклидовы пространства размерности 3, 4, 5, п. п-я гомотопическая группа пространства S. матириа. вектор-столбец. вероятность события Е. биномиальный коэффициент.
В м А [а :/] R(n) множество Рассела. аксиоматическая теория множеств. обычная арифметика. результат подстановки 1 в а n-ii сайн в гёделевской нумерации.
Оглавление
Предисловие к русскому изданию 3
Предисловие 6
Благодарности 8
Глава 1. Математика в целом 9
Глава 2. Движение без перемещения 18
Глава 3. Кратчайшие пути в высшей арифметике 38
Глава 4. Язык множеств 58
Глава 5. Что такое функция? 82
Глава 6. Основы абстрактной алгебры 98
Глава 7. Симметрия: понятие группы 122
Глава 8. Аксиоматика 145
Глава 9. Счет. Понятие о бесконечном 162
Глава 10. Топология 184
Глава 11. Умный в гору не пойдет 199
Глава 12. Топологические инварианты 214
Глава 13. Алгебраическая топология 231
Глава 14. В гиперпространство 244
Глава 15. Линейная алгебра 263
Глава 16. Вещественный анализ 280
Глава 17. Теория вероятностей 297
Глава 18. Компьютеры и их применение 312
Глава 19. Применения современной математики 329
Глава 20. Основания математики 351
Примечания 368
Обозначения 380
Ян Стюарт
КОНЦЕПЦИИ СОВРЕМЕННОЙ МАТЕМАТИКИ
Редактор Л. С. Румянцева
Мл. редактор Т. С. Капелян
Худож. редактор Ю. С. Сергачев
Техн, редактор М. Н. Кислякова
Корректор В. В. Неверко
ИБ 621
Сдано в набор 04.07.79. Подписано в печать 20.11.79. Формат 70Х108’/з2. Бумага типогр. № 2. Гарнитура литературная. Высокая печать. Усл. печ. л. 16,8. Уч.-изд. л. 15,52. Тираж 35 000 экз. Изд. № 77-127. Зак. 2386. Цена 75 коп.
Издательство «Вышэйшая школа» Государственного комитета Белорусской ССР по делам издательств, полиграфии и книжной торговли. 220048, Минск, Парковая магистраль. II.
Полиграфический комбинат им. Я. Кол аса Государственного комитета Белорусской ССР по делам издательств, полиграфии и книжной торговли. 220005, Минск, ул. Красная» 23.
Стюарт fl.
С88 Концепции современной математики. /Пер. с англ. Н. И. Плужниковой и Г. М. Цукерман.— Мн Выш. школа, 1980.— 384 с., ил.
75 к.
В увлекательной форме с помощью множества примеров рассмаг риваются цели, методы, проблемы и области применения многих ва нейших отраслей современной математики. Для понимания основы; идей достаточно знания школьного курса математики.
Предназначена для широкого круга читателей.
с 2020 009 98—70 1702010000
М 304(05)—80
ББК 22.1
51