Текст
                    Кибернетический
сборник
НОВАЯ СЕРИЯ
ВЫПУСК
3
Сборник; переводов
Под редакцией
А. А. ЛЯПУНОВА И О. Б. ЛУПАНОВА
ИЗДАТЕЛЬСТВО «МИР»
Москва 1966


Научный совет по кибернетике УДК 519.05 Академии наук СССР Третий выпуск новой серии кибернетических сборников состоит из двух разделов: математические вопросы и математическая лингвистика. Первый из них открывается работой А. Альберта по теории конечных полей — важ- важному разделу алгебры, находящему широкое применение в теории кодирова- кодирования. Теория кодирования представлена статьями известных специалистов — Р. Галлагера и В. Истмена. Остальные статьи этого раздела посвящены тео- теории автоматов и теории оптимальных процессов. Раздел «Математическая лингвистика» включает работу Н. Хомского и М. Шютценберже по алгебраи- алгебраической теории контекстно-свободных языков. Сборник рассчитан на научных работников, инженеров, аспирантов и студентов различных специальностей, занимающихся и интересующихся ки- кибернетикой в ее математическом аспекте, Редакция литературы по математическим наукам
Математические вопросы
Конечные поля !) А. А. Ал ьберт 1. Число элементов. Поле, состоящее из конечного числа эле- элементов, называется конечным полем. Конечное поле, состоящее из ц элементов, будем обозначать символом Рд. Единичный элемент поля Р порождает подполе поля Р, ко- которое называется простым подполем. Простое подполе конеч- конечного поля Ря с необходимостью само конечно и представляет собой поле Р A) т. е. фактор-кольцо кольца К целых чисел по модулю (р), где р — характеристика поля Ря и (р) означает главный идеал, порожденный простым числом р. Как известно, элементы поля /?р можно представить целыми числами О, 1, ..., р—1, B) где каждое число а представляет класс вычетов а+(р), со- состоящий из всех целых чисел вида <х + Хр. Напомним, что для каждого а6 Яр справедливо свойство Ферма = а, C) так как множество Яр всех ненулевых элементов поля Яр является группой порядка р — 1. Каждое конечное поле К = РЯ есть векторное пространство над его простым подполем Яр. Так как К конечно, то и его размерность п над /?р конечна. Отсюда К^и^р+1... +ипКр, D) т. е. каждый элемент к 6 К единственным образом представим в виде пип, E) А1Ь е г 1 А. А., Рипс1атеп1а1 сопсер1з о! Ы&Нег а!деЬга, СЬ.. V, 1956.
А. А. Альберт где ^1, ..., 5п€ Нр. Так как &,..., ^п независимо друг от друга пробегают значения ряда B), то к принимает рп значений. Та- Таким образом, доказана Теорема 1. Конечное поле К состоит из ц=рп элементов, где р есть характеристика поля К, а п — степень поля К над /?р. 2. Существование и единственность. Ненулевые элементы любого поля К образуют мультипликативную группу /С*. Если К = РЯ, то группа /С* имеет порядок т = <7—1, и так как поря- порядок подгруппы является делителем порядка группы, то каждый элемент группы К* удовлетворяет уравнению хх=*1. Но в та- таком случае справедлива Теорема 2. Каждый элемент поля Ря является корнем уравнения F) Докажем теперь существование и единственность поля Ря. Теорема 3. Поле К разложения уравнения F) над Яр есть конечное поле, состоящее из д=рп элементов. Каждое поле Ря изоморфно полю К. Так как ^=рп = 0 в /?ф, то }'(х) =^~1—1= — 1 не имеет об- общих корней с 1(х). Отсюда следует, что полином 1(х) сепара- бельный (т. е. полностью распадается на различные линейные множители) и в поле разложения К имеет ц различных корней = 0, B2=1, ..., а^, G) Если а\ = а1 и ад, = а„ то (аг-а;-)9 = аг-а^ и тогда любое про- произведение Ь1...Ьт ненулевых корней уравнения !(х)=0 есть снова ненулевой корень этого уравнения. Таким образом, ка- каждый элемент поля К=Яр{аи ..., ая) *) есть линейная функ- функция 6 = 6202+...+69Яд Для ?2, ..., 1я^Кр и 1? = ^- Но тогда Ь? = Ъ9,а2-\- ... -\-Ъддад = к, и, значит, каждый элемент поля /С есть корень уравнения /(я)=0. Отсюда следует, что К содер- содержит в точности д элементов и К = РЯ. Если Рд — произвольное поле, которое состоит из ц элементов, то можно предположить, что Рд имеет то же самое простое подполе /?р, что и К. По тео- теореме 2 Рд^К'^эЦ, где К' есть поле разложения над Яр урав- 1) Символом КР(аи ..., ая), как обычно, обозначено расширение просто- простого поля /?р, полученное путем присоединения к нему всех корней G) урав- уравнения F). —Яриж. перев.
Конечные поля 9 чения }(х)=0. Но по только что доказанному /С' имеет ц эле- элементов и потому К = Рд. Известно, однако, что все поля раз- разложения уравнения /(л;)=0 изоморфны, и потому наш резуль- результат доказан. 3. Циклическая группа Рд. Множество Рд всех ненулевых элементов поля Ря образует абелеву группу порядка т = <7—1- Пусть е — показатель группы Рд, т. е. наибольший из порядков всех элементов группы /у Тогда хг=\ для каждого х^Рд, так как порядок любого элемента конечной абелевой группы является делителем показателя группы. Но уравнение степени е имеет в Рд не более е корней, и уравнение хг=1 имеет ц— 1 различных корней. Отсюда е ^ т ^ е, а потому е=т. Из сказан- сказанного следует, что Рд — циклическая группа, и справедлива Теорема 4. Пусть К = РФ где <7=рп = г+1. Тогда /С = = Кр(у) 1)у где у — первообразный корень степени т из единицы и ненулевые элементы поля К суть степени 1, у, у2, ..., ух~х элемента у. Мультипликативный порядок р любого ненулевого элемента к поля К = РЯ называется периодом элемента к. Поэтому период элемента к есть делитель числа х — порядка группы /> и мы будем говорить, что элемент к принадлежит р. Элемент к назы- называется первообразным элементом поля Рд, если к принадле- принадлежит т. Следовательно, элемент к является первообразным эле- элементом в том и только в том случае, когда к=у^у где \1 взаимно просто с х. Число таких показателей \х есть значение функции Эйлера ф(т), и полученный результат можно сформулировать следующим образом. Теорема 5. Пусть Ря — поле, состоящее из ц~рп элемен- элементов, и х = 9—1- Тогда в поле Ря имеется ф(т) первообразных элементов. 4. Первообразные корни по модулю т. Теория первообраз- первообразных корней по модулю т нужна для изучения степени конеч- конечного поля, заданного корнем из единицы. Рассмотрим поэтому общий случай кольца /?т = #—(#?), где целое число т>1. Обозначим через Нт множество тех классов вычетов &+{т)у которые определяются числами §, взаимно простыми с т. То- Тогда #*т будет абелевой группой порядка ф(т). Если !) Символом /?Р(г/), как обычно, обозначено простое расширение поля , полученное присоединением одного единственного элемента у. Ниже в том же смысле употребляется символ Р<г{Ь). — Прим. перев.
10 Л. Л. Альберт циклическая группа и у — такое целое число, что у+[(гп) поро- порождает группу $т> то мы будем называть у первообразным кор- корнем по модулю т. Случаи, когда/?т — циклическая группа, опи- описываются следующей теоремой. Теорема б1). Группа Нт будет циклической тогда и толь- только тогда, когда т = 2, 4, рп, 2рп, где р — нечетное простое число. Существует такой нечетный первообразный корень б по модулю любого нечетного простого числа р, что бр~! ф 1 (тойр2). Ка- Каждый такой первообразный корень б является также первооб- первообразным корнем по модулям рп и 2рп для любого целого поло- положительного числа п. Действительно, в случае если тф2п, рп, 2рп, можно напи- написать т = аЬ, где а и Ь взаимно просты и а>2, Ь>2. Так как ф(Рп) =рп~1(Р — 1) является четным числом, если р нечетно или если /? = 2, я>1, то мы видим, что ф(а) четно, каково бы ни было а>2. Но тогда наименьшее общее кратное чисел ф(а) и фF) есть некоторое целое у<у(аЬ). Если бит взаимно просты, то бф(а)=1 (той а) и бф(Ь)=1 (тос! Ь), так что 6у= =1 (той а) и бу=1 (той Ь). Но тогда бу=1 (той аЬ), показа- показатель абелевой группы Нт не превосходит у и 7?т—не цикличе- циклическая группа. Отсюда т=рп, 2рп, 2п. Группы /?2 и /?4 — циклические и б= — 1 при т = 4. Если у — любое нечетное целое, то для к—\ справедлива формула (8) т. е. */2=1 (той 8) при всех нечетных целых у. Если она спра- справедлива для некоторого к, то у2 — 1 + #2 и потому у2 +1 = = (у2*J==1+2?2й+Ч?222А+4=1+2*+3(^ + 2й+У). и, значит, сравнение (8) справедливо для всех целых к. Но тогда показа- тель группы/?тдля т = 2п>4 не превосходит 2 ~ =уфB ) и — не циклическая группа. Положим теперь т=рп, где р — нечетное простое число и . Заметим, что если (9) то а = о-\-ср•", аг=о-\-р ср + ••• -\~(срк)р и, значит, а ^о [топ р )• (Ш) 1) Теорему б можно найти в любом руководстве по теории чисел, и мы сохраняем здесь ее доказательство только для полноты изложения. — Прим. перев.
Конечные поля 11 По теореме 4 существует первообразный корень р по модулю р. Тогда, каково бы ни было целое а, б=Р + ар есть первообраз- первообразный корень по модулю р, и(>р — 6 = ф-\-ар)р— ($-\- ар)==$р — — р — ар (той р2). Таким образом, или р? — Р^О (той р2) и мы полагаем а = 0, или Э^ — Э^О (той р2) и 8Р — бфО 1^ (тос1р2), если 1<1а^р—1. Мы доказали существование первообразного корня б по модулю р, такого, что A1) где й ф 0 (той р). Из биномиальной теоремы следует, что A2) В случае 1 = 1 сравнение A2) принимает вид (той р3). Согласно равенству A1), это частный случай формулы A3) при /=1. Но, согласно A0), из сравнения A3) для данного зна- значения / имеем (р1)р^1( ^)Р( 1+г) A4) и, чтобы получить сравнение A3) для /+1., мы используем сравнение A2) при * = /+1. Это показывает, что сравнение A3) справедливо при всех значениях/. Но тогда если 5= (р — 1)рп~2, то 6*=1+рп-1A ф 1 (то&рп). Пусть г—порядок того класса вычетов, который содержит б по модулю рп. Тогда б'=1 (тос1р) и, значит,'/ кратно р—1. Но ф(рп) =рп-!(р—1} кратно ^, и потому г=рк(р— 1), где к •< п—1. Из только что доказанного видно, что к = п—1 и потому б имеет порядок ср(рп) по модулю рп, а группа 1?т циклична, если т — рп и р — нечетное простое число. Одно из чисел б или б+рп нечетно и оба являются первообразными корнями по модулю рп; таким образом, мы можем считать б не- нечетным. Теперь фBрп)=фB)ф(рп) =ф(рп), и если I — порядок числа б по модулю 2рп, то б'=1 (тос1рп), I делится на ф(рп) = = фBрп), / = фBрп) и снова б — первообразный корень. Этим завершается доказательство нашего утверждения. В приложении I дана таблица первообразных корней для всех нечетных простых чисел р<500. В приложении II дана краткая выборочная таблица индексов целых чисел. Заметим, что если б — первообразный корень по модулю р, то элементы
12 А. А. Альберт • группы Нр являются степенями элемента б, и потому для всех целых л=1, 2, ..., р—1. Целое число у(п) назы- называется индексом числа п по модулю р по отношению к б. Оно обладает свойством (той(р—1)). Вернемся к теории конечных полей. 5. Группа Галуа конечного поля. Если Р — произвольное поле характеристики р, то множество рр, состоящее из р-х сте- степеней элементов поля Р, образует подполе поля Ря Отобра- Отображение 5 :х -> есть изоморфизм поля Р на Р? и должно отображать конечное поле Р на себя. Таким образом, 5 есть автоморфизм поля Р. Согласно равенству C), 5 есть автоморфизм поля Р над Теорема 7, Группа Галуа поля Р степени п над Яр есть циклическая группа, порожденная автоморфизмом х—>хрл Порядок группы Галуа О поля Р над Яр равен п, и 5 по- порождает О в том и только в том случае, если 5 имеет поря- порядок я. Если 5 имеет порядок т<п и г=рт, то хЗт=х*=х, ка- каково бы ни было х€Р=Рд. В таком случае уравнение х*=*х имеет <7 различных корней, что невозможно, так как г= Известно, что если § — образующий элемент конечной циклической группы порядка V, то любая ее подгруппа Н является циклической и порождается элементом #б, где б — де- делитель V. Отсюда сразу следует, что каждая циклическая группа [5] порядка п имеет единственную подгруппу Н ин- индекса т, каков бы ни был делитель т числа я, и Н=[Зт]. Тогда поле Ь ^ К, которое состоит из всех элементов а 6 К, таких, что а=а$, если 5 6 Я, является подполем поля К = РЯ степени т над /?р. Так как подполе Ь единственно, то имеет место следующая Лемма 1. Пусть К — поле степени п над /?р. Тогда поле Ь степени т над Яр изоморфно подполю поля К над Яр тогда и только тогда, когда п кратно т. Лемма 1 влечет за собой теорему, частным случаем кото- которой она является.
Конечные поля 13 Теорема 8. Пусть К — конечное поле степени п над Р*. Тогда поле Ь степени пг над Ря изоморфно подполю поля К над Рч в том и только в том случае, если п кратно т. Действительно, пусть Р=РЯ имеет степень V над Яр и, сле- следовательно, ру = д. Тогда, как известно, К имеет степень т над Яр. Если степень Ь над Ря есть т и Ь изоморфно подполю поля К над Рд, то оно изоморфно подполю поля К над Яр и по- потому т кратно тч и п кратно т. Обратно, если п кратно т, то поле К содержит подполе V степени т над Р и V изоморф- изоморфно Ь по теореме 3. Перефразируем теперь теорему 7 для случая поля К над Ря, а не над Яр. Теорема 9. Пусть К — поле степени п над Ря. Тогда группа Галуа поля К над Р есть циклическая группа, порожден- порожденная автоморфизмом х-^хч. Действительно, поле К циклично и имеет степень № над Яр1), где ^^Р^ Поэтому группа Галуа поля К над Р есть группа индекса V, оставляющая элементы поля Р на месте. Она порождается V-й степенью отображения 5, где 5 — автоморфизм х—>х?у и мы видим, что 5Л; есть автоморфизм х->хр^\ 5л; есть В ТОЧНОСТИ X —* XV. В качестве следствия из теоремы 9 можно получить крите- критерий для определения степени простого расширения конечного поля. Теорема 10. Число т тогда и только тогда будет степенью поля К = Р(к) над Р — Рду когда оно является наименьшим из натуральных чисел, удовлетворяющих равенству Н1 =к. A5) Действительно, можно найти такое поле № 3 /С, что его степень п над Рд кратна т, где т есть наименьшее целое число, удовлетворяющее равенству A5). В таком случае равенство A5) показывает, что к принадлежит полю /,, элементы кото- которого остаются неизменными при преобразованиях группы Я, порожденной автоморфизмом Зт. Эта группа имеет индекс т, и потому степень поля Ь над Р равна т. Если Р{к) имеет сте- степень \1<т над Ру то по теореме 9 кя =к вопреки определе- определению числа т. ) Поле Р — конечное, нормальное, сепарабельное расширение поля Т — называется циклическим над Г, если группа Галуа поля Р над Т циклична. Определение сепарабельного расширения см. в сноске на стр, 28. — Прим, ред%
14 Л. Л. Альберт 6. Формула Дедекинда. Теорему 8 относительно полей можно следующим образом перефразировать на случай непри- неприводимых полиномов: Теорема 11. Пусть ^(х) —неприводимый над Рч полином степени т и A6) Тогда полином §(х) кратен полиному ц(х) в том и только в том случае, если п кратно т. Из теоремы 11 следует, что §(х) делится на все неприво- неприводимые полиномы степени т, где т — любой делитель числа п. Более того, &(х) = (хг — л;)—сепарабельный полином, и, зна- значит, в разложении полинома @(х) на неприводимые полиномы каждый неприводимый полином степени т встречается в точ- точности один раз; о таком неприводимом полиноме можно ска- сказать, что он — простой множитель полинома @{х). Пусть Л (а:)—произведение всех различных неприводимых полиномов, степени которых суть собственные- целители, числа я. Тогда Л (а:) —наименьшее общее кратное полиномов — 1], A7) где \х пробегает все собственные делители числа п. Очевидно, кратно Л (л;), и частное Г (х; п, д) = -|^- A8) есть произведение различных неприводимых полиномов сте- степени п над Р=Рд. Имея в виду вывести так называемую формулу Дедекинда, примем некоторые обозначения. Пусть теперь п = р*1ре* ... /?Ч где ри Рг, ..., Р» — различ- ные простые множители числа п. Пусть A9) множество, состоящее из простых чисел ри ..., р8. Если к р & любое подмножество, состоящее из к элементов рь , ..., р. 1 к множества 2, то отношение числа п к произведению элементов множества 1>к обозначим следующим образом: ОB0) Существует сг8, & подмножеств 2& множества 2, где сг8, &— число сочетаний из 8 элементов по к. Заметим, что тB&) есть соб- собственный делитель числа п для &=1, ,,.,5. Положим тBо) =#.
Конечные поля 15 Для всех положительных целых т положим [т] = х<1т— х, B1) где основным полем коэффициентов является поле Р = Рд. Тогда [я] = [да B„)] = *(*). B2) Пусть = П [«B*)]. B3) 22 Тогда Хь(х) есть произведение множителей вида B1), где п кратно т и Х() {B)]() B4) По теореме 11- степень каждого неприводимого множителя в произведении Х&(л?) является делителем числа я, причем в случае к>0— собственным. При <7=р формула, которую мы сейчас выведем, принадлежит Дедекинду. Теорема 12. Пусть Р — поле из ц элементов и Г(л;; я, #) — произведение всех неприводимых над Р полиномов степени п. Пусть п = рех{ ... ре* и П B5) П » О < 2к < 5 = П Ц + 1D B6) Тогда Т(х; п,д) = ^. B7) В самом деле, как мы уже видели, каждый неприводимый полином степени п есть простой множитель %о(х) и не является множителем произведения Хк(х) при к>0. Пусть Н(х) —непри- —неприводимый полином степени \х<п, который кратен произведению Ао(а:)Д1(^); \1, таким образом, является собственным делителем числа п. Пусть ^^, ..., ц%—простые множители числа я, кото- которые входят в я с более высокими показателями, чем в \х. Тогда если к>г, то пгA>к) не кратно ^. Отсюда при к>1 Хъ(х) не кратно к(х). Если &4^, то т(Е^) кратно \х тогда и только то- тогда, когда Ей есть подмножество множества Е/=(^1, ..., с/г)- Существует а*, и подмножеств Ей с Е', и, значит, Н(х) является множителем полинома %к{х) кратности а*, к. Отсюда Н(х) является множителем полиномов Ао(а:) и Д1(л:) кратностей ои2к B8)
16 А. А. Альберт И 2 ои2к+1 B9) соответственно. Разложение р(х) = A +»<= 1 + ои 1^4- ... Ч-а,, гх* C0) показывает, что а есть сумма коэффициентов при четных, а C — при нечетных степенях х в р(х). Поэтому р(—1)=а—C = = A — 1)' = 0. Отсюда Н(х) входит в До(#) и А{(х) с одинако- одинаковой кратностью, а потому — с нулевой кратностью в их частное. Это доказывает нашу теорему. Степень функции Т(х\ п, #) в равенстве B7) равна пч(я, #), где 1[2^2] C1) Таким образом, C1) есть формула для числа неприводимых над Рд полиномов степени п. Упражнения 1. Путем разложения частного (#16 — х) (хА — х)~1 показать, что тремя неприводимыми над Рч полиномами степени 4 являются полиномы и х*+х3+х2+х+\. 2. Пусть 2;2+2;+1 = О, так что Р2(Ъ) есть поле /^ степени 2 над Р2- Опре- Определить шесть неприводимых над Рц квадратных полиномов посредством раз- разложений (х*+х+1) = (х*+х+1) 7. Полиномы, принадлежащие некоторому показателю. Го- Говорят, что неприводимый над конечным полем Р полином }(х) степени пг принадлежит показателю е, если е такое наименьшее натуральное число, что Xе—1 кратно }(х). Теорема 13. Неприводимый над Рд полином {(х) степени пг принадлежит показателю е тогда и только тогда, когда пе- период каждого корня уравнения }(х)=0 равен е. В этом случае пг — 1 КратНО е. Действительно, пусть к — корень уравнения }(х)=0, так что Р{к) есть поле степени пг над Рд и ке=\. Если е — период корня к, то, как мы знаем, е > е. Отображение х—»л^ — обра- образующий автоморфизм поля Рд(к) над Рч и }(х) = (х — к{) ... ...(х—кш), где кг = к8{~1. Тогда к] = {кгM ~1 = 1, и потому ка^
Конечные поля 17 ждый корень полинома 1(х) является также корнем поли- полинома хе—1. Так как полином }(х) сепарабельный, то он является делителем полинома хг— 1, и потому е > е. Следова- Следовательно, г = е. Согласно разд. 3, период каждого элемента поля Рд(к) является делителем числа цт—1, а значит, таковым является и е. Используя теорему 10, можно усилить предыдущий резуль- результат следующим образом. Теорема 14. Пусть к—первообразный корень степени е из единицы в некотором поле над Ря. Тогда степенью поля Ря(к) над Рд будет такое наименьшее целое число т, что цш=\ (тос1е). Более того, цп=\ (тос! е) тогда и только тогда, когда п кратно т. Теорема 10 утверждает, что степенью поля Рд(к) над Рд будет такое наименьшее натуральное число т, что &т=1, где % — цт—1. Но если к — первообразный корень степени е из единицы, то это значение т есть такое наименьшее натураль- натуральное число, что <7т=1 (тос1е). Действительно, тогда т есть по- порядок элемента ц в мультипликативной группе /?*. Но тогда, если <7П—1 (тойе), то п кратно т. Это следует из того, что степень элемента равна единице группы тогда и только тогда, если показатель степени кратен порядку элемента. Теперь не представляет труда найти в терминах функции Эйлера выражение для числа нормированных неприводимых полиномов данной степени, принадлежащих данному показа- показателю. Теорема 15. Существует т~х^{е) нормированных непри- неприводимых над Ря полиномов степени т, принадлежащих показа- показателю е. Теорема 15 представляет собой следствие того факта, что элементы поля, имеющие одинаковый период, определяют одно и то же поле. Для доказательства положим, что К есть поле разложения полинома хе—1 и что к^К — первообразный ко- корень степени е из единицы. Тогда из того, что /С* циклическая группа и ее подгруппы однозначно определяются своими поряд- порядками, следует, что в поле К каждый корень степени е из еди- единицы есть степень элемента к. Поэтому если период элемента /г 6 /С равен е, то мы имеем к = кг для /, взаимно простого с е, к = Н8 для 5, взаимно простого с е, Р(Н) с: р[к) с р[Н) иР(Н)== = Р(к). Таким образом, каждый первообразный корень сте- степени е из единицы определяет нормированный неприводимый над Р полином, степень которого равна степени тп поля Р(к)
18 А. А. Альберт над Р. Каждый из \1 таких различных полиномов имеет пг раз- различных корней, и все они являются элементами периода е. В таком случае в поле К существует \ип первообразных корней степени е из единицы. Но каждый первообразный корень сте- степени е из единицы есть степень к1, где / взаимно просто с е\ таких показателей I существует ф(#), и \1~т~1ц>(е), что и тре- требовалось доказать. Заметим, что делимость ф(е) на т следует из теоремы 14, которая утверждает, что т есть порядок элемента ц в группе Не- Порядок группы Не равен ф(е), и, значит, ф(е) кратно т1). Упражнения 1. Вычислить порядок числа 2 в группах /?9, Я15. 2. Воспользоваться результатом упражнения 1 для определения степени поля р2(&), где к принадлежит показателю 9 и к принадлежит показа- показателю 15. 3. Пусть 1—Рд[у] — кольцо полиномов от неизвестного у над полем Рч. Показать, что отображение к-ъ-кч есть автоморфизм кольца / над Рд. 4. Следующий результат принадлежит А. Глисону и Р. Маршу. Пусть }(х)—неприводимый полином степени п в кольце Рд[х]. Тогда у!(§)=У§(у)* гДе 8 (у) имеет степень цп — 1. Из этого следует, что §(у) неприводим в том и только в том случае, если }(х) первообразный полином2). Использовать этот результат для построения неприводимых над Р% полиномов 6-й и 63-й степеней. 8. Полиномы, принадлежащие простому показателю. Поли- Полином C2) неприводим в поле Р = Рд тогда и только тогда, когда класс вычетов в кольце 7?е, содержащий ц, имеет порядок ф(е). Это может случиться только тогда, когда е — простое и ^ — перво- первообразный корень по модулю е. Рассмотрим теперь случай, когда е — простое и к—такой первообразный корень степени е из единицы, что степень Р(к) над Р — четное число. Теорема 16. Пусть е — простое, к — первообразный ко- корень степени е из единицы; степень К = Р(к) над Р равна т = = 2|1. Тогда отображение к—>к~1 индуцирует автоморфизм Т поля К над Р, Т имеет порядок 2, степень поля К над Ь = — Р(к + кгх) равна 2 и Ь — такое подполе поля К, что <хТ=а для всех 1) Здесь используются обозначения, введенные в разд. 4. — Прим. ред. 2) Определение первообразного полинома см. в разд. 15, — Прим, ред,
Конечные поля 19 Теорема 14 определяет т как такое наименьшее целое, что (тос1е). В таком случае ц^— 1 не кратно е. Так как е —» простой делитель числа ^ш—1 = (ср—1)(дгМ'+1), то (тос1е). Опираясь на теорему 9, видим, что отображение х —>хч представляет собой образующий автоморфизм 5 поля Рд(к) над Ря. Следовательно, х81Х=хд , и условия ке=\ и (тос1 е) означают,. что к8^ = к~х. Таким образом, 7 = автоморфизм поля К над Р, который индуцируется ото- оторф р уру бражением к—*к-\ так как Т в таком случае есть автоморфизм Так как к — корень уравнения C3) то степень поля К над Ь0=Р(к + к~1) не превосходит 2. Те- Теперь1) [К : Р] = [К : Ьо] [Ьо: Р] и Ьо есть подполе поля Ь, такого, что для а^Ьу аТ = а и [Ь:Р] = \х. Следовательно, [/С^0] = 2, [Ьо: Р\ = \х и Ь = Ьо. Предыдущий результат и излагаемое ниже следствие из него были впервые доказаны для случая д = 2 У. А. Блэнкиншипом, Теорема 17. Пусть к — первообразный корень степени е из единицы, определяющий поле Рд(к) четной степени 2\л над Ря, и пусть е — нечетное простое число. Тогда период элемента 1 + к1 равен еЬи где б * взаимно просто с е при г — 1, 2,..., е — 1. Действительно, степень поля Р(к + к~1) равна \х, и, значит, период бо элемента к + к~1 является делителем числа ^^—1. Так как д^— 1 не кратно е, то е и бо взаимно просты. Но пе- период произведения двух элементов равен общему наименьшему кратному периодов этих элементов, и поэтому период элемента к(к + к~1) =1 +к2 равен ебо- Так как е = 2г—1 нечетно, то е и е взаимно просты, а потому ко=ке — первообразный корень сте- степени е из единицы. По той же причине \+.к2г=\+к имеет пе- период еЬи где 61 и е взаимно просты. Но тогда это верно и для каждого первообразного корня степени е из единицы, и потому \+кг имеет период еб*, где б* и е взаимно просты при 0</<е. Очевидно, если у(к + к~1)—любой элемент поля Р(к + к~]), то период элемента ку{к + кг1) равен бе, где б и е взаимно просты. Например, период элемента к (кг + к~г) = кг+\+1к1~г ра- равен X • е, где К и е взаимно просты. 1) Символом [/С;/7], как обычно, обозначена степень поля К над /\ — Прим. перев.
20 А. А. Альберт Упражнения 1. Найти 10 простых чисел е, таких, что полином (хе—1)(л:—I)-1 не- неприводим над Р2. 2. Найти степень поля Р2A) над Р2, где 5 — первообразный корень 7-й степени из единицы. Указание: воспользоваться приложением I. 3. Найти первое простое р, такое, что (х2г—1)(л:—I) неприводим над Рр. 4. Пусть к — первообразный корень 5-й степени из единицы над Р2. Найти период элемента \+к. (Проверьте ваш результат, сравнивая с при- приложением III.) 5. Доказать, что хв~1+хе~2 + ... +#+1 неприводим над Рд, только если е —простое число. Указание: применить теорему 14. 9. Построение неприводимых полиномов. Покажем, как можно получить одни неприводимые полиномы из других. Нач- Начнем с вывода леммы. Лемма 2. Пусть }(х)—неприводимый над Рд полином степени т, е=(дт—1)яМ — целое число, которому принадле- принадлежит }(х), и я— простой делитель числа е, не являющийся де- делителем числа й. Тогда 1(хя) неприводим над Рд и принадле- принадлежит показателю ел. Действительно, }(х) определяет поле К=Рд(к) степени пг над Рд, где к имеет период е. Известно, что уравнение хл = к либо неприводимо в /С, либо имеет корень в К. Заметим, что если порядок циклической группы есть V = е6 и к — ее элемент порядка е, то в качестве порождающего элемента группы можно взять элемент §, определяемый соотношением Н=§6. В силу последнего замечания и условия леммы положим к-=На, где к порождает /С*. Корнем уравнения хя = к в поле К будет такой элемент На, что /1ал = к, /1ап~а—1. Тогда ая — й должно де- делиться на *7Ш— 1, а это означает, что ая — й делится на я, в то время, как й не кратно я. В таком случае уравнение хл = к определяет поле 2=К(г) степени я над К и 2 имеет степень ят над Рд. Но гп = к, значит, Рч(г)^К и поле Рд(г)=К(г) имеет степень я • ш над Ря. Так как г является корнем уравнения }(хп)=0 степени тя, то левая его часть должна быть мини- минимальной функцией1) от г над Рд и полином !{хл) неприводим в Рд. Если период, элемента г равен а, то га — гол = к° = 1 и о = еоо. Ногел = ке—1, а потому етс кратно а, и я кратно сг0. Если Gо=1, то г имеет период е и является степенью элемента к, ) Минимальной функцией, или минимальным полиномом, от г над Рд называется такой нормированный полином }(х) наименьшей степени над Рд, что {(г) =0. — Прим. перев.
Конечные поля 21 что невозможно. Отсюда сго=я, период элемента г равен етс и \(хп) принадлежит показателю етс. Применим лемму 2 для доказательства одного ее обобще- обобщения, относящегося к случаю, когда рассматриваются все про- простые делители числа е, взаимно простые с й. Сохраняются все условия леммы 2 и вводится одно дополнительное. Теорема 18. Пусть ^(х), !2(х), .,., }а(х) (а-=гп-\(е)) — различные неприводимые над Рд нормированные полиномы, ка- каждый из которых принадлежит показателю е={(/т—1)а-1 C4) и имеет степень т. Пусть далее I — такое целое число, что все его простые делители являются также делителями числа е, но не являются делителями числа й. Положим также, что г ф О (тос14), если цш = —1 (тос14). Тогда полиномы \ь(х1), \г(х1), ..., }0(хг) исчерпывают множество нормированных поли- полиномов степени тг над Рч, принадлежащих показателю ег. Результат тривиален при /=1. Предположим, что он спра- справедлив для всех натуральных и<1. Так как все простые дели- делители числа являются делителями числа е, то е = р®1 ... ра/, еЬ = = р\* ... /^.гдер^а, >0. Тогдаф(^)=^A — р~1) ... A — и A) г A 1 Но тогда (щ{)'1 ф (ег) = (пь'1ё) (е1)"\ (ег) = (т,- 1е) е-^(е) = а. C5) В таком случае из теоремы 15 следует, что число неприводимых полиномов степени тг, принадлежащих показателю е1, в точ- точности совпадает с числом неприводимых полиномов степени т, принадлежащих показателю е. Запишем теперь I в виде ^ = я/о, где я — простое число. Если / = я, то наше утверждение не- немедленно следует из леммы 2. В противном случае /о<^, и, применяя лемму 2, мы видим, что каждый из (тя)"!ф(^я) поли- полиномов и{хп), ..., !0{хл) степени тп неприводим и принадлежит показателю етс. Покажем теперь, что каждый простой делитель числа и является делителем числа етс и взаимно прост с йо= 1) {етс)~1. Действительно, — \) = у(дт — 1), у = дт(л-1)_^ ### _|_д,т_|_1# C6) Поэтому йо^^тП—\)(етс)-х==[^т—\)е-1]утс1==Aчтс-\ Если я0 любой простой делитель числа е, взаимно простого с й, то дттс—1=<у^ш—1)а=й#у кратно я0. Итак, й0 кратно я0 в том и только в том случае, если ул~1 кратно яо. Но дт=\
22 А. А. Альберт =1 (тос! я) и, значит, у = 0 (тос! я), -у == я (тойя0). Если я, то Vя'1 = 1 (той я0). Если Ло — тс, то <7ше=A+6я) (той я2), где 0-<6<я, и ?те=A+е5я) (той я2) (е = 0, 1, ..., я— 1). Таким образом, *у=я + бя^я(я—1)(тойя2), ул-1 == 1 \)~2 я(тойя). Но тогда уя не кратно я, если тсФ2. Если я = 2 = яо, имеем (у = 9ш+1, и если <7ш+1=0 (той 4), то наше предположение, что к0 не кратно яо, не выполняется. Поэтому мы должны предположить, что<7ш=1 (той 4), если /=0 (той 4). Но из ^т=\ (той 4) следует, что у~2 (той 4), ук~1^\ (той 2) и, значит, снова я0 и 30 взаимно просты. Таким образом, мы по- показали, что условиям теоремы удовлетворяют полиномы М*я)> ..., !0(хл) для и и из предположения индукции следует, что М**), •••> 1о(х*) исчерпывают множеств© неприводимых полиномов степени т/, принадлежащих показателю е1. Следствием из теоремы 18 является следующий результат: Теорема 19. Пусть р — первообразный элемент поля Рч\ I — целое число, все простые делители которого являются дели- делителями числа ц— 1; г — любое целое, взаимно простое с 1\ й — наибольший общий делитель чисел г и ц—1; <7=1 (той 4), если 2 = 0 (той 4). Тогда нормированные неприводимые над Ря полиномы степени I, которые принадлежат показателю — \)й~1, имеют вид хг — рг. В самом деле, нормированные неприводимые полиномы пер- первой степени, которые принадлежат показателю (#—1)^, имеют вид х—рг, где г пробегает все целые г^й (г0 взаимно просто с (#—\)й~х). Тогда й — наибольший общий делитель чисел г и ^—1, и наше утверждение сразу следует из тео- теоремы 18. Заметим, что теорема 19 дает все биномы, неприводимые над Ря. Действительно, /иг должны быть взаимно просты, так как в противном случае бином х1 — рг тривиальным образом оказывается приводимым. Если I содержит простой делитель я, который не является делителем ц— 1, то уравнение хл = рг при- приводимо, так как существует такое число Пи что ЯЯ1=1 (той 9—1) и (ря1г)Я = рг- Но тогда х1 — рг=х*8 — рг кратно х3 10. Особый случай. В этом разделе мы положим 7 = —1 (той 4). Тогда ^ — нечетно, <72а=1 (той 4) и потому т — нечетно, д = —1 (той 4),
Конечные поля 23 Теорема 20. Пусть заданы в = 1ггхц(е) неприводимых над Рд нормированных полиномов 1\(х), ..., /а(л;) нечетной сте- степени т, принадлежащих четному показателю е=(дт—\)й~х\ пусть далее г (и, V>2), C7) еде т и г нечетны, и все простые делители числа I являются также делителями числа е, но не являются делителями й; пусть, наконец, к — меньшее из чисел и и V. Тогда каждый из полино- полиномов и{х1) разлагается в произведение 2к~1 неприводимых над Ря нормированных полиномов 8ц(х) степени т12х~к. 2к~1о поли- полиномов §г^(х) исчерпывают все множество неприводимых' нор- нормированных полиномов степени т121~к, принадлежащих пока- показателю ег. Действительно, по теореме 18 полиномы 1ог(х) =/г(#г) исчер- исчерпывают множество, содержащее (тг)~1ср(ег) нормированных полиномов нечетной степени тг, принадлежащих четному по- показателю ег. Таким образом, доказательство нашей теоремы сведено к случаю / = 2*\ Если г—первообразный корень степени е из единицы и е четно, то каждый корень уравнения х2 = г — первообразный ко- корень степени 2е из единицы. Это следует из того, что цикличе- циклическая мультипликативная группа {х}, порожденная элементом ху имеет порядок, не превосходящий 2е, и содержит группу {г} порядка е в качестве своей подгруппы. Таким образом, порядок группы {х} равен либо е, либо 2е. Если порядок элемента х ра- равен е, то л;=2а, х2 = г2а=г и гы~х-=\, в то время как е четно. По индукции заключаем, что корни уравнения хг = г — перво- первообразные корни степени ег из единицы. Тогда все корни поли- полинома /г(я') принадлежат показателю ег. Из рассуждений, про- проведенных при доказательстве теоремы 15, следует, что все пер- первообразные корни степени ег из единицы порождают поля оди- одинаковой степени \х над Рд, и, действительно, \х — такое наимень- наименьшее натуральное число, что ^=1 (хпрйег). Следовательно, 1<(х*)=8и(х) ...Ви(х) A=1, ..., а), C8) где все полиномы ёа(х) неприводимы над Ря и имеют одина- одинаковую степень \х. Таким образом, 5|1 = т*. C9) Если 0 — корень уравнения /г(#')=0, то /^@) Э/^(б*) сте- степени т над Рд и, значит, \х кратно т, \х = тХу I кратно К и к есть степень числа 2. Далее: ^=1, так как в противном случае цт— 1=0 (той /) и цт=\ (той 4) вопреки предположению. Теперь ц»—\ = (цт—\)Ь=ед,Ь, где
24 А. А. Альберт Поэтому X есть такое наименьшее натуральное число, что б кратно I. Вычислим К. Так как ^ и га нечетны, то <7т+^1 = (<7+1) (<7т"~1 — дт~2+ ... ... + <72—<7+1)=2ите, где е — сумма т нечетных (положитель- (положительных и отрицательных) целых чисел и само нечетно. Тогда #т== = 2и1—1, где I нечетно. Для вычисления ^=Bи|—0я* при- применим биномиальную теорему, в результате чего получим и 1± ...]. D0) где а^, |з — обычный биномиальный коэффициент. Так как ка- каждый член, начиная со второго, в квадратных скобках равен- равенства D0) делится на степень числа 2, которая выше, чем сте- степень числа 2, делящая первый член, то б кратно I тогда и толь- только тогда, когда 2и~1Х кратно I, т. е. 2и)~'1Х— целое число. Если и^.V, то наименьшее четное целое число X, для которого это справедливо, есть Х = 2 = 21-"^ = 21-й/. Если и^> то к —и и 2и~/°-1Х будет целым тогда и только тогда, когда X кратно 2'0+1~и = 2х-кг. Следовательно, во всех случаях К = 21~Ч, \1 = тг2х-к, D1) что и требовалось. Теперь, применяя C5), вычисляем а: т пй 2я \х В таком случае \гхц(е1)=2к-хо представляет собой число нор- нормированных неприводимых полиномов степени \х, принадлежа- принадлежащих показателю ег по теореме 15. Теперь 8\1 = 8тХ — 812х~кт = = т1 и, значит, 8 = 2к~х. Этим завершается доказательство тео- теоремы. 11. Неприводимые полиномы четной степени. Изложим спо- способ построения неприводимых полиномов четной степени г над таким полем Рд, что # = 2^т— 1, где т нечетно и гр > 2. Будем считать, что все простые делители числа I являются также де- делителями числа ц — 1, и пусть V = <у/, -у = 2*-*. D3) Тогда V кратно 2* = 2у. Если р — первообразный корень в Ря и 5 — любое целое число, взаимно простое с /, то полином х — р8 принадлежит показателю (^—1)йН, где й — наибольший об- общий делитель чисел 8 и д—1, причем V и й взаимно просты. Применяя теорему 20, видим, что хУ — р8 есть произведение у неприводимых полиномов степени / в Ря[х]. Найдем эти поли- полиномы.
Конечные поля 25 Так как у и -к-(<7—1) взаимно просты, то существуют та- такие целые числа а0 и р0, что \ уD4) Умножив равенство D4) на четное число $ + -г>-(<7—1), получим такие целые числа аир, что 1 D5) Так как р — первообразный корень в Рд, имеем рб = — 1, где = 2г(<7— 1)» и тогда = х* + р2с^. D6) Теорема 21. Все корни уравнения и = 0 D7) принадлежат полю Рд. Имеет место разложение Р2а D8) бинома х^ — р5 яа неприводимые множители хг — ^р^х1!*1 — р2а кольца Рц\х\, где I] — корни уравнения Ф(у = 0. В самом деле, корни квадратного уравнения х2 — 1х — 1=0 D9) равны г) и —г). Согласно формуле Варинга, сумма у-х степе- степеней корней уравнения D9) равна Ф(?). Таким образом, из -{ E0) следует, что *. E1) Следовательно, если ^ = т]у — лу1 — корень уравнения Ф(|)=* = 0, то Л2/7 =х - 1. E2) Так как #+ 1 =2ут (т нечетно), то ^^1. E3)
26 А. А. Альберт Но тогда в поле я(^) у-л;Т = т(»~л;' = -Л71 + лу = 1г E4) Следовательно, ^ должно принадлежать полю Рд. Тогда ^ E5) 7-1 есть тождество. Подставив Т| = .*'/«> <р-«, | = Л-^= *-" E6) 1] ^/2Ира в равенство E5) и освободившись от знаменателей, получим тождество D8). 12. Приложения. Применим результаты разд. 8 для построе- построения некоторых неприводимых полиномов. Пусть сначала # = 4. Тогда Рк = /72((о), где ш2 + (о + 1=0, т. е. со — первообразный корень третьей степени из единицы. При- Применив теорему 19 для случая / = 3, увидим, что неприводимыми над /ч полиномами третьей степени, которые принадлежат по- показателю 9, являются х3 — со и хг — со2. Их произведение х6—(со + (о2)л:3+1 = л;6 + л;3+1—неприводимый над Р2 полином шестой степени, принадлежащий показателю 9. Его восьмерич- восьмеричное представление 111 содержится в таблице приложения IV. Аналогично этому полиномами степени 9 над /ч, которые при- принадлежат показателю 27, являются х9 — со и х9 — со2, и х18+] + х9+1 — неприводимый над Р2 полином степени 18, принад- принадлежащий показателю 27. Положим теперь # = 5. Можно взять / = 4 = </— 1 и р = 2. То- Тогда неприводимыми над Р$ полиномами 4-й степени будут х4 —2 их4 —23 = х4 — 3. Возьмем 9 = 7, р = 5. Тогда при / = 2 получим неприводимые полиномы второй степени х2—5, х2+1 и х2—3, принадлежа- принадлежащие соответственно показателям 12, 4 и 12. При / = 3 и г = 1, 2, 4 и 5 мы получим соответственно полиномы УЪ ^ У3 А уЗ О уЗ *} неприводимые в Р7 и принадлежащие показателям 18, 9, 9 и 18. Наконец, пусть # = 8. Тогда, согласно приложению III, мож- можно положить Рв = Р2(р), где р — первообразный корень седьмой степени из единицы и р3 = р+1. При /=7 и г=1, 2, 3, 4, 5, 6 по- получим неприводимые полиномы х1 — р, х7 — р2, х7 — р3, х1 — р4, х7 — р5 и а:7 — р6. Элементами, сопряженными с р, будут р2 и р4, а с р3 — эле- элементы р6 и р12 = р5. Отсюда полином (х7—р) (х7—р2) (х7—р4) =
Конечные поля 27 = л;21— (р р Р)(рР РР РР) () неприводим над Р2 и принадлежит показателю 49. Корни поли- полинома (х7—р3) (х7—р6) (х7—р5) = х21 +хи+1 взаимно обратны корням полинома к(х), а потому сам полином л;21+л;14+1 также принадлежит показателю 49. Рассмотрим пример применения теоремы 18. Пусть д = 2у т — \. Согласно приложению IV, неприводимыми полиномами 4-й степени, принадлежащими показателю 15, будут полиномы хк + х+\ и л:4 + л:3 + 1. Тогда неприводимыми над Рч полиномами 12-й степени, принадлежащими показателю 45, будут л;12+л;3+1 и л;12 + л;9+1. Неприводимыми полиномами 20-й степени, принад- принадлежащими показателю 75, будут л;20+л;5+1 и л;20+л;15+1. Нако- Наконец, неприводимыми полиномами 60-й степени, принадлежа- принадлежащими показателю 225, будут л:60 + л:15 +1 и л:60+л:45 + 1. В заключение рассмотрим пример применения теоремы 21. Положим <7 = 7 = 23— 1 и / = 4. Тогда имеем V=16 и попытаемся разложить *1б_5* E=1, 3, 5). E7) Уравнение имеет своими корнями §==1, —1, 3, —3. Кроме того, А:16 — 5« = л:16 + 58+3=д:16+;52а E + 3 = 2а = 4, 6, 8). Так как 58а = 52а (той 7), то уравнение D8) принимает вид *и + 52а в П х4 ~ 1;5ах2 - 52а E8) над Р1. Тогда х^-{-4 = (х* — х2 — 4)(х4 + х2 — 4)(х4 — 2х2 — 4)(х4+2х2— 4), х16 + 2 = (х4 — 2х2 — 2) (х4 + 2х2 — 2) (х4 — 4х2 — 2) (х4 + 4х2-2), Х1б+1==(Х4_ Х2_ 1)(Л4 + Х2_ 1)(д:4 — 4х2 — 1)(х4 + 4х2— 1) представляют собой требуемые разложения. Упражнения 1. Построить неприводимый над /^ полином 4-й степени. Результат ис- использовать для построения неприводимого над /^ полинома 8-й степени. 2. Результат примера 1 использовать для построения неприводимого над Рз полинома 16-й степени. 3. Найти неприводимый над Р\6 полином 3-й степени; использовать при- приложение IV и найти неприводимый над /^ полином 12-й степени. 4. Найти неприводимый над Р\$ полином 5-й степени и неприводимый над Р2 полином 20-й степени.
28 , А. А. Альберт 13. Полиномы степени р над Рг д = рп. В этом разделе мы получим следующий основной результат1). Теорема 22. Полином №хр — Хх — $ (КФО, %€Рд) непри- водим над Ря, где ц — рп тогда и только тогда, когда след В самом деле, полином №х? — Хх — р неприводим над Рд тогда и только тогда, когда х? — х — р неприводим в Рд[х]. Полином х? — х — р приводим тогда и только тогда, когда уравнение х? — л;=|3 имеет в Ря корень у. Но отображение 1) Для удобства чтения этого раздела и разд. 15 приведем некоторые дополнительные сведения из теории полей. Элемент г, являющийся корнем неприводимого в Р[х] полинома /(*)> не имеющего в расширении поля Р кратных корней, называется сепарабельным над Р. Поле К=ЭР называется сепарабельным над Т7, если все его элементы сепарабельны над Р. Пусть К — сепарабельное расширение поля Р степени п над Р. Тогда К—Р(г)> где г — сепарабельный элемент. Минимальная функция от г /(*) — л:п + а1л:п-1-Ь• +...+ап над полем Р есть неприводимый полином и в поле Ы=Р(гиЛ.., гп) разложения этого полинома / \Х) = \Х — Х\) ... \Х — 2 Можно положить 2=21 и N ^>К. Каждый элемент к поля К можно един ственным образом представить в виде Положим - о 0 0 _ — ап (Уо, Уь .. 1 0 0 —ал_1 0 1 0 — «/2-2 ... 0 ... о 0 ... — а2 0 0 1 — а. (эту матрицу называют «сопровождающей» матрицей для полинома Т(х)). Отображение к=у(г)->у(С) = является изоморфным отображением поля К на поле Р[с] всех полиномов от матрицы С. Характеристический полином /(*; к) — \ х1 — у (с) \ матрицы у (с) имеет степень п и называется характеристической функцией элемента к. Симво- Символом Ок/р(к) обозначается след матрицы у (с), взятый с обратным знаком. Коэффициент при X"-1 полинома }(х,к) равен — Ок/р(к); Ок/р(к) назы- называют также следом элемента к в поле К над Р. Легко видеть, что для лю- любых а^Р, к, Н ак) =авК/р (к), ок/р [Н+к) = аК/р (й) +ок/р (к), ок/р (а) -па. Имеет место теорема: если поле К циклично над /% то ак/^(^)==0 тогда и только тогда, когда §—кЗ — к, где ^ — некоторый элемент поля /С, а авто- автоморфизм 5 порождает группу Галуа поля /С над Рш — Прим, перев%
Конечные поля 29 х->х? является порождающим автоморфизмом поля Ря над Рр, и наше утверждение непосредственно следует из того, что элемент поля К=РЯ имеет нулевой след в том и только в том случае, когда он представим в виде к8 — к для некоторого к€.К, где 5 — автоморфизм, порождающий группу Галуа поля К над Р. Этот результат можно теперь применить сле- следующим образом: Теорема 23. Пусть •С / \ УМ I уу% 4 ■ г" | ^ / ^ У"? \ /Г* /Л \ / \ ~~ / ~~""" "' | СЛ \ *\* |т • « • | \Л*ууъ I >^2 ^- О ) \ ^-* ^ / — неприводимый над Ря полином степени пг и ц = рп. Тогда если а1 + а?"Ь • • • Ч~а? ! =^= 0, то полином \{х? — а:) является не- неприводимым над Ря полиномом степени рпг. Действительно, пусть |—корень уравнения /(л;)=0, Р = Рру и К=РЯA). Тогда корни уравнения /(л;)=0 равны ^аг//7 (I) = <^ [^/1 (&)] = — ^ь/р(щ) Ф 0. F0) По теореме 22 полином у? — у — | неприводим над /С. Он опре- определяет поле К{х\) степени тар над Ря. Так как 9=/Пр—Л при- принадлежит полю Рд(ц), то поле ^(/п)==^(г1) имеет степень тр над ^д, /(т!р — /п)==0, Л — корень полинома 1(х? — а:) степени тр из кольца Рд[х], и }(хр — а:) неприводим над Рд. Упражнения 1. Применяя теорему 22, найти неприводимый над РА полином второй степени. Используя этот результат, найти неприводимый над /^ полином 4-й степени. 2. Найти неприводимый над Р2 полином 6-й степени, применяя тео- теорему 23. 14. Теорема Диксона. Ниже для г = ^ формулируется резуль- результат Л. Е. Диксона, см. Тгапзаспопз о/ 1Не Апгепсап МаНгетаИ- са1 8ос1е1у, XII A911), 98. Теорема 24. Пусть 6 — первообразный элемент поля Рч, д=рп, C — произвольный элемент поля Рд и г=рш>2, где пг — делитель числа п. Тогда полином F1) является произведением линейного полинома и неприводимого над полем Рд полинома степени г — 1. Из того, что !'(х)=—6=^=0, следует, что /(*) — сепарабель- ный полином. Так как г>2, то пусть 5 и г) — два различных
30 Л. Л. Альберт корня уравнения /(л;)=0 в его поле разложения. Тогда |г — — г)г=(! — т))г=б(^ — л)» и поэтому (I — т])г~1==6. Кроме того, г— \=рш— 1 является делителем числа рп— 1. По теореме 19 полином хг~{ = д неприводим над Рд и определяет поле Рд(^— ц) степени г — 1 над Рд. Но Рд(%— ц) с Рд(%9 т)), так что суще- существует такой корень | уравнения }(х)=0, что РдA)ФРд. Кроме того, поле Рд{1) содержит элемент |«. Однако (^г — 6| + C)^ = )в«|9 + р9=(|9)г_ е|9 + р = о и, таким образом, я) —поле степени г— 1 над Рд. Следовательно, степень поля Рд(%) есть такое целое число \х, что г^>(а>т—1 и \х кратно г—1. Но г>2 и \х может делиться на г—1 тогда и только тогда, когда г— 1 = |х, поле /7д(|) имеет степень г— 1, и наше утверждение доказано. Заметим, что при г = д в поле Рд легко найти корень уравне- уравнения F1). Действительно, если %йРд, имеем ^ = |, и потому —р в том и только в том случае, когда |A —6)=—р, Тогда где Г1^ —в, F2) и, значит, F2) —полином степени ц — 1, неприводимый над Рд. Пусть, например, д==7 и 6 = 5. Тогда, если р=1, имеем !• = = E — 1)~1 = 2. Таким образом, — 4х — 4 F3) — неприводимый над Ру полином шестой степени. Пусть теперь *7 = 4, так что 6 корень третьей степени из еди- единицы. Тогда 62=1+6 и 6 — 1=62. Берем р = 62 и получаем |=1; следовательно, полином <2(х)=х*+'х2+х + № F4) неприводим над Р*. Упражнения 1. Применить теорему 24 для получения неприводимого над Р8 поли- полинома 7-й степени. 2. Применить теорему 24 для получения неприводимого над Р{6 поли- полинома третьей степени. 15. Построение неприводимых полиномов. Полином \{х) степени п, неприводимый над полем Рд, называют первообраз- первообразным, если его корень 8 является первообразным элементом
Конечные поля 31 поля Рд{$). В этом случае все корни полинома }(х) первооб- первообразные. Каждый отличный от нуля элемент к поля Ря{8) пред- представляется в виде . F5) Характеристическая функция /,(*)=/(*; 6<) F6) элемента 6' является полиномом степени п с коэффициентами из Рд. Если Рд(№) имеет степень т над Рд, то п = тг и }г(х) = = [§■*(*) ]г, где §*(х)—минимальная функция над Рд элемента 6' и ее степень равна т. Полином 1г{х) можно построить следующими тремя спосо- способами. I. Первый способ заключается в построении сопровождаю- сопровождающей матрицы С/ для полинома }(х). Тогда }{(х) = \х1— С'А1)' Для больших значений п этот метод практически непригоден, т. к. приводит к вычислению характеристического определи- определителя матрицы, которая является степенью другой матрицы. II. Поле Рд($) является векторным пространством К с бази- базисом 1, 6, ..., б71 над Рд. Тогда 8' = ац+а126+ ... +а1П6п-1, где элементы а^- принадлежат полю Р. Вычислим значения 8ж-1 = ап+]а«6+ ... +агП6п-1 (/=1, ..., п) и, таким образом, получим матрицу А = (<х^). Тогда А = С'/ и }{(х)=\х1— Л|. III. Пусть / = $ра, где 8 и р взаимно просты. Тогда 6* = = F8Mа, где 5 — автоморфизм х—>х*>. Но тогда 1г{х)=18{х). Поэтому достаточно выбрать такое I, которое взаимно просто с р. Тогда в расширении И? поля К=Рд(&) существует первооб- первообразный корень со степени / из единицы, и мы видим, что из ^(х) = (а: — 60 ... (х — 6п), где 0 = 6Ь 62 = 6?, ..., 6^ все при- принадлежат полю /С, следует, что !(у)!(®у) •. • !(®'~1у) = (у — — 80@0 —в,)... (сУ-1у —80 ... О/— 8Я) (оу — 8Я) ... (в*- — 0Л)==(^ — 0{) ... {у* — 0^). Положив у = х11г, видим, что , (х) = / {х1'1) / (о^1^) ... / (в*-1хх1*). F7) Теперь мы в состоянии узнать, какие из полиномов 1г{х) являются неприводимыми. Теорема 25. Пусть й—наибольший общий делитель чи- чисел г и *7П— 1, так что цп — \=ей. Полином ^(х) неприводим над Рд тогда и только тогда, когда е не делит цт— 1, где т — произвольный собственный делитель числа п. 1) \А\ — символ определителя квадратной матрицы А. — Прим. ред.
32 А. А. Альберт Известно, что если 6 — образующий элемент циклической группы порядка цп — 1 и й — наибольший общий делитель чи- чисел цп—1 и /, причем цп—1=ес1, то порядок элемента 6* в этой группе равен е. Отсюда если 6 — первообразный эле- элемент поля /^F), порожденного первообразным полиномом/(х), то период элемента 6' равен е. По теореме 14 степенью поля ®1) будет такое наименьшее натуральное число ш, что —1 кратно е. Более того, п делится на т. Таким образом, полином }г(х) неприводим тогда и только тогда, когда цш—1 не кратно е, где т — произвольный собственный делитель числа п. Приведем для иллюстрации следующий пример. Иллюстративный пример Пусть # = 2, я = 6. Найдем значения I, при которых полином ;) неприводим. Решение. Целое число цп — 1=26—1 = 63 = 32«7. Нетри- Нетривиальными делителями числа 63 являются е = 3, 7, 9, 21. Соб- Собственными делителями числа п являются числа т=1, 2, 3. Тогда <7т—1 = 1, 3, 7. Отсюда следует, что в случае е = 3 или 7 соответствующие полиномы приводимы. Но тогда М*) ПРИ" водим при 0</<63 тогда и только тогда, когда / делится по меньшей мере на одно из чисел 9 или 21. Следовательно, }г(х) неприводим, кроме случаев /=9, 18, 27, 36, 45, 54, 21, 42. Упражнения Определить значения /, при которых полином /* (х) неприводим, если: 1. ?=2, л=5; 2. <7 = 4, л=3; 3. <7 = 3, «=2; 4. <7=3, л=3; 5. ?=9, «=3; 6. ?=5, л=4. 16. Кубическое преобразование. Пусть !г(х)=[§(х)]г, где #(л;) неприводим над Рд и его степень ш делит п, причем п=* = пгг. Тогда отображение Тс: !г(х) ->!ы{х) множества М всех полиномов /*(л;) в себя называется кубиче- кубическим преобразованием. Оно отображает полином §(х) на Тс{8) =8з(х), где 8г(х) — характеристическая функция эле- элемента б3' над Ря, рассматриваемого как элемент поля /^F), и
Конечные поля 33 1?F')=0. Очевидно, Тс определяется отображением мультипликативной группы К* поля К=Рд(®) в /С*. Теперь ясно, что кГ = к*а. F8) В этом случае говорят, что Тс является периодическим пре- преобразованием на множестве полиномов !г(х) или, что то же са- самое, на множестве полиномов §(х), если Г? [/, (х)] = !{(х) при произвольном целом положительном -у- Целое число -у назы- называется периодом преобразования Гс. Тогда &$(х) = §(х), где C = 3\ Очевидно, Тс периодично на множестве полиномов }г(х) тогда и только тогда, когда существуют такие целые у и 5, что C* — ^*) I =0 (той <7П — 1). F9) Однако к — первообразный корень степени е из единицы, где цп— 1=ес1, а й — наибольший общий делитель чисел ^и^п— 1, Следовательно, Тс периодично тогда и только тогда, когда су- существуют такие целые у и 5, что ЗV = <78 (той в). G0) Поэтому Зие должны быть взаимно простыми. Теорема 26. Пусть §(х) — неприводимый над Ря поли* ном степени пг, и пусть §(х) принадлежит показателю е. Тогда кубическое преобразование §(х) —*§з(х) будет периодическим тогда и только тогда, когда е не кратно 3. Когда е не кратно 3, все образы кга кубического преобразо- преобразования имеют период е и определяют одно и то же поле. Тогда соответствующие полиномы §г(х), где / = За, все являются не- неприводимыми, имеют степень пг и принадлежат показателю е% Займемся теперь вопросом о неприводимости полиномов &з(*), в случае, когда е кратно 3. Теорема 27. Пусть §(х) — неприводимый над Рд полином степени т, принадлежащий показателю е = 3ре, где г и 3 взаимно просты. Тогда ёг{х) является квадратом неприводи* мого полинома в том и только в том случае, когда т==2\х четно, C=1 и <7М'=ЕЕ1 (той г). Полином &ъ(х) равен кубу неприводи- неприводимого полинома тогда и только тогда, когда C>1, т = 3\х кратно 3 и ^V^=\ (той З^е). Во всех остальных случаях полином ( неприводим. 3 Зак. 243
34 А. А. Альберт Пусть §(к)=Оу где к имеет период е. Тогда §з{х) =[Л(-*0]6, где Л(х) — минимальная функция элемента к3 над 7^. Таким образом, степень полинома Н(х) есть степень \х поля Ря(к3) над 7^ и т = |дб, где /^(Л) имеет степень б над Рд(к3). Очевидно, 6=^=3, так что 6 = 1, 2 или 3. Если 6=2, то пг четно, т = 2|ы, (пюйе), ^=1 (той З^-'е), но ^^ 1 (тоДе). Так как = (^м-—1)(^м-+1), то ^=-—1 (тойЗ) и, значит, C=1. Обратно, если C=1, т = 2\х и ^=1 (тос1е), то степень поля Рд(к3) над /^ равна |а и 6=2. Если 6=3, то т = 3\1 и 1 (тойЗ^е). Если C=1, то е = 3в и <?>'^ 1 (тойЗе), так как в противном случае степень поля /^(й) над /\, не была бы равна т. Отсюда ^ = 2 (тос! 3) и 72[Х+<7м'+1 ==4+2+1 == = 1 (тос!3), откуда #т = 2 (тос!3), что ведет к противоречию. Таким образом, C>1. Обратно, если |3>1, т = Ъ и ^^^ = 1 (той 3^~1е), то степень поля Ря(к3) над /^ равна \х и, значит, 6=3. Ясно, что полином ^з(*) неприводим во всех остальных случаях, т. е. когда C = 0 или C=1 и при этом т либо нечетное, либо такое четное число 2|ы, что ц^ ф \ (тойе), или когда C>1 и при этом т либо не кратно трем, либо если оно кратно 3, т. е. т = 3\1у тогда ц* ф 1 (тойЗ^е). Основное преимущество кубического преобразования со- состоит в том, что, когда полином §(х) дан, вычисление поли- полинома &з(х) выполняется относительно просто. Вычисления по- полиномов §"*(*) для других значений /, вероятно, слишком трудоемки. Упражнения 1. Найти период отображения Тс при ^=8 и е=7. 2. Найти период отображения Тс при ^=16 и е—Ъ. 17. Определение первообразных неприводимых полиномов. Для фиксированных п и ^ Л. Е. Диксон (Ыпеаг Огоирз апй 1Ье (ЗаЫз ТЬеогу, р. 35—42) предложил вычислительную про- процедуру одновременного определения всех неприводимых над Рд первообразных полиномов степени п. Этот метод основан на формуле для произведения Л(а:; ^» Л» е) всех различных не- неприводимых над Рд полиномов степени я, принадлежащих по- показателю е. Действительно, пусть G1) где рг — различные простые делители числа е. Пусть 2 = = (ри •••! Рг)—множество простых чисел ри ^ = (/7^, ... •••> Ри) — любое подмножество множества 2, состоящее из к
Конечные поля 35 элементов, и |1 №>) = *. |хBЛ) = - 1—- (*=1, ..., г). G2) Положим {И-} —-х:**— 1 G3) для всех целых положительных \х и = П №)Ь G4) 2^2 так что й&(л;) представляет собой произведение ог,к множите- множителей, где аГг и — число сочетаний из г элементов по к. Тогда по(х)=хе—1. Применяя процедуру, описанную в разд. 6, по- получим Л (х; д, т, е) = $&, G5) где Ло(*)= П О» И. G6) О < 2к < г П О»+1(*)- G7) ^ 1 Мы не будем приводить деталей вычисления. Очевидно, Л(*; ц, п, 9П~1)—произведение различных неприводимых первообразных полиномов степени п. Метод Диксона использует равенство G5) следующим об- образом: будем искать /(я) в виде ]... +а п, где щ^Рд и подлежат определению. Первообразными неприво- неприводимыми полиномами будут полиномы /*(л;), где I пробегает все целые числа, меньшие чем х — цп—1 и взаимно простые с т. Более того, тогда и только тогда, когда 6й сопряжено с 6', т. е. = /<75 (тос1т). Таким образом, мы можем начать с перечисления тех значе- значений I, которые взаимно просты с т и дают различные значения полиномов }г(х)у а Л(л;; ц, п, цп — 1) — произведение этих поли- полиномов. Использование этого результата состоит в том, что если А(х\ 9, я, цп — 1) кратно }(х), то можно написать
36 Л. Л. Альберт где коэффициенты полинома }\(х) суть полиномы от аи ...,ап. Так как полином !\(х) должен быть равен нулю, его коэффи- коэффициенты должны быть равны нулю, и мы получили систему урав- уравнений с неизвестными а,\, ..., ап. Вторая процедура состоит в следующем: если / и т взаимно просты, то существует такое целое 5, что /$=1 (тос!т). Таким образом, 1г(х) и 1(х8) имеют одни и те же корни и отсюда сле- следует, что }(х8) является степенью полинома !г(х). Заметим, что если то к— первообразный корень из единицы, кх=1. Отсюда кх1&=— ^ если т четно. Используя полученные соотношения, часто оказывается воз- возможным выразить полином ^(х) с помощью !(х8) и, значит, записать Л (а:; ц, п, цп — 1) в виде произведения полиномов, включающих только коэффициенты полинома !(х). Получен- Полученные таким образом уравнения позволяют определить как }(х)у так и другие неприводимые первообразные полиномы сте- степени п. Указанный метод проиллюстрируем примерами. Иллюстрирующие примеры I. а) Пусть 9 = 3, я = 2, так что ?(х) =х2+ах + Ь и т=8. Тогда !(х)=!г(х) и Ы*)=/15(*)=Ы*). Таким образом, Применяя равенства Й8=1 и Й4=—1, получаем 1(к5)=к10+] + ак5+Ь = к2+(—а)к + Ь. Но тогда !5(х)=х2 — ах + Ь и (х2 + ах + Ь) (х2 — ах+Ь) =л;4+1. Это дает 2Ь = а2, 62=1, и отсюда = — 1, а=1 или —1. Тогда — 1, }5(х)=х2 — х— — два неприводимых над ^з первообразных полинома второй степени. Ь) (Первый альтернативный метод.) Запишем х2 = — ах — Ь, х3 = — а (— ах — Ь) — Ьх = (а2 — Ь) х+ аЪ, Отсюда аBЬ — а2)=0, —а2Ь + Ь2 = — 1, значит, 62=1, как и выше. с) (Второй альтернативный метод.) В поле ^з уравнение х2 = — 1 не имеет корней и, следовательно, определяет поле ^(^) степени 2, где к имеет период 4. Так как а2=1 для всех у то один из элементов к+\ или к— 1 должен быть перво-
Конечные поля 37 образным. Действительно, элемент 6 = /г~-■ 1 — первообразный, так как 62 = /г. Тогда б2 — 6— 1=0. Элемент —0, также перво- первообразный, и получаем }5(х)=х2 + х -~ 1. II. Пусть # = 5 и я = 2. Тогда т = 24, фB4)=8 и из восьми целых чисел 1У взаимно простых с т и меньших чем т, можно составить следующие пары сопряженных первообразных эле- элементов: е, е5; е7, в35 = вп; е13, е65 = е17; е19, е95 = б2з = Заметим также, что 617= (б7). Теперь Применяя равенства л;24=1 и л;12=— 1, находим ^(л;13) =л;26+1 ах13 + Ь = х2— ах + Ь = }п(х). Тогда Ь17(х)=Ьх2— ах+Л и 2г (х) = Ьхг + ах +1, так что = ЬЦх* — х*— 1). Получаем Ь2= — 1 и 2а2 = Ь, что дает следующие полиномы вто- второй степени: , х2 — х + 2, х2+2х — 2, х2 — 2х — 2. Этот пример можно также решить, выполнив деление поли- полинома х8—х4+1 на х2 + ах + Ь, как и в примере 1Ь. Его можно решить также способом, примененным для примера 1с, при этом Й2 = 2, и в поле Ръ Й4 = 4 =—1 и период элемента к раве'н 8. Тогда элемент р = 1+/г обладает тем свойством, что р2=*1+^2й + /г2= = 3 + 2/е, р3=C + 2/г)A+/е) = 3 + 4 + 5/г = 2, BрK= 16=1 и, зна- значит, период элемента 2р равен 3. Но в таком случае 2р/г = = 2йA + й) =2й + 4 = 6 имеет период 24. Таким же образом (9— 4J=62 — 88+16 = 4/г2 = 8, 82 + 28 —2 = 0, и мы получим 1(х)=*х* + 2х — 2. Так как 67 = 66в = 8Bр/гN = е26.4 -8 = 38, то (87J=C8J= —B —28)=—2 —38 =—2 —87 и мы получаем }7(х)=х2+х + 2. Запишем оставшиеся полиномы: Зх2/7A/х) = = 3Bх2+х+:1)=х2 + Зх+3 = х2 — 2х — 2 и —Зх21(\/х)=*—3 X X (—2х2 + 2х+1)=х2 — х+2. III. Пусть ^ = 3 и /г = 4. Полиномы второй степени х2+х — 1 и х2 — х — 1 определяют неприводимые полиномы четвертой степени х^+х2— 1 и л;4 — х2— 1, принадлежащие показателю 16 (см. теорему 18), и произвольный корень к каждого из ука- указанных полиномов четвертой степени определяет поле Ръ{к) степени 4 над Р$. Пусть § = к2—к, где Л4 = Л2+1. Тогда в поле
38 Л. Л. Альберт и /е5 = 63 + /г. Значит, — к_ 1)^_к2_1г_ 1+й3 — к + к2 — 1 — /г3 — /г = 1. От- Отсюда следует, что д = §к — первообразный элемент поля Рз(к). Но 8 = /г3 — /г2, 82 = /г4(/г2 + /г+1) = 1 — /г2 + /г3+/г + /г2+ — к3— к2 — /г3=1 + , 83=82 — 6 — 2/г и 84=- = 63 — 62 + /г4 — /г3 = 83 — 62+ F2+1 — к3) =63 — 82 — 8 +1. Итак, мы получили неприводимый первообразный полином ?(х) = Упражнения 1. Определить неприводимый над Рв первообразный полином четвертой степени. 2. По теореме 14 и приложению I полином хв+х5+хА+х2+х+\ непри- неприводим над Р$. Найти неприводимый первообразный полином. 3. Доказать, что полином хР—х + а будет неприводимым и первообраз- первообразным тогда и только тогда, когда а — первообразный элемент поля Рр и ко- корень полинома ур=у+1 принадлежит показателю в={р? — 1)(р — I). Указание: показать, что произведение корней полинома хр=х+а равно а = Л и положить х=ау. 4. Пусть 0 — корень одного из неприводимых полиномов второй степени из иллюстративного примера II, так что полином х3 — 9 неприводим над р25- Найти соответствующий неприводимый полином над У^ шестой степени. 5. Пусть 96 + 293 + 2, где используется один из результатов упражнения 4. Показать, что ао+а19 + а292+аз93+а494+а595 принадлежит полю Р^ъ тогда и только тогда, когда ао=О, а4=3а1 + 4оь2 и а5=2а1 + 3а2. Доказать также, что г|)=9 + 92+294 является первообразным элементом поля У7^ и что г|K= = 2г|) + 3 (результат принадлежит Е. Н. Мооге). 6. Доказать, что полином хъ = х— 1 неприводим над У^. 7. Пусть 99 = 9+1 над Р2. Показать, что 9 принадлежит показателю 73 и что 9 + 94+96 + 97+98 принадлежит показателю 7. Тогда их произведение принадлежит показателю 29—1 и поэтому является первообразным элемен- элементом поля ^3(9). Показать, что это произведение является корнем полинома 10— \)(х— I)-1. 18. Смешанные результаты. В этом заключительном раз- разделе теории конечных полей мы без доказательства приведем несколько известных результатов. Первые из них взяты из книги Диксона «Ыпеаг Огоирз апс! Ше Оа1о15 Р1еШ ТЬеогу», р. 44—71. Элемент а^Рд будем назы- называть квадратом, если можно указать такой элемент Р^/7^, что а=C2, и неквадратом в противном случае. Это понятие лишено смысла, если ц четно. Для нечетных ц имеет место следующий результат: Теорема 28. Пусть ц нечетно. Тогда неквадраты поля Ря являются квадратами или неквадратами поля Р т, если т четно или нечетно соответственно. Опра'Ввдл'ива также
Конечные поля 39 Теорема 29. Пусть й—наибольший общий делитель на- натуральных чисел гп и ц—1. Тогда в поле Рд существует (<7—1)сН элементов, которые являются гп-ми степенями эле- элементов поля Рч. Следствие. Каждый элемент поля Рд есть пг-я степень элемента поля Рд в том и только в том случае, если пг взаимно просто с ц — 1. Диксон рассматривал число решений квадратных уравнений над полем Рд и получил следующие результаты: Теорема 30. Пусть ц — нечетно, и положим V—1 или —1 в зависимости от того, является ли отличный от нуля элемент —аC квадратом в поле Ря или нет. Тогда уравнение <хх2+$у2=у имеет в поле Рд #—V решений (ху у), если уФО, и <7 + V(<7—1) решений (х, у), если у = Теорема 31. Пусть ц нечетно, и положим V=1 или —1 в зависимости от того, является или нет отличное от нуля про- произведение —0С1 . .. <Х2т квадратом в поле Рд. Тогда уравнение ... +<Х2тх1т = У имеет в поле Рд ^2т~1—V^т-^ решений, 1 ( 1) 0 д если -у^О, и 92т~1 + V(9т — д™) решений, если у = 0. Теорема 32. Пусть ц нечетно, и положим со = 1, —1 или 0 в зависимости от того, является ли выражение (—1)т/уа1..* ... агт+1 в поле Рд квадратом, неквадратом или равно нулю, причем произведение а\ ... с&гт+^О. Тогда уравнение 04^-}- ... • • • +а2т+1-х-2т+1==^ имеет <72т + ю#т решений. Полином }(х) с коэффициентами из поля Ря определяет ото- отображение поля Рд в себя. Это отображение является взаимно однознач- однозначным отображением на себя, если уравнение }(х)=а имеет в поле Рд решение для каждого а^Рд. Каждый такой полином определяет так называемое аналитическое представление под- подстановки I на конечном множестве Рд. Этот полином назы- называется полиномом подстановки для поля Рд. Так как для ка- каждого элемента %€ Р то в дальнейшем можно ограничиться изучением полиномов сте пени не более чем ц — 1. Теорема 33. Два различных полинома определяют личные подстановки на множестве Рд.
40 А А. Альберт В самом деле, если для всех %€.РЯ, }{1) =§A)> то полином }(х)=§(х) степени не более ц—1 имеет ц корней и поэтому тождественно равен нулю. Теорема 34. Полином хт является полиномом подстанов- подстановки для поля Ря тогда и только тогда, когда пг и ц — 1 взаимно просты. Теорема 35. Если <7 = рп, где п нечетно и р = 5т + 2 или = Ът — 2, то полином }(х) = 5л;5+5ал;3 + а2л; является полино- полиномом подстановки для произвольного а Теорема 36. Пусть рг—\—йе и пусть элемент а^Ря не может быть представлен в виде й-й степени ни одного из эле- элементов поля Рд. Тогда х(ха — а)е — полином подстановки поля Ря. Теорема 37. Полином га является полиномом подстановки для поля К = РГ, г = дт тогда и только тогда, когда х = 0 — единственное в К решение урав- уравнения <ф(л:)=О. Множество всех подстановок такого вида на К есть группа, которая называется группой Бетти — Матье. В статье «Критерий неприводимости функций в конечном поле» (ВиИеПп о} гНе Апгепсап МагН. Зое, XIII A906—1907), 1—8) Л. Е. Диксон получил следующие результаты: Теорема 38. Полином [(х) из кольца Рч[х] неприводим] когда ц нечетно, только в том случае, если его дискриминант есть квадрат или неквадрат в зависимости от того, является ли степень полинома }(х) четной или нечетной. Теорема 39. Пусть ц нечетно. Тогда полином третьей сте- степени имеет в Рд в точности один корень только в том случаеё если его дискриминант не является квадратом. Теорема 40. Полином третьей степени х3+ах + $ неприво- неприводим над Рд (д = рп, Р>3) тогда и только тогда, когда выраоюе- ние (—4а3—27р2) не является квадратом вида 81|ы2 в Ря и 1 _____ . — Т ' (—Ь-{-\х,у — 3) не является кубом в поле РЯ{У — 3).
Конечные поля 41 Теорема 41. Пусть /(х) = х* + ахв + Ьх2 + сх + A9 где сф х-аЬ—$а3и а, Ь, су й^Рп, <7=РП нечетно. Тогда!(х) неприво- неприводим над Ря в том и только в том случае, когда элементы кЪ — -«г#2) —& и ~и\а* — п2Ь-\-\6с1 не являются квадратами. Теорема 42. Пусть {(х) удовлетворяет условию теоре- теоремы 41. Тогда }(х) неприводим над Ря в том и только в том слу- случае, когда его кубическая резольвента имеет в Ря точно один корень у и а2 — 46 + 4у не является квадратом в Рд. В том же томе (стр. 8—10) Диксон рассматривал теорию Галуа для конечных полей. Диксон опубликовал статью, которая называется «Инва- «Инварианты модулярных представлений бинарных форм» (Тгапз- асИопз о! (Не Апгепсап МаИг. 8осге1у, VIII A907), 205—232). Позже, в статье «Исследование инвариантов неприводимых би- бинарных модулярных форм», ТАМ8, XII A911), 1 —18, он изучал бинарные формы над модулярным полем и на стр. 75—98 — общие формы. В более поздней работе он получил результат, упомянутый нами в теореме 24. В своей статье «О троичной алгебре и тернарных кубических формах», ВАМ8, XIV A907— 1908), 160—169, Диксон изучал также кубические формы над Рд. Форма 1(х) =!(хи ..., хп) называется нулевой формой, если над Рд существует такой ненулевой вектор |=(^ь ..., |п), что . Он получил следующие результаты. Теорема 43. Пусть {(х)=1(хи х2у х3) —тернарная кубиче- кубическая форма над Рд, где ц нечетно. Тогда \(х) не является нуле- нулевой формой в том и только в том случае, когда определитель Гессе формы }(х) равен гп}(х), где т(:Ря> и полином 1(х\,ХиО) неприводим над Ря. Теорема 44. Пусть [(х) = ах\ + Ьх\х2-\-сх\хг + с1хгх1 4- + еххх\ + ^х^х^ + ^2 + ^Х1хг "Ь ^Х2Х1 "Ь *Х1 — тернарная ку- кубическая форма над полем Ря, где # нечетно, а пусть За Ь с 6= 2Ъ 2Л а з§ н Тогда }(х) не является нулевой формой в том и только в том случае, когда $(х) имеет линейный множитель в поле 1, 1,0) — неприводим над Ря, и 8Ф0.
42 А. А. Альберт В этом же томе (стр. 313—318) Диксон вывел формулу для числа различных решений в поле Р т однородного уравнения с двумя неизвестными !{х\, х2) =0 степени г над Рд. В данном случае говорят, что два вектора (хи х2) и (уиу2) являются одинаковыми решениями/ если (уи у2) =к(х\, х2)у к^Рдт, В статье «Инвариантное преобразование квадратичных форм над СРBп)»у А1М, XXX A908), 263—281, Диксон получил не- несколько частных результатов относительно квадратичных форм над конечным полем характеристики 2. В статье «О представлении чисел модулярными формами», ВАМ8, XV A908—1909), 338—347, Диксон высказал следую- следующее предположение: Теорема 45. Каждая форма степени гп от т+1 перемен- переменных над конечным полем является нулевой формой. Диксон доказал эту теорему для га = 2 и 3. В общем случае теорему доказал Шевалье — «Доказательство одной гипотезы Артина», НатЪиг§ АЬНапс11ип§епу XI A935), 73—75. Ниже следует список других статей об уравнениях с не- несколькими переменными над конечным полем. ЛИТЕРАТУРА 1. АгНп Е., (ЭиаёгаИзсЬе Кбгрег т ОеЫе1е ёег ЬбЬегеп Когщшепгеп, Маш. геИзскг., 19 A924), 230—231. 2. С а г П12 Ь., 5оте АррПсаИопз о! а ТЬеогет о! СЬеуаПеу, Вике МаШ. /., 18 A951), 811—819. 3. С а г П 12 Ь., 5оте РгоЫетз 1пуо1у1п§ РгшШуе Коо1з т а ПпИе ПеЫ, Ргос. Л/а/. Асай. За., 38 A952), 314—318. 4. С Ь о XV 1а I., Оп Шапп^'з РгоЬ1ет (тоё р), Ргос. N0,1. Асай. Зси 1п(Иа, 5ес. А, 13 A943), 195—220. 5. С о г п а с с Ь 1 а С, 5и11а соп^гиепга хп + уп =гп (тоё р), Сюг. сИ таг., 47 A909), 219—263. 6. В а у е п р о г 1 Н., Оп Ше О151г1Ьи11оп о! РиаёгаИс КезЫиез (тоё р), ]оиг. Ьопйоп Маш. Зое, 6 A931), 49—54. 7. Э а у е п р о г 1 Н., Наззе Н., О1е Ыи1151е11еп ёег Коп§гиеп22е1аГипк11о- пеп 1п ^ешззеп гукПзсЬеп Ра11еп, 1оиг. }. Маш., 172 A935), 173—175. 8. В \ с к 5 о п Ь. Е., Оп Ше Ьаз! ТЬеогет оГ Регта!, Ме8зеп§ег о/ МагН, зег. 2, 38 A908), 14—32. 9. В [ с к 5 о п Ь. Е., Оп Ше Ьаз! ТЬеогет о! Регта!, О.иаг1. 1оиг. МаШ., 40 A908), 27—45. 10. О1скзоп Ь. Е., Оп Ше Соп^гиепсе хп+уп+гп =0 (тоё р), Атег. МаШ. МопШу, 15 A908), 217—222. 11. О1скзоп Ь. Е., Оп Ше Сопдгиепсе хп+уп + гп е=о (тоё р), 1оиг. /. Маш., 135 A909), 134—142. 12. О1скзоп Ь. Е., Ьо^ег ЫтИ !ог Ше ЫитЬег о! 5е1з о! ЗокШопз о! хе + уе + ге==0 (тоё р), 1оиг. /. Маш., 135 A909), 181 — 188. 13. О1скзоп Ь. Е., Сус1о1оту апё Тппогша1 Соп^гиепсез, Тгапз. Атег. Маш. Зое, 37 A935), 363—380; 38, 187—200. 14. О1скзоп Ь. Е., Соп^гиепсез 1пуо1уш§ Оп1у еШ Рочуегз, Асга АгИН., \ A935), 161—167.
Конечные поля 43 15. О1скзоп Ь. Е., Сус1о1оту, Н1^Ьег Соп^шепсез, апё Шапп^'з РгоЫет. I, Атег. 1оиг. Маш., 57 A935), 391—424. 16. О1скзоп Ь. Е., СусЫоту, РП^Ьег Соп^гиепсез, апё Шапп^'з РгоЬ- 1ет. II, Атег. 1оиг. Маш., 57 A935), 463—474. 17. Р а I г с 1 о 1 Ь О. В., А Зиттагу о! Ые^ НезиНз сопсетт^ Ше 5о1и1юп о! ЕяиаИопз т РтИе ПеЫз, Ргос Л/а/. Асай. 8си, 37 A951), 619—622. 18. Р а 1 г с 1 о 1Ь О. В., V а п с! 1 V е г Н. 5., Оп Ше МиШрНсаИуе РгорегИез о! а ОепегаНгеё ^соЫ — СаисЬу СусЫогтс Бит, Ргос. МаИг. Асаа1. 8 си, 36 A950), 144—151. 19. Р а 1 г с 1 о 1 Ь О. В., V а п сП V е г Н. 5., Оп Сег1ат ОюрЬапИпе ЕяиаИопз т Шп^з апё ПеЫз, Ргос. Маш. Асаа*. 8си, 38 A952), 52—57. 20. Се^епЬаиег Ь., ОЬег ет ТЬеогет ёез Неггп Рерт, У/1еп. 8Игипцз- Ъег., II, 95 A887), 838—842. 21. Нагёу С. Н., Ы И1 е ^ о о ё У Е., ТЬе ЫитЬег тF) т Шапп^'з РгоЫет, Ргос. Ьопйоп Маш. 8ос, зег. 2, 28 A927), 526—528. 22. Ни а Ь. К., М1п 5., Оп Ше ЫитЬег о! 5оНи1опз о! Сег1ат Соп^гиепсез, 8с1 Яер1 Ыа1. Тз1п§ Ниа Паю., 4 A940), 113—133. 23. Ниа Ь. К-, УапсПуег Н. 5., Оп Ше Ех1з1епсе о! 5о1иИопз о! Сег1а1п ЕяиаНопз 1п а ПпНе ПеЫ, Ргос. Ыаг. Асай. 8си, 34 A948), 258—263. 24. Н и а Ь. К., V а п ё 1 V е г Н. 5., СЬагас1егз оуег Сег1а1п Турез о! Кш^з ш[Ъ. АррПсаНопз 1о Ше ТЬеогу о! Е^иа^^оп5 1п а РтНе ПеЫ, Ргос. Ыа(. Асай. 8си, 35 A949), 94—99. 25. Ниа Ь. К., Уапё1уег Н. 5., Оп Ше ЫитЬег о! 5о1и1юпз о! Зоте Тп- пот1а1 Е^иа^^оп5 1п а ПпИе ПеЫ, Ргос. Ыаг. Асай. 8с1., 35 A949), 477—481. 26. Ниа Ь. К., УапсПуег Н. 5., Оп Ше Ыа1иге о! Ше 5о1и1юпз о! Сег1ат ЕяиаИопз 1п а РтПе ПеЫ, Ргос. Ыаг. Асай. 8си, 35 A949), 481—487. 27. Н и 11 К., ТЬе ЫитЬег о! 5о1иИопз о! Соп^гиепсез 1пуо1у1п§ Оп1у кИ Ро^егз, Тгапз. Атег. Маш. 8ос, 34 A932), 908—937. 28. НигчуПг А., ОЬег <Ие Коп^гиепг ахе + Ьуе+сге^0 (тоё р), 1оиг. МаШ., 136 A909), 272—292. 29. ^ а с о Ъ1 С. О. X, ОЬег сИе КшзШеПип^ ипё 1Ьге Ап\уепёип§ аиГ сНе 2аЫепШеог1е, 1оиг. (. Маш., 30 A846), 181—182, ог УРегке, 6, 254—94. ВегПп, Уег1а^ уоп Сеог§ Не1тег, 1891. 30. Кит тег Е. Е., ОЬег сНе 2ег1е^ип§ ёег аиз Шигге1п ёег Е1пЬеИ &еЫ1- ёе!еп сотр1ехеп 2аЫеп 1П Шге Рг1т!ас1огеп, 1оиг. }. МаШ., 35 A847), 328—329. 31. Кит тег Е. Е., Мётспге зиг 1ез потЬгез сотр1ехез сотрозёз ее гас'тез ее ГипИё е! ёез потЬгез епИегз, ]оиг. йе Ма1п., зег. 1, 16 A851), 377— 498. - 32. Кит тег Е. Е., ОЬег сНе Ег^апгип^ззаЧге ги ёеп а11^ете1пеп Нес1рго- сИаЧ5^езе12еп, ]оиг. {. Маш., 44 A852), 95—100. 33. Ь а п ё а и Е., Уог1езип^еп йЬег 2аЫепШеопе, I, 296, Ье1р21^, Уег1а§ уоп 5. Н1гге1, 1927. 34. Ье^ез^ие М., НесЬегсЬез зиг 1ез потЬгез, 1оиг. д,е МаШ.., зег. 1, 2 A837), 253—292. 35. Ье^ез^ие М, НесЬегсЬез зиг 1ез потЬгез, 1оиг. д,е МагН., зег, 1, 1 A838), 113—145. 36. Ье^езяие М., Оетопз1гаНоп ее яиеЦиез !огти1ез ё'ип тёто1ге ее М. ^асоЫ, 1оиг. йе МагН. зег. 1, 19 A854), 289—296. 37. ЫЬг1 С, Мет. ё1уегз зауап1з ас. зс. ее ПпзШи! ее Ргапсе (таШ.), 5 A838). 38. М1 п 5., Оп 5уз1етз о! А1^еЬга1с Е^иа^^оп5 апё Сег1а1п МиШр1е Ехро- пепИа1 5итз, 0,иаН. 1оиг. Маш., ОхЬгё зег., 18 A947), 133—142. 39. .М 11 с п е 11 Н. Н., Оп Ше ОепегаП7её ^асоЬ^ — Киттег СусЫогтс Рипс- Попз, Тгапз. Атег. МагН. 8ос, 17 A916), 165—177.
44 А. А. Альберт 40. МНсЬеП Н. Н., Оп Ше Соп^гиепсе сха + \^--с1уа т а СаЫз Р1е1ё, Апп. Маш., зег. 2, 18 A917), 120—131. 41. МогёеМ 1^. »1., ТЬе ЫитЬег о! 5о1и1юпз оГ Зоте Соп^гиепсез т Т\уо УапаЫез, Магк. 1еШскг., 37 A933), 193—209. 42. Р е 11 е 1 А. Е., МёШоёе поиуеИе роиг ё1У1зег 1е сегс1е еп рагИез ё&а1ез, Сотр1ез гепйиз (Рапз), 93 A881), 838—840. 43. Р е 11 е I А. Е., Мётсмге зиг 1а Шёопе а1§ёЬп^ие ёез ё^иа^юп5, Ви11. Зое. таИг. йе Ргапсе, 15 A886—87), 80—93. 44. Р ё р 1 п Р., 5иг сНуегз 1еп1аЦуез ее ёётопз1гаИоп ёи Шёогёте <3е Регта!, Сотргез гепйиз (Рапз), 91 A880), 366—368. 45. Р 1 и т а С. М., 1п1егпо аё ипа сопдгиепга ё1 тоёи1а рпто, Апп. 6,1 таг., зег. 2, 11 A882—83), 237—245. 46. К ё ё е 1 Ь., 2иг ТЬеопе ёег О1е1сЬип^еп 1п епсШсЬеп Кбгрегп, Ас1а 11пш. Зге^ей, 11 A946). 47. ЗсЬиг I., ОЪег сИе Коп^гиепг хт+утш==гт (тоё р), 1апгезЬег. ВеигзсН. тагк. Уегешвипв, 25 A916), 114—117. 48. 5 с Ь чу а г ъ 5., Оп Шапп^'з РгоЫет !ог РтНе Р1еИз, §иаг1. 1оиг. Магк., ОхЬп! зег., 19 A948), 123—128. 49. 5 с Ь чу а г г 5., Оп ап Е^иа^^оп т Р1п11е Р1е1с15, О.иаН. 1оиг. Магк., Ох- 1огс1 зег., 19 A948), 160—163- 50. 5 с Ь \у а г г $., Оп ип1Уегза1 Рогтз 1п РтИе Р1е1с1з, Сазорьз Рёзг% Маг. Руз., 75 A950К 45—50. БЬ 5сЬ>уег1п8: К., 2иг ТЬеопе с!ег агНЬтеШсЬеп РипсИопеп, ^уекЬе уоп ^асоЫ \|)(а) ^епапп! \^егс!еп, 1оиг, /. Магк, 93 A882), 334—337. 52. Т о г п Ь е 1 т Ь., 8итз о! пХЪ Ро\уегз 1п Р1е1Aз о! Рг1те СЬагас1епзНс, Оике Магк. 1оиг„ 4 A938), 359—362. 53. УагкЛуег Н. $., Зоте ТЬеогетз \п РтИе р1е1A ТЬеогушШАррНсаИопз 1о РегтаГз Ьаз! ТЬеогет, Ргос. Ыаг. Асаа*. За., 30 A944), 362—367. 54. V а A1 у е г Н. 5., Оп Тппот1а1 Соп^гиепсез апё Регта1'з Ьаз! ТЬеогет, Ргос. N0,1. Асай. Зси, 30 A944), 368—370. 55. УапсПуег Н.5., Ые\у Турез о! КеЫюпз т р1пИе р1еЫ ТЬеогу, Ргос. N0^ Асаа4. Зси, 31 A945), 50—54. 56. У а п ё 1V е г Н. 5., Оп Ше ЫитЬег о! 5о1иИопз о! Сег1а1п Ыоп-Ьото- ^епеоиз Тппогта1 Е^иа^^оп5 1п а Р1пИе Р1еИ, Ргос. N01. Асай. Зси, 31 A945), 170—175. 57. V а п ё 1 V е г Н. 5., Ые\у Турез о! КеЫюпз т РтЛе Р1е1ё ТЬеогу, Ргос. N01. Асай. Зси, 31 A945), 189—194. 58. V а п ё 1 V е г Н. 5., Оп Ше ЫитЬег о! 5о1иИопз о! Зоте Сепега1 Турез о! Е^иа^^оп5 т а Р1пИе Р1е1ё, Ргос. Nа^. Асаа4. Зс1., 32 A946), 47—52. 59. Уапё1Уег Н. 5., Оп С1аззез о! ЭюрЬапИпе Е^иа^^оп5 оГ Н1^Ьег Эе^гее ШЫсЬ Науе N0 Зо1и1юпз, Ргос. N01. Асай. Зси, 32 A946), 101 — 106. 60. Уапё1Уег Н. 5., СусЫоту апё Тг1пот1а1 Е^иа^^оп5 1п а РтНе Р1е1ё, Ргос. N01 Асаа4. Зси, 32 A946), 317—319. 61. УапсПуег Н. 5., Оп Зоте Зрес1а1 Тг1пот1а1 Е^иа^^оп5 1п а РтНе Р1е1ё, Ргос. N01. Асаа4. Зси, 32 A946), 320—326. 62. Уапё1Уег Н. 3., ЫтИз !ог Ше ЫитЬег о! ЗоШНопз о! Сег1а1п Оепе- га1 Турез о! Е^иа^^оп5 т а Р1пИе Р1е1ё, Ргос. Nа^. Асаа4. Зси, 33 A947), 236—342. 63. V а п ё 1 у е г Н. 3., АррПсаИопз о! Сус1о1оту 1о Ше ТЬеогу оп Ыоп-Ьото- ^епеоиз Е^иа^^опз т а Р1пИе р1е1ё, Ргос. N01. Асаа4. Зси, 34 A948), 62—66. 64. У а п ё 1 у е г Н. 3., (ЭиаёгаИс КеЫюпз 1пуо1у1П^ Ше МитЪегз оГ 5о1и- Иопз о! Сег1а1п Турез о! ЕяиаИопз 1П а Р1п11е Р1е1ё, Ргос. N01. Асай. Зси,ЪЬ A949), 681—685. 65. V а п ё 1 у е г Н. $., Оп а ОепегаПгаЪ'оп о! а ^соЫ ЕхропепИа! Зит Аззос1а1её т\Ъ Сус1о1оту, Ргос. N01. Асаа4. Зси, 36 A950), 144—151.
Конечные поля 45 66. XV а г п 1 п а Е. уоп, Ветегкип&еп гиг \'<эгз{епепс1еп АгЬеН уоп Неггп СНе- уа11еу, АЫгапй1. а. й. таИг. Зеттаг й.НатЬиг{у.1!пж.,\\ A936), 76—83. 67. Ш е 11 А.,1\[итЪег о\ 5о1и1юпз о! Е^иа^^оп5 т РтНе Р1еЫз, Ви.11. Атег. МагН. Зое, 55 A949), 497—508. 68. ШЬ11е т а п А. Ь., ТЬеогетз Апа1о^оиз 1о ^соЪз1апГз ТЬеогет, пике ММ. 1оиг., 16 A949), 619—626. 69. Ш п 11 е т а п А. Ь., ТЬеогетз оп (ЭиаёгаИс РагШюпз, Ргос. Ыаг. Асай. Зси, 36 A950), 60—66. 70. \У Ь 11 е т а п А. Ь., РтИе Роипег Зепез апё Сус1о1оту, Ргос. Ыа(. Асай. За., 37 A951), 373—378. П Р ИЛОЖЕН И Е I ТАБЛИЦА НАИМЕНЬШИХ ПЕРВООБРАЗНЫХ КОРНЕЙ Следующая таблица представляет собой список наименьших первообраз- первообразных корней б по модулю р для каждого нечетного простого р<500. Она включает также список вычетов —б по модулю р для тех первообразных корней б, для которых —6(тос1р) является минимальным. Таблица является частью таблицы А. Канингама, X. Вудала и Т. Г. Грека (РгосеесИпдз о/ Иге Ьопйоп Мат. Зошгу, XXI A922), 343—358), где даны первообразные корни по модулю р для всех р •< 2о409. р 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 б 2 2 3 2 2 3 2 5 2 3 2 6 3 5 2 2 2 2 7 5 3 2 3 5 -б 1 2 2 3 2 3 4 2 2 7 2 6 9 2 2 3 2 4 2 5 2 3 3 5 р 101 103 107 109 113 127 1 131 137 139 149 151 157 163 167 173 179 181 191 193 197 199 211 223 227 б 2 5 2 6 3 3 2 3 2 2 6 5 2 5 2 2 2 19 5 2 3 2 3 2 -б 2 2 3 6 3 9 3 3 4 2 5 5 4 2 2 3 2 2 5 2 2 4 9 3 р 229 233 239 241 251 257 263 269 271 277 281 283 293 307 311 313 317 331 337 347 349 353 359 б 6 3 7 7 6 3 5 2 6 5 3 3 2 5 17 10 2 3 10 2 2 3 7 -б 6 3 2 7 3 3 2 2 2 5 3 6 2 7 2 10 2 5 10 3 2 3 2 р 367 373 379 383 389 397 401 409 419 421 431 433 439 443 449 457 461 463 467 479 487 491 499 б 6 2 2 5 2 5 3 21 2 2 7 5 15 2 3 13 2 3 2 13 3 2 7 -б 2 2 4 2 2 5 3 21 3 2 5 5 5 3 3 13 2 2 3 2 2 5 5
46 А. Л. Альберт ПР ИЛ ОЖЕНИ Е II ВЫДЕРЖКА ИЗ КАНОНА ЯКОБИ Вероятно, первой обширной таблицей первообразных корней была таб- таблица Якоби «Сапоп апШтеИсиз», ВегПп, 1839. Его таблица давала значения первообразного корня б по модулю р для каждого простого р<1000 и ин- индекса у(п), где 0<у<^Р—1 и п =Ьу (тоё р). Тщательно разработанные таблицы для р=5, 7, 11 и 17 весьма полезны для приложений. V. . . . п ... V. . . . п .... V. . . . п . . . . V. . . . п . • . 1 • • • • 0 0 0 1 0 2 1 2 1 3 1 2 [т 1 10 3 2 4 2 2 2 4 . е. 2 15 13 3 3 3 6 3 8 V 3 14 11 4 1 4 4 4 5 A) 4 4 8 5 5 5 5 10 — 5 6 12 6 7 6 7 1 6 7 9 7 10] 6 7 9 5 1 8 8 8 3 8 16 9 9 9 6 9 7 „-5 п ... V. ... /7 = 7 Л ... V. . . . /7=11 Л ... V. ... 1 .... „-.7 Л ... V. ... 1 .... 0 0 0 0 5 0 1 1 4 1 6 1 10 [т. 1 16 13 2 1 2 2 2 1 е. 2 10 15 3 3 3 1 3 8 3 11 12 4 2 4 4 4 2 10) 4 4 3 5 5 5 5 4 1 = 5 7 2 6 7 6 7 3 6 7 9 7 = 5] 6 7 5 9 8 8 8 8 3 8 14 9 9 9 6 9 6 ПРИЛОЖЕН И Е III ТАБЛИЦЫ БЮЗИ Эти таблицы помещены в двух статьях У. Бюзи, озаглавленных «Оа1о1з ПеИ ТаЫез 1ог рп < 169», ВАМ5, XII A905), 22—38, и «Сакмз Р1еЫ ТаЫез о! Огёег Ьезз Шап 1000», там же, XVI A909), 188—206. Каждая таблица начинается с первообразного неприводимого над РР полинома ((х) степени п для ?=рп<1000. Тогда /(*) определяет поле /7д=/7Р@), где /@)=0 и 0 — первообразный корень (?— 1)-й степени из единицы. Затем таблица указывает для каждого отличного от нуля элемента ^@) в Гд показатель е в выражении
Конечные поля 47 Мы приведем только несколько случаев этих таблиц, но зато дадим полный список первообразных неприводимых полиномов, полученных Бюзи. г) -—». О* у-3 ^^ у- 1 • ^-4 . V* . 1 • у-5 » у»3 _ у-2 __ Vе - 1 • у"б - V 1 • V7 V* 1 • у —-— ^* И- —— ^ — ^ ^ _ ^ _— ^ ^ ,д, И* Иг Иг 1, И- ^— Иг 1 у Иг ' Л — 1 ^ « ^. ^2 о V 9* уЗ О у Ч* у4 г3 у 9 ^/ —— О. Л ~~~~^ ЛёЛ, "^^ ^>, Л ~^^ ^/^Л. <_1, *Л^ Л Л ^. Я I / • у*2 ^__ V* _^ Л* уЗ ___ V* _^_ ^ у —— I • А, "^^ Л ~^^ Ть^ Л Л О» п 11. У2 Л у О п — 9^«у2 у 1Л // ~ • X О • шЛг ^™""" И^ ■ XX* Л/ ■ ^ С/ • И^ ^™""" И^ —— ^^^ п 01 . у2 у 1О // — 01 . X X 1 У. Приведем теперь таблицы Бюзи для рп = 23. 8 1 2 3 4 5 6 7 1 1 1 1 а, 1 0 1 1 1 0 а2 0 0 1 0 1 1 1 8 7 1 3 2 6 4 5 1 1 1 1 а, 1 1 0 0 1 1 а2 1 0 1 0 1 0 1 Дадим теперь несколько примеров результатов таблиц Бюзи, представ- представляющих только правую часть таблицы. рп = З2 рп = 24 а, 8 4 1 2 7 5 3 6 1 1 1 2 2 2 1 2 0 1 2 0 1 2 8 15 1 4 2 8 5 10 3 14 9 7 6 13 11 12 а0 I 1 1 1 1 1 1 1 а, 1 1 1 1 0 0 0 0 1 1 1 1 а2 1 1 0 0 1 1 0 0 1 1 0 0 1 1 1 0 1 0 . 1 0 1 0 1 0 1 0 1 0 1
48 А. А. Альберт е 31 1 12 2 24 13 27 3 8 25 10 14 18 28 5 4 17 9 7 26 23 11 30 15 21 19 20 29 22 6 16 а0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 рп = а2 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 а, 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 а4 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 8 1 63 1 6 2 12 7 26 3 32 13 35 8 48 27 18 4 24 33 16 14 52 36 54 9 45 49 38 28 41 19 56 5 а0 1 а, 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 а2 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 а. 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 а4 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 а5 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 8 62 25 11 34 31 17 47 15 23 53 51 37 44 55 40 10 61 46 30 50 22 39 43 29 60 42 21 20 59 57 58 Р1 а0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 г а1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2б а2 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 а3 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 а4 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 а5 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 ПРИЛОЖЕНИЕ IV НЕПРИВОДИМЫЕ ПОЛИНОМЫ НАД Р2 Следующие таблицы принадлежат Ричарду Маршу. Они называются восьмеричным представлением неприводимых над /^ полиномов {(х)=хп + ■\-а\хп-х+ ... + ап для /г<, 9. Чтобы получить все неприводимые полиномы степени п% нужно дополнить таблицу взаимными полиномами хп}(\/х) для
Конечные поля 49 каждого представленного в таблице полинома {(х). Если 1(х)=хп1(\/х), то в представлении полинома имеется звездочка. Так как коэффициенты 1, #ь • • • , ап равны 0 или 1, то каждый полином ((х) может быть представ- представлен последовательностью Ь\, ... , Ьт троек коэффициентов, где /г = 3т—1, Зт —2 или Зт —3 и &1=A00), @10), @01) в зависимости от п. Пронумеруем тройки следующим образом: 0=@00), 1= @01), 2=@10), 3=@11), 4=(Ю0), 5=A01), 6=A10), Т= A11), и тогда полином {(х) можно представить последовательностью сь ... , ст, где Сг=О, 1, ... , 7. Число е обозначает показатель, которому принадлежит !(х). Например, 433 представляет такую последовательность коэффициентов 100, 011, 011 и полином хъ+х*+х3+х+1 принадлежит показателю #=51. Таблицы Марша доведены до /г=13, и мы выписываем только первообраз- первообразные полиномы: #10+#3+1, принадлежащий показателю 1023, л:п+л:2+1, при- принадлежащий показателю 2047, х12+х*+хА+х+1, принадлежащий показателю 4095, и х13+хА+х3+х+1, принадлежащий простому показателю 8191. п 1 2 3 4 5 6 7 Пх) 2 3* 7* 13 23 37 45 57 67 103 111* 127 133 147 207 211 217 235 247 253 277 313 357 е 1 3 7 15 5 31 31 31 63 9 21 63 63 27 27 27 27 27 27 27 27 27 п 8 9 /(*) 433 435 453 455 471* 477 515 537 543 567 573 607 613 637 717 12Г 1003 1021 1027 1033 1055 1063 е 51 255 255 255 17 85 255 255 255 85 85 255 85 51 255 17 73 511 73 511 511 511 п 9 Их) 1113 1131 1137 1145 1157 1167 1175 1207 1225 1243 1257 1267 1275 1317 1333 1423 1437 1473 1517 1533 1577 1617 е 73 511 511 73 511 511 511 511 511 511 511 511 511 511 511 511 511 511 511 511 511 511
Простой вывод теоремы кодирования и некоторые применения1) Р. Г. Г ал лаг е р Для вероятности ошибки получены верхние границы, которые можно до- достигнуть при использовании блоковых кодов в общем дискретном по вре- времени канале без памяти. Дискретный по амплитуде канал и непрерывный по амплитуде канал исследуются как в отсутствие, так и при наличии огра- ограничений на входе. Основное преимущество представленного здесь подхода состоит в простоте выводов и относительной простоте результатов; с дру- другой стороны, экспоненциальное поведение границ, полученных при его по- помощи, с ростом длины блока при всех скоростях передачи, лежащих между О и пропускной способностью, является наилучшим из известных. Результаты прилагаются к целому ряду конкретных каналов и, в частности, к двоич- двоичному симметричному каналу и к каналу с аддитивным гауссовским шумом. 1. ВВЕДЕНИЕ Теорема кодирования, открытая Шенноном [1] в 1948 г., утверждает, что для широкого класса моделей каналов связи существует наибольшая скорость (пропускная способность), с которой информация может быть передана по каналу, и что при скоростях, меньших пропускной способности, информация может быть передана с произвольно малой вероятностью ошибки. Для дискретного канала без памяти наиболее сильный из известных вариантов этой теоремы был предложен Фано [2] в 1961 г. Его результат состоял в том, что минимальная ве- вероятность ошибки Ре для кодов с длиной блока Л^ ограничена при любых скоростях, меньших пропускной способности2), сле- следующим образом: е-м [ЕЬ{Я)+о{щ ^ р ^ 2е~МЕ{Я). A) В этих неравенствах Еь(%) и Е(%)—положительные функции переходных вероятностей канала и скорости ./?; О(Ы)—функ- !) О а 11 а д е г К. С, А з1тр1е (кпуаИоп о! Ше сосПп^ Шеогет апс1 зоте аррПсаИопз, 1ЕЕЕ Тгапз. 1п\огт. Ткеогу, 1Т-11, № 1 A965), 3—18. 2) В этой работе будут рассматриваться вероятности ошибок только при скоростях, меньших пропускной способности. По поводу наиболее сильного среди известных результата для скоростей, больших пропускной способно- способности, см. Галлагер [3], гл. 6.
Простой вывод теоремы кодирования 51 ция, стремящаяся к 0 при увеличении N. Для некоторого интер- интервала скоростей, меньших пропускной способности, но следую- следующих непосредственно за ней, Еь(#) = Е(%). Оказывается, что функция Е(#), особенно на интервале, где Е(#) =Е1(Я)У представляет собой с точки зрения задачи коди- кодирования основную характеристику канала. При ее помощи ясно и просто выявляется связь между вероятностью ошибки, ско- скоростью передачи данных, длительностью ограничений и харак- характеристиками канала. В последние годы в теории кодирования был найден ряд эффективных и экономичных при реализации процедур кодирования; неравенства A) дают теоретическую основу для разумного обсуждения относительных преимуществ этих процедур. Еще важнее то, что функция Е(#) дает воз- возможность произвести более содержательное сравнение различ- различных каналов, чем это можно сделать на основе пропускной спо- способности или отношения сигнал/шум. Так, например, при же- желании использовать кодирование в реальной линии связи один из первых возникающих вопросов состоит в выборе системы дискретной модуляции. Рассматривая модулирующую систему как составную часть канала, можно сравнить модуляции с точки зрения использования кодирования по соответствующим им кривым Е(%). Пример такого сравнения дается в работе Возен- крафта и Кеннеди [4]. В разд. 2 этой работы приводится простое доказательство того, что Ре<е~МЕ^я\ В разд. 3 будет установлено несколько свойств Е(Я) и детально описано, как можно вычислить функ- функцию Е(К). Это вычисление лишь немногим сложнее вычисления пропускной способности. В разд. 4 будет дано некоторое число применений теории, развитой в разд. 2 и 3. Сначала для при- примера будет получена Е(К) для двоичного симметричного ка- канала; затем будет найдена универсальная кривая Е(%) для канала с очень большим шумом, и наконец кривая Е(Я) для совокупности параллельно действующих каналов будет свя- связана с кривыми Е G?), относящимися к отдельным каналам. В разд. 5 верхняя граница для Ре будет улучшена для ма- малых скоростей; будет получена большая величина Е(%) по сравнению с той, которая приводится в разд. 2. Есть основа- основания думать, что комбинация этих двух границ даст правиль- правильное описание экспоненциального поведения наилучших кодов в зависимости от длины блока. В разд. 6 эти результаты рас- распространяются на каналы с ограничениями на входе и на ка- каналы с непрерывным входным и выходным алфавитами. И, на- наконец, эти результаты применяются для примера к каналу с гауссовским аддитивным шумом.
52 Р. Г. Галлагер 2. ВЫВОД ТЕОРЕМЫ КОДИРОВАНИЯ Пусть Хм — множество всех последовательностей длины которые могут быть посланы по данному каналу, и пусть Ум — множество всех последовательностей длины УУ, которые могут быть приняты. Предположим, что множества Хм и Ум конеч- конечны. Пусть Рг(у\х) при у^Ум и х^Хм является условной ве- вероятностью принять последовательность у при условии, что х была послана. Будем считать, что имеется код, состоящий из М кодовых слов, т. е. отображение номеров от 1 до М в мно- множество кодовых слов хь ..., хм, где хт^Хм и 1-^т^М. Предположим, что приемник производит декодирование по ме- методу максимума правдоподобия, т. е. декодер декодирует вы- выходную последовательность у в номер т, если Яг(у|хт)>Яг(у|хт') для всех т! ф т, 1</я'<М. B) С тем чтобы получить верхнюю границу для вероятности оши- ошибочного декодирования, ситуацию, в которой ни одно из т не удовлетворяет B), будем рассматривать как ошибочное деко- декодирование. Разумеется, ошибочное декодирование происходит также тогда, когда декодированный номер отличается от но- номера на входе. Пусть теперь Рет — вероятность ошибочного декодирования, когда послано хт. Произойдет ошибочное деко- декодирование, если будет принято у, не удовлетворяющее B). Та- Таким образом, для Рет имеем C) где функция фт(у) определяется следующим образом? фт (у) = 1, если Рг (у | хт) < Рг (у | хт') D) для некоторого т'фт, фт(у)=0 для всех остальных у. E) Ограничим сверху Рет, построив верхнюю границу для функции фт(у): Фт(У)< Р ИГ (у | ХтгУ'^' ' к/ т' фт . Р>0. F) Причина использования оценки F) интуитивно отнюдь не очевидна, однако по крайней мере можно установить ее спра- справедливость, заметив, что правая сторона неравенства F) все- всегда неотрицательна, и поэтому если фт(у)=0, то неравенство имеет место, Если фт(у) = 1, то в числителе имеется слагаемое,
Простой вывод теоремы кодирования 53 большее (или равное) знаменателя и, таким образом, числитель больше (или равен) знаменателя; возведение дроби в степень р оставляет ее не меньшей единицы. Подставляя F) в C), по- получим Яг(у|хт-IЛ1+рIР. G) \ для всех р>0. Неравенство G) ограничивает Рет для некоторого фикси- фиксированного множества кодовых слов. За исключением некото- некоторых частных случаев, эта граница слишком сложна для приме- применений, если число кодовых слов велико. Упростим G) с по- помощью усреднения по соответствующим образом подобранному ансамблю кодов. Пусть на множестве Хн возможных входных последовательностей канала определена вероятностная мера Р(х). Можно породить ансамбль кодов, выбирая каждое слово независимо в соответствии с вероятностной мерой Р(х). Таким образом, вероятность, связанная с кодом, состоящим из кодо- м вых слов Хь ..., хм, есть ЦЯ(хт). Очевидно, что по крайней т-1 мере один код из ансамбля будет иметь столь же малую ве- вероятность ошибки, как и средняя по ансамблю вероятность ошибки. Используя черту для обозначения среднего по ан- ансамблю, будем иметь 1 2 4 3 —I —1—1 1 1— (у|Т- (8) т'фт \ Введем теперь дополнительное ограничение р •< 1 и будем снимать занумерованные части усредняющей черты в (8). Сна- Сначала заметим, что все слагаемые в (8), находящиеся под чер- чертой, являются случайными величинами, т. е. действительными функциями множества случайно выбранных слов. Таким обра- образом, можно снять часть 1 черты в (8), так как среднее суммы случайных величин равно сумме средних. Точно так же можно снять часть 2, так как среднее произведения независимых слу- случайных величин равно произведению средних. Независимость имеет место из-за того, что кодовые слова выбираются незави- независимо. Для того чтобы снять часть 3, обозначим через | случайную величину, стоящую в квадратных скобках. Покажем, что ^р^;|р. Рис. 1 изображает ^р; на нем видно, что ^р при 0<р-<1 является вогнутой функцией !•, т. е. функцией, все хорды кото-
54 Р. Г. Галлагер рой лежат не выше функции1). Рис. 1 иллюстрирует неравен- неравенство ^р^^р в частном случае, когда ^ принимает только два значения; общий случай является хорошо известным результа- результатом2). Часть 4 усредняющей черты можно снять перестанов- перестановкой суммы и усреднения. Таким образом 3), Яг(у|хт.I/A+РТ \_т' фт ^ (9) Так как кодовые слова выбраны с вероятностью Я(х), то Я(х)Яг(у|хI/A+р). A0) Замечая, что правая часть A0) не зависит от т, подставим A0) с индексами т и т! в (9). В неравенстве (9) суммируются ( Рис. 1. Вогнутость ^р. (М— 1) таких слагаемых, поэтому получаем Я(х)Яг(у|хI/A+р) при р, 0<р< 1. (И) 1) Пусть !(х)—действительная функция векторного аргумента х, при нимающего значения в области /?. Назовем область выпуклой, если Кх\+ + (\-—'к)х2^Я при любых X! ^/?, х2 ^/? и 0< А, < 1. Функция }(х) яв ляется вогнутой на выпуклой области, если Х/(х1) + A—А)/(х2) < /[Я<х1+A — К)х2] при любых X! ^ Я, х2 ^ /? и 0 < X < 1. Функция являет- является строго вогнутой, если неравенство <! можно заменить на строгое нера- неравенство <. 2) См., например, Блекуэлл, Гиршик [5], стр. 38 (стр. 50 русского пе- перевода) или Харди и др. [14] (стр. 99 русского перевода. — Прим. перев.). 3) С помощью незначительного изменения рассуждения, использованного здесь, для перехода от (8) к (9) можно потребовать лишь попарной неза- независимости выбора кодовых слов. Поэтому полученные здесь границы при- применимы к специальным ансамблям кодов, таким, как ансамбли кодов с про- проверками на четность»
Простой вывод теоремы кодирования 55 Граница (И) применима к произвольному дискретному ка- каналу с памятью (и, в частности, к каналу без памяти), для кото- которого можно определить Рг (у|х). Она справедлива при любом выборе Р(х) и при любых 0 < р ^С 1. Для того чтобы упростить границу A1), предположим, что канал является каналом без памяти. Пусть хи ..., хп, ..., Хн будут отдельными буквами во входной последовательности х, и пусть у\у ..., уп, ..., ум будут буквами в последовательности у. Под каналом без памяти здесь понимается канал, для которого N п = \ при всех х (: Хм, у ^ У^ и любом N. Ограничимся теперь рас- рассмотрением класса ансамблей кодов, в которых каждая буква каждого слова выбирается независимо от всех остальных букв с вероятностной мерой р(х)\ х^Х^ N Я/ у.\ I I -, / у. \. у. / у. у. у. \ /1 О\ \Л} ]^^ у \^ц/1 л, — \«^1» • • • » ^п* ' ' ' ' УУ/ \ / Подставив A2) и A3) в A1), получим 1+Р A4) Выражение, стоящее в квадратных скобках в A4), можно за- записать как +р рет<(м-\г 2 П 2 Р(ХЯ)РГ(УП\ХП) 1/A +р) п A5) Заметим, что выражение, стоящее в квадратных скобках в A5), есть произведение сумм; оно приводит к выражению, стоящему в квадратных скобках в A4), с помощью арифметического пра- правила перемножения произведений сумм. Наконец, вынося в A5) знак произведения за скобки, можно снова применить то же самое правило и получить р(хп)Рг(уп\хп) 1/СИ-р)" A6) Можно несколько упростить обозначения в A6), если заме- заметить, что Х4 — множество входных букв, которые обозначим че- через аи ..., Щи •••> Як, где К — объем входного алфавита ка- канала. Точно так же У4 — множество выходных букв, обозна- обознау чаемых через Ъи ..., Ь], ... Ъ^, где / — объем выходного алфа-
56 Р. Г. Галлагер вита. Обозначим далее через Р^ переходные вероятности канала Рг(Ь^\ак), а через р(ак)=рк— вероятность, с которой буква ак выбирается в ансамбле кодов. Используя эти обозна- обозначения в A6), заметим, что все сомножители под знаком произ- произведения идентичны. Включая тривиальный случай р = 0, полу- полунаем A +Р) 0<р<1. A7) Оценивая сверху М—1 с помощью М = е^я, где ^ — ско- скорость кода в нат. ед. на символ канала, A7) можно переписать в виде к Рет < ехр A8) В силу того что правая часть A8) не зависит от т, она является границей для средней по ансамблю вероятности оши- ошибочного декодирования. Эта граница не зависит от вероятно- вероятностей, с которыми использовались кодовые слова. Так как по крайней мере один код из ансамбля должен иметь столь же малую вероятность ошибки, как и среднее значение ошибки *), то доказана следующая основная теорема. Теорема 1. Рассмотрим дискретный канал без памяти с входным алфавитом из К символов аь ..., а<к\ выходным ал- алфавитом из / символов &!,..., Ь3 и переходными вероятно- вероятностями Р^ — Рг (Ь^\ак). Каковы бы ни были длина блока /V, чис- число кодовых слов М = емп и распределение вероятностей исполь- использования кодовых слов, существует код, для которого вероят- вероятность ошибочного декодирования ограничена следующим обра- образом: Я,<ехр-ЛЧ-р/?+Я0(р, р)], A9) где р — произвольное число, удовлетворяющее неравенствам О ^ р -^ 1, а р= (ри Ръ • •*, Рк) — произвольный вероятностный вектор 2). !) Один и тот же код может удовлетворять A8) не при любых выборах вероятностей, с которыми используются кодовые слова (см. следствие 2). 2) Вероятностный вектор есть вектор, все компоненты которого неотри- неотрицательны и сумма которых равна единице.
Простой вывод теоремы кодирования 57 Теорема 1 справедлива для всех р, таких, что О^Ср^Г, и для любых вероятностных векторов р=(Рь ..., рк)У поэтому можно получить более близкую к Ре границу с помощью мини- минимизации по р и р. Приходим к тривиальному следствию. Следствие \. В условиях теоремы 1 существует код, для которого B1) р)], B2) р, р где максимум разыскивается при вариации по р, удовлетворяю- удовлетворяющим неравенствам О-*Ср<С1, и по всем вероятностным век- векторам р. Функция Е(Я) является кривой надежности, которая обсу- обсуждалась в предыдущем разделе. За исключением области ма- малых значений /? (см. разд. 5), следствие 1 дает наиболее силь^ ную среди известных границу вероятности ошибки в дискрет- дискретном канале без памяти. Свойства Е(%) будут обсуждаться в разд. 3, в котором, в частности, будет показано, что при 0</?<С, где С — пропускная способность канала. Иногда удобно иметь границу для вероятности ошибки, ко- которая применима к каждому отдельному кодовому слову, а не только к средним по ним. Следствие 2. В условиях теоремы 1 существует такой код, для которого при 1 <С тп << М вероятность ошибки при пе- передаче пг-го кодового слова ограничена следующим образом: Рет < 4е-»Ж*\ B3) где Е(К) дается B2). Доказательство. Возьмем код с М' = 2М кодовыми сло- словами, который удовлетворяет следствию 1, если источник вы- дает 2М равновероятных кодовых слов. (Скорость %' в B1) и B2) равна сейчас Aп2М)/Ы.) Удалим из кода М слов с наи- наибольшими Рет. На половине кодовых слов невозможно иметь вероятность ошибки большую, чем удвоенное среднее. Следова- Следовательно, оставшиеся кодовые слова должны удовлетворять не- неравенству Рет<2е-"Е<«'\ B4) Так как Я'= Aп 2М)/Ы=К+ Aп 2)/# и так как 0<р<1, ра- равенство B2) дает Е (/?') > Е(Н) —~ . B5) Подставляя B5) в B4), приходим к B3), что завершает дока- доказательство.
58 Р. Г. Галлагер 3. СВОЙСТВА КРИВОЙ НАДЕЖНОСТИ Е(К) Максимизация в B2) по р и р зависит от свойств функции Е0(ру р). Теорема 2 описывает ^о(р, р) как функцию р, а тео- теорема 4 описывает Е0(р,р) как функцию р. Доказательства обеих теорем приведены в приложении. Теорема 2. Рассмотрим канал с К входными и / выход- выходными символами и переходными вероятностями &, 1 < к < К. Пусть р=(Ри •••» Рк)—произвольный вероятностный вектор на входных символах. Пусть средняя взаимная информация к к не равна нулю. Тогда при 7-о (р> Р) = 0 при, р = О, ■о (Р. Р)>0 при р>0, 'о (Р, Р) B6) B7) B8) B9) C0) Равенство в C0) имеет место тогда и только тогда, когда вы- выполняются следующие два условия: 1) Р^ не зависит от к при к и ], таких, что о (Р, Р) Ф р = 0 = /(р), Рк не завасагп от у. 2) Используя эту теорему, можно легко выполнить максими зацию в B2) по р при фиксированном р. Определим Е(Ц, р)= шах [- 0<р<1 , р)]. C1) Приравнивая нулю частную производную выражения, стоящего в скобках в C1), получим «Ё^Ый. C2)
Простой вывод теоремы кодирования 59 Из C0) следует, что если некоторое р, лежащее в интервале 0-<р-<1, удовлетворяет C2), то это р максимизирует C1). Более того, в силу C0) дЕ0(рурIдр не возрастает при росте р, поэтому решение C2) существует, если 7? лежит в интервале дЕ0 (р, р) др C3) Наиболее удобно использовать C2) в этом интервале для того, чтобы связать Е(ЯУ р) и /? параметрически как функции р. Это дает C4) (Р. Р) Ф C5) На рис. 2 представлено графическое решение параметрических уравнений. / (/), р) кок срункиия р ""А / 1 Рис. 2. Геометрическое построение Е (/?, р). При #<дЕ0(ру р)/ф|р=1 параметрические уравнения C4) и C5) не справедливы. В этом случае функция —р# + Е0(ру р) возрастает при росте р в интервале 0^Ср< 1, и, следовательно, максимум имеет место при р=1. Таким образом, -л при р) р=1< C6)
60 Р. Г. Галлагер Ход Е(%, р) как функции %у задаваемой C4) — C6), проиллю- проиллюстрирован на рис. 3. Свойства Е(%у р) зависят от того, отрица- отрицательна или равна нулю величина д2Е0(ру р)/др2. Если она отри- отрицательна, то КУ как следует из C5), строго возрастает при ро- росте р. Дифференцируя C4) по р, получим —рд2Е0(р, Р)/ф2; таким образом, Е($у р) строго возрастает вместе с р при р > 0 и равна 0 при р = 0. Значит, если ^ </(р), то Е(КУ р)>0. Если р выбрано так, чтобы достигалась пропускная способность С, Р) Рис. 3. Кривая показателя экспоненты в зависимости от скорости. то при К<С имеем Е(#у р)>0 и вероятность ошибки может быть сделана убывающей экспоненциально вместе с длиной блока. Взяв отношение производных C4) и C5), получим дЕ (/?, р) __ — — ^. C7) Отсюда следует, что параметр р в C4) и C5) есть взятый с обратным знаком наклон кривой Е как функции /?. Из условий, следующих за C0), ясно, что если д2Е0(рур)/др2 = 0 для какого-либо значения р>0, то эта произ- производная равна нулю для всех р>0. В этих условиях /? и Е(к, р), представляемые C4) и C5), просто определяют точку, в кото- которой /? = /(р) и Е(ЯУ р)=0. Оставшаяся часть кривой, как пока- показано на рис. 4, получается из C6). Класс каналов, для которых д2Е0{р> р)/др2 = 0у является в не- некотором смысле вырожденным. Он включает в себя каналы без
Простой вывод теоремы кодирования 61 шума, для которых, очевидно, можно достичь нулевую вероят- вероятность ошибки, при скоростях, меньших пропускной способности. Экспоненциальные границы при этом просто отражают веройт- ность того, что более чем одно сообщение приписано одному и Рис. 4. Кривая зависимости показателя экспоненты от скорости для канала, в котором д2Е0 (р, р)/др2 == 0. Яо (р, р) = р 1п 3/2 при р = A/3, 1/3, 1/3). тому же кодовому слову. Граница, полученная в разд. 5, дает в этих случаях вероятность ошибки, равную нулю. Пример ка- канала с шумом, имеющего д2Е0(р, р)/ф2 = 0, приведен на рис. 4. Рис. 5. Кривая зависимости показателя экспоненты от скорости, как оги- огибающая прямых линий. Другой подход в максимизации C1) по р состоит в рассмо- рассмотрении функции —р^ + Я0(р,Р) как линейной функции Я с на- наклоном —р, пересекающей ось ординат в точке 50(р, Р) при фиксированном р. Таким образом, Е(КУр) как функция /? есть
62 Р. Г. Галлагер просто верхняя огибающая этого множества прямых линий (рис. 5). (В этой работе под верхней огибающей понимается наименьшая верхняя грань указанного множества линий.) Этот рисунок также интерпретирует Ео(ру р) как пересечение оси ор- ординат касательной с наклоном —р к кривой Е как функции /?. Так как Е(Яур) является верхней огибающей множества прямых линий, она должна быть выпуклой функцией Я> т. е. функцией, хорда которой никогда не лежит ниже функции. Этот факт, конечно, следует также и из того, что дЕ(Яур)/дЯ умень- уменьшается вместе ери, следовательно, увеличивается вместе с Я. Все результаты этого раздела до сих пор относились к функ- функции Е(Я,р), определенной C1). Функция Е(Я) в B2) может быть выражена как Е{К) = тихЕ{К, р), C8) р где максимум разыскивается по всем К-мерным вероятностным векторам. Таким образом, Е(Я) есть верхняя огибающая всех кривых Е(Я>р)> и можно сформулировать следующую теорему. Теорема 3. В любом дискретном канале без памяти функ- функция Е(Я) является положительной, непрерывной и выпуклой функцией при всех Я из интервала О -< Я < С. Таким образом, граница Ре ^. ехр—ЫЕ(Я) для вероятности ошибки является экспоненциально убывающей функцией длины блока при О < Я < С. Доказательство. Если С = 0, то теорема тривиально верна. С другой стороны, мы показали, что при р, на котором достигается пропускная способность, Е(Я> р) положительна на интервале ОГ^У?<С и, следовательно, Е(Я) положительна на том же самом интервале. Точно так же мы показали, что для любого вероятностного вектора р функция Е(Я>р) непрерыв- непрерывная и выпуклая с наклоном, лежащим между 0 и —1, и, сле- следовательно, верхняя огибающая является непрерывной и вы- выпуклой функцией. Далее можно было бы предположить, что Е(Я) имеет непре- непрерывную производную, но, как показано ниже, это неверно. Функция Е(ЯуР) имеет непрерывную производную при лю- любом р, однако те р, которые максимизируют Е(Я, р), могут изменяться вместе с изменением Я, и это может привести к разрыву производной Е(Я). Обратимся теперь к самой максимизации Е(Яур) по р. Представим B2) в виде Я(/?)= тах [— р/?+тах,Е0(р, р)]. C9) 0<р<1 р
Простой вывод теоремы кодирования 63 Определим теперь 2B!Гр)У+р D0) Из B0) имеем: /?0(р, р) =—1п-Р(р, р), так что минимизация ^(, р) по р приведет к максимизации ^0(р, р). Теорема 4. Функция Р(р,р)> заданная уравнением D0), является выпуклой функцией р в области, в которой р== = {Ри • • •, Рк) — вероятностный вектор. Для того чтобы вектор (или векторы) р минимизировал Р(р,р) (или максимизировал Ео{р, р))> необходимо и достаточно, чтобы ^5а1/р л/щ и** А, D1) равенство имеет место, если ркф0У а а; = к Эта теорема доказана в приложении. Если все ръ положи* тельны, D1) является просто результатом применения метода множителей Лагранжа для минимизации ^(р, р) при условии 2/^=1. Как показано в приложении,тот же метод может быть использован для получения необходимого и достаточного усло- условий того, что р максимизирует /(р). Результат, который неза- независимо был получен также Эйзенбергом, состоит в следующем: при всех к, D2) где равенство имеет место, если Ни неравенство D1), ни неравенство D2) не являются особо полезными при отыскании максимума 2?0(р, р), или /(р), однако оба эти неравенства оказываются полезным теоретическим ин- инструментом и могут быть использованы для того, чтобы прове- проверить, является ли гипотетическое решение истинным. Для кана- каналов любой сложности Ео(р, р) и /(р) обычно легче всего макси- максимизировать численными методами. Если известен максимум Е0(р, р) по р, то функцию Е(Н) можно найти любым из трех способов. Первый исходит из C9) и использует то, что Е(Н)—верхняя огибающая семейства прямых линий — р/? + тах^0(р> Р). 0<р<1. - D3) р Можно также вычертить тах^0(р, р) как функцию р и с по- р мощью графического метода рис. 2 найти Е(Я),
64 Р. Г. Галлагер Можно, наконец, использовать параметрические уравнения C4) и C5), в которые для каждого р нужно подставить те р, которые максимизируют Е0(р9р). Для того чтобы понять, что это дает непрямолинейный участок Е(К), предположим, что ро—некоторое фиксированное значение р @<р0<1) и ро мак- максимизирует ^о(ро»р). Как уже было показано, единственная точка на прямой линии —ро/? + Яо(ро, Ро), которая лежит на кри- кривой Я(/?, ро) и, таким образом, может лежать на Е(К), за- задается равенствами C4) и C5). Так как прямые линии —р/? + + тах^о(р, р) порождают все точки на кривой Е(К), то равен- р ства C4) — C5), в которых подставлено Е0(р, Р)> максимизиро- максимизированное по р, порождают все точки кривой Е(Н). Эти параметри- параметрические уравнения в некоторых вырожденных случаях могут так- также приводить к некоторым точкам, не принадлежащим кри- кривой Е(Я). Чтобы понять это, рассмотрим канал, изображенный Ь\ Ъч Ъ* Ьл а{ 0,82 0,06 0,06 0,06 а2 0,06 0,82 0,06 0.06 а% 0,06 0,06 0,82 0,06 а4 0,06 0,06 0,06 0,82 а5 0,40 0,49 0,01 0,01 а6 0,01 0,01 0,49 0,49 Матрица переходных вероятностей е(я) 0,053 V 1 Наклон -0,63 0,3 От 0х5 Р и с. 6. Вырожденный канал. на рис. 6. Как можно проверить с помощью D1) для р<0,51, функция /?о(р, Р) максимизируется при Р1 = Р2 = Рз = Р4=1/4. При р>0,51 максимум Еъ($, р) достигается на р5 = р6=112. Па- Параметрические уравнения теряют непрерывность в точке р = 0,51, в которой входное распределение изменяется скачком. На рис. 6 изображена кривая Е(Я) для этого канала и ложные точки, по- порожденные равенствами C4) и C5). Проведенное обсуждение было посвящено детальному рас- рассмотрению Е(Я) —показателя экспоненты верхней границы ве-
Простой вывод теоремы кодирования 65 роягности ошибки, описанной в разд. 1. Можно показать, что Еь{Н)—показатель экспоненты нижней границы вероятности ошибки в A) —задается выражением = зир Г-р/?+тах^0(р, р)|. D4) 0<р<оо[ р ] Сравнивая C9) и D4), можно увидеть, что единственное отличие состоит в интервале р, на котором отыскивается экстремум. Интерпретируя Е(Я) и Еь(%) как верхние огибаю- огибающие семейства прямых линий с наклоном —р, замечаем, что Е#=ЕЬ(К) при /?ст ^ /? <С С, где критическая скорость определяется как наименьшая верхняя грань величин /?, для которых наклон кривой ЕЬ(Я) не меньше чем —1. Это не нулевой интервал значений /?, если только при р, которое мак- максимизирует ^о(р, Р)> и при 0<р<^1, мы не имеем д2Е0(р,р)/ф2 = 0. Такого типа канал изображен на рис. 4. 4. ПРИМЕРЫ И ПРИМЕНЕНИЯ Двоичный симметричный канал Двоичный симметричный канал имеет две входные буквы, две выходные буквы и переходные вероятности Рц^Рц^Я и ^11 = ^22=1—<7- Таким образом, ц является вероятностью ошиб- ошибки в канале при отсутствии кодирования. Очевидно, что для входного вероятностного вектора, максимизирующего Я0(р, р), имеет место равенство р±=р2= 1/2. [Формально это'можно по- показать подстановкой в D1).] При таком выборе р = р1п2 — A+рIп[^1+р)+A — <7I/A+р)]. D5) Теперь продифференцируем D5) и вычислим параметриче- параметрические выражения C4) и C5) для показателя экспоненты и ско- скорости. После некоторых преобразований получим 1п2—Я(<7Р), D6) D7) D8) где D9)
66 Р. Г. Галлагер Эти равенства справедливы при 0<р<Л или при 1п2 — — Н\Уя1{Уд +|Л — <7)]</?<С. Для меньших скоростей справедливо C6), которое имеет вид E0) С точностью до коэффициента Ре ^С е-л^н, р) [где Е(Я,р) задается D6), D8) и E0)] является границей для вероятности ошибки для двоичного симметричного канала, найденной мето- методом случайного кодирования и впервые полученной Элайсом [6]. Каналы с очень большим шумом В этом пункте будут рассмотрены каналы с очень большим шумом в том смысле, что вероятность получения данной выход- выходной буквы почти не зависит от буквы на входе. Будет показано, что в пределе для этих каналов существует универсальная кривая зависимости показателя от скорости. Будем предпола- предполагать, что канал является дискретным и без памяти; тем не ме- менее полученный ниже результат может быть легко распростра- распространен на непрерывные каналы. Пусть ^и ..., ц3 — множество ве- вероятностей, определенных на выходных буквах канала; опреде- определим г^и следующим образом: п _л /I | о, \ /^1 \ Г Э'к— (/н1Т^/{/. \и1/ Предположим, что |е^|<С1 при всех / и к. Заметим, что, если E1) умножить на ри и просуммировать по всем /г, то бу- будем иметь 2<7.е/й = 0 для всех к. E2) Вычислим теперь ^о(р, Р) для этого канала E3) и пренебрегая E4) (Р, р)=—1п2Г2/^у<1+Р>A+е/ / I. к Разлагая A + е#I/A+р) в степенной ряд по членами выше второго порядка, получаем , Р)» — 2A+р)» Член в квадратной скобке в степени A+р) можно снова разложить в степенной ряд по е^ и получить р (Р. Р) Р 2A+рI^*с# к ) .у • E5)
Простой вывод теоремы кодирования 67 Используя E2), получим > р) « — 1п 11 .E6) Разлагая, наконец, E6) и пренебрегая членами выше второго порядка по е#, будем иметь . р) /(р). E7) где коэффициент 1(р) представляется выражением E8) Если взять взаимную информацию /(р), использовать E1) для переходных вероятностей и разложить /(р) в степенной ряд по е^, пренебрегая членами выше второго порядка, то можно по- получить /(р). Таким образом, пропускная способность канала С приближенно представляется в виде С»тах/(р), E9) р . р) Р 1+Р с. F0) Можно тепе = тах 0 <р< 1 зь легко найти р, для того чтобы получить ЕЩ) = тах^0(р, рI. В результате получаем, что Т• F1) г г у — /?, ^<-4-- F2) Следует заметить, что кривая зависимости показателя экспо- экспоненты от скорости, задаваемая F1) и F2), совпадает с ана- аналогичной кривой для ортогональных сигналов в белом гауссов- ском шуме [2]. Каналы с шумом, определенные так, как в этом пункте, впервые были рассмотрены Рейффеном [7], который показал, что показатель экспоненты, соответствующий нулевой скорости, ра- равен С/2. Параллельные каналы Рассмотрим два дискретных канала без памяти, в первом из которых К входных и / выходных букв и переходные ве- вероятности Р&9 а во втором / входных и Ь выходных букв и пе-
68 Р. Г. Галлагер реходные вероятности С1ц. Пусть к у+р где р=(ри •••» Рк) и Я=(^ь ..., <7/) —произвольные вероят- вероятности, приписанные соответственно входным буквам первого и второго каналов. Будем считать, что два канала используются параллельно, т. е. в каждый момент времени передатчик посылает одну букву по первому каналу и одну букву по второму каналу. Если рас- рассмотреть эту пару каналов как один канал с К1 входными бук- буквами и ]Ь выходными буквами и переходными вероятностями Р^нЯи, то можно найти верхнюю границу для вероятности ошибки, достижимую с помощью совокупного кодирования в двух каналах. Следующая теорема, первая половина которой принадлежит Фано [8], связывает кривую Е(%) для параллель- параллельной комбинации каналов с кривой Ё(/?) отдельных каналов. Теорема 5. Наименьшая вероятность ошибки, достижимая при кодировании, оценивается сверху следующим образом: , 1 ( )] при 0<р<1, F3) где (р, я). F4) Если выбрать далее р и ц так, чтобы максимизировать соот- ветственно -со(р> р) и Ео (р, я) при фиксированном р, то по- получим (Р> РЧ) = шах Ео (р, г), F5) где г= (ги, г12, ..., Гц, г21, ..., г2/, ..., гК1) представляет со- собой произвольные вероятности, приписанные парам на входе, а Е0(р,г)—обычная Е0-функция [см. B0)], определенная для параллельной комбинации каналов. Доказательство. Рассматривая параллельные каналы как один канал с входным вероятностным вектором г, получим у F6) Предположим теперь, что входные вероятности заданы так, что буквы в каналах используются независимо, т. е. гы=рндг1 где
Простой вывод теоремы кодирования 69 ри • • •, Рк и #ь ..., ^1 — вероятности, приписанные буквам в отдельных каналах. Подставляя гы = РкЦ\ в F6) и разделяя суммирование по к и по I, получим е0 (р, г)=- ш у [2 /> ЛМ [5 Разделяя суммирование по у и по /, будем иметь (Р, Я). F7) Далее следует показать, что г^ = р^г максимизирует Я0(р, г), если р и я максимизируют соответственно ^о и Ео . Из D1) видно, что р и я, максимизирующие Ео и Ео , должны удовле- удовлетворять неравенству 1^%^ Для всех к F8) с равенством при рпф0, где а/ = 2/^1Д1+р)» И неравенству 2СЙA+р)Р?>21Р/1+р для всех г F9) с равенством при цьф\}, где р/ = I Перемножая F8) и F9), получим 2 {РМт+р) («;Рг)р > 2 («АI+р G0) у» ' У» ^ с равенством при гл/ = Замечаем, что G0) в точности то же самое, что и D1) в при- применении к параллельной комбинации каналов. Это значит, что такой выбор г максимизирует Е0(р, г) и теорема доказана. Теорема 5 имеет интересную геометрическую интерпрета- интерпретацию. Пусть Е(р)—показатель экспоненты и ^(р) — скорость в параллельной комбинации представлены параметрическими уравнениями C4) и C5), в которых г выбрано оптимальным при каждом р. Пусть 5*(р), #*(р), 5**(р) и /?**(р)—анало- /?**(р)—аналогичные функции для отдельных каналов. Из F4) имеем G1) G2) Таким образом, параллельная комбинация формируется с по- помощью векторного сложения точек равного наклона кривых Е(р) и /?(р) отдельных каналов. Теорема 5, очевидно, применима к любому числу параллель- параллельных каналов. Если рассмотреть блоковый код длины N как
70 Р. Г. Галлагер совокупное использование N отдельных параллельных каналов, то теорема 5 оправдывает сделанный нами независимый равно- вероятный выбор символов в ансамбле кодов. 5. УЛУЧШЕНИЕ ГРАНИЦЫ ДЛЯ МАЛЫХ СКОРОСТЕЙ При малых скоростях показатель экспоненты Е(К), найден- найденный в разд. 3, не дает точной границы для вероятности ошиб- ошибки. Показатель экспоненты столь велик для малых скоростей, что вдруг становятся важными такие эффекты, как сопоставле- сопоставление одного и того же кодового слова двум различным сообще- сообщениям, которыми ранее можно было пренебречь. В настоящем разделе эта трудность обходится с помощью выбрасывания тех кодовых слов, для которых велика вероятность ошибки. Нера- Неравенство G) дает для любого заданного кода границу для ве- вероятности ошибки при передаче /п-го слова. При р=1 оно дает 2 Ург(уЫ 2 УРг<уМ. G3) У т'фт Это можно представить в виде Рет< 2 Я(Хт, Хт>), G4) т' фт где д(Хт, Хт') = 11УРг(у\Хт)Рг(у\Хт')= G5) У = П 2 УРГ (Ь; I Хтп) РГ (*у | Хщ'п) • G6) 1 / Эквивалентность G5) и G6) устанавливается с"помощью обыч- обычного арифметического правила для произведения сумм, при этом (&1, .. ., 6/) — выходной алфавит каналов. Назовем — 1п<7(хт, Хтг) мерой различия между хт и \т>\ она предста- представляет собой естественное обобщение хемминговского расстоя- расстояния в двоичном симметричном канале на общий канал без па- памяти. Так как Рет в G2) является функцией от рассматриваемого кода, то Рет является случайной величиной на ансамбле кодов. В настоящем разделе будет построена верхняя граница для Рг {Рет^В), где В — число, которое будет далее выбрано, и затем будут выброшены кодовые слова, для которых Рет > Вт Используя черту для обозначения среднего по ансамблю кодов, получаем Рг (Рт >В) = ут (код), G7)
Простой вывод теоремы кодирования 71 где Фт (код) = 1, если Оценим фт сверху: Фт (код) • для всех остальных случаев. , *т>У G8) в- G9) т Равенство G9), очевидно, имеет место при фш = 0. Если срт=1 и 5=1, то G9) следует из G8) и G4). С уменьшением 5 увеличиваются все слагаемые в G9), которые меньше единицы; если же какое-либо слагаемое превышает 1, то G9) всегда справедливо. Подставляя G9) в G7), будем иметь д(хт,хт>K. (80) т Предположим, что буквы кодовых слов в ансамбле кодов выбираются независимо с вероятностями ри . .., рк, так что при хтп = ак. Используя л=1 теперь G6), получаем Я = 2 N хт' рг N К К л-1 ^ 2 (81) (82) Так как (82) не зависит от т и т7, можно подставить это выражение в (80) и получить Рг(Рет>В)<(М-\)В-> 2 2 ла 2 (83) Выберем В так, чтобы правая часть (83) была равна 1/2. Бу- Будем иметь 1, = [2 (ж -1)]1" [2 ла B N/5 (84)
72 Р. Г. Галлагер Если из ансамбля выбросить все кодовые слова, для кото- которых Рет>5, где В дается (84), то среднее число оставшихся в коде слов по меньшей мере равно М/2, так как вероятность выбрасывания не больше 1/2. Таким образом, существует код с М' > М/2 кодовыми словами и вероятностью ошибки для ка- каждого кодового слова, ограниченной неравенством Рет < В < {АМ'Г \ 2 ЛЛ B УР^ГГ • (85) Заметим, что выбрасывание кодового слова из кода не может увеличить вероятность ошибки, связанную с каким-либо другим кодовым словом. Если положить М/ = емя и р = 1/5, то (85) можно представить в виде ^] (8б) (87) Можно резюмировать полученный результат следующей теоремой. Теорема 6. Рассмотрим дискретный канал без памяти со входным алфавитом аи ... , ак, выходным алфавитом Ьи ... > Ь^ и переходными вероятностями Р^ = Рг {Ь^\ак). Тогда каковы бы ни были длина блока N и число кодовых слов М' = емяу суще- существует такой код, что для всех пг A^т^Л1/) вероятность ошибочного декодирования при передаче пг-го кодового слова ограничена (86) и (87), где р=(Рь ..., Рк) в (87)—произ- (87)—произвольный вероятностный вектор. Метод выбрасывания, который приводит к теореме 6, от- отчасти аналогичен ранее развитому методу выбрасывания, при- примененному Элайсом [6] к двоичному симметричному каналу и Шенноном [9] к каналу с аддитивным гауссовским шумом. Окончательная граница, полученная здесь, несколько сильнее этих границ, и фактически разность показателя экспоненты, полученного здесь, и показателей, полученных в более ранних работах, равна скорости /?. Интерпретация теоремы 6 почти совпадает с интерпретацией теоремы 1. Кривая зависимости показателя экспоненты от ско- скорости, задаваемая формулой (87), является верхней огибаю- огибающей множества прямых линий; линия, соответствующая всем значениям р^-1, имеет наклон —р и пересекает ось ординат в точке ^(р, р). Следующая (доказанная в приложении) тео- теорема описывает свойства Ех(р,р).
Простой вывод теоремы кодирования 73 Теорема 7. Пусть Р^и — переходные вероятности дискрет- дискретного канала без памяти, и пусть р = (ри .. ., рк) — вероятност- вероятностный вектор, заданный на входных буквах канала. Предполо- Предположим, что к.] Тогда при р>0 задаваемый (87) показатель Ех{р,р) является строго возрастающей функцией р. Кроме того, ЕхA,р) — = Е0A,р), где Ео дается B0). Наконец, Ех(р, р)—строго во- вогнутая функция р, если только канал не является каналом без шума, т. е. если не верно, что для каждой пары входных букв аи и а^ для которых РиФЪ и РгФО, либо Р^Р^-= 0 при всех ], либо Р]к = Рл при всех /. Эта теорема может быть использована точно таким же об- образом, как и теорема 2, для получения параметрических выра- выражений для показателя экспоненты и скорости при малых ско- скоростях. Пусть (88) Тогда для /? в интервале «. дЕу(р, о) ^ тл х 1п4 ^ дЕу(р, р) р->со Ф М имеем параметрические по р уравнения 1п 4 дЕх (р, р) (89) (90) Р) Если Ех(р, р)—строго вогнутая функция р, то (90) предста- представляет собой выпуклую кривую, имеющую непрерывную произ- производную, равную —р. Наименьшая скорость, для которой уравнения (90) остаются применимыми, есть где [ 1, если % о, если
74 Р. Г. Галлагер Если существуют такие две буквы на входе с номерами к и I, которые не имеют общих букв на выходе (т. е. для кото- которых 2 Р]иР]1 = ®)> то правая часть (91) строго положитель- на. Если /? + 1п4ДУ меньше, чем правая часть (91), то Е(/?, р) бесконечно велика. Это наиболее просто можно увидеть, рас- рассматривая кривую Е{Н,р) в зависимости от /?, как верхнюю огибающую прямых линий с наклоном —р; правая часть (91) . Р) ■/? Рис. 7. Типичные кривые зависимости показателя экспоненты от скорости, полученные с учетом улучшения границ для малых скоростей. а — обычный канал; б —канал без шума; в —канал с неравной нулю пропускной способ- способностью при нулевой ошибке. является пределом точки пересечения оси абсцисс этими ли- линиями при стремлении наклона к —оо. Шеннон [10] определил пропускную способность канала при нулевой ошибке как наи- наибольшую скорость, с которой возможно вести безошибочную передачу. Правая часть (91) дает, таким образом, нижнюю границу пропускной способности при нулевой ошибке. На рис. 7 изображена данная теоремой 7 кривая зависимости по- показателя экспоненты от скорости для некоторых типичных ка- каналов. Если канал является каналом без шума в, смысле теоремы 7, то нетрудно заметить, что Е(/?, р),.задаваемая..{88), бесконечно велика при /?+ Aп 4)/Л/</(р). Конечно, это не великое дости- достижение— показать, что для каналов без шума возможна нуле- нулевая вероятность ошибки при скоростях, меньших пропускной
Простой вывод теореМы кодирования 75 способности, однако приятно видеть, что этот результат есте- естественно вытекает из общей формулировки. Совсем мало можно сказать о максимизации ^(р, р) по входным вероятностным векторам. Возможно, что существуют несколько локальных максимумов; общий метод максимизации не известен. Этот результат для малых скоростей можно применить к па- параллельным каналам точно таким же образом, как это дела- делалось в разд. 4. Если входной вероятностный вектор р для па- параллельных каналов выбирает буквы из обоих каналов незави- независимо, то Ех(р,р) для параллельной комбинации равна сумме функций Ех(рур) отдельных каналов. К сожалению, Ех(р, р) не Рис. 8. Переходные вероятности в канале с неравной нулю пропускной способностью при нулевой ошибке. всегдэ максимизируется при независимом использовании кана- каналов. Указанный Шенноном [10] пример этого дает параллель* ная комбинация, состоящая из двух одинаковых каналов, изо- изображенных на рис. 8. Граница для пропускной способности при нулевой ошибке ИтЕх(р, р)/р отдельного канала равна 1п 2 р->оо и достигается при использовании входных букв 1 и 4 с равными вероятностями в (91). Для параллельных каналов (91) дает 1п 5, достижимый при использовании пяти пар входных букв A,1), B,3), C,5), D,2) и E,4) с равными вероятностями. Теорема 6 приводит к довольно интересному результату при применении ее к двоичному симметричному каналу. Считая ц вероятностью ошибки и положив р= A/2, 1/2), из (87) получим ЕХ(Р. Р) = -р1п{^^[4?A-?)]1/2р}. (92) Используя (92) в параметрических уравнениях (90) и произ- производя некоторые алгебраические преобразования, получаем (93)
76 Р. Г. Галлагер где параметр б связан с р равенством 6/A — б) =[4^A — <7)]1/2Р, а Н{8)^~б 1п б— A — 6Iп A — 6). Уравнения (93) и (94) справедливы для б > |/Ч<7A—'<7)/0 + У*4<7A — <7))- При больших значениях #, согласно (93), б приближается к Дп1п/А^, где Дпш — граница Гилберта [11] для минимального расстояния в двоичном коде, имеющем скорость /?. Показатель экспоненты, задаваемый (94), оказывается в точности таким же, как показатель экспоненты вероятности перехода одного кодового слова в другое, если они находятся на расстоянии Гилберта друг от друга. Этот результат известен также и для кодов с проверкой на четность [12]. 6. НЕПРЕРЫВНЫЕ КАНАЛЫ И ОГРАНИЧЕНИЯ НА ВХОДЕ Дискретный по времени и непрерывный по амплитуде ка- канал — это такой канал, входной и выходной алфавиты которого являются множествами действительных чисел. Обычно необхо- необходимо или удобно наложить ограничение на кодовые слова та- такого канала, для того, чтобы отразить физические ограничения на мощность передатчика. Таким образом, до того, как рас- рассмотреть непрерывные каналы, мы рассмотрим эффект введе- введения ограничений в дискретных каналах и затем обобщим эти результаты на непрерывные каналы. Можно включить ограничения в теорему 1, если выбирать кодовый ансамбль таким образом, чтобы среднее кодовое сло- слово удовлетворяло ограничению. Существуют две трудности, свя- связанные с такой процедурой. Одна — математическая и состоит в том, что не все слова удовлетворяют ограничению. Другая, более существенная трудность состоит в том, что те кодовые слова, которые удовлетворяют ограничению со значительным запасом, иногда имеют такую высокую вероятность ошибки, что верхняя граница, даваемая теоремой 1, не является наиболее сильной экспоненциальной границей, которую можно получить. В этом разделе теорема 1 будет модифицирована так, чтобы получить наилучшую экспоненциальную границу для дискрет- дискретного канала с ограничениями на входе. Затем граница будет распространена на непрерывный канал, и наконец в качестве примера будет рассмотрен канал с аддитивным гауссовским шумом. Пусть /1 = /(а1), ..., !к = !{ак) —действительные (положи- (положительные и отрицательные) функции входных букв аи ..., ак- Рассмотрим коды, каждое из кодовых слов х= (хи ..., хя) в которых удовлетворяет ограничению 2 / (х„) < 0. (95)
Простой вывод теоремы кодирования 77 Если входные буквы представляют собой напряжение и если = а& — 5о, то (95) представляет собой мощностное огра- ограничение, требующее, чтобы в каждом кодовом слове средняя энергия на одну букву не превосходила 50. Пусть р= (рь ... ..., Рк) — вероятностный вектор, компоненты которого удовле- удовлетворяют ограничению к 2 < о. (96) Определим теперь ансамбль кодов, в которых вероятность ко- кодового слова Р(х) является условной вероятностью выбора букв в согласии с р при условии, что удовлетворяется ограни- огранила чение —6^ 2 /(^л)^0, где б—число, которое будет брано ниже. Математически это значит, что /> (■*„). ф(х) = ' 1, если — 6<2/(*„)<0, Л (97) (98) (99) где р(хп)=ръ при хп = аъ. Можно рассматривать ц как норми- нормирующий множитель, выбираемый так, чтобы сделать сумму Р(х) по дс, равной 1. Учитывая, что A1) справедливо для любого ансамбля ко- кодов, подставим теперь (97) в (И) 1+Р 0 для всех остальных N Еф(х)П A00) Прежде чем упростить A00), оценим ф(х) сверху Ф (х) <! ехр г 2/(-О+& л-1 при г>0. A01) Неравенство A01), очевидно, справедливо при ф(х)=0. При ф(х) = 1 имеем ^!(хп)-\~Ь ^ 0 и A01) по-прежнему справед- л-1
78 Р. Г. Галлагер ливо. Более удобная для математических преобразований пра- правая часть A01) все еще не учитывает большие вклады в Рет со стороны последовательностей, для которых 2/(-О слишком п мала. Подставляя A01) в A00) и производя те же самые опера- операции, которые были сделаны при переходе от A1) к B0), по- получим доказательство следующей теоремы. Теорема 8. В условиях теоремы 1 существует код, каждое N кодовое слово которого удовлетворяет ограничению 2 / (Хп) ^ 0, 1 л 1 а вероятность ошибочного декодирования для которого ограни- ограничена следующим образом: РеКВеxр-N[Е^(Р, р, г) —р#], A02) Р» /■) = —1п ^ В к 2 /&\1+р 1+Р A03) -(•V) • A04) еде ц удовлетворяет (99). Формулы A02) — A04) справедливы при 0<!р^5 1, г>0, 6>0 и любом р, удовлетворяющем усло- условию 2лЛ<о. Отметим, что если г = 0, то A03) совпадает с B0) с точ- точностью до коэффициента В. Если вектор р, который максими- к зирует /?о(р, Р) в B0), удовлетворяет условию можно положить г=0 и получить тот же самый экспоненциаль- экспоненциальный характер ошибки, что и в случае отсутствия ограничений. Если в этих условиях выбрать б достаточно большой, то ц бу- будет стремиться к 1/2 при увеличении N. если 2л/* = 0> и бу- к дет стремиться к 1, если 2/^/^ < 0- Наибольший интерес вызывает применение теоремы 8 в слу- случаях, когда р, максимизирующее ^0(р, Р) в B0), не удовлетво- удовлетворяет условию 2а^0- В этом случае оказывается, что ^о(р, Р, г) максимизируется выбором г>0. Инженерный подход к максимизации ^о(р, Р, г) по р и г состоит в том, чтобы из предположения о том, что макси- максимум в случае отсутствия ограничения находится вне области, определяемой ограничением, сделать вывод, что максимум при наличии ограничения достигается на граничном значении
Простой вывод теоремы кодирования 79 ^ = 0. Тогда с помощью метода множителей Лагранжа к при условиях 2 Рк = ^ и Иа[й = 0 можно найти стационарную к к точку выражения, стоящего под знаком логарифма в A03). Эта процедура дает ^ ^%1+^ при всех К A05) ау = 2/>л№р>/'* A06) с равенством в A05) при рнФО. Строгое неравенство в A05) имеет место для максимума, в котором, как и в теореме 4, не- некоторые ри = 0. Потребуем также, чтобы точка была стационар- стационарной по г A + р) 2 ору 2 />ЛЯ$1+рУ* = 0. A07) } ' к у Если умножить A05) на ри и просуммировать по всем к, то получим Я, = — A+рJау+Рв Если умножить A05) на просуммировать по всем к и сравнить результат с A07), то найдем, что ^ = 0. Объединяя эти результаты, получим 2аИ1+р)Л>2а1у+р при всех к A08) с равенством при риФО. Можно показать, хотя доказательство этого существенно сложнее доказательства теоремы 4, что когда максимум в от- отсутствие ограничения не удовлетворяет условию неравенство A08) и ограничения 2/>л = 1 и к к являются необходимыми и достаточными условиями для того, чтобы г и р максимизировали 50(р, р, г). Таким образом, когда произведена максимизация по р и г и когда A02) максимизи- максимизировано по р, можно показать, что при Я^ Яст граница A02) описывает истинную экспоненциальную зависимость от N ве- вероятности ошибки наилучшего кода с длиной блока N. удовле- удовлетворяющего заданному ограничению. Значение В в A02) и A04) трудно ограничить, однако его довольно легко оценить при больших N с помощью централь- N ной предельной теоремы. Положим 5=2бл1 где 1п — незави- 1 симы и 1п = !к с вероятностью рк. При этом ц = Рг{— § -< 5-< 0]
80 Р. Г. Галлагер и, как следует из центральной предельной теоремы, при фик- фиксированном б Нт у77<7 = -т=^—> A09) (по) Используя A09) совместно с A03), можно увидеть, что приближенно минимизируется при б = 1/г. При этом A11) Здесь ^ означает, что отношение обеих сторон A11) стре- стремится к 1 при Аг —>оо. Если |п имеют решетчатое распределе- распределение1), то б кратно шагу и A11) перестает быть справедливым, хотя В все еще остается пропорциональным Ограничения на входе при малых скоростях При малых скоростях границу, заданную A02) и A03), можно улучшить так же, как теорема 6 улучшает теорему 1. Для этого просто выберем вероятности Рг (хт) и Рг(хт>) в (81), так чтобы они задавались (97). Используя границу A01) в (97), подставляя результат в (81) и упрощая выражение, получим V К К Х,тг» Хт') = е ч 2 у у РкР* Г A12) Используя A12) вместо (82) и повторяя соображения, ис- использованные при переходе от (82) к (87), придем к следую- следующей теореме. Если ^п имеет нерешетчатое распределение, то A09) можно получить с помощью простых алгебраических преобразований из теоремы 2 на стр. 225 монографии Гнеденко и Колмогорова [13]. Если %п имеет решетчатое рас- распределение, A09) следует из теоремы на стр. 248 монографии Гнеденко и Колмогорова [13]. (Решетчатое распределение есть распределение, в котором значения величины ^п могут быть записаны в виде йи = к}(к)+а, где а и Н не зависят от к, а }{к) —целое число при всех %. Наибольшее /г, удовлетво- удовлетворяющее этому равенству, называется шагом распределения.) Для решетча- решетчатых распределений \п должно иметь третий абсолютный момент; это три- тривиально для конечных входных алфавитов и является достаточно общим условием для непрерывного входного алфавита, который мы хотим рас- рассмотреть*
Простой вывод теоремы кодирования 81 Теорема 9. В условиях теоремы 6 существует код, ка- каждое слово которого удовлетворяет как условию 2/(*п) ^ О, п так и границе . Р> г) — р д A13) , Р. г) = -Р1п 2 Л/>/ (^+//) B при р>1, /*>0, 6>0 а р, удовлетворяющем 2д[л<0. /7/ш /г = 0 значение етЬ1ц задается A09) — A11). Непрерывные каналы Рассмотрим канал, входной и выходной алфавиты которого являются множествами действительных чисел. Пусть Р(у\х) — условная плотность вероятности получения у при условии, что передано х. Пусть р(х)—какая-либо плотность распределения на входном множестве канала, а }(х)—некоторая действи- действительная функция, заданная на том же множестве. Предполо- Предположим, что каждое кодовое слово удовлетворяет ограничению 2 I (хп) ^ 0» и предположим, что р(х)[ (х) с1х ^ 0. п = \ 1 — оо Разделим входное пространство на К интервалов, а выход- выходное пространство разделим на / интервалов. При каждом к пусть аи — точка из к-то входного интервала и ри — интеграл от р(х) по этому интервалу. Пусть Р& — интеграл от Р(у\ак) по /-му выходному интервалу. Теперь теоремы 8 и 9 могут быть применены к этому квантованному каналу. Устремляя К и У к бесконечности так, чтобы интервалы около каждой точки стремились к нулю, получаем, что суммы по к и / в теоремах 8 и 9 переходят в римановы интегралы и границы остаются спра- справедливыми, если интегралы существуют1). Таким образом, до- доказана следующая теорема. Теорема 10. Пусть Р(у\х) — переходная плотность ве- вероятности канала, непрерывного по амплитуде. Пусть каждое N кодовое слово удовлетворяет ограничению 2/4-0^0. Тогда, каковы бы ни были длина блока Ы, число кодовых слов М = екп и распределение вероятностей использования кодовых слов, су- 1) Подробности такого обоснования перехода см. Галлагер [3], разд. 8,
82 Р. Г. Галлагер ществует код, для которого Ре<Веxр^-N{Е0(р, р, г) — ^о(Р. Р. /•) = —1п со — оо со \р{х)Р(у\ х) т+р) ег* М их \- —СО 1+Р A15) йу, (Пб) В = Кроме того, при любом р ^ 1 имеем , р, Г) A17) каждого кодового слова 2е> ' , A18) со со Ех(р, р, г) = — р 1п | \ р(х)р{х') е'1 М+п <*') X — со —со со 1/р X \УР{у\х)Р{у\х')йу\ ахйх'. A19) — со Формулы A15) — A19) справедливы, если римановы интегралы существуют при всех г>0, 6>0 и р(х), удовлетворяющих со Г р(хI(х)Ax^.0. Если — со со со р(х)!(х)с1х = 0 и \ р(х)\!(х)\*Aх<оо, —со — со то .гб а ге [см. A11)]. В отсутствие каких-либо ограничений на входе соотноше ния A15) — A19) остаются справедливыми, если в них поло жить г = 0 и 0=1. Аддитивный гауссовский шум В качестве примера применения формул A15) — A19) рас- рассмотрим дискретный по времени и непрерывный по амплитуде канал с аддитивным гауссовским шумом. В таком канале, если передается хт=(хт1, ..., хтдг), то принятая последователь- последовательность у может быть представлена в виде (х„ц + ги ... ,хт]Ч+2м), где гп — гауссовские случайные величины, статистически неза- независимые друг от друга и от входной последовательности. Без
Простой вывод теоремы кодирования 83 потери общности можно предположить, что шкалы х и у ©ы- браны так, что каждое гп имеет нулевое среднее значение и единичную дисперсию. Таким образом, ^е-Ь>-#1*. A20) Предположим, что каждое кодовое слово удовлетворяет мощ- ностному ограничению тп ИЛИ A21) A22) Значение А в A21) и A22) —отношение сигнал/шум по мощ- мощности, рассчитанное на одну степень свободы. Интуитивно ка- кажется, что в этих условиях следует выбрать в качестве р(х) гауссовскую плотность с дисперсией А\ оказывается, что такой выбор при подходящем выборе г дает стационарную точку ^(, Р, 0* Таким образом, '"*" A23) Подставляя A20), A22) и A23) в A16) и непосредственно выполняя интегрирования, получим Р. г) = ( | |A ^). A24) Для упрощения в A24), делая подстановку р=1— 2гА и мак- максимизируя A24) по р, будем иметь I }. <125> Используя A24) для того, чтобы максимизировать A16) по р, получаем, что РКВ МЕ(Х) A26) где Е(Я) задается параметрическими уравнениями по р, 0<р<1 4A+Р)AР) A27) A28> где р при каждом р задается A25)
84 Р. Г. Галлагер Постоянная В в A26) задается A04) и A11), в которых б/, согласно A22), равна ]/2Л. Таким образом, при Л/-*оо В ~ [4лЛМ* A^-J *2](Р) = [яЛ^2 A - рJ]A+р)/2. A29) Равенства A27) и A28) применимы при 0 <С р ^ 1 или по- после подстановки A25) в A28) при -11п4"{1-Ь4-ЬУ1-Ь4^ }<^<11пA-ЬА). A30)  Левая сторона A30) есть /?Сг1Ь а правая сторона — про- пропускная способность канала. В этом интервале скоростей Е(Я) в точности совпадает с кривой зависимости показателя экспо- экспоненты от скорости, полученной Шенноном1), и это тот самый интервал скоростей, в котором верхняя и нижняя граничные экспоненты Шеннона совпадают. Коэффициент у Шеннона, однако, значительно точнее, чем тот, который приведен здесь. Для того чтобы получить границу для вероятности ошибки при малых скоростях методом выбрасывания, подставим A20), A22) и A23) в A19). После прямого интегрирования, полу- получим Ех(р,р, г) = 2грЛ + |1пA-2М) + |-1пA-2гЛ+^-). A31) Полагая рх=1—2гЛ, установим, что Ех(р, р, г) максимизи- максимизируется р^ 2 I. 2р Оптимизируя, наконец, A18) по р, найдем где ^(/?) задается с помощью параметрических уравнений при р^> 1, A33) 1) Эквивалентность A28) и A29) полученным Шенноном [9] равенствам E) и A1) легко установить с помощью ряда алгебраических преобразова- преобразований. Соответствие между различными параметрами следующее (параметры Шеннона будут стоять с правой стороны; Аа будет обозначать шеннонов- ское Л): 2. а3 А-Аа, р- а3о (е,) зш* е, [О (б,)]2 з1п2 9, '
Простой вывод теоремы кодирований 85 Здесь, как и прежде, при больших Если положить A34) A35) то можно просто решить A32) — A34) и получить при 4 / * A36) A37) Показатель экспоненты, заданный A36), больше, чем пока- показатель экспоненты, полученный Шенноном [9] для малых ско- скоростей; разность равна к'ш ~ ~ А*0 Рис. 9. Кривые зависимости показателя экспоненты от скорости для канала с аддитивным, гауссовским шумом. А — отношение сигнал/шум по мощности. При скоростях, лежащих между теми, которые определены A30) и A37), можно использовать либо A24), либо A31), по- положив р=1. Любым методом получим ( 4)]. О38) A39) На рис. 9 изображены кривые ^"(/?), задаваемые этими равен- равенствами при различных отношениях сигнал/шум.
Р. Г. Галлагер ПРИЛОЖЕНИЕ Для доказательства теорем 2 и 7 требуется следующая лемма. к Лемма. Пусть аи ..., аь — множество неотрицательных чисел, и пусть <7ь • • •» Яь — множество вероятностей. Тогда функция A40) является невозрастающей при х>0 и строго убывающей, если аь для которых 9^0, не все равны друг другу. Функция 1(х), кроме того, выпуклая при х>0 и строго выпуклая, если все не- ненулевые аь для которых <7/=5^О, не равны друг другу. Доказательство. Хорошо известным свойством взве- взвешенного среднего значения (см. Харди и др. [14]) является то, что B*7/0/) —возрастающая функция г при г>0 и строго возрастающая функция, если не все щ, для которых ^=^=0, равны друг другу. Положим *=»1/г; это значит, что функция \{х) — невозрастающая или строго убывающая при х>0. Дру- Другое свойство взвешенного среднего, вытекающее из неравен- неравенства Гёльдера !), -состоит в том, что если г и г не положительны, 0<9<1 и 5 = 0г+A —0)/, то с равенством только в том случае, если все ненулевые а/, для которых <7г^0, равны друг другу. Пусть X определяется равен- равенствами Подставив A42) в A41) и возведя каждую сторону в сте- шень 1/5, получим < B <?^ГB я^~т- A43) ( ^ Логарифмируя обе части A43) и интерпретируя 1/г и \Ц как два различных значения х, найдем, что Цх) —выпуклая функ- функция и строгая выпуклость имеет место при указанных зыше условиях. ') См. Харди и др. [14], теорема 17«
Простой вывод теоремы кодирования 87 Доказательство теоремы 21). Р Согласно лемме, (^ркР1№+9)\ —невозрастающая функция р. Так как /(р)=^0 по условию, то существует по крайней мере одно /, для которого Р}к изменяется по к при риФ0\ для такого / ^Р^)-к+р)\ — строго убывающая функция и, таким обра- образом, Е0(р, р)—строго возрастающая функция р. С помощью прямых вычислений находим, что Е0@, р)=0 и, следовательно, Ео(р, р)>0 и дЕ0(р, р)ДЭр>0 при р>0. Непосредственным диф- дифференцированием можно показать, что дЕо/др\9=о=1 (р). Да- Далее, пусть р1 и р2 не положительны, пусть 0<Х<1 и рз= + A — X) р2. Из леммы имеем Используем теперь неравенство Гёльдера2), которое утвер- утверждает, что, если а^ и Ь$ — множества неотрицательных чисел, то 2 а/,< B я1,*) B Л1/1) A45) с равенством только в том случае, если а$ и Ь$ пропорциональ- пропорциональны. Суммируя A44) по всем /, положив а^ и Ь$ равными чле- членам, стоящим в правой части A44), и используя A45), получим '"\ A46) Логарифмируя A46), установим, что Е0(р,р) —функция вогну- вогнутая и, таким образом, что д2Е0/др2 ^С 0. Вогнутость является строгой всегда, когда A44) и A45) одновременно не обра- обращаются в равенства. Но условие 1 теоремы 2 является усло- условием того, что A44) обращается в равенство, а условие 2 ) Приведенное здесь доказательство вогнутости принадлежит главным образом X. А. Юдкину. 2) См. Харди,.и др.ь [14],.теорема 17,
Р. Г. Галлагер является условием пропорциональности а^ и Ь$ в случае, когда выполняется условие 1. Доказательство теоремы 4. Начнем с доказатель- доказательства того, что ^(р, р) —выпуклая функция р при р > 0. Поль- Пользуясь D0), представим ^(р, р) в виде /?(Р.Р) = 2«}+Р; «у^ИдЯ^Р) A47) Пусть р = (/*!, ••-, рк) и ^ = (^1, ..., дк) — произвольные вероятностные векторы, и пусть ' к ' •'к При 0 < X < 1 имеем ЧМ+р- A48) У Так как а?- и C/ должны быть неотрицательными и так как х1+р — выпуклая функция х при р >- 0 и х>0, правую часть A48) можно ограничить сверху A49) Таким образом, ^(р, р) —выпуклая функция р при р >- 0. Общая задача отыскания необходимых и достаточных усло- условий для вектора, минимизирующего дифференцируемую выпук- выпуклую функцию на выпуклой определяемой серией неравенств области векторного пространства, решена Куном и Такером [15]. В частном случае, когда область ограничена ри > 0 при ^ » это решение сводится к условию к —д >*а 'при всех к с равенством при ркф0. A50) "к Дифференцируя ^(р, р) и решая относительно постоянной и, сразу же получим D1). Подобно этому если подставить вы- выпуклую функцию — /(р) в A50), то получим D2). Наконец, видно, что ^(р, р) —непрерывная функция в зам- замкнутой области, в которой р — вероятностный вектор. Следова- Следовательно, ^(р, р) имеет минимум, и, таким образом, D1) имеет решение.
Простой вывод теоремы кодирования 89 Доказательство теоремы 7. ЕХ(Р, ЕСЛИ ПОЛОЖИТЬ РкР1 = Я^ ^УР]кР]1~а1 и Р = Х> то МОЖНО увидеть, что лемма непосредственно приложима к —^(р, р). Так как /(р)=^0 по условию, то '2^УР^/^Р^^ не может быть не- независящей от к и /, и ^(р, р)—строго возрастающая по р. Вместе с тем Ех(р, р)—вогнутая функция р, и вогнутость строгая, если ^УР^Р^ не равна всегда 1 или 0 при Но 2У"ЯулЯу/=1, только если Р# = Р# при всех у, и 2 УР)кРц = 0» только если Р^кР^ = 0 при всех /. Л ИТЕРАТУРА 1. ЗЬаппоп С. Е., А таШетаИса1 Шеогу о! соттишсахлоп, Ве11 Зуз. ТесН. /., 27 A948), 379, 623. (Русский перевод: Шеннон К., Матема- Математическая теория связи, сб. Шеннон К., Работы по теории информа- информации и кибернетике, ИЛ, М., стр. 464—487.) 2. Ра по К. М, Тгапзгшззюп оГ тЬгтаИоп, М. I. Т. Ргезз, Ие^ Уогк, 1961. (Русский перевод: Ф а н о Р. М., Передача информации, «Мир», М., 1965.) 3. О а 11 а ^ е г К. С, 1п[огтаИоп 1Ьеогу, ТЬе таШетаИсз о! рЬуз1сз апс! сЬет1з1гу, Рг1псе1оп, N. Л., V. 2, 1964. 4. ШогепсгаИ Л. М., К е п п е с! у К. 5., СосИп^ апс! соттип1саИоп, Рге- 5еп1ес1 а! 1Не иН51 СопГ., Токуо, Ларап, 5ер. 1963. (Русский перевод: Возенкрафт Дж. М., Кеннеди Р. С, Кодирование и связь, Ки- Кибернетический сборник, вып. 9, «Мир», 1964, стр. 71—89.) 5. В 1 а с к ш е 11 С, О 1 г з Ь 1 с к М. А., ТЬеогу оГ ^атез апс! з1а11зИса1 сксь 51оп, Ыеш Уогк, N. V., 1954. (Русский перевод: Блекуэлл Д., Гир- ш и к М. А., Теория игр и статистических решений, ИЛ, М., 1958.) 6. Е И а з Р., СосНп^ [ог 1^о по1зу сЬаппе1з, ТЫгс! Ьопс1оп 5утроз1ит оп ЫГогтаНоп ТНеогу, Ьопйоп, 1955. (Русский перевод: Элайес П., Ко- Кодирование для двух каналов с шумами, сб. Теория передачи сообще- сообщений (Труды Третьей международной конференции), ИЛ, М., 1957, стр. 114—138.) 7. НеИГеп В., А по!е оп уегу пслзу сЬаппе1з, 1п]огт. Соп1го1, в A963), 126. 8. Р а п о К. М., Рпуа1е соттишсатлоп, 1963. 9. ЗЬаппоп С. Е., РгоЬаЫШу о! еггог Гог орИта1 сос!ез 1п а Оаизз1ап сЬаппе1, ВеИ Зуз. ТесН. }., 38 A959), 611. (Русский перевод: Ш е н- н о н К. Э., Вероятность ошибки для оптимальных кодов в гауссов- ском канале, сб. Шеннон К., Работы по теории информации и кибернетике, ИЛ, М., 1963, стр. 540—586.) 10. 5 Ь а п п о п С. Е., ТЬе гего-еггог сарасНу оГ а по1зу сЬаппе1, ЩЕ Тгапз. оп ЩогтаНоп ТНеогу, 1Т-2 A956), 8—19. (Русский перевод: Шен- Шеннон К. Э., Пропускная способность канала с шумом при нулевой
90 Р. Г. Галлагер ошибке, сб. Шеннон К., Работы по теории информации и киберне- кибернетике, ИЛ, М., 1963, стр. 464—487). 11. Ре1егзоп XV. ^., Еггог соггесИп^ соскз, М. I. Т. Ргезз, СатЬпс1^е, Мазз., 1пс, Ые^ Уогк, N. У., 1961. (Русский перевод: Питерсон У., Коды, исправляющие ошибки, «Мир», М., 1964.) 12. О а 11 а §[ е г К. С, Ьо^ йепзНу рагНу сЬеск сойез, М. I. Т., Ргезз, Сат- Ьг1A^е, Мазз., 1963. 13. Гнеденко Б. В., Колмогоров А. Н., Предельные распределения для сумм независимых случайных величин, М.—Л., 1949. 14. Нагс1у О. Н., ЫШе^оос! Л. Е., Ро1уа С, 1пеяиа1Шез, СатЬпс1^е, Еп^1апс1, ТЬеогет 16, 1959. (Русский перевод: Харди Дж., Литтл- в у д Дж., Полна Г., Неравенства, ИЛ, М., 1948.) 15. КиЬп Н. XV., Тискег А. XV., ЫопПпеаг рго^гаттт^, Зесопс! Вегке1еу 5утроз1ит оп МаШетаИса1 51аИзИсз апс! РгоЬаЫШу, Вегке1еу, 1951, 481.
О построении кодов без запятой1) В. Л. И отмен Приводится метод построения максимальных (по числу слов) кодов без запятой при любой нечетной длине п слов и любом основании а алфавита. 1. Введение. Конечный код называется синхронизуемым то- тогда и только тогда, когда существует минимальное число М, такое, что знание последних М букв произвольного сообщения достаточно для разделения кодовых слов. Блочный код С, со- содержащий слова длины я, называется кодом без запятой тогда И ТОЛЬКО ТОГДа, КОГДа ДЛЯ ЛЮбЫХ СЛОВ ХМ = 1М1ТЮ2 . . .1Мп И Х = ... хПу принадлежащих С, я-буквенные перекрытия ..., я) не являются словами кода. Коды без запятой образуют под- подкласс синхронизуемых кодов, для которых Л1<2я. Голомб, Гор- Гордон и Велч [1] показали, что число слов длины я в коде без за- запятой, построенном над алфавитом, содержащим буквы 0, 1, .,, ш л ., о — 1, не может превышать а \п где суммирование распространяется по всем делителям й чис- числа я, а \к(й) —функция Мёбиуса. Голомб, Гордон и Велч пред- предположили, что эта граница достигается при всех нечетных значениях я и всех а. С другой стороны, Истмен и Ивен [2] показали, что Да, я) равно максимальному числу слов синхро- синхронизуемого блочного кода, состоящего из слов длины я над ал- алфавитом из а букв. Таким образом, если это предположение справедливо, то требование кода без запятой при нечетных зна- значениях я не вызывает уменьшения числа слов, хотя это тре- требование является значительно более сильным, чем требование синхронизуемости кода. ) Еаз1тап №. Ь., Оп Ше сопз1гис1юп о1 сотта-Ггее сойез, 1ЕЕЕ Тгап$. 1п}огпг. ТНеогу, 1Т-11, № 2 A965), 263—267,
92 В. Л. Истмен Построение кодов без запятой было рассмотрено ранее Го- ломбом и другими [1], [3]—[5]. В работе [1] Голомб, Гордон и Велч показывают, как можно построить максимальные (по числу слов) коды без запятой при я = 3, 5, 7 и 9. Далее они утверждают, что их методы могут быть расширены для по- построения максимальных кодов без запятой при л=11, 13 и 15. Однако следует заметить, что лексикографическое упорядочи- упорядочивание не дает кодов без запятой для этих случаев. В настоящей статье предложен метод построения кодов без запятой Са, п при всех нечетных значениях п и всех а (см. определение 2 п. 2). В п. 3 приводится доказательство того, что коды С0} п являются кодами без запятой. В п. 4 показано, что коды СОг п максимальны и что предположение Голомба, Гор- Гордона и Велча в действительности справедливо. 2. Построение кодов без запятой. Метод построения, пред- предложенный в этом пункте, дает максимальные коды без запятой при любом заданном основании а алфавита и любой нечетной длине п слов. В последующем рассмотрении головой будет на- называться произвольная последовательность из пг букв A^т< < п) начала некоторого слова, а хвостом — произвольная по- последовательность из ш букв A ^т < п) окончания некоторого слова. Мы начнем наше рассмотрение с нескольких примеров и введем обозначения, которые будут полезны при описании кодов без запятой. Пример 1. а = 2, п = 3. Код без запятой задается множеством из двух слов С2, з= = {100, 101}, которое мы сокращенно запишем как С2, з={Юа}. Символ а всегда следует понимать таким образом, что его можно заменить любой буквой алфавита @, 1, ..., а— 1), ко- которая не меньше предшественника а в этом кодовом слове. Так, {1010а} = {10100, 10101} {10ааа} = {10000, 10001, 10011, 10111}. Пример 2. а = 2, п = 5. Сг, 5 = {Ю10а, 10ааа}. Мы будем сокращенно записывать в дальнейшем этот код как С2,5 = {Ю5а}. Символ В следует понимать таким образом, что его можно заменить как последовательностью 10, так и последователь- последовательностью аа. (Замена символа 5, конечно, предшествует замене символа а.) Заметим, что последовательность аа никогда не может быть заменена последовательностью 10. Отсюда следует, что никакой хвост никакого слова из С2,5, имеющий четную длину, не является головой никакого слова из С2% $. Следова- Следовательно, этот код является кодом без запятой,
О построении кодов без запятой 93 Пример 3. а = 2, п = 7. С2,7={10##а} = {101010а, ЮЮааа, \0аа\0а, Юааааа). Каждый код, определенный до сих пор, был порожден не- некоторым характеристическим образцом, состоящим из последо- последовательности 10... а, где между головой 10 и хвостом а могла встретиться последовательность из символов В длины 0, 1, 2, ... . Введем теперь дальнейшее обозначение, которое за!ме- няет каждую последовательность 10... а числом символов 5, содержащихся в этой последовательности. Используя эти обо- обозначения и отбрасывая скобки, мы можем сказать, что: С2K порождается образцом 0, С2>5 порождается образцом 1, С2>7 порождается образцом 2. Обратимся теперь к случаю произвольного основания а ал- алфавита. Каждый код, который был определен до сих пор, со- содержал только слова, начинающиеся головой 10. В общем слу- случае мы будем учитывать при включении в С0) п только слова, начинающиеся уменьшающейся головой ху, где а > х > у >- 0. Пример 4. в=в, п=3. Со> з = {хуа) является кодом без запятой. Символ а снова следует понимать таким образом, что его можно заменить любой буквой алфавита {0, 1, ..., а— 1}, кото- которая не меньше предшественника а в этом кодовом слове. Рас- Распространяя очевидным образом понятие характеристического образца, мы можем сказать, что Са> 3 порождается характери- характеристическим образцом 0. Пример 5. в = в, п = 5. , хуааа]. Символ В всегда следует понимать таким образом, что его можно заменить как любой уменьшающейся головой ху, так и последовательностью аа. Заметим, что для любого г последова- последовательности, порожденные га, отличны от последовательностей, порожденных ху. Отсюда следует, что код С0M является кодом без запятой, так как никакой хвост никакого слова из этого кода, имеющий четную длину, не является головой никакого слова из этого кода. Снова можно сказать, что этот код поро- порождается характеристическим образцом 1. Подобным образом Со> 7 порождается образцом 2. Максимальный код без запятой можно получить в случае /г=11 путем выбора всех слов, порожденных образцами 4 и 100
94 В. Л. Истмен (т. е. хуВахуахуа), в случае я=13 — путем выбора всех слов, порожденных образцами 5, 200 и 101. В работе [6] этот подход расширен для определения максимальных кодов без запятой для всех простых длин п слов при п^31. Однако этот подход не будет использован здесь, так как его нельзя обобщить на все нечетные я. Если некоторое слово до порождается образцом х) р = ж=*Р\рг- • -Ри то мы будем говорить, что до составлено из г сек- секций, /-я секция есть часть слова, порожденная числом р$, и она имеет вид хуВ ... Ва, где длина последовательности из симво- символов В равна р-2, а длина всей секции равна 2/^ + 3. Для каждой секции / слова ш мы определим числовое значение ю$ по осно- основанию а следующим образом: где т = 2р;- + 2 и хюк— начальная буква секции /. В дальнейшем при определении кодов СОг п мы будем требовать, что если до подлежит включению в СОг п, то слово V, составленное из чис- числовых значений секций слова хю, должно принадлежать неко- некоторому ранее определенному коду Ср> *. Таким образом, опре- определение кодов происходит индуктивно по п. Определение 1. Характеристический образец • Ра порождает все слова вида . * хуВ ... ВахуВ ... Ва ... хуВ ... Ва, где символ В можно заменить как ху (о>х>у^> 0 для каждой последовательности ху), так и аа и символ а можно заменить любой буквой, которая не меньше предшественника а. Определение 2. Код Са$1 есть алфавит {0, 1, ..., а— 1}. Код С0,п (п нечетно, п^Ъ) состоит из всех слов до, каждое из которых: 1) порождается некоторым характеристическим об- образцом нечетной длины одного из видов Ри 1) Мы будем также использовать обозначение р=рн Ря... ри для образ< да длины I.
О построении кодов без запятой 95 где л —3/ а) ' б) / — наибольшее из нечетных целых чисел /, таких, что /г, и 2) обладает тем свойством, что слово V = V^V<^... рь об- образованное из числовых значений секции слова до, является словом кода Ср>^ при некотором р. Однобуквенный характеристический образец ри будет назы- называться первичным характеристическим образцом; остальные об- образцы будут называться вторичными. Слова, порожденные пер- первичным образцом, будут называться первичными словами, а их головы и хвосты будут называться первичными головами и хвостами. Каждое неотрицательное целое число к является первичным образцом при некотором нечетном л, а именно при Для произвольной 1) я-буквенной последовательности г — = 2^2... гп (п нечетно) можно построить образец р, который порождает некоторую циклическую перестановку г. Определим последовательность 8 = 8 (г) следующим образом: 0, если ^1^-^Л, 1, если гх <гп, и Г О, если г/>г/_1, с ^ ■' ' / О ~ ; 1 1, если г; <гу_!, Итак, если 5^ — 1, то 2;- не может быть получен из символа а, тогда как если 5^ = 0, то г$ не может быть получен из сим- символа у. Следовательно, если 5;-... 5д — серия четной длины из единиц, то 2;... гк можно получить лишь из последователь- последовательности вида хуху ... ху, в то врем%как если 5;-... 8к — серия не- нечетной длины из единиц, то г^^г^... гк можно получить лишь из последовательности вида хуху . . . ху. (При рассмотрении последовательности 5 с точки зрения серий из единиц счи- считается, что 51 следует за 5П.) Все остальные буквы слова г могут быть получены только из символов а. Выписывая соот- соответствующие символы х, у или а под каждым 5;- (/=1,2,.. .,я), мы получаем некоторую последовательность, из которой мо- может быть получена г. Эта последовательность разделяется на ^ Приведенное ниже утверждение справедливо лишь для последователь- последовательностей, содержащих по крайней мере две различные буквы. Однако это не* существенно для дальнейшего, — Прим. перев*
96 В. Л, Ист мен секции следующим образом. Каждая новая секция начинается после серии нечетной длины из символов а. Так как п нечетно, а символы х и у встречаются только парами, то такое разбие- разбиение должно создать нечетное число секций. (Одна из секций, конечно, может начинаться в хвосте и оканчиваться в голове этой последовательности.) Характеристический образец полу- получается заменой каждой /-й секции числом Рз=(у — 3)/2, где V — число букв в этой секции. Для определенности выберем в качестве первой секции секцию, содержащую г^ Пример: г = 301 201230312 4330313 201 20123 32 5=010 010001010 0101010 НО 01000 01 хуа, хуаахухуа, хухухуа, хуа, хуааа, ху /7=13201. Ясно, что одна из циклических перестановок последователь- последовательности г порождается образцом р. Если слово хю принадлежит коду С0|П, то хю порождается единственным образцом р и разбиение хю на секции единствен- единственно. Так как каждая секция слова всегда начинается положи- положительным целым числом, то для заданного алфавита существует взаимно однозначное соответствие между секциями и их число- числовыми значениями. Следовательно, с каждым словом хю кода С0$п связана единственная последовательность V из числовых значений секций слова хю. 3. Доказательство того, что коды СОг п являются кодами без запятой. В этом пункте будет установлено индукцией по п, что коды Са> п являются кодами без запятой для всех алфави- алфавитов с основанием а и всех нечетных длин п слов. Необходимое и достаточное условие того, что код С является кодом без за- запятой, дается леммой 1, которая по существу является пере- переформулировкой определения ^ода без запятой, приведенного ранее. Вслед за леммой 1 мы докажем еще три леммы, приво- приводящие к основному результату этого пункта (теореме 1). Лемма 1. Блочный код С является кодом без запятой то- гда и только тогда, когда для каждой пары последовательно- последовательностей з/ и з", таких, что слово хм = з'з" принадлежит С, или з/ не является хвостом никакого слова из С, или з" не является голо- головой никакого слова из С. Лемма 2. Никакой первичный хвост I четной длины произ- произвольного слова из С0о, п0 не является головой никакого слова никакого кода СОг п.
О построении кодов без запятой 97 Доказательство. Хвост I начинается (строго) убываю- убывающей последовательностью букв, имеющей нечетную длину. Но все головы четной длины начинаются убывающими последова- последовательностями букв, имеющими четную длину. Следовательно, I не является головой никакого слова никакого кода СОгП. Лемма 3. Никакая первичная голова Н четной длины произвольного слова из С0о, п0 не является хвостом никакого слова никакого кода Со, п. Доказательство. Голова Н оканчивается неубывающей последовательностью букв, имеющей нечетную длину. Но все хвосты четной длины оканчиваются неубывающими последова- последовательностями букв, имеющими четную длину. Следовательно, Н не является хвостом никакого слова никакого кода СОгП. Лемма 4. Если слово до = ДО1ДО2...^п принадлежит коду Сд0, п (п нечетно, п ^ 3), то для любых неотрицательных а и C слово о/ = (^1 + а)ш2.. . шп_1(шп + Р) принадлежит коду С0$п при некотором о. Доказательство (индукция по п). Лемма 4 тривиально выполняется при п = 3 и всякий раз, когда слово ш порождено первичным образцом. Предположим, что она справедлива при всех п<Ы. Пусть слово до = ДО1Ш2. .. до^, принадлежащее С0о) дг, порождено вторичным характеристическим образцом, и пусть до'= (^1 + а)ш2... ^лг-1(^.лг + Р), где аир неотрицательны. Вы- Выберем произвольное а4>тах (а0— 1, ^1 + а, ш^ + Р) и образуем 1 '^ \ последовательность V1 = ъ'^ ... ъ\ из числовых значений по основанию а! секций слова ш'. Очевидно, что слово ш принад- принадлежит коду СОим. Образуем последовательность V из числовых значений (по основанию о\) секций слова ш. По определению 2 слово V принадлежит коду Ср, { при некотором р. Но V' удо- удовлетворяет соотношениям гс[^>ео1, ъ'^ — Ъу ..., ю^^ — ъ^^ ч)г По индуктивному предположению слово V' принад- принадлежит коду СР) I при некотором р. Следовательно, слово ш' при- принадлежит коду СОгк при некотором а, так как все условия определения 2 выполнены. Таким образом, лемма 4 справед- справедлива при всех п. Теорема 1. Если слово тм = 8'8" принадлежит коду С0о, Ло, то или з' не является хвостом никакого слова никакого кода Со$ л, или 8" не является головой никакого слова никакого кода С* „. Доказательство (индукция по я0). Условие теоремы не выполняется, когда яо=1. Теорема справедлива при яо = 3, так как по лемме 2 никакой хвост четной длины слова из С0о, з
98 В. Л. Истмен не является головой никакого слова никакого кода Са,п и по лемме 3 никакая голова четной длины слова из С0о, з не является хвостом никакого слова никакого кода С0$п. Предпо- Предположим теперь, что теорема справедлива при всех во и всех не- нечетных значениях яо<Л/. Пусть з/ и &" — произвольная пара последовательностей таких, что слово до —5'5" принадлежит коду С(т0, ы- Тогда справедливы следующие утверждения: 1) Если з" — хвост четной длины, начинающийся в нечет- нечетной секции слова до, то по лемме 2 з" не является головой ни- никакого слова никакого кода Са$ п, так как з" имеет в качестве своей головы первичный хвост четной длины. 2) Если з" — хвост четной длины, начинающийся в четной секции слова до, и первая буква $" не является начальной бук- буквой этой секции, то по лемме 3 з/ не является хвостом никакого слова никакого кода Со$ п, так как з/ имеет в качестве своего хвоста первичную голову четной длины. 3) Если з" — хвост нечетной длины, начинающийся в чет- четной секции слова до, то по лемме 2 з" не является головой никакого слова никакого кода Са, п, так как з" имеет в каче- качестве своей головы первичный хвост четной длины. 4) Если з" — хвост нечетной длины, начинающийся в нечет- нечетной секции слова хю и первая буква з" не является начальной буквой этой секции, то по лемме 3 $' не является хвостом ни- никакого слова никакого кода С0,п, так как з/ имеет в качестве своего хвоста первичную голову четной длины. 5) Если з" — хвост четной длины, начинающийся первой буквой четной секции слова до, то или з" не является головой никакого слова никакого кода Со, п, или з/ не является хвостом никакого слова никакого кода Со$ п. Действительно, предполо- предположим, что в некотором коде Са„ л, существует слово хю' такое, что з' является хвостом до', и в некотором коде СОъ П2 суще- существует слово хю" такое, что з" является головой до". Пусть сгз = = тах (а0, аь а2). Тогда -ДО^СОя> к, <®'€С0^П1 и ^ГГ^СО„ «2. Об- Образуем слово у = ^2...^, состоящее из числовых значений (по основанию а3) секций слова до. По построению кода СОз, N слово V принадлежит коду Ср>г- при некоторых р и /<ЛЛ Пусть 1Г = х)]хJ... р& и I" = юк+1Оъ+2.. . Юг являются соответственно го- головой и хвостом слова у, которые соответствуют голове $' и хвосту з" слова хю. Тогда слово, образованное из числовых зна- значений (по основанию аз) секций слова хю\ имеет хвост ы' = = (^1 + а)у2 ..• Ъъ при некотором неотрицательном а, в то время как слово, образованное из числовых значений (по основанию о3) секций слова хю"\ имеет голову ^—^л+^л+г*.. ^*-1(^ + Р) при некотором неотрицательном р. Но по лемме 4 слово V''=* =и/и// принадлежит коду Ср,г- при
О построении кодов без запятой 99 некотором р. Так как /<Л/, то по индуктивному предположе- предположению или и" не является головой никакого слова никакого кода Са,п, или и' не является хвостом никакого слова никакого кода Со, п, что приводит к противоречию. Следовательно, или з" не является головой никакого слова никакого кода С0|П, или $' не является хвостом никакого слова никакого кода С0,п- 6) Если з" — хвост нечетной длины, начинающийся первой буквой нечетной секции слова до, то теми же рассуждениями устанавливается, что или з" не является головой никакого слова никакого кода Са,п, или з/ не является хвостом никакого слова никакого кода С0,п. Все возможности для з" были рассмотрены. Поэтому для любой пары последовательностей з/ и 5", таких, что слово до = = 5/5// принадлежит коду Сд<ьдг (<*о — произвольное), или з/ не является хвостом никакого слова никакого кода Са,п, или з" не является головой никакого слова никакого кода Со п. Сле- Следовательно, теорема доказана по индукции при всех сто и всех нечетных л0. Следствие. Коды С0,п являются кодами без запятой при всех а и всех нечетных п. 4. Максимальность. В этом пункте будет показано, что коды СОуП, построенные в соответствии с определением 2, максималь- максимальны (по числу слов) и что предположение Голомба, Гордона и Велча из Несправедливо. Пусть Оп — циклическая группа преобразований слов, по- порожденная преобразованием а, где ЩЩ . . . IVп — -> Таким образом, Оп — группа преобразований, осуществляющих циклические сдвиги слов. Му говорим, что два слова Ю\ и хю2 эквивалентны тогда и только тогда, когда существует преобра- преобразование из Оп, которое переводит Ш\ в до2. Класс эквивалент- эквивалентности может содержать не более п элементов. Если класс со- содержит ровно п (различных) слов, то этот класс будет назы- называться невырожденным; в противном случае он будет назы- называться вырожденным. Код без запятой не может содержать никакое слово из вырожденного класса эквивалентности и бо- более чем одно слово из произвольного невырожденного класса эквивалентности. Поэтому достаточным условием максималь- максимальности кода СОуП является то, что он содержит некоторое слово из каждого невырожденного класса эквивалентности. Если по- последнее можно показать для всех кодов С0,п, построенных со- согласно определению 2, то предположение Голомба и других справедливо, поскольку, как показано в [1], /(а, п) равно числу невырожденных классов эквивалентности,
100 В. Л. Истмен Теорема 2. Для любого а и любого нечетного п код содержит некоторое слово из каждого невырожденного класса эквивалентности. Доказательство. Если л=1, то теорема справедлива, так как каждая буква алфавита {0, 1, ..., а—1} составляет невырожденный класс эквивалентности и никаких других клас- классов не существует. Предположим теперь, что теорема справед- справедлива при всех (нечетных) п<N. Пусть ш — произвольное слово из произвольного невырожденного класса эквивалентности слов длины N. построенных над алфавитом из а букв. Построим образец р, который порождает некоторую циклическую переста- перестановку слова ш. Тогда р = Р\Р2- • - Р% при некотором нечетном ь A ^л-^М/3), и очевидно, что р удовлетворяет условиям 1 (а) и 1 (б) определения 2. Разделим ю на I секций, порожденных I компонентами образца р, и вычислим числовые значения ю$ (/=1, ..., ь). Так как ш принадлежит невырожденному классу, то у = у^г • •. У{ принадлежит некоторому невырожденному классу слов длины КЫ. При некотором р код Ср>* по индук- индуктивному предположению содержит некоторую циклическую пе- перестановку слова V. Поэтому некоторая циклическая переста- перестановка слова ш включена в код С0|П. Следовательно, теорема доказана индукцией по п при всех а и всех нечетных п. Следствие. Коды СОшП максимальны (по числу слов) при всех а и всех нечетных п и содержат /(а, п) слов, что доказы- доказывает предположение Голомба, Гордона и Велча. Л ИТЕРАТУРА 1. Оо1отЬ 5. XV., О о г с! о п В., XV е 1 с Ь Ь. К., Сотта-Ггее соскз, Сапай. /. МаШ., 10, № 2 A958), 202—209. (Русский перевод: Голом б СУ., Гордон Б., В е л ч Л. Р., Коды без запятой, Кибернетический сбор- сборник, вып. 5, М., ИЛ, 1961.) 2. Е а з 1 т а п XV. Ь., Е V е п 5., Оп зупсЬгошгаЫе апс! РЗК-зупсЬгошгаЫе Ыоск соске, 1ЕЕЕ Тгапз., 1Т-10, № 4 A964), 351—356. 3. О о 1 о т Ь 5. XV., XV е 1 с Ь Ь. К., О е 1 Ь г и с к М., Соп51гис11оп апс! рго- регИез оГ сотта-Ггее сос!ез, ВШ. Мейй. пап. У'ьй. Зе1зк., 23, № 9 A958), 3—34. (Русский перевод: Голом б С. У., Велч Л. Р., Дельбрюк М., Строение и свойства кодов без запятой, сб. Мате- Математика, 4 : 5 A960), 137—160.) 4. О о 1 о т Ь 5. XV., ЕШаеп! сосНп^ Гог скзохупЬописЫс сЬаппе1, МаШета- 11са1 РгоЫетз т Ше Вю1о^ка1 Зскпсез, Ат. МаШ. 5ос, Рптскпсе, 1962, 87^100. 5. Л ^ ^ з В."^Н., Кесеп! гезиНз т сотта-Ггее сойез, Сапай. /. МагН., 15, № 1 A963), 178—187. 6. Е а з 1 т а п XV. Ь., ОеПшп^ раНегпз Гог сотта-1гее сос!ез Гог зта11 рпте шогс! кп^Шз, Зреггу Напд КезеагсЬ Сеп1ег КезеагсЬ Мет. 64—4, Арг. . 1964.
Приведенные формы для стохастических последовательностных машин1) Е. У. Карлайл 1. ВВЕДЕНИЕ Стохастическая последовательностная машина М = (X, Г, 5, Р) определяется заданием конечных множеств X, У, 5 (элементы которых называются соответственно входными символами, вы- выходными символами и состояниями) и функций условной ве- вероятности Р(У, *'|$. х): х^Х; у$У; 5, 5^5. A.1) Предполагается, что модель М представляет идеализирован- идеализированную физическую систему с конечным числом таких различных внутренних конфигураций (состояний), что: A) если на вход подан х при состоянии 5, то Р(у, 5'|$, х) есть полная вероят- вероятность того, что будет получена реакция у и новым состоянием будет $', и B), если машина находилась вначале в состоянии 5! и последовательно на вход подавались хи х2, ..., хп, то выход- выходная последовательность у^ ..., уп имеет вероятностное распре- распределение п I ХХХ1 ••••*«)= г 2 ^ , Д Р {Ук' ** + , | **. Хк). A.2) Если 5, /^5 и для любого положительного п Рз\У\У2 ' ' * Уп Х\Х>2 • • • Хп) = р^ \У\У2 • • • Уп\ -^1-^2 • • • Хп) A«о) для всех Хи€.Х, Ук€.У, Л=1, 2, ..., л, то состояния 5 и I назы- называются эквивалентными (т. е. 5 и г неразличимы как внутрен- внутренние начальные условия, поскольку они приводят к одному и тому же «внемне наблюдаемому поведению», или «отношению входа — выхода» р*(•!•))• В разд. 2 (теорема 1) устанавли- устанавливается, что достаточным условием эквивалентности льдбы^с двух состояний 5 и г является справедливость условия A.3) для п = 1) С а г 1 у 1 е Л. Ш., Кедисей 1огтз !ог зЬсЬазИс 8е^иеп^^а1 тасЫпез, /. МаИг. Апа1у818 апд, Арр1, 7 A963), 167—-176.
102 Е. У. Карлайл «с— 1, где с — число элементов множества 5. Это стохастиче- стохастическое обобщение фундаментального результата Мура [1] для де- детерминированных конечных автоматов (в настоящем контексте М является детерминированным, если вероятностная функция Р принимает лишь значения 0 и 1. От обычного функционального описания, очевидно, можно перейти к такой форме). Доказа- Доказательство теоремы 1 было подсказано работами Блэкуэлла, Куп- мана [2] и Гильберта [3] о функциях стационарных цепей Мар- Маркова с конечным числом состояний. Входная, последователь- последовательность стохастической последовательностной машины может быть представлена как функция контролируемой цепи Маркова с конечным числом состояний (для которой переходные ве- вероятности в любой момент времени п зависят от входного сим- символа, подаваемого в момент п). Такая модель была использо- использована в [4] для дискретного канала связи с шумами; формули- формулировки, эквивалентные A.1) и A.2), для этой цели были даны Шенноном [5]. Таким образом, результаты, полученные здесь, могут быть интерпретированы или как стохастические обобще- обобщения соответствующих фактов теории детерминированных авто- автоматов, или как структурные свойства каналов связи с конечным числом состояний. ■ Если некоторые из состояний стохастической последователь- последовательностной машины эквивалентны, то структура машины должна быть избыточной; в разд. 3 будет показано, что, как и в де- детерминированном случае, эта избыточность может быть устра- устранена путем получения упрощенного варианта машины, назы- называемого приведенной формой. Приведенная форма стохастиче- стохастической последовательностной машины может быть не единствен- единственной (в противоположность детерминированному случаю); тем не менее существует вычислительная процедура для нахожде- нахождения всех приведенных форм данной машины. 2. ДОСТАТОЧНОЕ УСЛОВИЕ ЭКВИВАЛЕНТНОСТИ Пусть М=(Х, У, 5, Р)—машина с с состояниями, для удобства мы идентифицируем 5 с множеством целых чисел 1, 2, ..., с. Для каждой пары (х, у) входного и выходного символов через М(у\х) обозначим матрицу, //-элемент которой есть ши(у\х) = Р(у, у|/, х). Тогда {М(у\х) :х€Х, у^У] — семейство сХс матриц с неотри- неотрицательными элементами, таких, что для каждого х переходная матрица состояний
Приведенные формы 103 есть марковская матрица; любое семейство матриц {М(у\х)} с этим свойством определяет машину с с состояниями. Таким образом, мы записываем М = {М(х\у)}, рассматривая эту запись как другое обозначение машины; при нашем рассмотрении входное и выходное множества X и У предполагаются общими для всех машин и не будут упоминаться явно. Буквы и и V применяются для обозначения конечных последовательностей входных и выходных символов, исключая пустую последова- последовательность 0, имеющую длину нуль. ииг обозначает соединение последовательности и с последующей последовательностью и', а \и\ есть длина и, так что, например, \уV\ = \ + \V\. Когда обе и- и ^-последовательности появляются в одном контексте (с идентичными индексами или последние отсутствуют), то предполагается, что | и \ = | V \. Если {М(у\х)} — машина с с состояниями, то сХс матрицы М {о[и) определяются равенством М{ю\а) = М(у1\х1)М(у2\х2) ... М(уп\хп), B.1) когда и = Х1Х2...хп и V=у^у2...Уп, тогда как М @\0) есть единичная матрица. Если е — ^-компонентный вектор-столбец, все компоненты которого равны единице, то из A.2) видно, что Н&\и)=М^\и)е, B.2) где к{ю\и) — окомпонентный вектор-столбец, 1-я компонента которого есть рг-(а|а). Из B.1) и B.2) мы получаем рекурсив- рекурсивный метод конструирования й-вектора к{о&\ии')=М^\и)к{о'\и'). B.3) Если я=(я1, я2, ..., яс) —любое вероятностное распределение состояний М, т. е. любое начальное распределение для М, тогда число \ | B.4) означает вероятность реакции V, когда и подается при началь- начальном распределении я. Если к — неотрицательное число, два на- начальных распределения я и X называются к-жвивалентными (относительно М), если рл^\и) =р%{ю\и) для всех и и V дли* ны к\ я и X эквивалентны, если они ^-эквивалентны для всех к (иначе говоря, неразличимы). Когда я и % являются вырожден- вырожденными распределениями, это определение, очевидно, согласуется с введенной выше концепцией эквивалентности состояний. Теорема 1. Если машина М имеет с состояний и если я и К — любые два начальных распределения М, тогда (с—1)- жвивалентность пик есть достаточное условие их эквивалент-- носш.
104 Е. У. Карлайл Доказательство. Если г — любой окомпонентный век тор-столбец, то пусть г|)(г) = (я — К)г\ тогда, в частности, при меняя B.4), получаем так что я и X ^-эквивалентны тогда и только тогда, если г|) равно нулю на линейном подпространстве (^-мерного простран- пространства), натянутом на векторы К(х)\и) для всех и к V длины к. Пусть это подпространство есть Ьъ{М)\ теорема будет верна, если мы сможем установить, что для достаточно большого к (т. е. к ^ с—1) все пространства Ьь(М) совпадают. Прежде всего заметим, что для любого к Ь^а Ьъ+и поскольку К (р | а) = 2л & (ЩI их). у С другой стороны, если ^ = ^+ь тогда ^+1 = ^+2, потому что Ьк+2 натянуто на векторы Н{ую\хи) для всех х, у и всех а и у длины (&+1), а для таких х, у, и, V Н^\и) = М(у\х) (вектор в 1Л+1) = = М(у\х) (вектор в Ьк) = , Линейная комбинация векторов = М(у\хУ /. /ч /I 1/1 и ; \а ): 1^'! = \ю'\ —к == {лин. комбинация векторов Ь, Таким образом, существует число / = /(А1), такое, что ^й = для всех й>/, тогда как размерность Ьь+1 строго больше раз- размерности Ьъ для всех к<]. В частности, (сНт 10) +/ ^ сНт I/ (< с). Но сПт Ьъ=&\т {пространство, натянутое на е}=\ для любой машины, так что / ^С с— 1, что завершает доказательство. Когда одновременно рассматриваются две или более ма- машины, то удобно приписывать идентифицирующие индексы к величинам рл{ю\и) и к(ю\и), т. е. B.2) может быть записано в виде Нм(ю\и) =М(ю\и)е. Предположим, что я и % есть на- начальные распределения соответственно для машин М и N (М и N могут иметь разное число состояний). Если р^(^\и) = = р^^\а)лля всех и я V длины к, мы говорим, что начальное распределение п для М к-жвивалентно начальному распреде- распределению К для Л/, или что (М, п) и (Л/, X) — к-эквивалентные си- системы. Если ^-эквивалентность справедлива для всех к, то (М, п) и (Ы,Х) эквивалентны, что мы символизируем обозначе- обозначением (Л4, п) ~ (М, Я). Если п сосредоточено на единственном
Приведенные формы 105 состоянии 5, мы можем писать (М, 5) ~ (Л/, Я), т. е. состояние и невырожденное распределение неразличимы. Теорема 2. Если машина М имеет с состояний, N имеет й состояний, а п и Я — начальные распределения соответствен- соответственно для М и М, то {с + й—\)-эквивалентность (М,п) и есть достаточное условие их эквивалентности. Доказательство. Пусть М-\:N есть сумма машин, опре- деленная равенством М{у\х) О М{у\х) Применим теорему 1 к машине М + Ы с начальными распреде- распределениями Л# = @, ..., 0, Достаточные условия, данные в теоремах 1 и 2, являются лучшими из возможных, зависящими только от числа состоя- состояний, поскольку легко построить детерминированные машины, для которых действительно достигаются границы с—1 и с + + с1—1 [1]. Теорема 2 при М = Ы была установлена для функций мар- марковской цепи (т. е. автономной стохастической последователь- ностной машины) Гильбертом [3] и ранее (вернее, с границей 2с2+1 вместо 2с— 1) Блэкуэллом и Купманом [2]. Этот послед- последний метод доказательства был модифицирован для получения теорем 1 и 2. Часть процедуры, примененная Муром [1] для детерминированных машин, включая иерархию разбиений мно- множества состояний относительно ^-эквивалентности, &=1,2, ... может быть расширена на стохастический случай [6], при усло- условии, что «множество состояний» заменяется на «множество всех начальных распределений». Немедленным следствием теоремы 2 (с М = М) является то, что если структура М не дана, но р^(^\и) определена для всех последовательностей длины 2с—1, то р^(ю\а) однозначно определено для всех последовательностей произвольной длины. Для функций марковской цепи явное правило для конструиро- конструирования функции р% по их значениям для аргументов длины 2с — 1 было получено Гильбертом [3]. Этот результат может быть распространен на любую стохастическую последователь- цостную машину [6],
106 Е. У. Карлайл 3. ПРИВЕДЕНИЕ Если каждому состоянию машины М соответствует эквива- эквивалентное состояние машины N и каждому состоянию машины N соответствует эквивалентное состояние машины М, то М и N называются машинами, эквивалентными по состояниям. Среди машин, эквивалентных по состояниям данной машине М, те, которые имеют минимальное число состояний, называются при- приведенными формами для М. Будем говорить, что машина, у ко- которой любая пара состояний неразличима (т. е. не существует эквивалентных состояний), находится в приведенной форме. Терминология непротиворечива, поскольку приведенные формы любой машины являются в точности теми машинами, которые эквивалентны М по состояниям и находятся в приведенной форме. Это следует из теоремы 3, приведенной ниже, и из тран- транзитивности эквивалентности по состояниям. Теорема 3. Пусть М — машина с с состояниями, имею- имеющая по крайней мере пару эквивалентных состояний. Тогда су- существует машина с (с— 1) состояниями, которая эквивалентна М по состояниям. В частности, если з и I есть эквивалентные состояния М, а М(у\х)—матрица, полученная из М(у\х) вы- вычеркиванием строки г и столбца I и заменой столбца 8 суммой столбцов I и 8, то Ы=^(у\х)} есть машина с (с— 1) состоя- состояниями, эквивалентная М по состояниям. Доказательство. Для удобства пусть состояния М про- пронумерованы так, что 8 = с—Л и 1-е. Тогда с — 1, у = 1, • •., с — 2, , * = 1, 2, ..., с—\ Ясно, что [№(у\х)} — машина. Мы хотим показать, что для всех и, V ъ\и) = р*1(ъ\и), 1 = 1, 2, ..., с—\, C.1) и ?(Ф) ?(Ф) C.2) Заметим, что C.2) следует из C.1) при 1 = с— 1, так как со- состояния с и с— 1 машины М предполагаются эквивалентными. Утверждаемые равенства очевидны (по построению Ы) для а| = |р| = 1, и если они справедливы для всех последователь- последовательностей и и V длины й, тогда для таких последовательностей и
Приведенные формы 10? любых х и у для 1=1, 2, ..., с—1, так что C.1) справедливо для последо- последовательностей длины (й+1), что завершает доказательство по индукции. Правило построения машины N в теореме 3, называемое склеиванием (тег§т§) эквивалентных состояний, есть обобще- обобщение аналогичной процедуры приведения, применяемой в тео- теории детерминированных последовательностных машин. Процесс склеивания эквивалентных состояний может применяться к дан- данной машине М многократно, пока не будет получена приведен- приведенная форма. Если М — детерминированная, то хорошо известно, что ее приведенная форма единственна (с точностью до пере- перестановки состояний), однако если М — стохастическая, то мо- может быть получен континуум различных приведенных форм, как будет видно из теоремы 4 и следующих за ней рассужде- рассуждений и примера. Теорема 4. Пусть М — машина, имеющая с состояний, пусть Ь = Ь1(М) —соответствующее линейное пространство, вве- введенное в теореме 1, и пусть Н = сХ{<ИтЬ) —матрица, столбцы которой образуют базис в Ь. Пусть М={Ы(у\х)} — множество матриц, удовлетворяющих условиям C.3а) / у=1, 2, ..., с. (З.Зб) Тогда N={N(у\x)} есть машина с с состояниями, эквивалент- эквивалентная М по состояниям, именно (Л/,5)-(М,5), 5=1, 2, ..., с. C.4) Обратно, если машина с с состояниями удовлетворяет C.4), то она должна удовлетворять C.3). Доказательство. Обратное утверждение немедленно следует из B.3) и из факта, что C.4) можно записать в форме для всех и, V. C.5) Для прямого утверждения заметим прежде всего, что если {М(у\х)} — множество матриц, удовлетворяющих C.3а), тогда,
108 Е. У. Карлайл в частности (поскольку е€. Ь), Ы(у\х)е = М(у\х)е. C.6) Суммируя по всем у (для любого фиксированного х), мы полу- получим М(х)е = М(х)е = е, что вместе с условием (З.Зб) доказы- доказывает, что М(х) —марковская матрица. Таким образом, {М(у\х)} есть машина. Утверждение C.4) [или C.5)] получается при по- помощи индукции по |р|. Это установлено для |р|=1 в C.6), и если оно справедливо для всех последовательностей и и V дли- длины &, тогда для таких последовательностей и любых х и у (уъ\ха) = N (у\х) км (ъ\а) = N (у\х) если применять B.3) и C.3а). Если М — машина с с состояниями, с а входными и Ь вы- выходными символами, то множество {М(у\х)} решений уравнения C.3а) зависит от аЬс(с—сНт Ь) действительных параметров. Согласно теореме 4, если пределы изменения параметров огра- ограничить таким образом, чтобы постоянно выполнялось (З.Зб), это параметрическое семейство множеств {Ы(у\х)} матриц совпа- совпадает (с точностью до перестановки состояний) с семейством всех машин с с состояниями, которые эквивалентны М по со- состояниям. Прилагая этот результат к приведенным формам для М, скажем М' (которые могли быть получены повторным при- применением построения теоремы 3 к М), мы видим, что семейство всех приведенных форм М может зависеть от числа параметров, равного аЪс'{с'—ИтЬ), где с' — число состояний М\ т. е. число классов эквивалентности состояний М. Из ее определения видно, что (ИтЬ(М) не может превдсходить с' и что сНт Ь(М') =сНт Ь(М). Таким образом, М имеет единственную приведенную форму, если (ИтЬ = с'9 в то время как М может иметь континуум различных приведенных форм (как в приве- приведенном ниже примере), когда й^т^<с/. (Следует отметить, что условие сНт /,<*/ может иметь место и тогда, когда приведен- приведенная форма единственна. Простая детерминированная машина, обладающая этим свойством, приводится в [6].) Пример. Пусть Ж@|0) = М@|1) = | /0,2 0,2 \0,2 ° \0,6 х = 0,2 0,2 0,2 0 0 0,1 Г = {0, 0,2 \ 0,2 , 0,2/ 0 \ 0,6 , 0,1/ 1). 5={1, / ЖA|0) = \ / 1 \ 2, '0,4 0,1 ,0,2 '0 0,4 ,0,2 3} 0 0 0 0 0 0 и ,3 .1 0 0 0 0 0 0,1 \ •
Приведенные формы 109 Очевидно, что М уже в приведенной форме, т. е. эквивалентных состояний не имеется потому, например, что три компоненты к(\ 11) —М(\ \ \)е различны. Вычисление векторов /г(у|и) для = 1 и 2 показывает, что /=1 (т. е. Ь^Ь) и что &\тЬ = с = с'). Матрицу Н из теоремы 4 удобно выбрать так: 0\ 2 1 1/ Если уравнения C.3а) решить, учитывая ограничение (З.Зб), то мы получим следующее 7-параметрическое семейство всех раз- различных форм {Ы(у\х)} для М: А 0,6 —2Л В 0,6 — 25 С 0,6 —2С /0,4 0 Я—0,1 0,5 1 0 0 Р Р 0.6-2Р О О-0.5 1,3-20 0<Л, В, С, /т<0,3, 0,5<О<0,65. Выбор минимального значения каждого параметра дает машину с особенно простой структурой. С другой стороны, если для всех параметров выбраны максимальные значения, то стано- становится ясно, что машина М, хотя и находится в приведенной форме, может быть «приведена» (минимизирована) дальше в следующем смысле: машина с двумя состояниями М*, опре- определенная посредством матриц /0,3 0,3\ /0,4 М*@|0)=(д3 1 0 \ /О такова, что (М, 1) — (ЛГ*, 1), {М, 2) - (М*, 2), (Л1, 3) - (М\ я), где я=@,5 0,5). (Машина М преднамеренно была построена с этим свойством для данного примера.) Это приведение М не является допустимым с «механической» точки зрения; при этом имеется в виду, что машина начинает работать с некото- некоторого фиксированного начального состояния. Тем не менее кон- концепция общей приведенной формы (для которой состояния ис-
ПО Е. У. Карлайл ходной машины могут соответствовать распределениям в новом минимальном множестве состояний) может быть ключом (§ег- тапе) к нерешенным проблемам идентификации таких систем с конечным числом состояний, выходные последовательности которой имеют ту же вероятностную структуру, что и данный контролируемый стохастический процесс [2, 3, 6]. Автор желает выразить признательность проф. Томасяну (А. ,1. ТЬота51ап), который поставил проблему, изученную здесь, и оказал помощь в работе. Л ИТЕРАТУРА 1. Мооге Е. Р., Оейапкеп— Ехрептеп1з оп 5е^иеп^^а1 МасЫпез, Аи1ота1а зЫсПез, Апп. о! МаШ. 51исНе5 № 34, 129—153, РппсеЬп, 1956. (Рус- (Русский перевод: М у р Э. Ф., Умозрительные эксперименты с последова- тельностными машинами, сб. «Автоматы», ИЛ, М., 1957.) 2. В1аскшеН С, Коортапз Ь., Оп Ше 1с1еп11ПаЬШ1у ргоЫет Гог Гипс- 1юпз о! ПпНе Магкоу сЬатз, Апп. МаШ. 81аИ81, 28 A957), 1011— 1015. 3. 011 Ь е г 1 Е. X, Оп Ше Меп1ШаЫП1у ргоЫет Гог Гипс11опз о\ Пш1е Маг- коу сЬа1пз, Апп. Ма1Н. ЗгаШг., 30 A959), 688—697. 4. В 1 а с к ш е 11 О., В г е 1 т а п Ь., Т Ь о т а з 1 а п А. Л., Ргоо! о\ ЗЬаппоп'з 1гап5гт55юп Шеогет Гог ПпИе-з1а1е тдесотрозаЫе сЬаппа1з, Апп. МаНг. 8гап8г., 29 A958), 1209—1220 (Русский перевод: Блеквелл Д., Б р е й м а н Л., Томасян А. Я., Доказательство теоремы Шеннона, сб. Математика, 4 : 5 A960), 123—135.) 5. 5 Ь а п п о п С. Е., ТЬе таШетаИса1 1Ьеогу оГ соттитсаНоп, В. 8. Т. ]., 27 A948), 379—423, 623—656. (Русский перевод: Шеннон К., Мате- Математическая теория сообщений, сб. Шеннон К., Работы по теории информации и кибернетике, ИЛ, М., 1963, стр. 243—332.) 6. С а г 1 у 1 е Л. Ш., Е^и^Vа1еп^ зЬсЬазИс 5е^иеп^^а1 тасЫпез, ТесЬп. Кер. 5ег. 60, Ьзие 415, Е1ес1готсз КезеагсЬ ЬаЬога1огу \]ту3 о! СаШогша, Вегке1еу, 1961.
Развитие теории оптимальных по быстродействию процессов управления1) Е. КРвйндлер В работе разрабатывается единообразная теория оптимальных по быст- быстродействию процессов управления общих линейных управляемых объектов с обобщенными ограничениями на управляющую переменную. Принятый здесь геометрический подход позволяет по-новому понять и представить не- некоторые результаты, получаемые методами функционального анализа. Тео- Теоремы, устанавливающие необходимые и достаточные условия существования и единственности оптимальной управляющей функции и°у и явные формулы для и° выводятся с помощью топологических свойств достижимой области — множества конечных состояний (п-мерных векторов), которые могут быть достигнуты с помощью процессов управления, удовлетворяющих ограниче- ограничениям. Подробное изучение условий, при которых в достижимой области по- появляются угловые точки и грани, проясняет некоторые «вырожденные» слу- случаи при ограничениях на амплитуду и «площадь». Кратко обсуждается задача синтеза. 1. ВВЕДЕНИЕ Классической задачей теории управляющих процессов является задача об оптимальном по быстродействию управле- управлении: найти управляющие переменные (функции), удовлетворяю- удовлетворяющие некоторым ограничениям, которые переводят управляемый объект из некоторого начального состояния в желаемое конеч- конечное состояние за кратчайшее время. Исследование этой задачи было начато Бюшо [1] и, незави- независимо, Фельдбаумом [2]. Бюшо рассматривал автономные линей- линейные системы второго порядка с ограниченной по амплитуде управляющей переменной. Он доказал, что релейное2) упра- управление является оптимальным, и построил кривые переключе- переключения в фазовой плоскости. Фельдбаум доказал то же самое в бо- *) К г е I п с! 1 е г Е., Соп1пЬитюп5 \о Ше Шеогу о! ите-орТ1та1 соп!го1, /. о/ гке РгапкНп 1пзШШе, 275, № 4 A963), 314—344. 2) Управление иA) называется релейным на ^о-<^<^ь если | и (/)!=■- = соп51 (почти всюду) и, возможно, конечное число раз меняет знак.
112 Е. Крейндлер лее общем случае и показал, что в случае систем я-го порядка с действительными, отрицательными и различными собствен- собственными значениями матрицы системы в оптимальном релейном управлении необходимо не более п — 1 перемен знака. Это же было доказано (независимо) Беллманом, Гликсбергом и Грос- Гроссом [3], использовавшими еще более общий и очень сильный метод. Дезоэр [4] получил оптимальное релейное управление с помощью вариационного исчисления и указал, что моменты переключения могут быть получены из решения сопряженной системы. Лассаль [5] распространил результаты Беллмана и др., а также свои более ранние результаты [6] на общий линейный случай нормальных систем (понятие, им введенное). Гамкре- лидзе [7] получил оптимальное релейное управление, используя принцип максимума Понтрягина [8, 10], и доказал теоремы су- существования и единственности в случае линейных автономных систем. Красовский [И, 12] для получения своих результатов исполь- использовал методы функционального анализа. Некоторые его идеи были разработаны и развиты Куликовским [13—17], который получил выражение для оптимального управления при различ- различных ограничениях, выраженных в терминах нормы в простран- пространстве Ьр, и фактически получил оптимальные регуляторы (устройства, осуществляющие управление) для частных слу- случаев. Недавно результаты Куликовского были распространены Крэнком и Сарачиком на случай многих функций управления [18], а также на случай, когда каждая управляющая перемен- переменная может быть различным образом индивидуально ограни- ограничена [19]. В настоящей статье развивается единообразная теория для общего линейного случая. Ограничения на управление, такие, как ограничение амплитуды, «энергии», «мощности» и «пло- «площади», даются здесь в общей форме, как это делается в рабо- работах Красовского, Куликовского, Крэнка и Сарачика. Централь- Центральную роль играет достижимая область 7?, которая сходна с об- областью, вводимой в работе [3]. Исследуются топологические свойства области /?, в частности наличие в ней угловых точек и граней. Это облегчает понимание неизученных случаев при ограничениях на «площадь» и систем, не являющихся нормаль- нормальными, в которых управляющие переменные ограничены по амплитуде. Изложение просто как в смысле понятий, так и математически. Геометрическая интерпретация, как полагает автор, позволяет лучше вникнуть в сущитво задачи. Основные результаты изложены в теоремах, большинство формальных доказательств помещено в приложении»
Развитие теории оптимальных процессов управления 113 2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ Объект. Линейная управляемая система, которую мы будем называть объектом, может быть описана интегралом , т) и(т)я?т, A) где я-мерный вектор х есть выход объекта, компонентами кото- которого являются п параметров объекта, управляемого единствен- единственной управляющей функцией и{1), которую будем называть управлением. Член х°(/), выражающий влияние начальных условий состояния объекта при 1~и на х(/), предполагается заданным и непрерывным. Если х(/) не представляет состояние объекта, то х°(/0) не обязан полностью определять начальные условия при г = и. Конечно, выражение A) можно отождествить с хорошо из- известным решением х (/) = Ф (/, /0) х (/0) + | Ф (/, т) Ь (т) а (т) а% B) векторного дифференциального уравнения * C) где х — вектор состояния, а Ф(^,т) —переходная матрица. Однако задание объекта равенством A) выгоднее, чем ра- равенством C), поскольку объект может иметь разрывы и вре- временные задержки в некоторых параметрах. Объект может иметь очень большую размерность, в то время как п в равен- равенстве A) может быть сравнительно малым. Кроме того, функ- функцию Н(/, т) можно интерпретировать как реакцию х(/) системы на импульс (б-функцию) и{г)=&(г — т), приложенную в мо- момент /=т, и, следовательно, ее можно получить из экспери- эксперимента. В связи с этим будем считать, что функции /гг-(/, т), (г = = 1, 2, ..., п) удовлетворяют следующим условиям: а) Функции Нг(г,х) ограничены на конечных интервалах т^/<оо изменения I и т, непрерывны по I и кусочно- непрерывны1) по т (для автономных объектов функция Ь(/) непрерывна). Если Ь(/, т) есть импульсная реакция, то йг-(/, т) = = 0 для /-^т, причем /гг-(?,т) может иметь разрыв в точке 1=х. Из этого условия следует, что управление и и разрывы пара- ]) То есть непрерывны на конечных интервалах т, за исключением ко- конечного числа точек разрыва первого рода, Зак. 243
114 Б. Крейндлвр метров объекта (если они имеются) влияют на выход х только через динамические элементы. б) Функции кг(г,х) линейно независимы на любом интер- интервале ^о^Ст-^, т. е. для всякого ненулевого вектора X п на *о<^<*- D) Можно показать [9], что это условие эквивалентно утвержде- утверждению, что объект может быть переведен с помощью подходящего управления при любых начальных условиях в момент времени =*и в состояние, имеющее любой конечный выход х(Г) при =Т (и и Т конечны), каков бы ни был интервал времени ^С^-^Г. Это свойство объекта будем называть полной упра- управляемостью. Важно отметить, что условие D) допускает равенство Х- Ь(^, т)=0 на собственных подинтервалах интервала /0^ т ^ I при условии, что для каждого I существует некоторый конечный интервал ^^т-^^, на котором 1-Ь^О. Если Х-Н(/, т) может обращаться в нуль лишь на множестве (меры нуль) изолиро- изолированных точек, объект называется нормальным [5]. Ограничения на управление». Обычно считается, что и неко- некоторым образом ограничено. Наиболее распространенные огра- ограничения на и — это ограничение по амплитуде \и(г) \ ^ С, огра- т ничение по «энергии» \аA)\2сИ^С2 и ограничение по «пло- щади» \ \иA)\сН -^.Сг- Эти ограничения можно объединить выражением д. 11 и (О . \<р<оо. E) При р — оо и кусочно-непрерывной и неравенство E) сводится к ограничению по амплитуде тах \аЦ)\КС^ F) ^7 Управление и, удовлетворяющее неравенству E) (с задан- заданным р), будем называть допустимым, совокупность всех допу- допустимых управлений назовем допустимым множеством упра- управлений.
Развитие теории оптимальных процессов управления 116 Хотя кусочно-непрерывное управление — наиболее общий случай, с которым сталкиваются в инженерной практике, по математическим причинам ]) удобнее р*ассматривать более ши- широкий класс всех измеримых управлений, удовлетворяющих неравенству E), при этом интегрирование понимается в смысле Лебега. Тогда для заданного р каждое управление становится элементом функционального пространства Ьр, левая часть не- неравенства E) есть обычная норма и в Ьр, а допустимое мно- множество — замкнутая Ср-сфера в Ьр. Для того чтобы включить в рассмотрение б-функции для случая р=1, будем считать, что в случае ограничения по «площади» допустимое множество изометрично замкнутой Сгсфере пространства Ьоо (сопряжен- (сопряженного С Ьоо). В случае ограничения по «площади», р=1, считаем, что функция Ь(/, т) непрерывна как по /, так и по т. Для допусти- допустимых управлений х(/) в равенстве A) непрерывно. Задача управления. Цель управления состоит в том, чтобы добиться совпадения х(/), получаемого с помощью равенства A), с заданным непрерывным (или фиксированным) выходом хг(/) в минимальное время, используя допустимое управление. Образовав разность ха (*) = хг @ - х° (*), G) можно сформулировать задачу следующим образом: Для данного хй(/) найти допустимое управление и, так чтобы | а (8) за минимальное время г=Т°. В частном случае задачи регулирования (привести началь- начальное состояние х({0) в состояние равновесия х = 0 за минималь- минимальное время) равенство (8) заменяем на равенство | Ф (/0, т) Ь (т) и (х) ат = - х (/0), (9) I которое получается, если в равенстве B) положить х(^)=0 и использовать тождество Ф~г(/,/0) • ФB, т)=Ф(/0, т). Выраже- Выражение (9) в этом случае предпочтительнее, так как правая часть (9) фиксирована в отличие от (8), где она зависит от времени. ]) Пространство кусочно-непрерывных функций не обладает необходи- необходимыми свойствами; соответствующие свойства пространства Ьр использованы только в приложении.
116 Е. Крейндлер 3. ОБЩИЕ РЕЗУЛЬТАТЫ Достижимая область. Удобно рассматривать выход х(/) как непрерывно перемещающуюся точку в я-мерном декартовом пространстве X — пространстве выходов. Считаем, что система находится в покое при / = /0(х°(/)=0). Множество точек х(Т) из X, в которые можно прийти, используя всевозможные упра- управления и из допустимого множества, будем называть достижи- достижимой областью и обозначать /?(/0, Т). Конечно, /? зависит от р и Ср. Общие свойства К{и,Т) выражает следующая теорема. Теорема 1. Достижимая область /?(^о, Т), Г>/0, является замкнутым, ограниченным, выпуклым телом, центрально сим- симметричным относительно начала координат х = 0 и непрерыв- непрерывным по Т. Из замкнутости /? следует, что граница дК множества /? принадлежит к /? и, таким образом, любая точка дН дости- достижима. Выпуклость /? означает, что отрезок, соединяющий лю- любую пару точек из /?, целиком содержится в /? (или в д/?, ко- конечно) и что в /? нет «дыр». То, что /? есть тело, означает, что /? не содержится в линейном подпространстве X, таком, как пря- прямая или плоскость пространства X (при я^-3); симметрия означает, что если х(Т) лежит в /?, то и —х(Г) лежит в /?; говорят, что #(и,Т) непрерывна по Г, если для всякого Т и любой точки хе, внешней к К(и,Т), существует такое б>0, что хе остается внешней к /?(/о, Т) для всех т, |т| ^ б (т. е. ^(^ь Т) не может делать «скачок» при «малом» возрастании Т). Эти свойства доказываются в приложении. Теперь процесс управления может быть наглядно предста- представлен (по крайней мере в 3-мерном пространстве) следующим образом. В пространстве выходов имеется непрерывно меняю- меняющаяся область /?(/о,') и непрерывно движущаяся «мишень» х<*(/). По определению х<*(/) достижима тогда и только тогда, когда для некоторого конечного Т точка ха(Т) принадлежит /?(/о, Т). В силу непрерывности ясно, что первое соприкоснове- соприкосновение хй(/) с /?(/о, 0 должно произойти на границе <Э/?(/о,')• Оно и определяет минимальное время /=Г°. Таким образом, приходим к следующей теореме. Теорема 2. Если при некотором конечном Т = Т1 точка хйG\) лежит в /?(*<>, ^О, то существует такое оптимальное вре- время Г°, Г°<ГЬ что х*{Т°) находится на д/?(*0, Т°) и для Т<Т° точка хй (Т) не принадлежит /?(/о, Т)ш
Развитие теории оптимальных процессов управления 117 Аналогичная теорема существования формально доказана для ограничения по амплитуде в [5] и [7]. Условия а) и б) (разд. 2) именно для того и были наложены на йг-(/, т), чтобы эта теорема была справедливой. Если не выполнено условие а), то /?(/о, 0 и (или) х°(/) (а следовательно, х<*(/)) могут ока- оказаться разрывными и первое соприкосновение х<*(/) с /?(/0, О может произойти внутри области /?(/о, 0- Это же может слу- случиться, если К(и,Т) вырождается в подмножество линейного подпространства X, ибо выражение D) в условии б) не выпол- выполняется для некоторых х=и и 1 = Т. Поэтому на практике эти условия могут быть ослаблены; здесь они присутствуют глав- главным образом для изящности изложения. В соответствии с теоремой 2 необходимо искать управле- управления, приводящие систему на границу области Н(^Т). В этой работе такое управление будет называться оптимальным упра- управлением и0. Необходимые и достаточные условия оптимальности упра- управления. Следующая теорема, доказываемая в приложении, ин- интуитивно ясна. Теорема 3. Допустимое управление может быть опти- оптимальным только в том случае, если оно удовлетворяет неравен- неравенству E) со знаком равенства. Следует заметить, что при ограничении по амплитуде этот результат сам по себе не влечет релейность управления. Из него в силу ограничения F) следует только, что |и(/)|=Соо по крайней мере в одной точке интервала /о-^^-^^- Так как /? — выпуклое множество, то в каждой точке дН можно провести опорную к /? гиперплоскость1) 5(Л,). Точки пересечения 5(^) П ОН являются наиболее далекими точками /? в направлении %. Это приводит к следующей теореме. Теорема 4. Для того чтобы допустимое управление было оптимальным или более определенно для того, чтобы при по- п 1) Гиперплоскость, задаваемая в виде 2 ^1Х1 ==^ *х == с> гДе с!>0, а X — ненулевой вектор пространства X фиксированной длины, представляет собой обобщение на л-мерное пространство плоскости 3-мерного простран- пространства. Это (п—1)-мерное линейное (если оно содержит начало координат) или аффинное (если не содержит) подпространство- в терминологии «-мер- «-мерной геометрии это (п—1)-мерная плоскость. Опорная к #(/0, Т) гиперпло- гиперплоскость 5(Х)—это такая гиперплоскость 7,-х=с, с>0, что для всех точек х(Г) из #(*(ь Т), **х(Г) <с и по крайней мере для одной точки к*х1Т)=о (рис. 1).
118 Ё. Крейндлер мощи этого управления можно было прийти в любую точку 5A) П д#({0,Т), необходимо и достаточно, чтобы и максимизи- максимизировало выражение A0) и Доказательство. При заданном допустимом и правая часть равенства A0) есть некоторая константа с, следовательно, Углодая точка /- мерная грань Рис. 1. Гиперплоскость 5A), опорная к Я (*0. т) в точке ха G1). х(Г) лежит в гиперплоскости 1-х = с. По определению опорной гиперплоскости и в силу выпуклости К(*о,Т) величина 1-х(Г) достигает максимума в том и только том случае, если х(Г) ле- лежит в 5A) П дК(и,Т). Так как /? замкнуто, все точки этого пересечения должны быть достижимы. Теорема доказана. Максимизация выражения A0) дает оптимальное управле- управление как функцию времени, зависящую от параметров 1, /0, Т° Р* й°=й°(/; К /о. т°> ср)- О1)
Развитие теории оптимальных процессов управления П9 Остается найти Т° (если оно существует) и к1), соответствую- соответствующее точке хй(Т°) 6 дК(и, Т°). Для этой цели используется следующая теорема, доказы- доказываемая в приложении. Теорема 5. Для того чтобы точка хаA) лежала на в момент времени г = Т, необходимо и достаточно, чтобы = 1. A2) I• ха (*) тах Ц я ' I /* • П (Г, Т) И \Х\ А, Г{), Г, С ^ и г = Т Далее, ха(г) является внутренней или внешней точкой тогда и только тогда, когда левая часть равенства A2) соот- соответственно меньше или больше 1. При этом равенство A2) не имеет локальных максимумов. При возрастании I, (?>/о) пеР~ вое значение Т, удовлетворяющее равенству A2) для к = к°, есть оптимальное время Т° и к0 таково, что х<*(Т°) лежит в Из этой теоремы непосредственно вытекает следствие. Следствие 1. Решение задачи управления существует, т. е. х<*A) достижима тогда и только тогда, когда равенство A2) удовлетворяется при некотором конечном Т. Полезные, более определенные формы условия A2) будут получены нами после подстановки выражений для и0. Угловые точки и грани области К. Точки дЯ. можно класси- классифицировать следующим образом: а) Точка гладкости — точка на дЯ, однозначно определяю- определяющая направление к. Таким образом, гладкий кусок дЯ есть об- область дЯу где для каждой точки имеется единственная внешняя нормаль к, а 5 (Я,) —касательная к дЯ гиперплоскость. б) Угловая точка порядка к—такая единственная точка пересечения 5 (Я,) П дЯ, что к имеет к степеней свободы внутри й-мерного конуса2), называемого в этой статье Х-конусом. Та- Таким образом, наивысший порядок угловой точки равен л, а уг- угловая точка первого порядка есть просто точка гладкости, так как к в любой точке дЯ имеет по крайней мере одну степень свободы — длину. ) Выражение «X, соответствующее хй ^ д#у> означает, что X является перпендикуляром к гиперплоскости 5(Л), опорной к Я. в точке Xй (см. рис. 1). 2) Конус С пространства X — это такое выпуклое множество в X, что если х ^ С, то и кх (| С для любого действительного к ^ 0, при- причем кх(^ С для к<0. Кроме того, если хь х? ^ С, то также Х1+х2 ^ 0.
120 Е. Крейндлер в) Если имеется более одной точки в 5A) П д/?, то в силу выпуклости /? в пересечении 5A) и д# получается либо отре- отрезок прямой, либо кусок плоскости, либо в общем случае кусок й-мерной плоскости, 1^й^/г—1. Такое пересечение будем называть к-мерной гранью (?/? в направлении А,. При этом к означает наименьшую размерность плоскости, содержащей это пересечение. Если й-мерная грань рассматривается как множе- множество в й-мерной плоскости, содержащей ее, понятия внутрен- внутренности и границы й-мерной грани принимают вполне определен- определенный смысл. Граница й-мерной грани может содержать точки гладкости, угловые точки и грани размерности ниже к. Например, криволинейное ребро заострения на /? в 3-мер- 3-мерном пространстве представляет собой совокупность угловых точек второго порядка, а прямолинейное ребро — 1-мерную грань; если, например, область /? есть эллипсоид, то она пол- полностью гладкая. Грани доставляют неприятности, потому что если 5A) П д% является гранью, то по теореме 4 допустимое управление, максимизирующее условие A0), должно быть та- таким, чтобы можно было достигнуть любой точки 5A) П <?/?. Так как в линейных системах заданное и приводит к един- единственной точке х(Г), приходим к выводу, что в этом случае максимизация выражения A0) дает неединственное и0. Следствие 2. Для существования грани необходимо, что- чтобы допустимое управление, максимизирующее выражение A0), было недоопределено. Из этого, однако, не вытекает, что и0 для достижения вну- внутренних точек грани обязательно неединственно. Что касается угловых точек, то они даже полезны, так как, находясь в 1-ко- нусе, устойчивы по отношению к погрешностям 1. 4. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ Вывод формул. Максимизация выражения A0) при ограни- ограничении, задаваемом неравенством E), представляет собой, при- принимая во внимание теорему 3, простую вариационную задачу, легко решаемую в вариационном исчислении. Она становится еще легче, если использовать неравенство Гёльдера !) для ин- !) Неравенство Гёльдера имеет вид: ь / ъ \\1р / ь у/д ( \ ] где 1-</?-<оои 1/р+1/<7=1, а для 1<р<оо знак равенства имеет место тогда и только тогда, когда | х(г) \ * = /С| */@ 19, где /С>0.
Развитие теории оптимальных процессов управления 121 тегралов. По определению ^-х(Г)>0, и можно записать сле- следующую последовательность неравенств: к-х(Т) у .Ъ(Т, х)\дс1т\ ■ A3) По теореме 3 необходимым условием максимума является т х мр \\а(х)\раЛ =Ср. A4) О / Подставляя это в выражение A3), получаем для допустимых управлений / т \1/<7 Ср. A5) Ясно, что максимум 'к-х(Т) на допустимых управлениях дости- достигается тогда и только тогда, когда в неравенстве A5) имеет место знак равенства. Далее первое неравенство в A3) обра- обращается в равенство тогда и только тогда, когда где 5§п равен +1 для положительного аргумента, —1 для от- отрицательного и неопределен (но в пределах от —1 до 1) для нуля. Во втором неравенстве A3) знак равенства имеет место тогда и только тогда, когда для 1<р<оо и(х)\=К\к-Ъ(Т, т)|^, К>0. Комбинируя эти два условия, получаем, что в неравенствах A3) будет знак равенства тогда и только тогда, когда -с), 1< р < со. Наконец, подбирая К так, чтобы удовлетворялось условие A4), приходим к следующей теореме.
122 Е. Крейндлер Теорема 6. Допустимое управление оптимально в том и только том случае, если я (<) = —гг ^ш—• К/><оо. A6) Для /? = оо (<7=1) равенство A6) сводится к хорошо извест- известной формуле которая, очевидно, дает необходимое и достаточное условие равенства в выражении A3). Для /? = 1 (^ = оо) равенство A6) также справедливо; однако, поскольку предельный переход при <7—>оо труден, мы в следующем разделе выведем и0 для этого случая непосредственным образом. С учетом полученного и0 формула A2) теоремы 5 прини- принимает вид Л х (П „ A8) шах Уя Поскольку длина к несущественна, ее можно выбрать так, чтобы = 1, тогда равенство A8) эквивалентно равенству гшп I | к • Ь (г, х) ,=т=\. A9) В силу неравенства A5) очевидно, что /?(^о> Т) ограничивается в направлении к опорной гиперплоскостью г \ ия ср. Назовем расстояние этой гиперплоскости от начала координат т (к-к)'1гл B0) протяженностью /?(^о, Т) в направлении к. Для автономных систем т \\/я / т \\/я о о не убывает по Г.
Развитие теории оптимальных процессов управления 123 Следствие 3. Протяженность 7?(^0, Т) в направлении прямо пропорциональна Ср и не убывает по Т, если система ав- автономна. Равенства A6) — A9) были впервые выведены Куликовским [13] методами функционального анализа, но без имеющейся здесь геометрической интерпретации, позволяющей составить более полное представление по обсуждаемому вопросу. Замечание 1. Как указано Красовским [11], из решения за- задачи оптимального быстродействия получается решение задачи о минимуме нормы при фиксированном конечном времени, т. е. при фиксированном Т требуется достичь хй(Г) с минимальным аA)\рсН\ (это выражение измеряет в некотором смысле -и «величину» и(г) на ^<^<Т и называется нормой и). В этом случае, вместо того чтобы подбирать Г, необходимо подобрать Ср в равенстве A4) так, чтобы удовлетворялось равенство A8). При этом определяется минимальная норма, так как в силу теоремы 5 ха(Т) принадлежит дЯ. (^0, Т) и при убывании Ср, хй (Г) становится внешней точкой /?(^о, Т). Замечание 2. Все вышеуказанное применимо к задаче ре- регулирования в том виде, в каком она сформулирована в выра- выражении (9). Пусть /?о(Аь Т) означает область (в пространстве состояний X) всех начальных состояний х(^0), которые могут быть на интервале ^0^^^^ переведены в начало координат х = 0 с помощью допустимых управлений. Сравнение выраже- выражения A) с B) и (8) с (9) показывает, что каждое состояние х(^о) €/?о(^о, Т) получается из состояния х(ГN/?(Аь Т) взаимно однозначным преобразованием B1) Поэтому /?о(Аь Т) обладает всеми топологическими свойствами /?(^о, Т), в частности /?о(^о, Т) будет иметь все угловые точки и грани ^(^о, Т). В равенствах A6) и A8) необходимо просто за- заменить Ь(Г, г) на Ф(^о, 0Ь@ и ха ({) на —х(*0). О задаче синтеза. В принципе поставленная задача решена. Для некоторого подходящего интервала значений Т из равен- равенства A8) можем получить скалярную функцию [°(Т) Т)= гт \Ь-Ъ(Т, (г Наименьшее значение Т = Т°, которое удовлетворяет уравнению /°(Г)=СР, и есть искомое минимальное время. Подставляя эти
124 Е. Крейндлвр значения 1° и Г° в равенство A6), получим оптимальное упра- управление и0 (как функцию времени на /о^^^Т) для достиже- достижения ха(г) в минимальное время Т° [за исключением случая, когда ха(Т°) лежит на грани /?(/0, Т0)]. На практике, однако, возникают трудности. Во-первых, за исключением некоторых частных случаев [13—17] для функции 1°(Т) нельзя получить аналитического выражения. Кроме того, !°(Т) должна пересчитываться, например, по методу градиента [выражение A8) по теореме 5 не имеет локальных максимумов] всякий раз, когда хаA) изменяется. Во-вторых, полученное ре- решение соответствует разомкнутой системе, в то время как в большинстве приложений требуется решение для замкнутой си- системы (с обратной связью). Для того чтобы получить уравнение для замкнутой системы, и0 (г) необходимо мгновенно непрерыв- непрерывным образом пересчитывать по мгновенным значениям хй(/), получаемым из непрерывных измерений х(/). Приближением к этому идеалу является пересчет с высокой скоростью !°(Т) и п°(г\ Х°у Т°) в процессе управления. Предлагается следующий метод вычисления 1° и Г° в про- процессе управления замкнутой системой. Пусть для соответствую- соответствующих интервалов /0 и Г каждая область К^о, Т) аппроксимиро- аппроксимирована в некотором смысле гиперэллипсоидом, заданным квадра- квадратичной формой О( 7>1 B2) где О(Аъ Т) —симметрическая положительно определенная ма- матрица. Это требует вычисления и хранения п(п— 1)/2 функций 9^(^о, Т)—компонент матрицы О(/0, Т). Тогда внешняя нор- нормаль к гиперэллипсоиду [уравнение B2)] дает приближенный вектор %а- 1а = 1 ёгас1 [х • О (/0, Т)х] = <* (/0. Т) х. B3) Управляющее устройство вычисляет ^а = <2(*чь 0хСЧ0 и х(/) • С} (и, 0х@» увеличивая значения I до тех пор, пока урав- уравнение B2) не будет удовлетворено. При этом определяется при- приближенное оптимальное время Т°а и приближенный оптималь- оптимальный вектор к°а- Затем величины Т°а и *к°а можно уточнить (если это необходимо) с помощью равенства A8). Наконец, упра- управляющее устройство выдает и°A) по формуле A6). Эти три шага необходимо повторить, используя вновь поступающие зна- значения хй. [Конечно, задача вычисления ха по формуле G) при измерении х(^) сама по себе нетривиальна.] Во многих приложениях величину Т° можно удовлетвори- удовлетворительно заменить величиной Т°а> и только К необходимо улуч-
Развитие теории оптимальных процессов управления 125 шать с помощью равенства A8). Например, для объекта при- примера 2 (см. рис. 3) максимальная относительная погрешность Т° около 2%, а максимальное относительное отклонение ха(Т°) от точки в /?(Г°), достигаемой с помощью и°а{г\ *к°а, Т°а), около 10% (подробности этих вычислений здесь опущены). Вычисление О (/о, 0 может быть довольно сложным; однако оно выполняется предварительно. Сглаживание угловых точек (которое происходит при замене области эллипсоидом) не так существенно в силу того, что в угловой точке к относительно нечувствительна к ошибкам. Ясно, что в точках пересечения гиперэллипсоида B2) с д/?(/о, Т) погрешность Т° равна 0, в то время как погрешность Л, максимальна. По-видимому, вообще, подбирая гиперэллипсоид B2) для /?(/о, Т), лучше избегать та- таких пересечений. Описанный выше метод получения Кь и Т°а можно, конечно, использовать в комбинации с другими вычислительными мето- методами, такими, как методы, изложенные в работах [21, 22]. На- Например, широко известная трудность для объектов с кратными полюсами в передаточных функциях состоит в том, что число переключений и (в случае ограничения по амплитуде), вообще говоря, заранее неизвестно. Однако, как показывает последую- последующее исследование, эти объекты, вероятно, имеют полностью гладкие достижимые области, и, таким образом, можно ожи- ожидать, что *ка и Та настолько хороши, что дают точное число пе- перемен знака и0 и их примерное размещение на интервале Для задачи регулирования, формулируемой в виде выраже- выражения (9), с ограничением по амплитуде, получаем в соответствии с формулой A7), замечанием 2 и формулой B3) где Оо (/о, Т) приближает /?о('о, Г), а Ф' есть транспонирован- транспонированная матрица Ф. Если состояние х непрерывно измеряется и по нему непрерывно и автоматически О0(^о, 0 подбирается так, чтобы удовлетворялось уравнение B2), каждое { можно считать начальным моментом времени /0- Тогда, поскольку Ф(/о, и) есть единичная матрица, На (х) = Соо З^П [Ь (/) О0 (/, Т°а) X]. B4) Этот метод получения приближенного оптимального управления как функции состояния, возможно, не проще, в частности, для автономного объекта, чем аппроксимация поверхностей пере- переключения. Фактически формулу B4) можно использовать и для получения аппроксимации поверхности переключений. Для ав-
126 Е. Крейндлер тономного объекта формула B4) принимает вид и ясно, что па(х) меняет знак в точке х гиперэллипсоида х • (}(Г2)х= 1, где Ь — ортогонально к (}о(Га)х, т. е. в тех точ- точках, где [как показывает B3)] Ь является касательным к гипер- гиперэллипсоиду. Во всяком случае, формула B4) показывает, что оптимальное управление можно аппроксимировать [в том смысле, что гиперэллипсоид B2) с Aо(Л Т%) приближает 7?о(^о> Т)] с помощью линейной зависящей от времени функции состояния. Вид достижимой области и единственность и0. Результаты предыдущего раздела и вопрос о единственности и0 побуждают нас к дальнейшему исследованию формы /?. Прежде всего заме- заметим, что для заданного Л, и при 1 < ц < оо(оо >р > 1) фор- формула A6) дает единственное и0. Отсюда следует (следствие 2), что при этих ограничениях в 7? не может быть граней. Более того, в /? не может быть и угловых точек. Для доказательства этого используем следующее свойство угловой точки (или соот- соответствующего ^-конуса): если Л* и к2 соответствуют угловой точке, то этой точке также соответствует и ^1+^2. Допустим, что х(Г) —угловая точка на д/?(/о, Т) с соответствующими ей неколлинеарными векторами %1 и А,2- Тогда из формулы A8) [или A5)] имеем = СР / | Я, • Ь (Г, т) Сложив их, получим +М 1^2 • Ь(Г, С другой стороны, так как Х1 + Х2 соответствует х(Г), то точка х(Г) достижима с помощью и°A\ Х1+Х2), поэтому г Сравнение двух последних равенств приводит к теореме 7.
Развитие теории оптимальных процессов управления 127 Теорема 7. Для того чтобы при ограничениях E) область /?(/о, Т) имела угловую точку, необходимо, чтобы для некою- рых неколлинеарных ^ и А,2 имело место Т \1/д/Т \1/д 1/д . B5) В силу неравенства Минковского 1) равенство B5) верно тогда и только тогда, когда (для 1 < ц < оо) \ т) на или (Л и)Ь(Г ) = 0 на Однако в силу условия линейной независимости D) отсюда следует, что Л* — к%2 = 0 или что Л,4 и Х2 коллинеарны — в про- противоречие с предположением. Следовательно, при 1 < р < оо в /? не может быть угловых точек. В частности, в случае ограничения по «энергии» р = 2, ис- используя формулу A6) при 9 = 2, точку х(Т) на д/?(^о, Т) можно задать в виде т х(Г)= /ЬG\ т)и"(х) их = ^ где Р — матрица, равная р (/01 Г) = | Ь (Г, т) Ь7 (Г, т) Л. B6) При этом граница д/?(^0» Т) задается квадратичной формой B7) и в силу теоремы 1 должна быть невырожденным гиперэллип- гиперэллипсоидом; поэтому Р должна быть положительно определенной 1) Неравенство Минковского имеет вид: ь \Щ / ь \х/д ( ь \ 1 и знак равенства имеет место тогда и только тогда, когда х @ = ку @, * > 0, 1 < д < оо.
128 Е. Крейндлер матрицей. [В самом деле, из равенства B6) видно, что Р есть матрица Грама для функций Аг-(Г, т); она положительно опре- определена тогда и только тогда, когда верно D).] Замечание 3. Если ограничена «средняя мощность», т 1 Г 2 2 /^ уг- \ и (г)сН^ Сг, то в формуле B7) нужно С2 заменить на \^ТС2. В этом случае оптимальное управление УТ С21 ■ Ь (Г, о 1/2 похоже на и0 в формуле A7) для ограничения по амплитуде (которое фактически есть мгновенное ограничение по «мощно- «мощности»). Следует, однако, заметить, что приближение /?(^о, Т) ги- гиперэллипсоидом, как это было предложено в предыдущем раз- разделе, не приводит к замене ограничения по амплитуде ограни- ограничением по «средней мощности». Итак, доказана следующая теорема. Теорема 8. Достижимая область при ограничениях E) с 1 < р < оо является полностью гладкой, а оптимальное упра- управление единственно. В частности, при р = 2, /?(/0, Т) есть гипер- гиперэллипсоид, задаваемый уравнениями B6) и B7). Случай, когда при ограничениях по амплитуде, р= оо, и «площади», р = 1, в области /? имеются угловые точки и грани, будет исследован в следующем разделе. Допустимые управления для достижения внутренних точек области /?, конечно, не единственны. В самом деле, покажем, что каждая внутренняя точка области /? может быть достиг- достигнута с помощью бесконечного (несчетного) множества управле- управлений одного только типа A6). Рассмотрим следующий метод (возможно, не самый удобный) построения управления для до- достижения какой-либо внутренней точки области /?. Добавляя еще одну фиктивную компоненту Нп^(Т, %) к ^-мерному вектору Н(Г, т), образуем расширенный (л+1)-мерный вектор Н(Г, т). Функция Нп+1(ТУ т) удовлетворяет условиям а) и б) разд. 2, а в остальном произвольна. Допустимая область /? становится теперь подмножеством расширенной достижимой области /?, со- соответствующей Ь, и каждая точка х из области /? получается из х вычеркиванием последней компоненты. Теперь для данной точки х(Г), внутренней к /?(*<>, Т), определяем соответствующую
Развитие теории оптимальных процессов управления 129 точку х(Т) на (Э/?(^о, Т) и (я+1)-мерный вектор X, нормальный к гиперплоскости, опорной к /?(/о, 71) в точке х(Г). Точка х(Г) на д/?(^о, Г) для фиктивного объекта, а следовательно, и вну- внутренняя точка х(Г) из области /?(^о, 7") для исходного объекта достижима с помощью управления, задаваемого формулой A6), где Н и % заменены на Н и X. Отсюда следует теорема 9. Теорема 9. Каждая внутренняя точка области достижима с помощью бесконечного множества управлений вида A6), где векторы Н(Г, %) и к заменены на определенные расширенные векторы Н(Г, т) и X. В частности, Нп+^Т, т) можно выбрать так, чтобы , т)=0 только в изолированных точках т. Для ограниче- ограничения по амплитуде это приводит к следующему результату. Следствие 4. В случае ограничения по амплитуде каждая внутренняя точка /?(^о, Т) достижима с помощью бесконечного множества релейных управлений вида ао(^)=Соо5дп Х-Н(Г, (). Тот факт, что каждая внутренняя точка области /? дости- достижима с помощью некоторого релейного управления, был впер- впервые доказан Лассалем [б], использовавшим методы теории меры. 5. ИЗУЧЕНИЕ СПЕЦИАЛЬНЫХ СЛУЧАЕВ Ограничение по амплитуде. Рассмотрим вначале нормальные системы, т. е. такие, для которых при А,=^=0, ^-ЬG, т) =0 только в изолированных точках т. Тогда для заданного % формула A7), очевидно, определяет единственное релейное управление, и по следствию 2 в области /? не может быть граней. Для р = оо (#=1) необходимое условие B5) теоремы 7 принимает вид Это равенство справедливо тогда и только тогда, когда т)=5§п М1G\ т) на ^-^т^Г. Поэтому и°{г\ Л,4) = ( ), чем доказана единственность и0 в угловой точке. Пусть теперь задано X. Возникает вопрос: является ли до- достижимая точка д/? угловой и если это так, то каков ее поря- порядок? Ответ на этот вопрос позволил бы установить взаимо- взаимосвязь между числом гп перемен знака функции А,*Н(Г, т) (а следовательно, и и0) на (о < т < Т и порядком угловой точки. Однако для полного ответа на этот вопрос на функции А* (Г, т)
130 Ё. Крейндлер необходимо наложить некоторые ограничения, и здесь мы упо- упомянем только следующие очевидные факты. Для того чтобы точка была угловой порядка п, достаточно, чтобы на /о^т<7" или на /0 < т ^ Т по крайней мере одна из функций Н\ (Г, т) Ф0; поэтому всегда в некотором ^-конусе можно найти такой век- вектор 1с« степенями свободы, что функция А,*Н(Г, т) не меняет знак на и < т < Т. Для того чтобы точка была точкой глад- гладкости в 5(^)П <?/?, необходимо, чтобы функция Х-Ъ(Т, т) имела / / X, р- л/2+агси 1/Т 4 туг х{ Рис. 2. Достижимая область Я(Т) для примера 1. Показана для Т = 3. п— 1 перемен знака на и < х < Г, а это является необхо- необходимым условием того, чтобы система уравнений Х-Н(Г, т^-)=0, (/= 1, 2,..., пг) имела решение % только с одной степенью сво- свободы. По этой причине объект с осциллирующими Нг(Т, %) (/= 1, 2,..., п) при достаточно большом Т будет иметь, вероят- вероятно, полностью гладкую достижимую область. Пример 1. Пусть х\==х29 #2 = и и Соо=1. Тогда Н{ (()=(, Н2(г) — 1, и область /?(Г) имеет вид, показанный на рис.2. В двух угловых точках 2-го порядка, достижимых с помощью и°(() = 1 и и°(г)= — 1, X кроме длины К имеет ещё одну степень свободы — угол между X и осью Х\ может меняться в пределах угла р. Точки гладкости достижимы с помощью управления, имеющего одну перемену знака.
Развитие теории оптимальных процессов управления 131 Пример 2. Пусть х{ = х2у х2=—х{-{-и и Соо=1. Тогда =з\п^ и /12@=со5/. Точку х(Т) на д#(Т) можно задать в виде т т х(Т) = | Ь (Г — т) 8§п к . Ь (Г — т) Л = | Ь @ 8§п А, • Ь (<) о о Нулями к-Ь^) являются ^ = /я— ф, /=1,2,..., где ф = = агс1д(А,1/^2)—угол между осью *1 и X. В силу симметрии У?(Г) можно считать, что 0 <! ср < я. Представляя Т в виде Т = Кп—а, где К — целое и 0'<^а<я, выражение для х(Т) можно запи- записать в виде х1(Т) = 1 +2/Ссо8ф — со8а, х2(Г)==2/С81Пф — 81па при а < ср< я и хг(Т) = 1 -+-2(АГ— при 0 <^ ф <^ а. Полагая «1= 1 — соз а, а2= — зт а при а<ф<я и 61=1 + СО5 а, Ь2 = з\па при 0^ф<^я, получим при а < ф < я и (Г) - *,]2 + [^2 СП - й2]2 = [2 (/С- I)] при 0 ^ ф ^ а. Таким образом, область /?(Г) ограничена четырьмя дугами окружностей (см. рис. 3) и является полностью гладкой. При Т = Кп [/(=1,2,.. . ,/?(Г)] область /?(Г) есть круг радиуса 2/(, а при Г<я область /?(Г) ограничена только двумя дугами окружностей радиусом 2, пересекающихся в двух угловых точ- точках порядка 2. (Их можно было ожидать, так как при Т < я, Н^)Ф0 на 0<^<7\) Рассмотрим теперь объект, не являющийся нормальным, т. е. при некотором к, скажем к*, ^*Н(Г, т)=0 на собственных подин- тервалах /0^т^^- Для простоты рассмотрим только один из таких подинтервалов, скажем ^0 < и ^ т -^ 4 < Т. Оптимальное управление и°A) является релейным, и оно единственно всюду, за исключением тех значений I, G1<^<^2), при которых его нельзя определить по формуле A7). Тривиальный случай имеет место, когда Ь(Г, т)=0 на ^^т-^/г. При этом каждая точ- точка ОН достижима с помощью управления и0(г), которое, оче- очевидно, произвольно на /1^^<^2. Допустим, что НG, т)^0 на ^^ и рассмотрим два таких оптимальных управления 5,1 оо88пА,*НG\ т), что и^@^0» а «?@ произвольно при ^1^^^^2 (но |^@|^^оо)- Эти управления приводят
132 Е. Крейндлер к двум точкам на (?/?, а именно хо(Т) и Х{(Т) соответственно. Ясно, что и^ = и\ — и°==0 вне < < 1 С << и I на Так как Ах(Г) не нуль для всевозможных щA), точки хо(Г) и хА(Г), вообще говоря, различны. Обе точки лежат в 5A*) П А -С05ОГ, - 51ПОГ) Рис. 3. Достижимая область К(Т) для примера 2. Показана для /<" = 3, 2 7 а = -^- л и Г = /(я — а = -5- я. о о П^/?(^о, 71), и, таким образом, это пересечение есть грань не- некоторого порядка к. Тогда существует такая ортогональная ма- матрица М (поворота осей), что на ^^т-^^ первые к компонент вектора-столбца МН(Г, т) линейно независимы, а последние (п — к) компонент равны нулю. Обозначим через /г/(Г, т) /г-мер- вектор, составленный из первых к компонент МЬ(Г, т).
Развитие теории оптимальных процессов управления 133 Тогда и (Г) |Ь(Г ))Л |о B8) является точкой /е-мерного пространства X/. Мы видим, что вектор Х/(Г) эквивалентен введенному выше вектору Дх(Г); од- однако он записан в системе координат Л/, повернутой по отноше- отношению к системе координат X. Более того, X; — это ^-мерная пло- плоскость, содержащая нашу /е-мерную грань, причем последняя эквивалентна области /?/(^, ^), соответствующей формуле B8). Поэтому эта грань центрально-симметрична по отношению к Хо(Г). Каждая граничная точка /?/ достижима на /^т^4 с помощью ^(/) = Соо8§п^^ • Ь^(Г, т), где 5(Х/) —опорная ги- гиперплоскость к /?/ в пространстве X/, а каждая внутренняя точка/?/ достижима с помощью #/ @ = СооЗ&п^ • Ь/ (Г, /), где X/ и Н/ — расширенные (&-Н)-мерные векторы, определенные в следствии 4. Таким образом, если ха(Т) лежит в грани /?(^о, Т), то можно записать а оптимальное управление в виде и° @ = « где ^@—единственное релейное управление, равное нулю на ^1 ^ ^-^ ^2, а и°@ — неединственная релейная функция, равная нулю вне ^4^4 4, которую можно построить описанным выше методом. С практической точки зрения важно, что для достижения любой точки ха в /? достаточно релейных регуля- регуляторов. Эти результаты сформулированы в теореме 10. Теорема 10. Оптимальное управление является единствен- единственной релейной функцией, за исключением тех интервалов измене- изменения т, в которых функция %-Ь(Ту т) обращается в нуль; на этих интервалах неединственным образом можно построить такое релейное управление, чтобы достигалась произвольная внутрен- внутренняя точка грани области /?, которая существует в /? тогда и только тогда, когда существуют такие интервалы (если ЬG, т)^0 на этих интервалах). Для существования двух сим- симметричных угловых точек порядка п, соответствующих ио(г)=> = +С и и0Ц)— —С, достаточно, чтобы по крайней мере одна из функций И-^Т, т) была бы не равна нулю на ^о^т<71 или
134 Е. Крейндлер на /0 < т'<С7\ Для достижения точки гладкости /?(^о, Т) необхо- необходима по крайней мере п — 1 перемена знака и0(г) на /0 < I < Т. Ограничение по площади. Случай ограничения по площади в отличие от случая ограничения по амплитуде для нормальных объектов был оставлен в стороне. Известно из работ [12, 16], что при таком ограничении оптимальное управление состоит из б-функций, но вопросы существования и единственности оста- оставлены открытыми, а некоторые из исследуемых здесь ситуаций не доведены до конца. Используя теорему 4, так же как и в разд. 4, можно вывести выражение для и0. Напомним, что Лг-(/, т) считаются здесь не- непрерывными как по I, так и по т. Пусть М тах < х < т B9) Подставив выражения B9) в формулы A3) и A5), получим . C0) Для того чтобы допустимые управления давали максимум функ- функций к-х(Т), необходимо и достаточно, чтобы в выражении C0) неравенства обратились в равенства. Непосредственной под- подстановкой в C0) убеждаемся в справедливости следующих до- достаточных условий, которым должно удовлетворять и0: а) если максимум в выражении B9) достигается в изолиро- изолированных точках Т;(/= 1, 2,..., т), то т т,-), C1а) где т и б) если максимум в выражении B9) достигается на некото- некоторых подинтервалах 0 отрезка /0 *^ т <С 71, то 0, если произвольно, при условии \\аA)\сИ е ЬG\ /), если , C16) и з§;п иA) =
Развитие теории оптимальных процессов управления 135 в) и0 является комбинацией равенств C1а) и C16), если максимум выражения B9) достигается как в изолированных точках, так и на подинтервалах. C1 в) Необходимость этих управлений для достижения равенства в выражении C0) можно доказать от противного. В случае а) точку х(Т) на д/?(^о, Т) можно задать в виде тп уу C2) где ху (Т) = СгЪ G\ ту) 5ёп I . Ь G\ ту). C3) Все точки х^(Т) вида C3) лежат в 5(А,) Пд/?(/0, Т), и если по крайней мере две из них различны, это пересечение есть грань. Можно выделить следующие подслучаи: I) т=1. Если К может меняться с к степенями свободы в некотором Х-конусе, так что точка Т1 максимума функции |-Н(Г, т) | не меняется, то соответствующая точка х(Г) = х1(Г) в C3) на д/?(^о, Т) есть угловая точка порядка к. В этом случае, если Л* и А,2 соответствуют угловой точке, необ- необходимое условие B5) дает = тах\кг . 11G", Это равенство верно тогда и только тогда, когда максимум функций 1^4-Н(Г, т) | и |Л,2ЬG\ т) | достигается в один и тот же момент времени ть Поэтому и0(Хх)^и°(Х2) = С\&A—Т]), и этим доказана единственность и0 в этом случае. II) т=1. Если при изменении Л, момент времени %и в кото- который достигается максимум, изменяется, точка хG1)=х1(Г) в C3) описывает на д/?(Аъ Т) криволинейную траекторию, кото- которая представляет собой отображение интервала, в котором дви- движется точка Ть Эта траектория не может иметь прямолинейных сегментов, так как при т=\ управление и0 однозначно опреде- определяется формулой C1а). Она представляет собой гладкий ку- кусок тогда и только тогда, когда X двумерно. III) т> 1. Если все т векторов х;(Г), определяемые фор- формулами C3), коллинеарны, то они, кроме того, должны иметь одинаковую длину и направление. Числа а^ в равенствах C1а) т и C2) произвольны (но, конечно, 2а/ = 1 и 0 -^ а,-^ 1) и и0 неединственно. Соответствующая точка в /? выражения C2) является угловой или точкой на траектории в <Э/? [как и в I или II].
136 Е. Крейндлер IV) 1<т'<Ся. Если векторы х;- в формуле C2) линейно независимы, то х(Г) является точкой (т—1)-мерной грани и задается единственным образом линейной комбинацией C2) векторов х;-. Например, если т = 3, двумерная грань — это тре- треугольник, образуемый точками хь х2 и х3 вида C3). Для задан- заданной точки ха(Т), принадлежащей грани уравнения C2), одно- однозначно разрешаются относительно а$, и формула C1а) дает вы- выражение для единственного управления и0. V) ш > 1. Вообще пг векторов в C3) линейно зависимы, так что размерность грани к удовлетворяет неравенствам 1^&< <т—1. Для заданного ха(Т) внутри /г-мерной грани можно так выбрать к+\ линейно независимых векторов, чтобы ха(Т) выразилось в виде C2), затем найти из C2) к+\ коэффи- коэффициент а$, необходимые для определения и0 по формуле C1а) (остальные коэффициенты а$ нужно положить равными нулю). Так как этот выбор неединствен, и0 неединственно. В случае б), если п функций Нг(Т, т) линейно независимы на 0, то можно показать, что на в можно найти п таких точек Т;(]= 1, 2,..., я), что п векторов НG\ -г,-) линейно независимы. С помощью этого показывается, что, как и в случае (а, IV), мы имеем в направлении к (п— 1)-мерную грань на д/? и каждая ее внутренняя точка достижима с помощью линейной комби- комбинации п 6-функций, приложенных в моменты времени х^ Так как выбор п моментов времени т;- на в неединствен, такое уп- управление неединственно. Более того, любое управление, удовле- удовлетворяющее условию C16), будет приводить к некоторой точке этой грани. В том случае, когда на интервалах в имеется линей- линейная зависимость между к{(Т, т), грань имеет более низкий по- порядок к и достаточна комбинация из к б функций. С практиче- практической точки зрения важен тот факт, что во всех случаях огра- ограничения по «площади» можно обойтись регуляторами, произво- производящими 6-функции. В случае в) имеем ^-мерную грань и к+\ линейно независи- независимых векторов могут быть найдены для интервалов в и дискрет- дискретных точек максимума |Л,-НG\т)| на/о^т-^Г. Вышесказанное сводится к следующей теореме. Теорема II. Допустимое управление оптимально тогда и только тогда, когда оно удовлетворяет выражению C1). В слу- случае а) оптимальное управление состоит из 8-функций и является единственным в подслучаях (а, I, II, IV). В случаях б) и в) можно построить неединственным образом оптимальное упра- управление, составленное из Ь-фунщий. Не существует гладких ку- кусков в области Я, за исключением, быть может, случая, когда X двумерно.
Развитие теории оптимальных процессов управления 137 Интересно отметить, что оптимальное управление не обяза- обязательно единственно для точек гладкости и угловых точек и не- необязательно неединственно для граней. Пример 3. Рассмотрим объект примера 1, и пусть С±= 1. Об- Область Н{Т) показана на рис. 4. Для к± Как и в случае б), оптимальное управление для достижения внутренней точки отрезка х3х2 неединственно. Угловые точки х3 и Рис. 4. Достижимая область для примера 3. Показана для Т = и XI достижимы с помощью а°(/)=б@ и и0(()=&(( — Т) со- соответственно. Для Х2 выражение имеет максимум при т = 0 и х = Т. Следовательно, каждая точка отрезка хАх2 является одно значной линейной комбинацией х4 и х2 х(Т) =
138 Е. Крейндлер и достижима с помощью и°(г) =а^{г) —а2Ь (I Ш)\ например, точка И достижима с помощью Т) (случай а, Пример 4. Рассмотрим объект примера 2. Требуется найти точки максимума выражения \1-Ъ(Т — т)| = где есть угол наклона к к оси абсцисс. В силу симметрии /? можно считать, что —я/2 < ф -^я/2. При Т > я/2 — ф функция Ъ — т) | на О^т-^Г имеет по крайней мере одну точку — (у максимума вида / 1 \ я (у = 1, 2, ...). В этой точке (й1йх)'к'\\(Т — т)=0. Следовательно, оптималь- оптимальным управлением является \\{Т— ту), и оно приводит в точку х(Г) на х (Г) = Сх 2 ауЬ (Т — ту) зёп I. Ь (Г — ту) = СО5ф _ ^ Г СО5 ф ] Таким образом, при Т -> я/2—ф, /? (Т) является дугой окруж- окружности Х\ (Т)-\- Х2(Т) = Си и если /> 1, и0 неединственно (слу- чай а, III). При —2ф < Т < я/2 — ф максимум достигается при т = 0, при этом м°(*)=С1б@ и, следовательно, з\пТ СО5 Т При —я/2 <^ ф < Т < — 2ф максимум достигается при т = Г, при этом и°(г) = — С& (I — Г) и При Г = —2ф функция |з1п (Г/2 — т) | имеет два максимума на ' "", при т = 0 и т = Г, и а°(/) =С1[а1Й (/)—а±ЬA — Г)], а,
Развитие теории оптимальных процессов управления 139 Получающаяся область Я{Т) показана на рис. 5. При Т<п оптимальное управление единственно. При Г>я Н(Т) является кругом и не увеличивается при возрастании Т. Неединствен- и Т О л Рис. 5. Достижимая область К(Т) для примера 4. Показана для Т—-*- о ность и0 при Т > я, конечно, устраняется, если объект имеет демпфирование (в этом случае |^*Н(Г — т) 1 имеет только один максимум). 6. СЛУЧАЙ МНОГИХ УПРАВЛЯЮЩИХ ФУНКЦИЙ; ИНДИВИДУАЛЬНЫЕ И СОВМЕСТНЫЕ ОГРАНИЧЕНИЯ В этом случае объект* управляется с помощью г управляю- управляющих воздействий щ (/=1, 2, ..., г) и описывается выражением и(т)</г = 4- у-1 C4)
140 ё. Крейндлер где Н;-(/, т) есть /-й столбец (пХг)-матрицы Н(/, т). Предпола- Предполагается, что ее компоненты кцA, т) удовлетворяют условию не- непрерывности а) разд. 2, а для полной управляемости считается, что по крайней мере один из столбцов Н;-(/, т) удовлетворяет равенству D) условия б). Если все столбцы удовлетворяют ра- равенству D), то объект полностью управляем каждым щ в от- отдельности, и тогда говорят, что объект обладает свойством сильной полной управляемости; если не все столбцы удовлетво- удовлетворяют равенству D) (но по крайней мере один удовлетворяет), говорят, что объект обладает свойством слабой полной упра- управляемости. Здесь рассматриваются два типа ограничений на и. В пер- первом случае считается, что каждое управляющее воздействие происходит от индивидуального источника и индивидуально ог- ограничено т и]{()\РЫП =Су, у=1, 2, ..., г, 1</?;<оо. C5) Во втором случае считается, что управляющие воздействия происходят от общего или совместного источника и потому ог- ограничены совместным ограничением C6) Совместное ограничение по амплитуде — это мгновенное огра- ограничение по «мощности» ' г \1/2 2 «5 @) <А- C7) ^ «=» 1 / (Такие обобщения, как и (/) • Ми (/)< Р или Г и (/) • Ми (<) сН < 2 /0 < Сг, гдеМ — симметрическая положительно определенная ма- матрица, можно свести к формулам C7) и C6) с р = 2 при по- помощи линейного преобразования управления и.) Можно показать, что достижимая область обладает свой- свойствами, перечисленными в теореме 1 для случая одной упра- управляющей функции. Следовательно, для рассматриваемого здесь случая многих управляющих функций все общие результаты разд. 3 остаются в силе. Чтобы получить оптимальное управление для случая инди- индивидуальных ограничений, достаточно заметить, что фактически объект распадается на г объектов, накладывающихся на выхо-
Развитие теории оптимальных процессов управления 141 дах. Поэтому достижимая область /?(^о> Т) является суперпози- суперпозицией г областей /?^- (^0, Т), как это показано в примере на рис. 6. Максимизация выражения A0) с использованием неравенства Гёльдера, как это сделано в разд. 4, или с помощью предыду- предыдущего рассуждения приводит к выражению для и^ вида A6) и I/, и У1 0,0 С / Т 5/ /\1/2A)№*1 О Рис.6. Достижимая область /? (Т) — суперпозиция индивидуальных обла- областей /^ (Т) и Я2(Т), соответствующих и{ и и2. Т = 3. A8), в которых соответственно нужно поставить и° Н-/, ^ и С;-« Заметим, что /? будет иметь все грани индивидуальных об- областей Ку Угловые точки Я] будут присутствовать в /? только в том случае, если каждое ^ имеет угловую точку в направле- направлении к и соответствующие ^-конусы имеют непустое пересечение, которое и будет ^-конусом этой угловой точки /?. Этот факт можно вывести из геометрических рассмотрений (см., например, рис. 6) либо с помощью обобщения теоремы 7. Если объект обладает свойством слабой полной управляемости, т. е. для некоторого КФО и некоторой управляющей функции
142 Е. Крейндлер щ, Х-Ък(Т, т)^0 на некотором интервале /о-^т-^7, тогда в формуле A6) ик = 0/0 и, если только Нь(Т, т) нетождественно равно 0, на /о^т-^71 имеется грань в /?. Это также можно по- получить геометрически, так как в этом случае Кк{1о, Т) выро- вырождается в подмножество линейного подпространства X. Пример показан на рис. 7. Вывод и0 для случая совместного ограничения C6) и C7) можно проделать с помощью применения обобщенной формы неравенства Гёльдера1) и неравенства Шварца2) на соответ- соответствующих этапах вывода формулы A6). Получающиеся фор- формулы приводятся ниже. Для совместного ограничения вида C6) иI \г) где тах / Т т \ I • Ъ} (Г, т) < /? < оо. Теорема 5 принимает вид Я, • х^ (г) C8) I г и у = ср. C9) Для совместного ограничения по амплитуде вида C7) йу (Г, г) «5 О = 1/2 D0) теорема 5 принимает вид тах I • х<* @ Р D1) 2) Неравенство Шварца — это частный случай неравенства Гёльдера для сумм п п Цр ( п
Развитие теории оптимальных процессов управления 143 При совместном ограничении по площади при р=1 отыска- отыскание оптимального управления то же самое, что и в случае одной управляющей функции, с той лишь разницей, что макси- макси| мум выражения |^« Н;-(Г,т) | следует искать по всем /. Если для некоторого / этот максимум не существует, то щA)=Ъ на / 4 1 >— 1 / / Хг Т О Рис. 7. Образование 1 рани в К(Т) для объекта со слабой полной упра- управляемостью. Т=\. Кроме того, в формулах C8) и D0) м;=0, если для некоторого / на поэтому в случае ;( ) совместного ограничения слабая полная управляемость не пред- представляет интереса. При совместном ограничении по амплитуде вида C7), как видно из формулы D0), грань может существовать тогда и только тогда, когда для всех / будет Х-Н;-(Г, /)=0 на некотором ненулевом интервале, в то время как Н^-^гО. Что касается угло-
144 Е. Крейндлер вых точек в этом случае, то легко доказывается (см. приложе- приложение), что они не могут существовать. Формулы C8) — D1) были впервые выведены методами функционального анализа Крэнком и Сарачиком [18, 19], а для автономных объектов Красовским [12]. Однако эти авторы не исследовали вопросы единственности и0, а также не полностью исследовали случай ограничений по амплитуде и по площади. Случай многих управляющих функций можно обобщить сле- следующей теоремой. Теорема 12. Управление и, удовлетворяющее одному из ограничений вида C5), C6) или C7), является оптимальным (удовлетворяет теореме 4) тогда и только тогда, когда оно удо- удовлетворяет формулам A6), C8) или D0) соответственно; точка хаA) лежит на дК{го,г) при г = Т тогда и только тогда, когда справедливо выражение A8), C9) или D1) соответственно. Оптимальное управление и0 единственно, за исключением следующих случаев: а) Если при некотором ХФО и некотором / имеет место ^•Н;(Г, т)=0 на некоторых ненулевых интервалах, то не един- единственны те и^ которые индивидуально ограничены по ампли- амплитуде; если Ъ](Т, т) ^ 0 на этих интервалах, то в направлении >, в /? существует грань. б) Если при совместном ограничении C7) по амплитуде \-Н)(Т, т)=0 на некоторых интервалах, общих для всех \, то и0 неединственно; если на этих интервалах Н;(Г, т)=0 не для всех ]', то в Н существует грань. в) Если каждое управляющее воздействие индивидуально ограниченно и Х-Ъ](Т, т)еееО на /0^т^7\ то и^ неединственно, и если Н;(Г, т)^0 на ^-^х^СТ, то в /? имеется грань., г) и0 неединственно в некоторых подслучаях при индиви- индивидуальном и совместном ограничении по площади, перечислен- перечисленных в теореме 11. Кроме указанных выше случаев, грани существуют, вообще говоря, при индивидуальных и совместных ограничениях по пло- площади. При совместном ограничении на и угловые точки могут существовать только в случае ограничения по площади. При индивидуальных ограничениях на и угловые точки в /? в направ- направлении X появляются тогда и только тогда, когда все и^ ограни- ограничены по площади и (или) по амплитуде и все %$ имеют угловую точку в направлении X, так что соответствующие Х-конусы имеют непустое пересечение. Конечно, изложенное выше приложимо к смешанному слу- случаю, когда некоторые управляющие функции ограничены сов-
Развитие теории оптимальных процессов управления 145 местно, а оставшиеся ограничены индивидуально. Кроме того, существуют многочисленные комбинации ограничений, при ко- которых управляющие функции ограничены индивидуально или совместно более чем одним ограничением. Эти случаи не рас- рассмотрены здесь, однако если ограничения таковы, что область /? замкнута, ограничена и выпукла, то оптимальное управление и° можно получить из теоремы 4. Автор хочет выразить свою благодарность профессорам Д. М. Крэнку, Р. Куликовскому и П. Е. Сарачику, уделившим много времени обсуждению этой работы. Их практические за- замечания и предложения значительно обогатили ее. ПРИЛОЖЕНИЕ; ДОКАЗАТЕЛЬСТВА Доказательство теоремы 1. Допустимая область /?(/0, Т) в п- мерном пространстве выходов X является образом допустимого множества управлений при отображении т = Г Ь G, т) и (т) ах. (А-1) Ясно, что это отображение линейно; легко можно показать, что оно ограни- ограничено, следовательно, оно непрерывно по и. (Ограниченность линейного ото- отображения эквивалентна его непрерывности.) Допустимое множество, будучи СР-сферой в Ьр, является по определе- определению нормы выпуклым; поэтому ^ выпукло (линейное отображение сохра- сохраняет выпуклость). Далее, так как Ьр изометрично I,- (пространство, сопря- сопряженное Ьп), где р + а-1 = 1, допустимое множество при 1^/?<1оо изомет- рично замкнутой Ср-сфере в ^, A<^#<оо) и по теореме Алауглу [20] является компактом в Ь.д— топологии пространства 1*~ш Поэтому /? — ком- компакт (непрерывное отображение сохраняет компактность) и, следовательно, замкнуто и ограничено (в «-мерном пространстве замкнутость и ограничен- ограниченность эквивалентны компактности). Область ^ симметрична, потому что если и допустимо, то и —и допу- допустимо, и поэтому если х(Г) ^ ^, то и — х(Г) ^ #. Предположение о полной управляемости эквивалентно тому, что для всех 40 и всех Т > @ отображе- отображение (А-1) есть отображение на все пространство X. Поэтому ^ должно содержать некоторую окрестность начала координат и поэтому есть тело. Область Н(и, Т) должна быть непрерывной по Г; в противном случае неко- некоторая внешняя точка хе связывается с #((о,Т) разрывной траекторией, а, как уже было отмечено, они непрерывны. Доказательство теоремы 3. Отображение (А-1) является непрерывным линейным отображением полного пространства Ьр на все (в силу полной управляемости) полное я-мерное пространство X, поэтому в силу принципа отображения внутренних точек [20] оно переводит совокуп- совокупность внутренних точек допустимого множества в множество открытое в X, которое по определению ^ и открытого множества не может содержать то- точек внешних к ^ и точек границы д/?. Поэтому только граничные точки до- допустимого множества отображаются в ОД
146 Е. Крейндлер Доказательство теоремы 5. а) Достаточность. Если выражение A2) верно при Я, = Я,°, тогда т I. ха (Т) = Г Я,0 • Ь G\ т) и0 (т; А,0) их, так как и0 (т; А,0) максимизирует выражение A0), то по теореме 4, хй(Г) лежит на сЩ/0, Т). б) Необходимость. Пусть хй(Г) ^д#({0, Т). Тогда по теореме 4 Я, • х* (Т) = Г Я, • Ь G1, т) ао (т; X) или 1, (А-2) Г G", где X таково, что хй(Г) ^ 5 (>.) П д#({0, Т). Чтобы показать, что (А-2) дает максимум по всем к ^ X, возьмем какое-нибудь другое к, скажем Хь и пусть 5(>-1)—гиперплоскость, перпендикулярная Л\ и содержащая хй(Г). Если 5(>-1) является опорной гиперплоскостью к Н(@,Т), то снова имеет место (А-2). Если 5(А,1) не является опорной гиперплоскостью, то она пересекает внутренность #A0,Т). Тогда по теореме 4 с помощью управления ио(х,/к\ достижима точка Х1(Г) ^ д#(@, Г), такая, что (Т) < кх • X! (Т) = Г 1{ • Ь (Г, т) ао (т; ИЛИ < 1, (А-3) Г Х{ • Ь (Г, т) а0 (т; чем доказано, что (А-2) дает максимум по всем к и что этот максимум не может быть локальным. в) Если хй (Г) есть точка, внешняя по отношению к /?(^0, Т), то существует опорная к ^ гиперплоскость 5(А,), такая, что х<*(Т) и К((о,Т) лежат по раз- разные стороны от 5(Я,) и х<*(Т) (^8 (к). Тогда по определению т = Г Я, • Ь (Т, т) и0 (т; Я,) где х(Г) ^ 5 (к) р ОД(/р, Т). Поэтому 1 (Т\ >1 I
Развитие теории оптимальных процессов управления 147 и максимум по А, этого выражения заведомо больше 1. Если при А, = А,0 ле- левая часть формулы A2) больше 1, то т 1° • ха (Т) > Г 1° • Ь (Т, х) и0 (т; 1°)ах. (А-4) Так как и0(г\ А,0) максимизирует выражение A0), то по теореме 4 достигае- достигаемая точка х(Т) находится в пересечении д#(@,Т) с опорной гиперплоско- гиперплоскостью А,0 • х=с, где т с = А,°.х(Г)= ( 1°-Ъ(Т, х)и°(х; 1°)ах. (А-5) Итак, хй (Г) лежит в гиперплоскости А,0 • х = А,0 • х (Г), и из сравнения (А-4) и (А-5) видно, что А,0 • ха (Т) > с, отсюда следует, что ха(Т) лежит в гипер- гиперплоскости, не пересекающей Я (^о, Г), и, следовательно, является внешней точкой по отношению к ^(^о, Т). г) Доказательство для внутренней точки получается методом исключе- исключения. Доказательство отсутствия угловых точек в случае совместного ограничения по амплитуде. Повторяя доказа- доказательство теоремы 7 при совместном ограничении по амплитуде C7), нахо- находим, что необходимым условием существования угловой точки в /? является равенство (Т, т)]2 ^т + ] 2^2*МГ> / 'о \У-1 = | ]►] ^ ' Ь/ (Т% т)]2 + [12. Ь;- (Г, т)]2 | ах. (А-б) ^о \7-1 / Заметим теперь, что знак равенства в неравенстве Минковского (неравен- (неравенстве треугольника) 2^? +12 у?) -B(^ + у/J) (а-?) имеет место тогда и только тогда, когда Х( = куг (к > 0, /=1, 2, ,.., «). Это условие не изменяется [из-за того что все члены формулы (А-6) положитель- положительны], если х и у являются функциями 1У а формула (А-7) интегрируется на некотором интервале I. Поэтому (А-6) имеет место в том и только в том случае, когда для к > 0, кх\\] (Г, т) ЕЕ кХ2 • Л,(Г, т) на ?0<т<Т для всех / или (А,1—кк2) • к)(Т,х)^Е:Ъ. По предположению о полной управляемости А,-Ьу (Т, х) =0 на ^о<т<Г не для всех /\ следовательно, А,1 — /гА,2=0 и векторы А-1 и А,2 коллинеарны, чем исключается возможность существования угловой точки. Л ИТЕРАТУРА 1. ВизЬа\у О. \У., ОрИта1 О1зсопИпиои5 Рогс1п^ Тегтз, Соп1г1Ьи1юпз 1Ье ТЬеогу о[ ЫопПпеаг ОзсШаНопз, уо1. 4, Рг1псе1оп, 1958. 2. Фельдбаум А. А., Оптимальные процессы в системах автоматического регулирования, Автоматика и телемеханика, 14 A953),
148 Ё. Крейндлер 3. В е 11 т а п К., СШскзЬег^ I., О г о з з О., Оп 1Ье Ьап^-Ьап^ Соп1го1 РгоЫет, О.иаг1. Арр1. Ма1Н., 14, A956), 11—18. 4. Эезоег С. А., ТЬе Вап^-Вап^ Зегуо РгоЫет Тгеа1ес1 Ьу УапаИопа! ТесЬшяиез, 1п{огтаНоп апй Соп1го1, 2 A959), 333—348. 5. Ь а 3 а 11 е Л. Р.,ТЬе Типе ОрИгтшт Соп1го1 РгоЫет, Соп1пЬи1юпз 1о 1Ье ТЬеогу оГ ЫопПпеаг ОзсШаИопз, 5, Рппсе1оп, 1959. 6. ЬаЗаПе Л. Р., Ваз1с Рг1пс1р1е оГ 1Ье Ьап^-Ьап^ Зегуо, АЬз1гас1 247/, ВиИ. Ат. Маш. Зое, 60 A954), 154. 7. Г а м к р е л и д з е Р. В., Теория оптимальных по быстродействию про- процессов в линейных системах, Изв. АН СССР, сер. Мат., 22 A958). 8. Болтянский В. Г., Гамкрелидзе Р. В., Понтрягин Л. С, К теории оптимальных процессов, ДАН СССР, 110 A956), 7—10. 9. К г е 1 п A1 е г Е., 5 а г а с Ь 1 к Р. Е., Оп 1Ье Сопсер! оГ Соп1го11аЪШ1у о? Глпеаг 5у51етз (выходит в свет). 10. Понтрягин Л. С, Оптимальные процессы управления, УМН, 14 A959). 11. Кгазоузку N. Ы., Оп 1Ье Шеогу 0р11тит КедиЫюп, АшотаНоп апд, Яетоге СопШ, 18 A957), 1005—1016. 12. Кр а со в с кий Н. Н., К теории оптимального регулирования, ПММ, 23 A959). 13. КиПко^зк1 К., Оп ОрИтит Соп1го1 ш{\\ Сопз1га1п15, Ви11. РоНзН. Асай. За. (Зег. ТесЬ. Зсь), 7 A959), 285—294. 14. КиМко^зк1 К., Сопсегптд 1Ье 5уп1Ье515 о! 1Ье ОрМтит ЫопНпеаг Соп1го1, Вий. РоНзН Асай. За. (Зег. ТесЬ. 5а.), 7 A959), 339—391. 15. К и И к о и/5 к 1 К., 5уп1Ьез1з оГ а С1аз5 оГ Ор^тит Соп1го1 Зузктз, Ви11. РоИзН Асай. За. (Зег. ТесЬ. Зсь), 7 A959), 663—671. 16. Ки И ко^з к1 Н., 5уп1Ьез1з оГ ОрИтит Соп1го1 51з1етз ш!Н Агеа — Ьоипс1ес1 Соп1го1 51^па1, Вий РоЦзН Асай. За. (Зег. ТесН. Зс1.), 8 A960), 179—186. 17. К и И к о \у з к 1 Н-, Сопсегп1пд а С1азз оГ 0р11тит Соп1го1 5уз1етз, Ви11 РоНзН Асай. За. (Зег. ТесЬ. За.), 8 A960), 595—600. 18. Кгапс О. М., ЗагасЬ1к Р. Е., Ап АррПса11Оп оГ РипсИопа1 Апа1уз1з 1о 1Ье Орита1 Соп1го1 РгоЫет, ргезеп!ес1 а! ЛАСС, Ые\у Уогк Ш N. У., Липе, 1962. 19. ЗагасЬ1к Р. Е., Кгапс О. М., Оп ОрИта1 Соп1го1 оГ Зуз1етз МиШ-Ыогт Сопз1га1п1з, 1о Ье ргезеп!ес1 а! 1Ье 2-пс1 1РАС Соп^гезз, Вазе1 3^11гег1апс1, Зер. 1963. (См. Труды 2-го Международного кон- конгресса по автоматическому регулированию, Изд-во АН СССР, М., 1965.) 20. О и п Г о г с! Ы., 3 с Ь ^ а г 1 г 3. Т., Ыпеаг Орега1огз, №\у Уогк, 1п1егзс1- епсе РиЬ. 1пс, 1958. (Русский перевод: Данфорд Н., Шварц Дж., Линейные операторы, ИЛ, М., 1962.; 21. N611513A1 Ь. XV., Зуп1Ьез12т§ Т1те ОрИта1 Соп1го1 5уз1етз, У. МагН. Апа1уз13 апй АррЦ I A960), 484—493. 22. Ь е е Е. В., Ма1Ьета11са1 Азрес1з оГ 1Ье Зуп1Ьез13 о[ Ь1пеаг М1П1тит зропзе Т1те Соп1го11егз. Тгапз. РСАС, АС—5 A960), 283—289,
Достижимые зоны для автономных систем дифференциальных уравнений1) Э. Роксин, В. С пин ад ел 1. ВВЕДЕНИЕ В настоящей статье рассматриваются кривые решений си стемы обыкновенных дифференциальных уравнений первого по рядка, имеющей вид где х{г)у }(х) и ш(х, г) являются ^-мерными векторами, а I — вещественная переменная. Мы предполагаем, что A.1) является системой Каратеодори, т. е. что }(х) и ш(х,г) удовлетворяют условиям Липшица по х и ш(х, I) интегрируема по (. Эти предположения сделаны для того, чтобы (см. [1]) система A.2) которую мы будем называть основной, и система A.3) которую мы будем называть возмущающей, имели каждая един- единственное решение, непрерывно зависящее от начальных условий и параметров, которые могут содержаться в рассматриваемых функциях. Систему A.1) будем называть возмущенной и будем рас- рассматривать ее как суперпозицию систем A.2) и A.3). Решения системы A.2) будем называть основными кривыми, а решения системы A.1) — просто траекториями. Выбрав начальную точку Р, мы имеем две части траекто- траектории, разделенные точкой Р: одна получается при возрастании (, а другая — при убывании г. Эти части траектории будем на- называть соответственно положительной и отрицательной полу- полутраекториями относительно Р. 1) Я о х 1 п Е., 5 р 1 п а й е 1 V., КеасЬаЫе 2опез т Аи!опотоиз Зуз^етз, Соп1пЬи1юп5 1о ОШегепИа! Е^иа^^оп5> уо1. 1, Ые\у Уогк, 1963.
150 9. Роксин, В. Спинадел Мы будем рассматривать }(х) как неизменную функцию (для частной задачи), а т(х,1)—как произвольную функцию, на которую, в зависимости от задачи, налагаются некоторые дополнительные условия. Мы часто будем иметь дело с дугами жордановых кривых, удовлетворяющих условиям непрерывности и дифференцируе- мости, необходимым для существования решения системы A.1), и будем называть их просто кривыми. Поскольку до (я, г) изменяется, мы можем рассматривать векторное поле, определяемое системой A.1), как результат суперпозиции фиксированного }(х) и произвольного т(х,1) век- векторных полей (с учетом ограничений, налагаемых условиями рассматриваемой задачи). Задавая начальную точку лг0, мы получим некоторую траек- траекторию х = хA), соответствующую каждой выбранной функции до (я, /). Мы будем изучать все траектории, получающиеся при вариациях до (я, /). На основе изложенных выше условий мы можем сформули- сформулировать нашу задачу в следующем виде. Дана возмущенная система A.1) с начальным условием л;(О)=л:о. Какие области покрываются траекториями л: = л:(/), если допускается произвольное изменение функции до (я, ^)? Эти области мы будем называть достижимыми зонами. В разд. 2 мы сформулируем некоторые определения и опи- опишем основные свойства достижимых зон. В разд. 3 будет под- подробно проанализирована природа достижимых зон, порождае- порождаемых уравнениями при ограничениях, налагаемых на возмущаю- возмущающие векторы; разд. 4 будет посвящен случаю, когда возмущаю- возмущающий вектор имеет меньшую размерность, чем фазовое простран- пространство, а разд. 5 и 6 будут посвящены важному случаю двумер- двумерных систем. Наконец, в разд. 7 результаты разд. 3 будут при- применены к случаю ограниченного (п—1)-мерного возмущения. Важно отметить, что, когда мы рассматриваем все траекто- траектории, получающиеся при изменении до(лг, /), мы можем опустить явную зависимость № от х, поскольку гю(хA), 1)=ш*A) для ка- каждого решения х — хA). Очевидно, траектории, получающиеся из полной системы произвольных функций до, те же, что и траек- траектории, получающиеся из множества функций ш*. В дальнейшем мы просто будем использовать до(^), за исключением тех слу- случаев, когда по некоторым особым соображениям будет удобно установить явную зависимость до от х. Если на функцию до(/) не наложено ограничений, то сфор- сформулированная выше задача имеет тривиальное решение, что легко видеть из следующей теоремы.
Достижимые зоны для автономных систем 151 Теорема 1.1. Пусть A.1) есть система обыкновенных диф- дифференциальных уравнений, где {(х)—заданная функция, и пусть << A.4) есть уравнение некоторой кривой. Тогда существует функция , определенная при 0^^-^^ь такая, что система имеет решением в точности заданную кривую A.4). Доказательство. Как легко видеть, для доказательства теоремы достаточно положить 2. ДОСТИЖИМЫЕ ТОЧКИ И ЗОНЫ Ограничения на «произвольные» возмущения. Рассматривая (для заданной точки х и заданного значения I) вектор шA) с компонентами 1Юг(г) (/=1, 2, ..., п) в я-мерном пространстве, мы видим, что ограничения на возможные значения ш разби- разбивают пространство на два множества точек, в одном из кото- которых могут быть значения ш, а в другом этих значений быть не может. Таким образом, мы приходим к рассмотрению для ш основного условия / = 1, 2, где Рг — заданные функции, которые могут зависеть отх1, х2,. .. ..., хп, но не от I. (Если Р\ зависят явно от I, то свойство транзитивности может не выполняться; см. лемму 2.1.) Ограни- Ограничениями могут быть, например, В этом случае шA) будет лежать в плоскости ^1 = 0 и содер- содержаться в гиперпараллелепипеде с ребрами 2аг A = 2, 3, . . ., п). Мы можем также рассматривать условия, налагаемые на шA) как на функцию от I (например, ограниченность первой производной), но в настоящем исследовании мы ограничимся типом условий, упомянутым выше. Вместо уравнений B.1) в неявной форме последние можно также задать параметрически, т. е. если в B.1) нет неравенств, то можно написать , 2, ..., п), B.2)
152 Э. Роксин, В. Спинадел где а{ — произвольные функции от I. Напротив, если в B.1) имеются неравенства, то <Х{ ограничены условиями типа Равенства B.2) определяют некоторое 5-мерное многообразие ($ = /г — р). В дальнейшем мы рассмотрим некоторые ограничения, на- накладываемые на гю(г), вследствие их важности для применения в различных областях физики и техники. Достижимые точки. Задавая систему A.1) и некоторое огра- ограничение на ш в форме B.1) или B.2), мы, однако, не знаем, можно ли перейти из начальной точки х0 в произвольную точ- точку хи двигаясь по возможной траектории. В связи с этим вве- введем следующее определение. Определение 2.1. Пусть дана система A.1) и на ш на- наложены определенные ограничения в форме B.1) или B.2). Будем называть точку х± достижимой из х0, если существуют функция хю^г), удовлетворяющая наложенным ограничениям, и значение 1± <> 0, такие, что система B-3) имеет решение х = х(г), удовлетворяющее соотношению X (н.) =1Х{. Другими словами, точка х^ достижима из лг0, если она лежит на положительной полутраектории системы B.3). Достижимые и непокидаемые зоны Определение 2.2. В условиях определения 2.1 множество точек, достижимых из лг0, будем называть достижимой зо- зоной из х0. Определение 2.3. В условиях определения 2.1 всякое множество точек С, обладающее свойством «если яо€ С и если Х{ достижима из лго, то XI6 С», будем называть непокидаемой зоной. Как будет показано в дальнейшем, всякая достижимая из Хо зона является и непокидаемой зоной. Однако обратное утвер- утверждение неверно. Лемма 2.1. Если х{ достижима из х0, а х2 достижима из то х2 достижима из х0 (свойство транзитивности). Доказательство. Доказательство получается непосред- непосредственно. По условию леммы существуют две функции до4 и 1с»2,
Достижимые зоны для автономных систем 153 такие, что уравнения х = !(х) + Щ> х@) = хо> и имеют соответствующие решения, которые при некоторых неот рицательных значениях и и 1г удовлетворяют условиям х(и) =х{ и хD) = соответственно. Если положить при — Ь) при то решение уравнения будет удовлетворять условию Замечание. Пустое множество V и все пространство Б являются непокидаемыми зонами. Доказательство. В обоих случаях невозможно, чтобы XI была достижима из х0, если хо€ I), а Х\ ^ V. Теорема 2.1. Произвольное объединение и произвольное пересечение непокидаемых зон являются также непокидаемыми зонами. Доказательство. Пусть {Са} — произвольное семейство непокидаемых зон, и пусть С = [)Са. Если точка хо€С, то она а принадлежит и некоторой зоне Са. Если точка х± достижима из лг0, то она содержится в той же зоне Са, и, таким образом, х^С. Доказательство для случая пересечения проводится ана- аналогичным образом. Теорема 2.2. Для данного множества точек Со существует минимальная непокидаемая зона Ст, содержащая это мно- множество. Доказательство. Рассмотрим всевозможные непоки- даемые зоны Са, содержащие Со. Множество {Са} не пусто, поскольку оно содержит по крайней мере все пространство Е.
154 Э. Роксан, В. Спинадвл Очевидно, что пересечение всех Са есть минимальная непоки- даемая зона, содержащая Со. Замечание. Как легко видеть, достижимая из точки Р зона есть минимальная непокидаемая зона, содержащая Р. 3. ОГРАНИЧЕННЫЕ ВОЗМУЩЕНИЯ Всюду в дальнейшем я-мерные векторы хA), }(х) и тA) будут рассматриваться в ортогональной декартовой системе ко- координат с евклидовой метрикой. Далее, наиболее естественным ограничением на возмущения, по-видимому, есть п I да (О I2 = 2 [«>/(ОР < *2- (зл) где хюх — компоненты вектора чю(г), а к— заданная постоянная. Из B.1) следует, что к может зависеть от х, но не зависит от параметра I. Как мы сейчас покажем, характер траекторий системы A.1) зависит от того, \!(х) \ >к или |/(л:) | & Теорема 3.1. Пусть A.1)—система обыкновенных диф- дифференциальных уравнений, в которой шA) подчиняется ограни- ограничению C.1), и пусть = *о. C.2) есть уравнение дуги, содержащейся в области О, точки которой удовлетворяют условию \П*)\<Ь. C.3) Тогда C.2)—решение системы A.1) при соответствующем вы- выборе 1ЮA). Доказательство. Мы должны доказать, что при соот- соответствующем 1ю(г) вектор х(г) может иметь любое направле- направление в й. Это означает, что нужно найти такое соотношение т=т@, C.4) чтобы при соответствующем выборе гюA) кривая C.2) удовле- удовлетворяла уравнению A.1). В силу теоремы 1.1 уравнению A.1) всегда можно удовлетворить, полагая с3-5) Остается показать, что х(г) можно выбрать так, чтобы C.1) выполнялось при йтЛ#>0, что необходимо для сохранения на-
Достижимые зоны для автономных систем 155 правления движения по дуге C.2). Из C.5) имеем (в вектор- векторной форме) М01= Если мы положим 3.^1 ах й1 1A) 3 с1х 3. ах C.6) то 3 их их М и Неравенство C.6) при с1х/сИ>0 справедливо в том случае, если Ь>\Нх)\. что верно по предположению. Теорема 3.2. Пусть A.1)—система обыкновенных диф- дифференциальных уравнений, в которой гюA) удовлетворяет огра- ограничению C.1), и пусть C.2)—уравнение кривой, содержа- содержащейся в области п, точки которой удовлетворяют условию \!(х)\>к. C.7) Тогда решениями системы A.1) являются те кривые, содержа- содержащиеся в й, которые удовлетворяют неравенству К*) ах Их) \ 3. ах C.8) Доказательство. Исходящие из х возможные напра- направления хA) образуют конус вращения, вершина которого есть х. Очевидно, что кривая C.2) будет осуществимой траекторией системы A.1), если при каждом х ее касательная лежит внутри конуса, соответствующего точке х. Нужно показать, что анали- аналитическим выражением этого условия является неравенство C.8). Как и в теореме 3.1, параметризацию C.4) необходимо вы- выбрать в форме C.5) и найти те кривые C.2), для которых можно выбрать так, что 11) @| = C.9) при йт/сИ>0. Найдем значение йт[сИ, которое минимизирует
156 Э. Роксин, В. Спинадел выражение п •а; ах - и (ЗЛО) где й\г\Aх и 1г(х) —компоненты векторов Л\\Лх и \{х) соответ- соответственно. Легко видеть, что это значение есть *1 их C.11) Для того чтобы существовало т, при котором C.2) и C.5) удовлетворяют A.1) и C.1), минимальное значение \хю\2 долж- должно быть меньше к2. Из C.10) получаем п П п ах т Заменяя т его выражением C.11), имеем 2 ги- гшп дог = п V 31 Ал ах ах Условие C.1) имеет место, если что мы и хотели доказать. Примеры. Применим теперь предыдущие теоремы к некото- некоторым конкретным случаям. Очевидно, в силу теоремы 2.1 не- покидаемые зоны будем строить объединением и пересечением достижимых зон. 1) Рассмотрим уравнение где А, — фиксированный положительный скаляр и \шA)\<,к. Для каждого значения \х\<к/Х осуществимые траектории мо- могут иметь любое направление. Таким образом, из любой точки внутри сферы \х\<к/к достижимо все пространство. С другой стороны, для точки х0 вне сферы непокидаемая зона есть тело вращения, подобное изображенному на рис. 1. Непокидаемой зоной является, например, множество точек \х\>к/Х.
Рис. 1. Тело вращения. Рис. 2. Меридиональное сечение гела вращения
158 Э. Роксин, В. Спинадел Однако, если А, отрицательно, зона, достижимая из точки х0, лежащей вне сферы \х\<к/Х, будет телом вращения, меридио- меридиональное сечение которого изображено на рис. 2. Причина этого в том, что конус предельных направлений в каждой точке х0 является конусом, касательным к сфере \х\<к/'к. 2) Рассмотрим уравнение где и щ хю(г) <к. В этом случае достижимая из точки х0 зона есть область вне тела вращения, изображенного на рис. 3, меридиональное сечение которого есть логарифмическая спираль, определяемая углом — • Л А ' Если же —Х>&>0, достижимая зона есть тело вращения, изображенное на рис. 4. 3) Рассмотрим теперь двумерную систему дифференциаль- дифференциальных уравнений х2 — а2х2 ~т- -ш2, где аи а2>0 и <т\-\-'т\^к2. Начало координат для основной системы является неустойчивым узлом. Всякая кривая, лежа- лежащая внутри эллипса V2 V2 *2 ~~2 I 2~ 2 2 ' х & I. & является осуществимой траекторией (теорема 3.1). Из любой точки, лежащей внутри этого эллипса, достижима вся пло- плоскость. Из точки вне этого эллипса возможные направления х заполняют криволинейный сектор, и на рис. 5 заштрихованы достижимые зоны для этого случая. Если аь а2<0, то начало координат является устойчивым узлом, и достижимые в этом случае зоны показаны на рис. 6. Построение всех этих зон легко произвести графически. 4) Рассмотрим систему х2 = а2х2 -)- щ где теперь а{>0>а2 и чя)[ \г™\^ &2- Начало координат для ос новной систему ярдяется седловой точкой. Всякая кривая, ле
Рис. 3. Тело вращения. Рис. 4. Тело вращения.
Рис. 5. Рис. Ь. Достижимая зона.
Достижимые зоны для автономных систем 161 жащая внутри эллипса ,2 '1 (Л/а,)- (к/а2у 1, является осуществимой траекторией. Для точек внутри этого эллипса достижимой зоной является полоса |#2|<!&/#2|. Дру- Другие типичные достижимые зоны изображены на рис. 7. Рис. 7/ Типичные достижимые зоны. 5) Рассмотрим систему ахх -{- Ьх х2 = — ах2 где а < О, ^Н-^2^^2- Начало координат является устойчи- устойчивым фокусом (в полярных координатах решение основной си- системы есть кривая р = ро^-асо/^). Всякая кривая, лежащая вну- внутри окружности 9 I 9 1 '2 является осуществимой траекторией, однако достижимой из на- начала координат зоной является окружность, уравнением кото- которой является х\ + х\'= к?/а2 (рис. 8). Если а>0, зона, достижимая из точки, лежащей на окруж- окружности х\ 4- х\ = к2/а2, есть область х\ -(- ^ > ^2/а2 (Рис- 9). И Зак. 243
162 Э. Роксин, В. Спинадел В каждом случае достижимые зоны находятся при помощи построения оболочки конусов (углов) возможных направле- направлении х. X Рис. 9. Другие типы ограничений. Условие C.1) можно обобщить, заменяя сферу C.12)
Достижимые зоны для автономных систем 163 квадратичной формой C.13) Тогда ограничивающим условием C.1) будет Легко видеть, что метрические свойства достижимых зон существенным образом зависят от типа рассматриваемой квад- квадратичной формы. Если ф(^г) является положительно опреде- определенной формой, сфера C.12) заменится на эллипсоид. В этом случае достижимая зона топологически подобна случаю C.1), так как оба они связаны аффинным преобразованием. Если же ср(Шг) является неопределенной квадратичной формой, то C.12) является гиперболоидом, а если ф(^г) является полуопреде- полуопределенной, то — цилиндром. Геометрический анализ достижимой зоны в этих случаях подобен предыдущему. Важно также рассмотреть случай, когда компоненты 1Ю\ ограничены независимо, т. е. ограничение B.1) имеет вид о><| <&г (/=1, 2, ..., п). C.14) Сфера C.12) заменяется в данном случае на гиперпараллеле- гиперпараллелепипед, и если х0 лежит вне его, то возможные направления х образуют пирамидальную поверхность, выполняющую роль ко- конуса предыдущих рассмотрений. Последний тип ограничений рассмотрен в работах [2] и [3], посвященных оптимальному управлению. Показано, что опти- оптимальный возмущающий вектор (в задаче приведения физиче- физической системы в состояние покоя за минимальное время) удо- удовлетворяет условию Шг=±6г. Наряду с этим теория достижи- достижимых зон позволяет точно определить область, из которой можно достичь каждую точку покоя. Рассмотрим, например, уравнение Пусть л:0==0 является особой точкой уравнения х = 1(х), т. е. точкой равновесия невозмущенной системы. Тогда, для того чтобы определить, из каких точек х достижимо начало коорди- координат л:0=0, достаточно рассмотреть уравнение х==—[{(х) + гм(()], или, что то же, произвести инверсию времени и отыскать зону, достижимую из точки х0. 4. ВОЗМУЩЕНИЯ МЕНЬШЕЙ РАЗМЕРНОСТИ Этот раздел будет посвящен случаю, когда возмущающий векгор хю(х,1) в уравнении A.1) имеет меньшую размерность, чем х(г) и }(х). Это имеет место, например, тогда, когда до(#, ()
164 Э. Роксин, В. Спинадел является функцией от п — 1 произвольной функции от D.1) где п — размерность вектора х. Линейный (п — 1) -мерный случай. Если Р в D.1) является линейной функцией от параметров щA) с коэффициентами, за- зависящими от х, то уравнение A.1) принимает вид х^!(х) + ця(х)оь1(О +ф2(*)а2(/)+ ••• +Чп-Лх)ап-\У)9 D.2) где /, ф1,..., фп-1 — заданные я-мерные векторы, а а* — произ- произвольные скалярные функции от г. Ниже мы будем рассматри- рассматривать только этот линейный случай. Рис. 10. Классификация точек. В зависимости от взаимного располо- расположения векторов /, ф1,..., фп-1 в точке х можно выделить сле- следующие типы точек: а) векторы /, фЬ .. ., фп_! линейно независимы. Такую точку х будем называть регулярной точкой. Возможные направления вектора х в уравнении D.2) заполняют полупространство, так как каждый вектор, соединяющий х с плоскостью я на рис. 10, является возможным вектором х\ б) фг линейно независимы, но / является их линейной ком- комбинацией. Такую точку х будем называть точкой контакта. Здесь мы исключаем случай, когда }(х)=0. На рис. 10 пока- показано, что возможные направления х образуют гиперплоскость размерности (п — 1); в) ф* линейно зависимы. Такую точку х будем называть ир- иррегулярной. При этом возможны несколько подслучаев в зава-
Достижимые зоны для автономных систем 165 симости от числа независимых величин ф* и относительного рас- расположения вектора !(х). Пертурбатрисы. Разложим уравнение D.2), имеющее форму A.1), в два уравнения вида A.2) и A.3) и рассмотрим решения каждого из этих уравнений. Как упоминалось в начале статьи, решения уравнения A.2) (основной системы) называются основными кривыми. Мы бу- будем различать положительные и отрицательные ветви основных кривых, т. е. части основной кривой, получающиеся соответ- соответственно при положительных и отрицательных значениях пара- параметра /. Всякое решение возмущающей системы полученное для определенного набора п — 1 произвольной функции агA), будем называть пертурбационной кривой, или просто пертурбатрисой. Найдем необходимое условие, при котором всякая пертур- батриса, проходящая через точку хо= (хои *ог,. .., хОп), лежит на некоторой гиперповерхности и(хи Хч,... ,хп) = 0 D.4) или хп = Р(х± Х2,..., Хп-А. D.5) Эта гиперповерхность должна быть касательной к векторам Фь ... ,фп-1, т. е. п ^ФУ/ = О (у = 1, 2, ..., л-1), D.6) где фа, Фг2, • • •, Фш — компоненты вектора фг. Это эквивалентно системе уравнений ди ди , ди ди , ди . . ди ф21 + 'дГ, ф22+ + ••••••••••••••*• I 1 • / I ди * ди , . ди Используя уравнение D.5), получим . 2.....*-!) D.8)
166 Э. Роксин, В. Спинадел ИЛИ ди дР ди •=- (/ = 1, 2, .... л —1), D.9) А/2 где Ду есть (—1)^, умноженная на определитель, получаю- получающийся вычеркиванием у-го столбца из прямоугольной матрицы Фп Ч>12 Ф1Л Ф/1-1,1 Фл-1,2 Фл-1,л Если существует решение D.4) или D.5) системы уравнений в частных производных D.7) или D.9) соответственно, проходя- проходящее через х0, то эта гиперповерхность содержит все пертурба- трисы, проходящие через эту точку. Вопрос о существовании таких поверхностей, т. е. о совместности или несовместности D.7) или D.9), приводит к проблеме Пфаффа в механике о раз- различении голономных и неголономных связей. Введем следую- следующее определение. Определение 4.1. Возмущающую систему D.3) будем называть голономной, если система D.7) совместна и одно- однозначно определяет поверхности и(хи х2,..., хп) =сопз1, которые мы будем называть пертурбационными. В противном случае бу- будем называть систему неголономной. Лемма 4.1. Если возмущающая система D.2) является го- лономной, и(хи х2, ..., хп)=0 — пертурбационная поверхность, и если D.10) — уравнение некоторой кривой на этой поверхности, то D.10) — пертурбационная кривая системы D.2). Доказательство. Поскольку D.10) лежит на пертурба- пертурбационной поверхности, вектор й\\(И является в каждой точке ли- линейной комбинацией векторов ф1, ф2,..., фп-1 -± а2 D.11) При изменении параметра I в D.10) изменяются х и а,, давая в конечном счете ■« =-Ц-= Ч>1 (*) <*1 @ + ••• +Фя-1
Достижимые зоны для автономных систем 167 откуда следует, что D.10) является пертурбационной кривой. Мы предположили, что в каждой точке 5@ векторы ^{(х) ли- линейно независимы. Если это условие не выполнено, уравнения D.8) уже не определяют касательную плоскость, и такие точки не могут считаться принадлежащими пертурбационной поверх- поверхности. Этот случай требует специального исследования. Квазидостижимые точки. Точку х^ будем называть квазидо- квазидостижимой из х0 системой A.1), если в любой окрестности л^ су- существуют достижимые точки. Теорема 4.1. Если х>± квазидостижима из х0, а х2 квазидо- стижима из х±, то х2 квазидостижима из х0. До к а з а те л ьств о. Доказательство основывается на не- непрерывной зависимости решений системы A.1) от начальных условий. Пусть Ц2 — окрестность точки х2. Тогда существует точка х'т принадлежащая этой окрестности, и функция хю(г)у такая, что траектория A.1), проходящая через хи проходит также и через х'2 при достаточно больших значениях I. По не- непрерывности существует окрестность \]\ точки х^ такая, что всякая траектория A.1), проходящая через 1/и впоследствии проходит через окрестность 1/2, которая является также окрест- окрестностью точки х'т Поскольку Х[ квазидостижима из х0 по пред- предположению, то существует функция хю(г), такая, что траектория, выходящая из лг0, проходит через некоторую точку х[^С/у По- Поскольку мы можем некоторой другой траекторией соединить х[ с некоторой точкой х2 ^ 6^2, то очевидно, что х2 в С/2 до- достижима из Хо, что завершает доказательство. Лемма 4.2. Пусть х=1A)—уравнение пертурбационной кривой, выходящей из л:0 = 5@). Тогда всякая точка Х1 = 5(^1) этой пертурбатрисы квазидостижима из х0 системой D.3). Доказательство. Мы всегда можем считать, что ^ > 0, поскольку в противном случае достаточно изменить знак аг(/), и пертурбатриса будет иметь обратную ориентацию. Положим = А, / (х) + Ф! (х) М0+ ... +фл-1М««-1Й- D.12) Поскольку при Х=0 существуют п—1 функций сц(г), таких, что траектория, исходящая из х0 при /=0, проходит через Х\ при ^=/1^0 и D.12) непрерывно зависит от Я, мы можем за- заключить, что: при наличии произвольной окрестности \]± точки Ху существует е > 0, такое, что для всякого |А,| <е решение D.12), проходящее через х0 при / = 0, проходит через окрест-
168 Э. Роксин, В. Спинадел ность О1 точки XI при 1 = и. В предположении 0 < X < е траек тория системы будет вести себя аналогичным образом, и, следовательно, этим мы доказали существование достижимых из х0 точек внутри а это и означает, что х± квазидостижима. Теорема 4.2. Пусть A.1)—система дифференциальных уравнений, возмущающая система которой имеет вид D.2). Если такая система голономна, и(хи х2,..., хп) = 0 — пертурба- пертурбационная поверхность, и х0, х± — две точки, принадлежащие этой поверхности, которые можно соединить дугой, целиком лежащей на той же поверхности, то х± квазидостижима из х0. Доказательство. Доказательство непосредственно сле- следует из леммы 4.1 и 4.2. Следствие 4.1. В условиях предыдущей теоремы из точ- точки х0 квазидостижима всякая точка, принадлежащая пертурба- пертурбационной поверхности, проходящей через х0 (и той же связной части в случае, если поверхность имеет их более одной, как, например, эллиптический гиперболоид). 5. ДВУМЕРНЫЕ СИСТЕМЫ Рассмотрим двумерные системы, которые, как легко пока- показать, всегда голономны. Многие результаты, которые будут здесь получены, допускают обобщение на общий голономный случай, однако мы не будем подробно ^излагать эти обобщения, поскольку для двумерных систем соответствующие факты ка- кажутся ясными и их развитие значительно проще. Если полная, система дифференциальных уравнений имеет вид E.1) то имеется некоторая симметрия между основной системой х=!(х) E.2) и возмущающей E.3) В последнее выражение мы не включили произвольный скаляр- скалярный множитель а(^), поскольку он не меняет кривую решения (пергурбатрису). Как уже упоминалось, рассматриваемый слу- случай всегда является голономным, и пертурбационные поверхно- поверхности совпадают с решениями системы E.3).
Достижимые зоны для автономных систем 169 Теорема 5.1. Пусть дана система E.1), непокидаемая зона 1 и регулярная точка лг0, принадлежащая границе 1. Тогда существует окрестность V точки лг0, такая, что в V граница 2 есть в точности пертурбационная кривая, проходящая через х0. Доказательство. Поскольку х0 регулярна и векторы 1(х) и ф(х) —непрерывные функции, то можно выбрать II так, чтобы кривые решений систем E.2) и E.3), задаваемые соот- соотношениями ^1(^1, л:2)=соп51 и и2(хи Х2)=соп51, соответственно образовывали регулярную сеть, топологически эквивалентную декартовой системе координат. Поскольку якобиан преобразо- преобразования отличен от нуля, мы можем принять щ и и2 за новые ко- координаты. В этой новой системе координат система E.1) будет иметь вид и2), E.4) где #1(ыь и2) и Цг(и,и и2) сохраняют знак в V. После другого топологического преобразования эту систему можно записать в виде Теперь очевидно, что некоторая точка Р2= (и2и и22) достижима из некоторой точки Р^={и^\^ и&), если и2\ > ип. По этой при- причине если х0 принадлежит границе 2, то эта граница совпадает с линией ^1 = 0. Критерии достижимости и квазидостижимости Мы сформулируем некоторые критерии, которые позволяют определить, какие точки достижимы или квазидостижимы из за- заданной точки. Теорема 5.2. Пусть даны система E.1) и точка х0. Вся- Всякая точка #1, принадлежащая пертурбатрисе, проходящей через Хо, квазидостижима из х0. Доказательство. Предположим, что х1 принадлежит положительной полупертурбатрисе точки #о, т. е. соответствует положительному значению I в решении E.3) с начальным усло- условием л;(О)=л:о. Если мы положим в качестве новой переменной параметр т = о^, где а — положительная константа, уравнение E.1) можно записать в виде = Ф (х) +1 / (х). E.5) Очезидно, мы ограничиваемся случаем, когда а(^) —константа.
170 Э. Роксин, В. Спинадел Общее решение E.5) х = ф(-, х0, т— т0) E.6) (при ограничениях, упомянутых в начале разд. 1) является не- непрерывной функцией от 1/а=|3, которое при C = 0 дает пертур- батрису, проходящую через х0. Следовательно, выбирая C до- достаточно малым (а достаточно большим), мы получим решение E.5) [и вместе с тем решение E.1)], проходящее вблизи х±, что и требовалось. Если #1 лежит на отрицательной полупертурбатрисе, прохо- проходящей через лго, достаточно изменить знак ф(х) [что даст то же множество решений системы E.1)]. Это так, поскольку мы не можем'менять ни знак /(х), ни направление параметра «вре- «времени» I или т, существенные при определении достижимой зоны. Следствие 5.1. Если х0 квазидостижима (из некоторой непокидаемой зоны) и х1 принадлежит пертурбатрисе, проходя- проходящей через лг0, то х1 также квазидостижима. Доказательство. Доказательство непосредственно по- получается применением теорем 4.1 и 5.2. Теорема 5.3. Если х0 — достижимая точка (из некоторой непокидаемой зоны 1), не лежащая на границе 1, то всякая другая точка х± пертурбатрисы, проходящей через лг0, также достижима. Доказательство. Доказательство аналогично доказа- доказательству теоремы 5.2. Используя те же обозначения, мы можем выбрать окрестность V точки х0, целиком лежащую в зоне 1 (х0 является внутренней точкой 2), и положительное достаточно большое а, так что соответствующее решение E.6), проходя- проходящее через Хи пересекает также окрестность Ц. Из положитель- положительности а следует, что значение т, соответствующее х^ больше значения, соответствующего точкам {У, так что х^ достижима из некоторой точки V, и поскольку все эти точки принадлежат 2 (достижимы), то таковой является и х±. Следствие 5.2. Если х0 не является квазидостижимой (из некоторой непокидаемой зоны 2), то никакая другая точка х± на пертурбатрисе, проходящей через л:0, не может быть квази- достижимой. Доказательство. Очевидно, что если х± квазидости- квазидостижима, то х0 также квазидостижима.
Достижимые зоны для автономных систем 171 Пересекаемые и непересекаемые кривые Пусть заданы жорданова дуга у в х-шюскости х = %(%), 0<т<1, E.7) ориентированная по возрастающим значениям т, и система диф- дифференциальных уравнений * = /(*, 0> E.8) определенная в некоторой области, содержащей дугу V- Опре- Определим теперь, что означает, когда говорят, что у «пересекаема» или «непересекаема» решениями системы E.8) в интервале вре- времени 7\, Т2. Для этого соединим концевые точки А и В дуги у другой дугой у7, которая не пересекает у, так что у+у' обра- образуют замкнутую жорданову кривую, делящую х-плоскость на две области /?* и /?г, где индексы / и г выбраны для левой и правой сторон ориентированной жордановой кривой, по кото- которую лежит соответствующая область. /?* и /?г определяются как открытые множества, не содержащие кривую у + у'. Конечно, у7 должна лежать в области определения E.8). Рассмотрим ин- интервал [ У<< E.9) вдоль оси I и трехмерные области Я\ X Т и /?г X Т. При этих замечаниях и используя обозначение E.10) для общего решения E.8), можно дать следующее определение. Определение 5.1. Упомянутую выше дугу у будем на- называть «пересекаемой слева направо» дифференциальным по- полем E.8) в интервале времени Г, если дугу у7 можно выбрать так, что в трехмерном пространстве существуют две точки (хи и) и (Х2, ^) со следующими свойствами: а) (хи к) 6 Кг X Г; (*2, к) 6 Яг X Т, б) и > и, в) Р(г2, хи к)=хг, г) проекция траектории (х±, ^^)у (х2, 4) на ^-пространство не пересекает дугу у/ (включая концевые точки Л, В), но пере- пересекает дугу у (исключая концевые точки Л, В). Бели этому определению удовлетворяет некоторая дуга у7, то ему удовлетворяет и некоторая другая дуга у", лежащая в области определения системы E.8). Для доказательства этого заметим, что пересечение траектории (хи /1), (х2, 1г) с цилин- цилиндрической поверхностью у X Т есть непустое замкнутое точеч- точечное множество, не пересекающее линии А X Т, В X Т. Поэтому
172 9. Роксан, В. Спинадвл на траектории существуют точки из /?/ X Т и из /?г X Т, сколь угодно близкие к у X Т. Это верно даже и в том случае, если исключить из рассмотрения два небольших круговых цилиндра высотой Г, основаниями которых служат окружности с цен- центрами в А и В достаточно малого радиуса е (рис. 11). Мы мо- можем, например, определить «первую» точку на траектории, та- такую, что всякая другая последующая точка принадлежит об- области /?г X Т. Определенная таким образом точка лежит на Рис. 11. у X Т и в любой окрестности имеет точки траектории, лежащие в #г X Т. Так как расстояние от дуги V до дуги у" положи- положительно, если исключить упомянутые выше два малых цилиндра радиусом е, то мы приходим к заключению, что существуют две точки (х[, г'^ и (х'2, ^), принадлежащие Н[ХТ и /?^ X Т соответственно (где /^ и ^ определяются дугой у"), которые удовлетворяют условиям определения 5.1. Если дуга V не удовлетворяет условиям предыдущего опре- определения, то будем говорить, что «V непересекаема слева на- направо» полем E.8) в интервале Т. Аналогично мы будем ис- использовать такие выражения, как «у пересекаема справа на- налево», «V пересекаема в обоих направлениях» и т. п. Если диф- дифференциальная система E.8) автономна, дело обстоит значи- значительно проще, так как в этом случае не нужно рассматривать интервал Т и все рассуждения можно провести исключительно в двумерном пространстве.
Достижимые зоны для автономных систем 173 Теорема 5.4. Пусть у — дуга E.7), а у' — другая дуга, со- соединяющая те же концевые точки, так что вместе они образуют жорданову кривую, делящую х-плоскость на области /?/ и /?г, и пусть (#1, 1ч\ х2у г2) есть траектория E.8), удовлетворяющая всем условиям определения 5.1, за исключением того, что х2 принадлежит не /?г, а у (без концевых точек). Тогда дуга у пе- пересекаема слева направо в интервале Т. Доказательство. Доказательство основано на свойстве непрерывности. Так как дуга (хи ^; х2, и) регулярна, то можно выбрать сферу {Д с центром в (х^ и) и радиусом еь и другую сферу 1J с центром в (х2, г2) и радиусом е2 так, что все траек- траектории E.8), проходящие через Ц2, проходят также через III и образуют «цилиндр траекторий» вокруг траектории (хи 1^\ х2у г2). Так как расстояние от поверхности у' X Т до траектории (хи ^; х2, и) положительно, е2 можно выбрать настолько малым, чтобы весь цилиндр траекторий не пересекал у' X Т. Очевидно, что в И2 имеются точки из Кг X Т и траектории, проходящие через них, исходят из 1/и т. е. из точек ^ X Т. Этим и завершается наше доказательство. Заметим, что условие регулярности траектории необходимо. Например, прямая, проходящая через начало координат, непе- ресекаема системой х= —х, несмотря на то что начало коорди- координат является предельной точкой всякой траектории (точка х2 рассматриваемой выше траектории). Теорема 5.5. Пусть уоу2 — жорданова дуга, разделенная точкой г/1 на две дуги уоуи У\У2- Если каждая из дуги уоу\ и у\у2 пересекаема слева направо полем E.8) в интервале Т, то дуга у0у2 также пересекаема. Обратно, если у0у2 пересекаема, то пе- пересекаема по крайней мере одна из дуг уоуи у1у2. Доказательство. Первое утверждение этой теоремы очевидно. Для доказательства второй ее части выберем дугу у\ образующую с у0у2 жорданову кривую, разделяющую /?/ и /?г. Существует, по предположению, траектория (х^\ х2, /2), пере- пересекающая (уоУ'>)ХТ. Она имеет по крайней мере одну общую точку с этой цилиндрической поверхностью, и проекция этой точки не является концевой точкой дуги у0у2. Если эта проекция является внутренней точкой уоух или у$2, теорема доказана. Остается посмотреть, что произойдет, если эта точка есть в точности г/1. Рассмотрим в этом случае цилиндр траекторий, упомянутый в доказательстве теоремы 5.4. По непрерывности этот цилиндр траекторий пересекает поверхность (уоу2) X Т в некоторой окрестности точки, в которой ее пересекает траекто- траектория (х±, ги х2, г2). Поскольку невозможно, чтобы весь цилиндр
174 Э. Роксин, В. Спинадел траекторий пересекал цилиндрическую поверхность вдоль ли- линии у^ X 7\ существует траектория, проходящая из Я\У\Т в X Т и пересекающая (УоУг) X Т на некотором расстоянии от X Т. Теорема доводится до конца без затруднений. Заметим, что у^ может быть особой точкой системы E.8), как в случае системы (рис. 12) — у» у2 2 1 (хх, х2 координаты х). Здесь ни отрицательная, ни положительная полуоси х не пере- пересекаемы снизу вверх, и это же имеет место для всей оси х в соответствии с теоремой 5.5. Рис. 12. Из этой теоремы вытекают легко доказываемые следствия. Следствие 5.3. Если ориентированная жорданова кри- кривая у состоит из дуг у^ ^2,.. ., уп, ни одна из которых не пере- пересекаема слева направо системой E.8) в интервале Т, то кри- кривая у делит плоскость на области Нь и /?г так, что в интервале Т никакая траектория системы E.8) не проходит из точки в /?* в точку Нг [т- в- можно сказать, что у обладает свойством «ло- «ловушки» для интегральных кривых системы E.8)]. Следствие 5.4. Если у — некоторая ориентированная кри- кривая, уходящая в бесконечность (и разделяющая плоскость на две области /?* и Нг), такая, что всякая конечная связная часть ее является жордановой дугой, непересекаемой слева направо в интервале Т, то никакая траектория системы E.8) не перехо-
Достижимые зоны для автономных систем 175 дит из #1 X Т в /?г X Т. (Для доказательства достаточно рас- рассмотреть топологически замкнутую комплексную плоскость с присоединенной к ней бесконечно удаленной точкой.) Теперь мы рассмотрим жордановы кривые и дуги, обладаю- обладающие непрерывно вращающимися касательными векторами. Мы будем допускать конечное число «угловых» точек, в которых касательный вектор терпит разрыв, но имеет пределы слева и справа. В этом случае, для того чтобы последующие теоремы оставались в силе, все условия в них, связанные с касательным вектором, должны выполняться для обоих предельных поло- положений. Теорема 5.6. Если на дуге у, заданной выражением E.7), существуют внутренняя точка х0 и значение и 6 Т, такие, что угол C между касательным вектором в х0 и вектором поля E.8) в точке х0, и удовлетворяет условию 0<|3<я, то у пересекаема справа налево в интервале Т. Доказательство. В некоторой окрестности точки х0, и этот угол останется в пределах 0 < р < я, так что траектория, проходящая через х0, и, пересекает у. Следствие 5.5. Если у непересекаема справа налево в интервале Т, то 0 ^ C ^> — я во всех внутренних точках у при всех 16 Т. Здесь мы даем теорему Массера [5], которая будет нам по- полезна. Теорема (Массера). Пусть О — некоторое открытое мно- множество в вещественном векторном пространстве У; граница этого множества является гладкой в следующем смысле: если у0 ле- лежит на границе О, то существует локальная система координат, такая, что граничные точки О в окрестности у0 можно предста- представить как поверхность функции и = у(г), где и — компонента у вдоль некоторого одномерного подпространства и г — проекция у на ортогональное подпространство, функция ф имеет ограни- ограниченный дифференциал в окрестности у0; это допускает, что точки О локально соответствуют множеству и<у(г). Пусть ё(у)—векторное поле в У, локально удовлетворяющее усло- условию Липшица; пусть р(г, и) —проекция § на г-простране^во и ц(г, и)—(скалярная) компонента вдоль оси и. Если в некото- некоторой точке границы О выполняется неравенство ц — 8ф[.г;р]^0 (т. е. если § образует острый или прямой угол с внутренней нор- нормалью к границе), некоторое решение дифференциального урав- уравнения г/ = й"(#), исходящее из некоторой точки множества О, бу- будет оставаться в замыкании О.
176 Э. Роксин, В. Спинадел Непосредственным результатом теоремы Массера является Следствие 5.6. Если дуга у, заданная выражением E.7), пересекаема справа налево полем E.8) в интервале Т, то в не- некоторой внутренней точке х0 и при некотором и^Т упомянутый выше угол C удовлетворяет условию 0<|3<я. Доказательство. Если C = 0, то вектор х системы E.8) будет касательным к поверхности у X Г; если 0 < C < я, то х направлен в /?гХ^; если 0>|3>—я, то х направлен в /?г. Так что мы можем очевидным образом применить теорему Мас- Массера. Следующие теоремы, относящиеся к комбинации двух век- векторных полей, доказать очень легко, так что здесь мы дадим только краткие наброски доказательств. Теорема 5.7. Пусть у — дуга E.7). Рассмотрим два век- векторных поля E.11) E.12) и пусть есть новое поле, где скаляры X, \х ^ 0. Если дуга у непересе- каема слева направо полями E.11) и E.12), то она также не- пересекаема и их линейной комбинацией E.13). Доказательство. По предположению касательная к дуге у образует с вектором / угол (Зь такой, что 0 -^ 01 -^ я, и с вектором § угол C2, такой, что 0 ■< (Зг -^ я. Очевидно, для поля E.13) угол C лежит между р4 и (Зг, откуда и следует теорема. (Заметим, что X, [I могут быть функциями от I.) Теорема 5.8. Если дуга у непересекаема слева направо полем E.13), где X, \х — две произвольные положительные функ- функции от г, то она непересекаема также и ни одним из полей E.11) и E.12). Доказательство. Доказательство получается немедлен- немедленно, если заметить, что, когда, например, Х->0, система E.13) стремится к E.12). В силу теоремы Массера, поскольку C = C(Я), угол (Зо между касательной к дуге у и полем E.12) должен удовлетворять неравенству 0 ^С C -^ я. Теорема 5.9. Если дуга у пересекаема слева направо по- полем E.11), то она также пересекаема полем E.13) при поло- положительных К и
Достижимые зоны для автономных систем 177 Доказательство. Рассмотрим дугу у\ которая вместе с у разделяет области /?/ и /?г- По предположению существует траектория E.11), идущая из /?/ в Нг. Полагая в E.13) Х=1 и (л —> 0, по непрерывности получаем, что существуют достаточно малые значения \х > 0, при которых дуга у еще пересекаема слева направо полем E.13). Приложим теперь полученные результаты к системе урав- уравнений типа E.1). Следующая теорема дает фундаментальный критерий для определения достижимых зон таких систем. Теорема 5.10. Пусть у — ориентированная жорданова кри- кривая (замкнутая) или кривая, уходящая в бесконечность, но та- такая, что всякая ограниченная дуга ее является жордановой ду- дугой. Если у состоит из дуг уи у2,..., уп, каждая из которых а) есть дуга пертурбатрисы [т. е. удовлетворяет уравнению E.3)], б) или критическая линия E.3) [т. е. ф(л:)=0]; кроме того, если всякая дуга уг (ориентированная в том же направлении) непересекаема слева направо полем E.2), то кривая у разделяет области /?* и /?г и /?/ является непо- кидаемой зоной для полной системы E.1). Доказательство. Кривая решения у непересекаема ни в каком направлении системой E.3). Так как у также непере- непересекаема слева направо основной системой E.2), очевидно, что непересекаема слева направо обеими системами х = / (х) + окр (х) и х = / (х) — аф (х), где а^-0, и теорема доказана. [Заметим, что мы предположили, что а(/) имеет постоянный знак. Но теорема остается верной и в том случае, если а(/) меняет знак, а теорема Массера приме- применима для произвольного а.] 6. АНАЛИТИЧЕСКИЕ УСЛОВИЯ Результаты разд. 5 допускают аналитическую формулировку, пригодную для многих приложений. При условии, что основная система имеет вид F.1) кривая () F.2)
178 Э. Роксин, В. Спинадел есть решение у возмущающей системы F.3) Угол р между векторами ф(х)и ((х) определяется выраже- выражением ьи F 4) где фь фг, /ь и — компоненты векторов ф и /. Условие 0 ^ C ^ я при этом имеет вид F.5) где предполагается, что Следующие результаты являются прямыми следствиями пре- предыдущих теорем. Следствие 6.1. Если дуга у удовлетворяет F.3) и суще- существует точка на у, в которой вектор поля F.1) удовлетворяет условию Ф1/2 ~ Ф2/1 > 0, F.6) то у пересекаема справа налево решениями F.1). (Следствие из теоремы 5.4.) Следствие 6.2. Если дуга у удовлетворяет F.3) и ^пе- ^пересекаема справа налево решениями F.1), то Ф1/2 - Ф2/1 < 0 F.7) на всей дуге у. Следствие 6.3. Если при тех же обозначениях у пересе- пересекаема справа налево решениями F.1), то на у существует точка, в которой имеет место F.6). Следствие 6.4. Если условие F.7) имеет место вдоль у [F.3) удовлетворяется], то у непересекаема справа налево ре- решениями F.1). Замечание. Мы предполагаем, что на V нет особых точек F.3), т. е. -у является регулярной дугой пертурбатрисы. Следствие 6.5. Если в условиях теоремы 5.10 всякая ду- дуга у( удовлетворяет а) и б) и, кроме того, в) на всякой некритической дуге уг выражение Ф1/2 — Ф2/1 имеет постоянный знак или равно нулю, причем этот знак та- таков, что 8\п C <> 0 при пересечении кривой в некотором напра- направлении, и г) на критических дугах ^-^=0) вектор Aи /2) таков, что 51 п C > 0, то кривая у является границей непокидаемой зоны, лежащей слева от у.
Достижимые зоны для автономных систем 179 Как следствие предыдущих результатов можно резюмиро- резюмировать метод определения достижимых или непокидаемых зон и сформулировать следующее практическое правило. Для определения непокидаемых зон системы следует начать с интегрирования системы решения которой, включая критические линии, являются един- единственно возможными границами искомых зон. Для того чтобы определить, какие из них являются границей, а какие нет, сле- следует проанализировать знак Р=у^2 — ф2/1 вдоль каждой пер- турбатрисы. Примеры. 1. Линейные пертурбатрисы Рассмотрим полную систему где [х — константа. Очевидно, что в данном случае F.3) сво- сводится к виду =[11, и решениями этой системы являются прямые |12#1— [11*2 + 6 = 0 (& = СОП51). F.8) Эти прямые делят плоскость на две области, и для того, чтобы одна из этих линий была границей непокидаемой зоны, необхо- необходимо и достаточно, чтобы на ней выполнялось условие F.5) (и единственно возможной границей непокидаемой зоны является именно такая линия). 2. Дифференциальное уравнение второго по- порядка Рассмотрим уравнение где а(г)—произвольная функция. Это уравнение эквивалентно системе
180 3. Роксин, В. Спинадвл Пертурбатрисами являются прямые линии .^««сопз!, и выраже- выражение для Р, определяемое через F.5), имеет вид /^ср^г— г В этом случае достижима вся плоскость, поскольку Р = —х2 принимает оба знака вдоль пертурбатрисы л^сопз!, которая, следовательно, не может быть границей непокидаемой зоны. Рассмотрим теперь уравнение х=}(х, х) +ха(г) и эквивалентную систему Пертурбатрисами снова являются прямые л:1 = сопз1, и, по- поскольку Р не меняет знака вдоль л;1 = соп51. Несмотря на это, прямая л^сопз! не может быть границей непокидаемой зоны, посколь- поскольку л:1 = соп51 является комбинацией двух пертурбатрис, а именно полупрямых, соответствующих х2 > 0 и лг2 < 0, идущих в про- противоположных направлениях (от х2 = 0 до хг=±оо), плюс точка лг2 = 0 (которая является особой точкой возмущающей си- системы). Поэтому возмущающий вектор меняет направление вдоль лг1 = сопз1. Соответственно форма Р изменит знак, если угол р постоянно ориентирован в одну сторону. Но этого, как легко показать, не происходит. 3. Однородная основная система Пусть =и (-^1» -*2)» F.9) == /2 ( — однородная основная система порядка т, т. е. /1 и \2 яв- являются однородными функциями порядка т (т>1), так что / (Хх) =Хт/(х). Легко видеть [6], что л: = 0 является особой точкой основной си- системы. Предположим, что Ц(х) + Ц(х) > 0 и, следовательно, на- начало координат является изолированной особой точкой. Если возмущающая система имеет вид
Достижимые зоны для автондмных систем Ш то, используя тот факт, что F.9) однородна, и полагая Х2 ==: получим Х2 :— Х\ 12 V ' 1/' Тогда полная система примет вид и, как в примере A), единственно возможными границами не- покидаемых зон являются прямые F.8). Если к = 0, то Х2 _{^2_ ___ „ Х 1* и форма Р имеет вид В дальнейшем мы исключаем случай |а1 = |а2 = 0. Из предыдущих теорем и следствий непосредственно вытекает следующая тео- теорема. Теорема 6.1. Для полной системы = 1\ (Хг, х2) + (о.10) (О с однородными функциями /4 м /г порядка пг прямая 2 ~ 1*1 является границей непокидаемой зоны, если т четно. Если в F.8) кфО, анализ также совсем прост. Полагая / М*1 1 ^~" *^1 •• *^2» 2 — для системы F.10), получим выражение (записывая снова Хи вместо х[ и х0 ^1 = ^1 1^1» Х2) (о.11)
182 Э. Роксин, В. Спинадел и возмущающая система имеет решениями прямые л:1 = сопз1. Для того чтобы одна из них была границей непокидаемой зоны, необходимо выполне- выполнение условия, что Р=-81(хи х2) . F.12) не меняет знака вдоль л:1 = сопз1. В силу однородности системы выражение. F.12) можно записать в виде и, следовательно, имеем: Теорема 6.2. Вертикальные прямые являются границами непокидаемых зон для системы F.11), если ^1 A, \х) не меняет знака при — сю < \х < + сю. 7. ОГРАНИЧЕННЫЙ ВОЗМУЩАЮЩИЙ ВЕкТОР МЕНЬШЕЙ РАЗМЕРНОСТИ Предыдущие разделы были посвящены случаю, когда воз- возмущения имели компоненты в виде аг@фг(#), где а* @ —про- —произвольные функции. Практически мало случаев, когда возму- возмущение может иметь неограниченную величину, так что рассмо- рассмотренные случаи описывают только идеализированную систему. В этом разделе будут рассматриваться дополнительные ограни- ограничения Целесообразно также рассмотреть условие <*<(*) >0. В первом случае мы будем говорить об ограниченных возмуще- возмущениях, а во втором — об ориентированных. Ориентированные возмущения. Рассмотрим уравнение х=!(х) +а^)^(х) + ... +ар(/)фр(х), G.1) где /, ф1,..., фР — заданные векторные функции и а»(/) огра- ограничены условиями а.(/)>0, /=1, 2, ..., р. G.2) Уравнение G.1) заменим уравнением G-3)
Достижимые зоны для автономных систем 183 которое будем называть основным уравнением (как и в преды- предыдущих разделах), и уравнениями G-4) которые будем называть р элементарными возмущающими уравнениями. В некоторой точке х0 уравнения G.3) и G.4) оп- определяют р+1 векторов, являющихся ребрами выпуклого ко- конуса, поперечное сечение которого есть многоугольник. Этот ко- конус обладает тем свойством, что всякое направление внутри него соответствует возможному направлению вектора х урав- уравнения G.1). Ребра и боковые грани не соответствуют возмож- возможным векторам х (они соответствуют некоторым а* —►оо), за исключением направления Цх). Очевидно, в некоторой окрест- окрестности Цо точки х0 достижимая из х0 зона содержится «в первом приближении» внутри этого конуса. Это означает, что границей достижимой зоны является некоторая поверхность с вершиной в #о, касательная к конусу в этой точке. Отсюда не следует, что точки {/о, внешние по отношению к конусу, недостижимы из #0, поскольку могут существовать траектории, начинающиеся в х0 и возвращающиеся обратно в Цо после того, как они пройдут через внешние точки Цо. Если существует функция и(х), обладающая тем свойством, что кривая хAI определяемая уравнением G.4), удовлетво- удовлетворяет соотношению и(хA)) =соп51, то это, как было отмечено в разд. 4, упрощает исследование, и мы называем этот случай голономным. Под «полным голономным случаем» мы понимаем тот, когда каждая парциальная система G.3) и G.4) является голоном- ной, т. е. определено некоторое многообразие размерности, рав- равной числу уравнений. Это многообразие содержит все инте- интегральные траектории. В этом случае непокидаемые зоны опре- определяются топологическим отношением между этими многооб- многообразиями. Примеры легко построить, рассматривая в я-мерном про- пространстве п семейств поверхностей Мг(#)=соп51 (/=1, 2, ...,я), не касающихся друг друга. Каждые п — 1 из них пересекаются по кривой, и можно выбрать п семейств кривых, являющихся решениями уравнений G.3) и G.4). Таким образом, если мы предпишем этим кривым подходящую ориентацию, то достижи- достижимая из точки х0 зона будет определяться п соотношениями щ(х)>щ(х0) (/==1, 2, ..., п).
184 Э. Роксин, В. Спинадел Ограниченные возмущения. Рассмотрим теперь уравнение G.1), когда агA) подчинены условию |а*|<&{ (/=1, 2, ..., р). G.5) Задача отыскания всех возможных траекторий при вариациях аг(г) может быть сведена к предыдущему случаю. Действитель- Действительно, в общем случае (когда векторы линейно независимы) во всякой фиксированной точке возможные направления векторов, определяемые G.1) и G.5), заполняют (р-Н) -мерный конус с многоугольником в поперечном сечении, ребрами которого являются векторы -ф*=/(лО±&1ф!(лО± ... ±&рфр(х); '=1, 2, ..., 9, где ц — 2^. Направления внутри конуса являются их линейной комбинацией г|I + р2г|J+ ... +№д G.6) при (Зг ^ 0. Для боковой поверхности конуса выражение G.6) дает нам только вектор г^, поскольку другие направления по- получаются при (Зг—*°°, т. е. являются квазидостижимыми, что эквивалентно замене G.5) на |<М01<*<. G.7) Очевидно, что внутренняя часть непокидаемой зоны одна и та же как в случае, когда граничные точки достижимы, так и в случае, когда они квазидостижимы. Связь с дифференциальными уравнениями первого порядка в частных производных. Как объяснялось выше, как в случае ориентированного, так и в случае ограниченного возмущения в произвольной точке х0 векторы х, касательные к возможным траекториям, заполняют внутренность некоторого выпуклого конуса (этот конус может иметь меньшую размерность, чем все пространство). Любая возможная граница непокидаемой зоны является, конечно, внешней по отношению к конусам точек этой зоны. В предельном случае важно (для отыскания дости- достижимой зоны) определить поверхности, касающиеся этих кону- конусов в каждой своей точке. Но это, как хорошо известно, в гео- геометрическом смысле как раз и есть интегрирование дифферен- дифференциальных уравнений первого порядка в частных производных. Эти конусы называются «конусами Монжа» и обычно задаются в форме Это соотношение связывает (в каждой точке) производные ди/дхи которые определяют конус как огибающую касательных плоскостей. В нашем случае этот конус вообще будет неаиали-
Достижимые зоны для автономных систем 185 тическим и соответствующее уравнение в частных производных очень сложно. Двумерные системы. Теперь мы приложим результаты, по- полученные в разд. 5 и 6, к случаю направленных возмущений для двумерных систем. Здесь легко получить некоторые общие результаты и построить в простых случаях различные возмож- возможные достижимые зоны. Теорема 7.1. Пусть ./? — простая связная область, в кото- которой основная и пертурбационная кривые пересекаются под уг- углом одного и того же знака. Тогда кривая у, образованная точ- точкой Р, соответствующей положительной полутраекторией основ- основной системы и положительной полупертурбатрисой пересекаема траекториями системы G.1) при условии G.2) только в одном направлении. Доказательство. Очевидно, существует гомеоморфное отображение /? на некоторую область К', при котором основ- основная и пертурбационная кривые становятся прямыми линиями = сопз1, л:2 = соп51 в прямолинейной системе координат. Теорема 7.2. Пусть С — ориентированная кривая, разде- разделяющая плоскость на две области, касательный вектор к кото- которой непрерывен во всех ее точках, за исключением не более чем конечного числа точек. При условии, что задана система G.1) с ограничениями G.2), пусть р— угол между вектором, каса- касательным к С, и вектором, касательным к основной кривой, а у — угол между вектором, касательным к С, и элементарным возмущающим вектором. Для того чтобы С была непересекаема слева направо всеми траекториями G.1) при ограничениях G.2), необходимо и достаточно, чтобы во всякой неугловой точке С имело место 0 -^ р -^ я, 0 -^ у ^ я. Доказательство. Доказательство базируется на тео- теореме 5.6 и последующих теоремах, примененных к обоим век- векторным полям (/ь/г) и (ф1, ф2). Замечание. В точках, где / = ф = 0, кривая С непересекаема «по существу», ибо эти точки являются вырожденными траек- траекториями. В угловых точках С необходимо рассматривать пове- поведение траекторий в бесконечно близких точках. Соответствующие теоремы для ограниченного возмущения [уравнение G.1) при условиях G.5)] получаются непосред- непосредственно, если рассмотреть кривые решений системы х), х = / (х) — &р (х).
186 Э. Роксан, В. Спинадел Приведем несколько примеров достижимых зон на плоско- плоскости при ограниченном однопараметрическом возмущении. Они подобраны так, чтобы показать различные характерные случаи; много других простых случаев можно исследовать таким же путем. В этих примерах аи Ь\ постоянны, а а(г)—произволь- а(г)—произвольная возмущающая функция. Пример 7.1. Рассмотрим систему = ахх х2 = ах2 + Ь2а где «Предельными случаями» G.8) здесь являются ахг — = ал;1-|-01#, ( хг- —— ах2 I 02К/у V ^2 —• сьх2 Обе системы линейны и имеют решениями прямые линии, сходящиеся в узлы, координаты которых являются соответ- соответственно х2 хг Ьок 11 а а а В каждой точке Р плоскости возможные направления х за- заключены между прямыми, проведенными через Р и соответ- соответственно точки А1 и Л2. Таким образом, при а>0 достижимая из точки Р зона есть внешний угол (рис. 13, а). При а<0 дости- достижимая зона есть треугольник РА{А2 (рис. 13,6). В обоих слу- случаях, как легко видеть, прямая А^Аг непересекаема в обоих на- направлениях. Пример 7.2. Рассмотрим систему где «1<а2<0 и 5С&. Предельные случаи G.8) есть хг = агхг Х2 II Х\ —— &\Х\ Х% "—^" ^2 2
Достижимые зоны для автономных систем 187 Их решениями являются конгруэнтные параболы, сходящиеся в узлах А^ и Л2, координаты которых Х,\ ■ кЬ1 Для построения достижимой зоны из некоторой точки Р наи- наиболее подходит интуитивный метод, состоящий в проведении из точки Р на плоскости х\Хг двух траекторий, соответствующих Рис. 13. системам I и II. Далее рассматриваем некоторые точки траекто- траектории, скажем системы I, и проводим из них траектории, соот- соответствующие системе II, и т. д. Таким путем мы быстро полу- получим в определенном смысле достижимые точки. При этом по- построении важно иметь в виду, что в точках прямой А{А2 реше- решения обеих систем касаются друг друга, так что угол между кривыми обоих типов меняет знак. (Это можно легко дока- доказать.) Процедура заканчивается, когда мы находим кривую достижимых или квазидостижимых из Р точек, состоящую из дуг решений одной системы, пересекаемую решениями другой системы только в одном направлении. Эти факты легко прове- проверяются в случаях, представленных на рис. 14—17, где показаны достижимые из точек Р, (^, /?, 5 зоны различных типов.
Рис. 14. Рис. 1$.
Рис. 16. Рис. 17,
*-Хл Рис. 18. Рис. 19.
Достижимые зоны для автономных систем 191 Пример 7.3. Рассмотрим систему Ь2а где а4>0, |а@1"С^. Поступаем, как и в предыдущих приме- примерах. Система при а=0 имеет в начале координат неустойчивый фокус, и «предельными случаями» являются хг = ах (хг ± к[) + а2 (х2 ± к'2\ *2 = ~ <*2 (*1 ± К) + п1 (Х2 ± К где к[ и к'2 удовлетворяют соотношениям — а2к\ -\-ахк'2 = Ь2к. Решениями являются спирали с центрами в Аг (х( = — в А2 (хг = -\-к'^ соответственно, касающиеся друг друга в точках прямой, проходящей через А^ и А2. Легко видеть, что существует некоторый овал (рис. 18), образованный дугами двух спиралей с центрами в Л4 и в Л2; из точек типа Р, лежа- лежащих внутри этого овала, достижима вся плоскость, а для точек типа 0 вне овала достижимая зона показана на рис. 19. (За- (Заметим, что если достижима некоторая окрестность одной из то- точек Аи А2, то достижима вся плоскость.) Л ИТЕРАТУРА 1. Запзопе С, С о п И К., Е^иа2^оп^ ОШегегшаП поп Упеап, Соп81д1ю Ыагюпак Aа11е ШсегсЬе, Коте, МоподгаПе Ма1етаИсЬе, Уо1. 3, 1956. 2. ВеПтап К., ОПскзЬеге !•» Огозз О., Оп Ше Ьапд-Ьапд соп!го1 ргоЫет, О.иаг1. Арр1. МагН., 14 A956), 1. 3. Н о х 1 п Е., 5 р 1 п а с1 е 1 V., ЗоЬге ип ргоЫета с1е соп!го1 с1е з1з1етаз с1е есиас1опез с11Гегепс1а1е5 Ппеа1ез, %еу. ипюп таг. аг§., 18 A958), 4. 4. Ь е И з с Ь е 1 г 5., О1ГГегепиа1 Е^иа^^опз, Оеоте1г1с ТЬеогу, Ые^ Уогк, 1957. (Русский перевод: Л е ф ш е ц С, Геометрическая теория дифферен- дифференциальных уравнений, ИЛ, М., 1961.) 5. Маззега Л., Соп1пЬи1юпз 1о з1аЫ1Ну Шеогу, Апп. Магк., 64 A956), 182—206. (Русский перевод: Массе р а X. Л., К теории устойчивости, сб. Математика, 1 :4 A957), 81—104.)
Математическая лингвистика
Алгебраическая теория контекстно-свободных языков1) И. X оме кий, М. П. Шютценберже 1. ЛИНГВИСТИЧЕСКОЕ ОБОСНОВАНИЕ В предлагаемой работе мы рассмотрим несколько типов устройств для порождения предложений, тесно связанных с раз- различными грамматиками естественных и искусственных языков различных типов. Под языком мы будем понимать просто мно- множество цепочек, состоящих из символов, принадлежащих неко- некоторому конечному множеству V, называемому словарем языка; под грамматикой — множество правил, которые рекурсивно перечисляют цепочки, принадлежащие языку. Мы будем гово- говорить, что грамматика порождает эти цепочки. (В применении к естественным языкам порожденные цепочки называются пред- предложениями; в алгебре их обычно называют словами, а сло- словарь— алфавитом-, когда речь идет о грамматике для языка программирования, цепочки называют программами; мы же, как правило, будем пользоваться нейтральным термином це- цепочки.) Если некоторый класс грамматик представляет лингвистиче- лингвистический интерес, то должна существовать процедура, приписываю- приписывающая каждой паре (б, С), где б — цепочка, а С — грамматика этого класса, удовлетворительное структурное описание цепоч- цепочки б в данной грамматике С. В частности, структурное описа- описание должно указывать, что цепочка б является правильно по- построенным предложением языка Ь{С)У порождаемого О. Если цепочка построена правильно, структурное описание должно также содержать грамматическую информацию, позволяющую объяснить, как б понимается носителем языка, пользующимся грамматикой С; в противном случае структурное описание !) СНотзку N.. ЗсЫНгепЪег&ег М. Р., ТЬе а1деЬга1с Шеогу оГ соп1ех1-1тее 1агщиа^е5, Сотри1ег ргодгатгтгщ апс! Гогта1 зузктз, Атз1ег- с1ат, 1963, р. 118. Эта работа частично финансировалась управлением войск связи Армии США, научно-исследовательским управлением Военно-воздушных сил, науч- научно-исследовательским управлением Военно-морского флота, а также Нацио- Национальным научным фондом и Государственным фондом. 13* За к 243
196 Н. Комский, М. /7. Шютценберже должно показывать, в какой степени б отклоняется от правил построения предложения. Мы будем рассматривать только один аспект структурного описания предложения, а именно то, как выполняется подраз- подразделение предложения на словосочетания (фразы), принадле- принадлежащие к различным категориям. Так, например, структурное описание английского предложения "йюзе 1огп Ьоокз аге сотр1е!е1у \уог1Ыезз" должно указывать, что гНозе — это де- детерминатив, гогп и шоггЫезз — прилагательные, Ьоокз — суще- существительное, сопгрШе1у — наречие, Нгозе (от Ъоокз — группа существительного, сопгрШе1у хюоггЫезз — группа прилагатель- прилагательного, аге сотрШе1у хюог1Мезз — группа глагола, вся цепочка -— предложение, и т. д. Эта информация может быть представле- представлена графически: — Пр.- г Г р. сущ.-— .-—Г р. глагола I Дет. Прил. Сущ. аге ■.—Гр. прил.—-. A) III I I V у у у у 1Ьозе 1огп Ьоокз Нар. Прил. сотр1еге1у или, что то же самое, с помощью скобок: [Пр.[Гр. сущ. [Дет. хЬозе] [Прил. 1огп] [Сущ. Ьоокз]] [Гр. глаг. аге [Гр. прил. [Нар. сотр1е1е1у][/7/шл. шог1Ыезз]]]]. B) Основной задачей общей теории естественных языков является определение: класса возможных цепочек (установле- (установлением универсального фонетического алфавита); класса возмож- возможных грамматик; класса возможных структурных описаний; про- процедуры приписывания предложениям структурных описаний, если дана грамматика. При этом определение должно быть та- таким, чтобы структурное описание, приписанное предложению грамматикой естественного языка, давало возможность объяс- объяснить, как говорящий на этом языке понимает данное предло- предложение (без ограничений на память, внимание и т. д.). Тогда грамматика будет отражать некоторые стороны понимания языка его носителем. Здесь нас не интересует эмпирическая проверка адекватно- адекватности структурных описаний или грамматик, которые мы будем исследовать. В действительности классы грамматик, которые мы будем рассматривать, и типы структурных описаний, кото-
Алгебраическая теория контекстно-свободных языков 197 рые они порождают, конечно, слишком узки, чтобы судить о том, как на самом деле люди понимают язык. Тем не менее рассматриваемые нами системы (формализующие традицион- традиционные понятия грамматического разбора и анализа по непосред- непосредственным составляющим) некоторым образом связаны с систе- системами, которые, по-видимому, адекватны, но в настоящее время слишком сложны для формального изучения 1). В представлении B) имеются, кроме скобок, две категории обозначений: 1) символы порождаемых цепочек (т. е. шесть символов Нгозе, гогп, Ъоокз, аге, сотрШе1у, шоггЫезз) 2); 2) символы Пр., Г р. сущ., Дет., Прил., Сущ., Г р. глаг., Г р. прил., Нар., представляющие категории словосочетаний. Символы типа A) будем называть терминальными-, символы типа B) — нетерминальными. Далее, мы будем допускать, что грамматики всех рассмат- рассматриваемых языков строятся с помощью фиксированного запаса терминальных и нетерминальных символов. Можно рассматри- рассматривать множество терминальных символов как потенциальный общий словарь для всех языков. Для устного языка мы можем считать, что множество терминальных символов задается с по- помощью некоторого универсального фонетического алфавита (предполагая, конечно, что длины морфем ограничены свер- сверху) 2). В применении к естественным языкам мы можем рас- рассматривать фиксированное множество нетерминальных симво- символов как универсальное множество категорий, из которых выво- выводятся типы словосочетаний (фраз) всех языков. Важным и традиционным вопросом общей лингвистики является вопрос о возможности дать конкретную интерпрета- интерпретацию нетерминальным символам, образующим категории, в тер- терминах которых строятся грамматики, — другими словами, во- вопрос о том, можно ли найти общее определение, не зависящее от конкретного языка, для таких категорий, как Существитель- Существительное, Глагол и т. д., в терминах их семантического содержания или формальных свойств грамматик. Проблема конкретной ин- интерпретации множества терминальных и нетерминальных сим- 1) Более подробно см. работу [10]. 2) В лингвистически адекватной грамматике следовало бы порождать не эти символы, а скорее более абстрактное представление предложения с ис- использованием символов Иге, указат. местоимение, мн. число, геаг, причастие, Ьоок, мн. число, Ъе, мн. число, сотр\е1е, 1у, шогНг, 1е88 (в указанном поряд- порядке). Представление в терминах этих символов (называемых морфемами) мо- может быть преобразовано в фонетическое представление с помощью фоноло- фонологических правил, которые здесь не рассматриваются (см. Хомский и Мил- Миллер [15]). Мы будем использовать предложения реального языка, типа B), только для иллюстративных примеров и поэтому не будем заботиться о по- подобных тонкостях.
198 Н. Хомский, М. П. Шютценберже волов является, как и проблема эмпирической проверки аде- адекватности некоторых категорий грамматик, ключевым пунктом науки о языке, но она выходит за рамки данной работы. Мы можем породить предложение 'ЧЬозе 1огп Ьоокз аге сотр1е1е1у \уог1Ыезз" со структурным описанием B) с по- помощью множества правил подстановки: Пр. —» Г р. сущ. Гр. глаг. Гр. сущ. —> Дет. Прил. Сущ. Дет. -* 1Ьозе Прил. —► 1огп Прил. -* \уог1Ыез5 C) Сущ. —» Ьоокз Гр. глаг. —» аге Гр. прил. Гр. прил. —> Нар. Прил. Нар. —> сотр1е!е1у и вывода, который строится следующим способом: сначала пи- пишем начальный символ Пр., который будет первой строкой вы- вывода; (п+1)-ю строку вывода образуем следующим образом: выбираем произвольное вхождение нетерминального символа а в п-ю строку (где а не является пометкой при скобке) и заме- заменяем это вхождение цепочкой [аф], где а—>ф— одно из пра- правил C). Процесс продолжается до тех пор, пока из нетерми- нетерминальных символов останутся лишь те, которые помечают скоб- скобки. Тогда вывод будет закончен. Вычеркивая из законченного вывода скобки с их пометками, мы получим цепочку, состоящую только- из терминальных символов. Назовем такую цепочку терминальной. Грамматика C) порождает четыре различные терминальные цепочки. Чтобы построить грамматику, поро- порождающую бесконечное множество терминальных цепочек, ка- каждую со структурным описанием, нужно ввести рекурсию — например, добавить к C) правила: Гр. сущ. —>Ша1 /7/7. Гр. глаг. —> 15 Гр. прил. D) Гр. прил. —> оЬуюиз. При этом мы можем, например, породить цепочку Ьа1 1Ьозе 1огп Ьоокз аге сотр1е1е1у шог!Ыезз 15 оЬуюиз" и т. д. 1) 1) В этом случае можно породить бесконечное множество цепочек, не являющихся предложениями английского языка, например «1На1 1Но5е 1огп Ьоокз 15 оЪуюиз аге сотр1е!е1у у/ог1Ые55» и т. д. Следовательно, грамматика [C), D)] неприемлема. Трудность избежать эмпирической неадекватности та- такого рода часто недооценивается. Еще раз подчеркнем, чго это ключевой во- вопрос как для лингвистики, так и для психологии. Однако мы здесь этим заниматься не будем. По этому поводу см. Хомский [13]
Алгебраическая теория контекстно-свободных языков 199 Каждое порождаемое предложение будет иметь структурное описание подходящего вида. Грамматики типа [C), D)] мы будем называть контекстно- свободными (кс) грамматиками1). Они характеризуются тем свойством, что в левой части любого правила стоит лишь один нетерминальный символ. Если это ограничение ослабить, можно получить системы с совершенно другими формальными свой- свойствами. Создается впечатление, что грамматика естественного языка должна содержать по крайней мере несколько правил подстановки этого более общего вида и несколько правил, ко- которые вообще не являются правилами подстановки. Абстракт- Абстрактное рассмотрение систем такого рода, которыми мы здесь за- заниматься не будем, имеется в работах: Хомский [8], [10] и [12]; Хомский и Миллер [15]. Множество терминальных цепочек, ко- которые могут быть порождены некоторой /сограмматикой, будем называть кс-языком. Кс-грамматика может породить терминальную (освобожден- (освобожденную от скобок) цепочку ф с несколькими разными структур- структурными описаниями. Если грамматика эмпирически адекватна, такая цепочка ф будет структурно неоднозначной. Рассмотрим, например, /сс-грамматику с правилами: Пр. —♦ Гр. сущ. Гр. глаг. Гр. сущ. —►Шеу; Гр. сущ. -+Прил. Сущ.\ Гр. сущ. -> Сущ. ' Гр. глаг. —> аге Гр. сущ.\ Гр. глаг. —► Глаг. Гр. сущ. Глаг. -> аге И Прил. —► Пут§ Сущ. —>р1апез Эта грамматика может породить как F), так и G). [Пр.[Гр. сущ. Шеу] [Гр. глаг.[Глаг. аге Пут§] [Гр. сущ.[Сущ. р1апез]]]]. F) [Пр.[Гр. сущ. Шеу] [Гр. глаг. аге [Гр. сущ. [Прил. Пут§] [Сущ. р1апез]]]]. G) Соответственно терминальная цепочка ,,Шеу аге Иут§ р1апези структурно неоднозначна; она может значить: "ту 1пепс15, ^Ьо аге рПо15, аге Иут§ р1апез", или "Шозе 5ро1з оп Ше Ьотоп аге Иут§ р1апез". Изучение структурной неоднозначности — один из наиболее поучительных путей определения эмпириче- эмпирической адекватности грамматик. *) Соответствующий английский термин «соп!ех1-!гее дгаттаг Aапдиа- д)» в других работах был переведен как бесконтекстная грамматика (язык). См. Кибернетический сборник, № 2, 1966. — Прим. ред..
200 Н. Хомский, М. П Шютценберже Мы увидим ниже, что имеются /соязыки, которые являются существенно неоднозначными в том смысле, что каждая кс- грамматика, которая их порождает, обязательно приписывает некоторым предложениям различные структурные описания. Более того, мы увидим, что проблема распознавания по данной /сс-грамматике, является ли она неоднозначной, рекурсивно не- неразрешима х) даже для предельно простых типов /сс-грамматик. Хотя /сс-грамматики далеко недостаточны для естественных языков, они, несомненно, адекватны для описания многих ис- искусственных языков, в том числе для описания некоторых, а возможно, и всех языков программирования. В частности, может быть построена /сс-грамматика для АЛГОЛа [18], при этом каждая программа в АЛГОЛе будет одной из терминаль- терминальных цепочек, порождаемых этой грамматикой. Очевидно, что язык программирования должен быть однозначным. Поэтому для конкретного языка программирования важно определить, удовлетворяет ли он этому условию или, по крайней мере, мо- может ли каждое конкретное бесконечное множество программ быть однозначным, если задан некоторый метод для его по- построения (например, метод, представимый с помощью правил /сс-грамматики). Как было отмечено в предыдущем абзаце, мо- может оказаться довольно трудным ответить на этот вопрос. Предположим, что О{ и С2 — порождающие системы, кото- которые определяют некоторый метод для построения программ для ЦВМ; допустим, что это грамматики, порождающие языки программирования Ь\ и Ь2, каждый из которых состоит из бес- бесконечного числа цепочек (каждая цепочка — возможная про- программа). Часто бывает интересно исследовать относительную силу языков программирования. Мы увидим, что если О{ и С2 есть /сс-грамматики (как, например, в случае АЛГОЛа), то большинство проблем, касающихся взаимоотношения между Ь{ и Ь2, рекурсивно неразрешимо. В частности, не решен вопрос о том, будет ли пусто или бесконечно пересечение Ь\ и Ь2, ины- иными словами, содержится ли Ъ{ в Ь2 или существует ли конеч- конечный преобразователь («компилятор»), отображающий 1^{ на Ь2 (Гинзбург и Роуз, личные сообщения). Таким образом, воз- возможно, что общие вопросы, касающиеся формальных свойств /сосистем и формальных отношений между ними, могут иметь конкретную интерпретацию при изучении языков вычислитель- вычислительных машин, а также при изучении естественных языков. На эту ]) Другими словами, не существует механического процесса (алгоритма), позволяющего для произвольной /сс-грамматики определить, приписывает ли она некоторый порождаемый ею цепочке более одного структурного описа- описания.
Алгебраическая теория контекстно-свободных языков 201 возможность указывали, в частности, Гинзбург и Раис [18], Гинзбург и Роуз [19]. Рассматривая грамматику как порождающее устройство, мы можем интересоваться языком (т. е. множеством терминальных цепочек), который она порождает, или множеством порождае- порождаемых ею структурных описаний [N.13.: каждое структурное опи- описание однозначно определяет терминальную цепочку, как в B)]. Ясно, что последний вопрос более интересен. Аналогично при изучении порождающей способности класса грамматик (или относительной мощности нескольких таких классов, как бывает при сопоставлении различных лингвистических теорий) нас мо- может интересовать либо множество языков, либо множество структурных описаний, которые эти грамматики могут поро- порождать. Последний вопрос опять-таки более интересен, но и бо- более сложен. Исследование таких вопросов началось, вообще говоря, совсем недавно, причем внимание было сосредоточено почти исключительно на порождении языков, а не систем струк- структурных описаний. Мы будем рассматривать порождение как не- нечто среднее между порождением языка и системы структурных описаний, а именно мы будем рассматривать представление языка не в виде множества цепочек и не в виде множества структурных описаний, а в виде множества пар (а, м), где а — цепочка, а п — степень неоднозначности, т. е. число различ- различных структурных описаний, приписанных цепочке а граммати- грамматикой О, порождающей язык, которому принадлежит а. 2. ГРАММАТИКИ КАК ГЕНЕРАТОРЫ ФОРМАЛЬНЫХ СТЕПЕННЫХ РЯДОВ 2.1. Пусть дан конечный словарь У, разбитый на две части: Ут (терминальный словарь) и 1/# (нетерминальный словарь). Мы будем рассматривать языки над словарем Ут и грамма- грамматики, нетерминальные символы которых берутся из 1/#. Пусть Р(Ут)—свободная полугруппа, порожденная множеством Ут, т. е. множество всех цепочек в словаре Ут. Тогда каждый язык есть подмножество множества Р(Ут)- Рассмотрим отображение г, которое ставит в соответствие каждой цепочке }аР(Ут) некоторое целое число (г,/). Такое отображение может быть представлено в виде формального степенного ряда (обозначим его тоже через г) в некоммутатив- некоммутативных переменных х из Ут- Таким образом, (8) •■■
202 Н. Хомский, М. П. Шютценберже где /1, /2, • • • — пересчет всех цепочек в Ут. Мы определим опор- опорное множество ряда г, обозначаемое 5ир (г) как множество цепочек, коэффициенты которых в г отличны от 0. Таким об- образом, ^ (9) Мы не требуем, чтобы коэффициенты (/\/*) формального степенного ряда г были положительными. Если для каждого /, (г, 1г) <^ 0» т0 мы будем говорить, что г — положительный фор- формальный степенной ряд. Если же для каждой \г^.Р(Ут) коэффициент (г, /г-) равен 0 или 1, мы будем называть г характеристическим формальным степенным рядом своего опорного множества. 2.2. Если г — формальный степенной ряд и я — целое число, будем определять произведение пг как формальный степенной ряд с коэффициентами (пг, [) = п(г, /), где (г,/)—коэффи- (г,/)—коэффициент / в ряде г. Если г и г' -- формальные степенные ряды, определим г + г' как формальный степенной ряд с коэффициен- коэффициентами (г + г', /) = (г, /) + (г7, /), где (г, I) и (г', /)—соответ- /)—соответственно коэффициенты / в г и в г'. Определим гт' как формаль- формальный степенной ряд с коэффициентами {гг\ /) =2(г,/г)(^,^), где 14]—/• Таким образом, множество формальных степенных рядов образует кольцо, замкнутое относительно операций умножения на число, сложения и умножения. Заметим, что если г и г' — положительные формальные сте- степенные ряды, *то опорное множество ряда г + г7 будет равно объединению опорных множеств рядов г и г7, а опорное множе- множество ряда гт' — прямому произведению опорных множеств ря- рядов гиг7 (т. е. множеству всех цепочек \\\^ таких, что ]\ принадлежит опорному множеству ряда г, а /^ — опорному мно- множеству ряда г7). Ниже мы рассмотрим интерпретацию некото- некоторых других простых теоретико-множественных операций. Будем называть два формальных степенных ряда гиг7 эк- эквивалентными по модулю степени п (г=гг(той с1е§ м)), если (г, /) = (г7, () для каждой цепочки / длины («степени») ^ п. Предположим, что имеется бесконечная последовательность формальных степенных рядов г\, г2, . .., такая, что для ка- каждого п и для каждого п'>п, гп> = гп (той с!е§ п). В таком слу- случае предел последовательности ги г2у ... вполне определяется равенством г= Нш л/л, A0) /2-»ОО где для каждого п выражение лпГп есть полином, образован- образованный из гп заменой на нули всех коэффициентов при цепочках
Алгебраическая теория контекстно-свободных языков 203 длины больше п. Тогда кольцо формальных степенных рядов становится ультраметрическим, а следовательно, топологиче- топологическим кольцом. Сформулировав эти определения, мы можем обратиться к проблеме взаимоотношения между представлением языков в терминах формальных степенных рядов и представлением языков с помощью порождающих процессов (таких, как кс- грамматики). 2.3. Предположим, что С—процесс, порождающий язык Ь(С). Каждой цепочке !^.Р(УТ) приписывается некоторое чис- число N@,1) структурных описаний в С; N@, /) >0 в точности в том случае, когда 1^Ь(О). N@, /) выражает степень струк- структурной неоднозначности / по отношению к грамматике О. Есте- Естественно ассоциировать с О формальный степенной ряд г (С), такой, что {г(О), ^)=N(С, /), где {г(С), /) —коэффициент при цепочке / в г(О). Таким образом, г(О) выражает неоднознач- неоднозначность всех терминальных цепочек по отношению к грамма- грамматике С. Коэффициент (г(С), /) равен нулю в точности в том случае, когда } не порождается грамматикой С, и единице, если / порождается однозначно (одним и только одним способом) грамматикой С; он равен двум в точности в случае, когда имеются два различных структурных описания для / в грамма- грамматике О, и т. д. Ряд г (О), ассоциируемый с грамматикой С, разумеется, всегда положителен, и его опорное множество 5ир (г(О)) есть не что иное, как язык Ь(С), порождаемый грамматикой С. Мы можем далее считать, что формальный степенной ряд г, имею- имеющий как положительные, так и отрицательные коэффициенты, ассоциируется с двумя порождающими процессами О{ и О2. Коэффициент (г, /) цепочки / в г можно при этом рассматри- рассматривать как разность между числами способов, которыми / поро- порождается в О{ и в С2, т. е. (г, |)=N(Ои I) —N@2, }). Предположим, что О есть /сс-грамматика с нетерминаль- нетерминальными символами ссь ... , ап, где а\ есть отмеченный начальный символ [в примере A) Пр. ^а^. Мы можем построить фор- формальный степенной ряд г (О), ассоциируемый с С прямой ите- итеративной процедурой. Сделаем это следующим образом. Во-первых, О может быть записана как система уравнений от переменных аи ..., ап. Пусть фг, ь ..., фг, т.— цепочки та- такие, что аг—>фг, $ A 4/4^) суть правила грамматики С. Сопоставим переменной а* полиномиальное выражение аг-, , 1 + фг, 2+ . . . +(рг,тг A1)
204 Н. Хомский, М. П. Шютценберже Тогда грамматике ставится в соответствие множество урав- уравнений . • •, ад = ап. A2) Предположим, что грамматика О не содержит правил типа1) Щ -> (X/. A3) Ясно, что эги предположения не изхменяют порождающей способности [2]. Это означает, что для каждой /сс-грамматики, содержащей такие правила, существует другая грамматика без таких правил, которая порождает тот же язык. С настоящего момента мы будем также требовать, чтобы, какова бы ни была /сс-грамматика С, для любого ее нетерминального символа а существовала терминальная цепочка, выводимая из а; это озна- означает, другими словами, что если рассмотреть грамматику С, содержащую правила С и а как начальный символ, то язык, порождаемый С'( Ь (С))у должен быть не пустым. Это требо- требование также, очевидно, не влияет на порождающую способ- способность. Возвращаясь теперь к проблеме построения степенных ря- рядов, ассоциируемых с грамматикой О и представляющих сте- степень неоднозначности, которую О приписывает каждой цепочке, заметим, что мы можем рассматривать каждое уравнение щ = = О{ из A2) как определение отображения %, которое перево- переводит п-ку степенных рядов (г4, ..., гп) в степенной ряд, полу- полученный заменой а$ в а* на г,-. Это можно делать ввиду свойств замкнутости кольца степенных рядов, указанных в разд. 2.2. Таким образом, множество уравнений A2) определяет ото- отображение г|), где г'1 = ^1(гГ ..., гп). A4) Рассмотрим теперь бесконечную последовательность п-ок степенных рядов р0, рь .. ., где = (го,1' •••> го, п) — @, •••> 0), Р1 =(/Р1,1» • • •> ^1, л)> Р2==(Г2, 1' * * > Г2, п) !) Здесь е — пустая цепочка. — Прим. перев.
Алгебраическая теория контекстно-свободных языков 205 и где для любых /, / (/>0) -1, Ь • ••» 0-1, п) A6) и 0 означает степенной ряд, у которого все коэффициенты есть нули. Каждый ряд т^\ в A5) имеет только конечное число не- ненулевых коэффициентов, другими словами, г^г- — полином. Бо- Более того, можно показать, что для любых /, /, /', таких, что /'>/>(), 1 4/<п, имеет место A7) Следовательно, как замечено в разд. 2.2, предел г», ^ беско- бесконечной последовательности ги г-, г2, *, • • • вполне определен для каждого I (вообще говоря, он, конечно, не является полино- полиномом). Назовем м-ку (Л», ь ..., г», п), определенную таким об- образом, решением системы уравнений A2). В самом деле, м-ка (л», ь ..., Гоо, п) — единственная м-ка, удовлетворяющая си- системе уравнений A2). Поэтому мы будем говорить, что степен- степенной ряд является алгебраическим [42], если он входит в #-ку, являющуюся решением некоторой системы уравнений вида A2), без ограничений на знаки коэффициентов. Назовем сте- степенной ряд контекстно-свободным, если все коэффициенты в определяющих уравнениях положительны. В частности, ряд г», ь который мы будем называть степен- степенным рядом, порождаемым грамматикой О [определяющей си: стему (Ц2) и имеющей в качестве начального символа а^ есть степенной ряд, ассоциируемый с грамматикой О, как это опи- описано в начале разд. 2.3. Опорное множество ряда Гоо, 1 есть язык Ь{0), порождаемый грамматикой О, и коэффициент (^с»,ь /) при цепочке /б/7(Ут) определяет неоднозначность / по отношению к О (способом, описанным выше). Заметим, что если алгебраический степенной ряд является контекстно-свободным, то он положителен, но обратное не все- всегда верно — степенной ряд может быть членом решения си- системы уравнений и иметь только положительные коэффициенты, но в то же время может не быть членом решения никакой си- системы уравнений, имеющих только положительные коэффи- коэффициенты *). 1) Например, мы здесь используем понятия, которые будут определены ниже, в разд. 3.1. Адамаровский квадрат 5 О 5, для 5 ^ Яо, имеет только по- положительные коэффициенты (и имеет то же самое опорное множество, что и 5), но не порождается, вообще говоря, системой уравнений с положитель* ными коэффициентами.
20б И. Хомский, М. П. ШютценберЖе 2.4. В качестве примеров описанного выше процесса рассмо- рассмотрим две грамматики A8) и A9): 5-* 655; 5->а, A8) 5—565; 5-*а. A9) Каждая из этих грамматик имеет единственный нетерминаль- нетерминальный символ, а, следовательно, соответствующая ей система урав- уравнений будет состоять из одного уравнения. Грамматике A8) со- соответствует уравнение B0), а грамматике A9) уравнение B1): B0) B1) Уравнения B0) и B1) соответствуют системе A2) (см. выше) с п=1; как B0), так и B1) удовлетворяют условию A3). Рассмотрим сначала грамматику A8), представленную в форме B0). Действуя, как в предыдущем разделе, мы будем считать, что B0) определяет отображение г|), такое, что г^(г) = = а + Ьгг, где г — степенной ряд. Затем [аналогично A5)] по- построим бесконечную последовательность ро, рь рг, ... следую- следующим образом: Ро = го — = гг = а 4- Ьг$г0 = а-\- ЬОО — а, = г2 = а -)- Ьгхгх = а + Ьаа, р3 = г3 = а-\- Ьг2г2 = а-\-Ь(а-\- Ьаа)(а + Ьаа) = B2) = а + Ьаа 4- ЬаЬаа + ЬЬааа + ЬЬааЬаа, р4 = гА = а Очевидно, что для любых /, /', таких, что /г>/>0, будет иметь место г^г) (хпоА &Щ]). Следовательно, предел л» вполне определен. Этот степенной ряд есть решение уравнения B0) и его опорное множество является языком, порожденным кс- грамматикой A8). Заметим, что степенной ряд л» является ха- характеристическим и его опорное множество есть множество правильно построенных формул «исчисления импликаций» с од- одной переменной в бесскобочной (польской) системе обозначе- обозначений. (Здесь а есть пропозициональная переменная, аЪ — опера- оператор импликации.) Теперь рассмотрим грамматику A9), представленную в фор- форме B1). B1) определяет отображение гр, такое, что гМО = гЬг, где г — степенной ряд. Построим теперь бесконечную
Алгебраическая теория контекстно-свободных языков 207 последовательность р0, рь р2, ... : Ро о 0» р1 = г1 = а + а-06г0 == а + 060 = а, р2 == г2 — а 4- г16г1 =а-\- аЬа, Рз = 'з = я + г2йг2 = а + (я + аба) 6 (а = а + ##а + 2аЬаЬа + аЬаЪаЪа, Р4 = Г4 = я + /Вз*/Рз = я + аба -(- о. (аЬJ а B3) 5 (аб)з а + 6 (абL а + 6 (абM а + 4 (а*N а ■+ (а*O а. **•••••• • • ••• Для любых у и у7, таких, что / > у > 0, имеет место г,= ^(тойс!еду) и предел г^ определяется как степенной ряд л - 5 (абK а + 14 (аЬL а -+ 42 (а*M а + ..., B4) где 2л /г 2п X 2^ — 1 X ... X я + 1 1 Х2Х ... Хп Степенной ряд Гоо [из B4)] есть решение уравнения B1); его опорное множество — язык, порождаемый грамматикой A9). Здесь ряд не является характеристическим. Если рассматривать символ а как пропозициональную переменную, а Ь — как знак для оператора импликации, то грамматика A9) представляет собой множество правил для порождения правильно построен- построенных формул исчисления импликаций с одной переменной в обыч- обычной системе обозначения, но с опущенными скобками. Струк- Структурные описания, порождаемые грамматикой A9) (как описано в разд. 1), являются, конечно, однозначными, пока сохраняются скобки, но терминальные цепочки, полученные отбрасыванием скобок, будут неоднозначными и степень неоднозначности для каждой порожденной цепочки есть не что иное, как ее коэф- коэффициент в ряде Те»; так, аЬаЬа может интерпретироваться или как (аЬ(аЬа)), или как ((аЬа)Ьа) и т. д. Более общий случай был рассмотрен Ранеем [38] с помощью формулы обращения Лагранжа. В уравнениях B0) и B1) все коэффициенты положительны и решение, следовательно, является положительным степенным рядом. Рассмотрим теперь систему, состоящую из одного ураз-
208 Н. Хомский, М. П. Шютценберже нения 5 = а — 8Ь8. B5) Тогда получается последовательность Ро = /о = °> =а~~ г0Ьг0 = а — ОЬО = а, р2 = г2 = а — г^а*! = а — р3 = г3 = а — г2Ьг2 = а — (а — ада) Ь(а — аЬа) = B6) = а — аЬа -[- 2аЬаЬа — аЬаЬаЬа. Коэффициенты р* в B6) совпадают с точностью до знаков с коэффициентами ряда р* в B3), причем коэффициенты ряда р* при цепочке / в B6) положительны, если / содержит четное число вхождений Ь. Степенной ряд л», являющийся решением системы B5), не является положительным, а следовательно, и контекстно-сво- контекстно-свободным [хотя его опорное множество и является контекстно- свободным языком, причем A9) может быть рассмотрена как одна из его грамматик]. Однако мы можем рассматривать Гоо как разность между двумя контекстно-свободными рядами г^ и г^ и соответственно его опорное множество рассматри- рассматривать как множество цепочек, которые не порождаются одина- одинаковое число раз парой /сограмматик О+ и О~, порождающих соответственно/"^ и г^. Предположим, что 5 = 5+ — 5", так что B5) можно записать как — 5~)Ь(8+— 5") = = а — E+&5+ — 3+Ь5~ — 5~Ь5+ + 3~ЬЗ~) = = а + 3+Ь8~ + 3~ЬЗ+ — 5+Ь5+ — 5~Ь5~. B7) Рассмотрим теперь систему уравнений B8) A) 5+ = а +~ ~+ - + + - - B8) A1) 5 5+65++5 Ь8 ; Система B8) является системой положительных уравнений с двумя переменными 5+ и 5~. Эта система будет иметь реше- решением пару (г + , г^), где г^ есть предел последовательности
Алгебраическая теория контекстно-свободных языков 209 г+, г + , ..., а г^ — предел последовательности г~, г~, ... из B9): B9) Ясно, что если Гоо есть решение системы B5), то г^ = г^— — г^. Но, более того, г^ — это степенной ряд, порожденный грамматикой С+ и начальным символом 5+ [этой грамматике соответствует уравнение A) из B8)]; г^ — это степенной ряд, порожденный грамматикой С~ и начальным символом 5~ [этой грамматике соответствует уравнение (п) из B8)]. Подобным образом каждый алгебраический степенной ряд может быть представлен (бесконечным числом способов) в виде разности двух контекстно-свободных степенных рядов, и его опорное множество можно рассматривать, следовательно, как множество цепочек, которые не порождаются одинаковое чис- число раз двумя /сограмматиками. Рассуждения в общем слу- случае настолько сходны с приведенными, что мы можем перейти к конкретной интерпретации общего понятия алгебраического степенного ряда. Ту же конструкцию можно было бы применить к произволь- произвольному кольцу коэффициентов вместо кольца натуральных чисел, использованного выше. Это еще не исследованная область. На- Например, если брать коэффициенты по простому модулю р (т. е. если рассматривать как «непорождаемые» те цепочки, число случаев порождения которых кратно р), то формальный степен- г с единственным терминальным символом г яв- п >0 ляется алгебраическим [27], хотя его опорное множество не мо- может быть опорным множеством никакого степенного ряда рас- рассмотренного выше типа. 3. ДРУГИЕ ОПЕРАЦИИ НАД ФОРМАЛЬНЫМИ СТЕПЕННЫМИ РЯДАМИ 3.1. В разд. 2.2 мы заметили, что множество степенных ря- рядов замкнуто относительно операций сложения, умножения и умножения на целое число. Мы указали также, что опорное множество ряда г + г' есть объединение опорных множеств ря- рядов г и г7 и что опорное множество ряда тг' есть произведение опорных множеств г и г', при условии, что коэффициенты не- неотрицательны. Теперь мы рассмотрим две другие операции, от- относительно которых множество степенных рядов замкнуто, и
210 Н. Хомский, М. П. Шютценберже рассмотрим соответствующую теоретико-множественную интер- интерпретацию для опорных множеств. Будем, как обычно делается, называть ряд квазирегулярным, если < г, е > =0. Тогда гп' ==0(тос1 йе^/г) для 0 < п < п' и элемент г*=Нт 2 гП' вполне определен. Более того, я-»оо 0 < п' < п ряд г* удовлетворяет тождеству =г\ C0) которое определяет его однозначно. При этом ряд г* обычно называется квазиобратным для г. Это понятие непосредственно связано с более известным понятием обратного элемента. Имен- Именно если г' = е — г и г" = е + г*, то г'г"= (е— г) (е + г*) =е— г-\- + г* — гг*=е = г"г', иными словами, г// = г/~1. Обратно, если дан ряд г' такой, что < г', е>=1, то можно его записать как г'=*е— г, где г — квазирегулярный, и тогда е + г* есть ряд, об- обратный для г'. Заметим, что из определения ряда г* следует, что он имеет неотрицательные коэффициенты, если этим свойством обладает ряд г, и что справедливо равенство 5ир г*= Eир г)*, где звез- звездочка в правой части равенства означает операцию итерации Клини [21]. В частности, если V — произвольное множество букв и сте- степенной ряд V определен следующими условиями: <у, х> =1, если хб V, и <у, х> =0, если х^Уу иными словами, если и явдяется характеристической функцией V, то е+У* (в смысле Клини) есть множество всех слов, порожденных элементами V, а е + V*=(е — у) есть характеристическая функция этого множества. Это следует из того, что каждое слово /6 V* встре- встречается один и только один раз в бесконечной сумме вида 2 Vй. Следовательно, если мы знаем характеристическую п >0 функцию г множества цепочек, то мы можем также написать характеристическую функцию A — Ут)~1 — г его дополнения. Стоит заметить, что в этом случае последний ряд имеет не- неотрицательные коэффициенты и, хотя он алгебраический в опи- описанном выше смысле, он не обязательно является контекстно- свободным. Вторая операция, которую мы определим, — это адамаров- ское произведение. Таким образом, мы обобщим еще одно по- понятие классического анализа. Определение, которое мы дадим, отличается от принятых в литературе обобщений на случай не- нескольких переменных, но нам оно кажется более естественным для случая некоммутативных степенных рядов.
Алгебраическая теория контекстно-свободных языков 211 Если г и г' — степенные ряды, то их адамаровским произ- произведением будет степенной ряд г О г7 с коэффициентами (гОг',Г> = <г.Г>{г'.1) C1) для всех цепочек /. Следовательно, 5ир (г©/*') = Eир г) П ПEирг'), и если г и г' — характеристические функции, то г © г' — тоже характеристическая функция. Наконец, уведем следующее обозначение: имея цепочку хьХ12 ... хь Хг =/ (XI ^У), определим / (зеркальный об- образ /) как цепочку . C2) Ясно, что / = / и что равенство ///==/// влечет равенство = Г/« С формальной точки зрения это отображение является инволютивным антиавтоморфизмом кольца степенных рядов. Можно показать, что оно однозначно определяется этим свой- свойством (с точностью до перестановки элементов из V). 3.2. Только что введенные обозначения будут в дальнейшем применяться для упрощения описания грамматик следующим образом. Предположим, что грамматика О содержит следующие правила: + + я3, где щ — полиномиальное выражение над V — {а!}. Тогда вто- второе правило влечет а2 = ( 2 я») C4) \п>0 ) и правила C3) могут быть заменены более простыми прави- правилами й1 = я1A — я^Яд + Яз. C5) Этой упрощенной форме описания можно дать лингвистиче- лингвистическую интерпретацию. Так, например, мы можем считать, что пара правил вида а\ —►/10:2/2 и аг — СС2СС2 [эту пару теперь можно представить в форме Щ~>[\A—а2) /2] является фактически схемой правил: «1->/1а27/:2 (п = \, 2, ...). При такой реинтер- претации грамматика (хотя схема правил определяет ее фи- финитно) имеет бесконечное число правил. Теперь вспомним ме- метод, с помощью которого терминальной цепочке, порождаемой кс-грамматикой, приписывалось структурное описание (с поме- помеченными скобками, см. выше разд. 1). Грамматика, определен- определенная данной выше схемой правил, может порождать структур- 14*
212 Н. Хомский, М. П. Шютценберже ное описание вида • • • [«1/1 Кл] [ад?] • • • \а2Рп] /2] • • • C6) для любого /г, где каждое рь выводимо из ссг. В предложении (терминальной цепочке) с таким структурным описанием ка- каждое рь есть словосочетание типа а2 (ри получается стиранием •скобок в ръ). Словосочетания ри...урп образуют «сочинитель- «сочинительную конструкцию», которая, рассматриваемая вместе с цепоч- цепочками, образованными в конечном счете из /1 и /2, является кон- конструкцией типа ссь Это естественный способ расширить /сограм- матики с тем, чтобы они могли описывать сочинительные кон- конструкции (например, цепочка прилагательных произвольной длины, не несущая внутренней структуры, может встречаться в позиции именной части сказуемого (см. Хомский [10])). 3.3. Попытаемся связать то, что мы до сих пор делали, с классическим анализом. Будем писать ф/=фГ для любых двух цепочек / и /', если они содержат одинаковое число вхождений каждого символа (терминального или нет). Ясно, что ф распространяется до отображения наших не- некоммутативных степенных рядов на кольцо произвольных (ком- (коммутативных) формальных степенных рядов с целыми коэффи- коэффициентами. Легко видеть, что ф — гомоморфизм. Например, если а = а-\-Ьаа, то фа = фа + ф&фафа, а фа — обыкновенный степен- степенной ряд с переменными фа и ф (если а' = а + а'Ьа', то фа' Более того, из способа, которым были получены наши сте- степенные ряды, можно было бы вывести, что коэффициенты ряда растут не быстрее, чем экспоненциальная функция степени (дли- (длина) цепочек. Так, образ ф любого из наших степенных рядов есть конечный сходящийся ряд Тейлора, являющийся разло- разложением некоторой алгебраической функции. Обратно, если даны (обычные) переменные #4,..., хп, то (обычная) алгебраическая функция от п переменных у опре- определена полиномом, зависящим от у и хи и в случае, если у до- допускает разложение в ряд Тейлора (с целыми коэффициентами) в окружности нуля, мы можем ассоциировать с ней бесконечно много формальных степенных рядов |3, таких, что ф|3 = г/ и |3 оп- определяется формальными уравнениями. Например, исходя из алгебраической функции от аргументов а и Ь, определенной уравнением у2Ь — у + а = 0у мы получим два вышеприведенных примера, а также формальный степенной ряд — ал, C8)
Алгебраическая теория контекстно-свободных языков 213 где л есть произвольный полином от а и Ь. Положим, напри- например, п = Ь. Тогда = а C9) и т. д. 3.4. В заключение укажем на некоторые связи между на- нашими рассмотрениями и линдоновскои теорией уравнений в сво- свободной группе (Линдон, 1960). Пусть {хг} A<л-<п) есть тер- терминальный словарь, | есть нетерминальный символ, и пусть до есть произведение членов вида 1—хи A—л:*)» 1—1> A—I). Положим с1е§(до)=й+— й_, где A+ и й- — соответ- соответственное число сомножителей в 1 —| и A —|)~! в до. Так, на- например, для до=A — х2) A —XI) A — |) A — хг)~1A — Ы X X A —*2)-1 имеем с1е§(до) = 1 — 1 =0. Как хорошо известно, элементы 1—х\ порождают (по ум- умножению) свободную группу О. Равенство до=1 можно рассма- рассматривать как уравнение с неизвестным |. В нашей терминологии решением уравнения до=1 будет степенной ряд ^0 от перемен- переменных Х\\ причем до = 1 тождественно, если в до вместо \ подста- подставить ^0; ^о будет групповым решением, если, кроме того, 1 —1о^6, т. е. если 1 —10 само может быть представлено как произведение членов A—Х{)±1. Линдон получил следующий замечательный результат: совокупность групповых решений мо- может быть получена алгоритмически. Этот вопрос частично связан с замечаниями, сделанными в разд. 2.3. Введем новые символы ^г-A <л <С я), т] и уравнения !г=**+&**; #=12 + &п. A) так что A — хг-)-1 = 1+^ и A — Б)в 1+Е + 62 + Бл- Подставляя эти выражения в уравнение до = 1 и упрощая его, получим равенство , B) где р' есть полином от переменных хи ?г, Ц, не содержащий чле- членов степени ниже 2. Следовательно, если с1е§(до)=^0, то система A), B) имеет одно и только одно решение в степенных рядах (то, что коэф- коэффициенты могут быть здесь не целыми, а рациональными чис- числами, не влияет на доказательство, приведенное в разд. 2.3); поскольку групповые решения образуют подмножество множе- множества решений в степенных рядах, мы непосредственно убеж-
214 Н. Хомский, М. П. Шютценберже даемся, что если с1е§ (ту)ФО, то уравнение в свободной группе ш=»1 имеет самое большее одно решение. Если же &е§(гю)=0 (как, например, для уравнения о>= A — 5) A — Х{) A — ^)A —лгг-) = 1), то наш подход не по- позволяет вообще ничего сказать о решении уравнения до=1. Например, уравнение A — х/) A — |) A — **)еA — ^)~1 = 1 не имеет решений, если гф — 1, и имеет бесконечно много груп- по.вых решений, если е= — 1, а именно 1 — |= A — Хг)±п (м>0). Действительно, тогда уравнение эквивалентным обра- образом может быть записано в виде 'Е>Х1 = х1'Е>. Решениями этого уравнения в нашем смысле являются все степенные ряды от переменного х^ Конечно, случай с1е§(ш)=0 имеет место именно тогда, когда неизвестное 1 — & исчезает при взятии коммутативного образа (см. разд. 3.3). Этот случай нетривиален с точки зрения теории групп. 4. ТИПЫ /ГС-ГРАММАТИК И СВОЙСТВА ПОРОЖДАЕМЫХ ИМИ ЯЗЫКОВ 4.1. Мы можем определить несколько особо интересных ка- категорий /сс-грамматик, накладывая условия на входящие в них правила. В дальнейшем будем употреблять буквы а, |3,... для обозначения нетерминальных символов, буквы /, §у ... для тер- терминальных цепочек (возможно пустых) и ф, г|э — для произволь- произвольных цепочек. Напомним, что мы исключили правила вида а-+е и а —> |3, причем это не влияет на порождающую способность грамматик. Мы будем описывать /сс-грамматики в терминах правил или уравнений, смотря по тому, как нам будет удобнее. Если грамматика О не содержит нетерминального символа а, из которого можно вывести как цепочку /7, так и цепочку /а^ то терминальный язык Ь(О)У порождаемый грамматикой О, бу- будет конечным. В этом случае грамматика О будет называться полиномиальной грамматикой. Рассмотрим теперь грамматиче- грамматические правила следующих видов: 1) а->/"р (правостороннее), 2) а-^р/ (левостороннее), 3) а->/в§- (линейное), ^ ' 4) а->/ (заключительное). Грамматика, содержащая только правосторонние и заклю- заключительные правила или только левосторонние и заключитель- заключительные, будет называться односторонней линейной грамматикой.
Алгебраическая теория контекстно-свободных языков 215 Грамматика, содержащая только правила типа D0), будет называться линейной. Предположим, что грамматика О содер- содержит правила только типа D0) и правила типа с&1 —>ср, где С&1 — начальный символ грамматики О, и что, кроме того, она не содержит правил вида |3 —► фа^. Тогда определяющее урав- уравнение для с&1 есть а1 = яь где щ — полином, не содержащий а\. Такая грамматика будет называться металинейной. Если грамматика О (т. е. система уравнений с положитель- положительными коэффициентами) является полиномиальной, односторон- односторонней линейной, линейной, металинейной или контекстно-свобод- контекстно-свободной, будем называть степенной ряд г, являющийся главным чле- членом ее решения (т. е. тот ряд, который она порождает, в смысле, определенном в разд. 2.3), и языки 5ир р соответствен- соответственно полиномиальными, односторонними линейными, линейными, металинейными или контекстно-свободными. Эти семейства сте- степенных рядов будут обозначаться соответственно^4" Л?о ^ , и для каждого семейства <5Г семейство опорных множеств будет обозначаться 5ир {<&*). Заметим, что Зир (<^+) есть семейство конечных множеств, а ЗирС^о")—семейство регулярных событий Клини [21] (см. Хомский [7]). Заметим, что класс регулярных событий замкнут относительно отражения. Рассмотрим некоторые элементарные свойства этих семейств языков. Очевидно, прежде всего, что 5ир(^+) с 5ир(^0+) с $ир(^+) <= 5ир(^) с= 5ир(#+). D1) Более того, в каждом из этих случаев включение является собственным. Таким образом, мы имеем Свойство 1. 8ир {<Р+) % 5ир (^0+) % 5ир (^+) % 5ир (^) % 5ир Простейшим примером языка, принадлежащего 5ир(«5?ч), но не 5ир (-З'о), является множество всех цепочек вида {апЪап} (а, Ь^Ут). Оно порождается грамматикой вида а = ааа + Ь. Легко показать, что этот язык не является регуляр- регулярным событием. Произведение языков из 5ир(«57+) всегда при- принадлежит 8ир(«2:7т)» но не обязательно принадлежит р( Язык Ь1С из нашего примера A8), имеющий грамматику а = а + Ьаа D2) и представляющий собой множество правильно построенных формул исчисления импликаций с одной свободной переменной
216 Н. Хомский, М. П. Шютценберже в польской системе обозначения, принадлежит 5ир(^+), но не 5ир(е5:7т)- Это следует из того, что язык Ь1С содержит все це- цепочки вида тттт тт D3) для каждого к^ 1, тг->- 1. Но каждая цепочка языка Ь1С со- содержит п вхождений Ъ и п+1 вхождение а для некоторого п% 1. Следовательно, для фиксированного целого числа к, для того чтобы породить все цепочки вида D3), нужно иметь воз- возможность вывести из начального символа грамматики Ь1С це- цепочку ф, содержащую к вхождений нетерминальных символов. Следовательно, эта грамматика не может быть металинейной. Для содержательной интерпретации теории /сс-грамматик особое значение имеет отношение между 5ир(^+) и 5ир(«57о)» потому что конечное устройство, включающее в себя некоторую /сограмматику О, порождающую язык ^@), может анализиро- анализировать предложение только из фиксированного подмножества /?^5ир {^о) языка 1@) € Зир (<^+) (при фиксированных до- дополнительных средствах). Это отношение может быть точно описано в терминах некоторых формальных черт структурных описаний (с помеченными скобками), порождаемых /сс-грамма- тиками (см. разд. 1). Будем говорить, что грамматика С есть грамматика с самовставлением, если она порождает некоторое структурное описание вида ... [аф [аф] х] • • •, D4) где ф и х содержат терминальные символы, а \|) есть выражение с правильно расставленными скобками. Тогда имеет место сле- следующий результат. Теорема 1а. Ь^Л^о тогда и только тогда, когда каждая кс-грамматика, порождающая Ь, есть грамматика с самовстав- самовставлением (Хомский [9]). Этот результат может быть обобщен следующим образом. Определим степень самовставления структурного описания п как наибольшее N. такое, что п содержит подконфигурацию [аф1[аф2[а ... [аф^+^Ф^+г] • . • ]ф2^+1], где каждое фг- содержит тер- терминальные символы. Тогда существует одно-однозначное эффек- эффективное отображение Ф множества пар {(С, п) : О /сограмма- тика, п > 1} во множество односторонних линейных грамматик и одно-однозначное эффективное отображение 4х множества А структурных описаний в себя, такие, что они описываются сле- следующей теоремой.
Алгебраическая теория контекстно-свободных языков 217 Теорема 16. Для каждого Ь^8ир(дг+) существует кс- грамматика О, порождающая Ь, такая, что для каждого N Ф(С, Ы) порождает цепочку I со структурным описанием В тогда и только тогда, когда О порождает терминальную це- цепочку I со структурным описанием 4я (I)), где ^(й) имеет сте- степень самовставления ^Ы (Хомский [8]). Таким образом, мы можем интуитивно, имея О, построить конечное устройство Ф(С, Л/'), которое будет распознавать структуру цепочки /, порождаемой грамматикой С, в точности тогда, когда степень самовставления данного структурного опи- описания / не превышает N. Отсюда вытекают некоторые содер- содержательные следствия (см. Хомский [10], Миллер и Хомский [29]). 4.2. Рассмотрим некоторые свойства замкнутости данных се- семейств языков. Семействам степенных рядов, определенных выше, может быть дана следующая алгебраическая характеристика. <&*+ есть полукольцо 1). Л^о —наименьшее полукольцо, содержащее <^+ и замкнутое относительно квазиобращения квазирегулярных элементов. Л^+ есть модуль, а Л?т есть наименьшее полукольцо, его содержащее. Полное множество 0* есть полукольцо, замк- замкнутое относительно квазиобращения квазирегулярных элемен- элементов. Соответственно мы имеем следующие свойства опорных мно- множеств: 5ир(<^) замкнуто относительно теоретико-множествен- теоретико-множественного объединения и прямого умножения; 5ир(»??о^) есть наи- наименьшее множество, содержащее конечные множества и замк- замкнутое относительно теоретико-множественного объединения, прямого умножения и итерации, описанной в разд. 3.1 [21]; 5ир (аЗ?+) замкнуто относительно теоретико-множественного объединения, но не прямого умножения; 5ир(»2:7те) есть наи- наименьшее множество, содержащее множества из 5ир(»??+) и замкнутое относительно прямого умножения (введение Х было обусловлено, конечно, не этими соображениями); 5ирEг замкнуто относительно объединения произведения и итерации. Эти свойства очевидны; естественно возникает вопрос о замк- ) Понятие полукольца обобщает понятие кольца таким образом, что в качестве его аддитивной структуры допускается полугруппа (не обязатель- обязательно группа). Пример полукольца — так называемое «булевское кольцо» с двумя эле- элементами 0 и 1 и правилами = 00 = 01
218 И. Хомский, М. П. Шютценберже нутости относительно других элементарных операций над мно- множествами, а именно пересечения и дополнения. Очевидно, что Зир(сР + ) замкнуто относительно пересечения; хорошо известно, что класс 8ир(„2г?оК) регулярных событий замк- замкнут относительно пересечения и дополнения. Для остальных множеств имеем следующие результаты. Множество 5ир((^г") всех /сс-языков не замкнуто относительно пересечения и, следовательно (так как оно замкнуто относи- относительно объединения), не замкнуто относительно дополнения [40], [2]. Пример, приведенный в обеих работах, представляет собой пару металинейных языков1), пересечение которых не является /соязыком. Следовательно, 8ир(«5?^) тоже не замкнуто отно- относительно пересечения и дополнения. Этот результат может быть распространен на линейные грамматики и даже (для пересече- пересечения) на линейную грамматику с одним нетерминальным сим- символом. Чтобы показать это, рассмотрим грамматики О1 и С2, опре- определенные соответственно следующими выражениями: а = ааас 4- Ьас -\- Ьс, D5) а == аасс + ааЬ + аЬ. D6) и О2 суть линейные грамматики с одним нетерминальным символом, но пересечение языков, которые они порождают, — это множество цепочек вида {а2пЬпа2п}, которое не является /сс-языком. Этот пример вместе с тем фактом, что эти семейства замкнуты относительно объединения, доказывает следующее свойство. Свойство 2. Семейства 5ир(в5?+), Зир(в5?^), ЗирEг+) не замкнуты относительно пересечения и дополнения; пересечение двух множеств, принадлежащих одному из этих семейств, мо- может не принадлежать 5ир(^+), даже если множества порож- порождаются грамматикой с одним нетерминальным символом. Вероятно, дополнение к языку из 5ир(«5?+) или из 5ир может не быть /сс-языком. Однако мы не располагаем приме- примерами, чтобы доказать это2). 1) В действительности эти языки линейные. — Прим. ред. 2) Справедливость этого предположения доказывается хотя бы следую- следующим примером. Пусть язык ^ состоит из всевозможных цепочек вида А\А2ЬА и АфА\А2, где А\А2 — произвольные цепочки в алфавите {аь а2) и Ах ФI. Язык /., как легко видеть хотя бы с помощью критерия из [2], не является /сс-языком. Дополнение к I до множества всех цепочек в алфавите {аи а2,Ь] можно представить в виде V [) Ь", где V — множество цепочек, не представимых в виде АЬА, где А и А' — цепочки в алфавите {аи а2] длины, не меньшей 2, и Ь"—множество цепочек, представимых в таком виде, но
Алгебраическая теория контекстно-свободных языков 219 Из рассмотренных классов языков только класс регулярных событий (и класс конечных множеств) замкнут относительно пересечения. Однако пересечение регулярного события и /сс-язы- ка является /соязыком [2]. Имеет место также более сильный результат, который обобщает одну хорошо известную теорему классического анализа, принадлежащую Юнгену [20]. Теорема 2. Допустим, что г\^Ьо. Пусть 1!+ — одно из семейств еР+, Ьо, Ь +, Ьт, 3Л.Пусть г^г2 — адамаровское про- произведение рядов ги г2 {см. разд. 3.1). Тогда Г!©г261/+ для ка- каждого г2€ 1/+. Кроме того, если г2, г3^1о, то г2(-)г3€:1о (Шют- ценберже [46]). Отсюда следует, что пересечение языка из 5ир(^+) с ре- регулярным событием содержится ^в 5ир(^+) для каждого 1/+. Доказательство этого факта, который связан с более простым результатом, касающимся замкнутости относительно конечного преобразования, будет намечено ниже, в § 8. 4.3. Категория линейных грамматик представляет, как мы увидим, особый интерес. Сделаем несколько предварительных замечаний, относящихся к ней. Заметим, что если Ь— язык, порождаемый линейной грамматикой, то можно найти словарь У, не пересекающийся с Ут% два гомоморфных отображения а, а' полугруппы Р(У) в Р(УТ), регулярное событие 7? над У и конечное множество СаР(Ут) такие, что Ь состоит в точ- ности из цепочек } = а(§)са (§), где &а#} § — зеркальный об« раз §, а сб С. Таким образом, конечный процесс, применяемый к системе цепочек (или пару согласованных конечных процес- не входящих в Ь. Ь\ очевидно, может быть порожден односторонней линей- линейной кс-грамматикой. В то же время Ь", как легко проверить, порождается грамматикой со следующей системой уравнения: а1а2 а3 — а1а3а1 а4 = а,а4 а5 = (где а,—начальный символ). Более сильный результат получен в работе: Н а 1 п е 8 Ь. Н., Ыо1е оп 1Ье сотр1етеп! о\ а (пишта1) Ипеаг 1апдиа^е, Щогт. апй Соп1го1, 7, A964), 307. Там показано, что даже минимальная линейная /сс-грамматика может порождать язык, дополнение к которому не является /сс-языком. — Прим. ред.
220 Н. Хомский, М. П. Шютценберже сов), можно, вообще говоря, связать с линейной грамматикой и изучать соответственным способом. Эквивалентным образом можно охарактеризовать линейный язык несколько иначе. Пусть У' = У+II У~ (У+ = {о{^. 0<л-<п}, У~={ог : — п^/<<—1}). Если /6 Р(У+), определим / как ре- результат подстановки V-^ вместо всех вхождений VI в /. Тогда линейный язык Ь определяется выбором гомоморфного отобра- отображения |3 полугруппы Р(У') в Р(Ут) регулярным событием /? над У+ и конечным множеством СаР(Уг). Теперь ^ — множе- множество цепочек |3(/") с |3(/), где /€/?, с^С. Ниже мы будем поль- пользоваться этой характеристикой. Мы можем определить специальные классы линейных язы- языков, налагая дальнейшие условия на регулярное событие /?, ото- отображения а, а' и класс С. В частности, ниже мы будем рассма- рассматривать случай, когда /? — просто свободная полугруппа (ре- (регулярное событие, определяемое автоматом с одним состоянием) и где С содержит такие с^УТу что а^фцс^фа' (}). Грамма- Грамматику, определенную такими условиями, назовем минимальной линейной грамматикой. Минимальная линейная грамматика содержит один нетерми- нетерминальный символ 5 и одно заключительное правило 5 —> с и не содержит незаключительного правила 5—>фсг|). Таким образом, каждая цепочка языка, порождаемая этой грамматикой, имеет «центральную пометку» с. Это простейшее множество языков (в рамках наших рассмотрений), более богатое, чем класс ре- регулярных событий; мы увидим, что эти языки значительно от- отличаются от регулярных событий многими формальными свой- свойствами. Для дальнейших ссылок мы приведем сейчас один частный результат, относящийся к минимальным грамматикам. Возьмем у\ УТ = Ф[}{с}(сф]№), а и а', как и выше. Пусть О — мини- минимальная линейная грамматика, определенная посредством а, а7 и порождающая язык Ь{0). Тогда грамматика О имеет опреде- определяющее уравнение D7) где а, а7 — отображения полугруппы Р(У) в Тогда имеем следующую теорему. Теорема 3. Если а — мономорфизм (изоморфизм в), то дополнение Р(Ут) \ 1^@) языка Ь(О) по отношению к Р(УТ) порождается однозначной линейной грамматикой. Доказательство. Пусть Л = а(У/), Р(А) =аР(У), и пусть для произвольного множества РаР(№) Р+ = {1^Р : }фе).
Алгебраическая теория контекстно-свободных языков 221 Очевидно, существует разбиение Р(УТ) \ ^@) =1*1} ^', та- такое, что [}Р(Ут)сР(Ут)сР(Ут)> но V — регулярное событие. Поэтому достаточно показать, что язык I порождается однозначной линейной грамматикой. Поскольку а — мономорфизм, то существует изоморфизм а :Р(А) ->Р(]/'). Распространим а' на Р+(А), определив а'а = = а'(аа) для а€Р+(А). Предположим, что ас^^Ь. Тогда а^Р+(А), {'€Р(№) и у фа'а. По определению имеются три взаимно исключающие возможности для ас/': A) а'аеГ+(ЮГ' D9) A11) ^ = ^«2^3 и /' = кчюцга'пг (где аг, а D91) в случае, если /"' содержит а'а как собственный пра- правый множитель; D911) в случае, если а!а содержит У как собственный пра- правый множитель; D9111) в случае, если а'а и /' имеют цепочку ^а!а^ наиболь- наибольшим общим правым множителем. Эти три случая исключают друг друга и исчерпывают все возможности. Мы получаем разбиение на три подмножества Ьи /.2 и /.з, состоящие из цепочек, удовлетворяющих условиям A) — A11) соответственно. Сейчас мы должны показать, что ка- каждый из языков порождается однозначной линейной граммати- грамматикой. _ Для языков /.1 и /.2 этот факт очевиден. Пусть А=2{а : а^А} и РГ = 2{йУ: до 6 №}. Тогда язык /.1 порождается грамматикой E0), а язык /.2 — грамматикой E1) (см. разд. 3.2). = 2 {а$а'а : а$ А] +с(\ — Щ'\ E0) = 2 {а$а'а : а $ А] + A - Л) с. E1) Рассмотрим язык Ь3. Для каждого а 6 А обозначим через В (а) множество всех цепочек до§(до6^, ё/7(^)), таких, что а'а (: Р+(V?) § и аа^Р{Щт§. Ясно, что В (а) есть всегда ко-
222 Н. Хомский, М. П. Шютценберже нечное множество, так как длина § меньше длины а'а. Язык может быть порожден однозначной линейной грамматикой, уравнения которой имеют вид ' E2) Это проверяется непосредственно. Но мы задаем Р(УТ)\Ь(О) как объединение четырех попарно непересекающихся множеств Ьи Ь2у Ьз и ^/, каждое из которых порождается однозначной ли- линейной грамматикой. Следовательно, Р(УТ) \ ^(О) также поро- порождается однозначной линейной грамматикой, что и требовалось доказать. Заметим, что если бы в качестве а мы взяли не мономор- мономорфизм, а «конечное преобразование без потери информации» [43], то мы могли бы получить результат, отличающийся от теоремы 3 только тем, что строящаяся в доказательстве линейная грам- грамматика была бы не однозначной, а имела бы ограниченную не- неоднозначность. 4.4. Мы рассмотрели несколько подсемейств класса /сс-грам- матик, определяемых структурными свойствами составляющих их правил. Возможны и другие принципы классификации. Так, возможно, имеет смысл выделение класса грамматик (языков) со звездочкой, характеризуемого следующим образом: О есть грамматика со звездочкой, если каждому нетерминальному сим- символу щ грамматики О поставлено в соответствие множество нетерминальных символов и три терминальные цепочки /г I'., причем О содержит все правила вида ^.->!"., с^->/^./Ца ^Е^, а. ->айаДа., ак, а^Х^. Это в известном смысле наиболее «бесструктурные» /сс-грамматики. Такие языки интересны тем, что уравнения, определяющие соответствующие степенные ряды, можно записать, используя существенным образом только квази- квазиобращение и сложение (как было замечено в разд. 3.2). Заметим, в частности, что не металинейный язык Ью, определенный урав- уравнением D2), является языком со звездочкой. В разд. 3.2 была предложена лингвистическая интерпретация для понятия «языка со звездочкой». Можно было бы также классифицировать /сс-языки по числу нетерминальных символов минимальной грамматики, опреде- определяющей степенной ряд (язык). Однако навряд ли какие-либо интересные свойства языка связаны с этим параметром, мало зависящим от структурных черт грамматики (за исключением специального случая языков, определяемых грамматиками с единственным нетерминальным символом), потому что для по- полугрупп, в отличие от групп, грубые числовые параметры не
Алгебраическая теория контекстно-свободных языков 223 связаны сколько-нибудь интересным образом с их (полугрупп) структурой. Заметим, впрочем, что для каждого N можно по- построить регулярное событие, которое не может быть порождено /сс-грамматикой, имеющей меньше чем N нетерминальных сим- символов. Еще один принцип классификации может быть получен из рассмотрения зависимостей между частями грамматик. Назо- Назовем кограмматику неприводимой, если ни одна собственная подсистема системы ее определяющих уравнений не образует кограмматику (напомним, что терминальные цепочки должны быть выводимы из каждого неначального нетерминального сим- символа кс-грамматики), в противном случае грамматику будем называть приводимой. Если кс-грамматика приводима в этом смысле, то должны существовать собственное подмножество 21 множества ее правил и собственное подмножество 22 множе- множества ее нетерминальных символов, такие, что в тех местах вы- вывода, где появляются символы из Ег, могут применяться только правила из Еь Один предельный случай приводимости был изучен Гинзбур- Гинзбургом и Райсом [18]. Следуя им, назовем кс-грамматику О после- последовательной, если существует такое упорядочение ее нетерми- нетерминальных символов аь . .., ап (где а\ есть начальный символ), что не существует правил вида аг-—*сра/ф, где ]<1. Решение последовательностной грамматики особенно легко определить итеративной процедурой последовательного исключения пере- переменных, описанной в разд. 2.3. Для семейства о?+ последовательностных грамматик и се- семейства 5ир(с^+) их опорных множеств Гинзбург и Райе полу- получили следующие результаты, параллельные указанным выше. Во-первых, ясно, что <^+, как и <*7 + , — полукольцо, замкнутое относительно квазиобращения квазирегулярных элементов. Со- Соответственно 5ир(<^+) замкнуто относительно объединения, ум- умножения и итерации. Отсюда и из того факта, что ^+с^+, следует, что ЗирС^о") си Зир^"). Более того, включение являет- является собственным, как можно видеть из примера с граммати- грамматикой D2), которая, поскольку она содержит один терминальный символ, является последовательностной. Таким образом, имеет место следующее соотношение: Зир (^0+) ф 5ир (<^+) ^ 5ир (# +). E3) Гинзбург и Райе показали, что не существует последователь- последовательностной грамматики для языка со словарем {а, Ьу с, й}у содер- содержащим цепочку 1папп 1Ьп а п ап*ь-* E4)
224 Н. Хомский, М. П. Шютценберже (симметричную относительно с) для любой последовательности (&, пи...,п2и-1) положительных целых чисел, хотя этот язык порожден грамматикой а = ай§ йа -\- ааа В соотношении E3) ни _5?о\ ни $ + нельзя заменить ни на ка- какое из семейств ^т и _5?+. В самом деле, грамматика E5) ли- линейная, хотя и не последовательностная, так что 5ир(^+)с^: (^5ир(о^+), а грамматика D2) последовательностная, но не металинейная, так что 5ир(^+) ^ 5ир(да2?т)- Поскольку грамматики D5) и D6) последовательностные, мы видим, что свойство 2 (но не теорема 2) может быть рас- распространено 5ир((^+). Дальнейшие результаты относительно последовательностных языков см. Гинзбург и Роуз [19], Ша- мир [51]. 5. ДРУГАЯ ХАРАКТЕРИСТИКА СЕМЕЙСТВА /СС-ЯЗЫКОВ В этом разделе мы разовьем несколько другой подход к оп- определению семейств языков и покажем, как этот подход соот- соотносится с классификацией, рассмотренной выше. Определим два основных понятия: стандартного регулярного события и языка Дикка. Стандартное регулярное событие определяется конечным ал- алфавитом Ху двумя подмножествами Д и /2 произведения (X, X) и следующим правилом: /6 А тогда и только тогда, когда: (I) ^хР(Х)[\Р(Х)х\ где A1) / ^ Р (X) хх'Р {х\ где (х9 х') 6 У2. E6) Таким образом, А есть множество всех цепочек, которые на- начинаются и кончаются заранее выделенными буквами и не со- содержат пары двух рядом стоящих букв, принадлежащих /2. А является (в более специальной терминологии) пересечением квазиидеала, определенного Л, с дополнением к двустороннему идеалу, порожденному всеми произведениями хх' ((х, х/)^12). Заметим, что множество А—то самое, что иногда называют «1-определенным событием» [21], [35]. Определим язык Дикка б2п над алфавитом из 2/2 букв я-ыA^/^л) как множество всех цепочек /, которые могут быть сокращены до пустой цепочки последовательным вычерки- вычеркиванием пар рядом стоящих букв вида х^Х-^(—п'^/^п). Язык Дикка — это хорошо известный математический объект: еслиф
Алгебраическая теория контекстно-свободных языков 225 является гомоморфизмом свободной полугруппы, порождаемой множеством {#+г}, на свободную группу, порождаемую подмно- подмножеством {Х{ : />0}, который удовлетворяет тождеству (Ф^.)"" = = ф^ , то #2п — ядро ф, т. е. множество цепочек /, таких, что Для этих понятий имеют место следующие результаты. Утверждение 1. Для любого регулярного события В с РA) можно найти стандартное регулярное событие А и гомоморфизм а: Р(Х) -*РG,), такой, что В = аА. Стоит заметить, что не только В = аАу но что, кроме того, каждая цепочка /(: А имеет ту же степень неоднозначности, что и соответствующая цепочка а/ 6 В. Иначе говоря, если В = = 5ир (|3), то можно найти -у такое, что Л = 5ир (-у), и для ка- каждой цепочки / (-у, /) = (Р, ос!). Утверждение 1 можно обобщить на /соязыки, используя следующие свойства языка #2п. Свойство 1. 1Jп порождается однозначной кс-граммати- кой. Чтобы получить такую грамматику, введем 2п+\ нетерми- нетерминальных символов а±г A ^/^п), C. Рассмотрим теперь 2м+1 уравнений: A) а1 = х1(\— 2 о-]) *-1> \ ЗФ-1 1 E7) (И) Р = 0—2»!). (Обозначение см. разд. 3.2.) Интуитивно |3 можно интерпретировать как совокупность всех цепочек, которые могут быть сокращены до пустой после- последовательности вычеркиванием пар рядом стоящих букв Х\Х-\. Каждое а* есть совокупность всех слов из 5ир (|3), которые начинаются с я* и не имеют собственных начальных или конеч- конечных отрезков, принадлежащих 5ир (|3). Из уравнения E71) сле- следует, что каждая цепочка /^5ир (аг) имеет одно и только одно разложение / ^ !х-1> E8) где каждая цепочка ^ принадлежит множеству 5ир (а^-) (где ]Ф—/, потому что мы хотим, чтобы начальная буква Х\ сокра- сокращалась только с конечной буквой #_г). Аналогично каждая цепочка /€5ир (|3) имеет одно и только одно разложение /=/1,5./т, где цепочки /^ принадлежат вир
226 Н. Хомский, М. П. Шютценберже ИУ I -II м и I I ■ и ■ —- ■ - ... — Имеет место следующий результат, аналогичный утвержде- утверждению 1. Утверждение 2. Любой кс-язык ЬаРG,) определяется целым числом п, стандартным регулярным событием А над сло- словарем Х2п = {х±и 1^/-^п}, гомоморфизмом ср: Р(Х2п) -+РB) и правилом 1 = ф(ЛП Дап). [48], [49], [11], [12]. Снова, как и выше, из этого утверждения следует, что це- цепочки порождаются с соответствующей степенью неоднознач- неоднозначности. Кроме того, можно выбрать /4 так, что (х, х') 6/ь есЛи х принадлежит некоторому подмножеству X (см. [48]). Специальные подсемейства языков рассмотренного выше типа можно определять, накладывая условия на стандартное регулярное событие А и гомоморфизм ср. Предположим, что мы взяли стандартное регулярное событие Л над алфавитом X II У где Х = {х±г: 1<л<1м}, У={у±г: 1^/^т}, определенное сле- следующими условиями на 1\ и /2: г, X}): знак (г)=^знаку (])}[} {(Уи Уд : 1<° или />0} II II {(*г, Уз) : /<0 или /<0} II {{уи хД : />0 или />0}. E9) Здесь каждая цепочка имеет вид }§§'!', где /, //6/7(Аг); 8> ^/^^7(^); /, § (соответственно \\ §') содержат буквы только с положительными (соответственно отрицательными) индек- индексами. Если мы обозначим через Х+ и Х~ подмножества Ху со- состоящие соответственно из букв с положительными и отрица- отрицательными индексами (аналогично для У+ и У~), то можно опи- описать допустимые и недопустимые переходы с помощью матрицы F0), где 1@) означает, что переход от элемента, обозначаю- обозначающего строчку, к элементу, обозначающему столбец, возможен (или нет); 0 есть матрица, состоящая только из единиц, а 0 есть матрица, состоящая только из нулей: У+ У X" X' F0) У+ У х+ 0 0 ц и 0 0 0 0 ц 0 и 0 X' о о о и Рассмотрим теперь множество Л П Охг (где йХу есть язык Дикка над алфавитом X II У). Если }§^.А [где !^Р(Х+ [} У+), @€.Р(Х- и У')] удовлетворяет тому условию, что !§аОхг, то цепочка § должна быть зеркальным образом цепочки / (то же, если изменить знаки индексов). Иными словами, в обозначе-
Алгебраическая теория контекстно-свободных языков 227 ниях второго абзаца разд. 4.3 должно быть, что Я=/. Ясно, что если а есть гомоморфизм Р(Х II У) в Р(]/Т)у то а (А П &ху) есть линейный язык. Кроме того, если добавить условие, что Уг = е для /<0 и Уг==с для каждого />0, где ахг ^ Р(Ут)сР(Ут) для каждого /, то Ь = а{А П Оху) будет минимальным линей- линейным языком с символом с в качестве центральной метки, при- причем каждый минимальный линейный язык определяется таким выбором а. Это дает независимую характеристику минималь- минимальных линейных языков. Кроме того, добавляя к /2 некоторую пару, можно ограни- ограничить определенный выше канонический язык А таким образом, что {}:}ар(Х+) и для некоторого §, 1§€А и^^Р(У)Р(Х)} явится произвольным регулярным событием (а не свободной полугруппой над Х+, как выше), так что Ь = а{А П Оху) будет произвольным линейным языком. Таким образом, мы получим независимое определение понятия «линейный язык». Заметим, что это дальнейшее ограничение на /2 влияет только на те эле- элементы матрицы F0), которые находятся на главной диагонали. Таким же способом можно дать определение «металиней- ного языка». Рассмотрим, например, металинейный язык, поро- порожденный грамматикой с уравнениями О — F1) В этом случае матрица для соответствующего стандартного регулярного события имеет вид ХГ хт X} Х2 ХГ ц 0 0 0 хт и и 0 0 X? 0 и и 0 Х2 0 0 ц и F2) Каждый металинейный язык и.только металинейные языки могут быть определены с помощью стандартного регулярного события с матрицей существенно такого вида (может быть, с дополнительными ограничениями на главную диагональ). Таким образом, утверждения 1 и 2 дают возможность весьма естественным образом определить полный класс /соязыков и различные подсемейства этого класса независимо от подхода, которого мы придерживались в предыдущих разделах,
228 Н. Хомский, М. П. Шютценберже 6. АЛГОРИТМИЧЕСКИ НЕРАЗРЕШИМЫЕ ПРОБЛЕМЫ 6.1. В работе Поста {36] показано, что так называемая про- проблема соответствий рекурсивно неразрешима. Если 2 = = {(/ь 8\), •••> (/п, §п)} есть последовательность пар цепочек,) скажем, что последовательность /=(/ь ..., 1т) целых чисел A ^ 1$ ^С п) удовлетворяет 2, если F3) Проблема соответствий состоит в распознавании того, суще- существует ли при данном 2 последовательность индексов, удовле- удовлетворяющая 2. Заметим, что 2 либо не удовлетворяется никакой последовательностью индексов, либо удовлетворяется бесконеч- бесконечным числом последовательностей, так как если (^, ..., ьт) удовлетворяет 2, то (/ь . .., 1т, /ь ..., 1т) тоже удовлетво- удовлетворяет 2. Пост показал, что не существует алгоритма, позволяю- позволяющего распознать при произвольном 2, какой из этих двух слу- случаев имеет место. Проблему соответствий можно непосредственно переформу- переформулировать в терминах минимальных линейных грамматик. Если дано 2={(/1, §{), ..., (/п, ^п)}, построим грамматику ОB) с одним нетерминальным символом 5 и определяющим уравне- уравнением 5 = а + №1+ ...+№п, F4) где а есть символ, не встречающийся ни в цепочках /г-, ни в це- цепочках §г. Ясно, что последовательность индексов, удовлетво- удовлетворяющая 2, существует тогда и только тогда, когда С B) поро- порождает цепочку /а/. Иначе пусть Ьт есть язык «зеркального отражения», состоящий из всех цепочек /а/, где }€Р(УТ), и пусть /.(СB)) есть язык, порождаемый грамматикой С. Тогда либо не существует последовательности индексов, удовлетво- удовлетворяющей 2, и в этом случае Ьт П Ь(С(Ъ)) пусто, либо суще- существует бесконечно много последовательностей индексов, удовле- удовлетворяющих 2, и в этом случае Ьт П ^@B)) бесконечно. Из неразрешимости проблемы соответствий и из того факта, что Ьт порождается линейной грамматикой с одним нетерминаль- нетерминальным символом, непосредственно следует теорема. Теорема неразрешимости 1. Не существует алго- алгоритма, позволяющего распознать для двух произвольных кс- грамматик О1 и С2, порождающих соответственно языки Ъ^ и Ьъ является ли Ь\ Г) ^2 пустым или бесконечным. Это верно также для случая, когда 0^ и 02 — минимальные линейные грамма- грамматики, и для случая, когда Ох — фиксированная грамматика языка Ьт.
Алгебраическая теория контекстно-свободных языков 229 Легко видеть, что для односторонних линейных грамматик проблема распознавания пустоты и конечности пересечения раз- разрешима. Но мы видим, что для простейших грамматик в рамках нашего рассмотрения, которые более богаты, чем класс регу- регулярных событий, эти проблемы уже не разрешимы. Это замечание обобщено в работе Бар-Хиллела, Перлеса и Шамира [2], где показано, что многие проблемы, относящиеся к /сс-грамматикам, рекурсивно неразрешимы. Коротко их метод заключается в следующем. Возьмем в качестве Ут множество {а, 0, 1}. Если 2={(/ь §{), ..., (/п, §п)} есть множество пар цепочек над словарем {0, 1} (т. е. /г-, §{€ Р{0, 1}), обозначим через ^B) множество всех цепочек 10'* ... \01ш{. ... !, аЦ, ... ?,. аОуЧ ... 0уП, F5) 1^^ • • • • ^^ ^ 1\, « . ., 1%, /1, . . ., У/ ^ч Я. Яснее можно сказать так: будем использовать Г=10г' в ка- качестве кода числа /. Тогда каждая цепочка из ^B) строится следующим образом: выбираются последовательности индексов /= ('1, • • •, к) и /= (/ь ...,//) и образуется 1к ... /а/ ... [{ а} ... } аУх ... уг F6) 1 к у I у 1 Язык /-B) играет такую же роль, как язык, порожденный уравнением F4) в доказательстве теоремы неразрешимости. Ясно, что это кс-язык [он порождается в действительности мета- линейной грамматикой, получаемой, очевидно, видоизменением уравнения F4)]. Но из теоремы 3 в разд. 4.3 непосредственно следует, что дополнение Р(УТ) \ ^B) языка ^B) по отноше- отношению к словарю Ут является /сс-языком и что, исходя из его грамматики, можно построить грамматику языка ^B). (Заме- (Заметим, что для определения ^B) мы могли бы вместо выбран- выбранного нами кода 1=10* использовать любой другой код.) Вместо языка зеркального отражения Ьт, использованного в доказательстве первой теоремы неразрешимости, рассмотрим теперь язык «двойного зеркального отражения» Ьат, состоящий из всех цепочек вида Х1пх2ах2сгхи где х± и х2 суть цепочки над алфавитом {0, 1}. F7) Нетрудно показать, что язык Ьат и его дополнение по от- отношению к словарю УТ являются /сс-языками. Заметим, что 1 (Е) П А,,» = {/* • • • 1ха\, ... \,аё, ■ ■ ■ В.аЛг ■ ■ • **}. F8) где A1, .. ., 1н) удовлетворяет 2 (т. е. где // • • • // ==§■/ • • • у Заметим также, что бесконечное множество цепо-
230 Н. Хомский, М. П. Шютценберже чек вида F8) не может образовывать /сс-язык (и тем более регулярное событие). Допустим теперь, что существует положительное решение проблемы соответстаий для 2, т. е. существует последователь- последовательность индексов, удовлетворяющая 2. Тогда, как мы заметили выше, существует бесконечно много таких последовательностей. Следовательно, ^B) П Ьа™. — бесконечно, поэтому оно не является ни регулярным событием, ни /соязыком. Допустим далее, что не существует последовательности ин- индексов, удовлетворяющей 2. Тогда ^B) Г) Ьа™, пусто, поэтому оно является и регулярным событием и /соязыком. Но 1,B) и Ьат являются /сс-языками, и при фиксированном 2 можно построить для них /сограмматики СB) и Оат (которые яв- являются в действительности металинейными). Таким образом, если бы существовал алгоритм, позволяющий распознавать, является ли пересечение языков, порождаемых двумя /сс-грам- матиками СB) и Оат, пустым языком, конечным языком, регу- регулярным событием или /соязыком, то этот алгоритм давал бы также решение общей проблемы соответствий. Нами доказана, таким образом, вторая теорема неразре- неразрешимости. Теорема неразрешимости 2. Не существует алго- алгоритма, позволяющего распознавать для кс-грамматик О{ и 0%, является ли пересечение языков, порождаемых ими, пустым языком, конечным языком, регулярным событием или кс-язы- ком. Это остается верным для случая, когда обе грамматики металинейные, и для случая, когда 02 есть фиксированная грамматика языка. Пусть Оат есть /сограмматика, порождающая дополнение языка Ьат (все дополнения рассматриваются теперь по от- отношению к словарю УТ). Если дано 2, пусть С B) будет кс- грамматикой, порождающей дополнение ^B) языка ^B) (су- (существование такой грамматики гарантируется теоремой 3 разд. 4.3). Рассмотрим грамматику С, порождающую язык Ь@)~Ьс1т II -Ц2). Ясно, что О есть /сограмматика и что она может быть построена, исходя из Оат и С B), но дополнение Ь(О) языка Ь{0) совпадает с множеством Ьа II Ь'(%)=ЬAт П П ^B). Как мы знаем из второй теоремы неразрешимости, не существует алгоритма, позволяющего распознавать при данном 2, является ли это множество пустым языком, конечным язы- языком, регулярным событием или кс-языком. Но при данном 2 О есть /сс-грамматика.
Алгебраическая теория контекстно-свободных языков 231 Поэтому мы можем сформулировать третью теорему нераз- неразрешимости. Теорема неразрешимости 3. Не существует алго- алгоритма, позволяющего распознавать для кс-грамматики О, яв- является ли дополнение языка, порожденного 6, пустым языком, конечным языком, регулярным событием или кс-языком. В частности, не существует общей процедуры, позволяющей распознавать, порождает ли /сс-грамматика О универсальный язык Р(УТ), порождает ли грамматика О регулярное событие (поскольку дополнение к регулярному событию является регу- ля-рным событием). Следовательно, не существует алгоритма, позволяющего для /соязыков Ь{ и Ь2 распознавать, существует ли преобразователь, отображающий /^ на Ь2, поскольку все ре- регулярные языки и только они могут быть получены конечным преобразованием из кс-языкг Р(Ут) (Гинзбург и Роуз, личное сообщение). Кроме того, не существует общего метода, позво- позволяющего распознавать, являются ли две /сс-грамматики экви- эквивалентными, т. е. порождают ли они один и тот же язык; в са- самом деле, если бы существовал такой метод, то с его помощью можно было бы распознать, эквивалентна ли /сограмматика О грамматике 0^, порождающей Р(Ут)- Отсюда непосредственно следует, что не существует алгоритма, позволяющего распозна- распознавать для двух /сограмматик, содержится ли язык, порождае- порождаемый одной из них, в языке, порождаемом другой грамматикой; в самом деле, это давало бы решение проблемы эквивалент- эквивалентности. Эти результаты были получены для языков над трехэлемент- трехэлементным словарем Ут, но ясно, что при соответствующем перекоди- перекодировании они могут быть применимы и к языкам над словарем из двух или более букв. Этот вопрос детально исследован в ра- работе Бар-Хиллела, Перлеса и Шамира [2]. 6.2. В разд. 4 мы заметили, что конечные процессы, приме- применяемые к парам цепочек, допускают естественную формули- формулировку в терминах линейных грамматик. В частности, как мы только что видели, проблема соответствий может быть описана непосредственно как проблема, относящаяся к минимальным линейным грамматикам. Это верно и для другой комбинатор- комбинаторной проблемы, также поставленной Постом, а именно так на- называемой «таг-проблемы». Обобщенную таг-проблему можно сформулировать следую- следующим образом. Пусть УР — множество цепочек (свободная полу- полугруппа) над некоторым конечным словарем, и пусть Р есть конечное подмножество непустых цепочек из Ш, удовлетворяю- удовлетворяющих тому условию, что для каждой цепочки из V? не более чем
232 И. Хомский, М. /7. Шютценберже один ее начальный отрезок принадлежит Р. Иначе не суще- существует ри ръ ши а>2, ^з (Рг€Р, гЮг^Щ таких, что Р\фрг и гю1=р1г02==р2^3' Пусть V есть множество цепочек из й?, ника- никакие начальные отрезки которых не принадлежат Р. Иначе го- говоря, V€.V тогда и только тогда, когда не существует р(^Р, такого, что ю = рхю, где о>6№. Ясно, что V есть рекурсивное и даже регулярное множество. Пусть а—отображение Р в У [таким образом, о^ определяет множество пар цепочек (р, ш), где и) = ар, р€Р, гмаЩ. Определим отображение Т на №, где = ('ар, если / — 27 = Я, если /б^(Я^ИТ) F9)  Рассмотрим следующую задачу. Существует ли для данной цепочки / целое число п такое, что Тп! = Н? G0) Если рассматривать Т как определение вычисления на не- некоторой машине Тьюринга, то наша задача есть проблема остановки для этой машины Тьюринга. Минским [30] было по- показано, что проблема G0) рекурсивно неразрешима. Таг-проблема в формулировке Поста — это специальный случай проблемы G0), где Т удовлетворяет следующим допол- дополнительным условиям: Р — это множество всех цепочек длины к для некоторого фиксированного к ^ 2, ар зависит только от самого левого символа р. Проблема G0), как показал Минский, неразрешима даже при этом ограничении. Этот результат является несколько неожиданным ввиду детерминированности {моногенности), порождающей процедуры Т. Чтобы удобнее было переформулировать обобщенную таг- проблему в терминах минимальных линейных грамматик, за- заметим, что она может быть представлена следующим образом. При данных №, Р, V, а, Г, как выше, проблема G0) имеет положительное решение тогда и только тогда, когда существуют цепочки рг, ..., рп^Р и ю^У, такие, что ри .. ., рпъ = 1арх ... арп. G1) Теперь обобщенную таг-проблему можно сформулировать как следующую проблему, относящуюся к линейным грамма- грамматикам. При данных И7, Р, V, а, Т определим грамматику О, порождающую язык Ь(О), с помощью уравнения 5 G2)
Алгебраическая теория контекстно-свободных языков 233 где V^€.V, рг^Р и с ^ УР — центральная пометка. Определим язык М(}) ={}&с§: §а Щ [таким образом, Мф=[Ьт, где Ьт есть язык «зеркального отражения», определенный выше]. То- Тогда решение проблемы G1) [или, что то же самое, проблемы G0)] положительно тогда и только тогда, когда пересечение Ь(О) с АЩ) непусто. Мы видим, таким образом, что не суще- существует алгоритма, позволяющего распознавать при фиксирован- фиксированной цепочке /, имеет ли язык М(() непустое пересечение с язы- языком, порождаемым грамматикой, удовлетворяющей уравнению G2) (даже для специального случая, когда Р есть множество всех цепочек длины для фиксированного к ^ 2 и ар зависит только от самой левой буквы р). Заметим, что первая теорема неразрешимости также непо- непосредственно следует из неразрешимости таг-проблемы. В са- самом деле, и таг-проблема и проблема соответствий относятся к мощности пересечения минимального линейного языка Ь с языками Л4(/), где в случае проблемы соответствий [ = б и I выбирается произвольно, а в случае таг-проблемы / произ- произвольна и Ь удовлетворяет уравнению G2). 7. НЕОДНОЗНАЧНОСТЬ 7.1. Мы назвали степенной ряд г характеристическим, если каждый коэффициент (г, /) есть либо нуль, либо единица. Мы говорим, что кг-грамматика однозначна, если главный член ее решения есть характеристический степенной ряд. В этом случае каждое предложение, которое она порождает, имеет только одно структурное описание и «стирание скобок» не приводит к неоднозначности. Назовем /соязык существенно неоднознач- неоднозначным, если каждая его грамматика неоднозначна. Хорошо из- известно, что ни одно регулярное событие не является существен- существенно неоднозначным, т. е. каждое регулярное событие есть опор- опорное множество характеристического степенного ряда, являюще- являющегося главным членом решения односторонней линейной грам- грамматики [14], [37]. Однако это не переносится на полный класс /сс-грамматик. Париком [34] было доказано, что существуют существенно неоднозначные кс-языки. Примером существенно неоднозначного языка является мно- множество [апЬтср \п = т или т = р). G3) Здесь цепочки вида апЪпсп должны иметь степень неодно- неоднозначности, равную по меньшей мере двум, для любой кс-грам- матики, порождающей G3) [и существует /сс-грамматика, по-
234 Н. Хомский, М. П. Шютценберже рождающая G3) со степенью неоднозначности, равной точно двум]. У нас нет примеров, иллюстрирующих объем понятия суще- существенной неоднозначности для /сс-языков или для специальных типов кс-языков. Заметим, что из первой теоремы неразрешимости (разд. 6) непосредственно следует, что не существует алгоритма, позво- позволяющего распозцавать, является ли /сс-грамматика или даже линейная грамматика неоднозначной. В самом деле, пусть, как и выше, 2 = {(/],, 8^, ..., (!п, &п)} есть последовательность пар цепочек. Выберем м+1 новых символов х0, ..., хп и построим грамматику ^^ с правилами: 5/ —> х0, 5/—*х{8^г A^1-^.п) и грамматику ОЙ с правилами: 5^ —>хОу Зд—^х^З^г (I ^.1 ^ п). Ясно, что грамматики О/ и Оё однозначны и проблема соответ- соответствий для 2 имеет положительное решение тогда и только то- тогда, когда существует цепочка, порождаемая обеими грамма- грамматиками О/ и ОёУ т. е. тогда и только тогда, когда является не- неоднозначной грамматика О^у определенная следующим обра- образом: 6{ё содержит правила О/, Оё и правила 5—>5/, 5—»5^, где 5 есть начальный символ грамматики О^ё. Следовательно, не- невозможна процедура, позволяющая распознавать для произ- произвольного 2, является ли грамматика 0/^, соответствующая 2, неоднозначной. Грамматика 0;ё линейна с тремя нетерминальными симво- символами и центральной пометкой, и мы видим, что для такого класса грамматик проблема неоднозначности неразрешима. Ве- Вероятно, это замечание можно обобщить на грамматики с двумя нетерминальными символами. Однако остается открытым сле- следующий вопрос: остается ли проблема неоднозначности нераз- неразрешимой для минимальных линейных грамматик1). Резюмируя все, что сказано здесь о неоднозначности, сфор- сформулируем следующие результаты в виде теорем. Теорема неоднозначности 1. Существуют суще- ственно неоднозначные кс-языки. Теорема неоднозначности 2. Не существует алго- алгоритма, позволяющего распознавать, является ли кс-грамматика (которая может быть даже линейной с центральной пометкой) неоднозначной. 1) Неразрешимость проблемы распознавания неоднозначности для ми- минимальных линейных грамматик доказана в работе Грейбах [О г е 1 Ь а с Ь 5. А., 11пс1еас1а ЫШу оГ Ше атЫдиНу ргоЫет Гог гштта1 Нпеаг ^гаттагз, 1п- {огш. апй Сопггог, 6 A963), 119—125]. — Прим. ред.
Алгебраическая теория контекстно-свободных языков 235 8. КОНЕЧНОЕ ПРЕОБРАЗОВАНИЕ Опишем теперь одно особенно простое семейство преобра- преобразований языка в язык. Первое и наиболее важное преобразо- преобразование — гомоморфизм. Пусть Ь есть язык над терминальным словарем 2У и пусть каждому г^2 сопоставлен язык Ь2 над другим словарем X. Обозначим через 6/. множество всех цепочек (над Х)у которые могут быть получены следующим образом: берется слово $: г, г, ...г. ^Ь, каждое г*, заменяется произвольным сло- 1 2 1т 1 вом из Ьг . Название «гомоморфизм» не нуждается в объяс- нении. В самом деле, если рассмотреть кольца А B) и А(Х) формальных степенных рядов от перехменных г^.2 и х^Х и обозначить через 6 гомоморфизм А B) в А(Х)У индуцированный отображением 02, равный формальному степенному ряду, соот- соответствующему языку Ь2, то 6/. есть опорное множество образа 6 формального степенного ряда, соответствующего языку /.. Это можно интерпретировать в рамках наших предыдущих рассуждений, если Ь и все Ь2 суть кс-языки. Предположим в этом случае, что язык Ь порождается /сс-грамматикой (с не- нетерминальным словарем У) и что каждый язык Ь2 порождается /сс-грамматикой 02 (со множеством нетерминальных символов У2 и начальным символом у2го). Допустим, что множества Уг попарно не пересекаются; рассмотрим /сс-грамматику О с не- нетерминальным словарем У\}2,\] II У2 (г ^2). (Попросту, мы отождествляем каждое г с у2} 0.) Ясно, что грамматика О поро- порождает в точности язык §Ь. Обобщим теперь эту конструкцию на следующий тип кон- контекстной зависимости: пусть Яг ('€/) и /?г(*'6^') — Два конеч- конечных множества регулярных событий, такие, что каждая цепочка ц^РB) принадлежит одному и только одному элементу ка- каждого множества. Пусть, кроме того, каждой тройке , /'€/') сопоставлен язык Цг,1,г) над словарем X. Заменим в каждой цепочке .у = г. г. ...г. каждое г. произвольной цепочкой из языка ^(г^ » I* ^)» гДе 1 и ^ удо- удовлетворяют тому условию, что цепочка г. , г. ... г. при- принадлежит Ни а цепочка г. ... г. принадлежит/?/. Легко доказать, что без потери общности можно допустить, что для любой цепочки §, принадлежащей некоторому множеству /?/,, и для г 6 2 множество /^2, которое содержит §гу зависит только от индекса, н и буквы г. Другими словами, мы можем допу-
236 Н. Хомский, М. П. Шютценберже стить, что задано множество состояний /, функция перехода /Х^—>/ и начальное состояние /об/, такие, что г., г; ... ... г. р/?. тогда и только тогда, когда * есть состояние, кото- рое можно достичь из /о, идя по цепочке гг. . .. г. Подобная конструкция применяется и к /?*; ради ясности будем записывать соответствующее отображение как левое умножение. Имея два отображения 1x2 —>/ и 1x1'—*!', обо- обозначим через о# для каждого # = 2/2:; ...г, ^^(А") после- довательность троек где /у- определяется индуктивно: V ^/ В этих обозначениях описанное преобразование можно рас- рассмотреть как состоящее из двух шагов: A) замена каждой цепочки ^^1 на цепочку а(г = Н19 г^ , 1'\ ... Aт^) » 1\), над алфавитом С/, состоя- G6) щим из троек (/, г, /'); (и) замена в о§ каждой тройки П,к, г. , 1'т_к+А произволь- произвольной цепочкой языка Ь(г. , /А, 1/т_к + 1у Поскольку шаг (и) есть просто гомоморфизм, достаточно рассмотреть шаг A). Для этого обозначим через 0 множество всех троек (/, г, Г) и рассмотрим язык I/, полученный из языка /. добавлением к его грамматике всех правил вида 2;-*(/, 2^, Г) (с произвольными /6/ и I' 6 /7). Ясно, что цепочка // принадлежит множеству {о§:§^Ь} тогда и только тогда, когда она удовлетворяет условию G5) или, другими словами, когда она принадлежит регулярному событию Л, определенному условием G5) на множество всех цепочек Р(Щ над алфавитом V. Следовательно, шаг A) состоит из последовательного при- применения двух преобразований — гомоморфизма языка Ь во множество всех цепочек над V (дающего О) и пересечения // с регулярным событием. Дадим теперь окончательную интерпретацию: для каждой цепочки г ^ 2 обозначим через \1% матрицу, строки и столбцы
Алгебраическая теория контекстно-свободных языков 237 которой занумерованы парами (/ ^ /, V ^ Г) и элементами ко- которой служат (я,г(/, /')('"> '"') =тройке (/, г, Г"), если Г7 = 12 и // = ,г//// = 0 в других случаях. G7) Затем, если мы вычислим \хг. , |яг,, ..., |яг. = \1@, легко проверить, что элемент (/, /^)(/т, /{) матрицы ^ это в точ- точности о§. Отсюда легко следует, что {о§ : § (^ Ь} = Ь' [\ К есть тоже КС-язык. Действительно, ^ является гомоморфизмом, так как мы заменяем каждый нетерминальный символ матрицей \ху, элементы которой есть новые нетерминальные символы, и проверяем, что \.1 коммутирует с подстановками, использовав- использовавшимися для определения языка как решения системы уравне- уравнений. С другой стороны, так как \х есть образ наших уравне- уравнений, он дает новую систему уравнений обычного типа, которые в точности определяют язык V П /? [46]. Еще проще мы можем определить \х', как выше, только вместо тройки (/ь г^ /') возь- возьмем формальный степенной ряд, соответствующий языку Ь{г^ /, Г). Тогда два шага нашей конструкции объединяются в один, а степенной ряд, соответствующий языку (над X), по- полученному нашим преобразованием, — это просто элемент мат- матрицы ^ G8) На основе сказанного строится доказательство теоремы 2 из разд. 4. 9. СВЯЗЬ С ТЕОРИЕЙ АВТОМАТОВ До сих пор мы изучали порождающие процессы, порождае- порождаемые ими системы структурных описаний, а также финитные отображения этих языков с абстрактной точки зрения. Для того чтобы связать эти замечания с теорией автоматов, удобно внести в рассмотрение временную асимметрию. Автомат М можно рассматривать как устройство, состоящее из множества состояний 2 (память М), которое допускает или (что то же самое) порождает последовательность символов над словарем (алфавитом) V в соответствии с конечно формули- формулируемыми предписаниями (которые можно задать, сопоставляя с каждым V^ V отображение ф^, множества 2 в себя или во множество подмножеств 2 в случае «недетерминированного» автомата). Если мы отметим начальное состояние и множество конечных состояний, то тем самым мы определим язык М(Ь), состоящий из цепочек, которые допускаются автоматом, когда
238 Н. Хомский, М. П. Шютценберже он переходит в соответствии с предписаниями от начального состояния в заключительное, причем переход из состояния 5 €2 в состояние 5'6 2 с допущением V происходит тогда и только тогда, когда ср^З = 5' [или в случае недетерминирован- недетерминированного автомата, когда 57 (:фг>E)]. Объем памяти автомата М или быстрота ее роста в процессе вычисления дает некоторую ха- характеристику языка Ь(М), в терминах которой можно сравни- сравнивать рассмотренные нами семейства языков. Для данного множества цепочек языка Ь будем писать, что /~7' в случае, если для всех § !§(:^ тогда и только тогда, когда Г^ё/-. Ясно, что знак ~ выражает эквивалентность. Более того, очевидно, что классы эквивалентности, определен- определенные отношением ~, можно взять в качестве состояний авто- автомата М(Ь), допускающего Ь, поскольку вся информация о це- цепочке /, существенная для дальнейшего вычисления в автомате М(Ь)У когда он читает /, определяется классами эквивалент- эквивалентности, к которому принадлежит /. Заметим, что язык Ь есть объединение некоторых из этих классов эквивалентности и что отношение /~/' влечет отношение }&~1'8 для всех §. Кроме того, при данном ^ будем писать, что / = /' тогда и только тогда, когда для всех § 8}~&}'. Ясно, что / = /' тогда и только тогда, когда для всех §•, ц' §}§' = §1'§'. Таким обра- образом, отношение = симметрично, и легко показать, что если /1 = /2 и /3 = /4, то /1=/з, т. е. отношение = есть конгруэнция, =-классы во множестве Р(У) можно перемножать, причем по- получается полугруппа частных полугруппы Р(У). Эта полу- полугруппа частных Р' (V) = ср/7(V) такова, что /. = ф~!ф/. и канони- канонически ассоциирована с Ьо [41]. Это замечание связывает нашу теорию с теорией полугрупп. Эта связь интересна тем, что в некоторых случаях классы (полугруппа частных) имеют простую интерпретацию на языке автоматов и обратно — что некоторые алгебраические понятия (в частности, расширение) получают простую интерпретацию. Вернемся теперь к проблеме характеризации семейств язы- языков в терминах автоматов. Хорошо известно, что подмножество Зир(«57о") кс-языков однозначно характеризуется тем, что для каждого языка 1^5ир(«57о+) существует автомат М(Ь) с конеч- конечной памятью, допускающий /.. Рассмотрим теперь семейство 8ир(е5::'о), т. е. множество Опорных множеств степенных рядов, которые являются реше- решениями систем «односторонних линейных» уравнений с положи- положительными или отрицательными целыми коэффициентами. Как мы заметили, !(; 5ир(-5?о) тогда и только тогда, когда
Алгебраическая теория контекстно-свободных языков 239 = 5ир(г1 — г2), где гь г2^@3?о). Можно показать, что следую- следующие утверждения эквивалентны: (I) 165ир(^0+); (II) существует одно-однозначное соответствие между ~- классами для Ь и конечномерным пространством целочисленных векторов V(}), таких, что для каждого х6 V, V(}x) =V(})^xxу где [IX есть их матрица; (Л!) /7=изоморфна некоторой полугруппе конечномерных целочисленных матриц [т. е. матриц [х из (и)]; (IV) ^ допускается автоматом М(Ь), множеством состояний которого служит конечномерное пространство целочисленных векторов, а функция перехода определена, как в (й). [(Шютценберже [44] — пусть класс автоматов Л совпадает с классом автоматов, определенных в G9 IV).] Рассмотрим следующие два ограничения на класс автома- автоматов Л. A) существует N такое, что для каждого (Н) для всех /, Г,Г$Р(У) и е > О Нт*-ея||г>(Р/ТI!=О, (80) я-»оо где 1М1 есть длина вектора в обычном смысле. Ясно, что (80 1) влечет (80 и). Кроме того, ясно, что Ь есть регулярное событие [т. е. Ь ^ 5ир (-З^о*)] тогда и только тогда, когда (80 1) удовлетворяется для некоторого автомата класса Л, допускающего /.. Автомат класса Л, удовлетворяющий ус- условию (80 и) в работе Шютценберже [47], где изучаются такие устройства, назван автоматом с конечным числом счетчиков. Можно показать, что (80 и) означает, грубо говоря, что объем информации (в битах), накапливаемой в памяти, растет не быстрее, чем линейная функция от логарифма длины входного слова. Интересно заметить, что (как раз в случае полного класса /сс-грамматик) не существует алгоритма, позволяющего опреде- определить для данного автомата Ма<А, допускается ли / автоматом М [28]. Кроме того, легко показать, что если неразрешима деся- десятая проблема Гильберта (проблема существования целочислен- целочисленного решения произвольного диофантова уравнения), то эта же проблема также неразрешима для автомата с конечным числом счетчиков [47]. Рассмотрим теперь автомат М следующего вида: его состоя- состояния (~-класса входного языка автомата М) отождествляются с цепочками над некоторым новым («внутренним») алфавитом,
240 Н. Хомский, М. П. Шютценберже и для каждого у^У функция перехода («вычислительное пред- представление») фи:[~-класс /] — [~-класс /у)] состоит в дописыва- дописывании или вычеркивании букв в правом конце цепочки над вну- внутренним алфавитом, сопоставленной с [~ -класс /]. Такой ав- автомат в соответствии с обычной терминологией назовем авто- автоматом с магазинной памятью или РО5-автоматом. Такие ав- автоматы составляют некоторый частный подкласс класса линейно ограниченных автоматов, изучавшихся Майхиллом [31], Ритчи [39]. Если М есть РО5-автомат, то язык Ь, который он допу- допускает, — /сс-язык и каждый /сс-язык может быть получен с по- помощью гомоморфного отображения из языка, допускаемого РО5-автоматом [48], [49]. В частности, если И есть язык Дикка и А есть стандартное регулярное событие (см. разд. 5), то О П А допускается РО5-автоматом. Недетерминированный РиЗ-автомат отличается от автомата описанного выше типа только тем, что ф^, отображает состояние во множество состояний. Теперь можно непосредственно дока- доказать, что /соязыки [языки класса 5ир(^ + )] в точности те, кото- которые допускаются недетерминированными РО5-автоматами [11], [12]. Л ИТЕРАТУРА 1. А]Aик1е\у!с2 К., &\е зугйакИзспе КоппехИаЧ, ЗЫсНа РНИозорЫса, 1 A935), 1—27. 2. В а г - Н 111 е 1 У., Р е г 1 е з М., 5 Ь а пи г Е., Оп Гогта1 ргорегИез ог 51тр1е рпгазе з!гис1иге ^гаттагз, ТесЬ. НерогЧ 4, Ли1у 1960. 3. В а г - Н 111 е 1 У., Р е г 1 е з М., 5 Ь а т 1 г Е., АррПес! Ьо^с ВгапсЬ, 2еИ. }йг РНопейк 8ргасктю188еп8ска$1 апй КоттипИгаНоп8}ог8сНип§, 14, № 2 A961), 143—172. 4. В а г - Н 111 е 1 У., Р е г 1 е з М., 5 Н а т 1 г Е., РтЙе з!а1е 1ап^иа^ез, ВиИ. ЯезеагсН СоипсИ 1згае1, 8Р A960), 155—166. 5. В 1 г к е 1 а п с! Н., 5иг 1а сопуег^епсе с1е Aёуе1орретеп1, <\т ехрг1теп! 1е гас1пз с1е 1^иа1юп а12еЬг^^ие ^ёпега1е, С. К. АсаЛ. Заепсез, 171 A920), 1370—1372, 172 A921), 309—311. 6. С и И к К-, 5оте по!ез оп ппИе з!а1е 1ап§иа§ез, Сазор18 рго ре$1оуат Маг., 86 A961), 43—55. 7. С Ь о т з к у 1М., ТЬгее тос1е15 \ох 1Ье Aезсг1рИоп ог 1ап&иа^е, /. Я. Е. Тгапз. РО1Т 2 A956), 113—124. (Русский перевод: Хомский Н., Три модели для описания языка, Кибернетический сборник, вып. 2, ИЛ, 1961, стр. 237—266.) 8. С Ь о т з к у Ы., Оп сегЫп к>гта1 ргорег^ез о\ ^гаттагз, 1п\огтаНоп апй СопШ, 2 A959), 137—267. (Русский перевод: Хомский Н., О некоторых формальных свойствах грамматик, Кибернетический сборник, вып. 5, ИЛ, 1962, стр. 279—312.) 9. С Ь о т з к у N.. А по!е оп рЬгазе з!гис1иге ^гаттагз, 1п\оттаИоп апй Сопггои 2 A959), 393—395. (Русский перевод: Хомский Н., Заметки о грамматиках непосредственных составляющих, Кибернетический сборник, вып. 5, ИЛ, 1962, 312—315.)
Алгебраическая теория контекстно-свободных языков 241 10. С Ь о т з к у N.. Оп Ше по!юп «Ни1е о! Огаттаг», Ргос. 5утр. АррНес1 МаШ., 12. Ат. МаШ. 5ос. A961). (Русский перевод: Хомский Н., О понятии «правило грамматики», сб. Новое в лингвистике, вып. 4, «Прогресс», 1965, стр. 34—65.) 11. СЬотзку N.. Соп1ех1-Ггее ^гаттагз апс! ризЬс1ош1 з!ога^е. (Зиаг1ег1у Рго&гезз Рерог1з, № 65, НезеагсЬ ЬаЬога1огу о! Е1ес1гошсз, М. I. Т., 1962. 12. СЬотзку N.. Рогта1 ргорегИез ог дгаттагз. Напс1Ьоок ог МаШетаИ- са1 РзусЫо^у, 2, сЬ. 12, ШПеу, 1%3, р. 323—418. (Русский перевод: Хомский Н., Формальные свойства грамматик, Кибернетический сборник, вып. 2, «Мир», 1966, стр.Л21—230.) 13. С Ь о т 5 к у N.. ТЬе 1о^1са1 Ьаз15 Гог Нп&шзИс Шеогу, Ргос. 1Х-1Н 1п1. Соп§. 1лп<ушз15 A962). (Русский перевод: Хомский Н., Логические основы лингвистической теории, сб. Новое в лингвистике, вып. 4, «Прогресс», 1965, стр. 465—575.) 14. С Ь о т з к у N.. М 111 е г О. А., Ртйе з!а1е 1ап&иа§ез, 1п{огпгаИоп апй СопШ, 1 A958), 91—112. (Русский перевод: Хомский Н., Мил- Миллер Д., Языки с конечным числом состояний, Кибернетический сбор- сборник, вып. 4, ИЛ, 1962, стр. 231—255.) 15. СЬотзку N.. М 1 11 е г О. А., 1п1гос1ис1юп [о Ше !огта1 апа1уз15 оГ па!ига1 1апдиа^ез, A962) Напс1Ьоок оГ МаШетаИса1 РзусЬоЬ^у, уо1. 2, СЬ. 12, АУНеу, 1963, 269—322. (Русский перевод: Хомский Н., Миллер Дж., Введение в формальный анализ естественных языков, Кибернетический сборник, вып. 1, «Мир», 1965, стр. 229—290.) 16. Э а у 15 М., Сотри1аЫШу апс! ипзо1уаЬШ1у, Ые^ Уогк, МсОга^-НШ, 1958. 17. Е1^о1 С. С, Оеазюп ргоЫетз о! ПпНе аи!ота!а с1е51^п апс! ге1а!ес1 апШтеИсз, Тгапз. Ат. МаШ. Зое, 98 A961), 21—51. 18. О 1 п 5 Ь и г § 5., Н 1 с е Н. С, Тшэ !атШез о! 1ап^иа§е5 ге1а!ес1 [о АЬООЬ, ТесЬп1са1 Метогапс1ит, 5уз1ет5 ОеУеЬртепТ Согрога11оп, 5ап1е Моп1са, СаШогта, 1961. 19. О1пзЬигд 5., Нозе О. Р., ОрегаИопз \уЫсЬ ргезегуе с1еПпаЫШ:у 1п 1ап§иа§е5, ТесЬп1са1 МатогапAит. 5уз1етз Оеуе1ортеп1 СогрогаНоп, 5ап1а Моп1са, СаШогша, 1961. 20. 3 и п § е п Н. 5иг 1ез зёг1ез с1е Тау1ог п'ауап! §ие Aез 51п^и1аг11ёз а1^еЬ- псо — 1о^аг11Ьт1циез зиг 1еиг сегс1е с1е сопуег^епсе, Сотт. МаИг. НеШШ, 3 A931), 286—306. 21. К1еепе 5. С, НергезепЫюп о! еуегйз 1П пегуе пе!з апс! Пш1е .аиЬ- та!а. Аи1ота1а 51исИе5, РппсеЬп, 1956, 3—41. (Русский перевод: К л и н и С. К-, Представление событий в нервных сетях и конечных автоматах, сб. «Автоматы», ИЛ, 1956, стр. 15—67.) 22. Кулагина О. С, Об одном способе определения грамматических по- понятий, сб. «Проблемы кибернетики», вып. 1, Физматгиз, 1958, стр.203— 214. 23. ЬатЬек .1., ТЬе таШета^сз о! зегйепсе з!гис1иге, Ат. /. МаНг., 65 A958), 153—170. (Русский перевод: Лам бек И., Математическое исследование структуры предложений, сб. «Математическая лингви- лингвистика», «Мир», 1964, стр. 47—68.) 24. Ь а т Ь е к Л., Оп 1Ье са1си1из о! зугйасИс *урез, Ргос. Зутрозшт Ар- рНеа МаШ., 12, Ат. МаШ. Зое, 1961. 25. Ь у п A о п Н. С, Е^иа^^оп5 т !гее ^гоирз, Тгапз. Ат. МаИг. Зое, 96 A960), 445—457. 26. М с N а и § Ы о п К., ТЬе Шеогу о! аи{ота1а, То арреаг т Айуапсез 1*п Сотри1егз, V. 2 (Асас1егшс Ргезз). 27. М а Ы е г К., Оп а Шеогегп о! Ь1оиуШе \г НеЫз оГ роз111уе сЬагас1ег1з11с, СапшНап /. о/ МаШ., 1 A949), 397—400.
242 Н. Хомский, М. П. Шютценберже 28. М а р к о в А. А., Об одной неразрешимой проблеме, ДАН СССР, 78 A951), 1089—1092. 29. М111 е г О. А., СЬотзку N.. РтИагу тос1е15 ог 1ап^иа^е изегз, Напс1- Ьоок оГ МаШетаИса1 РзусНо1о&у, 2, ШПеу, 1963, 419—492. 30. М1 п 5 к у М. Ь., Несигз1Уе ипзо1уаЫШу о! РозГз ргоЫет оГ Та^, Апп. о/ МаШ., 74 A961), 437—455. 31. МуЬ 111 1, Ыпеаг Ьоипс1ес1 аи1ота*а, №АОО. ТесЬ. Ыо1е, 60—165, №пдЬ4 А1Г Вазе, ОЬю, 1960. 32. N е \у е 11 А., 5 Ь а \у .1. С, Рго^гатгшп^ Ше 1о&1с Шеогу тасЬте, Ргос. АУез1егп *1от1 Сотри1ег Соп!егепсе, 1957, 230. 33. О е 1 Н п ^ е г А. С, Аи1отаИс зугйасИс апа1уз1з апс1 Ше риз!1с1о\уп з!о- ге, Ргос. о\ 5утроз1а т АррПес! МаШ., 12, Ат. МаШ. 5ос, 1961. 34. Р а г 1 к Ь Н- ^., Ьап^иа^е §епега11п§ с1еу1сез, риаг!ег1у Рго^гезз Керог*, № 60, НезеагсЬ ЬаЬогаЬгу Е1ес1гошсз, М. I. Т., 1961, 199—212. 35. Р е г 1 е з М, НаЫп М. О., 8 Ь а т 1 г Е., ТЬе Шеогу о\ йеНш*е аи!о- та!а, ТесЬ. Нерог! № 6, О. N. Н-, 1961. 36. Р о 51 Е., А уаг1ап! о! гесигз1Уе1у ипзо1уаЫе ргоЫет. ВиИ. Атег. МаИг. 5ос, 52 A946), 264—268. 37. К а Ь 1 п М. О., 5 с о 11 О., РтНе аи!ота!а апс! Ше1г с1ес15Юп ргоЫетз, /. В. М. 1оигпа1 о/ Кевеагск, 3 A959), 115—125. (Русский перевод: Р а б и н М. О., Скотт Д., Конечные автоматы и задачи их разреше- разрешения, Кибернетический сборник, вып. 4, ИЛ, 1962, стр. 58—91.) 38. Н а п е у О. N.. Рипс{юпа1 сотрозШоп раНегпз апс! ро\уег-зепез геуег- 51оп, Тгапз. Ат. МаШ. 8ос, 94 A960), 441—451. 39. Н 11: с Ь 1 е Н. \\Л, С1аззез о! гесигз1Уе !ипс!1опз о! ргесПс1аЫе сотр1ех11у, Оос1ога1 О1зз, Оер1. МаШ., РппсеЬп II, 1960. 40. 8 с Ь е 1 п Ь е г ^ 8., Ыо1е оп Ше Воо1еап ргорег!1ез о! соп!ех1-!гее 1ап- ^иа&ез, 1п}огтаНоп апд, Соп1го1, 3 A960), 372—375. 41. 8 с Ь и 1 г е п Ь е г § е г М. Р., Оп ап аррНсаИоп о! зегш-^гоир теШосЬ, /. /?. Е. Тгапз., 1Т2 A956), 47—60. 42. 8 с Ь и { г е п Ь е г § е г М. Р., 11п ргоЫёте бе 1а Шёопе Aе аи!ота1ез, 8ётта1ге ОиЬге11 — Р1зо1 (Раг1з), Оес, 1959. 43. 8сЬй1гепЬег^ег М. Р., А гетагк оп !тИе 1гапзс1исег5, 1п]огтаИоп апд, СопггоХ, 4 A961), 185—196. 44. 8 с Ь й 1 г е п Ь е г § е г М. Р., Оп Ше скПпШоп оГ а !атПу о! аи!ота!а. 1п]огтаИоп апй Соп1го1, 4 A961), 245—270. 45. 8 с Ь и 1 г е пЬ е г § е г М. Р., 8оте гетагкз оп СЬотзку'з соп!ех!-!гее 1ап- ^иа^ез, риаг!ег1у Рго^гезз Нерог* № 68, НезеагсЬ ЬаЬога1огу о! Е1ес1- гошсз, М. I. Т., Ос*. 1961, р. 155—170. 46. 8 с Ь и! г еп Ь ег §е г М. Р., Оп а Шеогет о! К. Лип^еп, Ргос. Атег. МаШ. 8ос, 13 A962), 895—890. 47. 8 с Ь и 1 г е п Ь е г § е г М. Р., РтИе соипИп^ аи!ота1а, \п]огтаИоп апй СопШ, 5 A962), 91—107. 48. 8 сЬ и 1 2 епЬ е г § ег М. Р., Оп соп!ех1-!гее 1ап§иа§ез апс! ризЬс1о\уп з1ога^е, То арреаг 1П 1ВМ 1оита1 о/ ЯезеагсН. 49. 8сЬй12епЬег^ег М. Р. Сег1ат е1етеп!агу !атШез о! аи!ота1а, 8утр. оп та1НетаИса1 Шеогу о! аи!ота1а, Ро1у1есЬп1с 1пзШи1е о! ВгооЫуп, 1962. 50. 8 Ь е р Ь е г с1 з о п ^. С, ТЬе гес1ис1юп о! 1\уо-^ау аи!ота1а 1о опе-\уау аи!ота!а, /. В. М. ]оигпа1 о\ ЯезеагсН, 3 A959), 198—200. (Русский перевод: Шепердсон Дж. К-, Сведение двусторонних автоматов к односторонним автоматам, Кибернетический сборник, вып. 4, ИЛ, 1962, стр. 92—98.) 51. 8Ьат1Г Е., Оп зеяиепИа1 1ап&иа&ез, ТесЬ. Нерог1, 7, О. N. Н-, 1961. 52. V а т а с1 а А., Соигйт^ Ьу а с1азз о! &пушп& аи!ота!а, Оос1ога1 О1зз., Ш1у. оГ Реппа, РЫ1ас1е1рЫа, 1960.
СОДЕРЖАНИЕ Математические вопросы А. А. Альберт. Конечные поля. Перевод Ю. Л. Сагаловича .... 7 Р. Г. Г а л л а г е р. Простой вывод теоремы кодирования и некоторые применения. Перевод Б. С. Цыбакова . 50 В. Л. И с т м е н. О построении кодов без запятой. Перевод В. И. Ле- венштейна 91 Е. У. Карлайл. Приведенные формы для стохастических последова- тельностных машин. Перевод Р. Г. Бухараева . 101 Е. К р е й н д л е р. Развитие теории оптимальных по быстродействию про- процессов управления. Перевод В. В. Глаголева 111 Э. Роксин, В. Спинадел. Достижимые зоны для автономных си- систем дифференциальных уравнений. Перевод В. М. Яковлева . . . 149 Математическая лингвистика Н. Хомский, М. П. Шютценберже. Алгебраическая теория кон- контекстно-свободных языков. Перевод' Н. Г. Самойловой и Н. Г. Щер- Щербаковой : 195
КИБЕРНЕТИЧЕСКИЙ СБОРНИК № 3 Редактор Н. Ф. Музылева Художник Н. К. Сапожников Художественный редактор В. И. Шаповалов Технический редактор Т. А. Мирошина Корректор Л. Я. Шехтер Сдано в производство 17/У1 1966 г. Подписано к печати 3/Х1 1966 г. Бумага 60x90716 = 7,63 бум. л. 15,25 усл. печ. л. Уч.-изд. л. 13,4. Изд. № 1/3925 Цена 1 р. 11 к. Зак. 243 (Темплан 1966 г. изд-ва «Мир», пор. № 5) ИЗДАТЕЛЬСТВО «МИР» Москва, 1-й Рижский пер., 2 Ленинградская типография № 2 имени Евгении Соколовой Главполиграфпрома Комитета по печати при Совете Министров СССР, Измайловский проспект, 29