Текст
                    ПРОБЛЕМЫ
КИБЕРНЕТИКИ
ПОД РЕДАКЦИЕЙ
А. А. ЛЯПУНОВА
ВЫПУСК 13
§
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОП ЛИТЕРАТУРЫ
МОСКВА 1965


6П2.15 П78 УДК 519.95 Сборники «Проблемы кибернетики» выпускаются под общим руководством Научного совета по комплексной проблеме «Кибернетика» Академии наук СССР Председатель Совета академик А. И. Берг В СОСТАВЛЕНИИ И РЕДАКТИРОВАНИИ СБОРНИКА ПРИНИМАЛИ УЧАСТИЕ: Н. А. КАРПОВА, О. С. КУЛАГИНА, О. Б. Л У ПАНОВ, Б. Ю. ПИЛЬЧАК, С В. ЯБЛОНСКИЙ Сборник статей под редакцией Алексея Андреевича Ляпунова М., 1965 г., 2 52 стр. с илл. Редакторы: Г. В. Вакулсвская, Н. А. Ляпунова Техн. редактор С. Я. Шкляр Корректор А. Ф. Серкина Сдано в Физ. печ. набор 13/Х 1964 г. Подписано к печати 4/II 1965 г. Бумага 70xi08i/i6. л. 15,75 + 1 вкл. Условн. печ. л. 21,955. Уч.-изд. л. 17,63. Тираж 6 700 экз. Т-03072. Цена книги 1 р. 43 к. Зак. 453. Издательство «Наука» Главная редакция физико-матемазической литературы Москва, В-71, Ленинский проспект, 15. Московская типография № 16 Главполиграфпрома Государственного комитета Совета Министров СССР по печати. Москва, Трехпрудный пер., 9
СОДЕРЖАНИЕ I. ТЕОРИЯ УПРАВЛЯЮЩИХ СИСТЕМ В. К. Коробков. О монотонных функциях алгебры логики 5- Т. Н. К р у г л о в а. Об асимптотическом методе решения задачи о зарядах 29 В. Б. К у д р я в ц о в. О мощностях множеств предполных множеств некоторых функциональных систем, связанных с автоматами 45 В. А. К у з ь м и н. Реализация функций алгебры логики автоматами, нормальными алгорифмами и машинами Тьюринга 75 Л. А. Шоломов О некоторых классах логических функций, связанных с пороговыми 97 II. ТЕОРИЯ ИНФОРМАЦИИ И КОДИРОВАНИЕ М. Е. Р а т н е р. Асимптотика оптимальной вероятности ошибки при передаче информации по непрерывному симметрическому каналу без памяти со стиранием 115 III. ТЕОРИЯ ИГР С. Л. Амбарян, X. К. Брутяя, Т. М. Тер-Микаэляя. Об автоматической выработке оценки ситуации при игре в крестики и нулики . . . 131 A. Л. Б р у д н о, И. Я. Л а н д а у. Одномастка 141 IV. ВОПРОСЫ МАТЕМАТИЧЕСКОЙ ЭКОНОМИКИ И. А. Красе. Об управлении процессами плавки металла . . 161 V. ПРОЦЕССЫ УПРАВЛЕНИЯ В ЖИВЫХ ОРГАНИЗМАХ B. А. Г е о д а к я н. О существовании обратной связи, регулирующей соотношение полов 187 И. И. Ш м а л ь г а у з е н. I Эволюция в свете кибернетики .... 195 VI. ВОПРОСЫ МАТЕМАТИЧЕСКОЙ ЛИНГВИСТИКИ Т. Л. Гаврилова. О структурном анализе вьетнамского текста и одном способе записи его результатов 201 К. Ч у л и к. Использование абстрактной семантики и теории графов в многоязычных переводных словарях 221 Ю. А. Шрейдер. Об одной модели семантической теории информации . 233
4 СОДЕРЖАНИЕ VII. КРАТКИЕ СООБЩЕНИЯ Ю. В. Г л е б с к и й, А. М. Д у д и ч, Д. И. Коган, М. И. Л погонь к и й, Ал. А. Марков. Алгоритмы, осуществляемые повторяющи мися применениями конечных автоматов 241 А. М. Ильи и. Об аддитивных цепочках чисел 245 Наследственная информация и ее преобразования 249 И. И. Ш м а л ь г а у з е н. VIII. ХРОНИКА Семинары по кибернетике в МГУ 251
I. ТЕОРИЯ УПРАВЛЯЮЩИХ СИСТЕМ О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ В. К. КОРОБКОВ (НОВОСИБИРСК) Введение Характерной чертой математической кибернетики является построение и изучение модельных объектов. Таковыми являются контактные и электронные схемы, автоматы, алгоритмы. Важнейшим звеном в изучении модельных объектов являются функции алгебры логики. Однако изучение класса всех функций алгебры логики наталкивается на значительные трудности. Так, из работ К. Э. Шеннона [1] и О. Б. Лупа- нова [2] известно, что большинство функций алгебры логики допускает лишь очень сложную схемную реализацию. Аналогичные трудности возникают и в других проблемах, связанных с функциями алгебры логики: построение теста [3] для произвольной функции алгебры логики f(xu х2, ..., хп), построение минимальной дизъюнктивной нормальной формы [4] для f(xu x2, ..., хп). Поэтому различными авторами [1, 5, 6 —9] изучались классы функций, существенно более узкие, чем множество всех функций алгебры логики. С. В. Яблонский [6] построил континуальное семейство инвариантных классов функций по параметру о (0<о<1), которые допускают более простую схемную реализацию. Однако для «большинства» классов (точнее, для классов, у которых а Ф 0) минимальные схемы для почти всех функций из этих классов имеют тот же порядок сложности, что и в общем случае. Для классов с параметром о = 0 не всегда удается общим методом получать схемы достаточно «хорошие». В настоящей работе исследуется класс монотонных функций. Класс монотонных функций алгебры логики является инвариантным классом с параметром о~0. Этот класс является «средним» по мощности: хотя он содержит достаточно много функций, но их «существенно меньше», чем всех функций алгебры логики. Далее, он «устроен совсем иначе», чем класс всех функций (в отличие, например, от класса самодвойственных [10] функций, класса симметрических функций [5], линейных функций [10]). Кроме того, многие прикладные задачи сводятся к изучению тех или иных свойств монотонных функций. Работа состоит из трех глав. Первая глава посвящена оценке числа монотонных функций алгебры логики, зависящих от п переменных хл, х2, ..., хп. Известно (см. [И]), что монотонные функции от переменных xt, x2, ..., хп образуют свободную дистрибутивную структуру с п образующими и задача о числе i|) (п) элементов этой структуры была поставлена Дедекиндом в 1897 году в работе [12], где он определил
6 В. К. КОРОБКОВ число элементов структуры с четырьмя образующими. Позднее Р. Чёрч определил г]) (5) (см. [13]), а М. Уорд с помощью счетной машины в 1946 году —ij) (6) (см. [14]). Общие оценки для числа монотонных функций алгебры логики, зависящих от переменных^, х2, ..., хп, были получены Э, Н. Гилбертом в 1954 году [15] и имели вид 2е п <г|)(л)</гс" +2. В настоящей работе показывается, что имеет место следующее: с[т] с[т] где А—некоторая постоянная. Устанавливаемая ниже оценка более точно выглядит следующим образом: [—1 г|)(л)<2 п, где В= *.log2* ^4,23 (j/9 — 1)3/2 И гп —> 0 При 72 -> ОО . Таким образом, установлен порядок логарифма я|5 (тг) *): ММ 2П log2 г]) (/г) х С* J или log2 г|) (/г) X -^= . }/ п Во второй главе рассматривается задача синтеза схем из функциональных элементов для произвольной монотонной функции алгебры логики, зависящей от переменных хи х2, ... ,хп. Из мощностных соображений следует, что сложность схемы из функциональных элементов для произвольной монотонной функции от п переменных оценивается снизу величиной Л1^-г-(1 — о (1)), где Ах — некоторая постоянная. В работе В. И. Резника [17] дан метод, позволяющий строить схемы из функцио- нальных элементов со сложностью не более чем А2—у-\°%\ п- П° методу, предложенному Э. И. Нечипоруком [18], можно строить схемы со слож- 2п ностью не более чем А3 -^- log2 n • Идея разложения монотонной функции по двум группам переменных, использованная в первой главе, позволила при синтезе схем из функциональных элементов применить принцип локального кодирования, предложенный О. Б. Лупановым [19]. Ниже, во второй главе, для произволь- *) Символ f(n)xg(n) означает: существуют две положительные константы с4 и с2 такие, что при достаточно больших п имеет место с^ —/—г<* сг-
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ / ной монотонной функции, зависящей от переменных х^ х21 ... , хП1 строится схема из функциональных элементов, имеющая не более чем D -Зу (1 + о(1)) элементов, где D= /(ysJ ча/ ^4,27. (4"2-1)/2 Таким образом, установлен порядок функции Шеннона для монотонных функций алгебры логики. Последняя, третья глава посвящена вопросу, возникшему в приложениях математической логики. Именно: если некоторая (неизвестная нам) монотонная функция алгебры логики задана оператором Af, вычисляющим для произвольной точки (аь а2, ..., ап) £ Еп значение функции /(.гь х2, ... ,хп) в этой точке, т. е. / (а4, а2, .., ап), то как минимальным числом обращений к оператору Af полностью восстановить таблицу значений монотонной функции / (хи х2, ..., хп), т. е. определить значения данной функции во всех точках 72-мерного единичного куба? При этом после каждого обращения к оператору полученное значение функции в некоторой точке распространяется по монотонности на другие точки. Рассмотрим множество алгоритмов {F}, решающих указанную задачу, т. е. для произвольной монотонной функции алгебры логики, зависящей от переменных хи х2, ..., хп — / (хл, х2, ..., хп),—любой алгоритм F с помощью оператора Af полностью восстанавливает таблицу значений монотонной функции / (хи х2, ..., хп). Пусть <p(F, /)—число обращений к оператору Af, достаточное для восстановления таблицы значений монотонной функции / (#i, х2, ..., хп) при использовании алгоритма F. Рассмотрим функцию (p(F, п) = max <p(F, /), где Мп — множество всех монотонных функций алгебры логики, зависящих от переменных Xi, Х2, ... , Хл. Определим также (p(n) = min (p(F, n). То есть ф (п) есть минималь- F ное число обращений к оператору Af, достаточное для восстановления таблицы значений монотонной функции f (xiy хъ ..., хп) при использовании алгоритма, решающего поставленную задачу. В работе показывается, что справедливы следующие оценки: [т]- Ш- 8 [т] а Сп +Сп <фИ<-(2з^_1)3/2 Сп (1 + о(1)). Для получения верхней оценки в работе строится алгоритм F, облада- ющий cBoiicTBOM [т] Ф(Л "К (2^2-i)3/2 С» (1 + °(1))- Предполагается знакомство читателя с основами алгебры логики (например, в объеме первых трех параграфов статьи С. В. Яблонского [10]). Результаты первой и третьей глав с несколько худшими оценками опубликованы в [24— 26].
В. К. КОРОБКОВ ГЛАВА 1 Известно, что в качестве области определения функций алгебры логики можно рассматривать множество Еп вершин 72-мерного единичного куба. Множество Еп упорядочим следующим образом: будем говорить, что точка а= (аь а2, . . ., ап) из Еп предшествует точке P=(Pi, P2» • • •» Рп) из Еп (или точка (5 следует за точкой а), если (Xj<f}j (1<£<д). Тот факт, что точка а предшествует точке р, будем обозначать через а =^ р. Если же а =^ (3 и а Ф (5, то будем писать а -< р. Две различные точки аир называются сравнимыми, если выполнено одно из условий а -< р или р -< а. В случае невыполнения ни одного из этих условий точки называются несравнимыми. Функция алгебры логики f (хи х2, ...,хп) называется монотонной, если из того, что а -< р, следует, что /(аь а2, ..., ад)</(рь р2, ..., рп). Монотонные функции используются во многих исследованиях по алгебре логики, однако до настоящего времени нет точной оценки числа монотонных функций алгебры логики, зависящих от п переменных хи х2, ..., хп. Известные в настоящее время оценки, полученные Э. Н. Гилбертом [15], имеют вид 2n <ур{п)<п'п + 2> где ур(п) — число монотонных функций алгебры логики, зависящих от переменных х1у х2, ..., хп. Т. е. даже логарифм i|)(ra) не оценивается с точностью до постоянного множителя. Ниже показывается, что справедливы следующие оценки: Д] с[т] где А — некоторая постоянная. Полученная в работе верхняя оценка более точно выглядит следующим образом: ИМ ■ф(л)<2 0 31(ж23 л где B = (f^ZiW2 и е*-*0 ПРИ "->°°- Для получения этой оценки прежде всего установим справедливость следующей леммы. Лемма 1. 0ь_1 rl ^ -I 2п~к Ф(*Х(Ч>(*-*)) 2к , (1) где 1<Л<л —1. Эта лемма является основой для получения дальнейших результатов, поэтому ее доказательству отводится большое место. Будут даны два доказательства этой леммы. Конструкция второго доказательства понадобится при описании процесса синтеза схем. Оба доказательства будут заключаться в том, что будет показано следующее: произвольная монотонная функция алгебры логики полностью определяется заданием 2h~l монотонных функций от п — к переменных
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ 9 и, кроме того, заданием значений самой функции на множестве, содержащем не более С^2^2п~к точек. Первое доказательство. Известно, что любую функцию алгебры логики можно представить следующим образом: / (#!, Х2, . . . , Хп) = = \/ Х°:1 ХУ • • • Xlk f К' G2> • • > °h, Xk+l, • • • , Xn). {(ovo2,...,oh)} x 2 Заметим, что если /(^i, x2l • • •» %n) — монотонная функция, то все функции f{ou a2, . . ., ok, xh+i, . . ., xn) от п — к переменных также будут монотонными. Рассмотрим одновременно другое представление той же функции: / (#!, Х2, . . . , Xn) — = V a^t1 4+t2 • • • хпп f (жь *2. • • • > *а, аА+1, . . ., ап). Пусть f(xux2l ...,xn) — произвольная монотонная функция алгебры логики. Очевидно, что задание всех функций / (х1ч х2, . . ., xkl a&+1, . . ., оп) или всех функций /(а1? а2 . . . а&, #д+1, . . ., хп) полностью определяет функцию f (хи х2, ...,хп). Утверждается, что если задать ровно 2к~1 функций /(а2, а2, . . ., а&, xk+u . .., дг71), именно тех, для кото- к рых 2ai нечетна, то любая из функций f {xi, x2, ..., Xk, Ok+i, . .., cj71) останется не определенной не более чем в CJi J точках. Действительно, любая из функций j(xu х2, . . ., х&, аА+1, . . ., ап) от к переменных уже будет определена во всех точках (а4, а2, . . ., а^), у которых сумма координат нечетна, а также, в силу монотонности, и в некоторых других точках. Так как, если монотонная функция алгебры логики g (хи х2, . . ., хт) в некоторой точке a = (a4, a2, . . ., am) из Ет равна нулю, то g (xu x2l . . ., хт) равна нулю во всех точках ((i^, р2, . . ., рт), предшествующих точке а. Аналогично, если монотонная функция алгебры логики в некоторой точке равна единице, то она равна единице и во всех точках, следующих за данной. Рассмотрим в области определения функции f(xu . . ., xh, a&+1, . . ., an), т. е. в /t-мерном единичном кубе, выделяемом в Еп фиксированием последних п — к координат Xi = ot (& +1 < г<я), две различные сравнимые точки: a = (a1, . . ., aA, ok+u .. ., оп) и $ = (рь . . ., рА, oh+u . . ., оп). к к Пусть a <; р. Тогда ^ с^ < ^ Р*. Очевидно, что найдется нечетное г=1 г=1 к к число Г такое, что 2j аг<Г<2 Pi- Легко видеть, что в том же /с-мер- г=\ 1=1 ном кубе можно найти точку у = (уь Y2> • • •» Y&> °тн-ь • • •» °п) такую, к что а =^ у =^ р и У! Y/ = r. Но значение монотонной функции г=1 f (xiy х2, ...,хп) в точке y тогда определяется заданием функции к /(Yi> Y2> • • - Ya» ^а+ь • • •» ^п) (для которой 2 Yi нечетна). В силу Миноге тонности функции / (#!, ;г2, . . ., #п) ее значение будет определено и в одной из точек а или р. Следовательно, если функция / (хи х2, . . ., х^, ok+u .. ., оп)
10 В. К. КОРОБКОВ не определена одновременно в двух точках /с-мерного куба, то эти точки Г--1 несравнимы. Так как известно, что в Е\ существует не более Cfc 2 -I несравнимых точек [20], то отсюда и следует наше утверждение. Для завершения доказательства леммы остается лишь заметить, что число функций / (xi, х2, . . ., хк, Gk+u • • •» оп) равно 2n~\ Второе доказательство. Назовем цепью последовательность S точек Ет, которая содержит ровно (т+1) точек а0, аь ..., ат, удовлетворяющих условиям: а0 -< а! -< а2 ■< ... -< ат. Из определения цепи непо- т средственно следует, что если а* = (aj, aj, . . ., ajj, то 2 а] =i (0 < i < m). Заметим, что у точек с нечетными номерами сумма координат нечетна, а любая точка ai+l отличается от точки at тем, что одна из координат точки at изменила свое значение с нуля на единицу. к /7-Т к (дл-Л) п к п-к Рис. 1. Понятие цепи было введено Э. Н. Гилбертом [15], и им же было [."!} показано, что в Ет можно провести не более СЛа2 J цепей так, чтобы любая точка Ет принадлежала по крайней мере одной цепи. Рассмотрим теперь произвольную монотонную функцию алгебры логики j(xux2, . . ., хп). Зададим все функции / (оь о2, . . ., ak, xk+u • • •* хп), h. \-k] для которых 2 °t нечетна. Предположим также, что в 2?Л построены СJ 2 J i=l цепей Гилберта. В области определения функции / (#ь ,т2, . . ., дгд, (Та+ь . .., an), т. е. в Л-мерном единичном кубе, выделяемом в Еп фиксированием последних п — к координат, рассмотрим одну цепь {а0, аь . .., dk], где <хг = (а*, . ..,а*,оА+1, ...,а7г) (0 < г < Л) (рис. 1). В этой цепи у всех точек с нечетными номерами сумма первых к координат нечетна. Поэтому значение функции f (xit х2, . . ., хп) в этих точках определяется заданием функций /(аь а2, ... k у которых сумма 2 Oi нечетна (рис. 2). г=1 В силу монотонности функции f (xi, х2, .. ., хп) не более одной пары точек a2p-i и а2р+1 с нечетными что / (Xi, x2, ...,хп) в точке а2р_! равна нулю, а в ffft» #ft+l» • • • » ^Vl) в цепи найдется номерами таких, точке а2р+1 равна
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ 11 единице. Т. е. в каждой цепи найдется не более одной точки а2р с четным номером, в которой значение функции f (х<±, х2, ...,хп) не определится заданием функций / (ои а2, . . ., ok, xk+l1 . . ., хп), у которых /{ 2 tfj нечетна. Лемма доказана. Замечание. В лемме каждая функция / (хи х2, . . ., Xk, tffc+i, . . ., оп) сначала определялась на всех нечетных «слоях» Ekl и тогда, в силу монотонности / (#!, х2, ...,хп), в каждой цепи оставалось не более одной точки, в которой значение f (х1у х2, . . ., хп) еще не определено. Очевидно, что если функцию / (хи х2, . . ., xk, а^+1, . . ., оп) задавать на «слоях» с номерами, делящимися на d, то в каждой цепи останется не более f=0 f=0 f=\ f=\ /И • • •»(♦)• m • • • Рис. 2. d—1 точек, в которых значение / (xiy х2, . . ., хп) будет еще не определено. Легко видеть, что на цепи d— 1 точек, следующих друг за другом, а4-< а2-<...-< ad_b монотонную функцию можно определить не более чем d способами, откуда следует, что V ndl Ш Ц(п)<(Ц(п-к))1=0 d h (2) Используя утверждение леммы 1 и замечание, докажем три теоремы об оценке числа монотонных функций алгебры логики от переменных хи х2, ..., хп. Первая теорема дает грубую оценку, но ее доказательство очень простое и в нем в явной форме содержится идея доказательств второй и третьей теорем. Вторая теорема устанавливает наилучшую асимптотическую оценку, вытекающую из леммы 1. Наконец, третья теорема дает абсолютную оценку (т. е. без остаточного члена) сверху для числа монотонных функций от переменных хи х2, ..., хп. Заметим, что первая теорема с подходящей константой также дает абсолютную оценку. Теорема 1. Число монотонных функций алгебры логики от п переменных хи х2, . . ., хп не превосходит 2 п , где А — некоторая постоянная. Доказательство. Так как всегда \|з (п) < 2 , то для любого п0 можно подобрать такое А0, чтобы удовлетворить начальным условиям индукции г|)(тг)<22"<2 Уп (1<п<га0). Для того чтобы оценка была справедлива и для больших п, достаточно выполнения неравенств (см. (1)) log2 ф (в) < 2fe-i log2 ф (п - к) + 2"-*С Ш < Ау^ ■
12 В. К. КОРОБКОВ Г—1 2™ Так как*) С^2 J <Z)—: , где D — некоторая постоянная, то, предполагая оценку доказанной для всех чисел меньших, чем п, получаем, что А должно удовлетворять неравенству 2п~ k и 2k 2n ** ■ <yn-h г4 - * *• 2к'гА -4= + 2n'kD -V < А Yn^lc Vk Уп Покажем, что существует решение последнего неравенства относительно А. Положим к = у . Так как -тг< у <у ПРИ п ^ 2,. то получаем, что А должно удовлетворять неравенству Очевидно, что любое А^—~-— является решением неравенства. Тогда Л = тах(Л0, —К—) удовлетворяет условию теоремы. Теорема 2. Число монотонных функций алгебры логики, зависящих от п переменных х<±, х2, ..., хП1 не превосходит где В= , -г- ь2чЧ/ ^ 4,23 и е7г-^0 при п—>оо. (]Г9—1)3/2 r Доказательство. Пусть п достаточно велико, п ки /с2, ..., кР — натуральные числа, удовлетворяющие условию ki + k2+ . . .+кр<п. (3) *) Действительно, используя оценки для п\ (формула Стирлинга), данные в [211: 4 Y2n~n ^- < п\ < УЫг^- ^ , можно легко получить, что /Т 2^1 ~Ш^ гт _ (2т)! /"2" 22"1 Г2Л2Тг У Л Ybk ^ C2m- m!7n! <-- J/ я ^ ./2^=1 /Т 22"-1 - ш _ V ~2ИГ V 1Г 1^2^=1 <С2,п-1- _J cm <ll/Ai!!l ста^|/2 22»'-' щЬт) - 2" 4тЧ 2 К Я 1/9^ * < К Л 1/2^1=1 У^2;?г " л Y'tm—\ Обозначая ]ж[ = -—[^я], получаем: Л Л=П: ,/АЛ в 6Ш<СШ < г/Т? Л у 2щ v л у» v л V* откуда получаем, что С^ 2 -1 ~ 1/ — при гс —> оо.
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ 13 Тогда из замечания к лемме 1 непосредственно следует, что № log24)(n)<( 2 Czhi1)log2^(n-ki) + 2n-hlCk12hog2z< [т] г=0 [Т] [Т2] . . г*п <(£ Cl\){2 Cj?t)log2y(n-ki-kJ + 2n-klCk12ilog2z-t ■*!■ V L z + (lSJai)2"-"1-'%[22"]log2z<...<(fJ "2" C$ log2i|)(n-S &,) + i=0 i=l i=0 p г—1 [ z n-2*« Ш + log,*S ITS" «J 2 5=1 ci/l (4) 2 = 1 j = l / = 0 J l о При этом будем считать, что J J (...) = 1. Положим kt = -—^r n Г i=l и выберем /? так, чтобы {p+l){V9ri>n>p{V9)>. Это всегда возможно при достаточно большом п. Тогда условие (3) будет выполнено. В самом деле, 2*<'+,у'-"'2^=н(1-^), 1=1 = п + р— —^<п + р — р = п. Из условий для р получаем: п > p(Y$)P = р 32/зР> 32/зР, откуда следует 3 р < у log3 /г. Из первого неравенства для /? имеем: (3/9)р+1 = 32/з(р+1)>-4т, Зр- „3/2 :>■ ,.3/2 3(p + i)»/.-3(4log,»+l)'/»f Р> ylogaw— 1— ylog3^ylog3re-|-l) , т. е. р—» со при п-^оо. Но из определений А;, следует h = f9-l (f9)4 > !3=^>(Г9-1)р, (f"9) т. е. для любого i (l<i</)) /сг^оо при тг^оо. Положим z== 3. Известно (см. [23]), что (5)
14 В. К. КОРОБКОВ Учитывая, что kt^co (1 <£</?), получаем, что (равномерно по i) W 2 <*',■ _2_ 3 п 2^:~^2« r'i 3' Q.2 J ~ j/ — -^- (см. сноску на стр. 12). Учитывая, что log2i|) (m) <2m, получаем из (4) для z = 3, что при достаточно больших п Р log^CnXCl + L)^^-1 log2i|)(ii-2 Af) + г=1 г-i г + log, 3 2 3^2" 2 " /|^)< i=i Ykt; <(l + in)(^2« + log23 2-lr2V4w)^ г=1 где in—>0 при п—>оо. Из определения чисел /с^ имеем: 1 / ОГ~М ' -Ш / 1. ^ (f 9)* ' V*t Vn Vf 9—1 ? откуда p ^3* /^ ^ VnYfTTi ^ (f 9)1 ^ /* |/рЗ[ ^ (f 9)* Vn (f 9-l)3/2 " Окончательно получаем (см. (5)): lo82*<»><(1 +1.) (p2" + (-^^-, /| y; ) < <7fey37^^ (i + en), Где e„_>0 при n->co. Теорема З. Число монотонных функций алгебры логики от переменных хи х2, . . ., хп не превосходит 2 п .
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ 15- Доказательство будет проводиться в 3 этапа: 1) для 1 <гс<30; 2) для 31<гс<60; 3) для л>61. 1. Известно, что log2i[) (/г)<Сп J log2 (rc-f 2) (см. [15]), откуда сле- Р1 Г—1 дует, что log2i|)(^)<CrJ log2(n + 2)<5C?1i2J при 1<тг<30. 2. Рассмотрим следующее разложение монотонной функции/ (хи . . ,,хп): ] (Х^у Х2, . . . , Хп) = Х^ Х2 J (U, U, #з> • • • > Хп) V \Jxix2 /(0, 1, х3, . . ., xn)\/xi х2 /(1, 0, х3, . .., £n)V V^l Х2 / (1> 1> ^*3> • • • > Хп). Если мы зададим две функции / (0, 1, х3, . . ., хп) и / (1, 0, х3, . . ., #„), то функция f (хи х2, ...,хп) останется неопределенной не более чем в 2П~2 точках. В самом деле, если мы определим исходную функцию в точке (0, 1, а3, . . ., ап) из Еп, то в силу£ монотонности функция f (х1у х2, ...,хп) будет одновременно определена J либо в точке (О, 0, (х3, . . ., ап), либо в точке (1, 1, а3, . . ., ап).^Отсюда|следует, что tf(n)<(^(n-2))222"-2. Из этого соотношения легко получаем: log2 г|з (п) < 2 log2 ф (п — 2) + 2^2 < 22 log2 ф (п — 4) + 2П"2 4- 2""3 < < 23 log2 ф (п — 6) + 2П~2 + 2П_3 + 2П_4 < ...<2L~*4og2i|>(n-2 [^J) + 2n-2 + 2n-3 + гп--4-1 _ [-71—4-1 _ Учитывая, что ij)(4)<28 и г|) (5) < 213 (см. [15]), получаем при л = 2т: log2 г|) (n) < 2т~2 log2 г|) (4) + 22т~2 + . . . + 2m+1 < г2171"1, при п = 2т + 1: log2 -ф (w) < 2m"2 log2 г|> (5) + 22m_1 -h . .. + 2т+2 < <2т~216 + 22т-1 + 22т"2 + ... + 2т+2< 22т,. откуда следует, что log2i|) (n) < 2й"1. Поэтому для доказательства теоремы при 31 < 72 < 60 достаточно показать, что при этих значениях п pi 2n-1<5Ctt . Как известно*), е~х > 1 — х при положительных х. Поэтому из оценок для С„ J (см. сноску на стр. 12) получаем: _ 1 |/ 2 j | [ ^ » /« 25/1 Л—\е 3Н[А2_!!<25(#])2, 1 2Ш] 25/1—rVrVl~rVr-H?<25(cP).. L__\ (\ 1 \ 2 2^n *) При x > 0 в* - ^ -^ < ^ хП= fz^ ' 0ТКУДа е~* > 1 ■ п=0 п=0
16 В. К. КОРОБКОВ Таким образом, для того чтобы теорема была справедлива при 31 < п < 60, достаточно, чтобы или f так как при га>31 имеем NN > 16 j чтобы Очевидно, что последнее неравенство справедливо при 200-31.47 РЛ , 3. Для гс>61 доказательство будем проводить методом математической индукции. Предположим, что теорема справедлива для всех чисел, меньших /г, и докажем ее справедливость для п. Для этого в (1) положим ^= Г 1 ~$Ц)п I • Тогда для п>61 получаем: [-1 [—1 f- log2 ф (п) < 2"-1 log2 ф (П - к) + 2"-ftCfcL 2 J < 2k-l5cL\ J f 2n-*CfcL 2 2J< -.Г4 12 ( ( 1-^= ) ^--1 ^ ■< 2] Теорема доказана*). l/l-—-- /ТГ|е-Ш.5/|_^< *) В цепочке неравенств, завершающих доказательство, необходимо с точностью до третьей значащей цифры вычислить значения двух арифметических выражений: * f4 .,-f~2e . 2 l/l—I— I AfP.Wu. * H2(60f4-6l)^^ fl 61
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ 17 X, 1 1- J...J ** 1 U 1 1 ■ ' '■ * • I !••• 1 1 F \ ГЛАВА 2 Метод задания монотонной функции, использованный в первой главе, позволил при построении схем из функциональных элементов для монотонных функций алгебры логики использовать принцип локального кодирования, предложенный О. Б. Лупановым [19]. Методы синтеза схем, предложенные ранее различными авторами [1,6,8], заключались в основном в следующем: функция алгебры логики представлялась в виде суперпозиции функций из универсальной в некотором смысле системы функций от меньшего числа переменных, затем строились схемы для функций этой системы, и в соответствии с представлением исследуемой функции производилось объединение схем функций из универсальной системы. Схема, построенная по этим методам, работала следующим образом: в соответствии со значениями одной части переменных к выходу схемы подключалась одна из схем, реализующих функции от остальных переменных (т. е. подключалась одна из схем, реализующих функции из универсальной t системы). Например, при построении схемы по методу Рис 3. К. Э. Шеннона [1] поступают так: функция алгебры логики разлагается по первым к переменным, и схема синтезируется из двух блоков (рис. 3). Здесь блок U имеет п — к входов Xk+i* xk+2i • • •» хп и 2 выходов, соответствующих всем функциям алгебры логики от переменных Xk+\, • • •, хп. Блок F имеет 23 ~\-к входов и один выход (выход схемы). Блок F в соответствии со значениями переменных хи х2, ...,хи подключает к выходу всей схемы один из выходов блока U в соответствии с разложением функции по первым к переменным, а состояние соответствующего выхода блока U определится набором переменных %k+li • • • » хп* Опишем теперь некоторый частный случай принципа локального кодирования. Функция разлагается по первым к переменным. Затем функции от /г — к последних переменных, получающиеся в результате разложения, некоторым специальным образом кодируются, т. е. каждой функции однозначно сопоставляется некоторое двоичное число. Схема в соответствии со значениями первых к переменных в качестве промежуточного результата реализует код той функции от остальных п — к переменных, которая соответствует значениям первых к переменных в разложении исследуемой функции. Затем по этому коду восстанавливается таблица значений этой функции, и в соответствии со значениями второй части переменных из этой таблицы выбирается необходимое значение. То есть вместо построения схем для универсальной системы строится схема, реализующая код необходимой нам функции из универсальной системы, и схема, осуществляющая декодирование этого кода. Блочная схема для произвольной функции алгебры логики будет выглядеть следующим образом (рис. 4). Блок А имеет к входов и некоторое число т выходов и реализует код функции от переменных жл+1, хк+2, . . ., хп, соответствующей в разложении данному набору значений первых к переменных аь ... а^. Блок В имеет т входов и 2n~k выходов и реализует таблицу значений функции /(аь а2, ..., aft, xk+u _.^ %) Блок С в соответствии 2 Проблемы кибернетики, вып. 13
18 В. К. КОРОБКОВ Х1 Х2 I 1 • • 1 А 1 I 1 В | | . . хк •1 *♦ 1 ХН*1 • A J. • • *п •1 | С | со значениями переменных ^+и ^а+2> • • • > хп выбирает из таблицы необходимый разряд, т. е. подключает к выходу всей схемы один из выходов блока В. В данном случае в качестве кода функции можно сразу же рассматривать таблицу ее значений, тогда блок В не, будет содержать в себе ни одного функционального элемента. Выходы блока В будут просто совпадать с соответствующими выходами блока А. Вообще, принцип локального кодирования наиболее целесообразен в тех случаях, когда длина кода т мала по сравнению с 2n~k и построение таблицы значений функции по коду (декодирование—блок В) осуществляется просто, например, когда значение элемента таблицы зависит от сравнительно малого числа разрядов кода, т. е. когда каждый выход блока В зависит от небольшого числа выходов блока А. Ниже принцип локального кодирования используется при построении схемы из функциональных элементов*) для произвольной монотонной функции алгебры логики. В качестве элементов для построения схемы будем использовать конъюнктор, дизъюнктор и элемент, реализующий J отрицание. Как показал Д. Е. Маллер [22], выбор базисных функций может повлиять лишь на р , постоянный множитель в оценке, но поскольку для числа монотонных функций логарифмы верхней и нижней оценок (известных в настоящее время) отличаются на постоянный множитель, то мы не будем стремиться получить в оценке для сложности схемы минимальную константу. Из леммы 11 работы [16] и нижней оценки для числа монотонных функций алгебры логики [15] следует, что для реализации произвольной монотонной функции алгебры логики от п переменных хи . . ., хп схемой /Т 2п ~~~зТг" (1 — ° (1)) элементов. Основной результат данной главы можно сформулировать в виде следующей теоремы. Теорема 4. Схема из функциональных элементов для произвольной монотонной функции алгебры логики от п переменных хх, х2, ..., хп 8 /Т 2п содержит не более Тз/i у 7Г~~372 (1 + 8п) элементов, где еп-^0 при п —> оо. Схему для произвольной монотонной функции будем строить в соответствии с приведенной выше блочной схемой (рис. 4). Предварительно докажем лемму о кодировании. Для этого введем некоторые понятия, которые нам понадобятся также и в главе 3. Рассмотрим произвольную монотонную функцию алгебры логики f (хЛ, х2, ..., хт) и р положительных чисел kt= v 3/-- \i т\ (1<*<Р)г р — число, удовлетворяющее условиям: (р+ 1) (3|/1б)р+ >т>р(|/1б)р- Определим функцию т-го ранга (1<г<р) как функцию, получающуюся из / (хи х2, . . ., хш) замещением первых аГ переменных :) Определение схемы из функциональных элементов см., например, в [16].
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ 19 константами, где ar=^1ki (1 < г< р). Функцию / (хи х2, .. ., хт) будем i=i называть функцией нулевого ранга, т. е. положим а0 = 0. Назовем функ- ai цию г-го ранга правильной, если все суммы вида V ст</(1<1<;г) *=**_! + ! делятся на четыре. По определению функцию f(xi,x2, ..., хт) тоже будем считать правильной. Заметим, что число правильных функций г-го г si ранга равно Д ^ СЪ где *i== [~г] * i=\ ;=0 Лемма 2. Все монотонные функции алгебры логики от т переменных хихг, ...,хт можно перенумеровать (закодировать) последовательностями из g (т) двоичных разрядов так, что 8 /"о" 2т где £то —> 0 при т —> оо; 2) схема, реализующая по коду функции таблицу ее значений, содержит не более 3-2т функциональных элементов. Доказательство. Кодирование. Предположим, что введенные выше (стр. 10) цепи ^ Гилберта перенумерованы для любого г(1<г<т), т. е. для любого г в ЕГ имеются №/23 последовательностей Sr{= {ar0\ а\\ . .., а™} (1 < £<Cf;r/2]), удовлетворяющих условиям: 1) ctf <а«< ... < а?; 2) любая точка Ег принадлежит по меньшей мере одной последовательности. г Номером точки (а1? а2, . .., аг) из ЕТ будем называть число 2 аг2'~г, г=1 а номером правильной функции s-го ранга f (oi, . . ., aa , ха +1, ..., £m) будем считать номер точки (at, a2, . .., aas) Отметим, что, вообще говоря, не всякому набору длины as соответствует правильная функция. Любую правильную функцию (s—1)-го ранга (s=l, .. ., р) можно записать следующим образом: gs-l (2/1, • • • , Vq, ZU ...,Zt) = f (alf . . ., Oasl, Xa8_i+i, . . . , Xm), где q = k8, t = m — as, yi = xas_i+i (l<i<ks), zj = xa^j (l<f<m — as). Если мы зададим все правильные функции 5-го ранга, то тем самым мы зададим все функции gs-1 (6l, . . ., 6q, zu . . ., zt), для которых суммы я 2 &t делятся на четыре. Тогда для любого набора (ги е2, . . ., е*) функ- i=i ция gs_i (уи у2, . .., yq, elf г2, . .., et) на каждой цепи Гилберта останется неопределенной не более чем в трех точках. Пусть для цепи Si это будут точки а1? а2, а3 (а4 -< а2 -< а3). Пусть значения функции ff*-i (Уи • • . 1 Vq, 8i> • • • 1 £t) в точках alf a2, a3 суть соответственно ги г2, г3. Из монотонности исследуемой функции и того, что а4-<а2-<аз, следует, что возможны следующие наборы значений г{, г2, г3 (см. таблицу 1). Определим две функции от переменных гА, r2, r3— w± и w2 (см. таблицу 2). Заметим, что w{ и w2 — ne всюду определенные функции. В случае, 2*
20 В. К. КОРОБКОВ Таблица 1 Таблица 2 Таблица 3 Таблица 4 Таблица 5 п ' 0 0 1 Г2 0 1 1 И?! 0 1 1 W2 0 1 0 1 1 0 0 0 1 Г2 0 0 1 1 7*3 0 1 1 1 Ui 0 0 1 1 W2 0 1 0 1 п 0 0 0 1 Г2 0 0 1 1 гз 0 1 1 1 п 0 1 W\ 0 1 U>2 о' 1 Wi 0 W2 0 если в цепи Si имеются две точки, в которых значение функции g"s_i (г/i, .. ., yq, еь . . ., et) не определяется заданием всех правильных функций 5-го ранга (это возможно, когда а4 и а2—последние точки в цепи), а также в случае, если найдется в цепи одна точка или не найдется ни одной, то wv и w2 определим заданием таблиц 2, 3, 4 соответственно. Код для монотонной функции / (хи х2, . .., хп) будем строить возвратной индукцией — код правильных функций s-ro ранга будем строить из кодов правильных функций (s■■+- 1)-го ранга. Код правильной функции нулевого ранга и будет кодом исследуемой монотонной функции. Код / (х{, х2, .. ., хп) будет представлять собой строку из g(m) двоичных разрядов, которые будут устроены так: сначала будут записаны коды всех правильных функций р-го ранга, затем будут следовать разряды, которые вместе с кодами всех правильных функций р-то ранга образуют коды всех правильных функций (р—1)-го ранга, и т. д. Точнее, будем поступать так. В качестве кодов правильных функций р-то ранга возьмем таблицы значений этих функций, т. е. код каждой правильной функции р-го ранга будет представлять собой строку из 2m~av двоичных разрядов. Выпишем подряд коды всех правильных функций р-то ранга в соответствии с нумерацией этих функций, определенной выше. Мы получим строку Ар из (Й S С%)2Г-р i=l 5=0 двоичных разрядов. Чтобы получить коды всех правильных функций (р — 1)-го ранга, к строке Ар в соответствии с нумерацией правильных функций (р — 1)-го ранга, для каждой функции gp_i (уи уг, . . ., yqj ziy . . ., zt) припишем по 2 С[ 2 -12m ар двоичных разрядов следующим образом. Рассмотрим р функцию g-p_! (г/ь .. ., yq, 0, .. ., 0) и для каждой цепи Si в соответствии с их нумерацией запишем значения wv и w2\ затем то же самое сделаем для функции gp_! (г/t, . .., yq, 0, ..., О, 1) и т. д. Мы получим строку Ар_{ из (IT X C«)2m-°J»4-2 C[2i 2m-aP [J S ci'. {=1 j=0 ' P i=i 3=0 ! двоичных разрядов. Повторяя этот процесс для правильных функций р — 2-го, р — 3-го, ... . . . , 0-го ранга, мы получим строку А0, состоящую из двоичных разрядов.
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ 21 Оценим длину полученной строки двоичных разрядов. Известно (см. [23]), что 71 71 сп+с*п + а+... ={ (г-чг'соз^) <-*- (2»-Ч2"2)- Дальнейшие рассуждения можно провести аналогично доказательству теоремы 2. Так же, как и в доказательстве теоремы 2, можно получить, что kt —^ оо (1<£ </?), р—> °° при п—>оо, откуда \ч [ 4 J ^ hi j=0 2"« 1 '4s 1 2"', И так же, как в теореме 2, из полученных соотношений следует, что Г—1 где gm —> 0 при п —> оо. Декодирование. Пусть щ, и2, . .., ^(т) — строка двоичных разрядов, значения которых определены процессом, описанным выше. Будем строить схему, которая по значениям н1? к2, . . ., ^(ТП) восстанавливает таблицу значений / (хи х2, . . ., хт). Рассмотрим 2т переменных vu v2, . . ., v2m, соответствующих разрядам таблицы значений функции / (хл, х2, . . ., хт). Покажем, что все ut можно получить из uj, используя не более 3-2т функциональных элементов. Выделим в отдельные группы переменные vt, соответствующие правильным функциям i-vo ранга (l<i</?). Очевидно, что любое vt, соответствующее одному из разрядов таблицы правильной функции р-то ранга, равно одному из uj. Таким образом, для реализации таблиц всех правильных функций р-то ранга не требуется ни одного функционального элемента. Схему будем снова, как и код, строить возвратной индукцией. Пусть выходы схемы, т. е. vt, соответствующие Есем правильным функциям рангов б, 5+1, ...,Р, уже соединены схемами с соответствующими входами из множества входов ии и2, . . ., ug^m). Рассмотрим некоторую правильную функцию (s— 1)-го ранга g8_i (уи yq, zu . . ., zt). Тогда vu соответствующие элементам таблиц функций gs_l (бь. . ., 6q, zi4 . . ., zt), для которых суммы ^] 6j делятся на четыре, уже будут соединены г=1 схемами с соответствующими входами. Рассмотрим произвольную точку а= (аь . . ., ад, рь . . ., р,), у кото- q рош2а>=--Ы + у, где 0<Z< [ -^J , у = 1, 2, 3.
22 В. К. КОРОБКОВ Из последовательностей 5?выберем последовательностьS= {a0, ... ад}, имеющую наименьший номер и такую, что a = a4z+Y. Рассмотрим две точки этой последовательности: а4г и a4(z+i). Эти точки входят в множества определений правильных функций s-ro ранга и поэтому имеются выходы схемы х и г/, соответствующие этим точкам и уже соединенные схемами с соответствующими входами. Рассмотрим два входа схемы: w± и w2, соответствующие последовательности S функции gs_{ (г/ь . . ., г/g, Pi, . . ., Р*). Очевидно, что если значения х и у совпадают, то значение функции gs_4 (г/ь . . ., z/g,pi, . . ., Р*) в точке a = (аь . . ., ад, рь . . ., Рг) должно совпадать с ними. Если же я = 0, а г/=1, то значение функции в точке а определится значениями гр^ и го2 (см. табл. 2 — 5): Iu\ w2, если у = 1, M7lf если y = 2> ^i V w>2i если y = 3. Легко видеть, что всегда g8-i(ab . . ., ag, рь . .., р4): x\/y wi w2, x\/y wu *Vу (WiVMb). если y= 1» если y = 2, если y = 3. Возможен случай, когда в последовательности S не окажется точки с номером 4 (1+1). Тогда легко видеть, что x\Zw{ w2, если Y —1» gs-i (g4, . . ., ag, рь . . ., P*) = j x\/wu если Y = 2, x\Zwi\Zw2, если y = 3. To есть для реализации элемента таблицы правильной функции (s — 1)-го ранга достаточно в любом случае трех функциональных элементов. Лемма доказана. Перейдем теперь к доказательству теоремы 4. Доказательство. Пусть / (хи . . ., хп) — произвольная монотонная функция алгебры логики. В соответствии с блочной схемой, представленной на рис. 4, для реализации кода функции /(аь .. ., ад, ~Xkv\, . .., %п) необходимо реализовать g{n — k) функций ht (xu . . ., xk) (l<£<g (п — к)) от к переменных. Разобьем таблицу значений функции ht (#ь . .., хц) на полосы по s строк в каждой, кроме, может быть, последнзй, содержащей s' < s строк. Тогда число полос будет равно Пусть функция hij (1 </</?) совпадает с ht на /-й полосе и равна пулю р на остальных полосах, т. е. hi(x{, . . ., xk) =\J hij(xi, ...,rft). Очевидно,
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ 23 что число различных функций hij(xi, ..., xk) не превосходит 2s р. Схему, реализующую g{n — h) ьфункций hi(xu . .., xk), будем строить так: xi хк X • • • X \ К | X • • • X I л I I ф 1 I • • • 1 * Рис. 5. Здесь блок /£ реализует все конъюнкции от к переменных. Блок П реализует все возможные функции hij(xil ...,хи). Блок Ф реализует g(n — k) функций hi (xiy . . ., Xk) как дизъюнкции соответствующих функций hij(xll . . ., #й). Оценим сложности отдельных блоков. Блок К. Очевидно, что для реализации всех конъюнкций от к переменных достаточно к инверторов и (к — 1)-2к конъюнкторов. Блок П. Разобьем выходы блока К на р групп, соответствующих полосам. Для реализации функции, тождественно равной нулю на полосе, достаточно одного конъюнктора (например, для реализации х^&х^). Для реализации каждой функции htj, равной 1 в одной строке, не нужно ни одного функционального элемента. Для функции /гг^, равной 1 в двух строках, достаточно одного дизъюнктора для объединения двух выходов блока К. Для функции /г^-, равной единице в трех строках, снова достаточно одного дизъюнктора для объединения одного выхода блока К и одного выхода, реализующего некоторую функцию, равную единице на двух строках. Продолжая этот процесс, легко получить, что для реализации всевозможных функций hij(xi, ...,#&) достаточно p2s функциональных элементов. Блок Ф. Для реализации одной функции hi(xi, ...,xk) из функций htj(xu . .., xk) достаточно р— 1 дизъюнкторов. Таким образом, сложность блока Ф не превышает (р — l)g(n — к). Из леммы 2 следует, что для построения таблицы функции / (<?i, • • •» CFft, £ftfl, . . ., хп) по ее коду потребуется не более 3-2n_ft элементов. Наконец, для выбора из таблицы / (оь . .., ад, хд+1, . . ., хп) необходимого разряда можно поступать следующим образом: реализовать все конъюнкции от переменных Хь+и ...,хп (для чего достаточно (п — к) + (п — к — 1) 2п~к функциональных элементов), затем в соответствии с разложением /((?!, . ..,<7ft, Xk+u ..- *n)=V^+V '•• tyfi0^ ...,<**, tfft+l, . .., On) получить дизъюнкцию всех членов разложения. Любой член разложения требует для своей реализации одного конъюнктора, а для получения дизъюнкции всех членов достаточно 2n~k дизъюнкторов. Обозначая через L (п, М) функцию Шеннона для класса монотонных функций, получаем: L(n, М) ^к+ {к~ l)2k + р28 + (р- 1) g (п- к) + 3.2п-к + 4-(п—A) + (rc-A;-l)2n-b-f 2-2n"fe.
24 В. К. КОРОБКОВ Положим к= [3 log2rc], s = [n — 5 \og2n\. Учитывая, что Я /"~9~ 9Т1— ft. *(»-*)< . * ,./,К77=Г(1 + Ц' (2^2—1) Г У ^—А: '-]?[<С?+0- получаем L("'M)<(2f2-l)^^^(1 + e")' где гп —-> О при гс —> оо. Теорема 4 доказана*). ГЛАВА 3 Известно, что в общем случае для однозначного определения функции алгебры логики необходимо знать значения функции во всех точках га-мерного единичного куба. Если же функция принадлежит к некоторому классу, более узкому, чем множество всех функций алгебры логики, то для однозначного определения значений функции во всех точках Ет не обязательно знать значения функции во всех точках £т, а иногда достаточно знать значения функции на некотором подмножестве Ет. Так, для однозначного определения симметрической [5] функции алгебры логики от т переменных достаточно знать ее значения на множестве G = {a°, а1, ...,ат| точек аг = (а*, aj, . ..,а*,) из Ет таких, что m 2- aj- = i (0<i<wi). Ряд задач математической логики и экономики сводится к следующей задаче: если нам задан оператор Af, вычисляющий для произвольной точки (аи а2, . . ., ат) из Ет значение монотонной функции алгебры логики /(#!, х2,...,хт) в этой точке, т. е. f(au a2, ...,am), то как минимальным числом обращений к оператору Af полиостью восстановить таблицу значений монотонной функции f (хи х2, ...,тт)? При этом после каждого обращения к оператору полученное значение функции / (хи х2, . . ., хт) в некоторой точке (Pt, (52, • • • i (W п0 монотонности распространяется на другие точки Ет. Образно говоря, мы имеем дело с «черным ящиком», который имеет т входов и один выход и про который известно, что он реализует некоторую монотонную функцию алгеб- *) Отметим, что справедлива более сильная теорема, именно Теорема 4а. Схема из функциональных элементов, реализующая произвольную монотонную функцию алгебры логики от п переменных, содержит не более 3 1о£2 3 \/ — 2П (1 + о (1)) элементов. (f 9_1)3/2 У п п'* Доказательство этой теоремы опирается на оценку числа монотонных функций, даваемую теоремой 2 настоящей работы. Доказательство теоремы 4а отличается от доказательства теоремы 4 тем, что цепи Гилберта объединяются в группы по г штук, где г—медленно растущая функция, и значения функции на каждой из таких групп кодируются строчкой длины ]rlog23[. Блок А (см. рис. 4) реализует именно такой код. Декодирование производится в два приема. Сначала по «экономному» коду строится код, имеющий структуру, аналогичную коду леммы 2 (выбором параметра г сложность этой части схемы можно сделать существенно меньше, чем сложность блока А). Остальная часть схемы полностью аналогична схеме, описанной в теореме 4.
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ 25 ры логики от т переменных. Нам надо определить, какую именно монотонную функцию он реализует. Рассмотрим множество {F} алгоритмов, решающих указанную задачу. То есть для произвольной монотонной функции алгебры логики / (х1ч . . ., хт) любой алгоритм F с помощью оператора Af полностью восстанавливает таблицу значений монотонной функции f(xl4 .. ., хт). Очевидно, что работа любого алгоритма F будет заключаться в следующем. Алгоритм выбирает некоторую точку а из Ет и с помощью оператора Af вычисляет значение функции f (хи х2, • . •, хт) в точке а. Полученное значение функции в точке а заносится в таблицу значений исследуемой функции. По монотонности определяются значения / (#1, . . ., хт) в других точках Ет (например, если / (а) = 1, то для всех точек р, следующих за а, /(Р) = 1 и соответственно заполняются разряды таблицы значений). Затем по некоторому правилу выбирается другая точка £т, и процесс повторяется до тех пор, пока таблица значений не окажется заполненной полностью. Очевидно, что любой паре —алгоритму F и монотонной функции /(#!, х2,...,хт)— можно сопоставить число ф(/<\ /) — число обращений к оператору Af в процессе восстановления таблицы значений функции f (х1ч х2,...,хт) с помощью алгоритма F. Естественно оценивать качество алгоритма F функцией cp(F, т) — -= max ф(//1, /), где Мт — множество всех монотонных функций от т переменных хи х2, ...,%, а класс монотонных функций можно характеризовать функцией у(т) = ттф (F, т), где минимум берется по всем F алгоритмам F, решающим поставленную задачу. Целью настоящей главы является получение оценок сверху и снизу для функции ф(т). Верхняя оценка для ф(га) получается из оценки ф(/\ т) для конкретного алгоритма F, который строится в настоящей работе. Введем следующее общее понятие. Пусть заданы класс N функций алгебры логики и функция /, принадлежащая классу N. Определение. Множество G(/, N) точек из Ет называется разрешающим множеством для пары (/, 7V), если из того, что известно, что а) функция g принадлежит классу N, б) на множестве G(/, N) значения функций fug совпадают, следует, что f=g. Разрешающее множество G(/, N) называется тупиковым разрешающим множеством для (/, N), если никакое его подмножество не является разрешающим для пары (/, N). Как будет показано ниже, у каждой монотонной функции алгебры логики существует единственное тупиковое разрешающее множество; оно входит во все разрешающие множества этой же функции. Заметим, что для восстановления таблицы значений функции необходимо определить значения исследуемой функции на некотором ее разрешающем множестве. Для дальнейшего потребуются некоторые понятия и определения. ^ Обозначим через V (а) множество точек р, удовлетворяющих условию а -< р, а через N (а) множество точек у таких, что у -< а. Определения: 1. Верхний нуль монотонной функции f(хи х2,...,хт) есть точка (СЦ, а2, ...,ат) из Ет такая, что /(а)=0, a / (Р) = 1 для всех точек Ре г («)• 2. Нижняя- единица монотонной функции f (хх, х2,...,хт) есть точка а такая, что /(а)=1, а /(у) = 0 для любой точки y£N(a). Обозначим через Р (/) множество всех верхних нулей монотонной функции / {хи х2, . . ., хт), а через Q (/) — множество всех нижних единиц.
26 В. К. КОРОБКОВ Тогда очевидно, что единственным тупиковым разрешающим множеством для произвольной монотонной функции алгебры логики f (хи х2, . ..,#т) является множество G{f)=P(f)\JQ(f). Покажем теперь, что справедлива Теорема 5. C^+C^+i<^(m)<Bc\r}{l.,&m), еде В = —т«т--= гт7— и гт —> 0 /1/?ю ттг —> оо. Доказательство. Нижнюю оценку мы получим, рассматривая некоторую монотонную функцию. Доказательство верхней оценки требует построения алгоритма восстановления таблицы значений для произвольной монотонной функции, заданной оператором Af. Из единственности тупикового разрешающего множества для монотонных функций следует, что для восстановления таблицы значений монотонной функции f (хи х2, . . ., хт) необходимо восстановить ее значения во всех точках G(f). Рассмотрим монотонную функцию алгебры ЛОГИКИ и \Х\, Х2, • • • * Хт) i определенную следующим образом: h(au a2, . . . ,a„ 1, если [у] +1<2 at [ т О, если 0<2 <х*< [-J-] [1] Г—1+1 Очевидно, что G (h) содержит ровно С^2 -I + С^2 J точек. Для описания алгоритма восстановления таблицы значений для произвольной монотонной функции алгебры логики нам понадобятся понятия правильных функций, введенные во второй главе (см. стр. 19). Алгоритм F (т) восстановления таблицы значений для произвольной монотонной функции алгебры логики от т переменных будем строить так. В таблице значений функции выделим разряды, соответствующие правильным функциям г-го ранга (0<г.</?). Первым шагом алгоритма F (т) является восстановление таблиц значений всех правильных функций р-то ранга с помощью оператора Af. Для этого понадобится ровно V { 4 J II 2 сЦ \i=l обращений к оператору Af. Вторым шагом алгоритма F (пг) является распространение по монотонности полученных значений функции f (хи ж2,...,жт). Вся работа алгоритма будет состоять из 2(р-\-1) шагов. (2(р — г) + 1)-м шагом алгоритма F (m) является восстановление таблиц значений правильных функций r-го ранга, а (2(р—г + 1))-м шагом алгоритма будет распространение по монотонности значений монотонной функции / (хи х2, . . ., хт), полученных на (2(р — г) + 1)-м шаге работы алгоритма.
О МОНОТОННЫХ ФУНКЦИЯХ АЛГЕБРЫ ЛОГИКИ 27 Из замечания к лемме 1 следует, что для построения таблицы одной правильной функции (г—1)-го ранга gV-l(*/l, • • .,Уд, ZU . . .,Zt) достаточно построить таблицы всех правильных функций r-го ранга, распространить по монотонности полученные значения функции / (хи х2, .. ., хт) и определить значения функции gr-1 (г/ь . .., yq, zu . .., zt) не более чем в ЗСL 2 J 2е точках. Точнее, на каждой цепи 5? в области определения любой функции gr_t (yu ...,yq, еь . . ., е,), где {(еь .. ., е*)} = Et, необходимо определить значения функции f{xu х2,...,хт) не более чем в трех точках аь а2, а3, причем а^а^аз. Легко видеть, что двумя обращениями к оператору Af можно определить значения функции / {хи ... ,хт) в этих точках: сначала определить значение функции в точке а2, тогда по монотонности функция определится и в одной из точек с^ или а3. То есть (2 (р—г) + 3)-й шаг алгоритма F (т) — восстановление таблиц значений всех правильных функций (г—1)-го ранга — потребует не более LA4] \ и \ II S c£l2clr2hm-ar обращений к оператору Af. Дословным повторением рассуждений леммы 2, аналогично доказательству теоремы 2, можно получить, что 8 /~2~ 2т Ф ("*)< (2^2-1)»/. V* 7^(1+U' где \т —> О при т —> оо. Объединяя этот результат с тем, что существует функция /г, для которой G (h) = Cjh2 -I -\-С^2 J , получаем утверждение теоремы 5. ЛИТЕРАТУРА [1] Shannon С. Е., The synthesis of two-terminal switching circuits, Bell syst. Techn. J. 28, 1, 1949, 59—98 (русский перевод: сб. К. Шеннон, Работы по теории информации и кибернетике, ИЛ, 1963), [2] Л упа нов О. Б., О возможностях синтеза схем из произвольных элементов, Труды МИАН LI, 1958, 158—173. [3] Чегис И. А., Яблонский С. В., Логические способы контроля работы электрических схем, Труды МИАН LI, 1958, 270—360. [4] Журавлев Ю. И., О невозможности построения минимальных дизъюнктивных нормальных форм функций алгебры логики в одном классе алгоритмов, ДАН СССР 132, 3, 1960, 504-506. [5] Shannon С. Е., A symbolic analysis of relay and switching circuits, Trans. A1EE 57, 1938, 713—722 (русский перевод: сб. К. Ш е н н о н, Работы по теории информации и кибернетике, ИЛ, 1963). [6] Я б л о н с к и й С. В., Об алгоритмических трудностях синтеза минимальных контактных схем, сб. «Проблемы кибернетики», вып. 2, М., Физматгиз, 1959, 75-121. [7] Т р а х т е н б р о т Б. А., Синтез бесповторных схем, ДАН СССР 103, 6, 1955, 973-976. [8] Поваров Г. Н., Математическая теория синтеза контактных (1, &)-полюсни- ков, ДАН СССР, 100, 5, 1955, 909-912. ,[9] Лупапов О. Б., О сравнении сложности реализации монотонных функций контактными схемами, содержащими лишь замыкающие контакты, и произвольными контактными схемами, ДАН СССР 144, 6, 1962, 1245—1248.
28 В. К. КОРОБКОВ [10] Яблонский СВ., Функциональные построения в /с-значной логике, Труды МИАН LI, 1958, 5-142. [11]Биркгоф Г., Теория структур, ИЛ. 1952. [12]Dedekind R., tJber Zerlegungen von Zahlen durch ihre grossten gemeinsamen Teiler, Festschrift Hoch. Braunschweig, 1897 u. Ges. Werke, Bd. II, 103—148. [13] С h u г с h R., Numerical analysis of certain free distributive structure, Duke J. 6, 1940, 732-734. [14] Ward M., Abstract 52-5-135, Bull. Am. Math. Soc, 1946. [15] Gilbert E. N., Lattice theoretic properties of frontal switching functions, J. Math. Phys. 33, 1, 1954, 57—67 (русский перевод: Кибернетич. сб., выи. 1, ИЛ, 1960). [16] Л у п а и о в О. Б., О синтезе некоторых классов управляющих систем, сб. «Проблемы кибернетики», вып. 10, М., Физматгиз, 1963, 63—97. [17] Резник В. И., О реализации монотонных функций схемами из функциональных элементов, ДАН СССР 139, 3, 1961. [18] Н е ч и п о р у к Э. И., О вентильных схемах, Международный симпозиум по теории релейных устройств и конечных автоматов, 24 сентября — 2 октября 1962 г., Тезисы докладов, ИФАК, Москва, 1962. [19] Л у п а н о в О. Б., О принципе локального кодирования и реализации функций из некоторых классов схемами из функциональных элементов, ДАН СССР 140, 2, 1961, 322-325. [20] Михеев В. М.,0 множествах, содержащих наибольшее число попарно несравнимых булевых векторов, сб. «Проблемы кибернетики», вып. 2, М., Физматгиз, 1959, 69—71. [21] У и т т е к е р Е. Т. и В а т с о н Г. Н., Курс современного анализа, изд. 2, т. 2, М., Физматгиз, 1963. [22] М и 1 1 er D. Е., Complexity in electronic switching circuits, IRE Trans. EC-5,, 1, 1956, 15-19. [23] Рыжик И. М., Градштейн И. С, Таблицы интегралов, сумм, рядов и произведений, изд. 3, Гостехиздат, М,—Л., 1951. [24] Коробков В. К., Резник Т. Л., О некоторых алгоритмах вычисления монотонных функций алгебры логики, ДАН СССР 147, 5, 1962, 1022—1025. [25] Коробков В. К., К вопросу о числе монотонных функций алгебры логики, Дискретный анализ, вып. 1, 1963, Сборник трудов Института математики СО АН СССР. [26] Коробков В. К., Оценка числа монотонных функций алгебры логики и сложности алгоритма отыскания разрешающего множества для произвольной монотонной функции алгебры логики, ДАН СССР 150, 4, 1963, 744—747. Поступило в редакцию: первый вариант 10 V 1963,. окончательный вариант 16 XII 1963.
ОБ АСИМПТОТИЧЕСКОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧИ О ЗАРЯДАХ Т. Н. КРУГЛОВА (МОСКВА) Рассматривается множество Еп вершин 72-мерного единичного куба. В вершины куба помещаются S одноименно заряженных частиц. Под воздействием сил отталкивания эти частицы будут перемещаться по вершинам куба до некоторого устойчивого состояния. Для описания характера взаимодействия частиц вводится величина Н(М), MczEn, называемая энергией подмножества М вершин куба Аи ...,AS, в которых расположены заряды: где q (At, Aj) есть расстояние между точками At и Aj в смысле Хэм- хминга [1]. Задача состоит в нахождении устойчивого состояния S частиц, что в даннной модели эквивалентно отысканию в классе множеств вершин куба Еп мощности S множества с минимальной энергией. Эта задача возникла в связи с задачей о нахождении максимальных кодов. Существует гипотеза, что решение задачи о зарядах будет являться и решением кодовой задачи. Однако вопрос о нахождении расположения с минимальной энергией встретил большие трудности, примерно такие же, как при нахождении максимальных кодовых множеств. Поэтому пришлось пойти по пути решения некоторых частных -задач. В работе [5] Б. С. Зильберманом рассмотрен случай, когда S = 2п~1. В этом случае оказалось, что минимум энергии достигается на кодовом множестве, определяемом характеристической функцией / = = xi-\~x2+ . . . +хп-^с (mod 2) и называемом счетчиком четности. Метод, которым был получен этот результат, не удалось обобщить на другие [2П 1 —п~ • В связи с этим представляет интерес асимптотическая постановка задачи. Пусть имеется последовательность натуральных чисел {Sn}, Sn <2n. Этой последовательности соответствуют последовательности Р0={Р*1} и Qo = {Q°n} множеств вершин 72-мерного единичного куба Р°пс:Еп и Qn^J-'n мощности \i(P°n)=\i(Qn) = Sn, на которых достигается соответственно минимум и максимум энергии. Тогда в асимптотической постановке задача ставится следующим образом. Найти такие последовательности Р--={Рп} и Q={Qn} множеств вершин гс-мерного единичного куба PnczEn и QnczEn мощности \i(Pn) = \i(Qn) = Sn, чтобы ~ЩП)— * и "ЯЩ" * р "->оо.
30 Т. Н. КРУГЛОВА В настоящей работе предложен метод, позволяющий для последовательности {Мп} множеств Мп мощности Sn асимптотически оценивать энергии как сверху, так и снизу. В некоторых случаях этот метод позволяет устанавливать асимптотику энергий. Далее строятся две последо- f2n "I —-j-т- . Первая из них имеет асимптотику энергий такую же, как последовательность {Рп} множеств- с минимальной энергией; вторая имеет асимптотику, отличающуюся от асимптотики для последовательности {Qn} множеств с максимальной энергией не более чем в два раза. Таким образом, для случая [2П 1 ——г- одна асимптотическая задача решена полностью, вторая—лишь частично. Наконец, для S= —-рг~ и п— 21 — 1 производится сопоставление асимптотик энергий для множеств Хэмминга и {Рп}- Здесь оказалось, что обе асимптотики совпадают. Тем самым установлено, что- решение асимптотической задачи представляет интерес для теории самокорректирующихся кодов. § 1 Решение поставленной задачи потребовало разработки методов для оценки асимптотических энергий множеств. Определение 1. Рассматриваются две последовательности М={Мп) и N = {Nn] множеств вершин ^-мерного единичного куба. Говорят, что последовательность М= {Мп} содержится в последовательности N = {Nn}, MciN, если для всех МпфА и Nn Ф Л выполняется условие |ы (Мп) г Обозначим символом Sn(rn) шар радиуса гп, принадлежащий Еп. Определение 2. Говорят, что последовательность М={Мп) имеет радиус не больший, чем R = {Rn), если для любого заданное е>0 существует последовательность шаров Se= {S* [Rn (1 + е)]} такая, что Мс5е. Пример 1. 1. Рассмотрим последовательность Mx={Mfy где М* — множество вершив /г-мерного единичного куба, представляющее собой максимальный групповой (п, 3)-код, а именно код Хэмминга мощности ц.(М£)=: —гу • Покажем, что эта последовательность имеет радиус не больший, чем Rx= 1 -9~ г • Как известно из работы [3], п . су+су1 «2г + а2г+1 — ~^Л~[ ' где ak—число кодовых точек, находящихся на расстоянии к от данной кодовой- точки z. Тогда число кодовых точек, содержащихся в шаре S% радиуса R% = у(1 + е),. будет 4(1+е) Т<!+е> к \1(Щ{)яеп)= 2 aft=irbr S с* k=Q *=0
ОБ АСИМПТОТИЧЕСКОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧИ О ЗАРЯДАХ 31 Отношение Т (1+е) 2п ' У, с* кд _ /г + 1 л + 1 ZJ •х lMn)t 2n л + 1 у (1-е) -yd+в) *-° ЫуМ, . 2п 2П 2п О при /г-> оо, где т — любое натуральное число. Подобные оценки легко делаются с помощью предельных теорем из теории вероятностей [6], например, как это- сделано в работе [4]. Следовательно, Мх имеет радиус не больший, чем Rx = i -ft \ • 2. В качестве второго примера рассмотрим последовательность МШ = {М^}, где М™ строится следующим образом: определяем последовательность чисел {R™} из- УСЛОВИЙ рш г 2П ~| i+ci+q+...+c5+1>[^y] . Отсюда /?™ ~ — . Тогда М™ представляет собой множество точек Еп, состоящее пз точек шара с центром в некоторой точке радиуса R™ и некоторого произвольного, Rm п но фиксированного мпожества мощности —TIT" — ^j Сл» принадлежащего сфере fc=0 радиуса Л™ + 1. Множество М™ в дальнейшем будем называть шарообразным. Легко- * •• г» f n In 2 1 видеть, что последовательность имеет радиус не больший, чем Rm= < —: }- . ^ III Tl J Теорема 1. Если последовательность М = {Мп} имеет радиус не больший, чем R, то н{мп)^Ш^1. Доказательство. Возьмем е > 0. Так как последовательность М имеет радиус не больший, чем R, то найдется последовательность шаров $е = {SnlRn (1 + б)]}, для которой имеет место И (Мп) Оценим величину Н (Мп): Н (Мп)>Н(Мп П -У» > 2Rn(i+e) 1 4Дп(1+е) т. е. для любого е > 0 0 при п —> оо 2 "~ Ги f м ^ it (м [\1 \lVln) \Х \Мп 55)]^._^Ж»)1". 4Rn(l+e) Н(М)> [>*(М")]2
32 Т. Н. КРУГЛОВА или Применим доказанную теорему для асимптотической оценки энергии снизу для последовательности Мх = {М%} и последовательности ^шарообразных множеств: Н(М*)> 2п Определение 3. Назовем диаметром последовательности М = = {Мп} последовательность чисел d (М) = {d (Мп)}, где d (Mn) — минимальное число, удовлетворяющее условию Q(At, AJ)<d(Mn) для любых точек At, Aj, принадлежащих Мп. Наряду с последовательностями М рассматриваются сдвиги М. Сдвиг М последовательности М характеризуется последовательностью векторов ап такой, что если х£Мп, то точка х-\-ап£ М. Определение 4. Говорят, что последовательность М = {Мп} содержится в сильном смысле в последовательности N — {Nn}\ M*N, если выполняется условие dnV (Мп \ Nn) A -^—гЬ-\—— —» 0 при п —> оо , где dn = max[d(Mn), d(Nn)\. Определение 5. Говорят, что последовательность М — {Мп] эквивалентна последовательности N = {Nn}(M~N), если существует такой сдвиг N = {Nn}, что MccN и TVocM. Из определения следует, что lx(Mn)^ix(Nn). Теорема 2. Если M — N, то H(Mn)~H(Nn). Доказательство. Так как М ~ N, то существует такой сдвиг N, что выполняются условия dn и, (Мп \ Nn) n oLu (ЛС \ Мп) г\ ч ч Дм») -^ 0 при в -* оо и "■ ^ДЛ ->0 при п -> со. (1) Очевидно, что Мп =,. МпГ)йп + Мп \ Nn и -1Ц^#^- -* 1 при п -> оо вследствие (1). Известно, что если M^Mi[_]M2 и М1Г\М2~---=А, то Н(М)^Н(М1) + Н(М2) + Н(Ми М2), (2) где Н(М1ч М2) — энергия, создаваемая парами (Аь ]3j), АЬ^МЛ и /^ £ М2. Тогда относительно энергии Н (Мп) имеем согласно (2) Н (Мп) = Н\(МпПNn) + H(Mn\Nn) + H(Mn[}Nn, Mn\ Nn).
ОБ АСИМПТОТИЧЕСКОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧИ О ЗАРЯДАХ 33 Оценим величину —ч_ : H(Nn) H_{Mnl = Я (Мп П йп) _^ H(Mn\Nn) _, U (Мп П Nn, Мп \ Nn) ^ /У(Л'„) Я(Л'„) ' ff(JV„) ' Я(#„) "* 1 „ я (Af„ n Л',.) , * 'T[|i(Jf"XA,»)]' , 1 • ц (мп n Nn) ц(лгп\ ivB) + Я(ЛГ„) ^..|.^(л'„)]2 _._[и(Лгв)]» Таким образом, и (мпр, Nn) ^ ^ так как (Мп п ^п)ел'„. # (Л п) Я(л/'1)<1 (3^ В силу симметрии аналогично показывается, что i^>-<M (4) Итак, вследствие (3) и (£) If (Mn)~ H (Nn). Теорема доказана. Обозначим символом L-.— M\AT последовательность, элементы кото- рои суть Ln--=Mn\Nn. Определение 6. Говорят, что последовательность М = {Мп) имеет радиус рассеяния не меньший, чем г, если для любого заданного е>0 найдется последовательность Лг, эквивалентная М, такая, что для любой последовательности SE шаров S*[rn (1 —в)] с центром в Nn выполняется условие M^M\Se. При мер 2. Г 2" "1 1. Рассматриваетсн[иоследовательноеть МХ—{М^\, u. (M*) — —ц—j- • Докажем, что радиус рассеяния для Мх будет не меньше, чем л/2. В качестве последовательности N, участвующей в определении 6, возьмем Мх. Поскольку в групповом коде все точки равноправны, то рассуждение достаточно провести для точки (0,*0, . .., 0). Рассмотрим шар S\ радиуса-^- (1-е) с центром в этой точке. Как было^показано в примере 1, число кодовых точек в множестве М* \ £® будет п п /t=^(l-e) fe=|(i-c) и, так как dn % и, .12» 1 V Гк~\ '\_n-\-i п -А ^- ".I n\y(Mn{\Sen) v- Wn) k=2il- 2п п + \ *<»-> ■е) гсо 2п 2п 3 Проблемы кибернетики, иып. 13 0 при п —+ оо,
34 Т. Н. КРУГЛОВА где т>0 любое. Следовательно, Мх имеет радиус рассеяния не меньший, чем 2. Последовательность шарообразных множеств Мт — {М™}, рассмотренная Г 2л In 21 _ в примере 1, имеет радиус рассеяния не меньший, чем Rn= < —. > . Для доказательства этого факта потребуется несколько вспомогательных лемм о структуре шарообразных множеств, которые и будут сейчас доказаны. Рассмотрим Мш = {Мп}. Множество Мп можно представить как объединение двух множеств: 1) шара М^е радиуса i?!f (1—е), 2) некоторого шарового слоя М™с = М™ \ М™е. Лемма 1. Для любого заданного е>0 dnV(M?lE) О при п—>оо. р (О Эта лемма является простым следствием следующей комбинаторной леммы. Лемма 1.1. Существует такой номер N, что для для любых /г > N и /с, 0<&</с0 = -, , будет выполнено неравенство rk Доказательство проводится индукцией по к. При к=\ С1 п ^ 1 Пусть Cl ■n-j-l i + <£+...+<*- j^f > lrl n> тогда 1 -^г1 - -п-1 -!-С > In п, так как -n-fl 1+С+ ;т> 1 л- 2Сг 2 i + 1 Лемма 1.1. доказана. В нашем случае dn = 2 (R™ + 1), 1 \ 1 п—А'о "^ 2 /гп-т-Г /г In 2 In гс rclri_2 in я In 7? .2(Д° + 1)(1 + С^+...+с£) 2 (Д£ + 1) 2С* ^п Г• • • I ^п (*£-*><£ -/г+1 2(Д^ + 1)2(Л + 1) 4(Д™-г-1)< 41n2 A -т > О е In n (R^-k)n - R™en при тг^оо. Здесь i?™ = Г 4~^- ] и A = i?™(l—е). Определение 7. Назовем точки а^ и $™ шарообразного множества г-далекимиу если q (aJJ\ (J^1) > 2/?"1 (1—е), и е-близкими, если Q(cC, р")<2Л?(1-е). Тогда множество Ш1п всех пар элементов, принадлежащих М™, будет состоять из множества пар, создаваемых е-близкими точками Шп, и множества пар, создаваемых е-далекими точками 5Ш?г. Будем считать, что центр шара находится в точке (0, 0, ...,0). Выбираем точку а ш<с в слое MJ" с R™t (1 — е<т<1) единичками 71 в соответствующем ей наборе.
ОБ АСИМПТОТИЧЕСКОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧИ О ЗАРЯДАХ 35 Обозначим для простоты написания R™ = q. Лемма 2. г-близкими точками относительно точки в слое aqx являются те и только те точки aq$ слоя, наборы координат которых пересекаются по х^-к-q (т + Р)—q (1— г) единицам, 1 — е<т<1, 1 —е< <р<1.- Доказательство. Пусть точки е-близкие, т. е. q<2#(1 — е), тогда q — qT + q$ — 2x<2q(l — е), отсюда x>±q(T + $)-q(l-E). (5) Пусть (5) верно, тогда Q = g(x+p) —2ж<2д(1 —е), ч. т. д. Согласно лемме 2 получаем, что число е-близких точек относительно точки адт, находящихся на сфере радиуса q, равно V q — L qTCn_qT -+-... 4~ CgTCn_q,T, Xq =l qE ^~ Я (Д V> на сфере радиуса q — 1 * q-l = Lqitn-qT + . . . + Cqx^n — qx » X^ = qE g" Я ( * ^ ~\~ ~ Аналогично на всех сферах радиуса #р, 1 — е<р<1, где ж«(1-Р)=-2 <3r(T+P)-^r(1 — 8)- Максимальным членом в любой из сумм Vq$ является первый слева. Для доказательства этого утверждения достаточно доказать, что величины слагаемых в каждой сумме монотонно убывают. Рассмотрим отношение двух соседних слагаемых в сумме Vq и покажем, что начиная с некоторого номера N = N(s) оно больше 1. Действительно, Lgx cv-gx _ x0 + i[-\ n — qT — (g—x0)4-i--l _ /-.xo+i-jl pq—xo—i — 1 q% — XQ—i q — x0—i qx ii—qx 1 1 qe (Jq (1— t) + i' + 1 n — q (\—e)—^-q (1+t) + i + 1 2 > 1 >-= , • -£-<^C{e)Cih\n> 1 при ra>W(e), 0<i<?t —ж0* (7 (1 — 6) о у? В других суммах Vq-h, Л: = О, 1, 2, . ..,#е, монотонность убывания слагаемых доказывается аналогично. Итак, для любого /с, к = 0, 1, . . ., qs, справедливо норавенство Vq-h < (qz -xh+l) С% Cl'lqi4 = Bh. Легко видеть, что из монотонного возрастания последовательности хк следует, что последовательность Bh монотонно убывает. Тогда, рассуждая 3*
36 Т. Н. КРУГЛОВА аналогично предыдущему, получаем следующие соотношения: qe Q£ -k- V= S Vq-h< 2 (qr-xh+l)C^Cqn_qxXk< /i=0 k=0 < § Bh < (qe + 1)B0 = (qr - x0 + 1) (ge + 1) C# G'Z* - Я. fe=0 Лемма З. Число точек в слое М™с превышает В более чем в 2 (qA-1) раз, т. е. 2(q + i)B ^+^-1 + ...+^(1"8) Достаточно показать, что ► 0 при п —> оо. >0 при тг-^оо. При доказательстве будут использованы оценки и обозначения: \ x0 = qe — — q(i — т) = дС0(т, б), (/т —ж0 = д[у(т + 1) — е] =дС1(т, е), </ —*o = g [у-ут —8] = 9C2(i:, «0, #т т = Сз(^,е), *0 <?0 (т> е) —==== — С4(Т, 8), К ^2 (т, е) _Д^4= = С5(т, 8), /2яС0 (т, е) Сз(т, е)С2(т, е)=Св(т, е), ' гс In 2" пш Г п In 21 * = *» = LbiTj • Г*о ^ (?т)*° ^0!~'|/"2я^о^о°^_л:о- Имеем: .С« С* YC2 (т, е) *о! L?C2(t, e) J \nej лЗГ (т я\ 1 Г сз (т, е) е<?С2 (т. е) П *о Г (n—gt) eg Пя ЯЬ5(Х'Ь)Уд1 (п-дт)е J L?C2(T,e)reeJ ^ v V In я у a v. » / [_ in „ J nln2Co(t>e) » < Cs <т'е) (тУ*е Шп ~*° при "
ОБ АСИМПТОТИЧЕСКОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧИ О ЗАРЯДАХ 37 Итак, соотношение 2(Д? + 1)В над • 0 при п —> оо выполняется для любой точки а ш слоя ЛТ™.. Rnx Из доказанных лемм следует утверждение: почти все точки шара г-далеки друг от друга. Что касается радиуса рассеяния последовательности Мш, то теперь очевидно, что он не меньше, чем 2R^ = 2 —, . В качестве последовательности, эквивалентной последовательлости Ми1, берется последовательность множеств ЛТ™С. Теорема 3. Если последовательность М ------ \Мп} имеет радиус рассеяния не меньший, чем г = {гп}, то Доказательство, Возьмем 8 > 0. Так как последовательность М имеет радиус рассеяния не меньший, чем г, то найдется последовательность N, эквивалентная М, такая, что для любой последовательности шаров Sf; = {Sn \rn (1 — е)]} с центром S„ в Nn выполняется условие dn\i(Mnr\S$) Здесь dn>rn. На основании теоремы 2 имеем: H(Mn)~H(Nn), поэтому достаточно доказать теорему 3 для H(Nn). Можно записать: Оценим величину Н (At): И (\ \ V 1 P(Aj,A;)^rB(l-e) ^n(iV„n^») + х^ 1 ^ р(Аг, Aj)>rn(.l-e) -J-^^N^S'X. ^(*»ntfH--$?^~- г» (1-е) ' Тогда // (Л/n) ~ // (Nn) ={ 2 Я (Л^) < ЙГ(Т^4) для любого 8 > °' или Применяя доказанную теорему для асимптотической оценки энергии сверху к последовательностям Мх и Мш, рассмотренным в примерах 1 и 2, с радиусами рассеяния, не меньшими соответственно [/г/2 и 2 .
38 Т. Н. КРУГЛОВА получим: [МЮР In п Асимптотические оценки для Н (Мп) зависят от асимптотических значений Rn и гп. Естественно, выгодно выбрать радиусы Rn и гп так, чтобы их асимптотики были соответственно наименьшей и наибольшей. Следствие из теорем 1 и 3. Коль скоро известны М = {Мп}, |д(Мп), Rn и гп, то выполняется соотношение Отсюда имеем следующее асимптотическое неравенство: Теорема 4 (критерий существования асимптотики энергии множества). Если rn~2Rn, то Н{Мп)~^п)\^[^мп)У (6) 4/in Zrn Из этого критерия следует Теорема 5. Для шарообразных множеств Утверждение теоремы 5 получается при подставлении в (6) значэ- нияц(Мп)=[^~|. §2 Вернемся к последовательностям Р и Q. Очевидно, что энергию лю- L2n "1 ——-. можно оценить сверху величиной Н0 энергии центра шарообразного множества. Именно, H(Ai)^H0=l+±C)l+...+±Crn, где г=Г^гП-21 • Тогда энергию множества Мп можно оценить сверху таким образом: 22" In n я(м„)^я0 = 1[£-1](1+А«+...+!«) 2л3 1п2 * Сопоставляя этот результат с утверждением теоремы 5, можно сказать, что величина энергии множества Qn для последовательности Q может превосходить величину энергии шарообразного множества не более чем в 2 раза. Что касается последовательности Р, то заметим, что из работы [3] вытекает асимптотическое неравенство Н (Мп) > [^М")]2 . Г 2П ~| Обозначим число ——г через S.
ОБ АСИМПТОТИЧЕСКОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧИ О ЗАРЯДАХ 39 Построим последовательность Р множеств Рп, имеющих энергию, асимптотически равную величине пк = —. Для этого представим число S в виде S = <z024a12'-1+...+all (7) где а0^0, а, = 0, 1, / = [logS]. Соответственно этому разложению числа S будем строить множество Рп следующим образом. В произвольном подкубе множества Еп размерности 1 + 1, которому соответствует элементарная конъюнкция х^х2 .. . #n-z-i» берется половина точек, образующая куб Мг, соответствующий конъюнкции х^х2 . . . хп-х.лхп-1 [2]. Далее выбираются кубы Мг-Ь, соответствующие коэффициентам разложения числа S, at Ф 0, i = 1, 2, .. ., I. Числу а! соответствует куб Мг_А с конъюнкцией х^ . . . xn-i-^xn-ixn-i^ » а2 » » М[-2 » » XV . . . Xn-^iXn-iXn-i+iXn-i+2 » az » » M0 » » xx .. . Xn-i-iXn-i . .. xn Множество Рп будет представлять собой объединение множеств Mi-t, соответствующих числам at = 1. Оно будет содержать ровно S точек. Энергию множества Рп можно представить в виде H(Pn) = Hi(Pn) + H2(Pn), где i i Н, (Рп) = J а«Я,-„ Я2 (/>„) = S а*а^,_», w (8) i=l Здесь Hi-i — энергия куба размерности I — i, а Hi~itt i-j — энергия связи кубов Mi-i и Л/г_/, определяемая следующим образом: Hi-i,i-s= 2 ^mz_. bemz:;. Пусть / > i. Тогда множества Mi-i и Mt-j лежат в некотором кубе размерности I — £+1 с конъюнкцией х^ . . . xn-i+i-i. Кубу Mi-t соответствует КОНЪЮНКЦИЯ Xi ... Xn-i+i-tfn-i+i, а Кубу Mi-j — КОНЪЮНКЦИЯ Xi ... ^n-z+^-i^n-z+^Li+i+i ••• xV-up где Ya = 0. ! № = 1, ..., / — i). Возьмем в кубе Mt-i подкуб К, соответствующий конъюнкции х&2 ... xn-i+i-ixn-i+ix%_l + i+i ... ж^*_5, а^ = 0,1 (д=1, ...,/—О- Энергия его произвольной точки относительно куба Mi-j будет равна 1-3 2l C{-i' c"ft 1 fe=0 d+k+1' где с? равно расстоянию между наборами (а4, ..., а7-_г) и (yi, ..., Y;-z)- Вся энергия связи между кубами К и Мг_; будет 1-0 ib 1 9f-j 2 с*-; fe=0
40 Т. Н. КРУГЛОВА Суммируя по всем наборам (а4 °7-z)» получим энергию связи между кубами Mj-i и Mi-ji Я,-,,,_, - 2 CU 2'"' S С?_. ^^. (9) d=0 fc=0 Подсчитаем асимптотически величины Н^{Рп) и Н2(Рп)' Согласно (8) Я4 (i>„) = 2 <*;#,-* = 2 °« 2м"1 Я (4ft) = = a02'-1(c} + lq+...+}cl) + + a, 2'-» (C}_i + J CU + • • • + т^Г С':0 + -«o2'-^2'[l+0(^)]+a12'-^2'-[l+o((7-1lT)S)] + . [log I] = 2 а^^Ч-^ + ЙН-^- [los/J I ~ т 2 a' 22(£"i} +y'*""yY ~ т 2 a< 221/"*} i=0 i=0 Остатки ряда R{ и /?, которыми мы пренебрегаем при этом подсчете, оцениваются следующим образом: /?=--a[lo,n2^-no^]-D4- . . . H-az < 2-22а-ГЮ*<]-1>= *^±, [log i] [log/] г=0 [log Z] 0 ^ /™ у1 z Z z ° V zw+1./' 3Z ^ /™+* /^ 22f N г=0 I —> оо, т > 0. Рассмотрим Н2(Рп). Из равенств (8) и (9) следует, что Я (i»n) = 2 a,a, 2'-'-i 2 Ci-t 2 d+Ьт ^ -r i i<o d=0 h=0 Подсчитаем сначала общий член Btj суммы, получаемый при фиксированном выборе значений i и / и являющийся коэффициентом при
ОБ АСИМПТОТИЧЕСКОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧИ О ЗАРЯДАХ 41 произведении ct^ci;: J-i 1-3 d=Q k=0 = 2'-i [ с?_* (c?_,+i a_, +... + j^. cizQ + ■bCj-i (|c?_/ + |c[-3-+ • • • + 2+7=7Ctf) + • • • • • • + СП (/=7+1 C?-j+ • • • + f-i+i + /=7"C'=01 = + Q-i4-+4=7^[l+o(r^) ]-... • • • + 33 2(/-; + i) +г-/ 2W [ * + ° ((T=7jm) ] ] = — 021'-» Г 1 Г» I * fi . I .. * fJ~T 1 v Подсчитаем отдельно сумму, стоящую в скобках: i-i 1 /_j " *=о (* + D + -^ 2 i) 2 Интеграл считается по рекуррентной формуле F (т> Р) = m + '+l l2P+1 - mF (m ~ l • РП ■ Подсчет по этой формуле дает результат F(m, р) = 2Р+1 , 1 , , + Л, 4 г/ т-\-р +1 где Я = 0 [; 2Р+1 ,]■ (m + p+l)(m + p) Подставляя в выражение Ви значения т = ~- и 'р = /—г. получаем. Ви - 22"->> [2м 1——- + R (/-•-!-1) + У [1 + 0((1^)]- :22/ ЗдесРз 2(/_1 + 1) + /_/-|-Л1 + Л2+Лз— 2 (/_,• + !) + /_/ Я* = Л1 = 2*(|-»Д = о 22l-;"-£ /- 1 22' — J — i (7-H-D- 2 (/—«•+1)+м; ' 22i-y-i .*=z m'-/j R3 = Ro = o [(/-i + i) + ^" ](/-/•)■ C-/)"V
42 Т. Н. КРУГЛОВА Тогда i i i=l i=l i=l = 2 2^0;^—+Д4. Ю г=1 Покажем, что Л4 на порядок меньше суммы 2 ^ aiay / г=1 г=1 г=1 22'+1 Г v ! П i /—2 i . / —2Z + 24 Z2 [ Zj 2;Л 2 ^ 22 + ' ' ' ^ 2' У ^ 7=1 „ 22i—J—* Подсчет же величины 2 V —-, дает lV 22i"M~—\ что приблизительно в Z/2 раз больше i?4. Возвращаясь к выражению энергии Н2(Рп), получаем следующую цепочку асимптотических равенств: i _ 1 Н2 {Рп) ~ 2 ^ a,a; ^ = i- 2 а,а, 2*-^ = | & ~ ■£ , г< г= так как согласно (7) г=1 г=1 I г=0 Последнее асимптотическое равенство верно ввиду того, что 1= j^log [—1 J ] ~n — \ogn~n при п^со. Заметим, что если п имеет вид 2Р — 1, р — натуральное, то последовательность Р множеств Рп превращается в последовательность кубов
ОБ АСИМПТОТИЧЕСКОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧИ О ЗАРЯДАХ 43 Mk£En размерности к = п—[log (лг —f-1)] = п — р. В этом случае, следовательно, тоже получаем гг,П/Г ч 2*h 22<П-Р> 2*п #(МЛ)~-— = — -jjg-. §з [2П П —т-т , где гс = 2р— 1 и п — р = т. Рассмотрим последовательность МХ={М*} хэмминговских множеств мощности S. Критерий, позволивший подсчитать асимптотическую энергию для шарообразных множеств, здесь оказался неприменимым, так как нижняя оценка в этом случае оказалась грубой. Подсчитаем энергию М% другим путем и сопоставим ее величину с величиной Н(Р°п). Пусть ^1 = (ац, . . ., <xln), А2— (Ct2b • • • > а2л)> Л2т=(а2т1, .. ., а2тп) есть множество точек кода Хэмминга. Возьмем за А^ набор (0, 0, . . ., 0). Энергия точки А^ будет i=2 i=2 Если рассмотреть наборы А1 = (ац, . . ., aim, 0,0, . . ., 0), А'ъ = ((Xji, . . . , (Хг*т, аг(7П+1)* • • • ч am)> A'l = (aiu .. ., afm, 1, 1, .. ., 1), будем иметь 1 <^< 1 \\а\\\ * н л,|1 ^ || л;и • Тогда для энергии Н (Aj) получаются следующие оценки: 2т 1=2 Подсчет сумм а4 (т) и а2 (яг) дает результат 2^+1 at (/n) ~ a2 (т) — , следовательно, tf(^>~V
44 Т. Н. КРУГЛОВА Вследствие того, что все точки кода Хэмминга равноправны, получаем Итак, верна Теорема 6. Последовательность Мх = {Мп} имеет такую же асимптотику энергии, как последовательность Р множеств Рп с минимальной энергией. Замечание при корректуре. В примере 1.2 (стр. 31) неправильно Г 2П П подсчитан радиус шарообразного множества мощности . Поэтому опирающиеся на эту величину оценки и утверждения неверны. Общие теоремы (1, 2, 3, 4) остаются справедливыми. Фактически у достаточно «мощных» множеств асимптотика энергии не зависит от структуры множества, а зависит только от его мощности (в частности, множество с максимальной энергией и множество с минимальной энергией имеют асим птотически одинаковую энергию). Точнее, М'1 если log jli (Mn) ~ п, то Н (Мп) " . Доказательство этого факта основано на том, что при указанном условии для каждой фиксированной точки множества Мп «почти все» остальные точки находятся п от нее на расстоянии, асимптотически равном -у . Я очень благодарна Э. И. Нечипоруку, который обратил внимание на ошибку. ЛИТЕРАТУРА [1] X э м м инг, Коды с обнаружением и исправлением ошибок, ИЛ, 1956, 7—22. [2] Я б л о и с к и й С. В., Функциональные построения в Ахшачной логике, Труды МИЛН LI, 1958. [3] Ш а п и р о Г. С, 3 л о т н и к Д. Л., К математической теории кодов с исправлением ошибок, Кибериетич. сб., вып. 5, ИЛ, 1962. [4] Яблонский С. В., Об алгоритмических трудностях синтеза минимальных контактных схем, сб. «Проблемы кибернетики», вып. 2, М., Физматгиз, 1959. [5] 3 и л ь б е р м а н Б. С, О расположении зарядов в вершинах единичного «-мерного куба, ДАН 149, 3, 1963, 546-549. [6] В а н дер Варден Б. Л., Математическая статистика, ИЛ, 1960, 20—23. [7] Рыжик И. М., Специальные функции. Собрание формул и вспомогательные таблицы, М.—Л., Гостехиздат, 1936. Поступило в редакцию: первый вариант 10 I 1963, окончательный вариант 20 III 1964.
О МОЩНОСТЯХ МНОЖЕСТВ ПРЕДПОЛНЫХ МНОЖЕСТВ НЕКОТОРЫХ ФУНКЦИОНАЛЬНЫХ СИСТЕМ, СВЯЗАННЫХ С АВТОМАТАМИ В. £. КУДРЯВЦЕВ (МОСКВА) Введение В настоящее время интенсивно развивается одно из направлений математики — теория автоматов. В этой области возник целый ряд трудных математических вопросов, таких, как, например, проблема синтеза, тождественных преобразований, полноты автоматов и др. В статье рассматриваются вопросы, связанные с проблемой полноты для автоматов, В инженерной практике часто приходится конструировать автомата с заданным поведением, исходя из некоторого набора элементарных автоматов. При этом указывается, какие схемы, построенные из этих автоматов, считаются допустимыми. Таким образом, задача о возможности построения автомата с произвольно заданным поведением сводится к выяснению того, содержатся ли среди допустимых схем схемы, реализующие любой интересующий нас автомат, т. е. полна ли исходная система автоматов. Оказывается, что проблема полноты для автоматов сводится к проблеме полноты для некоторой функциональной системы, другими словами, для формулировки проблемы полноты и решения ее важны функциональные характеристики автоматов и допустимые способы их соединений и несуществен вид схемы, построенной из элементарных автоматов. Пользуясь этим замечанием, уточним постановку задачи на функциональном языке. Будем рассматривать так называемые конечные автоматы. Пусть имеется такой автомат с п входами и т выходами, каждый из которых может находиться в конечном числе различных состояний. Если на входы .этого автомата подается последовательность наборов значений (входная последовательность), то на выходы его поступает некоторая последовательность наборов (выходная последовательность), зависящая от входной последовательности. Тем самым автомат определяет некоторое отображение Т входных последовательностей в выходные последовательности. Это отображение Т и примем за функциональную характеристику автомата. Часто вместо указания множества допустимых схем рассматривают правила построения схем из исходных автоматов. Введем обычно рассматриваемые операции суперпозиции и обратной связи [1, 2, 5, 6], индуцирующие в классе функциональных характеристик автоматов некоторые операции, суть которых состоит в том, что набору функциональных
46 В. Б. КУДРЯВЦЕВ характеристик исходных автоматов ставится в соответствие функциональная характеристика некоторого, вообще говоря, другого автомата. Сохраним за этими операциями названия суперпозиций и обратной связи. Теперь проблема полноты для автоматов может быть сформулирована следующим образом. Рассматривается множество Р функциональных характеристик всех конечных автоматов с введенными в нем операциями суперпозиций и обратной связи. В Р выбирается произвольное подмножество 5Ш. Спрашивается, в каких случаях выбранное подмножество Ш при помощи операций суперпозиции и обратной связи порождает любую функциональную характеристику из Р, другими словами, в каких случаях множество Ш является полным, а в каких нет. Применительно к системе Р укажем на некоторые общие задачи по проблеме полноты. 1. Нахождение необходимых и достаточных условий полноты для систем из Р, например, в терминах преднолных множеств. 2. Выяснение существования алгоритма, который для любой конечной системы из Р устанавливает, полна она или нет. 3. Исследование полных независимых систем. При решении второй из перечисленных задач может оказаться, что алгоритма для распознавания полноты системы нет, однако в принципе возможно указание всех предполных множеств. Тогда мощность всех преднолных множеств можно рассматривать как оценку эффективности искомого критерия полноты. Аналогичные задачи по проблеме полноты рассматривались в алгебре логики, конечнозначных логиках и при исследовании других функциональных систем. Назовем здесь работы Поста, Яблонского, Кузнецова и др. В этой связи проблема полноты для автоматов представляет интерес как пример в плане общей задачи о полноте для функциональных систем. Сопоставление различных функциональных систем показывает, что усложнение системы при неизменных операциях может вести к потере ряда «хороших» свойств, а усиление операций при неизменной сложности рассматриваемой системы может вести к приобретению некоторых «хороших» свойств. В связи с этим функциональная система, возникающая при изучении автоматов, представляет значительный интерес. С одной стороны, эта система является более сложной, чем конечнознач- ные логики, и, с другой стороны, операции, определенные в ней, сильнее операций, рассматриваемых в конечнозначной логике. Ввиду этого было совершенно не ясно, в какой степени известные результаты о полноте в конечнозначных логиках имеют место применительно к рассматриваемой функциональной системе, и трудно было прогнозировать наличие или отсутствие тех или иных свойств. До недавнего времени по проблеме полноты для автоматов имелось сравнительно немного результатов. Было известно существование некоторых конечных полных систем, например полной «истинностной» системы и «задержки», полной «истинностной» системы и «триггера» и т. п. Ряд серьезных результатов о полноте автоматов содержится в недавно опубликованных работах А. Летичевского [5, 6]. В предположении наличия полной «истинностной» системы им найден эффективный критерий полноты для систем автоматов Мура. Совсем недавно Кратко доказал алгоритмическую неразрешимость некоторых задач о полноте для ряда функциональных систем, связанных с автоматами. В понятие «поведение автомата» можно вкладывать различный смысл, и по-разному можно конструировать автоматы из исходных, поэтому
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 47 выбор функциональных характеристик и операций над ними не является однозначным. Так, в работах [7, 8] исследовалась проблема полноты для некоторого специального класса функциональных характеристик автоматов (функции алгебры логики с задержками). В предлагаемой статье исследуются две функциональные системы. В качестве первой системы рассматривается класс Р функциональных характеристик всех конечных автоматов, в качестве второй системы — класс Рд так называемых детерминированных отображений. Система Рд является более общей, чем система Р. Конечно, наибольший интерес представляет система Р. Однако решение задач о полноте для этой системы оказалось связанным со значительными трудностями. Отчасти с целью преодоления этих трудностей в упомянутых выше работах [7, 8] исследовались задачи о полноте I и полноте II для системы функций алгебры логики с задержками. Последняя система является в некотором смысле промежуточной между алгеброй логики и системой Р. Основным результатом работ [7, 8] было решение задачи о полноте II в терминах предполных множеств. Были описаны все предполные множества, число которых оказалось счетным. Все предполные множества описаны эффективно, и потому оказалось возможным получение эффективного критерия полноты П. Основным результатом данной статьи является доказательство того, что мощность всех предполных множеств в Р равна континууму, т. е. совпадает с мощностью множества всех подмножеств Р. Тем самым получен отрицательный ответ на вопрос о существовании эффективного критерия полноты в терминах предполных множеств. Далее в статье исследуется вопрос о независимых, полных в Р системах. Именно показано, что в Р наряду с полными системами, состоящими из одного о.-д. оператора с одним выходным переменным, существуют как угодно длинные независимые полные системы. Относительно системы Рд устанавливается, что мощность всех предполных множеств равна гиперконтинууму. Всюду для простоты изложения полагается, что входные и выходные переменные функциональных характеристик могут принимать только два значения: 0 и 1. § 1. Действия над д. функциями Пусть / — множество бесконечных последовательностей из нулей и единиц. Элементы этого множества будем обозначать так: а=(а(1),а(2),...). Пусть имеются две группы переменных: и-1, а2, . . . и —>• —> VU V2, ... , принимающие значения из множества /. Переменные первой группы назовем входными переменными, второй группы — выходными переменными. В дальнейшем, во избежание употребления сложных индексов, для обозначения входных переменных будем употреблять метасимволы X[i #2> • • • »
48 В. Б. КУДРЯВЦЕВ для обозначения выходных переменных — метасимволы *) -* —> Уи Уг, • • • Представим переменную xt, i = l, 2, . . ., в виде хь = (хь(1), xt(2),...). аналогично представим переменную у^ /=1, 2, . . . Введем обозначения: xrl(t) = (xl(t), x2(t), ...,xn(t)): пусть лгг (^) = a; (i), i = 1, 2, . . ., /г, тогда ап(0 = (<М0. а2(*), ...,ап(0). Определение. Будем говорить, что функция Т(хи х2, . . ., жп) = (у1, z/2, . . ., z/m), (1) где п, га>1, является детерминированной функцией (д. функцией), если она может быть рекуррентно определена при помощи системы вида <jr(* + l)=iM?(0. *i(0. x2{t),...,xn(t)\. */i(0r=<PiM0> Xi(t), x2(t),.. . .,xn(t)]. ЫО^ФгМО» *i(0» ^(0. • • .. ^ii (01. Ут(0 = фш[д(0» МО» жг(0» • • • » M01- где функция ij) принимает значения из натурального ряда, ц^ — некоторое фиксированное ее значение, называемое начальным состоянием д. функции Т\ аналогично произвольное значение этой функции называется состоянием д. функции Т. Из этого определения следует, что функция (1) обладает тем свойством, что компоненты г/4(0» Уг(0> • • • > У™ (0 выходных последовательностей при любом £ > 1 зависят только от компонент х1(т), #2(т),..., хп(т), 1<т<£, входных последовательностей и не зависят от компонент #i(t'), я2(т'), •••> ^п СО при т' > £ (свойство детерминированности д. функции). В силу свойства детерминированности д. функцию Г можно рассм тривать с несколько иной точки зрения, а именно как функцию одного аргумента, отображающую последовательности вход- ных слов ап (t) в последовательности выходных слов ym(t), t-~l, 2, ..., заданную при помощи той же системы (2). Назовем последовательность ■а"(1), а" (2),... входных слов входной последовательностью; аналогично вводится понятие выходной последовательности. В некоторых случаях нам будет удобнее рассматривать д. функцию именно с этой точки зрения, т. е. как функцию, переводящую входные последовательности в выходные последовательности. Заметим, что одна и та же д. функция может быть, вообще говоря, задана различными системами вида (2). Определение. Д. функция —*■—*■ —>—*•-> —* —► _► _-► 1 (ХЛ, Х2, . . . , £j-b xii #i+l» • • • » хп) = {Уи Угч • • • » Ут) * При этом разными хметасимволами обозначаются разные переменные.
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 49 не зависит существенно от входной переменной #г, если для любых -* —► элементов а и р из / имеет место —»■—»■ —►->—► -*• —► —► —»■—»■-> —> 1 (Xii Х%, . . . , #£-i, Ct, #i+l? . . . , Xji) = 1 (Xi, 2*2, . . . , #г-1? P? 3?г + 1? • • • •> xn)- Будем говорить также, что переменная xt является фиктивной для д. функции Т. Замечание. Будем предполагать, что вместе со всякой д. функцией имеется любая другая д. функция, которая получается из исходной путем добавления и изъятия любого конечного числа фиктивных переменных. Определение. Д. функция называется константной функцией, если она не зависит существенно ни от одной из своих входных переменных. Будем считать, что константная д. функция зависит (конечно, несущественно) от одной входной переменной. Нетрудно видеть, что константная д. функция отображает любой элемент из множества / в некоторый фиксированный набор элементов из /. Введем следующие операции над д. функциями. Операция А (выделение выходной переменной). Пусть имеем д. функцию Т (хп %2i • • • i xn) — {Уи У2i • • • * yj-ii Vh Vj+ii • • • По определению функция Т (х{, х2, . . ., хп) = у$, где yj принимает те же значения, что и в (3), / = 1, 2, Ут). (3) Щ-* Щ%% 4-/1 у f у•• • | ., ?п, получена ч ч J....A Л ± Ут Ч Ут Рис. 1. Операция А. Рис. 2. Операция Б. из д. функции (3) при помощи операции Л. Обозначим эту функцию так: 1 (#!, #2> • • • * хп) — У:- Операция Б (переименование входных переменных). Пусть имеем д. функцию Т (#!, Х2ч . . . , %i-i, xi, %i+i, • • • i хп) = \У\1 Угч • • • » Ут), (4) и некоторую входную переменную хь, отличную от хи . . ., хп. По определению функция 2 (X'j, #2, . • . , Я'г-i, Xki xi + li • •> хп) ™- \У\, У2ч • • • » Ут) i ГДО Vj принимает те же значения, что и в (4), г = 1, 2, . . ., /г, получена из д. функции (4) при помощи операции Б. 4 Проблемы кибернетики, вып. 13
50 В. Б. КУДРЯВЦЕВ Операция В (склеивание входных переменных). Пусть имеем д. функцию —► —>—>—> —►->—► ->.-> —+ Т (#!, . . ., Xi-i, Xi, Xi+i, . . ., Xk-\, Хъ, Xk+ir . . ., xn) -- (г/ь . . ., ym). (5) Функция —► —► —► —► —►_►—> —► / (#i» #2' • • • ' xi-\i xi + \-> • • • » ^-ft-i» ^ft? ^A+i» • • • ч xn) ~': = 1 (X\, X2, . ♦ . , #£-i? 2"А? 3?i-l? • ♦ ♦ » #m)» по определению, получена из д. функции (5) при помощи операции В. шн\ &Ы ХМ\ • -ЧII' • 'I I I '"У ft '*♦/ J. ••• |. fr' tifl |,rW xk-l\ fkxn tf f f r^, Рис. З. Операция В. Операция Г (переименование выходных переменных). Пусть имеем д. функцию Т (хи х2, . . ., хп) = (уи у2, . . ., ijj-u уj, yj+l, . . ., ym) (6) и некоторую выходную переменную уи, отличную от г/i, . . ., z/m. По определению функция Т (хи х2, . . ., жп) = (z/i, г/2? • . •, г/j-i, Ук, Vj+u • • ч */m)> где yj принимает те же значения, что и в (6), получена из д. функции (6) при помощи операции Г. У/ /71/7 f I/7I/7 I Ч-Г %'%f % УГУй Рис. 4. Операция Г. 1 %%i4m ,k Операция Д (объединение д. функций). Пусть имеем д. функции 7\ (а-!, #2, . . ., хп) = (г/!, у2, . . ., г/т) (7) ^2 (^п+1? xn+2i • • • » 2Wr) — (*/т+1> #т+2> • • ■ » Ут+s) • (°) Функция ^1, 2 (XU x2i • ч #п, #n+l» • • ч ^п+г) = {Уи Уг-> • • ч 2/т> */т+1, • • ч Утп+s) ,
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 51 по определению, получена при помощи операции Д, примененной к упорядоченной паре (Ти Т2) Д. функций (7) и (8), если функция. * 1, 2 ("^1» Х2ч • • • » xn+r) ~ У i совпадает с функцией 1 I (Х^, Х2, ...» Хп) — l/i при всех i таких, что 1<г<т, и функция * 1, 2 \х\* -Х2' • • • » хп+г) == У] совпадает с функцией ■* 2 (хп+1ч xn+2i • • • 1 ^'п+г) = У./ при всех / таких, что m+l</<m + s. ♦л* 0777*7 0^/77+5 ** 7,2 0777 J/77+/ Рис. 5. Операция Д. Приведем два вспомогательных построения, которыми мы будем в дальнейшем пользоваться. 1. Пусть имеем д. функцию Т (#!, х2, . . ., Xji) — \У\1 Уг^ • • •' Уэ-\ч Уз-> Уз+\* • • ч Утп)- (8') Тогда нетрудно видеть, что при псмощи операций А, Б, В, Д из нее можно получить функцию * (#i, Х2, . • - , Хп) — (#!, г/2' • • ч ^j-l» У./+1» • • ч */т)> где г/г при г =£ / принимают те же значения, что и в (8'). Обозначим эту функцию через Tjm (х%, х2, . . ., хп) = (г/j, г/2, . . ., г/^, yj+i, . . ., г/п). 2. Пусть имеем д. функцию 7 (^4, дт2, . . ., атЛ) = z/j —>• и некоторую выходную переменную yk, A> 2. Тогда нетрудно видеть, что при помощи операций Б, В, Г, Д из нее можно получить функцию Ti(xu х2, . . ., яЛ) = (У1, ук) такую, что функции 3TJ (хл, х2, . . ., a:n) =y1? TJ (хи х2, . . ., жп) = г/Л совпадают с функцией Т (хл, х2, . . ., xn) = yi. Индекс ;"* у функции Т на рисунках показан как ; перечеркнутое.
52 В. Б. КУДРЯВЦЕВ Операция Е (подстановка д. функции в д. функцию). Пусть имеем д. функции М (#1, х2ч - - - 1 хп) = l/i» (9) * 2 (^п+1» #n+r, • • • ч xi-\, xii xi + ii • • • i xn+r) == (£/2, £/3, • • • i l/m) • (*") По определению функция i (#i, ^2' • • • i **Vi, xn+l> . • . » xl-\i xj + \i • • • , 3?n-fr) = = ■* 2 v^n+l, ^-n+2? • • • , #i-l» * 1 (#ii ^2, • • • , ^Vi)» xi+li • • • » '^n+r) получена из д. функций (9) и (10) при помощи операции Е. *л*7 4-71 w • • • w t *•••* W 5 V, ч Ут Iх/ Хп\ ? • * * I h L \ fw |...| */- ; I 1 | 1 "%/ I..., г* ... 1 Й | хп+г ' Рис. 6. Операция Е. —► Определение. Будем говорить, что выходная переменная yj, j = 1, 2, .. ., га, для функции Т {хи х2, . . ., Xi-U xt, xi+i, . . ., аъ) = (г/i, г/2, ..., SO-n ^, j/,/+i, • • •, Ут) (И) со сдвигом зависит от. входной переменной .г*, г = 1, 2, . . ., п, если эту д. функцию можно задать при помощи системы вида (2) такой, что имеет место Ы*)=фЛ*1(0. *г(0. ..-i^«-i(0i *ж(0. ...,**(*)]. *=1, 2, ... (12) Операция Ж (обратная связь). Пусть имеем д. функцию (11), выходная переменная yj которой зависит со сдвигом от входной переменной xi, т. е. выполнено соотношение (12). Пусть имеем набор (сц, а2, . . ., CLi-i, otj+i, . .., ап) произвольных элементов из /. Используя его и систему (2), определим по индукции разряды некоторого нового элемента из / о? = (о?(1). «? (2),...)
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 53 следующим образом (здесь звездочка означает, что этот элемент зависит от элементов а;, / = 1, 2, . . ., i— 1, i+ 1, . . ., п). 1. Пусть c(l)=qu at (1) - ф; [с (1), сц (1), а2 (1), . . ., а^ (1), ai+l (1), . . ., ап (1)]. 2. Пусть определены значения а* (т) и с(т); определяем значения с(т+ 1) и а*(т + 1) так: с(т+1)=г|)[с(т), Мт), а2(т), . . ., а^т), а|(т), а;+1(т), . . ., ад(т)], а?(т + 1) = ф</[с(т+1),а1(т+1),...| a^^x+l), аг+1(т+1), . .., а7г(т+1)]. Функция Р~*1 (хи х2, . . ., х-г-и xi+u . . ., хп) = (г/ь г/2, . . ., у3-и yj+u . . ., z/m), по определению, получена из д. функции (11), если для любого набора ч-/ Ъ/ I У !•••♦ Л* #-/* Ш- от Рис. 7. Операция Ж. */ 1 7-У*' 1 .*/-/ Т' ' * ' \ > X.i+J. f • • • \ г Г'"1 V 1 f ... хп J У/77 (аь а2, . . ., а;-!, аг+1, . . ., аЛ) и любого к = 1, 2, . . ., /—1, /+ 1, . . ., т имеет место (Tj~*l)k (аи а2, . . ., аг-ь аг+1, . . ., аЛ) = rft (аь а2, . . ., а£_ь а*, а£+1, . . ., а„). Остается подчеркнуть, что функция Т°~*г однозначно определяется по д. функции Т и не зависит от вида системы, задающей эту функцию. Сделаем несколько очевидных замечаний. 1. Операция Е следует из операций Д и Ж, однако нам удобно выделить ее. 2. Операции А, Б, В, Г, Д, Е, по существу, совпадают с известными операциями суперпозиции над д. функциями (см., например, [1, 2]). 3. Применительно к логическим сетям операция Ж является более сильной, чем обычно рассматриваемые операции обратной связи через задержку (см., например, [1, 2, 5]). 4. В результате применения перечисленных операций к д. функциям получаются снова д. функции. На схемном языке применение перечисленных операций проиллюстрировано на рисунках 1 — 7. § 2. О мощности множества предполных множеств о.-д. функций Определение. Д. функция Т (хи хъ . . ., хп) = (г/ь г/2, . . ., ут) называется ограниченно-детерминированной функцией (о.-д. функцией)
54 В. Б. КУДРЯВЦЕВ если она может быть рекуррентно определена при помощи системы вида (2), в которой функция i|) принимает конечное число различных значений. Обозначим через Р множество всех о.-д. функций. Нетрудно показать, что в результате применения операций А, Б, В, Г, Д, Е, Ж к о.-д. функциям получаются снова о.-д. функции. Введем в Р операцию замыкания относительно операций А, Б, В, Г, Д, Е, Ж. Определение. Пусть ЗЯ^-Р. Множество [ЗЯ] называется замыканием относительно операций А, Б, В, Г, Д, Е, Ж*) множества $Щ, если оно содержит все те и только те о.-д. функции, которые могут быть получены из о.-д. функций множества Ш при помощи конечного числа применений операций А, Б, В, Г, Д, Е, Ж. Определение. Множество 5ЩС1Р называется замкнутым, если Очевидно, что так введенная операция замыкания обладает всеми свойствами замыкания, определенного в [6]. Определение. Множество Ш^Р называется полным, если [Ж]=Р. Определение. Множество ШczP называется предполным множеством, если 9Л не полно и если для любой о.-д. функции Т, не принадлежащей 9Л, множество Ш \J {T} полное. Интересно выяснить, какими свойствами должно обладать произвольное множество 9ЛС1Р для того, чтобы оно было полным. Как указывается в работе [6], условия полноты можно формулировать в терминах предполных множеств. Нетрудно показать, что применительно к системе Р с введенными в ней операциями имеет место следующее утверждение. Теорема. Для того чтобы множество Шс^Р было полным, необходимо и достаточно, чтобы 2К не содержалось ни в одном предполном классе. Так как множество Р счетно и, как известно (см., например, [1, 2, 5]), содержит полную конечную систему о.-д. функций, то естественно было ожидать, что в терминах предполных множеств можно получить эффективный критерий полноты. Оказывается, что это не так. Точнее, мы покажем, что множество всех предполных множеств о.-д. функций имеет континуальную мощность. Известно (см., например, [2]), что константная о.-д. функция переводит любую входную последовательность в одну и ту же периодическую выходную последовательность. Заметим, что если константная о.-д. функция имеет одну выходную переменную, то ее выходную последовательность можно трактовать как элемент множества /. Введем некоторые обозначения. Пусть С есть множество всех константных о.-д. функций с одной выходной переменной. О.-д. функцию из С, имеющую выходную последовательность Y = (Y(1), Y(2),...). обозначим через Г (y)- Через ] Г (y) [ обозначим множество всех о.-д. функций из С, выходные последовательности которых отличаются от последовательности y B конечном числе разрядов. Пусть имеется некоторое множество В периодических последовательностей б из /. Введем обозначения: VB=JJ {Г (б)}, ]FP[=JJ ]Г(б)[. *) В дальнейшем для краткости в выражениях, подобных следующему: «замыкание относительно операций А, Б, В, Г, Д, Е, Ж», слова «относительно операций А, Б, В, Г, Д, Е, Ж» мы будем опускать.
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 55 Определение. Будем говорить, что о. -д. функция Т (хи х2, ...,хп) = -*• —► -> = (2/i? Уг, • • .» Ут) сохраняет множество C'czC, если для любых о.-д. функций Tix, Ti2, . . ., Т{п из С и любого к такого, что 1<&<т, о.-д. функция Тп(Т{1Ч Ти, . .., Tin)=yk (которая, очевидно, является константной) принадлежит множеству С. Определение. Будем говорить, что множество Шс^Р сохраняет множество C'czC, если каждая о.-д. функция из ЯЛ сохраняет множество С. Заметим, что из сохранения множеством ЯЛ множества С с С не следует, вообще говоря, что множество [ЯЛ] также сохраняет С, в чем мы убеждаемся на следующем примере. Рассмотрим в качестве множества С множество всех константных о.-д. функций, выходные последовательности которых только в конечном числе разрядов отличаются от последовательностей ^ = (0,0,..., О,...), а2 = (1, 1, ..., 1, ...), а в качестве множества ЯЛ— о.-д. функцию, реализуемую схемой, представленной на рис. 13. Нетрудно видеть, что эта о.-д. функция сохраняет так определенное множество С'. Однако, как показывается в § 4, указанная о.-д. функция образует полную систему в Р, и потому, в частности, [ЯЛ] должно содержать константную о.-д. функцию, выходная последовательность которой есть а3=(0, 1,0, 1,...). Очевидно, эта константная о.-д. функция не сохраняет множество С". Определение. Пусть множество ЯК CZ Р сохраняет множество С CZC. Назовем множество Ш*с^Р С'-максимальным для ЯЛ, если выполнены следующие условия: 1) ЯЛ* замкнутое множество, 2) ЯЛ* сохраняет множество С, 3) ЯЛ* содержит ЯЛ, 4) [ЯЛ* [J {T}] не сохраняет множество С" при любой о.-д. функции Г, не принадлежащей множеству ЯЛ*. A priori для одного и того же замкнутого множества ЯЛс^\ сохраняющего множество С CZ С, могут существовать несколько различных с"-максимальных множеств. Лемма 1. Для любого замкнутого множества SftCZ^ и любого множества С CZ С таких, что ЯЛ сохраняет С", существует С-максимальное множество. Доказательство. Может случиться, что ЯЛ является С"-макси- мальным для себя. Тогда все доказано. Пусть ЯЛ не есть С'-максимальное для себя. Тогда найдется о.-д. функция Г(£ЯЛ такая, что множество [ЯЛ (J {T}] сохраняет С. Занумеруем все такие о.-д. функции Т\\, Т12, ...» Тц, . . . (13) Обозначим через ЯЛ! множество [ЯЛ [j {Tn}]. Очевидно, что замкнутое множество ЯЛ4 отлично от ЯЛ и сохраняет С. Либо множество ЯЛА является С'-максимальным для ЯЛ, либо нет. В последнем случае найдется о.-д. функция 7" такая, что замкнутое множество [ЯЛ4 |J {7"}] сохраняет С'. Очевидно, что все такие о.-д. функции образуют подпоследовательность
56 В. Б. КУДРЯВЦЕВ последовательности (13): ^21> * 22 > • • • > ^ 2Ь • • • Обозначим через ЗК2 замкнутое множество [ЗР^ (J {Г21}] и т. д. Или указанный процесс оборвется на конечном шаге, т. е. построим С-макси- мальное множество для ЗК, или же получится возрастающая последовательность замкнутых множеств, сохраняющих C'CZC: акс: aKi d ак2с:... с= 9К/с... оо В. последнем случае множество ЗК' = |J ЗКг- и будет С'-максималышм г=1 для ЗК. В самом деле, очевидно, множество ЗК' замкнутое, сохраняет С и по построению не существует о-.д. функции Т" такой, что Г"$ЗК и замкнутое множество [ЗК' (J {Т"}] сохраняет С. Ч. т. д. Определение. Пусть имеем о.-д. функцию 2 (#£, #2> • • • » #i-l» #i» #i+l» • • • » ^Vi) — */l и некоторую последовательность 6 = (6(1), 6(2),...) —> из /. Будем говорить, что входная переменная хи 1 = 1, 2, . . ., /г, о.-9. функции Т обладает F-свойством на последовательности б, если существует такое число t0, зависящее только от последовательности б и о.-д. функции Г, что о.-д. функция Т переводит любую входную последовательность ап(1), а» (2),..., ап(*), ..., где —> ап (0 = (а4 (0, а2 (^, . . ., af-4 (0, 6 (*), аг+1 (0, • • •, ап (*)) при 1 < £ < *<,, —> an(0 = (ai(0, a2(0, . . ., aj-i(0» <М*). <*h-i(*). • • •» <** (0) пРи * > *<ь в выходную последовательность Y = (Y(1), Y(2), ...,Y (0, •••) такую, что y (0 = ai (О ПРИ * > 'о- Число £0 называется пороговым числом для входной переменной xt о.-д. функции Т относительно последова- -> тельности б. Определение. Пусть имеем о.-д. функцию -> -> ->->-> -> -> 2 (,Xl, Х2, . . . , #i-i, #Ь ^г+1> • • • > хп) ~ У1 (14) и некоторое множество В последовательностей б из /. Будем говорить, что входная переменная #,-, г = 1, 2, . . ., /г, о.-9. функции Т обладает F-свойством на множестве В, если входная переменная #$ обладает /^-свойством на каждой последовательности б из В. Замечание. Если множество В состоит из периодических последовательностей б из / и входная переменная х-г о.-д. функции (14) обладает /^-свойством на множестве В, то будем говорить также, что входная —> переменная xt о.-д. функции (14) обладает /"-свойством на множестве VB=JJ{T(6)}. ~6£В
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 57 Применительно к автоматам /^-свойство входной переменной xt о.-д. функции (14) на множестве В означает следующее. Пусть б —произвольная последовательность из В. Тогда по о.-д. функции (14) и последовательности б можно указать такое число t0, что после подачи на вход х% автомата, реализующего о.-д. функцию (14), конечной последовательности 6(1), 6(2), ..., 6 (*<,), а на остальные входы любых конечных последовательностей длины to автомат начнет «работать» как тождественный, выдаъая на выходе значение, совпадающее со значением x-L(t), £> t0. Замечание 1. Нетрудно видеть, что если С С-С и С' = ]С'[, то всякая о.-д. функция, некоторый вход которой обладает ^-свойством на множестве С", сохраняет С'. Определение. О.-д. функция Т (хи х2, . . -, xn)=j/i называется почти константной, если существует такое число ^> 0, зависящее только от о.-д. функции Г, что входную последовательность аЛ(1), а(п>(2), ...,ап(*), ... (15) о.-д. функция Т переводит в выходную последовательность 6 = (6(1), 6(2) ...,6(0, ...) такую, что в ней значения 6(*i+l), 6(*i + 2), ... остаются неизменными для любой входной последовательности (15). Число ti называется абсолютным пороговым числом для о.-д. функции Т. Очевидно, что константная о.-д. функция с одной выходной переменной является почти константной. Рассмотрим следующее счетное множество периодических последовательностей из /: £ = (0, 1,0, 1, ...), (J2 = (0,0, 1,0,0,1, ...) Рп = (0, 0, ...,0, 1,0,0, ...,0,1, и множество о.-д. функций С = \j (Гф,)}. г=1 Лемма 2. Пусть С'д. С, С"дС, СфС"\ тогда\С'\Ф\С"\. Доказательство. По условию множества С и С" различны. Пусть для определенности множество С" содержит некоторую о.-д. функцию Г (Рд), не принадлежащую множеству С". Отметим одно свойство этой о.-д. функции. Именно, в последовательности рА как угодно далеко встречаются кортежи вида 1,0,0, ...,0,1, ... k Очевидно, ни одна о.-д. функция из С" не обладает этим свойством.
58 В. Б. КУДРЯВЦЕВ Отсюда следует, что этим свойством не обладает ни одна о.-д. функция из множества ] С" [. И так как Гфь)£С', ?о]£'[Ф]С"[. Ч. т. д. Определение. Обозначим через 91 (С) множество всех о.-д. функций -> -> -> -*■ -*■ -*■ Г (х±, Х2, . . . , Хп) = (z/i, 1/2, • • • , Ут) таких, что каждая из о.-д. функций . —> —> —> —> Т3 (хи х2, . . ., хп)=уу, /=1, 2, . . ., т, либо почти константная, сохраняющая множество ] С [, либо имеет входную переменную, обладающую /"-свойством на множестве ] С [, С сг С. Замечание 2. Нетрудно видеть что множество 91 (С) сохраняет множество \С [. Замечание 3. Нетрудно видеть, что множество всех константных о.-д. функций из 91 (С) с одной выходной переменной совпадает с множеством ] С [. Легко показать, что верна следующая Лемма 3. Пусть Ш — произвольное подмножество множества 91 (С); тогда любая о.-д. функция, которую можно получить из элементов множества Ш при помощи операций А, Б, В, Г, также принадлежит множеству 91 (С). Лемма 4. Если о.-д. функции 1 i \Х\, Х2, • • • » %п) — У it ■* 2 (^п+1> #п+2> • • • » ^n+r) = Z/2 принадлежат множеству 91(C), то о.-д. функция —► —► —>. —► —>. _>.—> _> —► i 1 (#1, #2> • • • * ^А-1> ^2 0*74-1» #п+2> • • • » хп+г)ч 3'h+li • • • » ^п) ~ #1 (ДЬ) также принадлежит множеству 91(C). Доказательство. Из определения множества 91(C) следует, что каждая из о.-д. функций Т\ и Г2 либо почти константная, сохраняющая множество ] С [, либо имеет вход, обладающий ^-свойством на множестве ] С [. Покажем, что о.-д. функция Т^ (х1ч . .., агд_1, Г2, 2"д+1, . . ., хп) = у^ также либо почти константная, сохраняющая множество ] С" [, либо имеет вход, обладающий /"-свойством на множестве ] С [. Возможны следующие случаи. 1. О.-д. функция Т\ почти константная. Тогда, очевидно, о.-д. функ- —► —► —► -> —► —► ция Z\ (xiy х2, . . ., xk_ly Т2, xk+i, . . ., хп) = г/i также почти константная, сохраняющая множество ]С"[. 2. О.-д. функция Tt имеет входную переменную, обладающую /'-свойством на множестве ]С"[. Пусть этой входной переменной является хг. Если I Ф к, то, очевидно, входная переменная хг о.-д. функции —► -> »-> ->• —► ?! (^ь . . . ,#*_!, Г2, хА+1, .. ., xn) = yi также обладает /^-свойством на множестве ]С"[. Пусть 1 = к. Тогда возможны следующие подслучаи. а) О.-д. функция Т2 почти константная, сохраняющая множество ] С [. Покажем, что тогда о.-д. функция (16) есть также почти константная, сохраняющая множество ]С"[. Пусть t0 — абсолютное пороговое число о.-д. функции Г2, и пусть Т2 переводит некоторую входную последовательность
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 59 в выходную последовательность 6 = (6(1), 6(2), ...,6(*0), ...). где значения 8(t0-\-k), /с>1, остаются неизменными для любой входной последовательности. Так как о.-д. функция Г2, по условию, сохраняет множество ] С [, то на любой последовательности вида б' = (6'(1), 6'(2),...,6'(*0), 6(«о+1), б(^о + 2),. ...б^о + Л), ...) входная переменная хг о.-д. функции Т\ обладает /"-свойством. Таких последовательностей, очевидно, не более чем 2 °, и относительно каждой из них входная переменная xt имеет свое пороговое число. Выберем среди этих чисел наибольшее. Пусть это будет число tim Обозначим £2=niax {to, ^i}- Тогда нетрудно видеть, что о.-д. функция Ti переводит любую входную последовательность оп(1), а» (2), ...,а"(0, ..., в выходную последовательность б" = (б"(1), б"(2), ...,6"(<2), 6(*2+1), ...), где в выражении ап(*) = (М*), аг(0. • • •> ctz_i(0, а.1 (t), az+i(0, . .., «п (t)) имеет место az (t) = 6 (/) при t > U. Отсюда следует, что о.-д. функция (16) является почти константной с абсолютным пороговым числом, равным £2. б) О.-д. функция Т2 имеет входную переменную, обладающую /''-свойством на множестве ] С [. Пусть xq, п~\-1 <# < п-\-г, — такая входная переменная. Покажем, что тогда входная переменная xq о.-д. функции (16) обладает /"-свойством на множестве ] С [. Пусть Г (у) — произвольная о.-д. функция из множества ]С"[, и пусть t3 — пороговое число для входной переменной xq о.-д. функции Т2 относительно последо1 вательности f=(Y(l), Y(2), ...,Y(0. •••)• Рассмотрим все последовательности у', которые могут отличаться от у только в первых t3 разрядах. Нетрудно видеть, что таких последовательностей у' не более чем 24 И так как, очевидно, Г (у')£]С' [, то входная переменная xq о.-д. функции 7\ обладает /^-свойством на этих последовательностях и относительно каждой из них входная переменная xq имеет свое пороговое число. Выберем среди этих чисел наибольшее. Пусть это будет число £4- Обозначим: t5 = max {t3, £4}. Теперь нетрудно видеть, что входная перемен- ная xq о.-д. функции (16) обладает /'-свойством на последовательности у и пороговым числом для нее относительно последовательности у является tb. Ч. т. д. Из леммы 4 следует Лемма 5. Пусть 3JI — произвольное подмножество множества 91 (С); тогда любая о.-д. функция, которую можно получить из
60 В. Б. КУДРЯВЦЕВ элементов множества Ш при помощи операции Д, также принадлежит множеству 91 (С). Нетрудно видеть, что имеет место следующее утверждение, которое позволяет свести операцию Ж к операциям А, Б, В, Г, Д, Е и весьма X У, fl ХП ' ' ч И Т хп Х1\ ХН ••• | у V"*f 4+1 % t. . . .«/.%, .£. t f * г' rA* Г77?! f • • 4 «) 4o г \ffJA Ч Хп4-П J ' ' ' 1 'Г fn*M r. . • . fin f r' 0-W7+/ \\l ) 1$ П J *J Рис. 8. частному случаю применения операции Ж. Именно, операция Ж применяется к о.-д. функции с двумя выходными переменными Т (хи х2, Хп) = (уи у2) такой, что имеет место 1 (Х^, Х2, . . . ,ХП) =- 1 \Х\, Х2, . . . , Хп). Лемма 6. Пусть выходная переменная yj о.-д. функции (см. рис. 7) Т (хи х2, . . ., xt-u xt, xi+l, . . ., хп) = (уи у2, . . ., г/;-ь yj, yj+u . . ., ym) (17) зависит со сдвигом от входной переменной xL. Тогда о.-д. функция (см. рис. 7) Р~*Х (хи Х2, . . . , Xi-U Xi+l, . . . , Хп) = (уи у2, . . . , yj-u yJ+u . . . , Ут) (18) может быть получена из о.-д. функции (17) следующим образом.
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 61 1. При помощи операций А, Б, В, Г, Д из о.-д. функции (17) получаем о.-д. функцию Tj'0(%i, х2, . . ., хь-и хи Zi+ii . . ., Zn) = (yj, х0) (19) (см. рис. 8,а). 2. Из о.-д. функции (19), заменяя при помощи операции Б входные —► -► переменные х^ на хп+ь, &=1, 2, . . ., п, получаем о.-д. функцию *h {xn+i, Хп+2, • • • > ^n+i-i? %n+ii ^n+i+i» • • . » %2п) = (yj> Уо). (20) 3. 7/з о.-д. функции (20) п/?а помощи операции Ж получаем о.-д. функцию /rph ОчО-иг+г /"*" -*->-* -> -> /пл\ V-* J V#n+1> ^n+2> • • . » xn+i-\, ^n+i+1» • • • » #2n) = 2/./ (^1) (см. рис. 8, 6). 4. Подставляем о.-д. функцию (21) в о.-д. функцию 'Л* (Жь Ж2, . . . , Xt-U XU Xi+i, ...,Хп) = (уи уъ . . . , yj-u yj+u . . . , ут) вместо переменной х%, получаем о.-д. функцию 'Л* (хи х2, . . ., xt-u (fh °)°-п+г, Xi+U _^Xn)=: {уи ^ . . ., у._и у.+{ ,,,ут) (22) (рис. 9). 5. Применяем к о.-д. функции (22) операцию В, «склеиваем» входные переменные xk и xn+k, А = 1, 2, . . . г —1, t + 1, . ..,/с, получаем о.-д. функцию Т>*(хих2, .:.,Xi-i, (Т3,0)°"п+г (хих2, ...,^_ь а-ж, . . .,хп)Лм, • . .,sn) = = (^1. */2, .... */;-ь y;+i, . . ., Ут) (рис. 10), которая, очевидно, совпадает с о.-д. функцией (18). Лемма 7. Пусть о.-д. функция Т (XU Х2, . . . , Хп) = (Уи У2, • • • > Ут) принадлежит множеству 91 (С") к ее еьгяод ^ зависит со сдвигом от входной переменной xt\ тогда о.-д. функция Т^1{хи Х2, . . ., Xi-u Xi+U . . ., Xn)=(yi9 Z/2, . . ., ys_u yJ+i, . . ., ym) также принадлежит множеству 91 (С'). Доказательство. Как следует из леммы 6, все рассматриваемые там в пунктах 1, 2, 3, 4, 5 о.-д. функции, кроме о.-д. функции (21), получаются из исходной о.-д. функции (17) и о.-д. функции (21) при помощи операций А, Б, В, Г, Д. Поэтому на основании лемм 3, 5, если о.-д. функции (17) и (21) принадлежат множеству 91 (С'), то и о.-д. функция (18) также принадлежит множеству 91 (С'). Отсюда следует, что для доказательства леммы достаточно установить, что о.-д. функция (21)
62 В. Б. КУДРЯВЦЕВ 1*7 \Xi-1 \Xi+1 "Ы "п*М и2п '♦ I■ ' " \ /j],OxO~<l+l I • •• t I t'"t 7"' W ty-/^4/ *& Рис. 9. Iя/ Л-/ \xl*f -\Xn LET ■j,0\0-i (П ШТ1. 1 Г"* K ft %,% % Рис. Ю.
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 63 принадлежит множеству 91 (С) или, что равносильно (используются обозначения из леммы 6), если о.-д. функция (20) принадлежит 91(C), то о.-д. функция (21) также принадлежит множеству 91 (С). Заметим, что если выходная переменная о.-д. функции с одной выходной переменной со сдвигом зависит от некоторой входной переменной, то эта входная переменная рассматриваемой о.-д. функции не может обладать /'-свойством ни на каком множестве С с С. Далее, нетрудно видеть, что выходные переменные у$ и у0 о.-д. функции (20) со сдвигом зависят от входной переменной xn+i. Отсюда следует, что входные пере- менные xn+i о.-д. функций —У —> —> —*■ ' \%п+\ч хп+2<> • • • » х2п) — У] и (23) 1 \%п+\1 Хп+2, • • • » х2п) = 2/0 не обладают /'-свойством на множестве ] С [. Возможны следующие случаи. 1. О.-д. функция (23) почти константная, сохраняющая множество ]С'[. Тогда, очевидно, о.-д. функция (21) также почти константная, сохраняющая множество ] С [. 2. О.-д. функция (23) имеет входную переменную хи обладающую /-свойством на множестве ]6"[. В силу вышесказанного 1фп+г, —*• и потому, очевидно, входная переменная х\ о.-д. функции (21) также обладает /"-свойством на множестве ]С'[. Ч. т. д. Отсюда следует Лемма 8. Пусть 9J1— произвольное подмножество множества 91(C); тогда любая о.-д. функция, которую можно получить из элементов множества Ш при помощи операции Е (если она применима к ним), также принадлежит множеству 31(C). Из лемм 3, 5, 8 следует Лемма 9. Множество 91 (С) замкнуто. Так как множество 31(C) замкнуто и сохраняет множество ]С"[, то но лемме 1 для него существует \С'[ — максимальное множество 91* (С), которое, очевидно, не является полным. Замечание 4. Нетрудно видеть, что множество всех константных о.-д. функций с одной выходной переменной, принадлежащих 91* (С), совпадает с множеством ]С'[. Пусть C'CZC, Г(у)$]С[, Q (x2i •• •» xn) =Уи —произвольная о.-д. функция с одной выходной переменной. Тогда обозначим через Ty,q{xi, х2, . . ., ХП)=У1 (24) некоторую о.-д. функцию, обладающую следующими двумя свойствами: 1. TyiQ(T(y), х2, х3, . . ., xn) = Q(x2, х3, . . .,хп). —► 2. Входная переменная xi этой о.-д. функции обладает /-свойством на множестве ]С[.
64 В. Б. КУДРЯВЦЕВ Существование о.-д. функции Ty<iQ для любых Т(у)$]С'[ и Q можно доказать следующим образом. Рассмотрим о.-д. функцию, реализуемую _ ^ схемой, изображенной на рис. 11, \^п_ где схемы под номерами 2, 2, о, 4, п 5, 6 реализуют соответственно о.-д. функции: -* —► —►_>.—>. Ti(xi) = yl, Т2(щ, xi)=y2l —► -* —> Г3 (w2, w3) = z/3, Г4 (W4) = У41 Г5 (Я2, • • • > ЯЛ) = г/5» Г6(гг4, а?!, и5)=у6 такие, что имеет место Г1(ж1) = Г(у), у2(0 = и1(0~ж1(0. У*(« + 1)=и*(0, 5/4(1) = 1, j -► -> -► i 5 \Х2, %3i • • • > Хп) = —v —► -»■ ==г Q\X2i Х3-> • • « » ^Vi)? Ы*) = М*) ^(^VMO u5(t). Нетрудно убедиться, что о.-д. функция, реализуемая всей схемой, удовлетворяет требованиям 1 и 2. Замечание 5. Очевидно, что если Г (у) (£ ]С"[, то для любой о.-д. функции () о.-д. функция r^Q^, #2, • • •» #п) == */i принадлежит множеству 31(C) и, следовательно, множеству 91* (С). Лемма 10. Любое множество 91* (С) является предполным множеством. Доказательство. Покажем, что если о.-д. функция Т не содер- —»■—♦> —► —► жится в 91* (С'), Q (х2, х3, . . ., хп) =Уи — любая о.-д. функция с одной выходной переменной и Ш= [91* (С) {}{Т}], то Q£3R. Отсюда, очевидно, будет следовать лемма. Из определения множества 91* (С) следует, что множество ЗЯ содержит некоторую о.-д. функцию Г' (иь и2. . . ., иП1) = (ии v2, . .., umi) такую, что для некоторых константных о.-д. функций Г (бА), Г(62), ... . . ., Г (бЭТ1), принадлежащих множеству ]С"[, и некоторого/, /—1, 2, . .., /п,, константная о.-д. функция Г (Г (60, Г(б2), ...,Г(вП1))=^ (25) не принадлежит множеству ]С'[. Заметим, что о.-д. функция (25) принадлежит множеству 9К, поскольку в силу замечания 4 множество
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 65 91* (С) содержит целиком множество ]С"[. Пусть выходная последова- тельность о.-д. функции (25) есть у. Так как Г(у)(£]С"[, то> п0 замечанию 5, множество 91(C), а следовательно, и множество 91* (С) содержат о.-д. функцию Г-* (xi4 х2, . .., хп)=у1. Но подстановка в эту о.-д. Y, Q функцию вместо входной переменной хх о.-д. функции Г (у) дает о.-д. функцию Q (ж2, %з, • • •, ж*) = г/i. Ч. т. д. Докажем основную теорему этого параграфа. Теорема 1. Мощность множества всех предполных множеств о.-д. функций равна континууму. Доказательство. Так как множество Р счетно, то указанная в теореме мощность не может быть выше континуальной. Пусть имеем множества С'С-С ж C'czC, и пусть С ФС". Тогда по лемме 1 и замечанию 4 предполные множества 91* (С), 91* (С"), соответствующие различным множествам С и С", различны. Для завершения доказательства остается заметить, что множество С имеет континуум различных подмножеств. § 3. О мощности множеств предполных множеств некоторых других функциональных систем Наряду с уже определенными операциями А, Б, В, Г, Д, Е, Ж введем в Р еще одну операцию (операция 3). Именно, будем считать, что вместе с о.-д. функцией Т имеются все о.-д. функции Г', которые получаются из Г фиксированием в качестве начального состояния любого другого ее состояния. В соответствии с этой операцией несколько видоизменяется операция Ж. Именно, операцию Ж можно применять к некоторым входной и выходной переменным о.-д. функции, если рассматриваемая выходная переменная зависит со сдвигом от входной переменной при любом фиксированном начальном состоянии этой о.-д. функции. Нетрудно видеть, что остаются справедливыми все результаты предыдущего параграфа и, в частности, имеет место Теорема 2. Мощность множества всех предполных относительно операций А, Б, В, Г, Д, Е, Ж, 3 множеств о.-д. функций равна континууму. Далее перейдем к рассмотрению д. функций. Обозначим Рд множество всех детерминированных функций. Подобно тому, как это мы делали при рассмотрении о.-д. функций, введем в Рд операции А, Б, В, Г, Д, Е, Ж, операцию замыкания, понятия замкнутого, полного и пред- полного множеств. Обозначим через D множество всех константных д. функций с одной выходной переменной, а через D' — его произвольное подмножество. Вводим, как и в § 2, понятия сохранения множества В' и D'— максимального множества для некоторого множества ЗЛ^Рд. Рассмотрим континуальное множество S CZ /. Пусть это множество таково, что любые две различные последовательности, принадлежащие ему, отличаются друг от друга в как угодно далеких разрядах. Ясно, что такое множество существует. Обозначим через D множество всех тех константных д. функций с одной выходной переменной, выходные последовательности которых совпадают с последовательностями из S. Введем, так же как и в § 2, понятие /"-свойства некоторой входной переменной д. функции, понятия множеств 91 (D') и $l*(D') и сохраним смысл операции ] [. Тогда справедливы леммы и замечания, аналогичные 5 Проблемы кибернетики, вып. 13
66 В. Б. КУДРЯВЦЕВ леммам 1 —10 и замечаниям 1 — 5. Опираясь на эти леммы и почти дословно повторяя доказательство теоремы 1, для д. функций можно показать следующее. Теорема 3. Мощность множества всех предполных относительно операций А, Б, В, Г, Д, Е, Ж множеств д. функций ,равна гиперконтинууму. Аналогично имеет место Теорема 4. Мощность множества всех предполных относительно операций А, Б, В, Г, Д, Е, Ж, 3 множеств д. функций равна гиперконтинууму. Заметим, наконец, что результаты, аналогичные теоремам 1, 2, 3, 4, остаются справедливыми и для некоторых более сильных наборов операций, например, если потребовать при определении «обратной связи» только наличия «непротиворечивости» (см., например, [3]). § 4. Некоторые теоремы о конечных полных системах Как отмечалось выше, в Р существуют конечные полные относительно операций А, Б, В, Г, Д, Е, Ж системы, например (см. [2]) система, состоящая из о.-д. функции Т*(хи x2) = yi такой, что y^t) = x{(t) V #2 (0» и °-~Д- функции Г**( *з) = Уз (26) (27) такой, что г/3(1) = 1, Уз№ + 1) =x3(t), J=l,2, ... О.-д.функция Т* обычно называется «функцией Шеффера», а Г** — единичной задержкой с начальным состоянием выхода, равным 1. Из сказанного, очевидно, следует, что всякая полная в Р система содержит некоторую независимую полную*) конечную подсистему. Таким образом, изучение произвольных полных систем можно свести к изучению конечных пол- п ных независимых систем, т. е. конечных базисов. Определение. О.-д. функция, образующая базис, называется универсальной о.-д. функцией. J Возникает вопрос: существуют ли универсальные о.-д. функции? Эта задача тривиальна, если рассматривать уни- рнс 12 версальные о.-д. функции с несколькими (более одной) выходными переменными. Для этого, очевидно, достаточно рассмотреть о.-д. функцию, получаемую при помощи применения операции Д к упорядоченной паре (Г*, Г**') о.-д. функций (26) и (27) (рис. 12). Оказывается, что имеет место следующая Теорема 5. Существует универсальная о.-д. функция с одной выходной переменной. 1 L Х1 ■ 1 ' хг f Г ■ % 1 хз ( Т** ' ъ *) То есть такую полную подсистему, которая теряет свойство полноты после удаления из нее любой о.-д. функции. Такие системы называются базисами.
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 67 Доказательство. Рассмотрим о.-д. функцию М (#i> х2, х3) = у1 такую, что имеет место &i{t)Vx2{t)) x3(t)=yi(t), *=1, 2, ..., и «единичную задержку» Т**Ы = у2. Подставим Г** в Т\ вместо входной переменной х3, получим о.-д. функцию Т^ъ, s2, Т**(х,)) = ^ (28) (рис. 13). Покажем, что эта о.-д. функция универсальна. Для этого, очевидно, достаточно показать, что из нее при помощи операций А, Б, В, Г, Д, Е, Ж можно получить о.-д. функции (26) и (27). Процесс построения разобьем на этапы. 1. При помощи операций Б, В, Г и Е из о.-д. функции Тх получаем некоторую о.-д. функцию У 2 (xi, х2, х3) — У\ (рис. 14). 2. При помощи операций Б, В, Д, Е и Ж из о.-д. функции Т2 получаем некоторую о.-д. функцию ТзЫ=~У1 (рис. 15). Очевидно, эта о.-д. функция такова, что имеет место ft(*) = l, * = 1. 2, ... 3. При помощи операций Б, В, Г и Е из о.-д. функций (28) и Т3 получаем некоторую о.-д. функцию Т4 (#!, Х2) — yt (рис. 16). Очевидно, она совпадает с о.-д. функцией (26). 4. При помощи операций Б, В, Г и Е из о.-д. функций Ти Т3 и Г4 получаем некоторую о.-д. функцию Т5(х3)=~у3 (рис. 17). Очевидно, она совпадает с о.-д. функцией (27). Ч. т. д. Как видно из рис. 13, схема, реализующая универсальную о.-д. функцию, рассмотренную в доказательстве теоремы 5, содержит «единичную задержку» не в виде обратной связи. Покажем, что существует универсальная о.-д. функция с одной выходной переменной такая, что схема, ее реализующая, содержит только одну «единичную задержку» и она содержится в схеме в виде обратной связи. Рассмотрим о.-д. функцию ii(#i, х2, х3, я4> хъ) = у! такую, что имеет место */i (0 = & (О V х2 (*)) х, (t) хь (t) V xk (t) хь (t) (Xi (t) V x2 (*)) V V xk (t) x5 (t) x3 (t) V xk (t) xb (t) (xk (t) x2 (t) V xt (t) x3 (0), 5*
68 В. Б. КУДРЯВЦЕВ \xi \хг xi I \хг \хч Г* ft t i Рис. 13. J 1 i__ T** I J t T** 4i Рис. 14. Рис. 15. .. *;. Г T 1 Г* | Г Г 1 w 1 1 J ' \г h-, II г. 1 4^-i 1 1 г** 1 { 1 ^Н 1 1 | | Т, | | | L . L 1 _| In. Рис. 16.
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 69 и «единичную задержку» Т**(х6)=у6 с начальным состоянием выхода, равным 0 (см. рис. 12). Подставим о.-д. функцию Г** в о.-д. функцию Ti вместо входной —> переменной х3, получим о.-д. функцию Tl (xi, х2, Т* , #4» х5) = z/j. При помощи операций А, Б, В, Г, Д и Ж из этой о.-д. функции получаем некоторую о.-д. функцию Т2(х1, х2, х^, xb) = ]ji (рис. 18). Покажем, что эта о.-д. функция является универсальной. Для этого, очевидно, достаточно показать, что из нее при помощи операций А, Б, В, Г, Д, Е, Ж можно получить о.-д. функции (26) и (27). Процесс построения разобьем на этапы. 1. При помощи операции Б из о.-д. функции Т2 получаем некоторую о.-д. функцию -► —► —► Т3(хи х2) = у! (рис. 19). Очевидно, что эта о.-д. функция совпадает с о.-д. функцией (26). 2. При помощи операций Б, В, Г, Д и Е из о.-д. функции Г3, как известно, можно получить о.-д. функции ть(х{)=уи Т5(х2) = у2, Т6(хи х2, х3) = у3 такие, что М*)=0. 02(0 = 1. y3(t)=^i(t)x2(t)y Xi(t)x3(t), * = 1, 2, .. 1 X, ' хг 1 Гт"\ i • х* Х5 г, Нис. 18. xt 1 \ 1 ( 1 \xz Р=П ! 1.1 '; \\ b l ! Ч Рис. 19. 3. При помощи операций Б, В, Г и Е из о.-д. функций Г2, Г4, Тъ получаем некоторую вспомогательную о.-д. функцию, обычно называемую «часами»: (рис. 20). Ti (xi) = yi
70 В. Б. КУДРЯВЦЕВ 4. При помощи операций Б, В, Г и Е из о.-д. функций Т3 и Т7 получаем некоторую вспомогательную о.-д. функцию, Тс кже называемую «часами»: (рис. 21). T*(xi) = yi \ i 1 1 X, 1 h \ h f т " 5 1 ( тг V Й Рис. 20. */ 1 ' '| J2 , ' i * f 7} ' 1 f ~\ t ^ 1 Л 1 гг tfl т.. Рис. 22. Г l."L IX, т T7 т т т 7, ТУ, ъ Рис. 21. Рис. 23. 5. При помощи операций Б, В, Г и Е из о.-д. функций Тъ 7'4, 7'5 получаем некоторую вспомогательную о.-д. функцию (рис. 22). 6. При помощи операций Б, В, Г и Е из о.-д. функций 7'6, 7\, Т8 и 1\ получаем о.-д. функцию Т(Х2)=~У2 (рис. 23). Очевидно, эта о.-д. функция является «единичной задержкой»
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 71 с начальным состоянием выхода 0. Для того чтобы яснее представить себе «работу» схемы, изображенной на рис. 23, схемы, реализующие о.-д. функции Те, Тч, Г8, Т9, представим в более «простом виде» и в схеме на рис. 23 заменим соответствующие блоки на более простые схемы (рис. 24). Теорема доказана. Как известно (см., например, [3]), из всякой полной в алгебре логики (Р2) системы функций можно выделить полную конечную подсистему, состоящую не более чем из четырех функций. Аналогичные утверждения справедливы для некоторых других функциональных систем, связанных с автоматами (см. [6, 9]). Подобная теорема в классе о.-д. функций, оказывается, неверна. Именно, имеет место следующая Теорема 6. Для всякого натурального п > 1 существует базис, содержащий ровно п о.-д. функций. Прежде чем переходить к доказательству этой теоремы, сделаем два замечания. Замечание 6. Рассмотрим множество 5Ш2 всех таких о.-д. функций 1 (.7*1, «Г2,..., Хп) = что значение выходного слова Рис# 24. Г** - единичная задержка с на- ит(2) не зависит от значения сальным состоянием выхода 0. Г** - единич- *■ v ' ^ ная задержка с начальным состоянием входного слова хп(1.) Нетруд- выхода 1. но показать, что это множество замкнуто. Отсюда следует, что 9#2 не содержит «единичной задержки» с любым начальным состоянием и потому Ш2фР. Замечание 7. Для произвольного натурального т>1 рассмотрим множество 91т всех таких о.-д. функций Т (#1, Х2, ..., %п) = (?/ь У2ч •••» Ут), что для любой о.-д. функции Т] (хи хг, ..., xn) = yj, /=1, 2, ..., ?п, значение выходной переменной yj{x) линейно зависит от значения входного слова*) х (т). Нетрудно показать, что это множество замкнуто. п г h г \ ° i и т »»| It**! Г/ ^1 \т**\ т 1 •1 ! II II г< 1 1 \Х2 1 грц г" X \т**\ \° \ Lr 1 \° т Ts | Т h щ *) То есть для каждого ; = 1, 2, ..., m yj(x)= 2 CU (Я (т)) ** (T) (m°d 2)» гДе i=i Cjy(g(t)) принимают значения 0 или 1.
72 В. Б. КУДРЯВЦЕВ Отсюда следует, что 5Jlt ни при каком т>1 не содержит «функции Шеффера» и потому %1хфР. Доказательство теоремы 6. Для п =■1 утверждение следует из теоремы 5. Примером базиса при п = 2 служит набор, состоящий из «функции Шеффера» и «единичной задержки». Пусть теперь п > 3. Рассмотрим 72 — 2 о.-д. функции 1 2 (#i, #2) = 2/2' ^71-2(^1? х2) = Уп-2) для которых имеет место Vi(t) = \xi (t), если t Ф /, ~~ l^i (О V#2 (0» если ^"-~~/- при i = 1, 2, .. . ., я — 2, о.-д. функцию —►->-+ для которой имеет место Рис. 25. о.-д. функций 7\, Г2, .. ., f*i(0. j если £<тг — 2, Уп-1{1) = )х,{Ь)Ух2{1)у У если £ > гс — 2Т и «единичную задержку» Г** с произвольным начальным состоянием. Покажем, что система о.-д. функций {Т\, Т2, ••• ч Тп—2ч Тп—iчТ / (29) полна в Р. При помощи операций Б, В, Г и Е из Гп_2, Г;_1 получаем о.-д. функцию (рис. 25) Т (хи х2)=у1, которая, очевидно, является «функцией Шеффера». Таким образом, система (29) действительно полна. Покажем, что из нее :ничего нельзя выбросить, не нарушив свойства полноты. Последнее обстоятельство следует из двух фактов. 1. Для всякого i = l, 2, ..., п — 1 система о.-д. функций 1*1» Т2, . . . , Ti—i, i i+i, . . . , 1 n—2' -* n—1 » J- } » очевидно, содержится в замкнутом множестве 31гфР.
О МОЩНОСТЯХ МНОЖЕСТВ, СВЯЗАННЫХ С АВТОМАТАМИ 73 2. Система о.-д. функций {Т\ч Т2, ..., Тп_2, Тп— i), очевидно, содержится в замкнутом множестве Ш*фР. Теорема доказана. В заключение отметим еще одно свойство полных конечных систем о.-д. функций. Определение. Назовем систему S предполных множеств о.-д. функций конечно-критериальной, если из непринадлежности произвольного конечного множества Ш каждому предполному множеству системы S следует, что 9К — полное множество. Теорема 7. Существует счетная конечно-критериальная система, и не существует конечной конечно-критериальной системы. Доказательство. Нетрудно показать что любое неполное множество о.-д. функций содержится в некотором предполном множестве. Рассмотрим множество всех неполных конечных множеств о.-д. функций. Каждое из них в силу вышесказанного содержится в некотором предполном множестве. Рассмотрим эту не более чем счетную систему S' предполных множеств. Очевидно, система S' конечно-критериальная. Покажем теперь, что не существует конечной конечно-критериальной системы. Допустим обратное. Пусть предполные множества Ши 5Ш2, ..., 9Jb образуют такую систему. Так как в Р в силу теоремы 1 бесконечно много различных предполных множеств, то найдется некоторое предполное множество 9tts+i, отличное от каждого из множеств 9Л/, /=1, 2, ..., s. Тогда, очевидно, в любом множестве 9К/ найдется о.-д. функция Tj такая, что Tj^3Jls+\. Далее, так как множество {Tj} \J 9Ks+i является полным в Р, то в силу существования в Р конечных базисов, как нетрудно видеть, в 9Ks+i можно выделить конечную подсистему о.-д. функций {Tj\» TJ2, . .., Tjn} таких, что система {Тн, Tj2, ..., Tjnjt Tj] (30) полна в Р. Рассмотрим следующую систему о.-д. функций: ^ = {-*11» ^ 12> •••! ^1п1, ^2Ь ^22> •••» ^2п2 » •••» *sl» *а2» ♦••> Т&п&\. Очевидно, 91 ф SW/, / = 1, 2, ..., s, поэтому по предположению 91 должно быть полным множеством. Но, с другой стороны, 9tCZ2J}s-fi и потому не может быть полным. Полученное противоречие и доказывает теорему. ЛИТЕРАТУРА [11 Г л у ш к о в В. М., Синтез цифровых автоматов, М., Физматгиз, 1962. [2] К о б р и я с к и й Н. Е., Трахтеяброт Б. А., Введение в теорию конечных автоматов, М., Физматгиз, 1962. [3] Я б л о н с к и й СВ., Функциональные построения в fc-значной логике, Труды МИАН Ы, 1958, 5—142. [4] Я н о в с к а я С. А., Математическая логика и основания математики, Математика в СССР за сорок лет. 1917—1957, I, M., Физматгиз, 1959, 13—120. [5] Л е т и ч е в с к и й А. А., Условия полноты для конечных автоматов, Вычислительная математика и математическая физика 4, 1961.
74 В. Б. КУДРЯВЦЕВ [6] Л е т и ч е в с к ий А. А.. Условия полноты в классе автоматов Мура, Материалы научных семинаров по теоретическим и прикладным вопросам кибернетики, вып. 2, Киев, 1963. [7] Кудрявцев В. В., Вопросы полноты для систем автоматов, ДАН СССР 130, 6, 1960, 1190—1192. [8] Кудрявцев В. Б., Теорема полноты для одного класса4автоматов без обратных связей, ДАН СССР 132, 2, 1960, 272—274. [9] Кудрявцев В. Б., Теорема полноты для одного класса автоматов без обратных связей, сб. «Проблемы кибернетики», вып. 8, М., Физматгиз, 1959, 91 — 115. [10] Сборник «Автоматы», ИЛ, 1956. [11] Post E., Two-valued iterative systems, 1941. [12] Кудрявцев В. Б., О мощностях множеств предполыых классов некоторых функциональных систем, связанных с автоматами, ДАН СССР 151, 3, 1963, 493-496. Поступило в редакцию 23 IX 1963.
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ АВТОМАТАМИ, НОРМАЛЬНЫМИ АЛГОРИФМАМИ И МАШИНАМИ ТЬЮРИНГА В. А. КУЗЬМИН (МОСКВА) В работе рассматривается реализация функций алгебры логики (ф. а. л) от п переменных тремя классами управляющих систем: нормальными алгорифмами А. А. Маркова, машинами Тьюринга и автоматами в смысле Мили (Mealy) —Трахтенброта. Все они читают и выдают информацию в двубуквенном алфавите, но нормальные алгорифмы и машины Тьюринга могут для внутренних целей при вычислении значения функции использовать алфавит большей значности (у автомата такого алфавита большей значности в принципе не бывает). Пусть f(Xi, х2, ..., хп) — любая ф. а. л. от п переменных. Вводятся определения реализации данной функции / автоматами, нормальными алгорифмами и машинами Тьюринга, и определяются сложности этих управляющих систем. Пока лишь скажем, что под сложностью машины Тьюринга и автомата понимается число их состояний, а под сложностью нормального алгорифма — число всех вхождений букв алфавита А, если нормальный алгорифм является нормальным алгорифмом в алфавите А (см. [2]), а также стрелок и точек в схеме данного нормального алгорифма. Показывается, что любую ф. а. л. от п переменных можно реализовать: 2п автоматом со сложностью ~ а (п) — , где ап g [1, 2]; нормальным алгорифмом в ^-буквенном алфавите А со сложностью 2П 2п машиной Тьюринга с внешним алфавитом А со сложностью ~ —гг—тт . Кроме того, показывается, что сложность минимального автомата, реализующего данную ф. а. л. / (хи .. ., хп) (напомним, что / (xi4 . . ., хп) — п—1 любая ф. а. л. от п неременных), равна 2 М/» s)i гДе М/> s) — число s=0 различных ф. а. л., получающихся из f (х^, ..., хп) подстановкой всех возможных наборов констант на место s первых ее аргументов. Из работ, как-то касавшихся рассматриваемых задач, следует отметить работу Ли [7], в которой рассматривается реализация ф. а. л. бинарными программами, напоминающими машины Тьюринга с двоичным внешним алфавитом. Ли показал, что сложность L (п) такой программы, реализующей любую ф. а. л. от п переменных, заключена в пределах 9n on 5<L<»)<4-1.
76 В. А. КУЗЬМИН Совершенно аналогично можно рассматривать реализацию системы ф. а. л. от п переменных, и лишь для простоты изложения в работе подробно описывается реализация только одной функции, а подобные теоремы о системах функций приводятся в конце работы без доказательств. Предполагается знакомство читателя с [4]. В заключение хочу воспользоваться случаем, чтобы поблагодарить Олега Борисовича Лупанова за руководство настоящей работой. Введем некоторые обозначения (часть из них взята из [2]). Алфавит {0, 1, . . ., к — 1} назовем алфавитом А, а алфавит {0,1} назовем алфавитом Б. Знак Q ^ В будем использовать для сокращения фразы «слово Q является словом в алфавите В». Знак Сбудет обозначать равенство слов, а знак^ — равенство по определению. Пусть Р^ Oi02 .. . ап, где (аь а2, ..., ап) —любой набор значений аргументов функции / (#i, ...,хп). Значение функции на этом наборе /(аь ...,ап) обозначим f(P). Длину слова Q будем обозначать [Qd. Из сказанного, в частности, следует, что Р, f (P) ctB и [Рд = п. Логарифм числа г по основанию 2 обозначим lb r. 1. Автоматы 1.1. Автоматом называется устройство, для которого выполнены следующие условия; 1) устройство имеет один вход, на который подаются входные сигналы из входного алфавита X, и один выход, с которого снимаются выходные сигналы из выходного алфавита Y; 2) оно имеет конечное число внутренних состояний q, среди которых имеется выделенное состояние q0, называемое начальным; 3) устройство работает в дискретные моменты времени £ = 0, 1, 2 . . .; 4) при подаче на вход некоторой последовательности сигналов я(1), х(2), ... устройство пробегает некоторую последовательность состояний q(l), q(2), ... и на выходе выдает последовательность сигналов у(1), у(2), •••; 5) работа устройства полностью определяется системой уравнений q(t) = <f(x{t), q(t-l)), y(t)=${x{t), ?(*-1)), где ф и г|) — однозначные функции, и условием q(0)=q0. Замечание. В литературе автомат такого типа называется автоматом Мили (Mealy) — Трахтенброта. Будем рассматривать только автоматы, в каждое состояние которых можно попасть из q0. Будем говорить, что автомат реализует данную ф. а. л. от п переменных / (#!, ..., хп), если алфавиты X и Y совпадают с алфавитом Б и выполняется условие V(t) = f(Pi) при * = 0 (mod/г), y(t) = 0 при t^O (modтг), где i^[t!n\< Pi t^x(ni) x (ni-\- 1) . . . x (n (i -f-1) — 1) и f(P,)^f(x(ni), ..., x(n(i + i)-l)).
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ // Сложностью Ьав (91) автомата 21 назовем число его состояний. Автомат, реализующий данную ф. а. л. и имеющий наименьшую сложность среди всех автоматов, реализующих эту ф. а. л., назовем минимальным. Пусть LaB (/) — минимальное из чисел L таких, что данную ф. а. л. /(#!, . .., хп) можно реализовать автоматом, сложность которого не превосходит L. Пусть, далее, LaB(n)^ шах /-/ав (/), где максимум берется по всем ф. а. л. от п переменных. Очевидно, что LaB(n)— минимальное из чисел L таких, что любую ф. а. л. от п переменных можно реализовать автоматом, сложность которого не превосходит L. Сейчас мы опишем один метод построения автомата, реализующего данную ф. а. л. f (х1ч ..., хп), и покажем, что этот метод дает минимальный автомат. Затем мы подсчитаем сложность минимального автомата, реализующего данную функцию /, и, наконец, оценим сложность минимального автомата, реализующего любую ф. а. л. от п переменных, т. е. дадим асимптотическую оценку функции Шеннона LaB(n). Построение минимального автомата 1.2. Метод, используемый нами при построении минимального автомата, является методом Г. Н. Поварова [3], перенесенным с контактных схем на автоматы. ПуСТЬ / ((?!, . . . , Gs, Zs+1, . . . , Хп) ±7 fs (xs+i, . . . , Хп) t^. fs И vst^oi ... о8. Обозначим (i(/, s) число различных функций /\ т. е. число различных функций, полученных из f (xi4 ..., хп) всевозможными подстановками констант на место первых s аргументов. Каждой ф. а. л. поставим в соответствие граф с отметками (labelled graph), построенный так. Сопоставим функции / вершину графа и назовем эту вершину начальной. Среди функций fs при фиксированном s выберем различные и каждой из выбранных функций поставим в соответствие вершину графа. Проделаем это для всех s£[l, n—l]. Вершину, соответствующую функции /г«, будем называть вершиной вида fs или просто вершиной fs. Начальную вершину для единообразия назовем вершиной вида f или просто вершиной /. Соединим каждую вершину f* ребром с приписанным ему входным символом 1, которое мы будем называть ребром вида 1, с вершиной fs1 и ребром вида О с вершиной fs , если функция fs представляется в виде fs=xs+lfsi V xs+ifs • Придадим каждому ребру ориентацию от вершины fs к вершине fs1 (i = 0, 1) при всех s£[0, лг — 2]. Соединим вершины вида fn~ обоими ребрами с вершиной / и придадим им ориентацию к вершине /. Припишем 0 в качестве выходного символа всем ребрам, идущим от вершин fs к вершинам fs1 (i = 0, 1) при всех s£[0, п — 2]. Ребру, идущему от некоторой вершины f°i'"°n и имеющему вид ап, припишем в качестве выходного символа значение / (о1? ..., оп-и оп). Будем полученный граф с отметками рассматривать как диаграмму переходов некоторого автомата [6], реализующего данную функцию /. При всех s£[0, п—1] каждая вершина вида fs соответствует одному из состояний q(ni~\-s)\ в частности, вершине вида / соответствует начальное состояние д0. Ребро диаграммы показывает: 1) в какое состояние переходит автомат из рассматриваемого состояния; 2) при подаче какого
78 В. А. КУЗЬМИН Рис. 1. Диаграмма автомата, реализующего функцию xi -j- х2 + х3 + .т4, где сумма берется по модулю 2. входного сигнала (соответствующего входному символу, приписанному ребру) это происходит и 3) какой выходной сигнал (соответствующий выходному символу) выдает при этом автомат. Автомат, реализующий функцию f (хи ..., хп), построенный только что описанным методом, обозначим 21/. Если же метод построения автомата не фиксируется, то автомат, реализующий функцию /(#!, ..., хп)> будем обозначать 21/. На рис. 1 показана для примера диаграмма переходов автомата, реализующего функцию xi ~\- х2 + х3-\- + #4» где сумма берется по модулю 2. Здесь вверху находится начальная вершина, стрелки указывают ориентацию ребра, первая цифра соответствует входному символу, а вторая — выходному. 1.3. Теорема 1. Автомату построенный описанным методом, является минимальным. Доказательство. Рассмотрим любой автомат, реализующий функцию /(жц .. ., хп). Назовем s-м ярусом множество всех состояний автомата, для которых t=s (modn). Пусть v (21/, s)—число состояний в 5-м ярусе автомата 21/, реализующего функцию /. Покажем, что для любого автомата 21/ и любого s£[0, п—\) выполняется условие \х (/, s)<v(2I/, s). Действительно, если для некоторого автомата 21/ и некоторого яруса состояний этого автомата оказывается v (21/, s) < \x (/, s), то существуют два различных набора значений первых s аргументов функции f (х±, . .., хп), us и v's, которым соответствуют две различные функции fvs и fs, причем этим функциям соответствует одно состояние q' 5-го яруса автомата. Пусть w — набор значений последних n — s аргументов данной функции /(#1, ..., хп), на котором функции fs и fs принимают различные значения. Легко видеть, что на различных наборах vsw и v'sw функции /(#i, ..., хп) принимает различные значения. Отсюда ясно, что, выйдя из состояния q' под действием поданного на вход слова w и придя в соответствующее состояние 0-го яруса, автомат не сможет дать однозначного ответа, что невозможно. Отсюда следует доказываемое неравенство. Так как в автомате 21/ для всех sg[0, п — 1] pi(/, s)=v(2I/, s), а всегда \х (/, s) < v (21/, s), то автомат 21/ будет минимальным, ч. т. д. Из доказанной теоремы следует, что всякий другой метод построения дает автомат, сложность которого не меньше сложности автомата S/. Замечание. Как уже указывалось, метод построения автомата, описанный выше, был предложен Г. Н. Поваровым для синтеза контактных схем. Контактная схема является микрообъектом, а автомат — макрообъектом. Поэтому поразительно, что метод, предложенный для синтеза микрообъекта, без всяких изменений переносится на макрообъект и дает при этом наилучший результат.
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ 79 Оценка сложности автомата 1.4. Из метода построения автомата 21/ и из минимальности^ этого автомата легко следует п— 1 Теорема 2. LaB (/) = LaB (Я/) = 2 И (/. *)• 8=0 1.5. Теорема 3. п т г Ьав(п)= 2 2"-' + S 2\ (1.1) r=m+l r=0 гдг m — натуральное число такое, что 22m<2n"m w 22m+1> 2n-m_1. (1.2) Доказательство. При подстановке различных наборов констант вместо первых s аргументов в функцию f (хи ..., хп) можно получить, очевидно, не более 2s различных функций. Следовательно, v(t/, s)<2\ (1.3) С другой стороны, при любой такой подстановке мы получаем функцию п — s аргументов. Как известно, число ф. а. л. от п — s аргументов равно 22П s. Из построения 21/ видно, что v(2t/, s)<22n"s. (1.4) Число 22 s с росте м s убывает, и начиная с некоторого s будет выполняться неравенство 22n~s <2S. Пусть т определяется условием (1.2)- Тогда из (1.2). (1.3) и (1.4) легко следует,* что п т Ью(п)< 2 2,г-г+2 22\ (1.5) г=т-\-\ г=0 Построим теперь функцию ф (xi4 . . ., хп) такую, чтобы для нее п В т LaB (Ф) = LaB (Яф) = S "2п-''+2 22Г. (1.6) Будем всякую ф. а. л. f (xt, ...*хп) задавать таблицей с двумя входами [1], строки которой будем нумеровать наборами значений аргументов хи ..., хп-т, а столбцы — хп-т+и ... хп. На пересечении строки cf± . . . Оп-т и столбца an_m+1 . . . ап будем писать / (^1? . • . » СГп_т, СГп_т+1, . . . , СГП). Легко проверить, что в диаграмме переходов' автомата 21/ тогда и только тогда совпадают вершины вида fn~m и fn~m, когда в таблице функции /(#!, . . ., хп) совпадают строки с номерами Un-m^lo'1 . . . o'v-m и Vn-m^ol ... a?,_m, а вершины вида /^Т"1 и fwv-m-i совпадают тогда и только тогда, когда совпадают строки с номерами 2z^_?n_iGn_m И Wn-m-lOn-m МСЖДУ Собой И ^ТрОКИ С НОМвраМИ Wn-m-lOn-m И w"n-m-i^n-m между собой, где Wn-m-i-^-o^ .. . a;_m_i и w"n_m-\ ^o[ . . . a;_m_j. Следовательно, число состояний (тг —т)-го яруса автомата 21 f равно числу различных строк нашей таблицы, а число состояний (п— т— 1)-го яруса автомата 21/ равно числу различных пар строк таких, что номер первой строки пары является двоичной записью четного числа (такую строку будем называть четной), а номер второй строки —следую-
80 В. А. КУЗЬМИН щего нечетного числа (т. е. равно числу различных строк аналогичной таблицы той же функции, строки которой нумеруются наборами значений аргументов xi, ..., жп_т_1). Число различных таких пар, очевидно, равно I1 Составим список всевозможных слов длины 2т в алфавите Б и занумеруем их любым образом числами от 0 до 22 —1. Занумеруем также строки составляемой таблицы числами от 0 до 2п~т—1, идущими в порядке возрастания, т. е. в естественном порядке натурального ряда. Разобьем строки этой таблицы на группы, включив в г-ю группу строки с номерами 1-2*™+ /, где /б [0, 22?п- 1] и ig [0, 2п~т^т] (т выбираем в соответствии с (1.2)). Если в таблице окажется только одна группа, т. е. если п = 2т-}-т, то в /-ю строку этой таблицы поместим /-е слово списка. Если число строк таблицы больше 22?п, но меньше 2-22т, то нулевую группу запол- ним, как и в предыдущем случае, а в строчку с номером 2А +/ поместим (/+1)-е слово списка. Если же число строк таблицы не меньше чем 2-22ГП, то поместим в четные строки i-ж и (i-\- 1)-й групп (г = 0, 2, 4, ...) i-e слово списка, а в строку с номером 1-2г +2/+ 1, где i = 0, 2, 4, ... и /6[0, 2%ш—1], поместим /-е слово списка. Составленная таким образом таблица задает некоторую ф. а. л. <p(#i, . . ., хп). Легко видеть, что эта функция и является искомой, т. е. £ав0#ф) удовлетворяет условию (1.6). Из (1.5) и существования такой функции у(хи ..., хц), для которой выполняется (1.6), и следует утверждение теоремы 3. 1.6. Теорема 4. Ьав (п) ~ а (п) — , где а(п)£[1, 2]. Доказательство. Производя суммирование в (1.1), получаем Ьав (п) = 2п'т -1 + 2>т (1 + 4S- + • • • + SO ~ 2"~'П + 22Ш <1Л) Выбрав, например, 1 1 2 А ] 22т -[lb (лг — :2п+1 п—2\Ьп . 4- 1 • • 21Ь< 2" 1 п« »)]. ~ н > 2 22° 22'" 2П п т±^[1Ь(п-21Ьп)], (1.8) получаем из (1.7) ^W<i^k + fr~2^. (1.9) Покажем, что эта верхняя оценка достигается. Из (1.2) получаем 2т + т< п < 2m+1-^-m-f-1. Рассмотрим последовательность {п} вида yz = 2m + m. В этом случае 2*т=2п-т. (1.10) Кроме того, в этом случае т = 1Ъ(п-1Ъп). (1.11) Таким образом, при таких п получаем из (1.7), (1.10) и (1.11) LaB(2m + m)~2n-m + 22m = 2.2n-m = 2-^ . Следовательно, а(2т + т)=2. (1.12) Рассмотрим таблицу с двумя входами, строки которой занумерованы наборами значений аргументов х{, . .., хп-т-и а столбцы— хп-т, ..., хп. Заполним эту таблицу так, чтобы все строки ее были различны (это
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ 81 можно сделать, так как опять берем т в соответствии с (1.2)). Эта таблица задает некоторую ф. а. л. ^{хи . .., хп) такую, что первые п — т — 1 ярусов автомата 21 ^ образуют на диаграмме переходов двоичное дерево. Поэтому очевидно, что Ьав(1*)> 2 2-r = 2n-m-l~2n-m. r=m-f- l При этом же выборе т (см. (1.8)) отсюда получаем Следовательно, Ь«в(п)>-^-. (1.13) Для доказательства достижимости этой нижней оценки рассмотрим последовательность {п}, имеющую вид п = 2т + 2т. В этом случае, очевидно, т = 1Ъ(п — 2\Ъп). (1.14) Из (1.7) и (1.14) получаем т 971 ОП ОП LaB(2m + 2m)~2n-m + 2*m = l_+A-~i_. dU v ' * ' n—2 lb n rc2 rc Следовательно, <z(2m + 2m) = l. (1.15) Из (1.9), (1.13), (1.12) и (1.15) и следует утверждение теоремы 4. Замечание. Функция a (n) имеет пилообразный характер (ср. [8]). 2. Нормальные алгорифмы 2.1. Напомним некоторые определения теории алгорифмов [2]. Пусть буквы —>, •, (г, v и X не входят в алфавит А. Слово вида д __> <уВ, где уШ •, А, называется формулой в алфавите А, если Л, J5 с; А. При этом слова A w В называются соответственно левой и правой частями этой формулы. Формула называется простой, если у^1А, и заключительной в противном случае. Схема вида {Л; —>y*#z (*6[1, £]) называется схемой в алфавите А, если все формулы этой схемы являются формулами в алфавите А. Формулы схемы будем называть также ее строками. Нормальный алгорифм (н. а.) 21 в А (иногда его для краткости будем называть просто алгорифмом) определяется схемой в А и следующим правилом. Взять 1-ю формулу схемы и посмотреть, входит ли Л4 в обрабатываемое слово Q. Если нет, то перейти ко 2-й формуле и т. д. Если существует ££[1, I] такое, что At входит в ^ и все Aj при / < i не входят в Q, то вместо первого вхождения At в Q поставить В^., Пусть при этом получено слово Q''. Если YzJ^*> to работа на этом заканчивается и ее результатом объявляется слово Q'. Если ytj[_A, то весь процесс (т. е. поиски самой верхней формулы схемы, левая часть которой входит в обрабатываемое слово, и т. д.) повторяется, только теперь работа ведется над словом Q''. Если на некотором шаге оказалось, что никакое At (г£[1, Ц) не входит в обрабатываемое на этом шаге слово, то цроцесс оканчивается и это слово объявляется его результатом. Если окажется, что обработка некоторого слова Q не может быть закончена (например, при Al^yiJ^A), то будем говорить, что в этом С Проблемы кибернетики, вып. 13
82 В. А. КУЗЬМИН случае н. а. 21 не применим к слову Q. В противном случае будем говорить, что н. а. 21 применим к слову Q. Если н. а. 21 применим к слову Q, то результат работы 21 над Q обозначим 2t|_<?j- Нормальные алгорифмы 21 и 21' в А назовем эквивалентными, если всякий раз, когда ^L\_P'j ^Q (P ^Б) и Q < Б 2I[_/)j Ш <?, и наоборот. Изображением к. а. 21 в А называется слово 21й, полученное так: в каждой формуле схемы букву —> заменим на (г, • на v и в конце каждой формулы поставим букву Л; после этого все слова, полученные из формул, напишем друг за другом, ставя слово, полученное из i-\\ формулы, левее слова, полученного из (г + 1)-н формулы (££[1, /]). Очевидно, по каждому слову 21й в алфавите В, полученном из А присоединением букв (л, v и Л, однозначно восстанавливается схема н. а. 21 в А, изображением которого является слово 21 - Алгорифмы 21 и 95 в А называются различными, если 21й графически не равно 95й . Сложностью LH. a «. а. 21 в А назовем длину слова, полученного из 21й вычеркиванием всех вхождений буквы А, т. е. число [21 — %(к), где % (£) здесь и дальше обозначает число вхождений буквы £ в слово 21й. Будем говорить, что к. а. 21 в А реализует ф. а. л. от п переменных /(#i, ..., хп), если он применим к любому слову Р < Б длины п и если Я[_Р_] :*:/(/>). Пусть LH.a (и, /с) — минимальное из чисел L таких, что любую ф. а. л. от п переменных можно реализовать нормальным алгорифмом в /с-буквенном алфавите А, сложность которого не превосходит L. Теорема 5. Ln.a(ra, &) ~ Tfr£ (&> 2). Нижняя оценка 2.2. Нижняя оценка получается из мощностных (энтропийных) соображений и основана на подсчете числа н. а. в А заданной сложности. Схема н. а. в А определяется расстановкой букв алфавита А в ней и «структурой» строк, т. е. н. а. в А, имеющие разные структуры или разную расстановку букв алфавита А в схеме, будут различными. Поэтому при подсчете числа различных н. а. в А, имеющих заданную сложность, нужно подсчитать и число различных структур, и число способов расстановки букв алфавита А в схеме н. а. Оказывается, что при таком подсчете основным является число способов расстановки букв алфавита А в схеме (ср., например, с формулами в некотором базисе), что происходит из-за роста средней длины строки с ростом сложности н. а. Перейдем теперь к доказательству нижней оценки, Алгорифм, левые части всех строк которого попарно различны, назовем правильным. Докажем, что можно ограничиться рассмотрением только правильных н. а. Действительно, пусть в схеме н. а. 21' существуют две строки такие, что AtJ>lAj при i < /. Легко видеть, что /-я формула схемы такого н. а. никогда не будет применяться, и поэтому н. а. 2Г будет эквивалентен алгорифму 21, схема которого получена из схемы 21' вычеркиванием /-Й строки. Очевидно, LH.a (21) <. Ьн.а (^')-
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ 83 Впредь мы будем поэтому рассматривать только правильные н. а. 2.3. Назовем структурой н. а. 21 вектор s = s (И) = (s4, s2, s3, . . ., s3Z), где I — число строк н. а. И; s3i-2 и s3i— соответственно длины левой и правой частей i-ii формулы схемы алгорифма 21; s3f-i указывает на тип i-ii формулы, т. е. s3i-i равно 0, если i-я формула простая, и 1 в противном случае. Вектор s обладает, в частности, свойствами: lc) s3j-i = 0, 1; з/ 2с) 2 ^ = LH.a(2l) — xW-X(v), где всюду ig[l, Z]. Легко видеть, что одну и ту же структуру могут иметь много разных и даже неэквивалентных алгорифмов. з/ Назовем число L(s)^l~\-^] Si сложностью структуры s. Очевидно, £и.а(И) = ЬИЯ)). Пусть Tk(N, /)— число различных структур н. а. в А, имеющих I строк и сложность N, %k (N)— число различных структур н. а. в А сложности N, a tk(N) — число различных н. а. в А сложности N. Лемма 1. th(N)<kNTh(N). (2.1) Утверждение легко получается из того, что а) между н. а. в А и парами, составленными из слов ^Аи 3/-мерных векторов s, обла- з/ дающих свойствами: 1) s3j-i =^ 0,1 и 2) 2 sj = lQdj гДе *£[!> 1]> анало- i=i гичными свойствам 1с) и 2с), существует взаимно однозначное соответствие и б) [Qd < Л\ Лемма 2. тл(ЛГ, Z)<2lcS/+2z-i. (2.2) Для доказательства достаточно подсчитать число /-мерных векторов, образуемых компонентами s3i-i вектора s, и число 2/-мерных векторов, образованных компонентами s3t и s3i-2 вектора s. При этом подсчете используются свойства 1с) и 2с) вектора s. 2.4. Лемма 3. Пусть lk(N)—максимальное число строк правильного н. а. в А, имеющего сложность N. Тогда lh(N) = o(N). (2.3) Доказательство. Назовем длиной строки А—>уВ сумму длин слов А и В. Легко видеть, что в схеме любого правильного н. а. в А 171 может быть не более 2 ^г строк, длина которых не превосходит т. г=1 т Пусть г —максимальное из чисел т таких, что 2 ikl^.N. Тогда, оче- г=1 видно, г=1 Из определения г имеем г N>^\ ikl. (2.5) г=1 6*
84 В. А. КУЗЬМИН Очевидно, при N—> оо, г—> оо и lk(N) возрастает неограниченно. Поэтому из (2.4) и (2.5) получаем lk(N) кг+2-к *2 "^ (к—\\ гкг ^ i N ^ (к—1) гкг ^ (к—1)г ' *ft (#) A AT откуда следует, что ' —->0 при N—->оэ, ч. т. д. Из (2.3), между прочим, следует, что средняя длина строк н. а. с ростом его сложности растет, о чем мы говорили в п. 2.2. 2.5. Лемма 4. Если тир таковы, что ——>0 при т—>со, то т г Доказательство легко следует из того, что т ^ т р\ ^ т К Р у Зт \ Р у 2ф-3 где Лемма 5. Щ^1^0при N^o*. (2.7) Доказательство. h <*> tk(N)< S Th(N, Z)<Zft(iV)maxTft(^, /). (2.8) i=i i По (2.2) имеем maxxh(N, I) <max(2lC%^h-i)<^^n^n)-!- (2-9) так как, во-первых, по определению /<Zft (N) и, во-вторых, в любом н. а. число строк не больше сложности этого алгорифма (/<7V)> откуда следует, что всегда /<y(7V + Z). По (2.3), (2.6), (2.8) и (2.9) получаем lhxk(N) ^ \hlk(N) , lk(N) , iS}LN + 2ik{N)-i N ^ N ' N ' TV при N—> oo, ч. т. д. 2.6. Теперь легко получается доказательство нижней оценки. Действительно, по (2.1) получаем, что число правильных н. а. в А, сложность которых не превосходит N, N N tk(N)=-- 2 tk(M)<Th(N) S kM<2k"xk(N). (2.10) M=l M=l Пусть Л^(1_б)~, где б б (О, 1). По (2.10) и (2.7) lb^^ = \bt'k(N)-2"<N\bk + \bTk(N)-2n + l^ 22 <ЛПЬ&-2п=-е2п^-оо при гс^со.
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ 85 2п t'k (N) Следовательно, при JV = (1 — е)— получаем >0 при N —>оо, 2п Отсюда N > lb* 2п Следовательно, LH. a. (^> к) > \Ък ' Верхняя оценка 2.7. Для доказательства верхней оценки построим н. а. в А, реализующий заданную ф. а. л. /(#!, ..., хп), сложность которого асимптоти- 2П чески не превосходит уг-г- . Зададим нашу функцию / (#i, . .., хп) словом U ^ Б длины 2П, у которого (г + 1)-я буква справа есть /(аг), где аг является двоичной записью числа i (г g [1, 2П]). Отдельно рассмотрим два случая: к > 2 и /с = 2. 2.8. Пусть сначала к > 2. Установим между словами 5 cj Б длины т (таких слов 2т) и 2т различными словами в алфавите А длины т' ^ -гт-г (таких слов km' g[2m, 2m/c)) взаимно однозначное соответствие. Слово, поставленное в соответствие слову 5, обозначим [ST. Теперь, идя справа налево, разобьем слово U на куски U-х длины т (если нужно, добавим к U слева несколько нулей так, чтобы длина последнего куска тоже была равна т) и каждый кусок С/,- заменим на слово Vt^:Oa [Ui, где а£А\Б. Слово, полученное при этом из С/, обозначим V. Очевидно, V ^ А [У = 0»' +2) ]£[< i^-З^ + ^ + З. (2.11) Пусть И7 —слово длины т' + 2, состоящее из а. Очевидно, для любого i имеем Vt графически не равно W'. Построим теперь н. а., реализующий выбранную функцию / \XU •••> хп)' Схема этого алгорифма состоит из нескольких блоков (групп строк) 21 $, работающих друг за другом, т. е. как только блок 21^ закончит работу, так сразу включается блок 2Iz+i, если 21; не был последним блоком. Работает этот н. а. так. Сначала блок 2li припишет слева к слову Р, представляющему поданный набор значений аргументов функции /(#!, ..., хп), слово WV. Затем блок 212, пользуясь словом W, перекодирует слово V в слово С/, к которому слева, быть может, приписаны несколько нулей, и затем превратит слово W в другое вспомогательное слово. Пусть N — число, двоичной записью которого является слово Р, N{il)±^N — i, Г1 —слово, полученное из U стиранием -А самых правых букв. Блок 213 попеременно вычитает 1 из N(l) (&>0), причем Ni0)^N, и стирает самую правую букву слова Т1. Этот блок будет работать до тех пор, пока не будут получены слова N(N) = 0 и TN, после чего он сотрет число Nw. Наконец, блок 214 сотрет все буквы слова TN, кроме самой правой, и вспомогательное слово. Легко видеть, что оставшееся слово будет значением нашей функции на поданном наборе значений аргументов, т. е. f(P).
86 В. А. КУЗЬМИН Таков, например, н. а. 21 в А со схемой (здесь ££[1, 2™], |£Б) 21 \%2 ■я4 W0a[£i-».W (1) W ^aaa aaa (2) |aaaa aaaa —> aaaa aaaa (3) aaaa aaaa —> • (4) £aaa aaaa —> aaaa aaaa£ (5) aa aaaO —> aaa aa (6) aa aaal —> laa aa (7) aa aaa —> aaa aaa (8) aa aa£ —> gaa aa (9) aaaa^aa (10) aaaO^laaa (11) aaa^ (12) laa^Oaaa (13) Oaa^aaO (14) ga^aaa aaa (15) -» W (16) } 2Ii Подсчитаем сложность н. а. 21. Учитывая (2.11), получаем LH. а (21) = 2т (2 [И^+ 2 + [[£та+ [Sd) + 2 [Wd + [7е + С < Из < 2П 2П 1Ь/с lb/с + 2" Зт lb/с ■m + Ci < 2т \Ък + с2< 2п 2п lb к 3^- + C(fc)24 где С, Ci и С2 —константы, а С (к) —константа, зависящая от /с. Положив, например, га^ [lb/г], получаем 2п Ьн.а(Я)<^+3 2П - С (к) п lb /г - 2п lb/с (2.12) lb* ' lb/г—1 2.9. Пусть теперь к = 2, т. е. А и Б совпадают. Разрежем слово С/, идя справа налево, на куски Ut длины т (если нужно, добавим слева столько нулей, чтобы длина последнего куска тоже равнялась т) и каждый кусок Ut заменим на слово Vi^0Ut. Полученное таким образом из U слово обозначим V. lVe = {m+i)~\£-[<2n + £- + m + l. (2.13) J m L т Пусть И7 —вспомогательное слово, имеющее вид (t) (t) ... (£), V раз где (t) означает слово, первая и последняя буквы которого 0, а остальные t букв — единицы. Легко видеть, что при любых £>га, q и i имеем Vi графически не равно (t) (t) ... (t) и, в частности, Vt графически ~ q раз не равно W. Построим теперь н. а. в А, реализующий данную функцию / (х1ч..., хп). Схема этого алгорифма тоже разбивается на блоки 21*, работающие друг за другом. Сначала блок 2Ii припишет к слову Р, представляющему поданный набор значений аргументов функции f {хи . .., хп), слева слово VW. Пусть, как и прежде, N — число, двоичной записью которого
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ 87 является слово Р, и Nil)—^ N—i. Пусть Тг — слово, полученное из V стиранием i + 4г самых правых букв. (Содержательно это означает стирание 1) i самых правых букв слова £/, вошедших в V; 2) всех нулей, отличающих Vj от Uj, вставленных между стираемыми буквами слова U, и 3) нуля, примыкающего слева к стираемым буквам слова U, если этот нуль отличает некоторое Vj от Uj.) Блок 212 попеременно вычитает 1 из А^(г) и стирает одну или две (в зависимости от i) самые правые буквы слова Тг, превращая его в Тг+1. Делается это так. Пока i не кратно т, стирается одна буква слова Тг и при этом запоминается, какой буквой справа в соответствующем куске Uj она была. Когда же с помощью такого «счетчика» выясняется на очередном шаге, что i кратно т, то стирается самая левая буква этого куска Uj и стоящий левее 0, отличающий это Uj от Vj. Этот блок 212 будет работать до тех пор, пока не будут получены слова Nm = 0 и TN, после чего он сотрет слово N . Блок 213 сотрет все буквы слова TN, кроме самой правой, и вспомогательное слово. Легко видеть, что оставшееся слово будет значением нашей функции на поданном наборе, т. е. f{P). Таков, например, н. а. 21 в А со схемой 31 didi dididfi- dtdi didtdil a,a, a^a* didididt - dididt0- dididf idtdi Odtdf 0£a~- -didididt didididt ^didididi didididt >didi dididt >ldtdi didt -dididt didtdi Ididt dtdi ► dtdi -ldidtdi >0dididi >didiO (i) ] (2) }2f3 (3) J (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) j % \%2 В этой схеме £ £ A, W~sld1dldldidldl, dt обозначает (n+i) и всякая строка, в которую входит dt, является сокращением группы из т строк, кроме строки (13), в которой i<w—1. Например, строка (11) в более подробной записи должна быть заменена следующей группой строк: la2a2 —> 0a2a2a2 idjdj —-> Odjdjdj la~a~ m m 0a~a~a~ m m m
88 В. А. КУЗЬМИН Подсчитаем сложность этого н. а. По (2.13) имеем тп i=\ m где Си С2 и С3 — константы. Положив, например, т^[\Ъп], получаем Ьн.а(%)<2"+ 1ЬГ_! + С3(2п + \Ъп + 1)\Ъп~2п. (2.14) Очевидно, (2.14) можно записать в виде Ьн.а(Я)<~. (2.15) 2.10. Из (2.12) и (2.15) получаем как следствие 2п LH. а (п, к) ^ -yg-^- . Сравнивая верхнюю и нижнюю оценки, получаем 2п LH.a(n, k)~^j , ч. т. д. Замечание. Из доказательства теоремы легко усмотреть, что оценка не изменится, если в качестве сложности н. а. взять числа [21 а, и [21 д — (х О*) -f % (v) + xW)> a также ДРУгие числа, «близкие» к этим. 3. Машины Тьюринга 3.1. Машиной Тьюринга (м. т.) (которую иногда будем называть просто машиной) называется устройство, для которого выполнены следующие условия: 1) устройство работает с лентой, разделенной на клетки, в каждой из которых записана одна и только одна буква алфавита А (называемого внешним алфавитом м. т.); 2) оно имеет конечное число внутренних состояний, занумерованных в некотором порядке; i-e состояние обозначим qi\ 3) зафиксируем некоторую букву а £ А для обозначения пустого слова. В начале работы на ленте записывается некоторое слово в алфавите А, такое, чтобы на ленте было только конечное число букв, отличных от а; 4) в каждый момент времени устройство видит одну и только одну из клеток ленты; 5) перед началом работы оно приводится в выделенное состояние q0, называемое начальным, и ставится в одну из клеток ленты; 6) работа устройства полностью определяется системой уравнений ( <Pi(?» £)=2'> Фг(?» £) = ТЬ I фз(9» £)=б. где q и | — соответственно состояние, в котором устройство находится в данный момент, и буква алфавита А, которую оно в это время видит; q' — состояние, в которое устройство переходит на данном шаге; л —буква, которую оно при этом печатает; б — движение по ленте, совершаемое устройством на этом шаге, причем при 6 = 0 оно остается на месте,
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ 89» а при 6^=1(2) оно сдвигается вправо (влево) на одну клетку; фь ф2 и ф3 — однозначные функции двух переменных; 7) работа устройства продолжается до тех пор, пока оно не попадет в некоторое состояние q, называемое конечным. М. т., внешним алфавитом которой является А, назовем м. т. в А. Будем рассматривать только такие м. т., у которых из каждого состояния можно попасть в д. Будем говорить, что машина Тьюринга реализует данную ф. а. л. от п переменных f (xu ..., хп), если она слово Р, записанное на ленте, перерабатывает в слово f(P), находящееся в клетке, которую она видит в момент остановки (перехода в состояние q). Сложностью LM. T (И) м. т. 21 назовем число ее состояний. Пусть LM. т (/г, к) — минимальное из чисел L таких, что любую ф. а. л. от п переменных можно реализовать м. т. в ^-буквенном алфавите А,. сложность которой не превосходит L. 2п Теорема 6. LM. т (/г, к) — n,k_jv (к > 2). Нижняя оценка 3.2. Здесь, как и в разделе о нормальных алгорифмах, нижняя оценка получается из мощностных соображений. Оценим сначала мощность одного класса графов. Обозначим Gh (N) число связных графов, обладающих свойствами: 1) граф имеет N вершин, две из которых выделены, причем одна из них отмечена знаком *, другая — знаком **; 2) ребра графа ориентированы; 3) из каждой вершины, кроме отмеченной **, выходит к дуг (дугой, вслед за Бержем [5], назовем ориентированное ребро), а из вершиныг отмеченной **, не выходит ни одной дуги. Множество таких графов обозначим 5Ш. Лемм а 6. Gk(N)<(CNf-i)N. (3.1) Доказательство. В любом графе из множества Ш можно выделить дерево с ориентированными ребрами, содержащее все вершины графа. Действительно, назовем вершину, отмеченную **, вершиной нулевого яруса. Пусть 1-й ярус образуют вершины, соединенные одной или несколькими параллельными дугами с вершиной нулевого яруса. Возьмем для каждой вершины 1-го яруса по одной дуге, соединяющей эту вершину с вершиной нулевого яруса. Назовем эти дуги дугами 1-го яруса. Если уже построены дуги i-ro яруса, то, взяв для каждой вершины (i-\-l)-ro яруса но одной дуге, соединяющей эту вершину с некоторой вершиной i-то яруса, получим дуги (£ + 1)-го яруса. Продолжая этот процесс до тех пор, пока не будут исчерпаны все вершины графа, получим через конечное число шагов искомое дерево. Как известно (см., например, [5]), каждое дерево с h вершинами имеет h—1 ребро. Следовательно, в нашем ориентированном дереве с N вершинами N — 1 дуга. Так как всего в рассматриваемом графе в силу свойства 3) содержится (N — \)к дуг, то в оставшейся после выделения дерева части графа содержится (Лт — 1) (к — 1) дуг. Каждый граф множества 9К содержится в множестве графов, построенных так.
90 В. А. КУЗЬМИН 1) Возьмем все неизоморфные деревья с корнем (т. е. выделенной вершиной), имеющие N вершин. Как известно (см., например, [1]), таких деревьев не больше 4N_1. 2) В каждом дереве отметим корень знаком ** и ориентируем любым образом все его ребра. Число способов выбора ориентации не больше 2 ~ . 3) Выбросим все деревья, у которых хоть из одной вершины выходит больше к дуг, и деревья, у которых из корня выходит хоть одна дуга. 4) В каждом из оставшихся деревьев а) одну из вершин, в которые не входит ни одной дуги (очевидно, в каждом дереве, ребра которого ориентированы, имеется такая вершина), отметим знаком *; число способов выбора такой вершины меньше N; б) к каждой вершине, из которой выходит меньше к дуг, кроме вершины, отмеченной **, присоединим столько дуг, ориентированных от этой вершины, чтобы из этой вершины выходило А; дуг. Всего будет присоединено не более (N— 1) (к — 1) новых дуг; в) концы этих новых дуг присоединим к любым вершинам. Способов такого присоединения не больше ^у(^-1)(/г-1^ Отсюда получаем Gft(iV)<4N-12IV-1^.iV(N-1)№-1> = 8'N'-1,V,V('1-1)-(k-2)<(8iV)Ar('i-1), ч. т. д. 3.3. Пусть Tk (N) — число различных м. т. в А, сложность которых равна N. Лемма 7. Th (N) < (CJPf* N(fe_1) N. (3.2) Доказательство. Каждой м. т. поставим в соответствие ориентированный граф с отметками, полученный так: 1) каждому состоянию м. т. поставим в соответствие вершину графа; 2) вершину, соответствующую начальному состоянию м. т., отметим знаком *, а вершину, соответствующую конечному состоянию, — знаком * *; 3) если м. т., находясь в состоянии q и видя букву £, переходит в состояние q", то соединим вершины, соответствующие этим состояниям, дугой, ориентированной к вершине, соответствующей q"\ 4) припишем этой дуге букву £ и значения функций ф2 и ф3 на паре (q', g). Легко видеть, что этот граф будет связным в силу ограничения класса рассматриваемых м. т. По такому графу, очевидно, м. т. восстанавливается однозначно с точностью до нумерации состояний, которая, конечно, несущественна. Из того, что графы множества Ш приводятся к графам, поставленным в соответствие м. т., приписыванием всем дугам трех чисел ai, а2 и а3 таких, что аи а2£[0, к — 1] и а3 g [0, 2], легко получаем Tk(N)^(3k2)NhGh{N), откуда по (3.1) получаем (3.2), ч. т. д. 3.4. Из последней леммы легко получается доказательство нижней оценки. Действительно, пусть T'h(N)—число м. т., сложность которых N не превосходит N. Очевидно, T'k(N)<C 2 Th(M), откуда ПО (3.2) ПОЛУДА 1 чаем rk(N)<N(h-i)N 2 (Си к*)ш<2(Сх, Л2),|2УЛ'(Л-1)Л'. (3.3)
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ 91 . 2п (1 е) Пусть N ^ (к—и ' где 8^(^' ^)* Тогда по (3.3) получаем + 1_2П е2п—>— оо при гс —> оо. Следовательно, V—> О при п —» оо и при Лт < —,, ,. . Отсюда £-.т(». к)>Т$=$- Верхняя оценка 3.5. Для доказательства верхней оценки опишем метод построения м. т. 21, реализующей функцию f (х{, . . ., хп) (напомним, что / (хи . . ., хп) — 2п любая ф. а. л. от п переменных) и имеющей сложность LMT(2I)^ ,, ,. . Этот метод является, по существу, модификацией метода О. Б. Лупанова, изложенного в [1]. Поставим в соответствие каждому слову PcJ Б длины п слово [Рх ^ А, являющееся записью в &-ричной системе числа М, двоичной записью которого является слово Р. Нетрудно убедиться, что [[Рх = jr-r п . 0 0 0 6г' + 1 1г'+2 С к—\ Л —1 к—\ о о о 6г< -1 к—1 Рис. 2. Над пунктирной чертой записаны значения функции /, а под этой чертой —нули. Слово Q cj А длины п назовем допустимым, если существует слово Р^Б длины п такое, что QJL[PX. Очевидно, допустимым будет только слово (2 е} A, [Qd = n', являющееся /с-ричной записью числа, не превосходящего 2n_1. Очевидно также, что между допустимыми словами и словами длины п в алфавите Б существует взаимно однозначное соответствие. 3.6. Зададим нашу функцию таблицей с двумя входами, строки которой занумеруем словами длины г' в алфавите А, а столбцы —словами длины п'—г' в этом алфавите. В этой таблице на пересечении строки с номером ^ ... £Г' и столбца с номером £r'+i .. . £П'-г' напишем слово f(P), если ii . .. £л—допустимое слово и Р—слово, соответствующее si • • • in', и 0, если слово ^ ... £П' не является допустимым. Эта таблица схематически изображена на рис. 2. Легко видеть, что только в первых
92 В. А. КУЗЬМИН строках этой таблицы могут стоять значения нашей функции. Эти строк» назовем информационными. Разрежем нашу таблицу на горизонтальные полосы At шириной s. Очевидно, число информационных полос, т. е. полос, содержащих информационные строки, равно N' Ш- <3-5> Разобьем каждую информационную полосу At на группы одинаковых столбцов Bij. Легко видеть, что число таких групп в каждой полосе не больше N" ±^ 2s. (3.6} Пусть fi(xu ..., хп) — ф. а. л. от п переменных, таблица которой совпадает с таблицей исходной функции в полосе Аъ и состоит из одних нулей вне этой полосы. Очевидно, N' f(xu .. ., хп)= V M*i. • ••» *п). (3.7) 1=1 Пусть ftj (хи . .., хп) —функция, совпадающая с ft {хи ..., хп) в группеВц и равная 0 вне этой группы. Из (3.7) следует, что N' N" f(xu ...,хп)=\/ V fu(xn . ...згп). (3.8) i=i ;=i Каждую функцию fij{xu ..., хп) можно представить в виде fu(xu • •., Zn) = fhfb, (3.9) где f\j является характеристической функцией ненулевых строк в таблице функции fij(xt, ...,xn), a f\j — характеристической функцией столбцов группы Btj. Из (3.8) и (3.9) получаем N' N" f(xu ...,xn)= v V fhfb- (З.ю> 1=1 ;=1 Замечание. f\j зависит только от £ь ..., £Г', а /?> — только от £г'+ь ..., In', хотя каждая из функций /1?- и /?7- зависит от всех переменных хи . . ., я7г. 3.7. Опишем теперь м. т., реализующую нашу функцию f (х{, ..., хп). Состояния этой машины будут делиться на блоки И*. Напишем на ленте слово Р cj Б длины гс, т. е. зададим некоторый набор значений аргументов нашей функции, и, приведя машину в начальное состояние, поставим ее в клетку, в которой написана первая (самая левая) буква слова Р. Блок 2Ii (так мы будем сокращать фразу «м. т., пробегая некоторую последовательность состояний, входящих в блок 214») перекодирует слово Р cj Б в слово [Рх ^ А, причем этот блок не работает, если алфавиты А и Б совпадают (при /с = 2), так как в этом случае РХ[РТ. Блок 212 п0 началу слова [Рх определит полосу At таблицы, в которой находится искомое значение / (Р). Щ3 затем по концу слова [Рх определит группу Btj, в которой написано f(P). Наконец, блок 214 найдет в таблице по этим данным и началу слова [Рх искомое значение / (Р) и напечатает его на ленте. На этом работа м. т. закончится.
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ 93 Опишем работу этих крупных блоков подробнее. Для этого некоторые из блоков 31 * разобьем на блоки 95^ так> чтобы U®y = *j. (3-И) 3 Схематически работа этой м. т. изображена на рис. 3, причем для простоты на схеме взято к = 2. Сложность некоторого блока © обозначим Рис. 3. Справа стрелка вида —>■ указывает, с какого места слова [Рх (или Р для ЭД) блок начинает работу, стрелка вида t — где он ее кончает; == отмечает стертые раньше буквы слова [Рт . ^м. т (©)• При подсчете сложности блоков последние состояния данного блока относятся к следующему блоку (конечно, кроме самого последнего блока). Блок $! переводит число М; двоичной записью которого является слово Р, в А-ричную систему счисления, осуществляя известный алгорифм такого перевода (М делится на к; остаток дает в двоичной записи младшую цифру искомого представления числа М, а частное снова делится на к\ новый остаток дает следующую цифру искомой записи, а частное снова делится на к и т. д.). Нетрудно убедиться, что Ьи.АЩ<С(к)п\ (3.12)
94 В. А. КУЗЬМИН где С (к) — некоторая константа, зависящая от к. Когда этот блок закончит свою работу, на ленте окажется слово [Рх и машина будет находиться в клетке, занятой первой буквой этого слова. 2Г2 просматривает слева направо первые г' букв слова [Рх, не изменяя их, и по ним определяет, к какой полосе нашей таблицы относится слово [Р . Делается это так. 2Г2 запоминает просмотренную часть слова [Рх, а в конце переходит в состояние, соответствующее полосе, к которой относится слово [Рх. Графически это изображается /с-хотомическим деревом, выходные вершины которого склеены в соответствии с распределением слов по полосам (см. рис. 3) £м.т(И2)< 2 к1 <^гг. (3.13) 1=0 Затем блок 353i> помня номер (i) полосы, определенный предыдущим блоком, пробегает к концу слова [Рт, не изменяя просматриваемых букв. По (3.4) и (3.5) получаем £м.,(»31)< А" (*'-/•')< 2]["'ГГП +2(п'-г'). (3.14) После этого" блок Э532> аналогично блоку ЭД2> просматривает справа налево последние п —г' букв слова [Рх, стирая и запоминая их, и по ним определяет, к какой группе Btj относится слово [Рх (т. е. Э532 находит тот номер /, при котором на наборе, определяемом последними п —г' буквами слова [Рх, /?7- (£Г'+ь • • •, lw) = 1). С помощью (3.4), (3.5) получаем LM.A^)<N'n 2 1^<(^+i)-K-=T(£iTr + S:- (3-15> i=0 Запомним^номер группы, Ви, определенный предыдущим блоком; блок 954i по первым г' буквам слова [Рх определит искомое значение f (Р) (этот блок вычисляет j\j(lu . . ., £Г') при найденных значениях i и/, где £ь ..., |Г'—начало рассматриваемого слова [Рт), причем, как и предыдущий блок, 9341 сотрет все просматриваемые буквы слова [Рх. По (3.4), (3.5) и (3.6) имеем г'-1 ьМшТ(*«)<№ 2 ^<(^-+i)2s^r- (ЗЛ6) i=0 Наконец, блок 9542 напечатает определенное блоком 954i значение / (Р): LM.T(»42) = 3- (3.17) Положив, например, г'±^ Г lb^J 1 и s ^[п — 6\Ъп], по (3.12) — (3.17), учитывая (3.11) и что кг' <гс2, получим 4 2" ' 2П+2к ' (п — 6\Ъп — 1)(Л— 1) ' п*(к—1) ' 2n+i 2n+l 2n ^2 (^ — 6 lb w — 1) (А: —1) ^ п± (к — 1) /г(/с —1)
РЕАЛИЗАЦИЯ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ 95 Следовательно, LM. т (п, к) < В(А_1} • Сравнивая верхнюю и нижнюю оценки, получаем 4. Реализация систем функций алгебры логики 4.1. Пусть теперь дана любая система р функций алгебры логики от п переменных где /? тоже является функцией от п (в предыдущих разделах было р(п) = 1). Рассмотрим реализацию этой системы ф. а. л. теми же управляющими системами, что и в предыдущих разделах. Будем говорить, что автомат 21 реализует систему (4.1), если алфавит X совпадает с Б. а алфавит Y состоит из 2р-1-1 буквы: 0 и всех слов длины р в алфавите Б, и если выполняется условие | y(t) = П (Pi) h (Pi) . . . fP (Pi) при t= 0 (mod л), | y(t) = 0 при ЬфО (mod n), где, как и в п. 1.1, i^\ — , Pt^x (ni)x (ni-\- 1) . . . x (n (г-j- 1) — 1), fj(Pi)--fj(x(ni), ...,*(*("+1)-1)) и /6 [1, p]. Аналогично будем говорить, что н. а. 21 реализует систему (4.1), если 21 применим к любому слову Р < Б длины п и если '*i_PjXh(P)f2(P) ■■■ U(P). Наконец, будем говорить, что м. т. 21 реализует систему (4.1), если она слово Р, записанное на ленте, перерабатывает в слово fi(P)f2 (Р) . . . fp(P) > находящееся в р соседних клетках, последнюю (самую правую) из которых она видит в момент остановки (перехода в состояние q). Л^сть LaB(n, р) (соответственно LH.a(rc, P, к) и LM.T(n, р, к))— минимальное из чисел L таких, что любую систему р ф. а. л. от/г переменных можно реализовать автоматом (соответственной, а. и м. т. в А), сложность которого не превосходит L. Так как методы доказательств теорем о реализации системы ф. а. л. от п аргументов аналогичны методам доказательств соответствующих теорем о реализации одной ф. а. л. от п аргументов, то эти теоремы дадим без доказательств. Теорему, аналогичную некоторой теореме предыдущих разделов, будем обозначать тем же номером со штрихом. 4.2. Прежде чем формулировать теоремы 1'—3', дадим одно определение. Пусть ф, (а?!, ..., хг), ..., %(хи ..., xr), Ttpi(xu ..., хг), ... ..., %(#!, ..., хг) — любые ф. а. л. Будем говорить, что системы {фь • • .» фг} и {'Фи • • .» %} различны, если существуют натуральное число t£[l, l] и набор значений аргументов (ои ..., аг) такие, что q>i(ou ..., ог)ф^г(а1, .. ., ог). Автомат, реализующий данную систему ф. а. л. (4.1), строится методом, аналогичным описанному в п. 1.2. Нужно лишь разные вершины 5-го яруса ставить в соответствие различным системам р ф. а. л., получающимся подстановкой всевозможных наборов констант 0 и 1 вместо s
96 В. А. КУЗЬМИН первых аргументов всех функций системы (4.1) одновременно. Число таких различных систем обозначим [а(/4, ..., /р, s). Кроме того, ребрам, идущим в вершину, соответствующую системе (4.1), нужно в качестве выходного символа приписать не f(P), а слово fi(P)fa(P) ... fP(P)- Теорема 1'. Автомат, построенный методом, аналогичным опи-. санному в п. 1.2, является минимальным. Теорема 2'. ~ Г7-1 £aB(/i, • • •' /р)=^ав(21/ ..#>/ )= 2 jx(/i, • • ., /р, *), 1 р s=0 где 21/ ...г/ гг Z/aB(/i, . .., /р) аналогичны 21/ гг LaB (/) соответственно. Теорема 3'. n m L.B(n, />) = S 2"-r+ 2 2«Гр, r=m+l r=0 m+ь где m —натуральное число такое, что 22 р < 2п~т и 22 /} > 2П~™~1. Теорема 4'. — р^Ьав (п, р) С —— р /г/?гг /? < тг, LaB(n, р) — 2П ?г/ж /?>;г. Теорема 5'. 2п Ьн. а (л, р, /с) — jj-^ /? гсргг /?<« гг р ^п, 2п 2п \ъТр^ Ьн а (п> ^ ^ ^ ТьТ ^ (! +Ib fc) w^ ^ ~ п- Теорема 6'. (,_1)2(?+1Ь р) < Lm» т (". Р. *) < (jfc-iHntlb P) "/>»/>-*-»>*, (S=T)^pib7)^LM.i(w' P' ft) ^2*> ЛРВ л-1Ьл<р<п, (&-1)^ + 1Ьр) ^ Lm- т К P. ft) < 2> при р~п и р^п. ' ЛИТЕРАТУРА 11] Лупанов О. Б., О синтезе некоторых классов управляющих систем, сб. «Проблемы кибернетики», вып. 10, М., Физматгиз, 1963. '{2] Марков А. А., Теория алгорифмов, Труды МП АН СССР им. В. А. Стеклова XLII, 1954. [3] Поваров Г. Н., Математико-логическое исследование синтеза контактных схем с одним входом и к выходами, сб. «Логические исследования», АН СССР, 1959. [4] Яблонский СВ., Функциональные построения в А-значной логике, Труды МИАН СССР им. В. А. Стеклова LI, 1958, 5-142. ;{5] Б ерж К., Теория графов и ее приложения, ИЛ, 1962. [6] Кобр и некий Н. Е.,Трахтенброт Б. А., Введение в теорию конечных автоматов, М., Физматгиз, 1962. [7] Lee С. Y., Representation of switching circuits by binary-decision programs, BSTJ 38, 4, 1959. 18] Shannon С. Е., The synthesis of two-terminal switching circuits, BSTJ 28, 1, 1949, 59 (русский перевод см. в сб.: К. Шеннон, Работы по теории информации и кибернетике, ИЛ, 1963). Поступило в редакцию 23. VIII 1963.
О НЕКОТОРЫХ КЛАССАХ ЛОГИЧЕСКИХ ФУНКЦИЙ, СВЯЗАННЫХ С ПОРОГОВЫМИ л. л. шоломов (МОСКВА) Пороговыми функциями описывается поведение ряда реальных физических элементов, используемых для построения комбинационных схем. Известные методы нахождения структуры порогового элемента и методы построения схем из таких элементов существенно различны. Поэтому желательно, не приступая к процессу синтеза; знать, можно ли реализовать функцию одним элементом или она требует построения схемы. Задача распознавания пороговых функций исследовалась рядом авторов. Элготом, Чоу и Габельманом были найдены аналогичные друг другу критерии пороговых функций (см., например, [9]), которые хотя и представляют теоретический интерес, практически неэффективны. В некоторых работах исследовалась ослабленная задача распознавания. Выделялись классы более широкие, чем класс пороговых функций, принадлежность к которым выявляется проще. Так, Мурогой [4] было установлено, что пороговые функции являются однородными (т. е. однотипными с монотонными). Однородные функции распознаются достаточно просто, но их гораздо больше, чем пороговых. Паулом и Маккласки [5] было показано, что пороговые функции являются полностью сравнимыми. Известно, что все полностью сравнимые функции 6 переменных являются пороговыми, и существует гипотеза, что такое соответствие сохраняется до 10 переменных (единственная описанная в литературе полностью сравнимая непороговая функция Мура зависит от 12 переменных). В предлагаемой работе исследуется метод распознавания функций путем приведения к некоторым «эталонным» функциям от меньшего числа переменных. С этой целью вводится система {/} допустимых операций и рассматриваются классы функций, замкнутые относительно операций этой системы (такими, в частности, являются классы полностью сравнимых функций и пороговых функций). Каждый такой класс 91 характеризуется системой {Д, /2, ...} «эталонных» функций (называемых порождающими элементами для 91), обладающей тем свойством, что любая функция /£sJt (и только такая) приводится хотя бы к одной ий ft допустимой операцией. В работе показано, что класс полностью сравнимых функций обладает единственным (и при этом очень простым) порождающим элементом. Этот факт используется для распознавания полностью сравнимых функций. Изучаются соотношения между классами однородных, полностью сравнимых и пороговых функций. Пороговые функции обладают свойством ^-ацикличности и полной ацикличности. В заключение формулируются некоторые результаты для системы ^-ациклических функций. 7 Проблемы кибернетики, вып. 13
98 Л. А. ШОЛОМОВ § 1. Пороговые функции, допустимые операции и замкнутые классы Определение 1. Функцию*) f {хи х2, ..., хп) назовем пороговой, если существует линейная форма I (х1ч х2, . . ., хп) = wxxiJrw2x2-\-.. ,-\-wnxn и такое число Т (все wt и Т действительны), что {1, если 1{хи х2, ..., хп)>Т, О, если !(Хи х2, ..., хп)<Т. Будем говорить в этом случае, что пороговая функция / (хи х2, ..., хп) определяется линейным неравенством 1(хи х2, . .., хп)^>Т. Опишем систему {/} допустимых операций, которыми мы будем пользоваться при исследовании функций. Определение 2. Назовем элементарной допустимой подстановкой 1° для функции / (#i, х2, .. ., хп) одну из следующих четырех операций: 1) I°(Xi\l)—подстановка константы 1 вместо переменной хи 2) I°(xi\xj) — отождествление переменных xt и Xj\ осуществляет замену переменной xt в функции f (х{, х2, ..., хп) переменной Xj, 3) I°(Xi\xi) — инверсирование переменной xt, 4) 1°(Х\у)—введение несущественной**) переменной у. Допустимой подстановкой I для функции назовем последовательное выполнение (в любом конечном числе) элементарных допустимых подстановок // (хи х2, . .., хп) = Ilk .. . I\I\f (хи s2» . ..» хп) (1) (в этом случае будем говорить, что / является произведением подстано- вок /J, /2°, ..., Ц). Для сокращения «допустимые подстановки» будем называть «/-подстановками» или просто «подстановками». Легко видеть, что /-подстановками являются I(xt\l) или I (xt\0) — подстановка 0 вместо х-ъ — и I(xt\xj)—замена переменной х^ инверсированной переменной xj. Транспозиция переменных xt и xj, являющаяся результатом произведения подстановок /J (К \ у^, /° (^ | у2), I\ (xt \ yt), ^(^|Уг). ^(Мж*)» 7б(^1^). 1*ЛуЛъ)г 11(У2\хг)^ Допустима, поэтому допустимы любые перестановки аргументов. Подстановками констант можно добиться исключения несущественных переменных. Отметим ряд свойств допустимых подстановок, которые понадобятся нам при дальнейшем изложении. 1° /-подстановка сохраняет операции дизъюнкции и конъюнкции: /(/iV/2) = //iV//2, (2) /(/i&/2) = //i&//2- (3) Это утверждение легко проверяется для каждого вида элементарной подстановки и распространяется на общий случай по индукции с учетом (1). 2° Операция отрицания перестановочна с операцией /-подстановки: 7/ = //. (4) *) Здесь, как и везде в дальнейшем, под словом «функция» понимается булева функция. **) Определение несущественной переменной содержится в [1].
О НЕКОТОРЫХ КЛАССАХ ЛОГИЧЕСКИХ ФУНКЦИЙ 99 Действительно, применение (2) и (3) к формулам / & / = О и / V / =1 приводит к //&//= О и 7/V^/ = l? откуда следует, что // является отрицанием функции //. 3° Операция /-подстановки сохраняет отношение сравнимости*), т. е. если /i>/2, то //i>//2- Действительно, из /i>/2, следует, что /i V /2 = /i, откуда в силу (2) /^ V If2 = Ifi или J/i>//2- 4° В общем случае допустимые подстановки не коммутативны, что доказывается примером применения подстановок /А (xi 11) и /2 (х2 \ #i) в различном порядке к функции / (хи х2)\ I2hf(xu ж2)=/(1, х{), IJ2f{xu z2) = /(l, 1). Однако легко видеть, что множество подстановок**) /, «/11 xh), ...,/* (*£* | xjk), Ih+l (sJVi II),...,/, (хУ 11) перестановочно при условии, что все x\s различны (xJr не обязательно различны) и переменные, входящие в правые части подстановок (#/г), отличны от переменных левых частей (xis). Произведение подстановок 1± (х°ч \ xj), /2 (х°*2 \xj), ..., Ih (х{ %h \ xj), где xj отлично от х\ , / = 1, 2, . .., /с, не зависит от их порядка, его мы будем обозначать /(я?*1, #°i2, ..., #/*!#/)• Аналогично произведение подстановок /4 (ж% 11), /2 (а£*а 11), .. ., /* (#/* 11) будем обозначать /(;ra*i, яаЧ ..., ж?** II). Определение 3. Класс 91 булевых функций назовем 1-замкнутым, если он замкнут относительно операций /-подстановок, т. е. из / £ УЬ следует //б 91. /-замкнутый класс функций является инвариантным в смысле определения С. В. Яблонского***) [1], обратное справедливо лишь в редких случаях. Приведем два простейших примера /-замкнутых классов: 1) класс $ всех булевых функций; 2) класс линейных функций и констант £ = {0, 1, f = xh® ...®xin@a}, где 0 означает суммирование по модулю 2. Следуя С. В. Яблонскому, введем понятие порождающего элемента. Определение 4. Функцию / назовем порождающим элементом для I-замкнутого класса 91, если 1) /ёзг и 2) / является константой или для любой /-подстановки, понижаю- щей число переменных функции /, //g9l. *) Функции /(#1, х2, ..., хп) и g fa, x2, ..., хп) называются сравнимыми, если всюду в области их определения выполнено неравенство f (xif x2, ..., хп) >- >■ g(xu хъ ..., хп) (или /(*!, я2, ..., ^X^h, а:2, . . ., zn)). (х если а — 0 a £ {0, 1}. х, если а = 1, ***) С. В. Яблонский называет инвариантным класс функций, замкнутый относительно подстановок констант, переименований переменных (без отождествления), введения и исключения несущественных аргументов. 7*
100 Л. А. ШОЛОМОВ Легко видеть, что вместе с / порождающими элементами будут все функции, получающиеся из / переименовавием и инверсированием переменных (т. е. функции, однотипные с /); поэтому будем различать порождающие элементы с точностью до типа. Пусть 91 —/-замкнутый класс и /£9t. Тогда, если / не является порождающим элементом для 91, найдется /-подстановка, приводящая / к порождающему элементу. Действительно, существует подстановка /А, понижающая число переменных /, такая, что /i = /i/6$ft. Если /4 —порождающий элемент, утверждение доказано; если нет, то, аналогично, найдется подстановка /2 такая, что /2 = ^2/1 6^1 > и т. д. Так как каждая из подстановок 1и /2, ... понижает число переменных, этот процесс должен оборваться, и мы придем к порождающему элементу fk = Ikfk_i = =ih...i2hj=u. Обозначим через F<^. систему {/А, /г,...} всех различных*) порождающих элементов для 91. Любая функция / £ 91 приводится хотя бы к одному из ft допустимой подстановкой, но для /£ 91 это невыполнимо. Отсюда каждый /-замкнутый класс 91 однозначно определяется системой Fm: если У1хфШ2, то Г^ФРщ. Можно показать, что множество функций {Д, /2, ...} является системой порождающих элементов F<^ для некоторого /-замкнутого класса 91 тогда и только тогда, когда 1) все fi существенно зависят от своих аргументов, 2) для любых 1Ф] невыполнимо Ifi = fj. Система порождающих элементов F$i может быть как конечной, так и счетной **). Укажем системы порождающих элементов для двух простейших примеров /-замкнутых классов, приведенных выше: 1) /\р = Л; 2) FL={xy, zV у]. Это следует из того, что любую нелинейную функцию подстановкой констант можно привести к одному из видов xGyx или х° V Vх (см. [1]). В заключение этого параграфа приведем важный для нас пример /-замкнутого класса. Теорема 1. Класс g пороговых функций I-замкнут. Доказательство. Проверим это утверждение для каждой из элементарных подстановок. Справедливость теоремы в общем случае будет следовать из индуктивного построения (1) /-подстановки. Пусть функция f(xu x2, ..., хп)£% определяется линейным неравенством wixi + w2x2+ . . . +гипхп>Т. Легко убедиться, что для подстановок /Jfoll), /°Ы*2), /J^il^i) и *!(М0 Функции /J/, /°/, /3°/ и /4°/ определяются соответственно неравенствами w2x2 + . .. + wnxn > Т' — u>i; (10! + w2) x2 -f w3x3 + ... +wnxn>T; —wixi + w2x2+ ... +wnxn>T — wi; WiXi + . .. -f wnxn -f 0 • z/ > Г. Для простоты записи мы применяли элементарные подстановки к переменным х± и х2\ в случае произвольных xt и xj доказательство не отличается от приведенного. Теорема доказана. *) Напомним, что однотипные элементы мы не различаем. **) Приведем без доказательства пример /-замкнутого класса 9£, обладающего счетной системой порождающих элементов. Определим для него F^={fk = x2x3 ...xky хххг . .. xh V • • • V*i*2 • •. *A-iV*i*2 • • • *ft (fr = 3, 4, 5, ...)}.
О НЕКОТОРЫХ КЛАССАХ ЛОГИЧЕСКИХ ФУНКЦИЙ 101 § 2. Полностью сравнимые функции Определение 5. Функция f (хи х2, ..., хп) называется монотонной, если она или 1) является константой, или 2) может быть представлена в базисе &, V (без отрицаний). Определение 6. Функцию назовем однородной, если она может быть переведена в монотонную инверсированием некоторых из своих аргументов. Определение 7. Функцию назовем полностью сравнимой, если для любого набора ее аргументов функции, полученные из нее произвольными подстановками констант вместо всех переменных этого набора, сравнимы. Замечание. Всякая полностью сравнимая функция f (хи ..., хп) является однородной. Действительно, представим эту функцию в виде / = z'i/(l, х2, .. ., хп) V Zi/(0, x2, ...,хп). Функции /(1, х2, ...» хп) и / (0, х2, ..., хп) должны быть сравнимы (например, / (1, х2, . .., хп) < </(0, х2, ..., х)), поэтому f = xj(i, х2, . .., хп) V Zi/(0, х2, . .., хп) V xj(l, x2, . .., хп) = = /(1, ж2, ..., xn)\/xj(0, х2, ..., хп). Аналогично, разлагая это представление по переменной х2, получим формулу для /, в которую Xi входит с инверсией, а х2 — в одной из форм х$2. Продолжая этот процесс для переменных х3, ..., хп, убедимся в однородности функции /. Если U — множество функций однородных, а 9К — множество полностью сравнимых функций, справедливо включение Однородная функция f (хи хг, хъ, х^)=х{х2\у х3х^Ш вследствие несравнимости /(1, х2, х3, 0)=х2 и /(0, х2, х3, 1) = х3. Поэтому включение строгое: UZ)2tt. (5) Теорема 2. Класс Ш полностью сравнимых функций является I-замкнутым. Доказательство. Как и в случае теоремы 1, проверим это утверждение для элементарных подстановок. При этом ограничимся случаем подстановки /° (xt | xj) (для остальных случаев доказательство тоже не вызывает затруднений). Пусть f(xu x2, ..., хп)£Ш, (Хгг, Хг2, ..., Х\^ — произвольный набор аргументов функции Pf, и пусть имеются подстановки, осуществляющие замену переменных из этого набора двумя различными наборами констант: /!=/!(*£!, <2Ч ..., ж£*|1) и /2 = /2«1il, *£», ..., xS\ 1). Требуется доказать, что функции IJ°f и I2Pf сравнимы. Будем различать два случая. a) xj не содержится в наборе (xiv xi2, ..., xi). В этом варианте подстановки Р и It применены к непересекающимся группам переменных, и по свойству 4° /-подстановок они перестановочны; то же можно сказать и о подстановках /° и 12. По определению полностью сравнимой функции IJ и I2f сравнимы. Подстановка /°, примененная к обеим этим функциям, не нарушает этого отношения (свойство 3°), т. е. IiPf = PIif и I2Pf = PI2f сравнимы.
102 Л. А. ШОЛОМОВ б) xj содержится в наборе (xiv xi2, . . ., х*) (пусть для определенности /=£i). В этом случае IJ°f = I*f и I2I°f==I*f, где II = 1\ (x°J, х%, .. ., х°\ X°J 11), /* = II (ХУ, a-Ji,, ..., х%, хУ 11). В силу полной сравнимости / эти функции сравнимы. Теорема доказана. Замечание. Класс U однородных функций не является /-замкнутым. Функция xtx2 V #з#4 6 U последовательным применением подстановок Л(#1|#з) и ^2(^4^2) приводится к виду х2@х3 = х2х3 V %2хз 6 И- Теорема 3. Хэд = {*/© z) > т. е. единственным порождающим элементом класса полностью сравнимых функций является линейная функция двух переменных. Доказательство. Покажем вначале, что всякую функцию /^3Ji можно привести /-подстановкой к линейной y@z. Пусть /(#!, х2, ..., хп)£ЗЯ. Тогда найдутся переменные (для определенности) х1ч х2, . . ., хи и два набора констант о = (ои а2, ..., ад) и т = (ть т2, ..., Th) такие, что функции /(аь ..., оА, я-А+1, ..., яп) и /(т4, ..., тА, жд+1, ..., #п) несравнимы. Поэтому для некоторых двух наборов а = (аА+1, аА+2, ..., ап) и j} = (pA+1, рА+2, ..., рп) выполнено /(аь ..., аА, аА+1, ..., ап) = 1, /(аь ..., aft, pA+i> ..., рл) = 0, (6) /(ti, ..., тА, Pa+i, ..., Pn) = l, /(ti, ..., тА, аА+1, ..., ап)=0. Сравним покомпонентно наборы а и т, а и р. Пусть (для определенности) *) Ot=Ti (i = 1, 2, . . . , Z), Gj=T* (l = Z+l, ..., /с), Ct;^=P /(ai, /(ai, m), af = pj (i = m+l, a/, a/+1, . . ., a^, aA+1, , rc). Тогда (6) перепишется так: > Omi am+l> •••> СЬЛ) = 1, , am, am+i, ..., an)=0, > Ami ^т+1, ..., an) = l, > ttm, am+i, ..., an)=U. j (7) Применим к /(#i, x2, Л (я?1, 42, # V ж 1Л+1 Л + 1 ' O/, О7+1, . . . , Ok, Q-k+U a/, a/+1, . . ., о hi ctft+1, . ., #n) последовательно такие подстановки J3 (XmV\^ * * ' ' Х1П I Z)' ПОЛУЧИМ фуНКЦИЮ ф Q/, z)=I3I2IJ (xu X2, . . . , 3T7l). Легко видеть, что ф(1, l) = f(au ..., az, az+1, ..., aA, aA+1, ..., am, am+1, ..., an) = l, аналогично ф(1, 0)=ф(0, 1)=0, ф(0, 0) = 1. Поэтому ф (г/, z)=yz\y yz. Инверсированием переменной у эта функция приводится к y@z. Для завершения доказательства нам осталось показать, что y@z является порождающим элементом для 2К. Это справедливо, так как z/@z£2K (в силу неоднородности), а любая подстановка, понижающая число переменных, вводит ее в ЗК (все функции от одной переменной полностью сравнимы). Теорема доказана. Замечание. Эта теорема представляет собой критерий полной сравнимости и может быть переформулирована следующим образом. *) Здесь и в дальнейшем а=1фа.
О НЕКОТОРЫХ КЛАССАХ ЛОГИЧЕСКИХ ФУНКЦИЙ 103 Для того чтобы функция f не была полностью сравнимой, необходимо и достаточно, чтобы нашлась подстановка! такая, что If = y@ z. Следствие 3.1. Полностью сравнимые функции вполне характеризуются тем свойством, что никакая I-подстановка не выводит их за пределы класса однородных функций. Действительно, если / £ 2К, то //gSKczU. Если же/^ЗК, то найдется подстановка / такая, что If = y@ z £91. Доказанная теорема позволяет выявить нам некий геометрический признак, характеризующий функции, не принадлежащие 2К (область определения функций интерпретируется га-мерным единичным кубом). Следствие 3.2. Для того чтобы функция не была полностью сравнимой, необходимо и достаточно, чтобы нашелся подкуб и в нем две пары противоположных вершин таких, что на одной из этих пар функция равна 1, на другой — 0. Действительно, если функция / не принадлежит 2К, для нее выполнено (7), что равносильно нашему утверждению (искомый подкуб — (ои .. ., оь хм, .. ., xk, ak+u . .., ат, xm+i, _.. ., хп), пары противоположных вершин — (Oi+l, .. .,_oh, am+1, .. ., _an), (az+1, ..., oh, am+1, .. ., an) и (oi+u ..., cFft, am+1, ..., an),(az+1, ..., aft, am+1, ..., an)). Обратно, легко видеть, что из существования в подкубе пары противоположных вершин с указанными свойствами следует (7) (с точностью до переименований переменных). Функция / приводится к виду y@z (см. доказательство теоремы 3) и не является полностью сравнимой. Следствие 3.3. Если /£2К, то /£2К и /* g 9K (где f* — функция, двойственная к /). Предположим, что /£2К, тогда найдется подстановка / такая, что lJ=V®z = Vz V yz- В силу свойства 2°/-подстановок // = (//) = (yz V yz) = = yz\/yz. Это противоречит полной сравнимости /. Итак, /£9К. /* получается из / инверсированием переменных, поэтому (в силу /-замкнутости 2К) /* 6 9К. Следствие 3.4 [5]. Класс $ пороговых функций содержится в 9К, т. е. ScE (8) Легко видеть, что */©z£$, поэтому никакая пороговая функция, в силу /-замкнутости класса §, не может быть приведена /-подстановкой к виду y@z. В силу теоремы 3 все пороговые функции полностью сравнимы: 2KZ)g. Для доказательства строгого включения сошлемся на пример полностью сравнимой непороговой функции /м, предложенный Муром: /м = ^з (хи x2j х3) [£4 (ж4, . •., ж7) V S3 (ж4, • • •, х7) S2 (ж8, . . ., xi2) V V ^2 (Ж4, . . . , Х7) S3 (Ж8, . . . , Xi2) V Si (Ж4, • . • , Х7) £4 Ы, . . . , Xi2) V V ^5 (х8, • • • •> #12)] V ^2 (X\i x2i Хз) [^4 (xk4 • • • > Xl) $2 (х8, ■• • • > ^12) V V ^3 (Я4, ' ' ' » ХТ) ^4 (Я8, • • • , Zi2) V ^2 (^4, • • • , Х7) S5 (ж8, • • • , Xi2)] V V Si (Xi, Х2, Х3) [О4 (Хк, . . . , Ж7) ^4 (х8ч ...» #12) V V S3 (ж4, ..., ж7) 55 (ж8, .. ., xi2)\ V ^4 (ж4, .. ., х7) S5 (ж8, . .., ж12), где Sp(xk, ...,x-i) — монотонная симметрическая функция от переменных .Xk, xk+ii ...,х{с рабочими числами р, р+1, ..., I— /с + 1 (функция /м приведена здесь в форме, представленной в [6], там же содержится доказательство ее непороговости).
104 Л. А. ШОЛОМОВ Возникает вопрос: при всяком ли достаточно большом п существуют полностью сравнимые непороговые функции, существенно зависящие от п аргументов, и ограничено ли их количество? Для выяснения этого предварительно докажем лемму. Лемма. Если /£ 2ft, то fi = x V / 6 9Л и /2 = я/ 6 9К (при этом х может принадлежать или не принадлежать множеству аргументов функции /). Доказательство. Предположим, что /4 £ Ш. Тогда найдется подстановка / такая, что Ifl = Ix\/If = y@z (здесь мы воспользовались (2) и теоремой 3). Отсюда при y = z получаем 1х = 0. Так как 1х существенно зависит не более чем от одного аргумента, 1х = 0 и, следовательно, If = y@z. Таким образом, по теореме 3 /£$Ш- Полученное противоречие показывает, что /i £ ЭДЬ Далее, функция /2 = #V/* по доказанному выше полностью сравнима (/*£9Ji по следствию 3.3), поэтому полностью сравнима и /2 (в силу (/2)* = /2 и следствия 3.3). Лемма доказана. Теорема 4. При всяком гг>12 существуют полностью сравнимые непороговые функции, существенно зависящие от п аргументов, и число их стремится к бесконечности с ростом п. Доказательство. Дадим индуктивный способ построения полностью сравнимой непороговой функции fn+1 (хи .. ., хп, хп+1), существенно зависящей от п-\~1 аргумента, если известна функция fn (хи . .., хп) от п аргументов, обладающая теми же свойствами. Положим fn+1 = xn+1fn. По лемме /П+1£9К- Так как множество 5 замкнуто, то /n+1£t5, ибо в противном случае для подстановки / = / (хп+1 \ 1) имеет место Ifn+1 = fn £ g. Функция fn+1 существенно зависит от всех своих аргументов: она зависит от хп+1, так как /n+1(*i, ..., хп, 0) = 0, a /*+1(*i, ..., хп, i) = fn(xu ..., хп)ф0; существенная зависимость от xt(i фп-\-\) следует из того, что от х^ зависит fn (хи .. ., хп) = fn+1 (хи . .., хп, 1). Из существования /12£2Ji\j? (/12 = /м—функция Мура) следует существование функций с требуемыми свойствами для любого гс>12. Пусть, далее, К (п)—число различных полностью сравнимых непороговых функций, существенно зависящих от п аргументов, и {/Г> /?» •••»/£(п)} — множество всех таких функций. Образуем из каждой fi пару функций: fit-i = xn+ifi и fit1 = xn+l V /?. Все вновь полученные функции существенно зависят от п 4-1 аргумента и принадлежат 9Л\$ (для f2i^-i это доказано, для fit1 доказательство аналогично). Убедимся теперь в том, что все /£+ различны. Действительно, №х=ХпъУ КфК?\ =xn+J? (так как ftf-i (*п . . ., **, 0) == 0, a fix (^i, . . . , Хп, 0) = fi (XU . . . , Хп) ф 0), Xn+Ji Ф Xn+ifi (l ф /), Xn+i V /? Ф xn+i V ft (i Ф j) (в последних двух неравенствах убеждаемся соответственно при xn+i = 1 и xn+i=0). Так как полученная система содержит 2К (п) различных функций, справедливо К(п+1)>2К(п). Поэтому К(п+1)>2К(п)>22К(п — 1) > ... .. . >2Г2~11/£ (12) — c2n+1. /£ (л) стремится к бесконечности с ростом п. Теорема доказана. Обозначим через N-& (п), N^ (n) и /Vg (n) число функций от п аргументов из классов U, 9Л и g соответственно. Из (5), (8) и теоремы 4 сле- дует Nu (п) > ТУдд (л) > #g (л). Известно [2], [7],что *) \og2Nu (n) X 2л/уЪ w (n) *) u(rc)^<i;(rc) означает, что сА <;—ГТ^С2 ПРИ достаточно больших п\ cir с2—некоторые константы.
О НЕКОТОРЫХ КЛАССАХ ЛОГИЧЕСКИХ ФУНКЦИЙ 105* и log2Ncr (n) Х?г2. Ниже приводится теорема, устанавливающая некоторую верхнюю оценку для N$fi(n). Теорема 5. Число полностью сравнимых функций от п аргументов n2J 2 L Nw (n) < 2 . (9) Доказательство. Будем доказывать теорему для случая четного п. Пусть / (#i, х2, . .., хп) £ 9К. Разобьем множество аргументов на две группы: хи . .., хп и хп , ..., хп. Зададим функцию / (х{, ..., хп) 2 2+1 П 71 квадратной матрицей Л/ размера 22 X 22 следующим образом (см. таблицу). Выпишем по горизонтали все наборы (а4, а2, ..., ап) значений хп * * * ^п—1 хп 2"' о ... о о о ... о 1 2 + i ... 1 1 /(alf .... an , an , ..., ая) 2" 2"+1 0 0 : 0 о : о 1 : <*2 2 : l : l l • .... 2^ x2 аргументов xu x2, .. ., xn в порядке возрастания чисел, представленных 2 двоичной записью (а4 а2 . . . оп), аналогично по вертикали выпишем' 2 наборы (an , . .., an) оставшихся л/2 аргументов. На пересечении столбца о "г1 (ffi» <?2, .. ., an) и строки (оп , . . ., an) поместим значение / (сг±, . .., an, 2 2+1 2 tfn , .. ., с^тг)- Каждой функции / соответствует единственная матрица Af, 2 и по матрице Л/ единственным образом восстанавливается /. Будем называть два /с-мерных двоичных набора (аь а2, ..., а^) и (Pi» P2» ; • •» Ра) сравнимыми, если для всех l<;i</c выполнено неравенство аг>рг (или a^<Pj). Столбцы матрицы Af, соответствующие произвольным наборам (сгь а2, .. ., оп) и (ть т2, . . ., тп), сравнимы, так как в них расположены 2 2 сравнимые функции / (аь . . ., о^, Яп » ...,яп)и/ (ть ...,Тп,Жп , ...,#n). 2 2' 2 2+ Все столбы ^4/ можно линейно упорядочить в соответствии с возрастанием^ числа единиц в них.
106 Л. А. ШОЛОМОВ п п Если М (п) — число матриц размера 22 X 22 , столбцы которых можно упорядочить указанным способом, справедливо неравенство Nw(n)<M(n). (10) Образуем из Af матрицу Л°, расставив столбцы матрицы Af слева направо в порядке убывания числа единиц в них. А* обладает тем свойством, что в каждой ее строке вплоть до некоторого места сплошь идут единицы (если они есть), затем — сплошь нули. п п п п 2 Число различных матрице/ размера 2^ х 2^, М0 (п), равно (22 + I)2 п п (22 + 1вариант выбора одной строки и 22 строк). Матрица Af соответст- п вует не более чем (22)! различным матрицам Af, поэтому п п п Ц 22 п (-+1)22 J 22 X п п£ \ М(п)<(22+1) (22)!<22 (^-J У2я22<(22 )* = 2 (в промежуточных выкладках мы воспользовались формулой Стирлинга). 71 Учитывая (10), получим для четного п: N^ (п) < 2П . Аналогично для нечетного п справедлива оценка (9). § 3. О распознавании полностью сравнимых функций Однородные функции распознаются достаточно просто: в сокращенную дизъюнктивную нормальную форму такой функции каждая существенная переменная х% входит лишь в одной из форм х*Л (несущественные переменные в нее вообще не входят). Все однородные функции трех переменных являются пороговыми, при возрастании числа переменных, /г, доля пороговых функций среди однородных чрезвычайно быстро уменьшается. Как показывает оценка теоремы 5, класс полностью сравнимых функций гораздо уже класса функций однородных. При малых п 2К достаточно хорошо приближает g: все функции из $Щ от 6 переменных (а возможно, и от 10 —11) являются пороговыми. Наличие единственного порождающего элемента для $Щ облегчает задачу распознавания полностью сравнимых функций. Как отмечалось выше, класс % пороговых функций тоже является /-замкнутым и для него существует система F<g порождающих элементов. Одним из элементов этой системы является функция х@у, а остальные функции принадлежат множеству 5Jft\§. Порождающие элементы из F<b, отличные от х®у, зависят не менее чем от 7 (а возможно, и от 11 —12) переменных, поэтому сложны и труднообозримы. То же самое можно сказать о системе порождающих элементов для любого /-замкнутого класса, промежуточного*) между Ш и g. Далее, легко видеть, что всякий /-замкнутый класс 5ft Z) 5 с достаточно простыми порождающими элементами (от 4—5 переменных) содержит в себе $Щ. *) /-замкнутые классы, промежуточные между ЗЯ и g, заведомо существуют. Можно построить, например, целую систему классов gC^iC ЩС1.. .CZ^aC- • -CZ S0?i определив F^ = {х@у, */i ... уа/мЬ где /м—функция Мура и iji(i = l, 2, ..., к) не входят в множество аргументов /м-
О НЕКОТОРЫХ КЛАССАХ ЛОГИЧЕСКИХ ФУНКЦИИ 107 IX - \ <"> Поэтому мы будем заниматься распознаванием лишь полностью сравнимых функций. Теорема 6. Для того чтобы функция f (хи х2, ...,хп) не была полностью сравнимой, необходимо и достаточно чтобы нашлась пара переменных*) х\ _ , х\ и три набора констант'. о = (он, oi2, .. ., aift), Р = (Р*А+1' Р*А+2' •••'К-2)' такие, что для функций Iif = fi (xiv .. ., х\ _ ) гг I2f — /г(жгц . . ., #г )г .где 1А=1Ахг \xi ), I9 = I2(xi \xi ), бшго бьг выполнено: 1 1V n ' n—l7 ^ * ч n ' n—l7 h K. •••.%- я,*!?, • • •. ^t;2. «!„_,) = г. J В дальнейшем для упрощения записи будем считать 4 = 1, i2 = 2, .. ., in==ra. Доказательство. Необходимость. Пусть / (хи х2, ..., #п) не принадлежит $Щ. Тогда по следствию 3.2 найдется некоторый подкуб (пусть (оь . ..,ад, £д+1, ..., яп)) и на нем две пары противоположных вершин, таких, что / (сг±, . . ., ад, yk+u . . ., Yn-i, Yn) = 1, / (ab . . ., ад, ya+i, • • •> Yn-i, Y*) = 1, / (ab . . ., ад, 6A+1, . . ., <5n-i, 6n)=0, /(аь . ..,aA, 6A+1, ...,6n-i, S^) = 0. Пусть для определенности Yn = Sn = l (если бы было Yn = 0, то мы бы взяли уп вместо уп). Так как / ((Ть . . ., orA, ya+i» -.-,Уп) ¥=f (o*i, . . ., aft, Sfc-и, . . ., 6n), наборы (ya+i, • • ., Yn) и (бд+1, . . ., бп) различаются хотя бы в одном разряде. Предположим, что уп-\Ф Sn-i и бп_! = 1, тогда / (аь . . ., ад, ya+i, • • •> Yn-2> °» 4) = U (°~ь • • •, аА, ya+i, • • •, Yn-2> 0) = 1, /(cti, . . ., аА, Yft+i, • • ., Yn-2. 1, 0) = f2(ou . . ., ад, ya+i, . . ., Y*-2» 1) = 1, Y Y или /2 (ab . . ., ад, x^jf, . .., ^72, Жп-i) = 1. Аналогично U (Ol, . . . , Од, аЛ+1, . . . , AT2, Жп_1) == 0. Положив Yi = «z и 6j = ($j, получим требуемое. Достаточность. Пусть выполнено (11), тогда в силу определения U и /2 / (аь . . . , Од, Ж°*+1, . . . , ^""_-2, Жл-i, ^n-i) =Е Т, / (Ol, . . . , Од, ж£*+1, . . . , ^Т2, Жл-ь Xn-i) = Т. *) Везде в этой теореме ip =£ iq для р ^= q.
108 Л. А. ШОЛОМОВ Каждое из этих тождеств определяет пару противоположных вершин*. в подкубе (аь .. ., а&, xk+i, ..., хп), и в силу следствия 3.2 /£$Ш- Теорема 6 оказывается достаточно удобной для доказательства непринадлежности функции ко множеству gji. Пример [8]: f=XiX2X3 V x\x2xk V Х\.Х2ХЪ V Х\Х2ХЪ V x\x3xk V Х\ХЪХЪ V V Х\.Х3ХЪ V xi4xb V xixbxQ V ^1^5^6 V ^2Х3^4 V Х2Х3ХЬ V V #2X3#6 V x2xkxb V #2Х4#6 V Х2ХЬХЪ- Рассмотрим функции, получающиеся из / применением подстановок 1\{х§\хъ) и h (XQ 1 хъ) • fl = hf = xlx2x3 V Х1Х2ХЬ V х1хгЧ V #2^3X4 V xix5 V x2^5» i2 = h1 = x\.x2 V *1*3 V *1*4 V *2*3 V *2*4- Будем стараться заменить переменные х1у х2, хг, х4 функции Д на хъ или х5 так, чтобы обратить /А в тождественный нуль. Легко видеть, что необходимо положить xi = X5» #2 = £5 (так как в ^ входят х^х5 и х2х5) и x3=#5> Х4=х5 (чтобы каждая из конъюнкций х^х2хъ и х^х2хк была равна 0). Для того чтобы обратить в тождественную единицу функцию /2, выберем в ней две конъюнкции без общих сомножителей, например х^хъ и х2х4, и положим x^ = xs=x5i х2=х^ = х5. Окончательно при /3 = ^з (xi> х2» хз> х4 I #б) имеем /3/1 =^ 0, а при- h = h(xi> х2> хз» хь\хь) получаем/4/г — 1- Итак, /gSJ?. В работе [8] было затрачено много усилий на попытку отыскания коэффициентов линейной формы этой функции, в то время как доказательство ее непороговости не вызывает затруднений. Теорема 6 позволяет посредством некоторых операций над формулами, логических функций устанавливать, что они не являются полностью сравнимыми. В некоторых более простых случаях в этом можно убедиться непосредственно по виду формулы, не проделывая преобразований. С этой целью мы докажем теорему 7, в качестве следствий которой мы получим несколько видов функций, не принадлежащих $Ш. Для доказательства этой теоремы нам понадобится ввести ряд новых обозначений. Пусть имеется функция f от п аргументов (тг>4). Произведем разбиение множества ее аргументов на два подмножества: Уи У2, Уз, Ук и z5, ..., zn, и обозначим: / {УU У2, УЗ, Уь *5» . . . , 2Л) = / (У, Z) , /(0,0, 0,0, z5, ...,*л)=/(0, Г), /(1, 1,1,1, Z5, ...,*П)=/(Г, z). Будем считать, что нами установлена однородность функции / (г/, z) и эта функция представлена своей минимальной дизъюнктивной нормальной формой (м. д. н. ф.). Инверсированием некоторых из своих аргументов /(г/, z) может быть переведена в монотонную. Так как по теореме 2 первоначальная и преобразованная функции являются одновременно полностью сравнимыми или не являются таковыми, в дальнейшем будем рассматривать лишь монотонные функции. Представим монотонную функцию / (г/, z) в виде / (У, z) = г/!г/2ф! (z/, z) \/ у3у^2 (У, z) V yiyityi (У, z) V У2УЛ2 (У, z) V Ц Q, z), (12) где <pt (г/, z), г|^ (г/, z) и г] (г/, z) —монотонные функции.
О НЕКОТОРЫХ КЛАССАХ ЛОГИЧЕСКИХ ФУНКЦИЙ 109 Такое представление всегда возможно, причем неоднозначно (его можно получить, например, группировкой членов м. д. н. ф. / (у, z) и вынесением за скобки). Теорема 7. Для монотонной полностью сравнимой функции, представленной в виде (12), справедливо [Ф1 (0, z) ф2 (0, z) V Ь (0, z) Ц2 (0, z)] л (X z) = 0. (13) Доказательство. Предположим, что (13) не выполнено. Тогда ло крайней мере одна из формул ф! (б, z) ф2 (0> z) Л (1* ^) и ^i (б» *0 ^2 (0, S) л (1» г) (пусть для определенности первая) не тождественна нулю. Это означает, что найдется набор значений аргументов o = (g5,oq, ...,оп) такой, что ф! (0, а)ф2(0, а)т] (1, о) = 1, откуда (pi(0,a) = l, ф2(0, a) = l, т] (1, а) =0. В силу монотонности функций ф* (у, z) и т] (г/, z) справедливо ф! (у, a)sl, ф2 (у, о) = 1, т] (у, а) = 0. (14) Исходя из представления (12), запишем: / (У. <*) = У1У2Ф1 (У. 5)\/УзУ1Я>2(У1 <?) V z/i^i (У, о) V JfeiMb (*Л <?) V Л (*Л 5), или, учитывая (14), получим: / (У, <*) = г/±г/2 V г/3г/4 V z/i^i (1л a) V У2У^>2 (у. <*)• Применим к такому представлению /(г/, а) подстановки /i(*/3|*/i) и ^2 (г/2 I Уь)» ^получим: у2 Л / (у, о) = г/i г/4 V г/i *А = г/i © г/4- Если учесть, что /(£ 5)=I0f(y, 7), где I0 = I0(zGb5, . ..,2>|1), то окончательно: // (у, z),= I2IJof (У, z) = yi@ г/4- Это противоречит полной сравнимости / (У, *). Теорема доказана. Замечание. Утверждение (13) теоремы иногда более удобно применять в виде ф1 (0, 2)ф2(0, z) V ^i(0, 2;)я|)2(0, z)<r](l, z). Следствие 7. 1. Пусть функция f (х) содержит в своей м. д. н. ф. две непересекающиеся*) конъюнкции длины не менее 2: ui=x\x,2 ... xs, и2 = х[х2 ... x'i, и не содержит ни одной конъюнкции и0 такой, что каждое из пересечений и0 с и{ и и0 с и2 не пусто. Тогда f (x) не является полностью сравнимой функцией. Действительно, представим / (х) в виде / (х) = х\ х'ч (я'з ... x's) V V х[ х\ (х"з .. . x'i) V Л (х)> где в ц (х) входят все конъюнкции/ (х), за исключением Щ И U2. Обозначим через г]1 (х) функцию, получающуюся из т] (х) подстановкой 1 вместо х\, х'2, х[, х\. Покажем, что условие (х'г . .. х\){х\ . . . x'i) < <т]1(а;) не выполнено, откуда по замечанию к теореме 7 будет следовать доказываемое утверждение. Если бы это условие было выполнено, то нашлась бы конъюнкция и1 функции т)1, поглощающая произведение (х'3. . .x's) (x3. . ,x"t). В конъюнкцию и0 функции т), из которой образовалась и1, должны входить лишь переменные, встречающиеся в ui или и2, и поэтому, в силу одновременного *) Под пересечением двух конъюнкций будем понимать произведение сомножителей, встречающихся в обеих конъюнкциях.
110 Л. А. ШОЛОМОВ непересечения щ и и2 с и0, щ должна поглощать щ или и2. Это противоречит минимальности представления / (х). Следствие 7.2. Если f (х) = Д (#') V /г (х")» г^<? каждая из функций /t и /2 содержит в своей м. д. н. ф. хотя бы одну конъюнкцию длины не менее 2, и переменные наборов х' и х" не пересекаются, то f (x) не является полностью сравнимой. Доказательство сразу следует из следствия 7.1. Следствие 7. 3. Если f (x) = f{ (xf) f2 (%"), где каждая из функций fi и /2 содержит в своей м. д. н. ф. не меньше двух конъюнкций, и переменные наборов х' и х" не пересекаются, то f (x) не является полностью- сравнимой. Действительно, в силу закона двойственности /*=/* V Я>. Функции ft и fl удовлетворяют условиям следствия 7.2, поэтому /*^5Cft. Отсюда по следствию 3.3 следует доказываемое утверждение. Непосредственно из теоремы 7 можно выявить еще несколько видов функций, не принадлежащих 2К. Так, например, такими являются функции f = yiy2<Pi(z) V г/з^ФгО2)' / = У\ УгФ (z) V УзУь<р(*) V Л (z) н др. (здесь представление / получено из м. д. н. ф. группировкой и вынесением за скобки). Следствия теоремы 7 справедливы для случая однородных (а не только монотонных) функций. § 4. О А>ациклических функциях Поскольку классы полностью сравнимых и пороговых функций не совпадают, были сформулированы более сильные, чем полная сравнимость, необходимые условия для пороговых функций. В частности, Элготом [/] введены понятия ^-ацикличности и полной ацикличности. Условие 2-ацикличности эквивалентно полной сравнимости, а требование 3-ацик- личности более сильно: так, функция Мура /М£ 9Л не удовлетворяет условию 3-ацикличности [3]. Пороговые функции полностью ацикличны. Вин- дером показано, что для любого к существуют /с-ациклические непороговые функции; им же сообщено, что условия полной ацикличности недостаточно для того, чтобы функция была пороговой [9]. Целью этого параграфа является изложение некоторых результатов относительно классов /с-ациклических функций. Будет доказана их /-замкнутость и конечность системы порождающих элементов. Следуя Элготу [3], дадим несколько определений. Пусть задана булева функция / (х) = f (xi, х2, . . ., хп). Определение 8. Будем говорить, что набор а{ предшествует набору а2 (ot!,^ct2 £ {0, 1}п) относительно /, если найдутся два набора ${ и [}2 такие, что /(Р0 = 1, / (р2) = 0 и *) a, + ^ = a2+j2. Такое отношение будем обозначать а{ _Z_> a2. Определение 9. Функция / обладает свойством к-ципличности (к>2), если найдутся наборы аь а2, . .., аг g {0, 1}'\ г</с, такие, что а! Л а2 Л U «г —> а1в В противном случае функция / /с-ациклична. Если свойство /с-ацик- личности справедливо для всех &>2, функция называется полностью ациклической. *) Здесь а + р—сумма наборов в обычном смысле, компоненты ее не обязаны, быть нулями и единицами.
О НЕКОТОРЫХ КЛАССАХ ЛОГИЧЕСКИХ ФУНКЦИЙ 111 Обозначим через /~ и /~ функции, получающиеся из / фиксацией тех компонент at и а2, которыми они различаются. Если выполнено отношение а{ -Z_> a2, найдется набор значений аргументов функций /~ и /~, на котором /£ = 0, а /- = 1. Для 2-цнклической функции / справедливо ах _L> a2 -L, аи т. е. f(T п /(Г несравнимы, и, следовательно, /g9Jl. Если же /£9Ji, то для любых а{ и а2 функции /~ и /~ сравнимы, и поэтому невыполнимо а{ > а2 __> а4. Отсюда следует эквивалентность 2-ацикличности и полной сравнимости [3]. Пусть / — пороговая функция, определяемая линейным неравенством 1(х)^Т. Для наборов сц, а2, рь р2, участвующих в определении 8, справедливо Z^pO > Z (р2) и I (di) + Z (pi) = Z (a2) + (р2)^т. е.^из a4 _Д а2^следует Z (a4) < Z (a2). Предположение, что / Ациклична и с^ _Z> а2 J^.. .-^_> а7. _1> аА, /•<&*, приводит к противоречивой цепочке неравенств Z (a4) < Z (а2) <. . . . .. < Z (аг) < Z (с^). Поэтому пороговые функции полностью ацикличны [3]. Пусть 21 & и 21 — соответственно классы /^-ациклических и полностью ациклических функций. В силу сказанного здесь и ранее Uz)an-2l2iD2l32...2Slft^...22lz:g. Перейдем к задаче распознавания функций из 2Ц с помощью введенных: ранее операций. Теорема 8. При любом &>2 класс 2Ц 1-замкнут. Доказательство. Пусть /i (#i, ..., #n) 6 2Ц. Убедимся, что элементарная подстановка /° не выводит Д за пределы этого класса. Ограничимся рассмотрением случая отождествления переменных Предположим, что Iofi = f (xt, . .., xn_i) /с-циклична и для а4,а2,.... .. ., [аг£ {0,1}п_1, г</с, справедливо сц —> а2 —>. . .—* аг —> аь т. е. (см.^определение 8) найдутся пары наборов (pi,Y2)i (Рг> Уз)» • • • »(Pr-i, Yr), (Pr, Yi) такие, что nli)=/(l2)=.-^=/(Pr) = l,/(Yi) = /(Y2)=^ J cti + Pi=a2 + Y2. a2 + p2 = a3 + ^3...-.ar+Pr = ai + Yi- J Если обозначить через a*, p*, y\ ^-мерные наборы, получающиеся соответственно из at, Pj, yt повторением на п-м месте (п — 1)-й компонентыг легко видеть, что соотношения (15) сохраняются с заменой с^, p^, yt на а*, Р*, у\ и / на /j. Поэтому а* —> а\ —^ . . . —-> а? —> а* , а это противоречит /с-ацикличности функции Д. Теорема доказана. Замечание. Точно так же доказывается /-замкнутость класса полностью ациклических функций. Теорема 9. Порождающие элементы класса 2I& зависят не более чем от — (3^ — 1) аргументов. Доказательство. Пусть функция f (х1ч ...,хп) обладает циклом ctj —> . . . —> ar —> aA длины ?•<& и для наборов р1? . . ., рг, уь . . ., уг выполнены соотношения (15). Сопоставим каждой переменной #/ а-вектор
112 Л. А. ШОЛОМОВ вхождений а3 = (а), а2,-,. . ., а'), i-я компонента которого совпадает со значением Xj в наборе at. Аналогично определим (5- и у-векторы вхождений этой переменной: р7 = (Р}, . . ., р$), yj = (у), .. ., у)). Если у двух переменных одинаковы а- и р-векторы, то они имеют общий у-вектор; последний однозначно определяется по а - и Р-векторам из соотношений (15). Иногда нам будет удобно вместо а3 рассматривать набор ajj = (aj, . .., aj, aj+1), получающийся из а3 повторением на (г+1)-м месте первой компоненты. Разобьем переменные хи ...,хп на группы S^ S2, ,..,St, отнеся в Si (I = 1, . . ., t) переменные #1?г, #2,z» . . • > хщЛ с одинаковыми а- и р~ве- кторами вхождений. Прежде чем оценить максимальное число таких трупп (или, что то же самое, максимальное число различных пар (a5, {?)), отметим одно свойство, связывающее а- и Р-векторы. Если в aj компоненты а\ и (XJ+1 различны, то pj = aj+1 (по (15)) и, следовательно, определена однозначно. Если же aj = aj+1, то на Pj никаких ограничений не наложено. Вектор aj может быть задан указанием первой компоненты и перечислением номеров разрядов, в которых происходит инверсия (т. е. разрядов, значение которых отлично от непосредственно предшествующих им). Так как первая и последняя компоненты вектора aj совпадают, число инверсий в каждом таком наборе четно. Количество векторов aj, имеющих в точности 2р инверсий Г0</?< -тг \ составляет 2С%Р. Каждому такому вектору может соответствовать 2Г_2Р различных наборов р3 (в г — 2p = q разрядах а}1, а}2, ...,сф набора aj инверсий нет и компоненты Pj1"1, Pj2"1, . . ., Pjg_1 могут быть выбраны произвольно). Общее число различных пар (а3, р3), а следовательно, и число групп St [т] К2^г2р 2Г~2Р - (2 + 1)г + (2- 1)г- Зг +1 <3* +1. Осуществим подстановки / (я^, ..., xPV t \ y{), отождествляющие переменные внутри каждой из групп Si. В результате получим функцию /i (г/i, . ..,*/*), зависящую не более чем 3fe+l аргумента. Пусть Qi = (Й» • • •» Q/)» °t = (ai» • • •» °1)' Ъ = (Ti»• • •' T*) — векторы, ZrKOMnoHeH- ты которых совпадают со значениями переменных из Si соответственно в наборах ab Pj и yt. Как нетрудно убедиться, все соотношения (15) сохраняются с заменой at на Qt, Pi на Oj, уг на Tj и / на /4, т. е. /4 А-циклична. Если а- и р-векторы вхождений, соответствующие некоторой группе переменных Sp, нулевые (как нетрудно видеть, такая пара допустима), то переменные из Sp имеют нулевой у-вектор (см. (15)). Аналогично все три вектора некоторой группы Sq могут оказаться состоящими сплошь из единиц. Осуществив подстановки 1(ур\0) и I(yq\l), придем к функции /2. Пусть, далее, среди групп переменных есть группы St и Sm, у которых взаимно инверсны (т. е. имеют противоположные компоненты) как а-, так и р-векторы. В результате подстановок вида / {уг, ут | zh) придем к функции /3, которая тоже Ациклична (доказывается, как в случае функции /i).
О НЕКОТОРЫХ КЛАССАХ ЛОГИЧЕСКИХ ФУНКЦИЙ 113 Всего различных пар векторов (а5, (У), среди которых нет пар, все 1 i координаты которых одинаковы, и взаимно инверсных пар — -г (3 + 1 —2) = = —(3k — 1), поэтому /3 зависит не более чем от такого количества аргументов. 1 h Функция f (х{, ..., хп), где п > у (3й — 1), не может быть порождающим элементом для 2Ц, ибо в этом случае найдется подстановка /, понижающая число переменных, такая, что // = /3 6 21ft- Теорема доказана. Эта теорема показывает, что система порождающих элементов каждого из классов Ид конечна и для того, чтобы ее найти, достаточно исследовать 1 функции от -7>-(3 —1) аргументов. Как указывалось ранее, эти элементы достаточно сложны. Однако при использовании вычислительных машин (которые нетрудно научить выполнять /-подстановки) метод распознавания функций из 21ft путем приведения к порождающим элементам может оказаться эффективным. ЛИТЕРАТУРА [1] Я б л о н с к и й С. В., Об алгоритмических трудностях синтеза минимальных контактных схем, сб. «Проблемы кибернетики», вып. 2, М., Физматгиз, 1959. [2] К о р о б к о в В. К., Оценка числа монотонных функций алгебры логики, ДАН СССР 150, 4, 1963, 744-747. }3] Е 1 g о t С, Truth function realizable by single threshold organs, Proc. lnd Ann. Symp. on Switching Circuit Theory and Logical Design. AIEE, 1960, 225—245. }4] M u г о g a S., Logical Elements based on a majority decision principle and the complexity of their circuits, J. Inst. Electr. Commun. Engrs. Japan 42, 11, 1959, 993-1000. 15] P a u 1 1 M. C, McCluskey E. I., Boolean functions realizable with single threshold devices, Proc. IRE 48, 7, 1960, 1335—1337. 16] С о a t e s С L., К i г с h n e г R. В., L e w i s P. M., A simplified procedure for the realization of linearly-separable switching functions, IRE Trans. EC-11, 4, 1962, 447. [7] GotoE., Takahasi H., Some theorems useful in threshold logic for enumerating boolean functions, Inform. Proc] 1962, Amsterdam, N. Holland. Publ. Co. 1963, 747-752. [8] С о a t e s С L., L e w i s P. M., Linearly-separable switching functions, J. Francl. Inst. 272, 5, 1961, 366-410. [9] Winder R., More about threshold logic, Proc. 2nd Ann. Symp. on Switching Circuit Theory and Logical Design. AIEE, 1961, 55—64. Поступило в редакцию 26 XI 1963. 8 Проблемы кибернетики, иып. 13
II. ТЕОРИЯ ИНФОРМАЦИИ И КОДИРОВАНИЕ АСИМПТОТИКА ОПТИМАЛЬНОЙ ВЕРОЯТНОСТИ ОШИБКИ ПРИ ПЕРЕДАЧЕ ИНФОРМАЦИИ ПО НЕПРЕРЫВНОМУ СИММЕТРИЧЕСКОМУ КАНАЛУ БЕЗ ПАМЯТИ СО СТИРАНИЕМ М. Е. РАТНЕР (МОСКВА) Исследование асимптотики оптимальной вероятности ошибки при передаче информации по бинарному симметрическому каналу без памяти и по бинарному стирающему каналу без памяти было проведено Элай- сом [1]. Для каналов без памяти с конечным числом состояний на входе и выходе, описываемых симметрической матрицей вероятностей перехода, асимптотика оптимальной вероятности ошибки была получена Добруши- ным [2]. В настоящей работе понятия симметрического канала без памяти с конечным числом символов на входе и выходе и канала без памяти со стиранием переносятся на случай каналов без памяти с любым измеримым пространством символов на входе и выходе. Полученная в работе асимптотика оптимальной вероятности ошибки для таких каналов аналогична найденной Добрушиным в [2] и [5] асимптотике оптимальной вероятности ошибки для дискретных каналов, описываемых симметрической матрицей вероятностей перехода. Оказывается, что существует некоторая скорость передачи Н'сг такая, что 1) при Н > Н'сг удается найти асимптотику оптимальной вероятности ошибки с точностью до константы, 2) при Н = Н'СГ — найти логарифмическую асимптотику, 3) при Н < Н'сг— найти асимптотически не совпадающие нижнюю и верхнюю оценки. В соответствии с терминологией и определениями работы [3] два измеримых пространства (X, Sx) и (У, SY) с заданными на Sx и SY конечными мерами \ix (•) и \iY (•) будем называть пространствами сигналов на входе, соответственно на выходе, стационарного канала бег памяти, описываемого функцией л(х, у), х£Х, y£Y, измеримой относительно а-алгебры SxxSY. При любом фиксированном х£Х функция к(х, у) является плотностью вероятностной меры QX(A), AdSY, абсолютно непрерывной относительно меры \iY (•), и для любого множества A(Z.SY вероятность того, что входной символ х в результате передачи перейдет в выходной символ, принадлежащий множеству А, равна QX(A)= jj я (х, y)\iY(dy). А Будем называть канал связи без памяти симметрическим каналом со стиранием, если описывающая его функция п(х, у) удовлетворяег следующим условиям: 1) Существует измеримое множество Bd.SY такое, что \iY (В) > О и для всех у£В функция л(х, у) = г(у) не зависит от х. Появление 8*
116 М. Е. РАТНЕР на выходе канала символа, принадлежащего множеству 5, будем в дальнейшем интерпретировать как стирание посланного символа, и вероятность стирания равна r=l r(y)\LT(dy). в 2) Пусть т] — случайная величина, принимающая значения в пространстве (У, SY) с распределением QX(A). Требуется, чтобы распределение случайной величины я (х, ц) не зависело от х. 3) На измеримом пространстве (X, Sx) можно построить вероятностную меру рх (•), абсолютно непрерывную относительно меры \хх(-) с плотностью л*(#), такую, что распределение случайной величины л(£, у), где £— случайная величина, принимающая значения в пространстве (X, Sx) с распределением Рх(-), не зависит от у для всех у£В, где В— дополнение множества В до всего пространства У. При г = 0 описанный канал связи без памяти называется симметрическим каналом без памяти с любым измеримым пространством сигналов на входе и выходе. Примерами такого канала являются изученный Элайсом [1] бинарный симметрический канал без памяти, изученный Добрушиным [2] канал без памяти, описываемый симметрической матрицей вероятностей перехода, и рассмотренный Вейсом [4] бинарный полунепрерывный симметрический канал без памяти. Определенный Добрушиным ([2] и [5]) дискретный решетчатый*) канал также является частным случаем описанного канала. В соответствии с [3] информация двух случайных величин £ и £, принимающих значения в пространствах (X, Sx) и (У, SY) соответственно, равна Р ~ (А- X В ) I (£, X) = sup ^ PtX (At X В,) log g<} ^ (д^ , (1) i, i £ где верхняя грань берется по всевозможным разбиениям {At} пространства X и всевозможным разбиениям {Bj} пространства У. Нетрудно показать, что если случайные величины £ и £ связаны описанным каналом связи, то мера Р ^ (•) абсолютно непрерывна относительно меры Рг X Pv (•) с плотностью -—п^ у^ . Тогда выражение (1) приводит- С ; V ' Jji(*,y)Pc(d*) ся к виду /(£,£) = $ я (я, у) log ^^- Рс X u.r (cte, cfo) (2) XxY и пропускная способность канала равна C' = sup J я(я, y)log^>-P£xM^, dy). (3) *) Канал называется решетчатым с шагом с?>0, если существует набор целых чисел mit ..., т$ и число D такие, что для всех £, для которых рц Ф О, logPii = ^ + mjc?, причем наибольший общий делитель чисел т4, ..., wjy равен 1. Если это не верно ни для какого d>0, то канал называется нерешетчатым.
АСИМПТОТИКА ОПТИМАЛЬНОЙ ВЕРОЯТНОСТИ ОШИБКИ 117 Здесь в выражениях (2) и (3) функция я (у) равна: я(у)=$я(а, y)Pl(dx), (4) X I я(у)11у((1у) = 1, (5) Y и верхняя грань в (3) берется по всем мерам Рг (•) в пространстве (X, Sx). Пусть пропускная способность нашего канала конечна (для этого достаточно предположить существование конечного первого момента распределения случайных величин я (х, ц) и я(|, г/), фигурирующих в свойствах 2) и 3) функции я (х, у)). Покажем, что верхняя грань в (3) достигается, если распределение на входе есть Рх (•) и пропускная способность равна C' = (l_r)$^log^M<W. (6) В Действительно, равенство (3) можно переписать так: C" = sup[M{M{logrt(£, i\)\l = x}}—Mlogn(i\)]. (7) Из свойства 2) функции я (я, у) следует, что Af {logjt(g, т)) | £=--£} = const < оо. (8) Из (7) и (8) следует, что пропускная способность равна С'= \ я (я, y)]ogn(x,y)pT(dy)—\ r(y)logr(y)iiY(dy) + Y В + SUp{"~S лМ1о8л(У) • Md*/)} • (9) ~в Легко показать, что верхняя грань в (9) достигается, когда Р^ (•) таково, что я (г/) = const, г/ £ £. Если Pt(-) = PX(-), то из (4) и (5) видно, что ,, ч \ г (у), у^В, Выражение (9) при Р^(-) = РХ{.) можно переписать в виде (6); высказанное утверждение доказано. Яространством слов на входе (выходе) канала без памяти длины п будем называть пространство Е{п) (соответственно Е1п)) всех последовательностей (хг±, . .., Хгп) (соответственно (z/;i, .. ., г/;п)), составленных из входных символов Xik б X, & = 1, . .., п (выходных символов yjk б У, & = 1, . . ., п): Пусть пространство Ет (соответственно Ein)) есть n-кратное произведение на себя измеримого пространства (X, Sx) (соответственно Y, SY)~ Определим в пространстве Еш меру \1дШ(А), A[CZSyX ... X SY, так, что для множеств вида А = Ai х ... X Ап\ AtczSy она равна ^<п) (А) = = |Ху (Л4).. ,(1Г (Ап), а на остальные множества продолжена естественным образом. Исходя из предположения об отсутствии памяти в канале связи, для любого фиксированного слова е£Еш; е = (xix, .. ., Xin) на входе
118 М. Е. РАТНЕР будем рассматривать в пространстве Ет меру (?(х. ,...,*. ) (•), абсолютно г1 *п непрерывную относительно меры \1дш (•) с плотностью Р (e/e) = n(xil, yh).. .n(xin, yjn), (10) где е£ Е{п) и е = (i/;i, . . ., i/jn)'; У]к£У, Л = 1, ..., п. Плотность /? (е/е) будем называть плотностью вероятности того, что входное слово е перейдет в результате передачи в слово е на выходе. Способом передачи К сообщений за время п будем называть совокупность кода, представляющего набор И = (еь ..., еК), ег£ Е<п), I = 1,... ..., К, и метода декодирования, задаваемого системой измеримых функций rt (e), i = l, ...,К, е£Еш, таких, что rt(e)^0 и г=1 Вероятностью ошибки для кода St назовем 1С />'(2l)=inf^2 J Р(ё/в0 [l-r,(i)]^(n,(de)f (И) i=1 ёея(п) где нижняя грань берется по всем методам декодирования. Нетрудно показать, что нижняя грань в выражении (11) достигается, в частности, если метод декодирования следующий: 0, если max p (e/ej) Ф р (е/ег), "-■•* - . (12) —— , если max p {e/ei} = p (e/et), где v (e)—число тех et, для которых max p (e/ei) = p {e/ei}. 1=1, ...,К Оптимальной вероятностью ошибки назовем Рп{К) = т1Р'{Щ, И где нижняя грань берется по всем кода№ 9L Фиксировав число К, рассмотрим совокупность К независимых, одинаково распределенных случайных величин а7}, . .., а\, принимающих значения в пространстве слов Е{п) на входе. При этом будем предполагать, что случайные величины a?, i = l, ...,К, образуются так: а?=(Й, .. ., li), где ££, i = 1, . .., К, к = 1, . .., п, независимы, одинаково распределены, принимают значения в пространстве (X, Sx) с распределением Рх(*)- Набор 21 = (а?, ..., <х#) назовем случайным кодом. Осредненной вероятностью ошибки назовем математическое ожидание Р'п{К)=М{Р'{$)}. (13) Очевидно, что Р'п(К)<Р'п(К). Для формулировки основного результата нам понадобятся следующие обозначения. П (ё)
АСИМПТОТИКА ОПТИМАЛЬНОЙ ВЕРОЯТНОСТИ ОШИБКИ 119 Пусть С—пропускная способность канала, определенная по"(6); Кп = [епИ], Д(Л)=5 [^z^]h^(x)]ix(dx), у,ев, X m{h) = £±2!LH±, e>(k) = d-^, H'cr № (т)<- г) г+т ft) (1-г) Нсг, где Ясг = -1т(1)-1оел(|) Пусть, далее, число m определяется из соотношения Р {£i + ... + In > log m] =•• -^ , где ^ — независимые, одинаково распределенные случайные7величины, определенные в пространстве (X, Sx) и принимающие" значения log я (я, г/i), z/igY, с плотностью Jt* (x) меры Р^ относительно меры \хх. Обозначим через Рп (Кп) jP{Yi+-..+Yn<tog™b где \j — независимые, одинаково распределенные случайные величины, определенные в пространстве (X, Sx) и принимающие значения log я (я, у^) с распределением, имеющим плотность я* (я) л (х, у^ относительно меры |хх. Обозначим через Р'п (Кп) ЪС7{\-г)™гп«-Е)Рпг{Кп). 8=0 (14) Пусть, далее, величины ан и h0 определяются из системы уравнений Н log R (h0) — h0m (h0) = — _ (1-г)[Д(Щ]ло ан — 1 . r+[*(uo)]Nl-'-) Введем следующие константы. Пусть <*н (15).
120 М. Е. РАТНЕР Для нерешетчатого канала со стиранием положим: [У 2л k0o(h0)] ь°т(2-т) m Ia„ = „ =г-———„ , ° , где В = н У2пан (1 — ан) (1 — А0) a (А0) У В _ i-i- j = [V2nh0o(h0)] h° -аН У2шн (1—ан) (1—*о) a (А0) У В а2(Ао)Л?ан (16) 1 У" (Л) при Н = Н'С1 при Н < Н'сг, (17) а для решетчатого канала со стиранием с шагом d положим: 1--L [y2n-d(l-e-h°d)o(h0)] ЛоГ(^2-1)(1+ап) аН = у 2nd (1—е-<1-"»> d) ст (Ао) УВаа (1—а^) _ГК2яа(А0)(1-еЛ^)"| где 0>а„>— (1 — e-2<*(i-fto)), i _ d(i+Qn) (18) (А0) (l-e"°d) "[ftp ' _ ====== <* J ]/2яа(Л0) (1—e-(l-"o)d) уван(1—ан) ' где |8„|<1 — e-h"d, <*(1.+ P„) /6 = ; ^a (y)(l-«~2 ) 2rf(l + Pn) K„CT ^^(i_e_2d) при H = H'cr, при Я < H'cr, где 0>р»>-(1-е 2). (19) Предположим, что случайные величины я (re, т]) и я(|, г/), фигурирующие в свойствах 2) и 3) функции л(х, у), имеют конечные первые три момента. Теорема. 1. При любом И, удовлетворяющем соотношению Н'сг < # < С", и гс —> оо Р'п(Кп)=1ан(пан) 2/l°exp|n [aH (logR (h0) + (1 -h0) m (h0)) + + aHlog^ + (l-aH)\og^-]} (l + o(l)). 2. #/?& любом Н таком, что 0<//<#сГ, и п—>оэ ?'п(Кп) = 1ь(пЬ) 5exp{n[tf + 2blogtf(i.) + blog^ + + (1 -Ь) log ^]} (l + o(l)). 3. Справедливо неравенство Р'п(Кп)<Р'п(Кп). (20)
АСИМПТОТИКА ОПТИМАЛЬНОЙ ВЕРОЯТНОСТИ ОШИБКИ 121 4. При любом Н из интервала 0 < /У < С" и п—>со i_ Рп (Кп) = IaH (naH) 2л° exp {n [ aH (log i? (А0) + (1 - А0) m (А0)) + + aHlog^+(l-aH)logi:^]} (1 + о(1)). (21). В доказательстве сформулированной теоремы будут использоваться результаты двух следующих лемм. Первая из них устанавливает асимптотику оптимальной вероятности ошибки для симметрического канала без памяти с любым измеримым пространством символов на входе и выходе, описываемого функцией я (я, у), удовлетворяющей свойствам 1, 2 и 3 с г = 0. Пусть С — пропускная способность этого канала. Пусть,, далее, Д(А)=$ ln(x,yi)]h^*(x)[ix(dx), y^Y, X , 7 ч d log R (h) о , 7 ч rfw (/г) 171 (/г) = dJT^ , a2 (A) = dfc Положим //cr = im(i-)-log/?(-i). (22> Лемма 1. 1. При любом Н таком, что 7УСГ <//< С, и п—>оо Рп (Kn)=In 2/loexp{n[logi?(Ao) + (l^A0)m(Ao)]}(l + o(l)), где А0 определяется из уравнения H+\ogR(h0)-h0m(h0)=0, имеющего единственное решение, и 1 -6 Г Г [ 9 (23> 7= [■К2яА0а(А0)]Ло "3г(^2-1) /2л (1 — Л0)а(Л0) в нерешетчатом случае, г^-з [|/"2я d (l—e-h°d) a (h0)]h° Г ( 2—i -^(1+ап), /2яй(1—е-й(1-л°>)а(Л0) ^ где 0>ап>—(1 — е-ы^-п^)у в решетчатом случае. 2. При любом Н таком, что 0<//"<Ясг, и п—>со _i Рп(Кп)=7п ~2exp{n[# + 21ogi?(-i)]} (1 + о(1)), (24> где в случае нерешетчатого канала 1 /ж /»а(1) гс/?и Н = НСГ, при Н < Ясг,
122 М. Е. РАТНЕР •а в случае решетчатого канала с шагом d 1 = d(l + Pn) /А /йа(1)(1 2d(l + pn) 4* при Н = НСТ, при Я < Ясг, 0>р„> — (1 —е *) тЛзга(т)(1_е * ) 3. Справедливо неравенство Рп(Кп)<Рп(Кп). 4. Яри любом Я из интервала 0<Я<С к п—> оо i_ Pn(Kn) = In 2ft°exp{n [log Д(/г0) + (1-Й0)т (/*„)]} (l + o(l)), (25) (26) еде /=1 [2T^2itfe0a(Ao)] л° 2 ]/"2я(1—Л0)ст(1—А0) для нерешетчатого канала, ,4-i ГУ2по(к0)(1—е-ь**) 1ло <*(1+8д) L rf J У 2л a (ho) (1 — e-d^-ho)) ' | 0П | < 1 — e_,lod, 9ДЛ решетчатого канала с шагом d. Доказательство этой леммы полностью аналогично доказательству «соответствующей теоремы в [5] и потому здесь не приводится. В дальнейшем всюду будем выбирать оптимальный метод декодирования, определенный в (12). Исследуем определенную по (13) осреднен- ную вероятность ошибки. Для этого рассмотрим симметрический канал •без памяти, имеющий пространства символов на входе и выходе соответственно (X, Sx, \ix) и (5, S-fi, И^) (здесь S^ — а-алгебра, порожденная множеством В), описываемый функцией ,_ у , у £В. Этот канал в дальнейшем мы будем называть условным симметрическим каналом, соответствующим рассматриваемому стирающему каналу. Пусть С — его пропускная способность. Из (6) видно, что С" = (1-г)С. (27) В дальнейшем штрихованные обозначения относятся к стирающему каналу, а нештрихованные — к условному симметрическому каналу. Докажем теперь следующую лемму. Лемма 2. Справедливо соотношение К(Кп) = 2 СТ (l-r)ner^-')Pne(Kn), (28) 8=0 -где суммирование производится лишь по всем тем е от 0 до 1, для которых пг целое. Рпе (Кп) в выражении (28) означает осредненную вероятность ошибки случайного кода длиной пе и объема Кп, передаваемого по условному ■симметрическому каналу. Доказательство леммы 2. Ввиду того, что случайные величины а*, участвующие в построении случайного кода, независимы
АСИМПТОТИКА ОПТИМАЛЬНОЙ ВЕРОЯТНОСТИ ОШИБКИ 123 и одинаково распределены, и определение (12) симметрично относительно индекса /, осредненная вероятность ошибки Р'п (Кп) равна Рп(Кп)= J MfrCe^eJll-rlCe^ft'WPswide'). (29) Здесь и всюду в дальнейшем Е'{П) и#(П) соответственно означают пространства слов на выходе длины п стирающего и условного симметрического каналов. Интеграл в (29) можно переписать так: 1 Р'п (Кп) = ^ I M {p (e'/et) [1 - г[ (?, Я')]} рш>т (d?), (30) е=0 ^.е где Ае—множество слов е' на выходе стирающего канала (АгаЕ'(П)), имеющих каждое ровно пг символов из множества В. Обозначим через В* множество слов е на выходе стирающего канала, имеющих ровно пг символов из множества В на фиксированных пг местах. Тогда из (30), очевидно, следует, что 1 ?;(£„) = 2 С8$ М{?№)[!-г;(?, W)]} u^<n> (<£')• (31) е=0 де Имея в виду (10) и свойства функции л(х, у), соотношение (31) можно переписать так: 1 Р'п (Кп) = ^ CVn(,-e) J M {P (eW/ed [1 - г, (е(™>, #<пе>)]} \1Шпе) (&<»«>). е=0 ]Ё(ле) (32) Здесь 21 пе) — случайный код длины пг и объема Кп, полученный описанным выше способом, а г1(е(пе\ И(пе)) — функция декодирования, определенная по (12). Ввиду свойств функции л(х, у) очевидно, что r[(e\ И')=Мё(пв\ ^е). Для завершения доказательства леммы остается умножить и разделить (32) на (1-г)пе. Доказательство теоремы 1. Вернемся к формуле (28) для осредненной вероятности ошибки Р'п(Кп). Чтобы к осредненной вероятности ошибки Рпе(Кп) применить лемму 1, нужно потребовать, чтобы скорость передачи — не превосходила пропускной способности С условного симметрического канала; т. е. результат леммы 1 можно применить лишь ко всем тем членам суммы (28), которые соответствуют значениям е: е1<е<1, где е1==^ . (33) По условию теоремы #<С", и из (27) следует #<(1-г)С. (34) Из (33) и (34) следует, что е1<1 —г. (35)
124 М. Е. PATHEP Разобьем теперь сумму (28) на две суммы: P'n(Kn) = Il + I2, где /i = 2l Сппе(1-г)пег^-*Рпе(Кп), (36) е=0 /2= 2 С™(1-г)пег^-*)Рпе(Кп). (37) , 1 8=81+ - П Исследуем сумму /2. Из леммы 1 следует, что если н н НСТ< — <С, т.е. е1<е<7^, то к осредненной вероятности ошибки РПе(Кп) применима формула (23). Если же 0<^<ЯСГ, т. е. -Я_<е<1, то к осредненной вероятности ошибки применима формула (24). Сумму /2г определенную выражением (37), представим в виде где я 1 /;= °S псГ(1-г)пег«(1-^пе(л:п), (38) /;= S HC(i-rK(1-\(q. (39) Исследуем сумму /g. К осредненной вероятности ошибки Pne (#п), стоящей н под знаком этой суммы, применим формулу (23). Пусть сначала-^- < 1. **сг Рассмотрим функцию ф(е), стоящую под знаком суммы Г2\ 1 Ф (е) = С™ (1 - r)ner^-*)Ie (m) 2ho exp {m [log R (А*) + (1 —Л«) m (А*)]}. Здесь hi определяется из уравнения Я 8 + logR(hl)-hlm(h*)=0. (40) При достаточно больших п, пользуясь формулой Стирлинга, имеем: СГ= г- * e-n[eloge+(l-e)log(l-e)](l + Q(l\)) (41) у п у 2яе (1—е) где о (1) равномерно по е в любом отрезке, лежащем строго внутри отрезка [0, 1]. Отсюда i_ — 2Ле ф(«)=7;^^)«р{»[е(1овЛ(А» + (1-А8)т(АЭ) + + в log '-=-' + (1 - е) log ^ ] } (1 + о (1)).
АСИМПТОТИКА ОПТИМАЛЬНОЙ ВЕРОЯТНОСТИ ОШИБКИ 125 Обозначим: А(г)=еп1Р(*\ (42) F(t) = * [log Л (AS) + (1-Ag) m (h^)] + e log ^+ (1 - e) log^ . (43) Покажем, что функция F (e) достигает абсолютного максимума на отрезке ■ei<e<l. Ее первая производная равна F' (е) = log R (h*) -t- (1 - A") /я (/г*) + ^ (/г* - 1) + log (1~r)re(1~e) . (44) Нетрудно видеть, что функция F' (е) на отрезке [е1? 1] меняет знак. тт Действительно, если в уравнении (40) г = г1, то — = С согласно (33) и AJ = 1. Тогда r(ei) = log(1-r^1-e')>0. При е —> 1 /" (е) —» — оо. Изучим вторую производную: ^ ~~ ~~о2(Ле)(Ле)зез < °- Функция JF (е) достигает максимума в некоторой точке ан, лежащей на отрезке [et, 1] и обращающей в нуль выражение (44). Оценим далее сумму Г2, определенную в (38). Используя обозначения (42) и (43), ее можно переписать так: 1 я 1 1 /е (не) Her « ___ 2/ig Допустим, что И таково, что 0<Н< тт 12 г- н_ гсг -Рассмотрим окрестность точки ан вида (ан —n~°'5+6; ан + д-°'5+6), О < б < 0,5, например окрестность (ан — п-0'4; ан + n-0'4). Тогда (45) представим в виде 1 1 1 ан-п -0,4 -" 2Л« аН+п °' 4 _ 2/1* e=ei+- е=ая-п °>4+п п _Н_ _ А 1_ ЯСг п _ 2/ге X-4(e) (1 + о(1))+ 2 ^=ЙЦг^А(е^1 + 0(1))- (46) _л „ V пу2ле(\— е) е=ая+п и>4 // 1 // 1 Так как по предположению =- < 1 и е-4Н <е<-~ , то член о(1) в (45) и (46) равномерен по е, и поэтому его можно вынести за знак 7е"2То суммы. Пользуясь непрерывностью функции 1% = g = и разложе- У 2яе( 1—е)
126 М. Е. РАТНЕР нием п о в ряд Тейлора в точке ан, вторую сумму в (46) можно представить в виде ая+п~м _ ~ "^ 1 VI /е (*в) ° Тп S_nj 9^=54(8) (i+o(i)) = ан+п-°>* е=ан—п °>4 (1 + о(1))^=7вя(пан) 2h» H-J= 2 е^) = /. (47) е=атт—п °»4 Помня, что /т'(ан)=0, разложим eF№ по формуле Тейлора в точке ан. Сделаем замену г=ан — б, где б меняется от — га-0»4 до я-0»4 . Тогда е*Х«н-»> = /(а«)+ Ч- 62+0(вз>. (48) Рассмотрим сумму п—0,4 nF"(arr)62 1 ^1 ^—+п0(б3) J* = ^z S * • (49> Сделав замену переменных получим из (49) /*= 2 оо F"(aH) V^W = (l + o(l)) J e 2 Zdz = (l + o(l)) /-^.= (l + o(l))/§. — OQ (50) Здесь мы воспользовались тем, что F" (ан) < 0. Из (47), (48), (50) следует, что J=IaH(naH) 2h0e J=, (51) где Та определяется выражениями (15) и (17). Для первой и третьей сумм в (46) справедливо я I 0Я~П ' Her n (i+o(i)) 2 фоо+(i+o(i)) 2 ф(£)< 8=ei+ - e=aH4-n-°>4 п „0,2 < пКепПа^ eF"<aH^'' = о (J). (52) тт Если тг— >1, то третью сумму в (46) можно записать так: S ф(е) = S Ф(е)+ 2 Ф(е), (53) 8=aH+n_0>4 e=aH+n-0.* e=l-s
АСИМПТОТИКА ОПТИМАЛЬНОЙ ВЕРОЯТНОСТИ ОШИБКИ 127 где s > 0 — достаточно малое число и 1 — s>aH. Первую сумму в выражении (53) можно оценить так же, как и суммы в (52), а для второй суммы в выражении (53) справедливо 1 1 S y(e)<KnCZ(i-s)(l-r)n(1-s)rnsn 2ho s ехр{л (1- s) [log Д(А*-') + + (1 - AJ-) m (AJ-)]} < Ksie^s) = o(J). (54), Из (46), (51), (52), (54) получаем, что i_ Г2 = ~iaH (naH)2h° exp |я [ aH (log Д (A0) + (1 - A0) m (A0)) + + flHlogl^+(l-aH)log-I=^F]} (1 + 0(1)), где 7a определяется выражениями (16) и (18). Рассмотрим, далее, сумму 1и определенную в (36). Так как верно (35)у. то имеет место неравенство h<nCn[ nj(l-r) [ n)r l n). (55), Обозначим, далее, через Fi (e) выражение F (е) - е log Ц^ - (1 - е) log j-^ , где /'(е) определено по (43). По формуле Стирлинга (41) имеем: n(ei+-J w(ei+-) nil—ei ) ^/2я(в1 + 1)(1-81-1) (56> Ввиду (33) и (40) при е—^б! имеем, что /\(е)—>0. Поэтому найдется такое Ni, что где т] > 0 таково, что F(*i)<F((Ih)-i\. Найдется, далее, такое N2, что Пусть N = m&x(N1, ЛГ2). Тогда из (57) и (58) имеем, что F(** + Zr)-Fi(.*1 + 7r)<F{aH)—T- (59> Сравнивая (55), (56) и (59) получим, что /, = о(/;). Осталась неисследованной сумма Г'2, определенная в (39). К выражению Рпе(Кп), стоящему под знаком этой суммы, применимо асимптотическое равенство (24).
128 М. Е. PATHEP Введем обозначения: 5(e) = exp{n[6(^ + 21ogjR(ij)+ "j + elog1-^ + (l-e)logj^i]} , j- (60) e(e) = e[f + 21ogi?(i-)]+elogi=-r + (l-6)logl^-8. j 'Покажем, что функция Q (e) достигает максимума в некоторой точке •Ь£[Е1, 1]. Действительно, ее первая производная, равная 21og*m+log(1-t(1-e), (61) 2 J ' S Г8 меняет знак на отрезке [еь 1], а вторая производная ()"(е)= J_<0. V V / 8 (1—8) ^ Следовательно, функция () (е) достигает максимума в некоторой точке 6, обращающей в нуль выражение (61). Значение Ъ легко вычисляется: Н-Д». 2 £■>-» Проводя исследования, аналогичные исследованиям суммы Г2, можно показать, что _ 1 Гл=7ь(пЬ) '2exV{n\H + 2blogR^ + blog^ + + (l-6)log^]} (1 + о(1)), где 1Ъ определяется по (17) и (19). Сравним теперь функции А (е) и В (г) из выражений (42) и (60). тт Из леммы 1 следует, что если Н таково, что — > НСГ, то м Если же Н таково, чго — < Ясг, то ан В(Ь) = о[А(ан)]. <#сг, то А(ан) = о[В(Ь)]. IX Обозначим через Н'сг такое значение Я, для которого —=//сг.Это значение Н'сг легко вычислить, если приравнять нулю выражение (44) ТТ' и вместо е подставить -^- ; при этом из (22) и (40) вытекает, что Щ = 1 н' = — при г=-^-. Оно оказывается равным 2 Г нст г- г+Л2Ст)(1_,') Тогда при Н = Н'СТ получаем, что ая = ^=Ь и А(ан) = В(Ь).
АСИМПТОТИКА ОПТИМАЛЬНОЙ ВЕРОЯТНОСТИ ОШИБКИ 129 Из проведенных рассуждений следует доказательство первой части теоремы, устанавливающей асимптотику верхней оценки для оптимальной вероятности ошибки. Чтобы получить нижнюю оценку для оптимальной вероятности ошибки, рассмотрим величину Р'п(Кп), определенную в (14). Докажем справедливость неравенства (20). Действительно, из (11), очевидно, следует, что Кп 1 P'W = ^2 2 J Р(е'/е±)[1~гЦё; И)] ,iiw (<£'), (62) г=1 е=0 ^е где ЛЕ, как и раньше, множество тех слов е на выходе стирающего канала, которые имеют ровно пг символов из множества В. Ввиду (10) и свойств функции я(х, у) выражение (62) можно переписать так: р/(я)=г2 2 /•«<!-*> (1-о* X г=1 е=0 XS l 7гЗг[1-Г^П8' ЯП]^е(^ве). (63) Здесь 2tje — код, полученный из кода 21 отбрасыванием /г(1-е) стирающихся компонент на фиксированных лг (1 — е) местах. Очевидно, что для всех / справедливо Из (11) следует, что интеграл в (63) равен вероятности ошибки Р (Щ ) при передаче кода Ще длины пг и объема Кп по условному симметрическому каналу. Но для любого такого кода 51"е, /==1, ...,СпЕ, справедливо (25). Поэтому из (25) и (26) получаем: Р' (Щ > 2 СТ (i-r)ner^-^Pne (Kn), (64) Е = 0 гдь 1_ 1) Рпе(Кп) = 1е(пг) 2/1о ехр {/г[1оВД (Aj) + (1-Ag) m(ftg)]} (1 + о(1)) при п —>оо, 2) h\ удовлетворяет уравнению (40) и , л? [2г/2л7г!а(Л5)] ° -" " v " для нерешетчатого канала, 2/2я(1—й0Е)а(1—Ле0) 3) 1е = \ __ >вл Л_1 - I 1-1^(1—«-fto")q(Ag) -jftg d(l+6ra) t. |0Л|<1— e~h°d, для решетчатого канала. Из (14) и (64), очевидно, следует справедливость неравенства (20). Проводя выкладки, аналогичные выкладкам при оценке суммы (47), получим асимптотическое выражение (21). Теорема доказана. Автор глубоко благодарит Роланда Львовича Добрушина за постановку задачи и руководство работой. 9 Проблемы кибернетики, вып. 13
130 М. Е. РАТНЕР ЛИТЕРАТУРА [1] Е 1 i a s P., Coding for two noisy channels, Inf. Theory 3rd London Sympos., 1955, Lnd, 1956, 61—74 (русский перевод: сб. «Теория передачи сообщений», 1957, 114—139). [2] Д о б р у ш и н Р. Л., Асимптотика вероятностей ошибок при передаче информации по каналу без памяти с симметрической матрицей вероятностей перехода, ДАН СССР 133, 2, 1960, 265-268. [3] Добрушин Р. Л., Общая формулировка основной теоремы Шеннона в теории информации, УМН XIV, 6, 1959, 3-104. [4] Weiss L., On the strong converse coding theorem, Quarterly of Applied Mathematics 18, 3, 1960, 209—214. [5] Д о б р у hi и н Р. Л., Асимптотика оптимальной вероятности ошибки при передаче информации по дискретному каналу без памяти с симметрической матрицей вероятностей перехода, Теория вероятностей и ее применения VII, 3, 1962, 283-311. Поступило в редакцию 4 IV 1963.
LIL ТЕОРИЯ ИГР ОБ АВТОМАТИЧЕСКОЙ ВЫРАБОТКЕ ОЦЕНКИ СИТУАЦИИ ПРИ ИГРЕ В КРЕСТИКИ И НУЛИКИ С. Л. АМБАР ЯН, X. К. БРУТЯН, Т. М. ТЕР-МИКАЭЛЯН (ЕРЕВАН) § 1. Принцип оценки ситуации В работе [1] был описан метод игры в крестики и нулики между человеком и машиной, при котором каждая свободная клетка игральной доски получала некоторую цену и машина в качестве своего очередного хода выбирала клетку с максимальной ценой. При этом правила выработки цены, а также величины самих оценок были в готовом виде сообщены машине. В настоящей заметке эти правила также составлены авторами, но, в отличие от предыдущей работы, величины оценок заранее неизвестны и определяются самой машиной в процессе ее «обучения». В рассматриваемом случае игра ведется на поле, полученном обычным склеиванием квадратной доски (размером 8 на 8 клеток) в тор. Линиями на поле называются замкнутые цепочки клеток, полученные соответственно от склеивания столбцов, строк и обеих систем «диагональных» линий квадрата. Таким образом, каждая из клеток тора входит в четыре различные линии, причем каждая из них содержит восемь клеток. Один из партнеров выбирает знак крестик (х), а другой —нулик (О). Игра заключается в серии ходов, выполняемых поочередно противниками. Каждый ход состоит в занятии играющим своим знаком одной из свободных клеток игрального поля. Один из играющих начинает игру, которая заканчивается, когда на какой-нибудь линии образуются пять клеток подряд, занятых одним и тем же знаком. Выигравшим считается тот из игроков, которому принадлежит этот знак. (Пример пяти клеток, расположенных подряд на одной линии и занятых знаком X ,изображен на рис. 1.) Основной принцип выбора очередного хода машиной заключается в том, что каждая свободная клетка доски получает некоторую цену. Машина выбирает ту из клеток, цена которой оказывается наибольшей, а если таких несколько, то выбор одной из них считается несущественным и определяется особенностями программы. При выработке цены некоторой клетки машина в одинаковой степени учитывает ценность этой: клетки и для нее самой и для ее противника. Иными словами, машина X X X X X 9*
132 С. Л. АМБАРЯН, X. К. БРУТЯН, Т. М. ТЕР-МИКАЭЛЯН как бы старается, во-первых, поскорее выиграть игру и, во-вторых, не дать своему противнику сделать того же. Алгоритм выработки цены состоит из ряда проверок, в результате которых одна и та же свободная клетка получает различные оценки. Все полученные оценки одной клетки складываются, и таким образом получается итоговая цена каждой свободной клетки; по этой цене машина и выбирает свой очередной ход. Опишем подробно метод образования цены свободной клетки. Рассмотрим пять клеток, расположенных подряд на одной и той же линии (будем называть такие клетки «пятерка»). Если среди этих клеток имеются хотя бы две клетки, занятые разными знаками, то все свободные клетки этой пятерки получают оценку нуль. В противном случае, т. е. когда в «пятерке» нет клеток, занятых разными знаками, если в этой пятерке имеется 5 — /с, к = 0, 1, 2, 3, 4, свободных клеток, то оценку каждой из них обозначим Ah. Таким образом, мы получаем пять положительных, вообще говоря различных, оценок: А0, Аи А2, А3, Л4, соответственно с тем, имеется ли в «пятерке» пять, четыре, три, две или одна свободная клетка. Рассмотрим какую-нибудь свободную клетку а игрального поля и одну из четырех линий Г* , i = 1, 2, 3, 4, проходящих через данную клетку. На этой линии имеется пять различных «пятерок», которым принадлежит а. Каждая из этих «пятерок» сопоставляет клетке а одну оценку, сумму которых мы обозначим через SK Легко видеть, что для клетки, заштрихованной на рис. 2, эта сумма равна Ai-\-A2-\-Аг. Наконец, через & а = За + За + ^а + & а мы обозначим сумму чисел Sla для каждой из четырех линий Tt, проходящих через а. Число Sa называется ценой клетки а при данной ситуации на игральном поле. Как указывалось выше, машина для определения очередного хода вычисляет цену каждой свободной клетки и из их числа выбирает клетку с максимальной ценой. Отметим прежде всего два недостатка описанного алгоритма игры. Первый из них заключается в том, что величины оценок А0, Аи А2, А3, 44 не зависят от характера линии. Между тем очевидно, что, например, две стоящие подряд клетки имеют различное число «соседних» клеток (заштрихованные клетки на рис. 3) в зависимости от того, расположены ли они на диагонали или на строке или столбце. Исходя из этих соображений, можно ожидать, что оценки для диагональных линий оказались бы несколько выше. Чтобы понять суть второго недостатка, рассмотрим ситуацию, изображенную на рис. 4, считая, что сейчас ход «крестика». Если обозначить через а клетку а4 и через р — клетку f8, то легко видеть, что Sa = ZAQ + lA, + ZA2+2Az, $э = 1040 + 242 + 4з. Естественно предположить, что имеют место неравенства 40<41<42<43<44, а тогда Sa-Sfi = lAi-7A0 + GA2 + A3>6A2 + A3>0. 0)Ш I0I0IX
ОБ АВТОМАТИЧЕСКОЙ ВЫРАБОТКЕ ОЦЕНКИ СИТУАЦИИ 133 Таким образом, независимо от величины оценок машина выберет клетку а. В ответ на этот ход «нулик» занимает клетку d3 или h7 и получает четыре подряд занятые им клетки, что в данной ситуации обеспечивает ему победу независимо от дальнейшего хода «крестика». Между тем занятие «крестиком» клетки (J обеспечивало бы ему победу, как это видно, например, из партии, описанной в таблице 1. Нужно отметить искусственность (с точки зрения поведения «крестика») разобранной ситуации. Ясно, что при хорошо подобран-; ной системе оценок «крестики» не довели бы до изображенной на рис. 4 позиции. Заметим, что вообще алгоритм описанного типа не столько стремится поскорее занять своим знаком пять клеток подряд, сколько заботится о том, чтобы иметь на поле как можно больше перспективных положений. В этом смысле алгоритм оценок с большим успехом может быть Номер хода 9 10 И Таблица 1 X f8! d2! h6 (сЗ) 0 е7 сЗ (L6) i 1 у// % X i % X <22. i У/ V/ ж ^ % I ж X f I X УУ, % 1 1 /Ул 4л © © © X © © © X X © X X X 7-г-т X X © Рис. 3. abcdefgb Рис. 4. применен к игре, в которой игра продолжается до тех пор, пока не будут заняты все клетки поля, и выигравшим считается игрок, набравший большее количество «пятерок», занятых его знаком (см. условия игры работы [1]). § 2. Автоматическая выработка оценок Будем предполагать, что существуют такие численные значения оценок AQ — i44, с помощью которых машина может более или менее «успешно» играть в описанную игру. Перед машиной ставится задача: найти эти значения. Для этого машине (обозначаемой впредь М) предоставляется возможность играть с уже опытным игроком (впредь именуемым «учитель» — У) и под его руководством постепенно вырабатывать «оптимальные» значения оценок. Так как в процессе обучения машине пришлось сыграть большое число партий (порядка 150), то в роли учителя не мог выступать человек, так как на ввод каждого его хода тратилось бы очень много времени. Поэтому «учитель» был программно смоделирован на самой машине. Метод моделирования сильного игрока основан на просмотре возможных продолжений на несколько ходов вперед, но с некоторыми разумными ограничениями. Подробное описание этого метода, представляющего, как кажется авторам, некоторый самостоятельный интерес, приведено в следующем параграфе. Здесь же достаточно
134 С. Л. АМБАРЯН, X. К. БРУТЯН, Т. М. ТЕР-МИКАЭЛЯН отметить, что «учитель», обучающий машину, сам не является «совершенным» игроком, т. е. не умеет выбрать наилучший для каждой данной ситуации ход. Авторам представляется, что именно это имеет место в реальных процессах обучения. Определение оценок было несколько упрощено на основании следующих соображений. В качестве Л0 было взято «маленькое» положительное число, а именно V8, а в качестве Л4 — «большое» число, а именно 214. Следовательно, машина должна была подобрать значения только трех оценок: Л4, Л2, А3. Непосредственно очевидно, что существует бесконечное число различных систем оценок, отличающихся друг от друга на постоянный множитель (при -фиксированных значениях Л0иЛ4). Поэтому одно из трех значений At, A2, А3 может быть взято произвольно (однако внутри интервала (А0, А^)), и машине остается определить только две из этих трех оценок. На основании этих соображений значение А2 было взято равным 32, и, таким образом, задача машины сводилась к определению величин At и А3. Чтобы машина могла начать игру, ей необходимо было иметь какие- то конкретные значения оценок Ai и А3. Непосредственно очевидно, что эти числа должны удовлетворять неравенствам A0<Ai<A2<A3<Ai. Однако, чтобы уменьшить влияние человека на машину, было решено положить .ri^ = -£*2 ~~ ""-3 ~~ *$£. Процесс обучения протекал следующим образом. Машина играла с У партию. При этом после того, как М определяла свой ход, У сообщал машине, какой ход сделал бы он в данной ситуации. Обозначим клетки, выбранные М и У, соответственно буквами а и р. Чтобы понять, насколько удачно сделан выбранный ею ход, машина определяет величины оценок Sa и S$ этих двух клеток; ясно, что Пусть е — некоторое положительное число. Возможны два случая: 1) 5a-$3<ef 2) Sa-Si>z. В первом случае (он включает в себя совпадение ячеек а и (5) машина делает свой ход (т. е. занимает своим знаком выбранную ею клетку а) и следующий ход. делает У. Во втором случае машина изменяет величины оценок ЛА и 43 (см. об этом несколько ниже), увеличивает число е на некоторую константу Ае, и У и М начинают новую игру. Каждая партия может протекать одним из двух способов. Либо на каком-то ходе образуется неравенство $а — £р > е, и тогда партия прерывается и начинается новая партия. Либо это неравенство ни разу не встречается, и тогда партия продолжается до тех пор, пока одна из сторон не проиграет (либо партия кончается ничьей). Если выигрывает У (или если партия кончается ничьей), то величина е уменьшается на константу А^ > Ае и начинается новая партия. Если же выигрывает машина,то задача, поставленная перед ней, считается решенной. Разъясним смысл введенного числа е (в начале обучения е=1, Де = 8, А1е = 16), которое фактически означает, что машина в некоторых
ОБ АВТОМАТИЧЕСКОЙ ВЫРАБОТКЕ ОЦЕНКИ СИТУАЦИИ 135 случаях позволяет себе сделать ход, отличный от хода, рекомендуемого учителем. Сделано это из следующих соображений. 1. Как было указано в предыдущем параграфе, возможен случай, когда никакое изменение оценок не может обусловить выбор какой-то определенной клетки. 2. Учитель, смоделированный на машине (да и вообще любой учитель), может сам допускать ошибки и во всяком случае не всегда выбирает наилучший ход. Следовательно, ученику нет необходимости «слепо» подражать учителю. 3. Машина, повторяя ходы учителя, может в лучшем случае научиться играть в ту же силу, что и учитель. Между тем перед ней стоит задача научиться обыгрывать своего учителя. 4. Наконец, повторение машиной ходов учителя привело бы к тому, что каждый раз разыгрывалась бы одна и та же партия (ибо стратегия учителя постоянна). Между тем отклонение машины от поведения ее учителя создало разнообразие в разыгрывавшихся между ними партиях. При увеличении числа е на величину Ае авторы руководствовались, по существу, теми же соображениями, которые обусловили ввод самой величины е. Уменьшение же е при проигрыше машины очевидно: свобода действий машины была слишком велика. Опишем закон изменения оценок А^ и А3 в случае, когда Sa — 5p > е. Пусть Sa = а0А0 + atA± + а2А2 + а3А3 + а4Л4, 5р = Мо + Mi + М2 + Мз + Mi- Следовательно, ^i(«i — Pi) + [a0^o + M2 + M4 — Mo — Мг — Md > ^з(Рз — <*з), или, обозначая через С величину, взятую в квадратные скобки, и Si = «! — Pi, б3 = Рз — <*з, получаем окончательно: б1Л1 + С>б3Л3. Перед машиной стоит цель: так изменить систему оценок, чтобы цена £р клетки (5 стала если не больше, то хотя бы ближе к цене Sa клетки а. Исходя из этого, в таблице 2 рассмотрены все возможные случаи распределения знаков коэффициентов 6i и б3 и приведены соответствующие изменения оценок А^ и А3. В этой таблице, например, вторая строка означает, что в случае, когда 6i > 0 и 63 = 0, величина А^ уменьшается на ДЛ4, а величина А3 остается без изменения. В качестве величин ДЛ1? ДЛ3, &\А3 были взяты числа 1, 4, 1 соответственно. Практически машине потребовалось сыграть 51 партию, чтобы выработать оценки Л1=12, Л3 = 63, при которых она обыграла своего учителя. Характерно, что в процессе обучения величина е достигла значения 65. Эта партия приведена в таблице 3 (партия № 1). Последовательность изменения оценок А1 и А3 приведена в таблице 4, в которой в четвертом столбце указана величина е и в третьем столбце указано количество сделанных в данной партии ходов. Заметим, что значения величин е, Де, Д^, AAll АА3, ^А3 были в разных экспериментах взяты разными и во всех случаях получался один и тот же результат (изменялось лишь число партий, требующихся для обучения).
136 С. Л. АМБАРЯН, X. К. БРУТЯН, Т. М. ТЕР-МИКАЭЛЯН Таблица 2 «1 о л «о о II «о о V «о бз б3>0 б3=0 63<0 б3>0 б3 = 0 б3<0 б3>0 63 = 0 б3<0 Изменение оценки Ai на величину: — аа^ — AAi — AAi 0 0 0 + bAt + Д^1 + дл, Изменение оценки Аз на величину: + AAi 0 — АИз + ДЛз 0 -АИз -АИз 0 • + АЛ3 Таблица 3 № хода 1 2 3 4 5 6 7 8 9 10 И 12 13 14 15 16 17 18 19 Партия № 1 М А1 = 12 А3=63 а8 а7 с7 Ь6 с5 сЗ d4 е5 d5 f4 d3 g7 ЬЗ g* dl h4 a4 c2 h5 У Ь8 al Ь7 a5 h8 c4 e3 f6 f5 d6 b2 bl h3 cl d2 e4 b4 e8 Проигрыш Партия № 2 Человек сб d7 c8 e6 d5 b7 e2 e4 e8 el e3 M Ai=10 A3=81 g2 b5 c7 bl d6 a8 dl f3 e5 e7 Проигрыш Партия № 3 Человек d4 e5 d6 f3 ЬЗ cl a5 h6 f8 e8 b2 fl g2 h4 Проигрыш M Ai=ll A3=81 e3 сЗ d3 f4 d2 b4 g5 el e2 c2 d8 f2 g3 c7 Партия JNft 4 M Al=ll A3=81 d8 d7 b8 c8 bl e7 dl t'6 a8 a2 h7 d3 d2 Человек c7 d6 cl e8 e6 П сб b7 h8 h3 g6 c2 Проигрыш Партия № 5 M Ai= 10 A8=81 hi gl h3 h2 a3 g8 16 f3 h4 g5 e7 Человек g2 fl a2 Ji8 f8 g7 f2 g3 h5 b2 Проигрыш
ОБ АВТОМАТИЧЕСКОЙ ВЫРАБОТКЕ ОЦЕНКИ СИТУАЦИИ 137 Таблица 4 Л1> партии 1 2 3 4 5 6 7 8 9 К) 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 ■Al 32 31 30 29 28 27 26 25 24 23 22 21 20 20 19 19 19 18 18 17 16 16 16 15 15 15 ^3 32 32 32 32 32 32 32 32 32 36 36 40 40 40 40 40 40 40 40 40 44 44 44 48 48 48 Число ходив 5 5 5 5 5 5 5 5 7 5 7 10 5 10 5 10 5 16 5 7 10 10 7 10 10 5 е 1 9 17 25 33 41 49 57 65 73 81 89 73 81 65 73 57 65 73 81 89 73 57 65 49 33 Результат партии прервана » » » » » » » » » » проигрыш М прервана проигрыш М прервана проигрыш М прервана » » » проигрыш М » » прервана проигрыш М » » прервана х° партии 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 ^i 14 14 13 13 13 13 12 12 12 13 12 13 14 14 14 14 14 14 13 12 12 13 12 12 12 Лз 48 48 52 52 52 52 56 55 54 54 58 58 58 58 58 58 58 58 58 62 61 61 65 64 63 Число ходов 10 7 10 К) 10 7 7 7 19 7 19 19 10 10 10 10 10 5 13 7 19 13 27 27 37 е 41 25 33 17 1 9 17 25 33 41 49 57 65 49 33 17 1 9 17 25 33 41 49 57 65 Результат партии проигрыш М: прервана проигрыш М » » » » прервана проигрыш М » » » » » » » » прервана » » » » » » выигрыш М Второй эксперимент был проведен при начальных значениях Ai=U ^з=-120 (при тех же значениях А0, А2, Л4). В результате этого эксперимента были получены значения 41 = 9, А3=П. На основании этого было сделано предположение, что оптимальные значения этих оценок лежат в интервалах 9<^!<12, 63<Л3<77. Определить более точно значения оценок машина, прибегая только к помощи учителя, уже не может, и поэтому на машине был сыгран «турнир» между различными системами оценок, заключенных в указанных интервалах. Результаты этого турнира приведены в таблице 5. В этой таблице на пересечении i-й строки и /-го столбца стоит результат партии, сыгранной между i-ii и /*-й системами оценок, когда первый ход делала i-я система. При этом, если партия кончалась вничью, то ставилась 1/2; если выигрывала i-я система, то ставилась 1, в против-, ном случае — 0. Как видно из этой таблицы, системы оценок: ^ = 11, Л3 = 78, i4t = 11, 48 = 81, Л = 12, 48 = 81, являются сильнейшими, когда первый ход делают они. Вместе с тем, если первый ход делает противник, то наилучшей системой оценок является 41=10, А3 = №
138 С. Л. АМБАРЯН, X. К. БРУТЯН, Т. М. ТЕР-МИКАЭЛЯН Ах 9 9 " 9 9 9 10 10 10 10 10 11 11 1 11 и 11 12 12 12 12 12 Аз Аз\ 69 72 75 78 81 69 72 75 78 81 69 72 75 78 81 69 72 75 78 81 69 9 0 72 9 0 l/2ll/2 1/2J1/2 1/2 1/2 0 0 1/2 1/2 1/2 1 1 1 1 1 1 1 1 1 1 1/2 1/2 0 0 1/2 1/2 1/2 1 1 1 1 1 1 1 1 1 1 75 9 0 1/2 1/2 1/2 1/2 0 0 1/2 1/2 1/2 1 1 1 1 1 1 1 1 1 1 78 9 0 1/2 1/2 1/2 1/2 0 0 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 81 9 0 1/2 1/2 1/2 1/2 0 0 69 10 0 0 0 0 0 0 0 1/2| 0 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 0 0 0 0 0 1/2 72 10 0 0 0 0 0 0 0 0 0 0 1/2 1/2 1/2 1/2 75 10 1/2 1/2 1 1 1 1/2 1/2 1 1 1 1/2 1/2 1/2 1/2 78 10 1/2 1/2 0 0 0 1/2 1/2 0 0 0 1/2 1/2 1/2 1/2 l/2il/2il/2|l/2 0 0 0 0 1/2 0 1/2 1/2 1/2 0 0 1/2Ц/2 1/2J1/2 1/2 1/2J1/2 ! 1/2 1/2 81 10 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 " 1 1 1 69 11 1 1 1 1/2 1/2 1 1 1 1 1 1/2 1/2 1/2 1/2 1/2 0 1/2 1/2 72 11 1 1 1 75 11 1 1 1 78 11 1 1 1 1/2!1/2'1/2 81 11 1 1 1 1/2 1/2:1/2'1/2|1/2 1 1 1 1 1 1/2 1/2 1/2 1/2 1/2 0 1/2 1/2 1 1 1 1 1 1 1 1 1 1 0 1 1 1/2:1/2' 1 1/2J1/2! 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 т 69 12 1 1 1 1/2 1/2 1 1 1 1 1 1/2 1/2 1/2 1/2 1/2 0 1/2 1/2 1/2 1/2 аб 72 12 1 1 1 1/2 1/2 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 л и 75 12 1 1 1 1/2 1/2 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 ца 78 12 1/2 1/2 5 81 12 0 1/2 1/2 0 (см. соответствующий столбец). Возможно, что это различие лежит в существе вопроса: нужны две различные стратегии в зависимости от того, кто делает перый ход. В контрольной встрече машина сыграла 11 партий с различными людьми, из которых выиграла 9 и проиграла 2. Одна из проигранных ею партий приведена в таблице 3 (партия № 2). Анализ этой партии показывает, что проигрыш в ней связан с тем, что после первого хода человека сб машина занимает клетку g2, цена которой оказалась равной цене каждой из 8 клеток, соседних с клеткой сб. Возможно, что увеличение размеров поля устранит эту ошибку. В остальных партиях, приведенных в таблице 3, выиграла машина. § 3. Моделирование на машине сильного игрока (учителя) Как было отмечено в § 2, моделирование на машине сильного игрока основано на просмотре, исходя из данной ситуации, различных возможных продолжений. Ясно, что такой просмотр при игральном поле, содержащем 64 клетки, практически неосуществим. Поэтому было ограничено число ходов вперед, на которые просматривались возможные продолжения. Кроме того, при каждом ходе исследовались не все свободные клетки игрального поля, а только наиболее «перспективная» часть этих клеток. Выбор «перспективных» клеток проводится по следующему правилу. Рассмотрим последовательность чисел Qi="Z1U' + 2.
ОБ АВТОМАТИЧЕСКОЙ ВЫРАБОТКЕ ОЦЕНКИ СИТУАЦИИ 139 Из предварительных опытов, проведенных на машине (в которых игра велась между машиной и человеком), были приблизительно известны величины оценок: A0 = ±,Ai=l,A2=Z, Л3 = 8, Л4 = 2". На основании этих оценок машина вычисляла цену каждой свободной клетки. Пусть S — максимум этих цен. Перспективными по отношению к данной ситуации называются те клетки а, цена Sa которых заключена в интервале Как видно из этого определения, перспективность клеток зависит не только от ситуации, но и от параметра i. Этому параметру мы будем придавать значения, равные порядковому номеру хода изучаемого продолжения. Важно подчеркнуть, что при этом число S является максимальной ценой свободных клеток при той гипотетической ситуации, которая возникла на (i— 1)-м ходе в данном продолжении. При этом, если величина S оказывается меньше некоторого фиксированного числа S0, то считается, что перспективных клеток нет. Возрастание чисел Qt по мере «углубления» в рассматриваемое продолжение связано с необходимостью уменьшения числа возможных разветвлений процесса. Вместе с тем именно так, по-видимому, осуществляется человеком анализ ситуации при выборе им очередного хода. Рассмотрим некоторый {i — 1)-й ход продолжения. Все перспективные клетки ситуации, образовавшейся после этого хода, назовем его слоем. Та клетка, в занятии которой заключался рассматриваемый (i — 1)-й ход, называется вершиной этого слоя. (Ясно, что если вершину брал знак X, то все клетки слоя берет знак О, и наоборот.) Некоторая вершина называется выигрышной (для самого игрока), если все клетки ее слоя приводят противника к поражению. Наоборот, вершина называется проигрышной (для данного игрока), если хоть одна клетка ее слоя приводит противника к победе. Если некоторая вершина не является ни выигрышной, ни проигрышной, то мы вводим понятие стоимости этой вершины по следующим правилам. Предположим, что просмотр возможных продолжений выполнен на к ходов вперед. Рассмотрим все перспективные клетки к-то хода, входящие в один и тот же слой CV Максимальная цена клеток этого хода, взятая с обратным знаком, называется стоимостью вершины слоя С&. В свою очередь эта вершина входит в некоторый слой Ch-i. Максимальная стоимость вершин этого слоя, взятая с обратным знаком, называется стоимостью вершины слоя Ck_i. Таким же точно образом определяются стоимости всех вершин, полученных на к — 2, к — 3, . . ., 1 ходах продолжения. Как видим, стоимость вершины определяется несколько различно для вершин последнего из просмотренных ходов и вершин всех предыдущих ходов. В понятие стоимости легко включить понятие выигрышной и проигрышной клеток, если обозначить их стоимость через Р и —Р соответственно, где Р — достаточно большое число. С помощью введенных определений можно описать правила, по которым У выбирает свой очередной ход. Пусть на поле имеется некоторая исходная ситуация. У определяет все перспективные клетки этой ситуации. Если множество перспективных клеток пусто, то здесь возможны два случая. Либо цена всех свободных клеток данной ситуации равна нулю, и это значит, что партия закончилась вничью. Либо максимальная цена этих клеток меньше S0, и тогда У выбирает клетку с максимальной ценой.
140 С. Л. АМБАРЯН, X. К. БРУТЯН, Т. М. ТЕР-МИКАЭЛЯН В противном случае пусть множество перспективных клеток исходной ситуации не пусто. Назовем эти клетки исходными вершинами. Выбор одной из этих вершин делается по следующим правилам. 1. Если исходных вершин всего одна, то У выбирает ее в качестве своего хода. 2. Если исходных вершин больше чем одна, то У начинает просмотр возможных продолжений сначала на один ход вперед, потом на два, на три и т. д. Пусть выполнены все возможные продолжения на к ходов вперед, к = 1, 2, . . ., 64. Исходя из цен всех перспективных клеток к-х ходов, мы можем определить стоимость вершин к-х ходов, с их помощью определить стоимость вершин (к — 1)-х ходов и т. д., пока не будет определена стоимость исходных вершин. Если среди них окажется выигрышная клетка, то У выбирает ее в качестве своего хода. Если выигрышной клетки нет, то продолжения строятся до (& + 1)-го хода, после чего вновь проводится оценка стоимости исходных вершин исходя из цен всех перспективных клеток (к + 1)-х ходов. Практически такой просмотр продолжений был ограничен объемом оперативного запоминающего устройства, содержащего 2048 ячеек. Из них программа вместе с константами и рабочими ячейками занимала примерно 600 ячеек, а все остальные ячейки были использованы под изображение ходов строящихся возможных продолжений. В силу этого просмотр продолжений осуществлялся не далее 10—12-го хода в зависимости от количества перспективных клеток на каждом из ходов. Внешняя память не была использована для сокращения времени работы машины. Партия в 25 ходов длилась около получаса. Это время удавалось существенно сократить за счет того, что каждая данная партия хранилась в машине в течение следующей партии и если в них ситуации повторялись, то ход брался из предыдущей партии. Практически на 51 партию, описанную в таблице 4, машина потратила около 4 часов. Отметим в заключение следующий любопытный факт. После того как машина нашла оценки, приведенные в § 2, оценки, которыми руководствовался У, были заменены на вновь найденные и между М и У были сыграны две партии. При этом У проиграл партию, в которой делал первый ход, и свел к ничьей ту fпартию, в которой первый ход делала М. Из этого можно предположить, что оценки, найденные М, настолько удачны, что просмотр возможных продолжений уже не влияет на качество игры У. ЛИТЕРАТУРА [1] С р а п я н Ш. О. и Т е р - М и к а э л я н Т. М., Об одном методе оценки ситуации при игре в крестики и нулики, сб. «Проблемы кибернетики», вып. 9, М., Физ- матгиз, 1963. Поступило в редакцию 6 XII 1963.
ОДНОМАСТКА (программирование игровой задачи) А. Л. БРУДНО, И. Я. ЛАНДАУ (МОСКВА) Введение В 1959 году в лекциях по кибернетике на объединенном семинаре математиков Института электронных управляющих машин и Института теоретической и экспериментальной физики А. С. Кронрод сообщил, что в результате работы с программой «подкидного дурака» выкристаллизовались основные трудности программирования игр. Кронрод сказал, что, пока игра идет по разумным принципам, программа превосходит человека и что, наоборот, человеческий интеллект обгоняет по скорости машину на много десятичных порядков при просчете широко ветвящихся, проверяемых до конца вариантов *) (ситуация эндшпиля), и поставил в качестве главной очередной задачи программирование точной оценки ветвящихся вариантов **). В результате этих лекций авторы решили заняться простейшей игрой, в которой не было бы иных обстоятельств, кроме точной оценки ветвящихся вариантов. В качестве такой игры была принята одномастка. Одномастка напоминает преферанс вдвоем, если карты открыты и имеется только одна масть. Мы не знаем и умышленно пытались не искать алгоритма для игры в одномастку. Если алгоритм кому-либо известен (или будет найден), то это не мешает нашему программированию, подобно тому как игре в шахматы не мешает гипотетическое наличие идеального игрока или возможность построения в будущем простого алгоритма игры в шахматы. Все же были построены примеры, опровергающие слишком простые рекомендации для игры в одномастку (см. «несколько свойств одномастки»). В процессе программирования одномастки мы стремились не пользоваться «слишком частными» свойствами этой игры, с тем чтобы наши результаты имели более общее значение. Но мы не знаем, насколько нам это удалось, ибо организация игровой программы, соревнующейся с че- ловеком, представляет исключительную трудность. *) Заметим, что к этому же выводу пришел и К. Шеннон. **) Один журналист написал, что Таль обладает электронными способностями расчета вариантов. В настоящее время трудно найти менее удачную похвалу. Как мало знают шахматисты о механизме проверки вариантов, следует из того, что тактическую игру они называют «интуиционной» в отличие от стратегической игры, которую называют «аналитической», и сами говорят, что есть позиции, где без всякого счета видно, что комбинация пройдет. Для нас еще более важно, что даже самый последовательный «аналитик», по-видимому, проводит оценки вариантов в объеме, фантастически превышающем возможности элементарных программ.
142 А. Л. БРУДНО, И. Я. ЛАНДАУ Работа велась в Институте электронных управляющих машин на трехадресной машине М2 с плавающей и фиксированной запятой, расположенной перед старшим разрядом. Объем памяти — 4096 тридцатичетырехразрядных слов (33 цифровых разряда и 1 знаковый). Скорость машины — 2000 опер./сек. Правила одномастки Двум игрокам случайным образом раздается по п номеров (карт) из числа 1,2, . . ., 2п (или из иного достаточного количества неповторяющихся номеров). Карты все время открыты — известны обоим игрокам. Один из игроков делает первый ход. При ходе игрок кладет на стол любую свою карту. Противник видит ее и отвечает любой своей. После этого обе карты сбрасываются (удаляются из игры), а игрок, положивший старшую карту, получает одно очко (взятку) и делает следующий ход. Выигрывает набравший максимальное число взяток. Кодировка Неудачная кодировка и плохие приемы выполнения ходов могут привести к потере двух десятичных порядков скорости. Поэтому, в отличие от других частей программы, мы с самого начала уделили внимание кодировке и элементарным действиям, согласовывающим кодировку с возможностями машины. Карта номера к обозначается положительным числом, содержащим единицу в разряде к (считая справа налево) и нули в остальных разрядах (т. е. числом 2"33 2k с фиксированной запятой). Множество карт (например, карты игрока) обозначается числом> содержащим единицы в разрядах, соответствующих картам. Для записи карт не используется старший разряд, где в этом случае пишется нуль. Таким образом, для информации остается 32 разряда, и карты у нас могут быть достоинством от 1 до 32. Заметим, что множество карт записывается числом, меньшим 1/2. Элементарные приемы. Благодаря такой кодировке быстра выполняется ряд элементарных действий, а именно: Добавление в группу карты (не содержащейся в группе) и изъятие карты (содержащейся в группе) достигаются арифметическим сложением и вычитанием (чисел с фиксированной запятой). Для взятия одной карты из группы (обозначенной числОхМ а) употребляется следующий прием Ромены Иоффе*): г = 1/2—, а вычитание с фиксированной запятой, г = г/\а поразрядное пересечение. Этот прием в два действия дает младшую карту группы (младшую единицу). Младшая из карт множества а, которая не меньше заданной карты а, получается в четыре действия: г = 1/2 — , а (карты > а), г = г/\а (карты а не меньшие, чем а), г = Чг-, г, г= г /\а. *) Публикуется с любезного разрешения автора.
ОДНОМАСТНА 143- Несколько свойств одномастки В записи позиции на бумаге мы будем иногда просто перечислять карты (номера карт) партнеров. Плюсом отмечаются карты партнера, которому принадлежит ход. Его карты называются активом. Карты второго партнера, которому принадлежит ответ, называются пассивом. Если 2к наличных карт имеют номера от 1 до 2/с, то позицию (ситуацию) перед ходом можно описать последовательностью нулей и единиц, где единицы изображают карты одного партнера, а знак + или — перед последовательностью указывает, чьи это карты: актива или пассива. Так, например, +001101 есть запись позиции, где у актива имеются карты с номерами 4, 3, 1, а у пассива — карты 6, 5, 2. Приведем несколько позиций: 1) в позиции +001101 ошибочно ходить младшей картой; 2) в позиции + 101010 ошибочно ходить старшей картой; 3) в позиции +101001 ошибочно ходить под старшую карту противника; 4) если в позиции +011010 сделан ход 01000, то ошибочно бить; 5) если в позиции +1010 сделан ход 0010, то ошибочно отдавать. Лемма (об одномастке). При перемене очереди хода число взяток или. сохраняется, или убывает на единицу для игрока, получившего ход. Игрок,, сменивший свою карту на большую карту из колоды, или сохраняет, или увеличивает на единицу число своих взяток (доказательство см. в Добавлении 1). Следствие 1. Из группы карт, не разделенных картами противника, достаточно рассматривать ход только одной картой (например, младшей). Следствие 2. При ответе достаточно рассматривать только две возможности — отдать младшую или побить младшей из берущих. Следствие 3. Ошибочный ход, как и ошибочный ответ, приводит к потере одной взятки. Следствие 4. Отдавая в ответ на ход некоторой картой, мы получим не меньше взяток, чем отдавая в ответ на ход большей картой. Первая программа Вначале решено было сделать программу, хоть как-нибудь играющую по правилам. Для сокращения числа вариантов, которые надо просмотреть при поиске оптимального хода, использовались только следствия 1 и 2. Таким образом, из каждой группы карт (не разделенных картами противника) рассматривался ход только одной картой, а при ответе рассматривались только две возможности — отдать младшую или побить младшей из берущих. Результаты первой программы были ошеломляющими даже для самых мрачных пессимистов: число карт 2+2 3+3 4+4 54 5 6+6 7 + 7 время выбора хода <1 сек 1 сек 5 сек 30 сея 4,5 мин > 15 мин Кроме того, было замечено, что положение с двенадцатью картами (6+6) анализируется человеком за то же время, что и нашей первой программой. Каждая пара добавленных карт (от [тг+ п] до [(тг+ 1)+ (п + 1)]) может увеличить число вариантов и время переборов почти в 2 /г раз
144 А. Л. БРУДНО, И. Я. ЛАНДАУ (число первых ходов/г, и на каждый —2 ответа). Таким образом, для игры на 15^15 картах первая программа потребует миллионы лет. Нам предстоит «ускорить» программу игры в 1010 раз. Забегая вперед, укажем, что это удалось, причем, как мы надеемся, некоторые из употребленных приемов относятся не только к одномастке. Организация быстро играющей программы Описанию программы предпошлем общие сведения (использованные уже и в первой программе) о ее построении и приемы, приведшие к ускорению игры: идентификацию позиций, построение таблицы концов и текущей справочной и организацию игры на дереве игры с надписанными оценками и гранями. Общая организация программы игры. Программа делается для игры с человеком. Она получает перечень «своих» и «чужих» карт и карту, которой пошел противник, если первый ход чужой. Программа находит один из лучших ходов (или ответов) и печатает его. Если следующее действие (ход — ответ) по правилам игры принадлежит машине, то она точно так же вычисляет и печатает его* Если действие принадлежит человеку, то машина останавливается и ждет ввода этого действия. Действия человека проверяются и печатаются. Кроме того, при каждой печати действия печатается и число взяток программы от начала игры до конца при оптимальном продолжении. Увеличение числа взяток свидетельствует об ошибке противника. Программа должна просмотреть все варианты, необходимые для определения одного из лучших ходов, если ход ее, и одного из лучших ответов, если пошел противник. Таким образом, все сведется к сокращению числа «необходимых» вариантов, которое априори безнадежно велико. Общая организация просмотра необходимых вариантов (вариантов, необходимых для отыскания лучшего действия, т. е. хода или ответа) выполняется по «одноветочной схеме». Действия нумеруются в порядке выполнения с начала партии. Кроме того, упорядочиваются варианты действий из фиксированной позиции (по величине действующей карты). Получив исходные карты, программа разыгрывает партию с младшими вариантами действий (рис. 1, а) до момента определения числа взяток этого варианта (например, до исчерпания карт). Число своих взяток программа запоминает. Затем программа возвращается на одно действие назад и играет следующий вариант из рассматриваемого положения (рис. 1,6). Снова возвращается назад, запоминает лучший результат и, убедившись, что иных вариантов из этого положения рассматривать не нужно, делает еще шаг назад. Из получившегося положения делает очередной вариант действия и продолжает его младшими вариантами действий (рис. 1, в). Представление о последовательности работы программы дает рис. 1. Количество и длина дорожек, выходящих из данного узла, могут зависеть от информации, полученной при рассмотрении предыдущих вариантов, ибо программа рассматривает не все варианты, а лишь те, которых еще не может отбросить. При «одноветочной схеме» в машине не содержится всего рис. 1, е — программа помнит в каждый момент только одну ветку без разветвлений, ту, которую просматривает от начальной позиции до рассматриваемого узла. По исчерпании вариантов первого действия программа получит оптимальное число взяток и лучший вариант первого действия.
ОДНОМАСТНА 145 Таким образом, работа программы состоит из движений «вперед» и «назад». Движение вперед — это выполнение очередного варианта действия из данной позиции и переход к следующей позиции. Движение назад возникает при исчерпании всех необходимых вариантов действия • 1-е дейстдие I 2-е действие I 3-едействие I • а б в г д е Рис. 1. из данной позиции (или в случае иного получения нужной оценки данной позиции). При движении назад программа переходит к предыдущей позиции. Изложенного достаточно для представления о программе. Более точное описание будет дано при описании блоков программы. Идентификация позиций. В любой игре человек часто может сразу сказать и доказать, эквивалентны ли две ситуации или они подчинены друг другу, хотя оценка этих позиций для него может быть и слишком трудной. Идентифицировать эквивалентные позиции важно при запоминании результатов анализа позиций. Тогда позиция, эквивалентная рас- хмотренной, может быть сразу оценена. В этом кроется возможность сокращения перебора вариантов за счет отсечения целых веток дерева игры. В одномастке все карты, находящиеся в игре, можно в любой момент сжать, т. е. плотно (без пропусков) сдвинуть, сохраняя порядок, на начальные номера 1, 2, . . ., и при этом ничего в ходе игры не изменится. При анализе вариантов после каждой пары ход — ответ программа будет плотно сдвигать номера карт игроков. Это сократит число возможных ситуаций. Пусть, например, было сдано 7 + 7 карт с номерами от 1 до 14 и сделано шесть ходов и ответов. Возможны 182 ситуации с различными оставшимися картами обоих игроков и различными очеред- ностями хода. После идентификации таких ситуаций возможны только две: либо у ходящего карта № 1, либо № 2. Мы собираемся ввести справочные таблицы с оценками позиций, найденными во время анализа или вычисленными заранее. Идентификация позиций сократит объем таблиц, повысит число случаев, когда они будут давать ответ, и сократит время поиска справки. Построение справочных таблиц. Для ускорения программы введем справочные таблицы, в которых по позициям можно найти их оценки. В справочных таблицах будут содержаться оценки позиций, как вычисленные заранее, так и полученные в процессе исследования вариантов самой программой игры. В нашей программе используются два способа построения справочных таблиц. При первом способе строится таблица — в память заносятся только оценки позиций. Сами позиции в память не заносятся. Они (их записи в двоичной системе) служат, грубо говоря, номерами мест, где находятся соответствующие оценки. Достоинство таблиц — в быстроте поиска оценки и экономии памяти, свободной от записи позиций. Недостаток — в малой плотности записи, ибо не все номера мест таблицы являются 10 Проблемы кибернетики, вып. 13 К к г^ к
146 А. Л. БРУДНО, И. Я. ЛАНДАУ образами возможных или нужных позиций. При втором способе строится справочная — в память заносятся и позиции и их оценки. Таблица оценок концов. Таблица будет содержать оценки всех позиций с числом карт от 1 + 1 до 7 + 7 и разместится в 512 ячейках по 34 разряда. Поучительно, что вся таблица составлялась 1,5^—2 минуты, т. е. в три раза быстрее, чем наша первая программа анализировала одну позицию при 6 + 6 картах. Для записи оценки одного положения в таблице отводится 4 разряда. В старших трех разрядах отмечается число взяток, которые наберут «младшие карты» — т.е. партнер, не имеющий старшей карты,— при своем ходе. В четвертом разряде отмечается, увеличится ли это число взяток на единицу, если ход будет чужой. По свойствам «одномастки» (см. Добавление) число взяток при потере очереди хода или сохраняется, или увеличивается на единицу. Сдвинутых (идентифицированных) младших позиций может оказаться: при числе карт 1+1 — одна (именно из карты № 1); при числе карт 2+2 — три (именно из карт с номерами 1 и 2, или 1 и 3, или 2 и 3); при числе карт п + п таких позиций С2^-\- Всех младших позиций при числе карт от 1 + 1 до 7 + 7 будет 2356. Для записи их оценок мы разбиваем 34-разрядную ячейку на 8 групп по 4 разряда (два разряда не используются). Всего в 512 ячейках помещается 4096 групп. Это почти вдвое превышает нужное число 2356, но требование быстрого поиска (без вычисления порядкового номера позиции) требует специального алгоритма для кодирования позиции номером группы. Кодирование позиций в таблице. При числе карт 7 + 7 берутся карты младшего партнера (семь единиц на тринадцати младших разрядах, в остальных разрядах — нули). Число А, получившееся в двенадцати младших разрядах, изображает позицию. При числе карт i + i, где 1 <! i < 7, берутся карты старшего партнера (i единиц на 2г младших разрядах и нули в остальных разрядах). Единица в разряде 2i выбрасывается. Число А, получившееся в двенадцати младших разрядах ячейки, изображает позицию. Теперь примем старшие 9 разрядов числа А за номер ячейки (всего получится 512 ячеек), а младшие 3 разряда числа А за номер группы (всего получится 8 групп) в ячейке, где запишется оценка позиции, представляемой числом А. Пример. Карты игроков суть №№ 7, 4, 3, 1 и №№ 8, 6, 5, 2. Всего карт 4 + 4. У младшего партнера карты №№ 7, 4, 3, 1 и взяток: при своем ходе1, при чужом —2. Старшие карты 10110010 Число А 000000110010 шестая ячейка вторая группа В ячейке л № группы: 7, 6, 5, 4, 3, 2, 1, 0 0000000110 содержание: ООН ... находится J Покажем, что при изложенном способе кодирования разным позициям будут соответствовать разные числа А и, значит, разные группы в ячейках. Действительно, при числе карт 7 -ь 7 число А содержит 6 или 7 единиц. При числе карт i+ i для 1 ■< i < 7 число А содержит точно i — 1 единицу. Следовательно, позиции с разным числом карт имеют различные числа А. Рассмотрим две младшие позиции с 7 + 7 картами. Если одна из них имеет карту Л2 13, а вторая не имеет, то для первой число А содержит шесть, а для второй семь единиц. Если же обе позиции одновре-
ОДНОМАСТНА 147 менно содержат (или не содержат) карту № 13, то они должны отличаться картами с номерами от 1 до 12 и, следовательно, тоже имеют разные числа А. Аналогично показывается, что двум различным старшим позициям с числом карт i + i при 1 ^ i < 7 соответствуют различные числа А. Может представить интерес одноцикловая (!) программа получения всех сочетаний из i элементов по /с, где i < к < п — фиксированные числа и п — число разрядов ячейки памяти. Сочетание представляется числом а, содержащим i единиц в последних (правых) к разрядах ячейки.. Остальные п — i разрядов заполнены нулями. Сочетания образуются в порядке убывания числа а. Приведем безцикловую программу, образующую из заданного сочетания (числа а) следующее сочетание. Программа и пояснения Заданное сочетание Ш=а+, I71 а = а Д R\ R\ — M — , a Я2 = 1' —, a R2=R2/\a Д1=Д1:, 1' Я1 = 1п:, R\ Я1 = Д2., R1 а = а—у Я1 [Гашение \ хвоста единиц младший нуль Iй Г младшая \ единица V \и—1 \п—и+1 [v+n—u+l результат Пример 1 а=х\000 «1001 яЮОО 00001 йооо 01000 00010 ,10... 00100 аЮ100 Пример 2 а=х1001 х\Ш а:1000 00001 ilOOO 01000 00100 ,010... 00010 аЮИО Пример 3 а = «100111 х\01000 «100000 0001000 «100000 0100000 0010000 ,00010... 0000010 «011110 В машине М-2 нет сдвигов, и они достигаются умножением или делением на целую степень двойки. Значок /\ обозначает пересечение, а значки -г, —, •, :,— действия над числами с запятой, фиксированной перед первым (старшим) разрядом. Значок 1г означает двоичное число, содержащее единственную единицу в разряде номера г, считая слева направо, т. е, число, равное 2~г. Через 1п обозначена последняя, самая правая единица, х — группа старших цифр (кроме первой), х — дополнение к х. Справочная. В программе одномастки имеется текущая справочная, куда заносятся исследованные положения вместе с найденными для них оценками (оценками сверху и снизу числа взяток при оптимальной игре). Справочная построена по схеме Г. М. Адельсон-Вельского и Е. М. Лан- диса [II и требует ~rln k действий на одно занесение или поиск, когда в справочной уже находится к позиций. Программу построил В. Ашкенузе. В справочной для каждого положения отводится две ячейки памяти (по 34 разряда). В одной ячейке записывается идентифицированная позиция — сдвинутые младшие карты. В другой ячейке записываются: 4 разряда—оценка снизу числа взяток- младшей позиции при своем ходе, 1 разряд —увеличение или сохранение этой оценки при перемене очереди хода, 4-j-l разрядов—то же для оценки сверху, 11 + 11=22 разряда—для адресов левого и правого соседа на дереве справочной. При 16 + 16 картах младший партнер не может набрать более 15 взяток. Это число записывается в четырех разрядах, и, следовательно, справочная может работать до 16 + 16 карт. Справочная работает в трех режимах — справка, занесение, уточнение. При «справке» справочная выдает справку о младшей позиции или 10*
148 А. Л. БРУДНО, И. Я. ЛАНДАУ отвечает, что у нее такой позиции нет. При «занесении» и «уточнении» справочная проверяет, имеется ли в ней поступившая позиция. Если позиции нет, то она заносится. Если уже есть, то справочная уточняет свои верхние и нижние оценки по поступившей информации. Независимо от распоряжения «занести» или «уточнить» выполняется нужное, но верное распоряжение выполняется быстрее, так как цикл поиска в «занесении» содержит больше команд, чем в «уточнении»,— он запоминает дорожку дерева справочной. Эта дорожка понадобится при перестройке справочной. В случае заполнения справочной (1024 позиции) дальнейших «занесений» не происходит. Вся справочная перестраивается в порядке возрастания позиций. Это ускоряет получение дальнейших «справок» и «уточнений». Узел Варианты хода Варианты ' ответоб Организация игры на дереве с надписанными оценками и гранями Рис. 2. Общая организация игры (перебора вариантов) ведется на дереве игры с (надписанными) гранями и оценками. Это описано в [2], но сей- Узлы час мы напомним все, что понадобится. Схема близка к одноветочной, но узлам дерева соответствуют только позиции (положения перед ходом — см. рис. 2). В памяти машины выделяются группа рабочих ячеек и п групп (по числу возможных последовательных позиций) ячеек для текущей информации. Мы приходим из ловушки с числом карт <15+15 и получаем оценку в «таблице» при любом числе карт <7 + 7. Поэтому у нас п = 8. Из нужной группы текущих ячеек информация переносится для обработки в рабочие ячейки. В k-й группе текущих ячеек содержится информация о позиции перед к-м ходом (напомним, что мы говорим о номере хода с начала партии, а не о номере варианта данного хода). Текущая информация (о позиции перед очередным ходом) располагается в трех ячейках памяти: сжатые карты актива, рассматриваемый (очередной) вариант хода, информационная ячейка. Ответ ! Число | взяток I I . Число карт Л/а твили т0 MR или Л/., Ответ — рассматриваемый вариант (взять или отдать) — занимает один двоичный разряд. Остальные части информационной ячейки — по 4 разряда: число взяток, набранных до рассматриваемой позиции, число карт (одного игрока) в рассматриваемой позиции, та и Ма — нижняя и верхняя оценки (априорные) узла, L, J — нижняя и верхняя грани узла. 7пв, Мъ (или т0, М0) — нижняя и верхняя оценки числа взяток от начала партии при ответе взять (соответственно — отдать). Рабочая информация не требует экономии ячеек. В нее переносится текущая информация (одного рассматриваемого узла), причем 10 составляющих «информационной ячейки» размещаются в одних и тех же разрядах десяти ячеек. Кроме того, в рабочей информации есть ячейки для
ОДНОМАСТНА 149 размещения оценок тк, Мх хода и еще несколько служебных ячеек. Обозначения текущей и рабочей информации требуют определения и даже доказательства того, что их достаточно для получения точного числа взяток начальной позиции. Перейдем к этому. Все обозначения, касающиеся числа взяток, оценок и граней, относятся к числу взяток партнера, которому принадлежат карты актива рассматриваемого узла. Это удобнее, чем рассматривать число взяток одного и того же партнера (например, машины) на протяжении всей партии,— программа содержит меньше вариантов. Таким образом, оценки /тга,Л/а; тх, Мх; тв, Мв\ т0, М0 суть оценки числа взяток (т. е. границы, в которых заведомо находится число взяток партнера, которому в настоящем узле принадлежат карты актива), если партия сперва будет идти по ветке дерева от начала до определенного момента, а затем продолжится обоими партнерами оптимальным образом. Для ?па, Л/а этот момент — положение в рассматриваемом узле. Для тх, Мх — включая еще и рассматриваемый ход, а для тв, Мв (т0, М0) включая, кроме того, и берущий (соответственно — отдающий) ответ. Заметим только, что в обоих случаях (ти, Мв и т0, М0) речь идет о числе взяток партнера, которому принадлежат карты актива в данном узле, а не в узле, к которому перейдет программа после берущего ответа. Определение граней дано в [2]. Повторим его. Пусть имеется ветка дерева игры от начальной позиции х = 1 до фиксированного узла х = к и на каждом узле х надписан отрезок [тК,МК] оценок для (числа взяток) k фиксированного партера А. Тогда пересечение П [mh, Mh] = [ Lh, J k] x=l дает грани для партнера А в узле к или, что то же самое, [ Li, J J = = [ти A/il и [ |_а, J A] = [ La-i, J *-il П l^ft» Mk]. Суть этого определения в том, что грани являются пересечением не любых оценок, а только надписанных (что подробно выясняется в [2]). Возвращаясь к обозначениям, принятым в «текущей информации», мы видим, что число взяток пассива заключено в границах ml, Ml, равных т*х = N — Ма, Л/а = N — тЛ, где N — число карт одного игрока в начале партии (равное общему числу взяток обоих партнеров). Поэтому, обозначая штрихом текущую информацию для предшествующего узла, получаем следующую формулу для вычисления граней L, J Данного узла. [ L, J 1 = [ L', J '1 П tma, Ma], если очередь хода сохранилась, [ L, J 1 = Ш' — J ', TV — L'l П [wa, Ma], если очередь хода переменилась, Мы говорим, что оценка узла огранена, если его грани содержат не более одной точки (т. е. пусты или состоят из одной точки). В [2] доказано, что если поддерево с надписанными гранями и оценками, выходящее из узла В, заканчивается позициями, имеющими ограненные оценки, то по ним восстанавливается ограненная оценка узла В. Поэтому уточнение оценок узла (т. е. перебор вариантов, выходящих из этого узла) можно прекращать, как только узел получит ограненную оценку (впрочем, к нашему случаю доказательство из [2] буквально не применимо и поэтому будет повторено с нужными изменениями). Пусть узел Р имеет грани и оценки /тга < L < J < Ma. Пусть из него следует рассматривать п вариантов pt первого хода. Если на ход Pi возможны оба ответа — взять и отдать, то ти Mi, равные mi=.--min(miB, mi0), l Mi = mm(MiB, Mi0) J ( )
150 А. Л. БРУДНО, И. Я. ЛАНДАУ являются оценкой хода pt. Если возможен только один ответ, то его оценка является и оценкой mtJ М\ хода pt. Оценка т, М позиции Р равна т = max ти М-— max Mt. (2) Пусть из узла Р, имеющего грань L, J , выходит ход Pt, за которым возможны оба ответа (или лишь один), и узлы этих ответов имеют ограненные оценки. Тогда [mt, М%\ пересекается с L, J не более чем в одной точке. В самом деле, если возможны оба ответа и (для определенности) mBi < moi или существует лишь один ответ (для определенности — «взять»), то [nit, Mi]g_[mBi, MBi]. Грани узла PiB равны пересечению [_, J с [mBi, MBi]. Коль скоро это пересечение не содержит более одной точки, то и [ти Мг] не пересекается с L» J более чем в одной точке. Пусть теперь все узлы {PiB, Pi0), следующие за узлом Р с гранью L , J , имеют ограненные оценки. Тогда оценка [/яьЛ/г] любого хода Pt не пересекается с L,_i более чем в одной точке. Пусть Mi>~ max Mx (по всем г), тогда [т, М]сг [ть> Mt>] и пересечение [т, М\ f) [ i_, J ] тоже не содержит более одной точки. Теперь рассмотрим дерево игры с гранями и надписанными оценками. Пусть оценки концевых узлов огранены, в частности (вначале) одноточечны. Двигаясь по одноветочной переборной схеме, мы будем уточнять, т. е. сужать, оценки, поэтому грани будут только сужаться и ограненно оцененные узлы будут оставаться ограненно оцененными. Просмотрев все ходы из узла В, за которым следуют только ограненно оцененные узлы, мы, как было отмечено, получим ограненную оценку узла В. Таким образом, будет расти множество ограненно оцененных узлов. Наконец, ограненную оценку получит вершина дерева игры. Но ее грань совпадает с оценкой. Следовательно, будет получена одноточечная оценка всей игры. Сам процесс просмотра узлов с сокращениями благодаря справочным и правилам одномастки будет описан в блоке «исследование оценок». Ловушка. Было замечено, что безукоризненно играющая программа может и не выигрывать у человека — она может играть так, что противник не сможет ошибиться. Любопытно, что живой игрок, даже и не рассчитывая на ошибки противника, все же ставит ему ловушки. Действительно, свои затруднения мы продумываем тщательнее, чем затруднения противника. В результате мы часто идем на вариант, который нам лишь кажется выигрышным. На самом деле этот вариант не выигрывает, но опровергается только при тщательном поиске противником выхода и, следовательно, является ловушкой. Поэтому выигрывающая программа должна расставлять ловушки. Описание программы Опишем программу игры против человека. Блок-программа игры состоит из блоков, которые тоже могут иметь блок-программу, т. е. содержать несколько программ. Блок-программа игры 1. Подготовка игры. 2. Действие. 3. Ловушка. 4. Оценка позиции.
ОДНОМАСТНА 151 i. Подготовка игры. Содержание этой программы не представляет интереса. 2. Действие. Проверка законности действий противника, выполнение (на картах) фактических действий (в отличие от гипотетических при рассмотрении вариантов), протоколирование игры, окончание партии. При своем ходе блок «действие» печатает ход, число своих взяток от начала партии до конца при правильном продолжении и характер возможной ошибки противника при ожидаемом ответе (нельзя бить, нельзя отдавать, ответ безразличен). Машина останавливается в ожидании ответа противника, подаваемого от руки клавишами. При своем ответе блок «действие» печатает ответ. Если ответ берущий, то блок передает задание «ловушке» для поиска следующего хода. Если ответ отдающий, то печатается, сможет ли ошибиться человек при своем следующем ходе, и машина останавливается в ожидании этого хода. 3. В принципе блок ловушка должен на несколько действий (ходов и ответов) вперед рассмотреть все варианты (а не только необходимые для оценки исходной позиции) и среди оптимальных вариантов своего действия выбрать тот, на котором противнику легче ошибиться. Программа ловушки. Входная информация — карты партнеров и ход (нулевой, если очередь хода за программой). Выходная информация — оценка (число взяток программы при оптимальной игре), избранный вариант действия и характер возможных ошибок противника: при ходе программы — ошибочно ли будет бить, отдать или ответы равноценны; при ответе программы — возможен ли ошибочный следующий ход (если отдать). Результаты работы ловушки печатаются и выполняются блоком «действие». Программа ловушки получает задание и возвращает управление блоку «действие». Промежуточную информацию она готовит для блока «оценка», который можно рассматривать как ее собственную подпрограмму. Если программа должна ходить, то ловушка делает все варианты ходов, точнее, по одному из каждой группы карт, разделенных картами противника, и на каждый ход делает два (если они возможны) варианта ответов — отдать младшую и побить младшей из берущих (по следствию 1 иные варианты ходов и ответов рассматривать незачем). Получившиеся позиции ловушка последовательно направляет в блок «оценка позиции», который сообщает оценку ловушке. Получив оценки всех позиций, ловушка отбирает оптимальные ходы, т. е. ходы, приносящие программе максимальное число взяток при лучшем ответе противника. Если среди оптимальных ходов есть такие, на которые ошибочно отвечать взятием, то младший из них ловушка сообщает блоку «действие» для выполнения (в расчете на «жадного» противника). Если на все оптимальные ходы можно бить, но на некоторые ошибочно отдавать, то ловушка избирает старший из последних (в расчете на «осторожного» противника). Наконец, если все оптимальные ходы безразличны с точки зрения ошибок партнера, то ловушка избирает один из них. Если программа должна отвечать, то ловушка рассматривает оба варианта ответа и на отдающий — все варианты ходов (противника). После получения результатов из блока оценок программа выбирает ответ. Если оптимальный ответ единствен, то выбирается он. Если оба ответа оптимальны, но на отдающий ответ имеются ошибочные варианты ходов противника, то выполняется отдающий ответ. Если на отдающий ответ ошибочных вариантов хода нет, то машина берет взятку себе. Таким образом, ловушка несколько раз обращается к блоку «оценка» и запоминает его ответы. В блок «оценка» ловушка иногда направляет положение перед ходом, иногда — перед ответом. Блоку «оценка» не
152 А. Л. БРУДНО, И. Я. ЛАНДАУ сообщается истинная принадлежность карт (программе или противнику), да и карты подаются не настоящие, а сжатые. 4. Оценка позиции. Программа состоит из ряда подпрограмм. Мы приведем ее общую, принципиальную блок-программу для основного случая и потом отметим некоторые дополнения. Принципиальная схема оценки позиции 4.1. Заловушка 4.2. Очередной ход 4.3. Два ответа 4.4. Запрос оценок 4.5. Уточнение оценок, оценка хода 4.6. Исследование оценок 4.7. Вбок 4.8. Вперед. Запись текущих 4.9. Назад] 4.10. Занесение в справочную 4.11. Возврат в ловушку 4.12. Чтение текущих 4.1. Заловушка. Подготавливает (возобновляет) информационные ячейки всей программы. Если ей передана позиция, в которой надо ходить (отвечать), то она передает управление блоку «очередной ход» (соответственно — «два ответа»). 4.2. Очередной ход. Делает ход младшей картой из очередной группы (в порядке возрастания) карт актива, не разделенных картами пассива, и передает управление блоку «два ответа». Первый раз ходит младшей картой актива. Если очередной ход невозможен (рассмотрены все ходы), то передает управление блоку «назад». 4.3. Два ответа. Делает ответ младшей картой и младшей из берущих карт (или один из них, если другой невозможен). Если ход был первым (младшей картой), а берущего ответа нет, то все карты актива старше карт пассива, число взяток в позиции легко определяется и управление передается блоку «назад». 4.4. Запрос оценок. Для двух (или одной) позиций, получившихся после хода и двух (или одного) ответов, наводится справка об оценке. Если карт <7 + 7, то справка наводится в таблице. Если карт >9 + 9, то — в справочной. При числе карт 8+8 справка не наводится, так как быстрее разыграть все варианты и получить оценки из таблицы 7 + 7. В этом случае сразу переходят к блоку «вперед». 4.5. Уточнение оценок, оценка хода. По свойствам одномастки один неверный ответ не может привести к потере более чем одной взятки. Это дает возможность взаимно подправить оценки на ответы «взять» и «отдать» (если они обе есть) и образовать одну из них по другой (если есть только одна). Кроме того, здесь образуется оценка хода rax = mm(ra0, mB); Mx = min(AT0, Mu). 4.6. Исследование оценок — центральный блок всей программы игры. Он будет описан в дальнейшем. Здесь только отметим, что этот блок уточняет оценку позиции, имея в виду имеющиеся оценку таМа и оценку очередного хода ?пхМх. Блок определяет, получены ли ограненная оценка позиции, ограненная оценка хода, ограненная оценка одного из ответов. После этого игра передается: блоку «назад» (для возврата в предыдущий узел), блоку «вбок» (для следующего хода) или
ОДНОМАСТНА 153 блоку «вперед» для продолжения варианта ответом «взять» или «отдать» в зависимости от того, получил ли ответ «взять» ограненную оценку. 4.7. Вбок. Подготавливает информацию для очередного варианта хода и передает ему управление. 4.8. Вперед. Подготавливает информацию для очередного хода после ответа «взять» или «отдать». В частности, заносит текущую информацию с полученными уточнениями и оценкой ответа «отдать», если продолжение идет по ветке «взять», и оценкой «взять», если продолжается ветка «отдать». 4.9.—4.12. Назад. Этот блок получает управление, если оценка позиции огранена. При числе карт >9 + 9 полученная оценка сообщается справочной для занесения или уточнения оценки, находящейся в справочной. Если рассматриваемая позиция является вершиной дерева, то шаг назад является возвратом в ловушку. В противном случае вызывается текущая информация предшествующего узла и управление переходит к очередному ходу. 5. Исследование оценок. Этот блок для ускорения счета написан в виде двух независимых программ: исследование первого варианта и исследование следующих (боковых) вариантов хода. При числе карт 8 + 8 оценок нет, и управление сразу передается программе «вперед». При числе карт <7 + 7 оценки одноточечные, что также упрощает дело. Мы приведем схемы только для общего случая с числом карт >9 + 9. При выписывании схемы рис. 3 использованы следующие свойства одномастки. Число взяток при ошибочном ответе или ходе убывает на одну единицу, так что |/WB —Л10|<1, |Л/в —М0|<1 а оценка позиции т, М заключена в пределах /их<лг<М<Л£х+1. Оценка отдающего ответа не возрастает с увеличением карты, которой делается ход. Так как в первом варианте хода ход делается младшей картой, то /я<М<М0 + 1. На рис. 3 две передачи «вбок» — к следующему варианту хода — в первой и третьей строке. Заметим, что на обоих уходах «вбок» для новых значений оценок будет та < L = J — 1 и Ма = J . В первой строке это происходит вследствие неравенства Мх< L <М0, из которого МХ = МВ = L=M0-1. В третьей строке при передаче «вбок» выполняются неравенства L<MX, /wB<_|, Мх<тв, тх=Мх, тх<М0, благодаря которым L < тх = My, = тв=Мв = М0 — 1 < J .
154 А. Л. БРУДНО, И. Я. ЛАНДАУ Разница между обеими передачами «вбок» только в положении wa, которое в первой строке может быть меньше L, а в третьей обязательно та= 1_. Исследование первого варианта хода по уточненным оценкам Мх < и_ М0^ 1__ - —> ход оценен ! ветки не рассматривать позиция оценена т — max(ma, 7пх), М=М0 назад 7na —max (raa, mx), Ma = J вбок . J <mB j рассматривать| позиция оценена '■ только ветку I m~~mx, «отдать » j М — min (Ма, М0) ! назад -> тх > Af х - I позиция оценена 7?i = 7ttx, М = МХ назад jGra = min[M0, Ma + 1] ; вперед, отдать | ^V^х < гпъ ветки «взять» не будет ход оценен М0 < тх—. позиция оценена /?г = Л/ = /?? х назад ?па = ?п0,Мл=М0 вперед, отдать i_ = mx, J^ I—+1 та=С, Ma = J вбок i_ = max(L_, mB), J—min (J, MB) ma = raax(ma—1, mB), Ma = min (Afa-(-l» ^в) вперед взять Рис. 3. Новые значения величии отмечены знаком ~. Пунктирные стрелки указывают переходы при невыполнении неравенств. В машине М-2 имеются две условные передачи типа о^Ьи |о|^|Ь|. Сравнения на равенство нет. Оценки не первого варианта хода не проходят предварительного уточнения. Делается это для скорости. Поэтому разности тв — т0 и Мв — Мц могут быть по модулю более единицы. Исследование оценок варианта хода начинается с проверки существования варианта. Если все варианты уже рассмотрены, то оценка позиции получается равной т = та, М = L. Действительно, все варианты имели оценки тх, для которых тх •< |_, ибо иначе грань L была бы увеличена. Но все ходы имели ограненные оценки, пересекающиеся с L» J не более чем в одной точке. Значит, для всех вариантов было Мх К- L • Таким образом, |_ является верхней оценкой позиции.
ОДНОМАСТНА 155 При разборе рис. 4 надо иметь в виду, что все оценки и грани — целые числа и что J — L — 1. Исследование оценок не первого варианта хода itfo<L_, очередного хода нет т — 7па назад нечем взять 1 >AfB<L- I f >mB< L_- позиция оценена ; ; _! <ч т0 ra = max [ma, 7?гх] i I позиция оценена M = J назад т = М- пазад i ход оценен ветка «взять» —— 1_<л/в ^_ = [_ 2j=j тл-—-.max [ma, mx]; ~а _ max [Wa —1, ти в] взять BOOK v ветка «отдать» C=i_; _J=.J 7иа---тах [/>?a—1, m,.\ отдать Рис. 4. Здесь, как обычно, переходы вниз при выполнении условия, а по стрелке — при невыполнении. Таким образом, невыполнение условия М0 < L влечет условие J < М0 и т. д. Примерные партии Неудачность «одномастки», как и большинства «надуманных» упрощенных игр, состоит в том, что в ней редки положения, где возможны ошибки. Почти всегда оправдывает себя правило — бей и ходи младшей. С другой стороны, в случае, когда человек ошибается, ему трудно выяснить, в чем состояла ошибка: он плохо «видит» комбинации одномастки. Недаром в «одномастку» люди не играют. Приведем две короткие партии, где встретились ошибки человека и где легко выяснить, что они действительно ошибки. Карты программы отмечены 1, а карты человека 0. Позициям с ходом программы (человека) предшествует значок + (—). Карты сданы случайно. Сделаем пояснение к надписям. При ходе программы: (а) «ловлю бьющий» —программа делает младший из оптимальных ходов, на которые ошибочно отвечать взятием; (в) «ловлю отдающий» — программа делает старший из оптимальных ходов, на которые ошибочно отдавать взятку; (с) «ловить нечего» — на все оптимальные ходы все ответы равноценны (отдающий младшей, бьющий — младшей из бьющих), и ход произволен (из числа оптимальных). При ответе: (а) «ловлю ход» — отдаю, потому что это возможно и при своем следующем ходе человек может ошибиться; (в) «ловить нечего» — отдать можно, но при следующем ходе человек не может ошибиться. Поэтому бью. Карта, которой делается ход (ответ), отмечена значком *(с). Остальные надписи ясны.
156 А. Л. БРУДНО, И. Я. ЛАНДАУ Пример I. Карт 13—(—13; ход человека. 1) —01110010010111110100011000 перед ходом ожидается 7 взяток, набрано 0, ловить нечего, программа бьет. 2) 4 011100100111110100011000 перед ходом ожидается 7, набрано 1, ловлю бьющий. Человек отдал (правильно). 3) -;- 0110010011111010001100 перед ходом ожидается 7, набрано 2, ловлю бьющий. Человек побил (ошибочно). 4) —10010011111010001100 перед ходом ожидается 8, набрано 2, ловить нечего, программа бьет. 5) +100011111010001100 перед ходом ожидается 8, набрано 3, ловить нечего. Человек бьет. 6 )—1000111110100100 перед ходом ожидается 8, набрано 3, ловить нечего, программа бьет. 7) 400111110100100 перед ходом ожидается 8, набрано 4, ловлю отдающий. Человек бьет (правильно). 8) —001111101000 перед ходом ожидается 8, набрано 4, бить нечем, программа отдает. 9) —0111110000 перед ходом ожидается 8, набрано 4. Еще 4 взятки программа, очевидно, наберет. В этой партии человек ошибся однажды (из жадности). Отдав подряд две взятки, человек не удержался и побил третью взятку. Пример II. Карт 848; ход программы. 1) 40110110000016111 перед ходом ожидается 3, набрано 0, ловлю отдающий, человек отдал (ошибочно). 2) +01011000001111 перед ходом ожидается 4, набрано 1, ход младшей, человек бьет. 3) —010110000111 перед ходом ожидается 4, набрано 1, отдать — ошибка; программа берет. 4) +0101000111 перед ходом ожидается 4, набрано 2, ход младшей; берет человек. 5) —01010011 перед ходом ожидается 4; набрано 2, отдать—ошибка; программа берет. 6)+ 010011 перед ходом ожидается 4; набрано 3, ход младшей, человек берет. 7) —0101 ход человека, поэтому программа получает здесь еще одну взятку. Здесь человек ошибочно отдал первую взятку, не рассчитав до конца очередность ходов в возникающей позиции. Если бы человек побил первую взятку, то возникла бы позиция — 10110000010111, в которой у человека имеется достаточное число ходов старшими шестью картами, для того чтобы у программы брали взятки только три старшие карты.
ОДНОМАСТНА 157 Выводы Перебор вариантов игровой ситуации допускает эффективное ускорение программными методами (в настоящем случае достигнуто ускорение в 1010 раз). Применены следующие способы: 1) Введение граней для отбрасывания ситуаций, чьи оценки выходят за грани. 2) Запоминание рассмотренных ситуаций на случай повторения их или появления подчиненных или близких ситуаций (в точном смысле этих выражений). 3) Построение «машинной» теории данной игры. Грани [2] являются эффективным аппаратом для отбрасывания ненужных вариантов. Они автоматически приводят к продолжению различных веток на разную (необходимую) длину. Человек интуитивно пользуется гранями при анализе вариантов. При запоминании позиций возникают две задачи построения справочных двух типов: из одних оценок и из оценок вместе с ситуациями. При запоминании одних лишь оценок сами ситуации связываются с адресами (точнее, положениями) оценок в памяти. Запись и справка на одну позицию производятся быстро (независимо от количества записанных позиций), но трудно добиться плотной записи, т. е. эффективного использования памяти. Наоборот, при запоминании оценок вместе с ситуациями запись плотна, но время записи и поиска растет с числом уже записанных позиций. По-видимому, человек наводит такие справки быстро благодаря ассоциативной памяти. Машинная «теория» игры сильно отличается от «теории» игры, излагаемой в учебниках для человека. Дело здесь не только в точности языка и наличии всех оговорок — для человека легче выполнение одних рекомендаций, а для программы — других. Наконец, для эффектной игры нужна ловушка. Нужно выбирать не просто лучший ход, но обязательно ход, приводящий к ситуации, где противнику трудно не ошибиться (легко ошибиться или хотя бы возможно ошибиться). Человек расставляет ловушки за счет поверхностного анализа возможностей защиты противника. В заключение отметим четыре технических качества игровых программ. Во-первых, необыкновенное развитие бюрократического аппарата, организующего (лишь в конечном счете) работу исполнительных звеньев, перерабатывающего и подготавливающего информацию. Этот аппарат становится многоступенчатым. Достаточно сказать, что наша программа (не считая справочных) содержит 1500 команд, а собственно ход и ответ — по 3 команды. Во-вторых, необыкновенную живучесть. Целые куски логически неверных звеньев не выводят программу из работоспособного состояния и обнаруживаются лишь на исключительно редких комбинациях. Вопрос о верности программы становится чуть ли не проблематичным, так как в некоторые положения игра вообще не может прийти. Эти положения были предусмотрены лишь потому, что программист не смог доказать их невозможности. В-третьих, необходимость доказывать все используемые обстоятельства. Все, что в процессе программирования было не додумано или принято на веру, в конце концов пришлось переделать. Наконец, игровую программу приходится делать самообучающейся. Она априори играет плохо, но затем выучивается. В нашей программе самообучение маскируется тем, что производится в игре против идеального противника, доставляемого другими частями самой программы.
158 А. Л. БРУДНО, И. Я. ЛАНДАУ Добавление 1 Л е м м а . В одномастке при перемене очереди хода число взяток или сохраняется, или убывает на единицу для игрока, получившего ход. Игрок, сменивший свою карту на большую карту из колоды, или сохраняет, или увеличивает на единицу число своих взяток. Доказательство. 1) Потеря хода не убавляет числа взяток; действительно, передав ход, игрок имеет возможность отвечать той же картой, которой раньше должен был ходить. Дальнейшие утверждения леммы доказываются совместно индукцией по числу карт (при отсутствии карт они, очевидно, верны). 2) Приобретение хода не убавляет числа взяток больше чем на одну. Действительно, пусть мы приобрели ход. Пойдем той же картой, какой раньше отвечали, и сравним новую партию со старой. Тогда: а) если принадлежность первой взятки не изменится, то и очередь хода останется, как в старой партии, но у противника, возможно, сменится одна карта; по предположению индукции это не добавит ему на оставшихся картах более одной взятки; в) если противник, в отличие от старой партии, потеряет первую взятку, то он потеряет ход и как бы сменит карту в оставшейся позиции; последние два обстоятельства, по предположению индукции, принесут ему компенсацию не более чем в две взятки взамен одной потерянной; с) если противник приобретает первую взятку (в отличие от старой партии), то в оставшейся позиции ход перейдет к нему и карты у него останутся хуже, чем прежде; по предположению индукции число взяток противника в оставшейся позиции не возрастет, и, следовательно, общее число его взяток не увеличится больше чем на единицу. 3) Пусть мы сменили одну карту на большую. Покажем, что от этого число наших взяток не убудет. Рассмотрим четыре партии: р, q, r, s. Партии р, q идут на исходных картах, а г, s — на смененных. В партиях р, q, r мы, а в партии/? и противник, делаем ходы и ответы лучшие при исходных картах. В партии s мы, а в партиях q, r, s противник, делаем ходы лучшие при смененных картах. Иногда при этом вместо промененной карты фактически кладется заменившая, и наоборот, что может сменить очередь хода, но не влияет на поведение игроков. Соберем партии в таблицу. I Партия Карты Играем в расчете на карты противник исходные исходные смененные смененные исходные исходные исходные смененные I исходные смененные смененные смененные Для числа наших взяток в этих партиях очевидны неравенства: взяток s^> взяток г; взяток д> взяток р. Покажем, что взяток г> взяток q. В обоих партиях гид противник (и мы тоже) делает те же самые ходы и ответы до окончания взятки со смененной картой. После нее карты в г и q совпадают, но может смениться ход. Если очередь хода не изменится, то все взятки в обеих партиях г и q совпадут. Если же смененная карта изменит очередь хода, то мы получим ход и взятку, которая его компенсирует по предположению индукции. 4) Смена карты противником на большую не увеличит числа его взяток более чем на одну. Действительно, пусть мы (но не противник) делаем
ОДНОМАСТНА 159 ходы и ответы в каждом положении, не замечая смены карты. Тогда либо смененная карта в своем «ходе — ответе» не изменит принадлежность взятки, либо принесет противнику взятку и ход, бесполезный по пункту 1). Лемма доказана. Следствие 1. Вместо любого отдающего ответа можно отдать младшую карту, вместо любого бьющего ответа можно побить младшей из бьющих {без потери взяток). Следствие 2. Если для оптимального ответа достаточно отдать, то можно отдать младшую', если достаточно побить, то можно побить младшей {из бьющих). Следствие 3. Один неверный ответ уменьшит число взяток на единицу. Следствие 4. Один неверный ход уменьшит число взяток на единицу. Доказательства следствий. 1. Карты, оставшиеся после заданного ответа, получаются из карт, оставшихся после ответа, рекомендуемого в 1) заменой одной карты на худшую. По лемме это не увеличит числа взяток в оставшейся позиции. 2. Следствие 2 является частным случаем следствия 1. 3. Сравним партию, начинающуюся с ошибочного ответа, с партией получающейся при верном ответе. Возможны три случая: a) Принадлежность первой взятки не изменилась. Тогда не изменилась очередь хода и у отвечающего сменилась одна карта. b) Отвечающий побил вместо того, чтобы отдать. Тогда он получил лишнюю взятку, но очередь хода перешла к нему и одна карта у него сменилась на меньшую. c) Отвечающий отдал вместо того, чтобы побить. Тогда он потерял взятку, но потерял ход и сменил одну карту на лучшую. По лемме во всех трех случаях а) — с) число взяток может измениться только на единицу. 4. Пусть правильный ход — А, ошибочный — В, а оптимальные ответы на них суть а и Ъ соответственно. Пусть вз {Uu) — число взяток ходящего в случае, если в первом «ходе — ответе» он положил карту U, а противник и. Сперва заметим, что вз {Аа.) ^> вз {АЪ), ибо а — оптимальный ответ на ход А. Далее, вз {АЪ) > вз {ВЪ) — 1, ибо ходы А и В можно считать двумя ответами на ход Ь и сослаться на следствие 3. Таким образом, действительно вз {Аа) > вз {АЪ) >- вз {ВЪ) — 1. Добавление 2 Программа перебора ветвящихся вариантов для получения оценки позиции или выбора лучшего действия (хода) имеет стабильную структуру. Она сохраняется в различных игровых задачах: и в играх нескольких партнеров, и в играх против природы, когда требуется составить оптимальную последовательность действий. При этом допускаемые действия могут каждый раз определяться ситуацией, возникшей в результате последовательности уже сделанных ходов. Информация, полученная программой при оценке уже рассмотренных вариантов, может использоваться ею при исследовании возникающих положений. Вследствие этого число ветвлений в узлах и протяженность различных вариантов могут определяться самой программой. Блок-программа перебора представлена на рис. 5. Здесь различаются хронологическая очередность ситуаций (например, номер позиции или номер хода с начала партии) и очередность вариантов действия из данной ситуации (например, различных вариантов первого хода из данной позиции).
160 А. Л. БРУДНО, И. Я. ЛАНДАУ Программа состоит из движений вперед — к следующей позиции, вбок — к следующему варианту действия из данной позиции и назад — к предыдущей позиции (точнее — к последнему варианту действия, рассмотренному в предыдущей позиции). Движение вперед возникает при необходимости продолжить (разыграть) рассматриваемый вариант ввиду невозможности оценить возникшую позицию, а движение вбок — если нужно рассмотреть дополнитель- Первое действие Нужно ли рассматривать следующий вариант? назад Да вбок вперед Увеличить помер действия первый вариант первое ли действие? следующий вариант да уменьшить номер действия оптимальное действие выбрано и оценено существует ли удовлетворительная оценка? да Рис. 5. ные варианты действия сверх уже рассмотренных. Движение назад выполняется после того как получена удовлетворительная оценка позиции (например, выяснено, что позиция неприемлема). Оценку позиций и выбор очередных вариантов осуществляют программы, специально составленные для решения данной задачи. Программу перебора вариантов можно рассматривать как особый цикл. В алгоритмических языках она может фигурировать в качестве лингвистической единицы, подобной оператору цикла или переключателя. ЛИТЕРАТУРА [1] А д е л ь с о н- В е л ь с к и й Г. М., ЛандисЕ. М., Один алгоритм организации информации, ДАН СССР 146, 2, 1962, 263—267. {2] Б р у д н о А. Л., Грани и оценки для сокращения перебора вариантов, сб. «Проблемы кибернетики», вып. 10, М., Физматгиз, 1963. Поступило в редакцию 15 X 1963.
1У. ВОПРОСЫ МАТЕМАТИЧЕСКОЙ ЭКОНОМИЕЙ ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА И. Л. КРАС С (НОВОСИБИРСК) Введение В данной работе сделана попытка построить алгоритм для дискретного управления непрерывным физическим процессом. В качестве такого процесса рассмотрен процесс плавки металла в ваграночной или доменной печи. В I главе строится приближенная физическая модель процесса. В §§ 1 и 2 рассматриваются интегральные законы сохранения вещества, импульса и энергии, которые после принятия некоторых ограничений сводятся к системе дифференциальных уравнений в частных производных. Для этой системы в § 3 устанавливаются граничные условия. В этом же параграфе рассматривается гипотеза Онзагера и гипотезы феноменологической кинетики. В § 4 после введения ряда ограничений, имеющих реальный смысл, полученная система уравнений значительно упрощается, в результате чего получается, что среднемассовая скорость вещества в активной зоне при постоянном дутье постоянна. При тех же ограничениях в § 5 упрощаются граничные условия. Затем в § 6 рассматриваются те условия, при которых диффузионная часть системы становится одномерной, после чего часть из полученных уравнений интегрируется в § 7, а остальные решения качественно описываются в § 8. Во II главе строятся алгоритмы, управляющие полученной физической моделью наилучшим (в определенном смысле) образом. В § 1 вводится понятие управляющей функции завалки, а в § 2 и § 3 на основе построенной в главе I физической модели выводится дискретная по времени система уравнений управления. В § 4 вводится функционал экономической выгоды и ставится задача об отыскании наилучшего управления в смысле максимума выгоды. Наконец, в § 5 этой главы рассматриваются различные алгоритмы отыскания оптимального управления, а именно показывается, что при одних условиях данная задача сводится к конечной задаче Р. Белл- мана, а при других — к задаче Л. С. Понтрягина. Показывается, при каких ограничениях конечная задача Беллмана может быть практически решена. Кроме того, предлагается метод локальной максимизации функционала выгоды. Выражаю благодарность Игорю Андреевичу Полетаеву за помощь и ценные замечания, которые помогли довести исследование до конца. 11 Проблемы кибернетики, вып. 1.3
162 И. А. КРАСС ГЛАВА I Физическая модель процесса § 1. Строение и функционирование вагранки. Ваграночный процесс состоит в плавлении чугуна и доведении расплава чугуна до нужной температуры, причем во время этого процесса производится частичное улучшение химических свойств металла (придание ему нужного процента серы, марганца и фосфора с помощью флюсов и присадок и выжигание углерода). Ваграночный процесс происходит в вагранке (см. схему на рис. 1). Вагранка представляет собой цилиндр, выложенный изнутри огнеупорным кирпичом. В нижней части цилиндра расположены отверстия (лётки) для выпуска чугуна и шлака. Выше леток расположены отверстия для подачи воздуха под давлением — фурмы; они делятся на основные и вспомогательные. Основных фурм две, каждая из них имеет плавное управление с помощью вентилей. Вспомогательных фурм 6, они могут находиться в двух состояниях (закрыто, открыто); они значительно меньше по размерам, чем основные. В верхней части имеется отверстие, через которое происходит завалка кокса, чугуна или летника (остатки чугуна, получающиеся после заливки форм). За один раз может быть произведена завалка только одного ковша какой-нибудь из перечисленных компонент, а следующая завалка может быть произведена только через время ть определенное техникой завалки. Слив металла производится в барабан объемом у4. Процесс в вагранке протекает следующим образом. В фурмы вентиляторами подается атмосферный воздух с давлением до двух атмосфер. Этот воздух, используемый как носитель кислорода, поддерживает давление в активной зоне вагранки, расположенной выше уровня У2- Пройдя активную зону, кислород воздуха почти полностью используется, превращаясь в С02. Образовавшиеся горячие газы через трубу удаляются в атмосферу. В активной зоне происходит сгорание слоев кокса и образование расплава шлака, стекающего в нижнюю часть вагранки. В этой же зоне, которую называют «холостой колошей», происходит разогревание расплавленных слоев металла, протекающих сквозь нее в нижнюю часть. Так как удельный вес металла больше, чем удельный вес шлака, то расплав металла располагается под расплавом шлака. Верхний уровень Рис. 1. Схема вагранки. 2 — лётка для чугуна; 2 — лётка для шлака; 3 — основные фурмы; 4 — вспомогательные фурмы: 5 — управляющие вентили основных фурм; 6 — заволочный цех; 7 — люлька на подвесной дороге; 8 — отверстие для завалки; 9 — барабан; о — уровень металла (УО; t» — уровень шлака (У?); с — уровень завалки (Уз)', d — уровень «холостой колоши» (У4); е — «козел».
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 163 активной зоны У4 — это поверхность, на которой происходит плавление* слоев металла. В состав шлаков входят кремниевые соединения с высокой температурой плавления. Ввиду этого эти соединения, подвергаясь частичному охлаждению воздухом, выходящим из фурм, кристаллизуются, образуя выросты на стенках печи над фурмами, так называемые «козлы». Для удаления «козлов» применяют плавиковый шпат, который, понижая температуру плавления кремниевых соединений, не дает возможности им кристаллизоваться. Полагая, что воздух состоит из кислорода и азота (неактивного), будем рассматривать следующие компоненты в активной зоне печи: 1) металл, 2) кислород, 3) обычные шлаки, 4) С02, 5) кокс, 6) кремниевые шлаки, 7) азот. Мы будем рассматривать вагранку, вышедшую в «режим», т. е. вагранку, у которой существует У4 (уровень, где может происходить плавление слоев чугуна). Если же температура упадет во всей вагранке ниже температуры плавления чугуна, то приводимое описание процесса будет неправомерным: произойдет остановка процесса — «закозление» вагранки. § 2. Переход от интегральных законов сохранения к дифференциальным. Рассмотрим основные законы сохранения для многокомпонентной смеси в активной зоне вагранки. Если обозначать количество граммов i-й компоненты в 1 см3 через Qf (i от 1 до 7), то для произвольного объема V закон сохранения массы имеет вид -^^Q.dV^^WidV, (1) V где и>{ — масса i-й компоненты, возникшая за счет химических реакций в единицу времени. 7 Суммируя по всем i и учитывая 2jWt=0 (закон сохранения веще- ства), получаем: d ~df V 7 где~()= 2q* (общая масса в единице объема). г=1 _ Если обозначить через vt скорость г-й компоненты, то закон сохранения импульса примет вид 7 7 2 ^ I QM ^ = J S QiFi <W + \ Рп dS, (3). г=1 V V i=i S где Ft — силы, действующие на единичный объем г-й компоненты (объемные силы), S — поверхность границы объема V, Рп — суммарные силы, действующие на 1 см2 поверхности (поверхностные силы). _ 7 7 _ Введем среднемассовую скорость qv= ^ QiVt = Q 2 civii гДе ci—мае- _ i=l i=l совая концентрация i-ii компоненты, и, по существу, есть скорость центра инерции всех рассматриваемых масс*. Тогда из (3) имеем: 7 ~ J QvdV= J ( ^ QhFk) dv+ jj PndS. (3') V V k=i S 11* ^QdV^O, (2)
164 И. А. КРАСС Если обозначить через е% внутреннюю энергию единицы объема i-ii компоненты, то закон сохранения энергии для объема V примет вид 7 ~\ (e+Q^dV+^ (%QhFkdk)dV+l(PnP)dS-]lgdS, (4) V V ft=l У У где Iq — суммарный поток тепла, проходящих! через 1 см2 поверхности 7 Почти все величины, стоящие под интегралами, по существу, являются разрывными для небольших объемов V. Для того чтобы лучше проанализировать выписанные законы сохранения, нам хотелось бы иметь дело с непрерывными величинами. Чтобы перейти к непрерывным величинам, предположим, что рассматриваемые нами объемы больше некоего фиксированного объема Vm-in, такого, что его можно считать бесконечно малым по сравнению с объемом вагранки. В то же время на Vm\n накладывается ограничение, чтобы величины, усредняемые по этому объему, например плотность, скорость, парциальное давление i-й компоненты, не испытывали ощутимого случайного влияния (т. е. такого, которым нельзя пренебречь по сравнению с самой усредняемой величиной), связанного с физической дискретностью этих величин. В силу этого замечания и того, что любые линейные размеры имеет смысл рассматривать только в слу- 2 чае AZ > V^mm , а поверхностные — в случае A«S > (Vmin) , тогда к нашим интегральным законам сохранения можно применить формулу Остроградского— Гаусса и соответственно после преобразований [1, 2] получить: ^L + diwQivi = wi (* = 1 7), (1") 4f-+divQ^=0, (2") 7 7 е^Це^ + ^+^+^^е^ + ^п, (3) t=i i=i 7 Q^-(e + 4) = 2 Q^+div^-div/,, (4") где П — симметричный тензор напряжений в некоторой точке вязкой жидкости, Рх, Ру, Pz — его столбцы, а П=— pl + fr и div (Ш) = JL (Pxv) + ± (V) + ± (Pzv), р — гидростатическое давление, / — единичный тензор, оР — тензор, обусловливающий влияние вязкости. Если для рассматриваемой многокомпонентной смеси принять гипотезу линейной связи между тензором напряжений и тензором скоростей деформаций ех.х. = -^-( "я^Г + ^Г ) » т0 получим обычный закон Навье —
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 165 С то кс а: П =■- —pi + \ \х div vl + 2ц,Ф, 7 где Ф — тензор скоростей деформаций, а \х= Jcifij (\ii — коэффициент г = 1 вязкости i-ii компоненты). Если ввести Ii = Qi(Vi—v)—диффузионный поток г'-й компоненты — ? р и удельную энтальпию п = е-\—, то получим наши уравнения в виде: Q^J-+divIi = wi (i = l, ..., 7), -^ 4- div qv = О, 7 г=1 г=1 где 0^ = divcT4; — ydivaP, а -т— есть оператор полного дифференцирова- 5 ■ "> ния по времени -jr-rvv- § 3. Гипотеза Онзагера и граничные условия. Если рассматривать It и Iq как обобщенные термодинамические потоки, то можно воспользоваться гипотезой линейности [3]: 7 Ik= 2j LikXt; г=1 здесь положено 7о = /9 и X; — обобщенные термодинамические силы. Для выбора сил Xt применим гипотезу Онзагера [4, 5], согласно которой, если выбрать силы так, 7 _ чтобы 2 li^i была равна приросту необратимой части энтропии в еди- г=1 ницу времени, то Lik = Lki. В нашем случае, исходя из 7 TdS = de-^-dQ- 2nikQkdV, (5> k=i где \ik — удельный термодинамический потенциал /с-й компоненты, получаем: 7 _ (/,-2 \lhlk) "S ,. /i=l . ^7^7=-dlV f + 7 + ^(/ru-rgradA*L)-7g!^ + 0„-2^A (6)
166 И. А. КРАСС или, если ввести получаем: где X -X - VT Xk = Fh - V (-!£) + hkXq + ^- V7\ 7 e4r = ~div^+4~( 2 ДХл+дХо + Ф,,), ^=1 _ 7 _ _ q = Iq— 2 hkIk = h, 7 ^ s — ™ есть обратимая часть потока тепла. Отсюда видно, что условие Онзагера выполнено. Если принять, что dek = cVkdT, (7) где cv —удельная энергия к-ifc компоненты, то используя определение \ik [3], можно получить: 7 7« = - в S T Dihdk*-Dj^ In Г, (8) ft=i 7 /)т _ д=-Х'ЧТ-р 2-^^L (9) где 7 с* 7 _ _ 5S = VcJ + 2 c£c?apAiVlnjD + -^- 2 (Q^i-в^л)- (Ю) i=l ft=l 7 Здесь т = — , где rc=2ni (и*— количество молей i-й компоненты), Dih = — ——— ( —— — ) — многокомпонентный коэффициент диффузии, Q >Щ™к \ Qk Qi У Dj = Loi = Li0 — термодиффузионный фактор, — V = L00, с* — -J— мольная . „ / * га Л . « концентрация г-и компоненты ( с* =—г ct ) , т^ — молекулярный вес г-и компоненты, ардг = mk~mi—бародиффузионный фактор. Очевидно, что Dik = Dki; Dit = 0. Итак, с учетом (8) — (10) из (1) — (4) мы получаем для неизвестных _ 7 q, v, с^, Т замкнутую систему уравнений (Р= 2с^м гДе^г—парциаль- г=1 ное давление г-й компоненты, определяется из уравнений состояния каждой из компонент).
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 167 Для газовых компонент в качестве уравнения состояния берем обычное уравнение Клапейрона — Клаузиуса _ Р Q~ RT ' а для негазовых Q = f[T], где / [Т] — экспериментальная зависимость [11], Р — парциальное давление, q — плотность. Для того чтобы поставить граничную задачу для системы (1") — (4"), возьмем законы сохранения на любой поверхности разрыва [1]. Сохранение массы: [q(£>-O]=0; (2a) сохранение массы j-й компоненты: [QCi(D — vn)-Iin]=0; (la) сохранение энергии: [Q(D-vn) (e+ ^ + (Pnv)-(TqZ))=0; (4a) сохранение импульса: №(D-vn)+Pn)=0 (За) (здесь [ф]=ф1 — ф2, где ^t — значение величины ф до разрыва, ф2 — значение величины ф после разрыва, D — скорость поверхности разрыва в данной точке, п — нормаль к поверхности разрыва в данной точке). Сверх этого должно быть задано уравнение, определяющее движение указанной поверхности. Что касается скорости образования г-й компоненты в результате химических процессов, протекающих в вагранке, то она, согласно феноменологической кинетике, выражается через концентрации веществ, участвующих в реакции [6]. Так, если принять, что в рассматриваемом случае идет реакция С + 02 = С02, (И) т. е. пренебречь всеми прочими химическими реакциями ввиду того, что реакции, изменяющие химический состав чугуна, почти не влияют на термодинамику процесса, а количество несгоревшего угарного газа мало по сравнению с образовавшимся углекислым газом, то -jf = - к^щщ + к2пь (12) где к{— константа скорости прямой реакции, к2—константа скорости обратной реакции, Yi — содержане углерода в коксе, или, исходя из определения wu (12) можно переписать так: 4?-■>--Get «■*.+£*). <13> Используя (11) и полученное соотношение (13), имеем: »'=-^. (15) w6 = Y2^3, (17)
168 И. А. КРАСС где тс — молекулярный вес углерода, у2—относительное содержание кремниевых соединений в шлаке. И исходя из нашего предположения, получаем: wi = w1 = 0. (18) Так как cQ мало по сравнению с с3, то мы можем пренебречь участием 6-й компоненты в описываемых процессах, а учитывать с6 только при образовании «козла». Исходя из этого, мы не будем выписывать отдельные диффузионные уравнения для г = 6. Предполагая, что количество тепла, уносимое азотом, и участие его в диффузионных процессах пренебрежимо мало, мы не будем рассматривать и эту компоненту в дальнейшем. Тогда мы будем иметь из 7 только 5 диффузионных уравнений, а всего 8 уравнений. Для реакции (11) характерно, что при Т < Т3 и невысоких давлениях константа реакции к (Т) ъ О (Т3 можно назвать температурой загорания реакции). Температура плавления чугуна (Тп) обладает свойством Тп > Т3, поэтому можно принять, что сверху активная зона всегда ограничена фронтом плавления. Когда рассматриваемый слой чугуна полностью расплавляется, то фронт мгновенно переносится на новый слой чугуна, т. е. слой кокса, лежащий над рассматриваемым слоем металла, уже горит и доведен до температуры Тп. В результате такого предположения мы имеем дополнительное условие на фронте плавления: Т, = Тг = Тп. (19) Введем следующую систему координат: ось Z направлена по оси вагранки, ось У —по оси фурм, а ось X перпендикулярно осям Z и У; все вышеупомянутые операторы будем рассматривать в этой системе координат. Тогда для простоты модели можно положить, что слои кокса и чугуна разделены плоскостями, параллельными плоскости XY (это почти всегда выполнено на практике), а «козел» есть выступ переменного профиля, расположенный над фурмами, высотой по образующей цилиндра I и с угловым раствором ф. Кроме того, если предположить, что все кремниевые шлаки переходят в «козел», то будем иметь: ё гДе Qe — плотность застывших кремниевых шлаков (ее можно считать постоянной), Vk — объем, занимаемый «козлом», 0 —объем активной зоны, или ё где г3 — радиус выступа. § 4. Некоторые упрощения основных уравнений. Практически баро- диффузионные и термодиффузионные эффекты много меньше, нежели основной эффект диффузии, они вторичны по отношению к эффекту диффузии; поэтому для нашей огрубленной модели можно предположить, что все эти эффекты пренебрежимо малы. Заметив, кроме того, что все Ft равны — gz0 (z0 — орт оси Z), имеем: 7 It=-Q 2^Sr- Dtk grade** (i=l, ...,6), (21) ft=i ^=-^gradr; (22) X называют коэффициентом теплопроводности.
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 169; Заметим, что коэффициенты диффузии для многокомпонентных смесей «кусочки твердого тела — газ» и «кусочки твердого тела — жидкость» практически очень малы (такая диффузия практически не происходит); поэтому можно предположить, что эти коэффициенты равны нулю. Из аналогичных соображений можно предположить, что коэффициенты диффузии «газ—расплав» тоже равны нулю. Если теперь обозначить коэффициент диффузии «02 — С02» через D1, а расплавов «шлак — металл» через D2, то, опираясь на сделанное предположение, получим: А= -Q^Dtfcl T2= _Z)lQ^Vc:, (23) 75=0. (25) Исходя из (25) и определения /, заключаем, чтои5 = и, т. е. скорость движения слоев горящего кокса совпадает со среднемассовоп скоростью смеси. Для анализа уравнений движения (3) и энергии (4) воспользуемся методом безразмерных величин. Сделаем следующие замены: v = v0v', x — Lx', y = Ly', z = Lz', t = x0t\ ц, = ц,0|Л q = qoq', p = p0p', где vQ — характерная скорость, равная отношению высоты вагранки ~ 10 м- к среднему времени прохождения возмущения по активной зоне ~ 45 мину т. е. у0~3-10~3 м/сек; L — характерный размер, равный диаметру печи ~2м\ т0 — характерное время процесса —45 мин = 3-103 сек; Qo-10-2 в системе MKS 1 ( таблиц); [i0 — Ю"4 в системе MKS J v h Pq — характерное давление —1 ашм= 10 н/м*. Сделаем указанные замены в уравнении (3"), которое имеет вид ^ (f+f ^+f-,+f ^)= -e^-gradP+div^: тогда получим: / f Оп^п dv' , v% f dv' , . dv' , , dv' , \ ^ ^1Г'- + *»А^У*+а^ + ^О = - QoQ'g*0 ~ ^ Srad P' + l*o % div &'. (26) Если предположить, что как введенные безразмерные величины, так и их производные имеют порядок величины ~ 1, и пренебречь членами порядка 10~6 по сравнению с членами — 1, то будем иметь из (26) gradP= — Qgz0, откуда P=-Qgz + Pb, (27) где Рь — давление на выходе из фурмы. Иначе говоря, в нашем предположении из-за достаточно малой скорости вязкость не оказывает влияния на изменение скорости смеси, а так как процесс протекает достаточно медленно, то он протекает почти стационарно, т. е. можно считать, что v = const и в силу симметрии vx = = vy = 0, откуда vz — v = const Ф 0. (28)
170 И. А. КРАСС В силу приведенных рассуждений уравнение энергии (3) примет вид 6 dh Q ~dt +div (2Iihi)= ~~div ?■ (29) dP i=l Член —тг = VQg по сравнению с прочими членами тоже имеет порядок 10~6, причем, исходя из предположения (7), получим: ■§ = Лхим + сР^, (30) где /гхим — теплота, выделяемая в единицу времени в результате химических реакций, а (31) (32) (cPk — теплоемкость при постоянном давлении/с-й компоненты). Из термохимии [6] известно: 7 — _^1 'гхим — гр% ^ 1 где rPi — теплота реакции, £—степень развития химической реакции (отношение количества непрореагировавшей /с-й компоненты к первоначальному количеству ее [6]). Исходя из определения величины £ и равенств (11), (12), имеем: dl = -^ = /ClYl-i"C2C5— A2-|-C4 (33) dt dt ah т^т5 ~*~" ~* га4 При тех высоких давлениях, которые существуют в активной зоне, равновесие в реакции (11) сильно сдвинуто вправо (диссоциация почти не происходит); поэтому можно принять, что /с2 = 0, т. е. dl 7 Q2 dt—^mcmt0**' (34) Принимая во внимание равенства (14) —(18), (25), (27), (29), (30) и (34), мы видим, что наши уравнения (1) — (4) примут вид: 1 dt^dz U' н dc Qmi?n3 dt dc>t ~li dco dck />2Vc3* = 0, ,»2 "2V^3 e^-div-e»-AVc;=-a2(r)Q*C8C5, div Ш£- D2Vc* = a3 (Г) q2C2c5, Q div Qm2m4 m2 AVc; = a4(r)QVs, Q-rfT= -o5(7,)Q2c2c5, где Q(cp ^- + a6 (f) q2c2c5) + div 2 /**/*=-div (Xgrad f), **i _ 08(r) = 08(r)icii=Y!); а4(Г)=а2(Г)^. mcjnb { <*2 (T) ™2 Yi ra2 (35) (36) (37) (38) (39) (40) (41) (42)
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 171 § 5. Некоторые упрощения граничных условий. Выпишем теперь для системы (35) — (41) граничные условия, заметив, что в силу теоремы единственности решения квазилинейных уравнений [7] для уравнения (35), которое в данном случае не связано с системой, достаточно задать только начальные условия: Q = Q(z)\t=t0. Если обозначить фронт плавления через zi = zi(x, у, t), то на zi будем иметь следующие условия разрыва: Р, = Р2 = Р, (43) так как фронт плавления есть поверхность слабых разрывов. Тогда из (За) с учетом (4а) имеем: vi = v2 = v. По определению с3 = с5 = 0, (44) с2 = 0, ибо можно считать, что весь кислород практически выгорает. Из (За) имеем: Он (zi — vnu) = Qci2 (Zi — vn) + Qy» D2 grad c*; (45) здесь ди есть плотность нерасплавленного металла при Т = ТПЛ, vn = = у51 = v, так как до плавления скорость слоев чугуна совпадает со скоростью кокса, а следовательно, со среднемассовой скоростью, т. е. (45) можно переписать в виде (Qii-Qi2) (k-vna) =-MS-Д2grade?. (45') Из (4а) с учетом (19) имеем: дТ дп дТ 8(z1-v) = X^--X^r\, (46) где б — внутренняя теплота плавления металла, п — производная по нормали к zt и, конечно, выполнено условие (19): тх = тг=тп. Везде на стенках, т. е. на боковом и нижнем основаниях, мы имеем условия с, = 0, 1 = 1, 2, ..., 6, (47) и условие теплообмена с окружающей средой а(Гто-Г)=-^, (48) где а — коэффициент теплообмена, п — нормаль к стенке, Т<х> — температура в цехе. На выходе из фурм вместо условия с2 = 0 будет условие - Q2i^2i = QC22 (*i - vn) + QmS* Di grad c*, (49) m где q21 определяется из уравнения состояния P2i = -~-, Р2 — парциальное давление кислорода в подаваемой воздушной смеси, a v2i—40 м/сек — скорость потока после вентилятора. На температуру налагается условие
172 И. А. КРАСС Что касается «козла», то, так как в (3) были отброшены члены, обязанные вязкости, оставить прямоугольный выступ переменной длины нельзя, ибо на краях этого выступа г/ = оо. Исходя из этого, мы примем гипотезу «застойной зоны», т. е. что весь материал, находящийся над «козлом», не передвигается вниз (это соответствует практике), другими словами, что вся боковая стенка печи нарастает со временем по закону, определенному соотношением (20). Итак, для системы Н мы имеем следующие граничные условия. На фронте плавления: ( Р± = Р2 = Р, vi = v2 = v, с2 = с5 = с3 = 0, (Си —Qi2)(s2 —p)= qmSZ As grade;, с4= 1- ~cii дТ Л дТ дп Tt = T2 = Tn. На боковой и нижней стенках: сг = 0, i=l, ..., 5, На выходе из фурмы: Г cj = 0, i= l, 3, 4, 5, < Q21^21 = Q^22 (*1 — Vn) 4- ! i Dt grade*, Рост стенки г (t) подчиняется соотношению dr 2Ql4>lr^-=yQ6dV. § 6. Переход к одномерной задаче. Для не очень грубой модели,, достаточно удобной для просчета на машине, можно принять, что фурма представляет собой кольцевую щель, расположенную на той же высоте, что и настоящая фурма, причем размер щели lt удовлетворяет условию 2яД/1 = 251,] (50) где R — радиус вагранки, St— площадь входного отверстия фурмы. В результате такого предположения задача станет осесимметричной, и если расписать все наши операторы в цилиндрической системе координат, то производная по углу ф исчезнет, т. е. задача сведется к задаче меньшей размерности. Для наших целей достаточно воспользоваться еще более грубой моделью, а именно предположить, что воздух подается в вагранку с плоскости Z3, параллельной плоскости XY и совмещенной с верхним уровнем расплава шлака (конец активной зоны). Когда эта гипотетическая плоскость доходит до места, где расположены фурмы, происходит остановка процесса, что соответствует реальной заливке фурм жидким шлаком. Что касается граничных условий на поверхности, таким образом
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 173 введенной, и условий, определяющих ее движение, то они будут выписаны несколько ниже. Пока заметим только, что в результате такого огрубления, ввиду полной симметрии процесса, скорости всех компонент будут направлены по оси Z, т. е. IiT = 0 для всех £, а так как в нашем случае It определяются соотношениями (23), то это означает, что -^f = 0, т. е. a=Ci(z, t). Если дополнительно принять, что А, (Т) = const, Dt = const, cpi = const и а* (Г) = const для всех i, что практически при данных температурах имеет место, то получим следующую систему уравнений вместо системы Н: Н' dt dz J л v дсо /" дсо , дсо Q [ S- -i- V Qmim3 а »л , dt ' " dz J dz V m* *-"*■ dz ^ Qz03C2Ca, *+'%)--* (T^i* )-<*»»• ^5 , 7,^5Л_ 2 J — Q <*5C2C5> 0*"~*~У dz 5 t=i •c2c5. (51) (52) (53) (54) (55) (56) (57) § 7. Получение простейших решений. Проанализируем соотношение (6). Как было показано выше, членами, ответственными за вязкость, в данном случае можно пренебречь. Кроме того, в силу определения q h=i а исходя из (22), имеем q-= — Xgrad7\ Но теплопроводность газовых компонент в 10~5 раза ниже теплопроводности расплавов, т. е. можно считать, что участие газовых компонент в недиффузионной передаче тепла мало по сравнению с передачей тепла расплавами. Но тогда А, не зависит от с2 и с4, т. е. изменение энтропии можно представить в виде dS dS dt Qht dSu dt (58) где Qr и Sr — соответственно суммарная плотность и энтропия газовых компонент, а днг и SHr — соответственно негазовых компонент. Применяя отдельно к смеси газов и к остальной смеси гипотезу Онзагера и вспоминая наши предположения относительно коэффициентов баро- и термодиффузии, получим: h = — Qr m2m4 Г) J* Г _ n m2m4 Г) j* 74— —0г-^2"^24О4' degrade*, dl = graded (59)
174 И. А. КРАСС где /)24 есть бинарный коэффициент диффузии, а Qr=Q2 + Q4=Q(c2 + c4): ~cl = -J!2—; C-J = _^_; пг = п2 + щ. (60). Используя соотношение где получим* и, исходя т из = _0г_ г пг (61), с2 _ т2 , и соотношение имеем: <£;= т2 m2m4 1 с2 1 га2 dc2 = 7* С2 с4 га > m4 — ? ^2 4 /?l2m4 С* dc4, c2 + c4=l, т. е. 72 = QrAgrad'c2» /4 = QrjDi grad c4, Или, используя нашу грубую модель, имеем: dz ' 4 *г х dz Рассмотрим уравнение (56). Если сделать замену f=t, то получим из (56) или отсюда )dt (61)' (62). /2 = Qr0i4£; /* = q,A-^-. (62> J'-»*, } » J/= -^5Qc2c5, (56'). -qp^ = - <W2 = - <*5Q2; -C75 J p2(£, *)<** ~a5 I P2(l. О < c5 = <Pi(E)* 'о = cos(0 в <о , (64). где (pi(£)|*=*0 = c05(z) —распределение концентрации с5 по уровням в начальный момент времени. Из (64) видно, что кокс движется волнами вниз со скоростью v и постепенно выгорает по экспоненте, показатель которой растет со временем. Рассмотрим теперь условия на введенной гипотетической поверхности z3. Ниже этой поверхности мы имеем расплавленный шлак и протекающий сквозь него металл, т. е. там среднемассовая скорость есть.
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА • 175 скорость протекания металла сквозь расплав шлака, которую практически можно считать постоянной. Тогда, исходя из (1а), для среднемас- совой скорости перед z3 имеем: ф(vi — v2) = ^P, где Ф — поток массы через z3, АР —скачок давления на ней. Но скачок давления образуется только в результате парциального давления, создаваемого воздухом, поступающим в печь, т. е. АР = с2РВ1 где Рв — давление воздуха на выходе из фурм ^ 1,8 атм, Рв = const. Следовательно, Vi = v2 + C^. (65) Скорость всей смеси до z3 отличается от скорости протекания металла через шлак на малую прибавку, создаваемую давлением воздуха. Что касается Ф, то из (2а) имеем: Qi (*з - vi) = Q2 (*з - и2) = Ф; (66) отсюда можно найти: Q2 = Qi^. (67) Н — v2 Но тогда плотность металла после z3 (и до z3, так как параметры металла не претерпевают никаких скачков на выделенной поверхности) есть Q2 — Qm = QM, где дш — плотность чистого расплава шлака, которую можно считать приблизительно постоянной ввиду ее слабой зависимости от температуры. Следовательно, для уравнений (52), (53), (54), (55) имеем граничные условия: л Q2—Qui n _ Qb r _ Qui _л Qi Qi Qi где qb —плотность вдуваемого воздуха. Что касается z3, то для нее верно — (Яз&з + On^i + Qsi^s) = z3, (68) 62 где vi обозначает, как и прежде, скорость соответствующих компонент, Qti — плотность до z3. Последнее слагаемое появляется, когда не весь углерод кокса выгорает и часть кокса, не сгорая, переходит в шлак. Что касается температурных условий, то ввиду малой плотности воздуха можно предположить, что он почти не влияет на температурный режим поверхности, т. е. считать, что Ti = T2, [~]=0. (69) Величины Т2 и -^— можно найти, решая смешанную задачу для уравнения Лапласа в области, ограничзныой z3 и стенками, на которых задан свободный теплообмен с окружающей средой: где п — нормаль к стенке.
176 И. А. КРАСС Итак, для системы Н' имеем следующие граничные условия: На фронте плавления и на выходе из фурмы те же граничные усло- 1вия, что и для задачи Н. На боковой стенке: а (Г0 T) = -^Z дп На границе «шлак—активная зона»: Va = Uo Qi (23—^1) Q2—Qui Qi c3 = TV Qi 1 ' c2 = c4 = 0, Qb Qi ■1-2 c^ Qi -T0 § 8. Качественный анализ точного решения. Для качественного описания решения уравнений (52) и (54) заметим, что для тяжелых вязких расплавов металла и шлака диффузия играет второстепенную роль (в частности, сам коэффициент диффузии D2 весьма близок к нулю), она только «смазывает» решение, полученное в предположении D2 = 0. (70) Но при условии (70) из (52) и (54) имеем: dt ' dz дсо . дсо (52') (54') или, после замены (63), дс_ dt дс_г dtr Qo3c2cb. Из первого уравнения имеем: ci = c01(£), (71) где с01 (z)— начальное распределение концентрации металла. Из второго с учетом (56): с8=-с5(£, *')^-ф2(Б), (72) где при t = t0 ф2{z) = c03 (z) -\—-c5(z), т. е. в первом приближении металл движется по печи «волнами» со скоростью и, шлак движется аналогично, но его масса постепенно нарастает по мере убывания кокса. Для качественного анализа структуры решения уравнения (57) заме- 5 тим, что слагаемое 2 ^Vz* можно с учетом (70) отбросить, ибо остаю- г=1
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 177 щиеся после этого предположения члены, отвечающие за унос тепла газами, как уже выше было замечено, весьма малы. Если теперь в полученном уравнении ^c^>(4г + г;l£) = -teT-otfc,c5 (57') мы бы положили Х = 0, убрав «смазывающее» действие теплопроводности, то из сравнения с (56) получили бы: Т = °6 ср<*3 где при t = t0 С5(Б.*)+«Ы£). (73) (f3(z) = T0(z)-^c0b(z), °pus т. е. в этом случае увеличение температуры происходит пропорционально количеству еще не сгоревшего кокса. Естественно, что диффузия и теплопроводность «размазывают» полученные «волнообразные» решения. Что касается уравнений (58) и (55), то для качественного описания их решения положим, что Qr и q = const, т. е., по сути дела, приравняем плотности газов друг другу, и аналогично поступаем с расплавами; тогда будем иметь из (53) и (55) с учетом (62) -9r + vlS-=-D^ Q2-Q2^2c5, (53') ^ + »^=-*-&* + &**>• (55') При этом Q2 + -JJQ4 (Щ будет удовлетворять обычному однородному уравнению диффузии (в переменных (63)). Для очень грубого изучения влияния стенок рассмотрим гипотетический стационарный процесс, при котором Т = Т(г) на всех плоскостях £ = const, т. е. тг-7 = 0, и выгорание кокса на всех плоскостях q = const постоянно или q2c2c5 = const = с; тогда из (57) имеем: ^U=-c, 1 dT <PT г dr dr j T = j(r2-rl) + T^ (75) где Г ос — температура на стенке, или с ДГ=(г-г0)^Дг0, (76) причем г<г0</?, где R — радиус вагранки, г0— радиус зоны застоя. Заканчивая рассмотрение данной физической модели, заметим, что ввиду большой подвижности молекул газа можно считать, что изменение площади поверхности фурмы (т. е. увеличение или уменьшение количества подаваемого кислорода) ведет к почти мгновенному понижению концентрации кислорода по всей печи. 12 Проблемы кибернетики, вып. 13
178 И. А. КРАСС ГЛАВА II Управление процессом плавления металла в вагранке § 1. Обозначения. Используя построенное в первой главе описание процесса (модель), обозначим интересующие нас параметры плавки следующим образом: Zi — координата границы между расплавами металла и шлака, z2 — координата границы между шлаком и активной зоной, z3 — координата границы между активной зоной и неактивной зоной (уровень «холостой колоши»), zk — координата уровня завалки (zi1 z2, z3, z4 измеряются от дна вагранки), z5 — температура расплава металла (считается, что весь расплав имеет одну и ту же температуру), z6 — ширина «козла» (измеряется по радиусу от стенки печи). Рассмотрим уровень zt. При постоянном дутье мы можем считать, что если в момент t0 произведена завалка, то уровень может измениться не ранее чем через время t0 -f-Zl *4, где v — средняя скорость продвижения слоев в активной зоне печи. Количественно уровень металла изменится при одной завалке чугуна на величину Az?=h> (77) где G(1) —вес одной завалки чугуна, Qt — плотность расплава металла (как и прежде, считаем, что плотность расплава от температуры не зависит), S — площадь печи. При завалке летника уровень zv изменяется соответственно на величину А^ = Ь; (78) при других завалках уровень расплава металла через указанное время не изменится. Что касается изменения дутья, то оно влечет лишь изменение v (см. (65)); но так как с6 и q6 —величины малые, то в первом приближении можно считать, что г; = const = u0. Для более компактной записи формул (77) и (78) введем управляющую функцию завалки X* (t). Xi(t) — функция, принимающая конечное множество значений (в нашем случае 4). Пусть Xi(t) = 0 соответствует отсутствию завалки, Xi (t) = 1 соответствует завалке чугуна, Xi (t) = 2 соответствует завалке летника, Xl(t) = 3 соответствует завалке кокса. Тогда Xi(t) может принимать значения 1, 2, 3 на время т2, потребное для завалки, и Xi(t) = 0 при всех прочих t, причем расстояние между двумя ненулевыми значениями Xt {t) по оси t равно kxt, где к целое (к > 0), а т1:—время, потребное для подготовки завалочного устройства к следующей завалке. Таким образом, Xi (t) имеет вид, изображенный на рис. 2. Так как т2 мало по сравнению с т1? то мы можем принять, что т2 ^ 0, и и для дальнейшего в качестве Xi (t) рассматривать релейную функцию с четырьмя состояниями.
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 179 Тогда, введя f1(Xi): /i(Xi) = Г О G G2 О при Xj = 3, при Xl = 0, при Xi=i, при Xj = 2, (79) получим: bz, (tt) = z, (ti) — zi (tUi) = h[x± (tUi uo 1A J Tt (80) где шаг по времени tt — £j_i = Д£ < т^ постоянен. % § 2. Вывод уравнений для уровня шлака и границы активной зоны. Рассмотрим уровень шлака z2. Если в момент t0 была сделана завалка кокса, то количество шлака, выделившегося через время *>0 равно z2+M2 q3 jj с3 (Zit) dz *2 1 3 2 1 \ **~л ' П 1 ■U- \'\ J ^. t=t0-[ zj-z_2 x,i (81) Рис. 2. а количество несгоревшего кокса к этому времени будет равно z2-!-A!2 q5 ^ сь (z, t) dz | 22 t=t0+ 24-22 ' (82) vo где q3, q5 —средние плотности шлака и кокса соответственно (считается, что они не зависят от температуры), M2 = —jr — толщина слоя завалки кокса (С3 — вес завалки). Если пренебречь выгоранием кокса из рассматриваемого слоя за время , то увеличение уровня z2 за счет шлакообразования будет А4: z2+AZ2 Г» = Sq3 \ c3(z,t)dz\ Z4_2 22 I V0 а за счет неполного сгорания кокса Д*» = 5(>з ? cs{z,t)dz\ d ,t=to-\ ■ 22 (83) (84) 22 Щ Что касается зависимостей c3(z,t) и c5(z,t), то они могут быть определены соответственно из формул (72) и (64). Заметим, что если мы в момент t = ti изменим дутье, то, хотя мы считаем, что изменение концентрации кислорода произойдет мгновенно по всей печи, на уровне z2 это скажется лишь через время ^ , где Zd — высота фурмы от дна вагранки. Если ввести функцию X2\t), пропорциональную увеличению площади просвета фурмы при открытии 12*
180 И. А. КРАСС заслонки, с помощью которой регулируется дутье, — «управляющую функцию завалки», то можно написать: ь°> = дг-'[х,((,.,-а=а), x,(<M-a=s)j. | В первом (линейном) приближении мы можем разложить &z$(j=l, 2) по q2 (это эквивалентно разложению по х2) в точке Q(20) = maxQ2. Отбрасывая члены второго порядка малости, получим: .А40 = А«Й>[Х1(*,-1Ь=Э)] + где &z$ = c-^—Az^ (с = const); при этом Az^ —0, так как при полном дутье кокс практически полностью выгорает (в нормально рассчитанной печи). Рассматривая суммарное изменение уровня Az2 = Az<» + Az«\ считаем, что шлаки, обусловленные загрязненностью металла, практически на процесс не влияют; тогда + /? |>0-'-*?)] АХ»0"-V)} i • <87> где функции Д?) (Х^ определены равенствами г 0 при Xi Ф 3, A1>(Xl) = l -&-Yi при Х1 = 3, Yi — относительное содержание углерода в коксе, и ( 0 при Х!#3, /(22)(*i) = { с4 = const. [ Ci при Xi = 3, Перейдем к рассмотрению границы активной зоны z3. При «нормальной» работе печи уровень z3 находится в динамическом равновесии, т. е. если в некий момент к уровню z3 подходит слой металла, то за время ;—— он будет опускаться с постоянной скоростью z3, определяемой соот- z3—v0 ношением (46) (AZ± — толщина слоя металла). Если же к уровню z3 подойдет слой кокса, то в силу принятых предположений уровень скачком поднимается на А/3. Динамическое равновесие заключается в том, что из-за соответствующего подбора завалок среднее положение ^3 не меняется за достаточно большой промежуток времени. Для дальнейшего заметим, что если к уровню z3 подошел слой летника, то опускание уровня z3 будет происходить со скоростью kz3, где 0 < к < 1, так как средняя удельная теплота плавления летника почти в два раза ниже, чем у чугуна. Исходя из вышесказанного, можно заключить, что Az3(tt) зависит не только от завалки, сделанной в момент tt— Zlk Zz , но и от v0
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 181 завалки, сделанной в момент z4—z2 и0 0<Нг(У чтоХ, ([J-(V В дальнейшем будем обозначать xi — mxi, где т целое z4 — H v0 J ] и наибольшее из всех допустимых таких, Л ^1 — тпх j ФО ([ ] обозначают целую часть). ti(< z4 — H ^0 ■)] т4 — тт^ через tt—хт. Что касается зависимости уровня z3 от дутья, то заметим, что при уменьшении дутья процессы горения начинают проходить менее интенсивно, т. е. перепад градиента температуры на фронте плавления становится меньше и скорость опускания z3 соответственно уменьшается. Если, как и прежде, использовать линейное приближение, то можно написать: Az3(ti) = f3[xi(ti_ ^о -), ха^-1-^), ДХ2(*,)]-^ (88) где Д/3 при Х = 3, У— любом. z3(c3v -\-\) At при Х=1, У —любом, /3(Х, У, v)=] z3k(c3u+l)At при Х = 2, У —любом, 'z3(c3u+l)At при Х = 0, У=1, z3k (с3и-{-1) At при Х = 0, У = 2, с3 = const. (89) § 3. Полная система уравнений управления. Очевидно, что для уровня завалки zk можно написать: 1 Az,(ti) = fdX1(ti_i)] где MX); 0 при X = 0, AZi при Х = 1, Д/2 при Х = 2, Д/3 при Х = 3. (90) (91) Для температуры расплава металла zb заметим, что завалка чугуна или летника снижает температуру, а завалка -кокса увеличивает ее через 24 Zi , что можно определить из формулы (57). Увеличение время "о дутья увеличивает температуру в активной зоне, что увеличивает температуру расплава через время *d- "0 ; увеличение «козла» сказывается на температуре через время Zd- vq — (по формуле (76)). Следовательно, можно в линейном приближении написать: Az5(ti)={f5[X1(ti_i-^)]+c?X2(ti_1-^) + -)Ч<--^)Н' <92) + <*%(*«_ ^5
182 И. А. КРАСС где ЫА') L<5) при Х = 1, (93) L'5» при Х = 2, Li<L2<0, L<S) при Х==3, L3>0, L<5) при Х = 0, Д5> =-- const, с<° = const > 0, cf = const < 0. Прирост «козла» z6, считая, что он практически не зависит от Х2, мы определим аналогично: дм*1) = /в [х, (^-1-^~-) ] -TV • (94) где 0 при X = 0, Li6) при Х = 1, /в(Х) = L(26) при Х-2, L<» при (95) Х = 3. Числа Zi6) должны быть определены эмпирически, это просто загрязнение завалок различными кремниевыми соединениями (песок и т. д.). Заметим, что при больших «козлах» предположение об отсутствии влияния вязкости теряет силу и среднемассовая скорость в активной зоне начинает зависеть от z6 в первом приближении по линейному закону v(ti)=V0 + Zs(ti)Ku (96) где 0<Х! < 1. Окончательно получаем систему ^z1(ti) = ±u[xl(ti_i-^-)-), + f.B[Xi(tJj-^)]AXa((1.1-^=b)} , Л*з (*«) = ^ П [*i (<«-! - ^) . *i (*Ui - гт), АХ2 (*,) ] , ^(ti) = -^h[xi(ti_1)] , A*. (*i) = ^- {/. [X, (*i-i-*=*) ] +4l,AX2 (*ц_!-=!1) + AM*,)=^/.[Xi(*M--*=^-)]. Эта система имеет смысл при (97) (98) Zi>0, z4<L, где L — длина печи. В системе (97) не рассмотрено влияние состояний выходов (леток) на внутренние параметры процесса z=-{zu z2, z3, z4, z5, z6}. Для того чтобы рассмотреть его, введем еще две управляющие функции: Y1 (t) и Y2 (t), каждая из которых принимает два значения: 0 или 1. Функцию У4 (t) поставим в соответствие летке для металла в том смысле, что Yi = 0
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 183 (99) будет отвечать закрытой летке, a Y^ = 1 — открытой. Аналогично У2 (t) поставим в соответствие шлаковой летке. При открытии летки для металла скорость продвижения материала по печи возрастает на величину х2; это равносильно тому, что мы все содержимое печи начали перемещать вниз со скоростью х2. При открытии шлаковой летки наблюдается та же картина, но со скоростью х3 и только для всех z>zn, где zn — высота шлаковой летки. Поэтому, если все Azj в системе (97) обозначить через A'zj, то с учетом воздействия леток система (97) примет вид Az2 (tt) = Afz2 (tt) + х2У! (tUi) + х3У2 (*ui), Az3 (tt) = A'z3 (tt) + x2Yi (tUi) + x3Y2 (tUi), Az, (tt) = A'zk (tt) + k2Y, (tUi) + x3Y2 {tUi), Az5(ti) = A'z5(ti), Az6(ti) = A'z6(ti). § 4. Введение функционала экономической выгоды. Задача состоит в том, чтобы, взяв систему в некотором состоянии z0 и зная Yi(t), выбрать в промежутке времени Т, исходя из системы (99) и ограничений (98), функции Xi(t), X2(t), Y2(t) «наилучшим образом». Что касается промежутков 7\ то их имеет смысл рассматривать при условии Т >— , т. е. чтобы управляющее действие завалки сказалось на уровне zt. Для выяснения понятия «наилучшим образом» введем функцию выгоды Р (zi, Хл, Х2, Vi, ^2), которую мы грубо определим так: Р = Р(1) [X» (tt)] +P(2) [z6 (t,)] Yl (tt) + P{3) [z (*»)]. (100) Первое слагаемое есть стоимость использованного сырья без учета стоимости дутья и соответственно определяется так: 0 при 1 = 0, p(i) ■^1 Ра) (X) = p<i> *2 при при при X=U Х = 2, х=з, (101) где -Pi1} — стоимость одной завалки г'-го материала и все Р^ < 0. Второе слагаемое есть прибыль, получаемая за выданный металл; оно зависит от температуры металла, так как при 1380° < z5 < 1400° литье возможно только в крупные детали, а при z5 < 1480° литье возможно только в изложницы, т. е. прибыль равна нулю. Итак, Р(2) (z5) имеет вид рт (*») Р<2) ^1 р(2) 0 при при при z5>1400, 1380 <z5< 1400, zb < 1380, (102) где Р(2) — стоимость металла, выпущенного за 1 сек, и все Р™ > 0. Третье слагаемое — это затраты при аварийных состояниях печи, т. е. Для простоты примем, что Р(8) (z) ~ M Р(2) (z) = 0 при min z < z < max z. (103) дальнейшего изложения мы вместо ограничений (98) при 0> zu zk > L, где М « —Р<?\ (104)
184 И. А... КРАСС Тогда Р{3) (z) можно представить в виде ро) (-} = р<з> {Zi) + р(з> (Za) + рсз> {ч) + р(з> (Ze) + pc» (Ze)| (105) где (М при Z! < 0, (ограничение zi < 2Л обусловлено тем, О при 0 < Zi < ял, что при Zi < Zji металл будет ^3,(*2) = -Pf (z5) при zt > zn вытекать через шлаковую летку); О при z2 < zd (P^ — стоимость остановки печи для Р£> при z2>zd ремонта фурм Р(23)<0); [ ° Р?(*ь) М О П(3) * 5 О при zk < L, при z4 > L; при z5 > min;z5, (где шт25 = Гпл, а Р™ — стои- при z5 < min zb мость остановки печи для ликвидации «закозления»), Р™ < Р™ < 0; при z6<maxz6, (где max;z6— критическое значе- (106) P(q)(zq) = \ P™ при z6>maxz6 ние «козла», при котором происходит «закозление»). Введя таким образом функцию выгоды, мы можем сказать, что за период Т наилучшее управление есть то, которое максимизирует функционал т $РЙ0, x4(o, x2(t), r4(01 л. о § 5. Методы решения задачи. К точному решению поставленной задачи можно подойти двумя способами. При Д£ —> 0 получим систему вида dz - dt = <p(Xi, Х2, Yu Y2, z]. где Xi, Х2, 5^2 наДо выбирать из условия max j/>[*(*), Xi(0, Х2(*)> ^i (*)]<«> (107). (108). причем Xt (t) и У2 (0 должны быть релейными функциями и 0 < Х2 < max Х2. Правая часть системы (107) — кусочно непрерывная функция, т. е. удовлетворяет условиям Понтрягина [8]; поэтому для отыскания оптимального управления в классе релейных функций надо составить функцию Н и по ней выписать сопряженную систему. Правда, согласно методу Понтрягина нам надо уметь решать краевую задачу для нелинейной системы обыкновенных дифференциальных уравнений, а как известно, численные методы для решения таких задач пока не разработаны. Вместо точного решения краевой задачи с максимизацией функционала (108) обычно составляют тупиковый алгоритм, дающий функционалу (108) локальный максимум (ВЦ АН СССР). Примем, что X2(t) может принимать только три значения: 0, 1, 2, которые соответствуют состояниям заслонки дутья «закрыто», «открыто
ОБ УПРАВЛЕНИИ ПРОЦЕССАМИ ПЛАВКИ МЕТАЛЛА 185 наполовину», «открыто». Примем также, что переход из одного состояния в другое может осуществляться за время %и что тоже соответствует практике. Наконец, примем, что У$(£=1, 2) также может переходить из одного состояния в другое за время iu что тоже соответствует практике. Тогда, взяв Д£ = т1, мы в каждый момент t0 можем принять к = 24 различных решения о дальнейшем ведении процесса. Кроме того, теперь каждый из zt принимает только определенное количество состояний Nt, б а вся система может принять N= \] Nt состояний, и задача состоит в том,. г=1 чтобы, сделав М шагов, в конце этого процесса получить максимальную выгоду. Как показано у Беллмана [9], для решения данной задачи надо составить функцию г|)м (z) — выгоду, полученную от М-шагового процесса при оптимальном управлении; для этой функции существуют рекуррентные соотношения: -фу (z) = max %-! [ф (z, Хи Х2, Уь У2)], h y>j(z) = m8ixP(z, Xu X2, Fi), k где ф получено из системы (99) при разрешении ее относительно z(tt). Правда, в этом случае Y1 (t) есть уже не заданная функция, а выбираемая. Ввиду наличия задержек процесс (109) может быть начат (причем 7 ч min т (z) не по всем к) только через ^- шагов. Неудобство этого метода состоит в том, что для того, чтобы выбрать оптимальный Л/-гааговый процесс, надо вычислить М функций kj (z) и запомнить их. Если упростить функцию Р [z, Xi, X2, Y\\ и считать, что затраты на сырье несущественны, а надо лишь иметь металл нужной температуры при условии безаварийной работы, т. е. считать, что /> = />*> (z), (100) причем вместо Р™ (z6) подставлять функцию P(2)(z6), то тогда данный М-шаговый процесс будет такой, при котором выгода получается только функцией от конечного состояния. В этом случае, оказывается, существуют алгоритмы, находящие точное решение с гораздо меньшим как количеством действий, так и объемом запоминаемой информации, необходимой для их реализации [10]. При условии, что формула (110) верна, можно принять следующий локальный алгоритм, не дающий, конечно, точного оптимума поставленной задачи, но зато намного более простой, чем вышерассмотренные. На каждом шаге перебираются все возможные управления и выбирается то, которое уводит z в центр безаварийной области по всем zu кроме % — 5, a z5 — в сторону более высоких температур. Этот алгоритм имеет смысл еще и потому, что на самом деле все параметры zt в результате неточности модели подвержены случайным колебаниям и поэтому процесс лучше вести дальше от границ, где можно случайно попасть в аварию. Что касается информации о параметрах z%, то она служит для исправления ошибок, получающихся при использовании данной модели. Заметим, что включение в данную модель работы вспомогательных фурм, присадок и флюсов может быть легко произведено и не представляет теоретического интереса. (109)
186 И. А. КРАСС Заключение В результате исследования основной термохимической системы уравнений получено, что при рассмотренных ограничениях вектор среднемассовой скорости смеси v в активной зоне постоянен и направлен по оси печи, а при переходе к одномерной задаче получаются для концентрации кокса, металла и шлака простейшие волнообразные решения: v -<*ь I p2(z; t)dt c5(z1t)=c05(t)) e <o , Ci(z, 0=coi(£), c3(z, t)= -cb{z, *)-^- + ф1(£), где£ = 2—vt,cob (z), Cqi(z), q>i(z) -c05 (z) = c03 (z) —начальное распределение концентрации кокса, металла и шлака по оси печи, Q2(z, £) —плотность кислорода в печи. Что касается температуры, то с точностью до «размазывающего» действия теплопроводности т— аб <7б С5(2, 0 + фз(£)» где ф3 (z) H — со5 (z) = TQ (z) —начальное распределение температуры. ср<*3 На основе этой физической модели во второй главе получена дискретная по времени система уравнений управления: bz(ti) = 4[Xi(ti-i — ri(z)),X2(ti-i--T2(z)), Y^tt-t), Г2(^-0, i(*i-i)]. Затем введена функция выгоды: Р (Хи Х2, Yu z), после чего были исследованы алгоритмы выбора оптимального управления и показано, что при выборе бесконечно малого шага по времени задача сводится к задаче понтрягинского типа, а при конечном, определенном шаге по времени —к конечной задаче Беллмана, для которой можно предложить различные модифицированные алгоритмы [10]. Рассмотрен один алгоритм локального розыска максимума функционала, который должен работать в условиях данной задачи. ЛИТЕРАТУРА [1] Л а н д а у Л. Д., Л и ф ш и ц Е. М., Механика сплошных сред, М., Физмат- гиз, 1953. [2] К о ч и н Н. Е., К и б е л ь И. А. и Розе Н. В., Теоретическая гидродинамика, т. 2, М., Гостехиздат, 1952. [3] Л е о и т о в и ч М. А., Введение в термодинамику, М.—Л., Гостехиздат, 1952. [4] П р и г о ж и и И., Введение в термодинамику необратимых процессов, М., ИЛ, 1960. [5] Де Г р о о т С, Термодинамика необратимых процессов, М., Гостехиздат, 1953. [6] Карапетьянц М. X., Химическая термодинамика, М.—Л., Госхимиздат, 1953. [7] Курант Р. и Гильберт Д., Методы математической физики, М.—Л., Гостехиздат, т. 2, 1951. [8] П о н т р я г и н Л. С., Г а м к р е л и д з е Р. В., Болтянский В. Г. и М и щ е н к о Е. Ф., Математическая теория оптимальных процессов, М., Физматгиз, 1961. [9] Б е л л м а н Р., Динамическое программирование, ИЛ, 1960. '{10] Dreyfus S., Progress in operations research, ORSA 1, 5, 1961. fll] Сб. «Основы металлургии» под ред. Грейвер Н. С. и др., т. 2, М., Металлург- издат, 1962. Поступило в редакцию 16 IV 1963.
Т. ПРОЦЕССЫ УПРАВЛЕНИЯ В ЖИВЫХ ОРГАНИЗМАХ О СУЩЕСТВОВАНИИ ОБРАТНОЙ СВЯЗИ, РЕГУЛИРУЮЩЕЙ СООТНОШЕНИЕ ПОЛОВ В. А. ГЕОДАКЯН (МОСКВА) Проблема половой дифференциации организмов представляет исключительный теоретический и практический интерес. Она с давних пор привлекает внимание ученых. Овладение методом целенаправленного регулирования пола откроет новые перспективы для животноводства. Численное равенство полов при рождении привело к предположению, что определение пола контролируется генетическим механизмом. Действительно, соотношение 1 : 1 в точности соблюдается при скрещивании доминантного гетероизигота с рецессивным гомозиготом. Согласно этой теории один из полов имеет гибридную конституцию и дает два типа гамет. Этот пол называется гетерогаметным полом. Противоположный пол имеет однородную конституцию по факторам, определяющим пол, т. е. дает гаметы одного типа. Это так называемый гомогаметный пол. У большинства видов, в том числе у млекопитающих, гетерогаметным полом является мужской пол. У других видов, в частности у птиц и бабочек, гетерогаметным полом является женский пол. Дальнейшие цитологические исследования отождествили факторы, определяющие пол животных, с определенными хромосомами — так называемыми половыми хромосомами. Следовательно, все соматические клетки обоих полов имеют одинаковый двойной набор аутосом (2Л) и разные половые хромосомы (2Х — гомогаметный пол и ХУ — гетерогаметный). Соответственно гомогаметный пол дает гаметы одного сорта — с хромосомным набором (А + X), а гетерогаметный — двух сортов: {А + X) ж (А + У). Согласно этой общепринятой в настоящее время цитогенетической теории определения пола, пол зародыша определяется при акте оплодотворения. У организмов с мужской гетерогаметностью оплодотворение, яйцеклетки сперматозоидом, несущим У-хромосому, приводит к развитию мужского зародыша, в то время как оплодотворение сперматозоидом, несущим Х-хромосому, приводит к развитию женского зародыша. При этом считается, что сперматозоиды, несущие Х- или У-хро- мосому, образуются в гонадах в равных количествах и появление того или другого пола одинаково вероятно и является делом случая (рис. 1). Соотношением полов в биологии принято называть количество самцов, приходящееся на 100 самок. Удобно различать первичное, вторичное и третичное соотношение полов. Первичное соотношение полов — это соотношение полов зигот при оплодотворении; вторичное соотношение
188 В. А. ГЕОДАКЯН полов — это соотношение полов при рождении; третичное — соотношение полов зрелой, способной размножаться, популяции. При обзоре литературных данных по вторичному соотношению полов человека и животных [1, 4] обращает на себя внимание одно обстоятельство. Заметные отклонения в величине вторичного соотношения полов Гомогамепшый Мать Гетерогаметныи Отец Зиготы Оплодотборение 2A+XY Дочь Сын Рис. 1. Схема гаметогенеза и оплодотворения. и несоответствия между данными различных авторов наблюдаются в основном для тех домашних животных, у которых человек искусственно меняет соотношение полов зрелой популяции — третичное соотношение полов (преимущественная ликвидация одного пола, кастрация, искусственное осеменение, раздельное содержание полов и пр.). В тех же случаях, когда естественное третичное соотношение полов не нарушается, вторичное соотношение полов удивительно стабильно и имеет значение 100— 110 (табл. 1). Наблюдаемый избыток самцов при рождении пытались Таблица 1 Вторичное соотношение полов у различных животных. Число самцов на 100 самок [1, 4] Человек Кошки Кролики .... Мыши Крысы Крупный рогатый скот 103—107 107,3; 105 104,6; 104,5 105; 109 105 104,6 Лошади Собаки Овцы Свиньи Куры 98,3; 101 118,5 97,7; 115,4 112; 105 94,7; 91,7; 104 объяснить более высокой жизнеспособностью мужских эмбрионов, однако исследования соотношения полов погибших эмбрионов животных [1] и человека [2] привели к противоположному выводу (рис. 2). Оказалось, что учет соотношения полов эмбриональной смерти приводит к значению для первичного соотношения полов человека порядка 125—135 по одним авторам и 170 по другим, вместо ожидаемого по теории 100 [3]. Это может
ОБ ОБРАТНОЙ СВЯЗИ, РЕГУЛИРУЮЩЕЙ СООТНОШЕНИЕ ПОЛОВ 189 ту 1300 быть вызвано различными причинами: либо Х- и У-сперматозоиды находятся в сперме в неравных количествах, либо шансы оплодотворить яйцеклетку у них разные, либо, наконец, может быть имеет место одновременно и то и другое. Вторичное соотношение полов у человека, среднее для всех рас — 105,5 [3, 4]. Много статистических исследований посвящено различным отклонениям от этой величины. Наиболее широко обсуждается в литературе повышение вторичного соотношения полов во время и после длительных войн в странах, участвующих в войне [3—7]. Например, во время первой мировой войны вторичное соотношение полов в воюющих европейских странах возросло в среднем от 1 до 2,5%. Максимальный прирост наблюдался в Германии (вторичное соотношение полов стало 108,5) (рис. 3). Во время второй мировой войны вторичное соотношение полов в Великобритании и Франции к концу 1942 г. увеличилось на 1,5 — 2%. Для объяснения этого явления предлагалось много гипотез. Одни авторы считают, что во время войны вступают в брак более молодые люди, а с понижением среднего возраста родителей связано повышение вторичного соотношения полов. Вторые связывают это с повышением количества первородящих, у которых доля мальчиков также превалирует. Третьи объясняют такой сдвиг вторичного соотношения полов отдыхом I wo rsg V' 563 Р >£ «41 У/ V, 9 «о «о 1 \о \!» V-o \p v^o V«? S^v. ©•<. e^s, оЧ* оЧ, «^ <h Q ^ «О «О <0 tvr СЭэ~ О^ OJ4 СЭ^4 О^ ^, ,Qi с ^ с ^ ^ Fi: Qj ^ <М *-• ^ Й ^ 5 5 Г^ ^ b ^ «О «"О Cvj ^- C4i cvj «О ^ 12 3 4 5 6 7 8 Возраст эмбриона, месяцы 9 Ю Рис. 2. Соотношение полов погибших эмбрионов человека [3] (цифры на диаграмме показывают количественное выражение случаев, в которых был определен пол). 1910 1915 1920 1310 1315 1920 1910 1915 1920 Годы Рис. 3. Рост вторичного соотношения полов во время первой мировой войны [5, 6]. матерей от беременности, большими интервалами между родами. Четвертые все сводят к изменениям диеты, к уменьшению потребления мяса и других белков.
190 В. А. ГЕОДАКЯН Хотя доказательства всех этих гипотез недостаточны, тем не менее большинство авторитетов отдает предпочтение первым двум [7]. Существуют статистически достоверные данные о зависимости вторичного соотношения полов от различных факторов [3,4,7]. Давно было замечено, что вторичное соотношение полов падает с возрастом матери. Так, например, для двух возрастных групп матерей: 18—20 и 38—42 лет — вторичное соотношение полов составляет 120 и 90 соответственно. Вторичное соотношение полов максимально для первых родов и падает при последующих (рис. 4). Такая закономерность показана для человека, собак, 12 3 4 5 6 7 8 %9 10 Хронологический порядок родоб Рис. 4. Зависимость вторичного соотношения полов от хронологического порядка родов [3]. ^ ^ & & & cs с^ s s % % % | % § а § § § £з $ 15 20 25 30 35 40 45 50' Возраст отца (в годах) Рис. 5. Зависимость вторичного соотношения полов от возраста отца [8 J (цифры сверху — количество случаев). мышей и крыс. Недавно Сциллард [8] привел данные, доказывающие, что вторичное соотношение полов падает также с возрастом отца (рис. 5). Так как у человека всегда существует определенная корреляция между возрастом матери, отца и порядковым номером родов и нет статистических данных для зависимости вторичного соотношения полов от каждого из этих факторов при постоянстве двух других, то имеет смысл, по-видимому, говорить только о тенденции понижения вторичного соотношения полов с возрастом родителей. Установлена даже связь вторичного соотношения полов с профессией родителей, комплекцией и прочими признаками [9]. Есть сообщения о высоком вторичном соотношении полов в семьях долгожителей [10, 11], причем играет роль как долголетие отца, так и матери. Вторичное соотношение полов различно в разных странах и у различных расовых групп внутри одной страны [4]. Исследовались отклонения от биномиального распределения вторичного соотношения полов в семьях [12]. Оказалось, что семьи с однополым потомством (одни мальчики или одни девочки) или с сильным преобладанием одного пола встречаются чаще, в то время как семьи с равнополым соотношением или близким встречаются реже, чем можно было бы ожидать при чисто статистическом механизме определения пола (табл. 2). Все приведенные данные говорят против взгляда на механизм определения пола как на чисто статистический, с одинаковой вероятностью появления того или другого пола. На основании анализа этих данных мы предлагаем новый подход для объяснения наблюдаемых явлений.
ОБ ОБРАТНОЙ СВЯЗИ, РЕГУЛИРУЮЩЕЙ СООТНОШЕНИЕ ПОЛОВ 191 Таблица 2 Частота различных соотношений полов в семьях с 12 детьми (общее количество—около 5 миллионов рождений) [3, 12] Количество сыновей 12 11 10 9 8 7 6 , 5 ! 4 ! з 1 2 1 ! 1 0 дочерей 0 1 2 3 4 5 6 7 8 9 10 11 12 Наблюдаемое число случаев 7 60 298 799 1398 2033 2360 1821 1198 521 160 29 6 Ожидаемая частота на миллион 346 3916 20303 63793 135299 204058 224408 181313 106819 44751 12655 2169 170 Наблюдаемая частота на миллион 655 5613 27877 74743 130776 190178 220767 170346 112067 48737 14967 2713 561 Знак разницы наблюдаемая частота — ожидаемая частота + + 1 -U + — — — + + ■ + + + 1. Третичное соотношение полов является специфическим параметром популяций данного вида. Его значение определяется условиями среды. 2. Вторичное соотношение полов — это эволюционно сложившаяся характеристика вида. Его назначение — наилучшим образом обеспечить оптимальное значение третичного соотношения полов. 3. Существует механизм отрицательной обратной связи, который регулирует вторичное соотношение полов при отклонениях третичного соотношения полов от оптимальной величины. Иными словами, соотношение полов у потомства зависит от соотношения полов у поколения родителей. Можно сформулировать принцип, аналогичный известному принципу Ле-Шателье: любое нарушение оптимального соотношения полов взрослых особей вызывает такое изменение в соотношении полов их потомства, которое приводит к восстановлению оптимального соотношения полов в по пуляции в целом. 4. Регулирующую роль в осуществлении обратной связи играет и н- тенсивность половой деятельности. С одной стороны, она связана с параметром популяции — третичным соотношением полов, для каждого пола она убывает с ростом количества особей этого пола и растет с ростом количества особей противоположного пола. Это внешняя ветвь цепи. С другой стороны, интенсивность половой деятельности непосредственно связана с физиологическими параметрами организма, это внутренняя ветвь цепи (рис. 6). Следовательно, легко представить себе, что любые отклонения от нормы (средней интенсивности) могут привести к определенным физио- Вторичное соотношение полов ^—±— Концентрация гормонов ь—г - —1 А д Третичное соотношение полов С Интенсивность . IIUJIUUUU деятельности В Рис. 6. Схема обратной связи, регулирующей соотношение полов.
192 В. А. ГЕОДАКЯН логическим, т. е. в конечном итоге к физико-химическим изменениям в организме (уровень содержания половых гормонов в крови и семенной жидкости, старение спермы и пр.), которые в свою очередь могут повлиять тем или иным путем на первичное или вторичное соотношение полов. Благодаря разной физиологической роли полов в; процессе воспроизводства, существует определенная «асимметрия» в их участии в двух основных аспектах этого процесса — количественном и качественном. Число возможных сочетаний отцовских и материнских генетических признаков пропорционально произведению количества самок и самцов. Его максимум достигается при соотношении полов 1:1. Чем ниже третичное соотношение полов (избыток самок), тем больше относительное количество потомства, так как последнее пропорционально количеству самок и не зависит от количества самцов в силу их больших потенциальных возможностей. Но, с другой стороны, избыток самок приводит к ухудшению полового отбора. При этом средняя интенсивность половой деятельности самок понижается, а самцов повышается и в потомстве превалируют самцы. Наоборот, чем выше третичное соотношение полов (избыток самцов), тем лучше условия для полового отбора, так как степень отбора прямо пропорциональна количеству самцов. Однако общая численность потомства при этом снижается. Поскольку интенсивность половой деятельности самцов низкая, а самок высокая, в потомстве больше самок. Когда наступают неблагоприятные для вида условия (голод, холод, жара, засуха и пр.), прежде всего гибнут самцы и в потомстве в такие периоды преобладают самцы. В природе в основном встречаются «равновесные» отклонения. Изменение третичного соотношения полов сказывается на самках и самцах диаметрально противоположным образом. Если интенсивность половой деятельности для одного пола растет, то для другого она падает (рис. 7). Но можно представить себе и «неравновесные» отклонения, когда оба пола испытывают изменения в одном и том же направлении, например при раздельном содержании полов, когда интенсивность половой деятельности обоих полов малая. Рассмотрение таких «неравновесных» отклонений дает дополнительную информацию для выяснения того, в ком из родителей заложена внутренняя ветвь механизма обратной связи,урегулирующей вторичное соотношение полов. Анализ таких данных позволяет сделать вывод, что решающим фактором является состояние самца, так как при спаривании после раздельного содержания, как правило, увеличивается доля самок [13, 14], а не самцов, что имело бы место, если бы механизм действовал в организме самки. Приведенные выше данные медицинской и демографической статистики (феномен военных лет, зависимость соотношения полов от возраста и некоторых других признаков родителей) легко объясняются с точки зрения предложенного принципа обратной связи. Тем самым эти необъяснимые до сих пор явления становятся аргументами в пользу выдвинутой схемы регуляции (А = /' (В) на рис. 6). О Iff 25 50 75 соотношение пол об (% самцов) 25% ! 75 I ?5 /00 Рис. 7. Схема отрицательной обратной связи между третичным (III) и вторичным (II) соотношениями полов для случаев, когда механизм обратной связи действует в организме самца (жирные линии) и в организме самки (тонкие линии).
ОБ ОБРАТНОЙ СВЯЗИ, РЕГУЛИРУЮЩЕЙ СООТНОШЕНИЕ ПОЛОВ 193 Можно привести также данные, показывающие зависимость вторичного соотношения полов от промежуточных звеньев: интенсивности половой деятельности (А = /" (С)) и гормональной деятельности организма (А = = Г (D), рис. 6). Действительно, во всех случаях, когда почему-либо интенсивность половой деятельности мужского пола высокая, в потомстве наблюдается избыток мужских рождений, а при' низкой интенсивности — женских, независимо от того, чем обусловлена та или другая интенсивность. С одной стороны, это могут быть естественные или искусственные нарушения соотношения полов зрелой популяции: война, голод, полигамия — для людей, раздельное содержание полов, кастрация и искусственное осеменение — для сельскохозяйственных животных. Например, животноводами давно было замечено, что умеренное использование производителей приводит к преобладанию в их потомстве самок, в то время как при интенсивном их использовании в потомстве превалируют самцы. Такую картину еще в 1884 г. наблюдал Дюзинг у лошадей [15], а в 1909 г.— Миллер у крупного рогатого скота [16]. В работе Мамзиной [13] содержатся данные, говорящие о том, что аналогичные явления наблюдаются и у кур. Раздельное содержание петухов и кур перед спариванием приводит к увеличению количества самок: вторичное соотношение полов падает до 66,5, при контроле 130. Курбатов [16] в опытах на кроликах наблюдал понижение вторичного соотношения полов от 99 при частом использовании самцов до 53 при редком, а в потомстве петухов при использовании их через день вторичное соотношение полов оказалось 73,5, при контроле 125. Аналогичную картину приводит Камалян [17]: при большой нагрузке на хряков (больше 15 опоросов на одного хряка) вторичное соотношение полов — 109, а при малой нагрузке (меньше 10 опоросов на одного хряка) вторичное соотношение полов — 94,5. Этот же автор в 1958 г. [14] обнаружил резкие отклонения во вторичном соотношении полов в семьях физиков и геологов, работающих в высокогорных экспедициях. В одном случае из 26 детей в 16 семьях было 5 мальчиков и 21 девочка (II с. п.^24). В другом случае из общего количества 239 детей было 63 мальчика и 176 девочек (II с. п. ^36). Автор объяснил эти отклонения кислородным голоданием, недостатком солей в воде, действием космических лучей и пониженного давления. Исходя из гипотезы равновероятности появления полов, автор подсчитал вероятность чисто случайного возникновения таких отклонений: она равна 9,8-10~4 в первом случае и 6,3-10~17 во втором. С другой стороны, интенсивность половой деятельности связана с уровнем гормональной активности организма, которая определяется наследственностью, возрастом, диетой и пр. В работах многих авторов есть указание на существование тесной связи половых гормонов — андрогенов и эстрогенов — со вторичным соотношением полов. Согласно работам Сиракавы [18] и Курбатова [16] обработка петухов андрогенами приводит к резкому падению вторичного соотношения полов их потомства. По действию же эстрогенов на самок результаты разных авторов противоречивы [16]. Бернштейн [9] приводит данные, согласно которым у людей, страдающих эндокринными нарушениями, такими, как подагра, болезнь Graves'a и др., в потомстве преобладают девочки, а в потомстве лысых мужчин наблюдается избыток мальчиков, доходящий до 40%. Известно, что в развитии лысины также играют роль андрогены. Таким образом, окончательной ясности в этом вопросе нет, но то, что половые гормоны могут повлиять на вторичное соотношение полов, не вызывает сомнения. 13 Проблемы кибернетики, вып. 13
194 В. А. ГЕОДАКЯН Выводы 1. Предлагается новая точка зрения для объяснения изменений вторичного соотношения полов, в основе которой лежит идея отрицательной обратной связи между третичным и вторичным соотношениями полов. 2. Показано, что связующим звеном является интенсивность половой деятельности, которая, с одной стороны, связана с третичным соотношением полов (внешняя ветвь), а с другой стороны, со вторичным соотношением полов (внутренняя ветвь) через гормональную систему. 3. Выявление схемы обратной связи представляет теоретический интерес как пример регуляторной связи от целой популяции к отдельному организму — части этой популяции. 4. Показано, что внутренняя ветвь механизма обратной связи действует в основном в организме самцов. Дальнейшая детализация этой ветви на биохимическом уровне поможет решению проблемы регуляции пола. 5. Понимание механизма регуляции вторичного соотношения полов даст возможность практикам правильно выбрать экономически оптимальное соотношение полов в стаде сельскохозяйственных животных. В заключение автор с признательностью вспоминает об интересег проявленном к настоящей работе, и поддержке, оказанной покойным ныне академиком И. И. Шмальгаузеном. ЛИТЕРАТУРА [1] Grew F. А. Е., The Genetics of sexuality in Animals, Cambridge, 1927. [2] С i о с с о A., Quart. Rev. Biol. 15, 1940, 59—79, 192—210. [3] Stern C., Principles of human genetics, London, 1960. [4] Sex-ratio, Encyclopaedia Britannica, v. 20, London, 1960. [5] Новосельский С. А., Вопросы демографической и санитарной статистики, М., 1958. [6] П а е в с к и й В. В., Бюллетень Петроградского губстатотдела, № 6, 1924. [7] S с h e i n f е 1 d A., Women and men, N. Y., 1944. [8] S z i 1 a r d L., Nature 186, 4725, 1960, 649. [9] Bernstein M. E., Sci. 114. 1951, 181. [10] Lawrence P. S., Quart. Rev. Biol., 16, 1941, 35—79. [11] Lawrence P. S., Human Biol. 12, 3, 1940. [12] Hewitt D., W e b b J. and S t e w a r t A. M., Ann. Human Genet. 20, 1955, 155—158. [13] Мамзияа Е. A., Влияние характера спаривания животных на соотношение полов потомства, Канд. дисс., Л., 1955. [14] Камалян В. Ш., Изв. АН АрмССР. Биол. и с.-х. науки, И, № 4, 1958, 97. [15] D using С, Jena, Z. Naturw. 17, 1884. [16] Повышение продуктивности сельскохозяйственных животных, М., 1961. [17] Камаляя В. Ш., Журнал общей биологии 23, № 6, 1962, 455. [18] Сиракава Т., Ниватори-но кэнкю 32, №11,1957, 44—48 (цит. по Р. Ж. Биол., № 19, 88159, 1958). Поступили в редакцию: первый вариант 14 V 1963, окончательный вариант 8 VI 1963.
ЭВОЛЮЦИЯ В СВЕТЕ КИБЕРНЕТИКИ | И. И. ШМАЛЬГАУЗЕН (МОСКВА) Автоматически регулируемые устройства являются более или менее сложными системами, связанными с внешней средой с помощью входных и выходных каналов связи. Эти каналы находятся под контролем самой системы, органической частью которой является ее регулятор. Регуляция осуществляется внутренними силами системы и определяется ее устройством. Так, например, простейший прибор — термостат обладает входным каналом связи, по которому подается энергия (газ или электричество). Подача энергии контролируется регулятором на основе сопоставления фактической температуры прибора с заданной. Регулятор является органической частью прибора (без регулятора это уже не термостат). Регуляция осуществляется внутренними силами соответственно устройству этого прибора. Все живые существа способны к саморазвитию и к регуляции как внутренних соотношений, так и соотношений с факторами внешней среды. Живые существа объединяются в системы разного порядка, и всем этим системам свойственна способность к автоматической'регуляции их состава и положения в окружающей среде. Простейшей живой системой является клетка с ее миниатюрным, но очень сложным механизмом регуляции. Наиболее высоко организованной и целостной (интегрированной) системой является отдельная особь, обладающая своими каналами связи с внешней средой (дыхание, питание, выделение, органы чувств, железы, органы дыхания), находящимися под контролем самого организма. Особь характеризуется сложными внутренними связями частей и их соподчинением целому. Все эти взаимосвязи определяют возможность регулируемого саморазвития и жизнедеятельности особи. Сами особи объединяются меж собой в системы, называемые населением или популяцией. И популяции обладают своими внешними связями, и внутренними взаимозависимостями, с помощью которых происходит регуляция их численности и состава. Популяции разных видов объединяются в систему, называемую биоценозом. И биоценозы характеризуются определенными взаимоотношениями их элементов (главным образом пищевыми связями) между собой и с факторами неорганической среды. И они способны к саморегуляции своего состава и положения в среде. Во всех этих случаях имеются свои внутренние механизмы регуляции, и для их изучения вполне применимы принципы и методы общего учения об управлении и регуляции, т. е. кибернетики. Эти методы 13*
196 И. И. ШМАЛЬГАУЗЕН имеют особое значение, так как допускают количественный учет многих явлений. Применимость кибернетики в отношении клетки с ее кодом наследственной информации хорошо известна. Широкое применение получила уже кибернетика в отношении физиологических регуляций организма и, в частности, при исследовании деятельности нервной системы. Менее известно, что кибернетика с успехом может быть приложена к процессам индивидуального развития. И, наконец, совсем еще не популярна возможность уяснить механизм эволюции в терминах кибернетики. Элементарной единицей эволюционного процесса является популяция, т. е. совокупность особей определенного вида организмов, связанных общностью происхождения и жизненных потребностей, половыми связями и средствами размножения. Каждая популяция обладает известной численностью (с возможными периодическими и историческими изменениями) и определенной (для данного периода) наследственной структурой, которые поддерживаются на известном уровне соответственно условиям внешней среды-. Это достигается вследствие наличия контролируемых каналов связи с внешней средой и существования внутреннего регулирующего механизма (генетический гомеостазис). Закономерное изменение структуры популяции соответственно историческим изменениям соотношений с внешней средой и называется эволюцией. Кибернетическая схема эволюционного процесса составляется из следующих звеньев, образующих элементарный цикл преобразований: 1. Воздействие биогеоценоза на популяцию путем прямого и косвенного истребления ее особей (входной канал связи). 2. Сравнительная оценка вариантов особей (фенотипов) при этом истреблении и в их дальнейшем размножении. Естественный отбор фенотипов внутри популяции (преобразование популяции, а следовательно, и ее наследственной структуры). 3. Спаривание и размножение отобранных особен. Увеличение концентрации соответствующих генов в популяции (передача и усиление прямой, т. е. наследственной, информации). 4. Индивидуальное развитие по унаследованной программе с прямой регуляцией соответственно внешним факторам. Реализация новых вариантов особей — фенотипов (преобразование наследственной информации в обратную, фенотипическую). 5. Воздействие популяции на биогеоценоз путем захвата жизненных средств (выходной канал связи со средой, несущей информацию о состоянии популяции через активную жизнедеятельность ее особей). Борьба за существование (контроль). Регуляция эволюционного процесса осуществляется, таким образом, внутри системы популяции путем естественного отбора вариантов (сигналов) на основании их сравнительной оценки в биогеоценозе. Результат регуляции передается через посредство сигналов наследственного кода половых клеток, усиливается в процессе размножения и преобразуется в сигналы обратной информации (фенотипы), поступающие в биогеоценоз по выходному каналу связи для контроля исполнения (фенотипов) . Кибернетическая схема эволюции предполагает наличие средств передачи информации от одного поколения к другому и возможность ее переработки. Передача информации от одного поколения к другому осуществляется через посредство тонких структур клеточного ядра, известных под названием хромосом и составляющихся из наследственных единиц — генов. Наиболее существенным субстратом этих структур являются молекулы
ЭВОЛЮЦИЯ В СВЕТЕ КИБЕРНЕТИКИ 197 дезоксирибонуклеиновой кислоты (ДНК). В последовательности расположения ее звеньев — нуклеотидов — заложен код наследственной информации, определяющий через промежуточный этап молекулы рибонуклеиновой кислоты (РНК) последовательность расположения аминокислот и индивидуальные качества белковых молекул. Активные белки — энзимы — в свою очередь определяют течение всех внутриклеточных процессов обмена веществ. Биологические единицы наследственной информации — гены — сложнее химических единиц — нуклеотидов, но также располагаются в линейном порядке внутри хромосом. Наследственная информация передается, как правило, при делении клеток в неизменном виде от клетки к дочерним клеткам. Однако при образовании половых клеток и при оплодотворении наследственная информация комбинируется с информацией, исходящей от другой особи. Таким образом, вносятся уже некоторые изменения, сказывающиеся на развитии особи следующего поколения. Еще большие изменения вносятся, однако, в состав наследственной информации всей популяции в результате процесса естественного отбора измененных особей. В этом случае происходит настоящая переработка наследственной информации как основа процесса эволюции. Фенотипы, т. е. конкретные особи, являются носителями обратной информации, передаваемой для сравнительной оценки в данных условиях существования. Единицей обратной информации является для популяции только целая особь. Естественный отбор происходит на основе сравнительной оценки особей по их фенотипам, т. е. по их организаций и жизненным проявлениям. Однако отбор фенотипов естественно связывается с отбором тех наследственных кодов, которые определили развитие данных фенотипов. Каждое изменение наследственного кода оценивается по результатам его реализации в процессах индивидуального развития и в жизненных проявлениях реализованной особи. Этот «кибернетический» цикл является лишь перефразировкой дарвиновского понимания эволюции. Применение понятий кибернетики позволяет, однако, внести большую ясность в понимание отдельных звеньев этого цикла и в особенности в определение места, занимаемого «борьбой за существование» как сложной системой контроля, в расчленение этого понятия и в количественную оценку многообразия форм как материала для естественного отбора. Обратим особое внимание на то обстоятельство, что регуляция эволюционного процесса осуществляется посредством циклического механизма с обратной связью на основе сопоставления полученных результатов (фенотипов) в реальных условиях существования популяции (т. е. в биогеоценозах). Сравнительная оценка особей завершается естественным отбором, что вместе с половым процессом ведет к преобразованию генетической структуры популяции. Оценка новых фенотипов может быть положительной, и это ведет к их размножению, т. е. к увеличению концентрации соответствующих генов в популяции, а вместе с тем к суммированию и нарастанию их фено- типического эффекта в особях следующих поколений. Это — движущая форма естественного отбора. Оценка новых фенотипов может быть и отрицательной. Это ведет к их элиминации, к уменьшению концентрации соответствующих генов в популяции и к вычитанию их фенотипического эффекта. Это означает стабилизирующую форму естественного отбора, поддерживающую устойчивость механизма индивидуального развития, фенотипов и всей структуры популяции. Движущая форма естественного отбора, т. е. регуляция с положительной обратной связью, характерна для саморазвивающейся системы в
198 И. И. ШМАЛЬГАУЗЕН условиях адаптации к изменению в соотношениях с внешней средой (биогеоценозом). Стабилизирующая форма естественного отбора, т. е. регуляция с отрицательной обратной связью, характерна для системы, достигающей стационарного состояния при данных условиях существования. Эволюция организмов не исчерпывается, однако, эволюционными преобразованиями отдельных популяций. В эволюции вида выражается не суммарный, а интегральный эффект преобразования популяций. В межгрупповом соревновании выявляются качественные и количественные показатели процессов адаптации различных популяций, которые оцениваются в групповом естественном отборе. Таким образом, над элементарным циклом эволюционных преобразований популяций имеется надстройка в виде более широкого цикла преобразований, охватывающих весь вид в целом. Здесь контролируется общий результат самого эволюционного процесса (и, в частности, его скорость), протекающего в отдельных популяциях. Это ведет через отбор наиболее преуспевающих популяций к регуляции качеств эволюционных преобразований в системе вида. Таким образом, эволюция всего вида в целом протекает в самонастраивающейся системе, состоящей из элементарных циклов регуляции в каждой популяции (а также расе, подвиде) и общей регулирующей надстройки в системе вида. Кибернетический подход принимает дарвиновское понимание эволюции, но позволяет внести некоторые уточнения и новые методы исследования. Количество наследственной информации в особи может быть измерено по числу генов, которые фактически встречаются в виде мутаций. Количество фенотипической информации вычисляется по концентрации вариантов в популяции. Количество информации является удобной мерой многообразия форм, входящих в состав популяции. Оно допускает простое суммирование данных по разным вариантам. Понятно, что количество фенотипической информации может служить основой для измерения интенсивности борьбы за существование и определяет границы возможной скорости естественного отбора. Мы здесь остановимся только на одном — на понимании борьбы за существование как контролирующего аппарата эволюции. Понятие борьбы за существование еще недавно было у нас предметом «дискуссии». Нужно признать, что термин «борьба» выбран Дарвином не совсем удачно, и это привело ко многим недоразумениям. Кроме того, Дарвин не дал определения понятия, а ограничился приведением примеров, поясняющих широкий его смысл. Это давало возможность различных толкований, в результате чего понятие «борьба за существование» стало совершенно расплывчатым. Поэтому некоторые дарвинисты совсем отказывались от его применения. К. Тимирязев пользовался вместо этого понятием «элиминация». Современные генетики обходятся и без этого, изучая непосредственно естественный отбор в популяциях. Однако как элиминация, так и естественный отбор являются результатом борьбы за существование, реальности которой нельзя отрицать. Необходимо лишь уточнить это понятие и показать его место в процессе эволюции. В теории Дарвина это место выступает с полной ясностью и при внимательном ее изучении не могло бы служить предметом дискуссии. Между тем некоторые биологи доходили до таких нелепостей, как простое отрицание внутривидовой борьбы. Однако споры о том, какая форма борьбы — внутривидовая или межвидовая — острее или важнее (для процесса эволюции), также лишены смысла, так как эти формы борьбы несравнимы — они лежат в разных плоскостях. При понимании борьбы за существование как контрольного механизма, в котором дается оценка
ЭВОЛЮЦИЯ В СВЕТЕ КИБЕРНЕТИКИ 199 особям, популяциям или видам организмов, все это становится совершенно ясно. Мы разбирали вопрос об эволюции популяции (как наименьшей надиндивидуальной системы). В этом случае в контрольном механизме дается сравнительная оценка особей данной популяции (в данном биогеоценозе). В этой оценке, выражаясь образно (по Дарвину), выявляется результат внутрипопуляционного соревнования особей. Если мы поставим вопрос об эволюции всего вида в целом, то и контрольный механизм мы должны отнести к виду в целом. В нем подвергаются сравнительной оценке отдельные популяции. В этом случае можно говорить о внутривидовом соревновании особей разных популяций. Если же иметь в виду эволюцию биоценозов, то в этом случае решающее значение имеет сравнительная оценка целых видов, т. е. межвидовое соревнование особей в условиях данного биогеоценоза. Поступило в редакцию 30 I 1964. От редакции. Статья И. И. Шмальгаузена «Эволюция в свете кибернетики» печатается впервые и без малейших изменений в том виде, в каком она была найдена при посмертном разборе архива.
VI. ВОПРОСЫ МАТЕМАТИЧЕСКОЙ ЛИНГВИСТИКИ О СТРУКТУРНОМ АНАЛИЗЕ ВЬЕТНАМСКОГО ТЕКСТА И ОДНОМ СПОСОБЕ ЗАПИСИ ЕГО РЕЗУЛЬТАТОВ Т. Л. ГАВРИЛОВА (ВЛАДИВОСТОК) Предлагаемая работа была выполнена в 1958—1959 гг. с помощью Ю. К. Лекомцева, которому автор выражает большую благодарность. Результаты работы были доложены на Всесоюзном совещании по вычислительной математике и вычислительной технике в ноябре 1959 г. в Москве. § 1. Предварительные сведения о деревьях Назовем кантороеым деревом С совокупность всевозможных конечных упорядоченных наборов нулей и единиц, начинающихся с нуля. Каждый набор будем называть узлом, характеризуемым этим набором. Будем говорить, что узел а = (iu i2, ..., ik ) подчинен узлу Р = (/*!, /2, .. ., //г ), если выполнены два условия: 1) /са=--/ср + 1; 2) im = Jm, еСЛИ 1</ГС</Ср. В этом случае узел (5 будет называться подчиняющим узел а. Подмножество С множества С назовем связным, если 1) существует только один узел р = (it, i2, . ..,*ьв), для которого Ap = minA:a и который мы впредь будем называть корнем С; a GC 2) для каждого узла а£С", не являющегося корнем, в С существует узел, его подчиняющий. Деревом будем называть любое конечное связное подмножество, KzzC. Назовем узел a £ К концевым в дереве К, если в if не содержится ни одного узла, подчиненного узлу а. Узел, не являющийся ни корнем, ни концевым, будем называть внутренним. Узел а£К назовем узлом ветвления, если в К содержатся оба узла, подчиненные узлу а. На рис. 1 приводится геометрическая интерпретация канторова дерева С. Здесь узлам соответствуют точки, подчинение изображено отрезком, верхним концом которого является подчиняющий узел, а нижним — подчиненный. Узел (0) является корнем для С. Тут же приведены примеры дерева и связного подмножества С множества С; пунктиром отмечено связное подмножество С", в котором узел (0, 1) является корнем С"; сплошной линией обведено дерево К, в котором узел (0, 0) является корнем, узлы (0, 0, 0, 0), (0, 0, 0, 1), (0, 0, 1, 0) —концевыми, узлы (0, 0, 0) и (0, 0, 1) — внутренними, узлы (0, 0, 0) и (0, 0) —узлами ветвления.
.202 Т. Л. ГАВРИЛОВА Рис. 1. Назовем дерево правильным, если его корень и все внутренние узлы являются узлами ветвления. Далее введем определение квазиконцевого узла к-то порядка. Определение будем вводить по индукции. Квазиконцевым узлом 1-го порядка назовем узел ветвления, если оба подчиненные ему узла суть концевые. Предположим теперь, что мы уже определили понятие квазиконцевых узлов всех порядков до (п — 1)-го включительно. Квазиконцевым узлом п-го порядка назовем узел ветвления, у которого оба подчиненных ему узла суть квазиконцевые узлы (п — 1)-го порядка. Назовем узел предельно квазиконцевым, если он является квазиконцевым узлом некоторого порядка т, а подчиняющий его узел не является квазиконцевым узлом (m-f-l)-ro порядка. Введем еще определение производного /с-го порядка от дерева К. Это определение мы также будем вводить по индукции. Производным 1-го порядка от дерева К назовем дерево К±, состоящее из всех узлов дерева К, за исключением концевых, подчиненных квазиконцевым 1-го порядка. Считая, что мы определили производные деревья всех порядков до (п— 1)-го включительно от дерева К, назовем производным п-го порядка от дерева К дерево Кп, производное 1-го порядка от дерева Кп-±*). Примечание. Если для некоторого т, где га>1, Кт=Кт+1, то для всех i и / таких, что г, />#г, имеем Kt^sKj. Порядком дерева назовем число его концевых узлов. Рангом дерева К назовем такое наименьшее положительное целое число г, что производное г-го порядка от дерева К совпадает с корнем дерева К. Вообще говоря, ранг существует не у каждого дерева. Проиллюстрируем введенные понятия геометрически. На рис. 2 приведен пример правильного дерева. Одной чертой подчеркнуты квазиконцевые узлы 1-го порядка, двумя — квазиконцевые (o,w,o)(o,w) Рис. 2. *) Очевидно, при любом i(j = l, 2, ...)Ki будет деревом.
О СТРУКТУРНОМ АНАЛИЗЕ ВЬЕТНАМСКОГО ТЕКСТА 203 узлы 2-го порядка. Отмечены производные 1-го, 2-го, 3-го, 4-го и 5-го порядков от дерева К, Kt = К5 для всех i > 5. Узлы (О, О, О, 0) и (О, 1, 1, 1) являются предельно квазиконцевыми, они на рисунке отмечены кружками. Порядок дерева равен одиннадцати, ранг — пяти. На рис. 3 приведен пример дерева, для которого ранг не существует, так как все производные от этого дерева, начиная с 3-го порядка, совпадают между собою и отличны от корня дерева К'. Будем называть дерево, состоящее из одного корня, вырожденным. Теорема 1. Для того чтобы невырожденное дерево К было правильным, необходимо и достаточно, чтобы существовал ранг этого дерева. Доказательство. I. Необходимость. Предположим, что Кт существует и отлично от Km-i (для т = 1 это во всяком случае верно в силу правильности дерева К0 = К). 0) Возможны два случая: 1) Кт имеет хотя бы один квазиконцевой узел 1-го порядка. Но тогда существует Кт+1фКт, и тогда вернемся к рассуждениям п. 0), рассматривая Кт+1 в качестве Кт. 2) Кт не имеет ни одного квазиконцевого узла 1-го порядка. Так как К — правильное дерево, то это возможно лишь в том случае, когда Кт вырождается в корень К. Но это означает, что ранг К существует и равен т. II. Достаточность. Из существования ранга г дерева К следует, что К имеет производные всех порядков от 1 до г включительно, не совпадающие тождественно, причем Кг выродилось в корень К. Но это и означает, что каждый внутренний узел К и его корень суть узлы ветвления, т. е. что К — правильное дерево. Теорема 2. Правильное дерево однозначно определяется заданием всех своих квазиконцевых узлов 1-го порядка. Доказательство. Заданное конечное множество всех квазиконцевых узлов 1-го порядка рассматриваемого дерева обозначим через М,~{ау}. 0) В силу правильности К по Mi однозначно определяется М0 — множество всех концевых узлов, подчиненных квазиконцевым узлам 1-го порядка, а именно: по каждому узлу av = (^, i2, ...,ii) однозначно определяется пара концевых узлов, подчиненных av: (Ч, *2» • ••> \, 0) и (ч, £2, . .., ц^ 1). 1) Через М[ обозначим подмножество узлов, принадлежащих Ми для которых в Mi нет парных (два узла мы называем парными, если они подчиняются одному узлу*)). В силу правильности К в него наряду с М[ обязательно войдет М[ — множество узлов, парных к узлам из Mt, ') Для корня парный узел не определяется, корень в М[, М\ ... не вносится.
204 Т. Л. ГАВРИЛОВА т. е. К содержит множество узлов Mt = М^М[, в котором все узлы имеют парные. По каждым двум парным узлам из Mt однозначно определяется подчиняющий эти узлы узел. Совокупность таким образом определенных узлов мы обозначим через М2. Очевидно, M2CZK. 2) Применим к М2 рассуждения п. 1), подставляя М2 всюду вместо Ми М3 — вместо М2. Затем применим рассуждения п. 1) к М3 и Mk и так далее до тех пор, пока очередное множество Мп не будет состоять из одного только узла, который и явится корнем определяемого правильного дерева*). Тогда KZDMoljMilJMzl} ... IJ^n-iU^. Обратное включение очевидно. Таким образом, К = M0[JM i\J • • • U^n-iU^n- Теорема 3. Правильное дерево однозначно определяется заданием всех своих предельно квазиконцевых узлов с указанием их порядка. Доказательство сводится к доказательству теоремы 2, так как по заданным квазиконцевым узлам /с-го порядка (в силу определения) однозначно определяется множество всех квазиконцевых узлов (к— 1)-го порядка (см. п. 0) в доказательстве теоремы 2), по этим узлам — множество квазиконцевых узлов (к — 2)-го порядка и так далее до тех пор, пока не определятся квазиконцевые узлы 1-го порядка. Замечание 1. Не всякое множество узлов может быть задано в качестве множества квазиконцевых узлов одного порядка: например, в это множество не могут войти два узла, из которых один подчинен другому. Замечание 2. Производное /с-го порядка от дерева К непременно содержит все квазиконцевые узлы /с-го порядка дерева К. Пустота множества квазиконцевых узлов /с-го порядка, однако, не отрицает существования производного /с-го порядка от дерева К, отличного от производного (к—1)-го порядка от дерева К. На рис. 2 приведен пример дерева, у которого пусты множества квазиконцевых узлов всех порядков, начиная с 3-го, и тем не менее существуют производные всех порядков, кончая 5-м, не совпадающие тождественно. Теорема 4 (о числе правильных деревьев тг-го порядка). Можно построить ■ , f f различных правильных деревьев п-го порядка с корнем, совпадающим с корнем С. Доказательство. Обозначим через у (п) при гс>2 число указанных правильных различных деревьев тг-го порядка. Кроме того, положим ф (1) = 1. Очевидно, ф(2) = 1. Предположим теперь, что мы уже подсчитали ф(1), ф(2), ..., Ф(и—1). Тогда ф(п)= 2 ф(а)ф(Р)- Рассмотрим производящую функцию Очевидно, <р(к)=±РЧ0). Функция / (х) удовлетворяет функциональному уравнению P(x)-f(x) + x=0. (*) *) Это произойдет через конечное число шагов в силу конечности К и конечности каждого набора, характеризующего узлы из М±.
О СТРУКТУРНОМ АНАЛИЗЕ ВЬЕТНАМСКОГО [ТЕКСТА 205 Действительно, № = (1ф(*)**)(§ ф(0**) = fe=l г=1 оэ оо оо = 2 Еф(*)ф(») *'i+i = 2 ф(«)«т = /(*)-«. fe=l i=l т=2 Решая уравнение (*) относительно f(x), получим: f(x) = j(l±VT=te). Так как по определению / (х) иредставима в виде ряда по степеням х без свободного члена, то /(.х) = 1(1-уТ^4^). Следовательно, 4(^ / х (2п—3)!!2"-1 , , (2п—2)1 (1— 4а?) 2 Теорема доказана. Будем говорить, что в невырожденном правильном дереве узлы, подчиненные его корню, расположены на 1-м ярусе в дереве. Очевидно, число узлов на 1-ярусе равно 2. Считая, что мы уже определили узлы, расположенные на А-м ярусе (Лс>1), будем говорить, что узлы, подчиненные узлам, расположенным на /с-м ярусе, расположены на (к-\-\)-м ярусе. Число узлов на &-м ярусе не превосходит 2k. Теорема 5 (о кодировке правильного дерева). Правильное дерево ранга г(г>Л) с заданным корнем можно закодировать в алфавите {0, 1} словом длины /,., где 2r — 2<Zr<2'' — 2. Доказательство. Опишем сначала способ кодировки. Каждый узел дерева, расположенный на /с-м ярусе (1 <&</•—1), закодируем однобуквенным словом б: (1, если узел не концевой, о = { _ [ 0, если узел концевои. Из кодов узлов составляется слово —код дерева. В нем коды узлов располагаются в следующем порядке: сначала записываются коды узлов, расположенных на 1-ярусе (в порядке их расположения на ярусе слева направо), затем — коды узлов, расположенных на 2-м ярусе (в таком же порядке), и так далее до кодов узлов (г—1)-го яруса включительно. Таким образом, длина кэда дерева не зависит от числа узлов, расположенных на r-м ярусе. Например, правильное дерево 4-го ранга, изображенное на рис. 4, имеет на 1-м ярусе 2 узла, на 2-м ярусе —4 узла, на 3-м —4 узла, на 4-м —2 узла. Оно кодируется словом «1101011000» длины / = 2 + 4 + 4=10. Правильное дерево 4-го ранга, изображенное на рис. 5, имеет на 4-м ярусе уже не 2, а 8 узлов, чем и отличается от дерева, изображенного на рис. 4. Оно кодируется словом «1101011111» длиною также 10. Правильное дерево 1-го ранга кодируется пустым словом. Еоли корень дерева задан, то по коду правильное дерево восстанавливается однозначно, причем восстановление идет по ярусам: сначала восстанавливаются узлы, расположенные на 1-м ярусе, затем узлы, рас-
206 Т. Л. ГАВРИЛОВА положенные на 2-м ярусе, и так далее до (г—1)-го яруса. Узлы последнего, r-го яруса» восстанавливаются по кодам узлов, расположенных на (г—1)-м ярусе: узлы (г—1)-го яруса, закодированные единицами; • (0Д1Д0) (0Д1Д1) Рис. 4. являются в силу правильности дерева узлами ветвления; следовательно, дерево содержит узлы 7*-го яруса, подчиненные вышеуказанным узлам (г— 1)-го яруса. Оценим теперь длину кода правильного дерева ранга г>1. Сод/до) (одщО (одио) (oaw) (цццф (щ,Ш(шШ(Ш10 Рис. 5. Очевидно, самый короткий код получит дерево, имеющее на каждом ярусе, кроме последнего, только два узла, т. е. минимальное количество. Длина этого кода lr = 2(r—1). Заметим, что имеется 3-2Г~2 различных правильных деревьев ранга г с заданным корнем, имеющих код минимальной длины. Наибольшую длину кода 1Г будет иметь дерево, на каждом ярусе которого с 1-го до (г—1)-го включительно будет располагаться макси-
О СТРУКТУРНОМ АНАЛИЗЕ ВЬЕТНАМСКОГО ТЕКСТА 207 \одш) J \om)J \щи)/ \o,w)l \одц) ФДДДД) ФШ ' (ОШ Щ (ОДДО) (0,1Д0Д) (0Д!,0) (0Ш0) (ОМО) Код дерева „//////////////",- max 1^=2^-2=14 (0Д0) Шодо) (ощо) Код дереда J1W11" ,• min 1<.=2(Ч)=6 Код дереда „1WW001"; 14=2+4+2-8 Рис. 6.
208 Т. Л. ГАВРИЛОВА мально возможное число узлов. Очевидно, тах/г = 21 + 22+ • • • +2Г 1 = = 2 (2r_1— 1) = 2Г — 2. Существует 2зГ —1 различных деревьев ранга г € заданным корнем, имеющих код максимальной длины. Таким образом, код любого правильного дерева ранга г с заданным корнем будет иметь длину Zr, для которой справедлива оценка 2r-2<Zr<2r-2. На рис. 6 приведены примеры деревьев 4-го ранга с корнем в узле (0), имеющих коды: а) самый длинный, б) самый короткий и в) промежуточный по длине. § 2. Опыт структурного анализа вьетнамского текста Первоначальная цель работы, результаты которой изложены в этом параграфе, —построение алгоритма независимого анализа вьетнамского предложения. Алгоритм был построен на основании исследования текста объемом в 27 предложений, взятого из двух математических учебников: перевода учебника Виноградова по теории чисел и школьного вьетнамского учебника по-алгебре. Отметим, что вьетнамский язык был выбран из-за его простоты: вьетнамские слова неизменяемы; математический текст столь малого объема был взят ради ограниченности словаря и относительной простоты грамматической конструкции (вначале предполагалось, что в дальнейшем объем текста будет постепенно увеличиваться, а построенный алгоритм — усовершенствоваться, но впоследствии наши исследования пошли по другому пути). Из сказанного следует, что построенный алгоритм, вообще говоря, непригоден для анализа любого предложения вьетнамского языка. При построении алгоритма разбиение всех слов текста на классы и список парных конфигураций считались заданными. Ниже приводится список классов, употребленных в алгоритме анализа. № класса Наименование класса I Символ ■Л" I I 1 | Существительное I 2 j Числительное, употребляемое в роли I (уществителыюго ! S' 3 j С ществительное, характеризующее j I собою место или время . . S1 4 Предлог си'а IV 5 Классификатор Р 6 ] Показатель множественного числа . . IV" 7 | Предлог (не си'а) Я" 8 | Глагол got V0 9 ! Глагол la' У1 10 | Вспомогательный глагол .... V 11 Прочие глаголы V 12 I Частица при глаголе U 13 I Наречие А 14 Подчинительный союз .... . . . с 15 Сочинительный союз. ... . . . '■ с' 16 Формула N 17 Глагол в роли прилагательного . . . ; У0пр I i Для конфигурации, образованной классами хну, вводится обозначение xy=$z, где z — результирующий элемент конфигурации. По комби-
О СТРУКТУРНОМ АНАЛИЗЕ ВЬЕТНАМСКОГО ТЕКСТА 209 наторным свойствам (способности образовывать конфигурации) результирующих элементов все конфигурации из заданного списка делятся на три группы: 1-я группа — конфигурации, результирующие элементы которых сохраняют комбинаторные свойства каждого из классов, образующих конфигурацию; 2-я группа — конфигурации, результирующие элементы которых сохраняют комбинаторные свойства одного из классов, образующих конфигурацию; 3-я группа — конфигурации, результирующие элементы которых приобретают новые комбинаторные свойства. Ниже приводится список заданных конфигураций. № ,конфигурации 1 2 3 4 5 6 7 8 9 10 И 12 13 14 15 16 Конфигурация R'»S =ф S PS=^S R"S=$Sf R'S=$S ss=$s S(R'S)=^>S uv=$v { »-- vs=$v <V(R"S) v \(R"S)V-^V vn^v VS =Ф Sl V (сП) =^> V Группа 2 2 3 3 2 2 2 2 2 2 2 2 2 2 3 2 № конфигурации 17 18 19 20 21 22 23 24 25 1 26 27 28 29 30 31 32 Конфигурация c'V^V sv=$n X(c'X)=$X s*n=$n c:N=$S Я : tf => II \П(сП) п \(с11)П-*и с'П=$П с11=$П VV^V VQI1 =ф II V:N=^V Stye^S* Группа 2 3 1 2 3 2 1 2 3 2 3 1 1 2 2 2 Примечания. 1) В списке под символом S понимается любой из классов S, SN, Sl всюду, кроме конфигураций № 5 (второй слева класс) и № 3, где под символом S нужно понимать только класс S. 2) Под (осу) понимается результирующий класс z конфигурации ху =*■ z, иод II — результирующий класс конфигурации № 18. 3) Под символом X в конфигурации № 19 понимается любой из классов S, 5«, S", V, Я. 4) Классы, стоящие слева в конфигурациях № 21, № 23 и № 31, образуют эти конфигурации только при условии, что в структуре (см. ниже) соответствующие классы разделены двоеточием. Теперь, отобразив каждое слово предложения на содержащий его класс, мы получаем структуру этого предложения 2, и исходным материалом для анализа становятся 27 структур предложений вьетнамского текста. Задача анализа заключается в последовательном отыскании конфигураций в структуре. Результатом анализа явится последовательность найденных конфигураций. Конфигурации, за редким исключением, образуются классами, расположенными рядом в структуре. Они отыскиваются в некотором строгом 14 Проблемы кибернетики, вып. 13
210 Т. Л. ГАВРИЛОВА порядке, обусловленном как свойствами языка, так и особенностями исходного текста. Процесс отыскания конфигураций протекает следующим образом. Пусть в исходной структуре 20 первой найдена конфигурация ху =ф z. Заменив в 20 конфигурацию ху ее результирующим классом, мы получим новую структуру 2i. Отыскав в 24 конфигурацию £i?/i =Ф 2^ и заменив ее в 24 ее результирующим классом, получим очередную структуру 22. Продолжая этот процесс, мы получим последовательность найденных конфигураций xy=$z, xvyx =$ zi4 . . ., xk-i г/А_1=Ф^_1 и очередную структуру 2А. Процесс окончится тогда, когда в очередной структуре не найдется ни одной конфигурации из списка. Это произойдет в случае, если очередная структура будет состоять из одного класса. Ниже приводится алгоритм анализа структуры вьетнамского предложения, записанный в простых правилах [3]. Здесь Т — таблица для записи последовательности конфигураций. Алгоритм применяется последовательно к каждой из структур 20, 2Ь ... Алгоритм анализа структуры Предварительное замечание: в каждой ступени правил поиск конфигураций ведется от начала структуры. Ко. ступени Правила поиска 1 (2, 4) 2 (3) 3 (1) 4 (5, 8) 5 (6, 8) 6 (7) 7 (4) 8 (9, 13) 9 (10, 11) 10 (12) 11 (12) 12 (1) 18) 18) 13 (14, 14 (15, 15 (16) 16 (17) 17 (13) 18 (19, 25) 19 (20, 25) 20 (21, 25) 21 (22, 25) 22 (23) 23 (24) 24 (18) Искать вправо R"', считать R'" = Rq. Записать в Т конфигурацию R^Sy. Стереть Ду. Искать вправо V, считать V = V0. Проверить Vq на особенность. Записать в Т конфигурацию VV4- Стереть V0. Искать вправо U, считать U = U0. Искать непосредственно вправо V. Записать в Т конфигурацию UqV^. Записать в Т конфигурацию UqV2- Стереть U0. Искать вправо с, считать с — с0. Искать непосредственно вправо Л\ считать N = Nl. Записать в Т конфигурацию cqN^. Стереть N^. Записать -5*0. Искать вправо с', считать с' = с'0. Искать непосредственно влево C£S\/V, считать С = С_^. Искать вправо C£S\/V, пропуская с', считать С — С^ Проверить C_i и Ci на совпадение классов. Записать в Т конфигурацию C_^c'Q. Стереть с'0. Записать в информацию С_4 признак вхождения в конфигурацию C_iCo. 25 (26, 31) Искать вправо 7, считать 7 = 70. 26 (27, 29) Искать вправо V, пропуская А, считать V — V^ 27 (28) Записать в Т конфигурацию VqV^. 28 (25) Стереть V0- 29 (30, 25) Искать влево V, пропуская А: считать V--V^. 30 (28) Записать в Т конфигурацию ViV0.
О СТРУКТУРНОМ АНАЛИЗЕ ВЬЕТНАМСКОГО ТЕКСТА 211 № ступени Правила поиска 10 И 12 13 14 31 (32, 35) 32 (33, 31) 33 (34) 34 (31) 35 (36, 41) 36 (37, 39) 37 (38) 38 (35) 39 (40, 35) 40 (35, 37) 41 (42, 44) 42 (43) 43 (41) 44 (45, 50) 45 (46, 48) 46 (47) 47 (44) 48 (49, 49 (47) 50 (51, 51 (52) 52 (50) 44) 53) 76) 57) 60) 70) 65) 67) 68) 53) 53 (54, 54 (55, 55 (56) 56 (53) 57 (58, 58 (59) 59 (53) 60 (61, 61 (62, 62 (63) 63 (64) 64 (53) 65 (66, 66 (67, 67 (64) 68 (69) 69 (53) 70 (71, 71 (72, 74) 72 (73) 73 (53) 74 (75) 75 (53) 76 (77, 82) 77 (78, 76) 78 (79, 76) 79 (76, 80) 80 (81) 81 (53) 82 (83, 89) 83 (84, 82) 84 (85, 82) 85 (86, 82) 86 (87, «82) 87 (88) 88 (53) Искать вправо C£S\/V, считать С = С0. Проверить С0 на признак вхождения в конфигурацию ступени № 5. Записать в Т конфигурацию С0С\. Стереть Cq. Искать вправо S, считать S = S0. Искать непосредственно вправо S, считать S = S{. Записать в Т конфигурацию S0Si. Стереть Sir N Искать непосредственно вправо С £ SyN. Искать влево R'. Искать вправо R", считать R" = R'q. Записать в Т конфигурацию i?^. Стереть R'q. Искать вправо Fonp, считать F0np = Поискать непосредственно вправо S, считать S = Si. Записать в Т конфигурацию VqS^ Стереть VQ. Искать непосредственно влево S, считать S = S^. Записать в Т конфигурацию S ^XVQ. Искать вправо R', считать R' = R'0. Записать в Т конфигурацию R'0S^. Стереть R'0. Искать вправо V, считать V = V0. Искать непосредственно вправо А, считать А = А^. Записать в Т конфигурацию VqA±. Стереть А\. Искать непосредственно влево А, считать A = A_i* Записать в Т конфигурацию A-\V0. Стереть А_^. Искать непосредственно вправо S, считать S = St. Проверить перевод прообраза V0 на «вычислим». Записать в Т конфигурацию V0Si. Записать П0 вместо VQ. Стереть St. Искать непосредственно влево V, считать F = F_i. Проверить наличие V _v в Т. Записать в Т конфигурацию VqS^ Записать в Т конфигурацию V_iV0. Стереть VQ. Искать непосредственно вправо V, считать V = V±. Проверить С2 =V'. Записать в Т конфигурации VqVu V<V> . -. 0М» М^2- Стереть V\, V2- Записать в Т конфигурацию VqVa. Стереть V±. Искать вправо V, считать V = V0. Искать непосредственно вправо S, считать S = Si. Проверить S\ на вхождение в Т в ступени № 9. Проверить прообраз VQ на tim theo. Записать в Т конфигурацию VqS^ (№ 13). Стереть S±. Искать вправо V, считать V = V0. Проверить прообраз VQ на goi. Искать непосредственно вправо S, считать S = S±. Проверить Si на вхождение в Т в конфигурацию № 3. Проверить прообраз R" из Т на la. Записать в Т конфигурацию V%Si ==> V. Стереть S^
212 Т. Л. ГАВРИЛОВА ступени 15 16 17 18 19 20 21 22 23 24 Правила поиска 89 (90, 94) 90 (91, 89) 91 (92) 92 (93) 93 (89) 94 (95, 125) 95 (96, 94) 96 (97) 97 (94) 98 (99, 103) 99 (100, 98) 100 (101, 98) 101 (102) 102 (98) Искать вправо V, считать V = V°. Искать непосредственно влево S, считать S — S—i, Записать в Т конфигурацию S_iVQ. Стереть S—\. Записать Я0 вместо F0. Искать вправо Я, считать П = П0. Искать влево непосредственно F, считать F = F_j. Записать в Т конфигурацию F_^70. Стереть F_4. Искать вправо с', считать с' = с'0. Искать непосредственно вправо Я, считать 1T=IIi. Искать непосредственно влево Я, считать П=П__1. Записать в Т конфигурацию П_1с'0П1. Стереть с^П^. 103 (104, 108) Искать вправо V, считать F — VQ. 104 (105, 103) Искать непосредственно вправо Я, считать II = Ili. 105 (106, 103) Проверить VQ на наличие особенности. 106 (107) Записать в Т конфигурацию VqJJ^ 107 (103) Стереть Пх. 108 (109, 112) 109 (110, 108) 110 (111) 111 (108) Искать вправо с, считать с = с0. Искать непосредственно вправо Я, считать П^П^ Записать в Т конфигурацию с0П^ Стереть с0. 112 (113, 120) Искать вправо Я, считать П = П0. 1 ИЗ (114, 112) Искать непосредственно влево Я, считать Я — П^. 114 (115, 112) Проверить Я0 на вхождение в Т в конфигурацию № 27. 115 (116) Записать в Т конфигурацию II^IIq. 116 (108) Стереть Я0. 117 (118, 112) Искать непосредственно влево F, считать V = V-i. 118 (119) 119 (112) Записать в Т конфигурацию F_i#o=£F_i. Стереть Я0. 120 (121, 125) Искать вправо с начала структуры Я, считать П = П0. 121 (122, 120) Искать непосредственно вправо : (двоеточие). 122 (123, 120) Искать Я непосредственно вправо от:, считать Я = Я1в 123 (124) Записать в Т конфигурацию Я0 : Я^ 124 (120) Стереть Я0 :. 125 (126, 130) 126 (127, 131) 127 (128) 128 (129) 129 (120) 130 (94) 131 (132, 136) 132 (133, 136) 133 (134) 134 (135) 135 (136) 136 Останов. Искать вправо S, считать S = SQ. Искать непосредственно вправо V, считать V = V\. Записать в Т конфигурацию SQVi. Стереть V\. Записать Я0 вместо SQ. , Заменить выходы 98 (99, 108), 112 (ИЗ, 131) и ИЗ (114, 112). Искать вправо £', считать Sl = S{0. Искать непосредственно вправо V, считать V = Vi. Записать в Т конфигурацию SiV^. Стереть V\. Записать Я0 вместо S^. § 3. Дерево предложения и дерево текста 1. Запись результатов анализа структуры. После того, как был произведен анализ структур по описанному выше алгоритму, встала задача об удобной, наглядной и экономной записи результатов анализа. Такой удобной, на наш взгляд, записью явилось дерево предложения. Определим это понятие.
О СТРУКТУРНОМ АНАЛИЗЕ ВЬЕТНАМСКОГО ТЕКСТА 213 Конфигурации ху =ф z поставим в соответствие правильное дерево 1-го ранга. Корень дерева обозначим через zu подчиненные узлы — через х и у (слева направо в порядке следования классов в конфигурации). Внутри дерева у корня записывается номер конфигурации в списке. Так, конфигурации ху =ф z с номером N ставится в соответствие дерево, изображенное на рис. 7. Примечание. Номер конфигурации однозначно определяет значения х, у и z\ однако мы сохраняем на дереве все эти обозначения для (RmS+Sg) (Rrs^s2) Рис. 7. Рис. 8. большей наглядности. Напротив, по виду х, у и z номер конфигурации устанавливается неоднозначно, так как х (у) образует с у (х) различные конфигурации в зависимости от того, результирующим классом какой конфигурации он сам является. Например, Si и S2 могут образовывать конфигурации № 5 или № 6 в зависимости от того, результирующим классом какой конфигурации является S2- Это можно видеть на рис. 8. Пусть, далее, имеется структура исходного предложения 2j0 = Х§Х\Х2 • * * Хп' С помощью построенного алгоритма мы найдем последовательность конфигураций в этой структуре: JVi, N2, Л^з> . . ., Nn. После отыскания конфигурации с номером Ni : xtxi + i=^ z и замены ее в 20 результирующим классом мы получим новую структуру: 2jj = XqXi . . . Xi_^ZXi+2 • • • %п или, переобозначив, у __ ^(1)^(1) „(1) zji — ж0 j.^ ... xn—1« Продолжая построение, мы получим последовательность структур Последняя структура имеет вид 2Д = х^. Она получена в результате замены пары классов, вошедших в конфигурацию с номером Nn, результирующим классом. Правильное дерево 1-го ранга со значками, соответствующее этой конфигурации, мы назовем деревом Dn-i предложения со структурой 2n_i (рис. 9). Один из классов, расположенных в концевых узлах дерева Dn-i, является результирующим классом конфигурации с номером Nn-i. Дерево 1-го ранга со значками, соответствующее этой конфигурации, построим так, чтобы его корень совпал с упомянутым концевым узлом. Построенное правильное дерево со значками назовем деревом Dn _2 предложения со структурой 2П _2. В концевых узлах дерева Dn-2 расположатся классы структуры 2п-2 (рис. 10). Пусть мы определили дерево Dk предложения со структурой 2А. Один из классов этой структуры является результирующим в конфигурации (п-1) Рис. 9.
214 Т. Л. ГАВРЙЛОВА у(п-1)=у(п-2) Л1 ~Л2 ,Сп-2) г (п-2) Рис. 10. У (п-2) у (п-2) Л0 • Aj "о "о А= "о "о уМяуМ пЮяП(*) "о "о ?(г)=?(з)= $Чг) п(5)=п (*) к//0 -Ид *0 ~д0 ~д0 ~д0 ~Ч *от c0Lc(2Lr,(d}_„( до ~до ~°о ~*о 4s v(%v(zW3) Ь s vi V1 Yi N. МЛ) y(0)sy(l)=v(2)sy(3) s«ls(2) D3 =S4 }2 IH\ (1)_ (o) дг»(и) S(J) R'0) S<» KoH(p.NrRln(0¥50Us(50) KoHtp.^RjOsfUs" Kon^S^S?^ T = с(0)у(0)~(0)рг(0)пт(0)<,(0) T _ „(2) „(2) „(2) „(2) L0-dO V1 *2 H3 Ht °5 Z2=S0 V1 S2 S3 T - *(1)V(1)*<I)D'(»<.(1) у e ~(3)у(3)„{3) D0-дерево предложения со структурой lQ Рис. И. W./W (5) ^П0
О СТРУКТУРНОМ АНАЛИЗЕ ВЬЕТНАМСКОГО ТЕКСТА 215 € номером Nk. Дерево 1-го ранга со значками, соответствующее этой конфигурации, пристроим к дереву Dk так, чтобы корень дерева 1-го ранга совпал с концевым узлом дерева Dk, в котором расположен упомянутый класс. Полученное правильное дерево со значками назовем Dh-i~depeeoM В0-дерево предложения со структурой lQ Рис. 12. предложения со структурой 2A_i. Такое построение продолжается до тех пор, пока не исчерпается последовательность конфигураций. Тогда деревом предложения мы назовем дерево предложения со структурой 20- В конечных узлах этого дерева расположатся классы структуры 20. Из определения видно, что дерево предложения определяется заданием правильного дерева и соответствия между его узлами и членами последовательности N\, Лг2, . . ., Nn. На рис. 11 и 12 приведены примеры построения деревьев предложений вьетнамского текста.
216 Т. Л. ГАВРИЛОВА 2. Построение дерева текста. Дерево предложения наглядно и просто отображает синтаксические связи между классами в отдельной структуре. Поэтому далее встает задача о столь же наглядном способе изображения множества всех синтаксических связей, имеющихся во всем тексте (в совокупности 27 структур). Мы предлагаем для решения этой задачи строить дерево текста. Определение дерева текста проведем по индукции. Если текст Т\ состоит из одного предложения, назовем деревом Ai текста Т\ дерево этого предложения, т. е. положим ДА = D\. Пусть теперь мы уже определили Ah для текста Tk, состоящего из к предложений. Определим А^+ь т. е. дерево текста Tk + i, полученного из текста Tk добавлением одного предложения с деревом Dk + t- Здесь может представиться несколько случаев: 1. /)А + 1 cz Ад (т. е. правильное дерево, характеризующее Dh + u является поддеревом дерева, характеризующего ДА, и в узлах Dk + t стоят те же номера конфигураций, что и в соответствующих узлах Ak). В этом случае мы полагаем A^ + i = Ak. 2. Ak CZDk + i. В этом случае мы полагаем ДА + 1 =^ Dk+i- 3. Ak и Dk + \ имеют общее поддерево D. Рассмотрим сначала случай, когда D не пусто. В этом случае Ak можно представить в виде D + Д^ *), a Dk+i — в виде D + £)/Wi (Aft и jDft+i могут быть несвязными, но состоят из совокупности связных поддеревьев Ak и jDft + i соответственно, которые присоединяются к D в концевых узлах или его вершине и образуют Ak или Dk + i соответственно). Тогда Aft + i мы будем строить, присоединяя связные ветви и Д/'{, и D'h+i к поддереву D. Это присоединение может происходить как в концевых узлах Z), так и в его вершине. Пусть z — произвольный концевой узел поддерева D. Он может быть а) концевым как в ДА, так и в Dk+i; тогда мы оставляем его концевым и в Ад+ь б) концевым в Ak(Dk + t), но является корнем некоторого связного поддерева d CZ Dk + i(Ak); тогда z становится корнем поддерева d и в Ад + ь в) корнем некоторого поддерева da Ak и корнем некоторого (другого) поддерева d*cz dk + u в этом случае z становится узлом ветвления в дереве Ад + ь причем подчиненными для z становятся корни поддеревьев d и d* (сами поддеревья, разумеется, тоже присоединяются, становясь ветвями, идущими из этого узла). Надо заметить, что при узле z не ставится номер конфигурации (ибо узлы, подчиненные узлу z, конфигурации не образуют), в дальнейшем такие узлы дерева A&+i мы будем называть узлами типа «или — или»; г) концевым в Z>A + i и узлом типа «или — или» в Ak; тогда z становится узлом типа «или — или» и в дереве Ak + 1, причем все ветви, идущие от z в ДА, сохраняются и в Ak + i\ д) корнем некоторого поддерева d в Dk + 1 и узлом типа «или — или» в Дй; тогда z становится узлом типа «или — или» в дереве Дд + ь причем в число узлов, подчиненных узлу z в дереве ДА + ь входит наряду с узлами, *) Операция + (присоединение) определяется только для таких связных деревьев D и d, у которых в корне d (D) стоит тот же класс, что и в одном из концевых узлов D (d): дерево d (D) помещается таким образом, чтобы корень d{D) совпадал с одноименным концевым узлом D (d); полученное в результате дерево D' называется суммой деревьев D и d, т. е. D' =D-\-d. Поиск общего связного поддерева D деревьев А^ и D^+i производится по следующему правилу. Деревья Ад и Dk+i просматриваются сверху вниз слева направо в поисках одинаковых узлов. Когда одинаковые узлы найдены, просматриваются в том же порядке поддеревья с корнями в этих общих узлах; к D относят одинаковые связные поддеревья с корнями в найденных одинаковых узлах.
О СТРУКТУРНОМ АНАЛИЗЕ ВЬЕТНАМСКОГО ТЕКСТА 217 w4mms» о л,- *7 DP= vz X /12\ Л3 /2f\ **' *з ^J= R1 S2 R3 ^5^7 ^6R9 SW »sm щ « *,ч Рис. 13. А,шЛ, Аг=Ъ+А\+Ъ'г, где В s V V /?'" S С: . N Здесь (^-обозначение узла типа Тг или -или'' Рис. 14.
218 Т. Л. ГАВРИЛОВА подчиненными z в ДА, еще и корень поддерева d. Само поддерево тоже входит в Afc + i, становясь одной из ветвей, идущих из узла z. Таким образом, в узлах типа «или — или» может нарушаться дихотомия. Присоединение может происходить и в корне D. Пусть z — корень D. Он может быть е) корнем Ak и корнем Dk + u в этом случае z будет корнем Ak+i: в узле z присоединения не произойдет; ж) корнем Ak (Dk + i) и внутренним узлом Dk + i (Ak); тогда z будет внутренним узом в АА + ь и в Afc + i войдут все поддеревья Dk+i (Ak) с корнями в узлах, подчиняющих z; з) внутренним узлом как в ДА, так и в Dk + ±; тогда z — внутренний .узел дерева Ak + i, которое строится следующим образом: корни Ak и Dk+i ' V VRmSc-N U VRmS Рис. 15. ■соединяются в узел типа «или — или» *), а все поддерево D с корнем z встречается в AA + i дважды — в каждой из ветвей узла типа «или — или». Случай, когда D пусто, практически ни разу не встретился. Он может возникнуть, тогда Tk и Tk + ± являются совокупностью заголовков, т. е. содержат фразы с сильными эллипсисами. Очевидно, такие тексты встречаются достаточно редко, чтобы считать случай, когда D пусто, невозможным. Ниже приводится пример построения дерева текста, состоящего из трех предложений со структурами: 1) Е^ЯДОз^ВД"; 2) X2 = S±V2V3A,c5:N6; 3) 23 = RIS2R™SJJ5V6R?S8RIS10. В результате анализа структур мы получили деревья предложений, изображенные на рис. 13. Далее на рис. 14 и 15 показан процесс построения дерева текста. Полученное дерево текста А3 содержит три узла типа чшли — или». *) Вообще говоря, это можно сделать только в случае, если оба корня одно- лменны, но во всех просмотренных нами деревьях этот факт имел место.
О СТРУКТУРНОМ АНАЛИЗЕ ВЬЕТНАМСКОГО ТЕКСТА 219 Построенное дерево текста наглядно показывает синтаксические связи в тексте, но, вообще говоря, очень громоздко, так как в узлах типа «или — или» скапливается большое число ветвей, мало отличающихся друг от друга или просто совпадающих между собою (например, одна ветвь может быть частью другой ветви или они могут отличаться одним только узлом). Поэтому следующим этапом работы стало упрощение строения дерева с помощью операций сокращения и склеивания. Под сокращением мы понимаем следующее: в каждом узле типа «или — или» ищем группы одинаковых между собою ветвей, а затем из каждой группы выбрасываем все ветви, кроме одной, так что среди ветвей в узлах типа «или — или» не останется одинаковых. Под склеиванием мы понимаем построение деревьев текста из деревьев, являющихся ветвями в узлах типа «или — или»: в каждом таком узле ветви рассматриваются как деревья предложений, и построенное из них дерево текста помещается корнем в узле, ранее бывшем узлом типа «или — или». На рис. 16 приведено упрощенное дерево текста, состоящего из 27 вьетнамских предложений, о котором говорилось в начале § 2 этой статьи. Небезынтересно отметить, что структура текста, обнаруженная изложенным выше алгоритмическим путем, оказалась очень близка к структуре языка в целом: для сравнения использовалась структура вьетнамского простого предложения, составленная на основе чисто лингвистических исследований [4]. ЛИТЕРАТУРА '[1] Кулагина О. С, Об одном способе определения грамматических понятий на базе теории множеств, сб. «Проблемы кибернетики», вып. 1, М., Физматгиз, 1958. [2] Молошная Т. Н., Алгоритм перевода с английского языка на русский, сб. «Проблемы кибернетики», вып. 3, М., Физматгиз, 1960. [3] Кулагина О. С, О машинном переводе с французского языка на русский. II, Алгоритм перевода с французского языка на русский, сб. «Проблемы кибернетики», вып. 4, М., Физматгиз, 1960. f[4] Лекомцев Ю. В., Структура вьетнамского простого предложения, Автореферат диссертации на соискание ученой степени кандидата филологических наук, Л., 1960. Поступило в редакцию: первый вариант 24 X 1962, окончательный вариант 16 XI 1963.
Проблемы кибернетики, вып. 13. Упрошенное дередо Рис. 16.
Упрошенное дередо текста Т^ Рис. 16. n'S
ИСПОЛЬЗОВАНИЕ АБСТРАКТНОЙ СЕМАНТИКИ И ТЕОРИИ ГРАФОВ В МНОГОЯЗЫЧНЫХ ПЕРЕВОДНЫХ СЛОВАРЯХ К. ЧУЛИК (ПРАГА) Составной частью каждого алгоритма перевода с одного языка на дру- той должно быть бинарное отношение переводимости, установленное между лексическими единицами обоих языков. Причем одна лексическая единица переводима в другую, если обе они имеют одинаковое значение. Однако в естественных языках некоторые лексические единицы (омонимы) имеют не одно, а несколько значений. Значит, одна лексическая единица переводима в другую, если они имеют хотя бы одно общее значение. Однако само отношение переводимости еще не определяет, какой из возможных лексических единиц надо перевести данную лексическую единицу. Необходимый выбор одной из возможных лексических единиц делается на основе контекста, в котором переводимая лексическая единица находится в данном тексте. Итак, вопрос касается устранения омонимии таким способом, чтобы каждая лексическая единица «расщепилась» на столько частей, сколько различных значений она имеет. При многоязычном переводе (в целях экономии) возникает потребность во вспомогательном искусственном языке, с помощью которого можно было бы переводить с любого языка на любой из данных языков. Языку-посреднику (ЯП) и связанным с ним проблемам посвящена почти вся четвертая часть сборника [1]. С точки зрения отношений переводимости, язык-посредник изучался в статье [2]. Отношения переводимости лексических единиц двух естественных языков учтены более или менее полно в обычных переводных словарях. В статье исследуются возможности устранения омонимии посредством использования абстрактной семантики лексических единиц некоторого количества языков, т. е. возможности «расщепления» лексических единиц, но с использованием не контекста, а перекрывания значений лексических единиц во многих языках. Кроме того, дается конструкция самой экономичной системы лексических единиц ЯП для данных языков. При этом используются основные понятия теории бинарных отношений и графов. 1. Отношение переводимости и абстрактная семантика Пусть Li есть множество лексических единиц i-го языка, 1<£<?г (?г>2). Предположим, что Lt Г) Lj = ф для i Ф / (выполнение этого условия легко достижимо практически; например, подходящей индексацией соответствующих лексических единиц). Затем пусть QtjCZLiXLj есть отношение переводимости с языка i на язык / (i ф /) при 1<£, /</г. Если лексическая единица я £ Lj переводима лексической единицей y£Lj, т. е. если (я, у) б Qij, то лексическая единица у £ Lj также может быть переведена лексической единицей x£Lt, т. е. (г/, я)£д^. Это значит, что Qjt есть
222 К. ЧУЛИК отношение, обратное к отношению ди-, и значит, что Qtj (J Qjt есть отношение симметричное. п Обозначим теперь: L = И Lu система множеств Li порождает разбие- п ние L= {Li, L2, . .., Ln] множества L. Обозначим: Q= (J Qij, так что q- гфз есть симметричное отношение и q CI L X L. Очевидно, что q^ = q f| (L, X L/) при i Ф j. Абстрактный неориентированный граф (L, q) вместе с разбиением множества его узлов (вершин) назовем графом с разбиением и обозначим его (L, q, L). Если L и q имеют значения множества лексических единиц и отношения переводимости, граф с разбиением (L, q, L) является системой перевода по [2]. Систему перевода (L, q, L) можно определить совершенно механически из обычных переводных словарей для пар данных языков. Надо найти множество искусственных или абстрактных лексических единиц L0 ЯП и отношения переводимости Qi0 и Qoi, 1<£<тг, такие, чтобы с Li на Lj было легко переводить посредством L0, т. е. если i Ф /, то Qij = QioQoj, (1> где QioQoj — обычное произведение бинарных отношений, т. е. (х, у) £ QioQ0jr если существует z£L0 такое, что {x,z)£Qi0, а (г, у) £ q0j-. Возьмем теперь абстрактное множество М и его элементы назовем элементарными значениями. Абстрактной семантикой в множестве М и множестве лексических единиц L назовем многоязычную функцию ф, которая к каждой лексической единице x£L присоединяет непустое множество ц(х)аМ элементарных значений так, что (я, ?/)бР<?=^ф(я)ПфЫ Ф ф, x£Li, y£Lh где i Ф /, (2') для каждого р£М имеется такое x£L, что /?g ф (х). (2") Условие (2') выражает тот факт, что лексические единицы находятся в отношении переводимости в том случае, когда они имеют какое-либо общее значение. В условии (2") говорится, что ни одно из элементарных значений в Ж не является избыточным, т. е. что каждое является значением хотя бы одной лексической единицы. Учитывая введенную абстрактную семантику ф, можно определить омонимию и синонимию следующим образом. Лексическая единица x£L является омонимом, если |ф(х)|>1, где \N\ обозначает мощность множества N. Лексические единицы х, y^Lt являются синонимами, если фИ = фЫ- Если предположим, что существует семантика ф в М, можно положить L0 = M и определить отношение переводимости Qi0 условием (x,y)€Qio*=*z£Li> 2/6^о, а г/€ф(я). (3)' Но если Qoi обратно отношению gi0, то из (2') сразу же вытекает (1). Таким образом, мы легко сконструировали требуемый ЯП и требуемые отношения переводимости. Остается еще устранить омонимию, т. е. подходящим образом «расщепить» отдельные лексические единицы. Поскольку предполагается существование семантики, это можно легко осуществить. Вместо множества Lz возьмем «приспособленное» множество лексических единиц L* = {[x, v] |scg Lt, v£y(x)}. Новые лексические единицы из L* являются упорядоченными парами [х, и]у где х — первоначальная
ИСПОЛЬЗОВАНИЕ АБСТРАКТНОЙ СЕМАНТИКИ И ТЕОРИИ ГРАФОВ 223- лексическая единица, a v — некоторое из ее элементарных значений в семантике ф. Здесь очевидно, что мы действительно «расщепили» основную лексическую единицу x£Lt на | ф (х) | новых лексических единиц [х, и] £ Z/*, где v £ ф (х). Это значит, что в L% мы отличаем х в значении v от х в значении и, если и, у£ф(х), ифи. Теперь можно определить, отношения переводимости q*q следующим образом: ([я, v], у) € qto <==Ф[я, и] б Ц, а и = у. (4) Если теперь используем условие (1) и определим Q*; = Q*oQoi (предполагая, что Qoi есть отношение, обратное отношению q*0), to получим отношения переводимости между L* и L* такие, что лексические единицы [x,v]£L* и [у,и]£Ь] являются взаимно переводимыми именно тогда, когда v = u(v\M = L0), т. е. именно тогда, когда они имеют одно и то же элементарное Значение. Другими словами, отношения переводимости q£ сохраняют значения. Это и есть основное требование, предъявляемое к переводу (когда уже устранена омонимия). Отношения переводимости q*j являются пригодными для использования в программе перевода, которая, очевидно, обеспечивает перевод с L* на L*, потому что они являются уже однозначными функциями (тогда как отношения q^ были многозначными функциями). Однако перед самим переводом необходимо перейти от Lt к L*. Именно в этот момент надо использовать контекст или другие дополнительные данные, которые в каждом случае исключаются из наших рассуждений, касающихся только значений отдельных лексических единиц. Все описанные простые конструкции предполагают существование абстрактной семантики ф, которая здесь —в теоретических рассуждениях— заменяет абсолютную семантику. Абсолютная семантика наделяет лексические единицы их абсолютными значениями, которые являются уже действительными предметами или их классами, обозначенными соответствующими лексическими единицами. Решающим является то, что при самом переводе абсолютная семантика не требуется, а достаточно иметь подходящую абстрактную семантику. Подходящей следует считать такую абстрактную семантику, которая есть модель абсолютной семантики, т. е. элементарных значений столько же, сколько абсолютных значений. Их можно взаимно однозначно сопоставить друг с другом. Это значит, что абстрактная семантика различает элементарные значения так же, как абсолютная семантика — абсолютные значения. Назовем эту абстрактную семантику собственной семантикой данного множества лексических единиц. В следующих разделах выясним, что можно сказать об отношении q системы перевода (L, q, L) без знания ее семантики, какие абстрактные семантики допустимы в данной системе перевода и какие из них ведут к наименьшему количеству лексических единиц ЯП. Кроме того, задача состоит еще в том, чтобы определить, можно ли прямо по графу с разбиением (Z/, q, L) узнать, является ли отношение достаточным для перевода, не является ли оно ошибочным или нельзя ли ограничиться какойт либо его частью. 2. Минимальная абстрактная семантика Прежде всего опишем конструкции всех возможных абстрактных семантик (ф, М) данного графа с разбиением (L, q, L). Подграф (V, о) графа с разбиением назовем относительно полным (по отношению к разбиению L), если х, y£V, a x£Lu y€Lj, i Ф /=$(х, у) б а. (5)
224 К. ЧУЛИК О системе подграфов © говорим, что она покрывает граф с разбиением (L, q, L), если L= U V, a q= U о, где H = (V, а). (6) не® не® Теорема 1. Все абстрактные семантики (ф, М) графа с разбиением (L, Q, L) можно получить следующей конструкцией', возьмем систему относительно полных подграфов ©, которая покрывает (L, Q, Z), и возьмем систему непустых и взаимно дизъюнктных *) множеств М такую, что |М| = |©|; наконец, возьмем простое**) отображение i|) системы © на М и определим xeL=$y(x)= U гН#), где ®X = {H=(V, o)\x^V}, (7) Н£®х м= иФИ. (8) хеь Доказательство приведено в разделе 5. Из теоремы 1 становится ясно, что для каждого графа с разбиением можно найти хотя бы одну его абстрактную семантику (она должна соответствовать (2') и (2")). Итак, теоретически каждое симметричное отношение может быть отношением переводимости. Теперь будем искать минимальную абстрактную семантику (ф, М), т. е. такую, что мощность \М\ является наименьшей из возможных. Семантику (ф, М) графа с разбиением (L, Q, L) назовем неприводимой, если р£М, то либо существует х £ L такое, что ф (я) = {р), \ либо x£Li, y£Lj для подходящих i Ф j таких, что I /д\ ф(*)Пф (у) = {/>}• J Теорема 2. Абстрактная семантика (ф, М) графа с разбиением (L, q, L) является неприводимой именно тогда, когда ее система относительно полных подграфов © и система множеств М (из теоремы 1) отвечают условиям: Н£®=$ система ©—{#} не покрывает И, (10) Y£M=*\Y\ = 1. (11) Доказательство приведено в разделе 5. Из теоремы 2 сразу же становится ясно, как из произвольной семантики постепенно получить определенную неприводимую семантику. На отдельных этапах можно или заменить какое-либо множество Y^M при [ Y | > 1 некоторым из его одноэлементных подмножеств, или из © отбросить произвольный подграф Н, который покрывают оставшиеся подграфы из ©. Если ни один из этих вариантов применить нельзя, то, очевидно, оба условия (10) и (11) выполнены. *) Попарно не пересекающихся. :*) Взаимно однозначное.
ИСПОЛЬЗОВАНИЕ АБСТРАКТНОЙ СЕМАНТИКИ И ТЕОРИИ ГРАФОВ 225 Пусть К = (Т, т) есть граф с симметричным отношением т. Разбиение Т множества Г, для которого выполняется условие X £ Г и я, у£Х, х ф г/=Ф (х, г/)^т, называется хроматическим, а наименьшая мощность хроматического разбиения называется хроматическим числом % (К) графа К (ср. [3]). Наименьшая мощность системы полных подграфов, которая покрывает граф Ку называется его номером полноты (й(К). Теорема 3. Для каждой абстрактной семантики (ф, М) графа с разбиением (L, q, L) мы имеем | ikf|>a> (К) > % (К), где K = (L, т) возникает из (L, q) дополнением всех относительно полных подграфов до полных подграфов и K = (L, LxL — т). Доказательство —в разделе 5. 3. Специальные абстрактные семантики Предположим, что нам дана собственная семантика (ф, М) (см. раздел 1) нашей системы перевода (L, q, L) и что в переводимых текстах действительно встретится каждая лексическая единица х £ L в каждом из возможных элементарных значений и£ц(х). Если избрать ЯП, L0 = M, то, учитывая теоремы 1 и 2, ЯП нельзя, видимо, сократить так, чтобы не утратить возможности перевода некоторых значений. Это можно сделать только в том случае, если в семантике ф некоторые элементарные значения встречаются всегда одновременно. Элементарные значения р, q£M назовем сопряженными в семантике ф, ССЛР1 x£L=$ или {р, ?}С1ф(я), или {/?, д}\~)ц)(х) = ф. (12) Из (12) очевидно, что бинарное отношение сопряженности является отношением эквивалентности на множестве М. Пусть M0dM есть произвольное множество представителей классов этой эквивалентности. Семантику (ф0, Л/о), определенную посредством условия q>o{x)=y(x)[}M0, назовем семантикой без сопряженных значений, ибо очевидно, что в семантике ф0 никогда два различных элементарных значения не являются сопряженными. Итак, если предположим, что L0 = M0, и по отношению к ф0 построим Lt и q*j (см. раздел 1), то в случае, если в тексте встретится лексическая единица х£Ьг в значении р£(М — М0)Г)ц(х), т. е. р$у0(х), используем тот факт, что существует значение <7бфо(^), которое сопряжено с р. Будем переводить [х, д]£Ь* как [z, и]£Ц, где u = q (см. (4)), притом, однако, q£q)o{z), а значит, по (12) p£y{z), так что перевод опять будет правильным. Сокращение ЯП, полученное применением собственной семантики без сопряженных значений, может быть довольно значительным, потому что сопряженные значения встречаются очень часто в специальной терминологии в случае, когда языки отдельных наук используют для обозначения своих новых понятий слова, употребляемые в реальном языке уже давно, но с другим значением. Например, в математике употребляется единица «дерево» для обозначения специального графа. И это употребление закреплено во всех реальных языках, так что два его абсолютных значения (дерево в лесу и дерево в .математике) являются сопряженными. Это значит, что, например, лексическую единицу «дерево» можно переводить только в одном значении «дерево в лесу», и перевод всегда будет правильный. Следующий вопрос состоит в том, когда можно каждую лексическую единицу i-то языка перевести на любой /-й язык (i Ф /; 1<г, /<гс), 1/ь 15 Проблемы кибернетики, вып. 13
226 К. ЧУЛИК если эта лексическая единица встретится в любом из своих возможны^ лексических значений. Очевидно, это возможно только тогда, когда абстрактная семантика (ф, М) является полной, т. е. когда выполнено условие иф(я) = М для i = l, 2, ..., п. (13) Полный подграф (V, о) графа с разбиением (L, q, L) назовем хорошим, если он соответствует условию \V[}Li\ = \ для i = l, 2, ..., п. (14) В [2] хорошие полные подграфы называются кольцами. Теорема 4. Абстрактная семантика (ф, М) системы перевода (L, Q, L) является полной только тогда, когда каждый относительно полный подграф из ее системы $ (из теоремы 1) содержит хороший полный подграф. Доказательство приводится в разделе 5. Теорема 5. Полная абстрактная семантика графа с разбиением (L, q, L) существует именно тогда, когда в (L, q) нет никаких изолированных узлов и когда каждая грань из (L, q) принадлежит какому-то хорошему полному подграфу. Доказательство вытекает из теорем 4 и 1. Из теоремы 5 очевидно, что независимо от семантики по графу с разбиением можно узнать, что он не допускает полной семантики, т. е. что его отношение переводимости недостаточно для перевода всех возможных значений на все данные языки. Такое положение означает, что соответствующие множества лексических единиц необходимо дополнить, чтобы полный перевод был возможен, т. е. для выполнения условия (13). Если же абстрактная семантика (ф, М) графа с разбиением (L, q, L) является полной, то для множеств лексических единиц и отношения переводимости q*j (см. раздел 1) имеем: \Ц\ = \Ь0\, ) a q*j является простьш отображением множества L* на L* для i =f=- /; l<i, /</г. Это действительно необходимое, хотя весьма тривиальное предположение об алгоритме перевода. 4. Примечания Остается еще ответить на вопрос, можно ли составить ЯП L0 с требуемыми свойствами для данной системы перевода (L, q, L) без знания ее собственной семантики. Следующие два примера показывают, что по принципиальным причинам это невозможно, пока, конечно, для данной системы перевода не установим или не предположим теоретически, что для ее абсолютной семантики не выполняются определенные специальные условия. В дальнейшем собственная семантика ф снова будет заменять семантику абсолютную. Пример 1 (см. рис. 1). Если х£Ь±, а у, z£L2, где у Ф z, и если {%•> у) 6 Q» {xi z) 6 Q> T0 без знания семантики нельзя решить, означает ли это, что у и z являются синонимами в L2 и что х, г/, z имеют одно и то же значение или что у и z не являются синонимами в L2, но х есть омоним в Li4 имеющий два значения, одно из которых есть значение лексической единицы г/, а второе — единицы z, т. е. имеем ли (15)
ИСПОЛЬЗОВАНИЕ АБСТРАКТНОЙ СЕМАНТИКИ И ТЕОРИИ ГРАФОВ 227 Ф(а) = ф(у) = ф(*) = {1} или ф(я) = {1, 2},ф(у) = {1}, ф(2) = {2}, где 1, 2 — элементарные значения. Пример 2 (см. рис. 2). Если x^Lt, y£L2, z£L3 и если (#, y)gQ, (у, z) £ q, (z, ж) g q, то без знания семантики нельзя решить, означает ли это, что х, у, z имеют одно и то же значение или х, у, z— омонимы, различные значения которых каким-то образом перекрываются, т. е. имеем ли ф (х) = ф (у) = ф (z) = {1} или имеем, например, ф (х) = {1, 2}, ф(г/) = {2, 3), ф(г) = {1, 3), где 1, 2, 3 — какие-то абстрактные элементарные значения. Если семантика ф является полной, то в этом втором случае существуют лексические единицы х' gZ^, y'gL2 и z'£L3 такие, что, например, ф(я') = {3}, ф(г/') = {1}, ф(2') = {2}. Тогда (х\ у), (х\ z)6q; (y\ z), (у', x)£q и (z', x), (z', у) g q. В [2] рассматривается система перевода (L, q, L), для которой выполнено условие, что каждое x^Lt для каждого 1=1, 2, ..., я принадлежит какому-то хорошему полному подграфу. За ЯП L0 избирается множество всех полных хороших Рис. 1. подграфов системы перевода (L, q, L). В примере 2 показано, что во втором случае, когда происходит перекрывание значений, совершенно неоправданно считать хороший полный подграф, содержащий узлы х, у, z, за лексическую единицу ЯП или за элементарное значение, ибо таким способом нельзя достичь требуемого «расщепления» значений у омонимов. Приведенная конструкция ЯП в [2] справедлива только тогда, когда для собственной семантики ф системы перевода {L, q, L) выполняется весьма специальное условие: для каждого ху y£Vy где (V, а) есть любой хороший } полный подграф графа разложения (L, q, L), имеем: \ (Ю) ф(з)=ф(у)- J Это условие, однако, часто не будет выполнимо, например, в случаях частичной сопряженности значений. Например, чешский термин «svaz» и немецкий «Verband» имеют одинаковое значение основное и одинаковое—в математике. Но в русском языке первое значение этого слова — «союз», а второе, в математике — «структура». Значит, значения сопряжены в системе перевода с чешского языка на немецкий, но не являются сопряженными в системе перевода чешский — немецкий — русский. В расширенной системе перевода встречаемся только с частичным сопряжением значений, так что очевидно, что условие (16) в нем не выполнено. 15*
228 К. ЧУЛИК Из примера 1 естественно возникает мысль — использованием собственной семантики ф ввести отношение переводимости Qti в каждом языке Li следующим образом: (х, y)£Qa имеем именно тогда, когда х, y^Lt, a 1 ч{*)Г)<р(у)фф- I (17) Условие (17) аналогично условию (2'). Отношение q*j является отношением переводимости лексических единиц i-го языка. В то время как отношения Qij, i Ф /, учтены в переводных словарях с i-го языка на /-й язык, отношения Qit учтены более или менее полно в лексикологических словарях £-го языка. Полностью это охвачено в литературной части i-vo языка, тогда как в научно-технической части — а эта последняя в большом количестве различных специальностей чрезвычайно обширна — это зарегистрировано в технических и научных словарях отдельных специальностей, но совершенно непригодным способом для машинного перевода. Обширность и богатство научно-технической терминологии, употребляв мой в естественных языках, являются также доводом в пользу необходимости разрабатывать самостоятельные алгоритмы перевода для отдельных специальностей. Из условия (17) вытекает, что отношение Qit есть симметричное (и рефлексивное), и все предшествующие рассуждения, которые касались отношения Qij всей системы многоязычного перевода, можно перенести на отдельный язык. Очевидно, и в нем может случиться перекрывание значений. В примерах 1 и 2 несущественно, что речь шла о различных языках. Такие же отношения можно найти внутри одного языка. И опять получим, что одно отношение недостаточно для решения вопроса, поставленного в случае 1 (как и в случае 2), что необходимо знать абсолютную семантику или хотя бы собственную семантику данного языка. То, что понятия омонимии и синонимии нельзя выделить без семантики, вещь очевидная и хорошо известная. 5. Доказательства Доказательство теоремы 1. Пусть (ф, М) есть произволь ная абстрактная семантика графа с разбиением (L, q, Z), т. е. пусть ф выполняет условия (2') и (2"). Согласно теореме 1 построим ®, М и г)?, для которых выполнены все требуемые условия. Пусть Vp= {х£ L |/?£ ф(я)} при любом р£М. Прежде всего, принимая во внимание (2"), имеем V р Ф ф для каждого р£М. Далее, р£ц(х) именно тогда, когда x£Vp, так что для любых двух узлов x£Li, y£Lj, 1ф], которые отвечают условию х, y€Vp, а значит и условию ф(#)П Пф(2/) Ф ф, согласно (2') имеем {х, 2/) € Q. Пусть ор={(х, ?/)6q|£, y£Vp). Затем подграф HP=(VP, op) удовлетворяет условию (5), значит, он относительно полный. Итак, предположим ($= {Нр\р£М} и покажем, что (У покрывает (L, q, L). Из определения абстрактной семантики мы имеем <р(х)Фф для любого x£L. Это значит, что существует р£М такое, что £бф(я), т. е. x£Vp, и поэтому L= {J Vp. Если же, далее, {х, у) £ q, НрЕ© то согласно (2') имеем ф(я)ПфЫ Ф Ф^ т- е- существует р£М такое, что Рбф(я)Пф(^). Это означает, что х, y£Vp и (х, у)£ор, так что Q^ U аР- Значит, выполнено (6). Бинарное отношение оо, определенное во множестве М условием р—q тогда и только тогда, когда Vp = Vq, является отношением эквивалент-
ИСПОЛЬЗОВАНИЕ АБСТРАКТНОЙ СЕМАНТИКИ И ТЕОРИИ ГРАФОВ 229 ности. Пусть Мр обозначает тот класс эквивалентности, который содержит элемент р. Предположим М = {Мр | р£М}, так что М есть система непустых и взаимно дизъюнктных множеств. Определим ур(Нр)=Мр для р б М, тогда, очевидно, if есть простое отображение системы @ на систему М, а поэтому |®| = |М|. Остается доказать (7) и (8). Однако, исходя из определения подграфа HP = (VP, op), имеем ®х= {Hp\x£Vp} = {Яр|рб ф(я)} для каждого x£L. Поэтому |J ty (H) = НЕ®Х = (J if (Нр) = U Мр и ф (х) С U Мр. Но из р б ф (ж) вытекает РЕФ (л) р£Ф (х) р£ф (ас) МрС1ф(я), ибо при любом q£Mp имеем Vp = Vq, так что из x£Vp получим x£Vq или же дбф(^). Отсюда имеем (J МрС1у(х). что РЕФ (*) и доказывает (7). Наконец, из (7), учитывая (2"), легко вывести 11ф(*)= U U *(Я)= и U мр = м, что и является условием (8). Теорема доказана. Доказательство теоремы 2. Пусть (ф, М) есть произвольная абстрактная семантика, и пусть @, М, ty определены по теореме 1. Если © не соответствует (10), то существует такой подграф Я б®, что & — {Я} покрывает Я. Возьмем p£ty(H) и покажем, что для него не имеет места правая сторона условия (9). Так как @ — {Я} покры-, вает Я, согласно (7) имеем | ф (х) | > 1 для каждого х б V, если Я = (V, а). Исходя из (7), также имеем, что р£у(х) именно тогда, когда x£V (ибо if простая, а множества из М дизъюнктны). Значит, если х, y£V произвольные и такие, что x£Li, у б Lj, i Ф /, то р£ ф(я)Пф Ы> и* значит, согласно (2') и (5) получим (х, у) б а. Однако ® — {Н] покрывает Я, так что по (6) существует H' = (V, а') такое, что Я'б®» Н'ф Н и (х, у) б а\ так что и ж, y£V'. Далее, существует р'б^(Я'), р'ф р, и по (7) р'бф(#)Пф (У) или же |ф (^ПфЫ I > 1- Это значит, что не имеет места правая сторона условия (9), т. е. (ф, М) не является неприводимой. Далее, если для М не выполняется условие (11), существует Y£M такое, что |У|>1. Пусть Н = ty~1 (Y), где Я = (7, а). Возьмем p£Y. Условие (7) влечет за собой | ф (х) | > 1 и | ф (я)Пф (у) I > 1 Для каждого х, y£V, x^Li, y£Lj, 1ф], так что (9) опять не выполняется, значит, (ф, М) не есть неприводимая. Предположим теперь обратное, т. е. что для @ выполнено (10), а для М выполнено (11). Покажем, что тогда (ф, М) является неприводимой. Итак, пусть р£М произвольное и пусть Яр = г)?"1 (Мр), где Hp = (Vp, Op) (Нр и Мр были использованы при доказательстве теоремы 1). Согласно (10) система ®* = ® — {Яр} не покрывает Яр, что согласно (6) значит, что существует либо x£Vp — [J V, либо (х, у)£ор— (J a, не®* не©* где II = (V, а). Исходя из (11), имеем Мр—{р}, так что в первом случае по (7) ф (х) = {/?}, т. е. выполняется (9). Во втором случае для некоторого z£Vp выполняется либо ф (z) = {/?}, так что (9) справедливо, либо | ф (z) \ > 1 для каждого z g Vp. Согласно условию (7) это значит, что, если любое q б Ф {%) и любое г б Ф (у), q ф р ф г, то q ф г (потому что ty является простой, а множества из М дизъюнктны), так что Ф (ж)Пф (у) = {р}' что и является условием (9). Так доказано, что (ф, М) неприводимая. х/г 15 Проблемы кабернетики, вып. 13
230 К. ЧУЛИК Доказательство теоремы 3. Так как каждому относительно полному подграфу из (L, q, L) однозначно соответствует тот полный частный подграф из (L, т), который возник при его дополнении, то согласно теореме 1 очевидно, что |М|>со(А). Далее, если @ есть произвольная система полных подграфов H = (V, а), которая покрывает граф (L, т), то пусть 53 есть система всех множеств узлов V данных подграфов. Но согласно (6) L= [J V. Обозначим 530 = 23 и из системы 35^ построим систему 23^+1 следующим образом. Возьмем Vt^i так, что Vt=/=Vj при 0</<£ и в 93ж включим все V, которые соответствуют условию V Ф ф, a V = V — Vt, где F'g33j. После конечного числа действий т получим систему 2Jm, которая является разбиением множества L и является хроматическим разбиением графа (L, LxL-т), причем, очевидно, |95|>|58т|- Этим доказано, что со (А) >% (А). Заметим только: тогда как в неравенстве |М|>со(А) всегда можно достичь равенства (подходящим подбором семантики (ф, М)), этого нельзя сказать о неравенстве со (А') > X (А') (как видно из простых примеров). Доказательство теоремы 4. В доказательстве теоремы 1 было показано, что при р£М имеем /?6ф(#) именно тогда, когда x£Vp, где Hp = (Vp, Op) и Нр£®. Если же данная семантика (ф, М) удовлетворяет приведенному условию, то Vp[)Li Ф ф для каждого Нр£® и каждого £, £ — 1, 2, . . ., п. Это значит, что для каждого Vp существует x£Vpf)Li, т. е. /?6ф(я), так что действительно (J <р(х)=М, что и есть условие (13). Если же семантика (ф, М) приведенному условию не удовлетворяет, то существуют Нр£(3 и индекс i такие, что Vp^Li = ф. Это значит, что при любом x^Lt имеем x^Vpi и поэтому р$у(х), так что р (J U ф (х) и, следовательно, условие (13) не выполнено. 6. Абстрактная семантика фраз При переводе текста недостаточно сохранить значения отдельных лексических единиц, необходимо сохранить и значение отдельных фраз, предложений и всего текста. При этом ясно, что значение фразы зависит от значений лексических единиц, из которых состоит данная фраза. Основным видом зависимости значений фраз от значений их элементов является зависимость (известная из математической логики) между примитивной формулой, с одной стороны, и п р е- дикатом и именами, которыми заняты отдельные места этого предиката, с другой стороны. Например, если Р (х, у) есть двуместный предикат, где х и у — вспомогательные переменные, a Q и R — имена, то Р ((?, R) есть примитивная формула. Рассмотрим фразу — «равносторонний треугольник принадлежит множеству правильных многоугольников». Отдельные слова этой фразы являются различными предикатами с различным количеством мест. Например, «равносторонний» — это отдельный предикат, и пусть его абстрактное значение R (х)\ подобно этому пусть «правильный» имеет значение Рг (х); «треугольник» и «множество» в этой фразе не выступают в качестве предикатов, поэтому их абстрактные значения — Т и Mz, в то время как «многоугольник» выступает в качестве отдельного предиката и имеет значение Mh (x); наконец, «принадлежит» выступает здесь в качестве двуместного предиката Ра (х, у). Таким образом, мы определили собственную
ИСПОЛЬЗОВАНИЕ АБСТРАКТНОЙ СЕМАНТИКИ И ТЕОРИИ ГРАФОВ 231 семантику лексических единиц данной фразы, и нам надо расширить эту семантику на всю фразу. Сперва рассмотрим части фразы. Прежде всего, здесь имеются две части фразы одного и того же типа — «равносторонний треугольник» и «правильный многоугольник», и в качестве их абстрактных значений, естественно, берем R (Т) и Pr (Mh). Следующая фраза — «множество многоугольников», ее значение—Mh (Mz), и, наконец, последняя фраза, которая нам нужна,— «треугольник принадлежит множеству», значение которой есть Pa (Т, Mz). Приведенные части фразы назовем примитивными фразами данной фразы, а их значения — примитивными значениями. Других примитивных фраз данная фраза не содержит, но содержит непримитивные части фразы типа «равносторонний треугольник принадлежит множеству» или «треугольник принадлежит множеству многоуголь- Р Pa Mh ников» и т. д. Наконец, под значением любой фразы будем понимать множество всех примитивных значений ее отдельных примитивных фраз. Это определение оп- -„ равдывается фактом, что абсолютное ™" Рг значение рассматриваемой фразы явля- Рис- 3- ется действительно совокупностью абсолютных значений фраз: «треугольник есть равносторонний», «треугольник принадлежит множеству» и «множество состоит из многоугольников» и «многоугольники являются правильными», где выделенные слова играют вспомогательную роль, объясняя тип отдельных предикатов. При этом абсолютные значения фраз «равносторонний треугольник» и «треугольник есть равносторонний» одинаковы, ибо обе фразы ссылаются на один и тот же факт и т. д. Итак, абстрактное значение данной фразы есть {R (Т), Pr (Mh), Mh (Mz), Pa (7\ Mz)}, а значения обеих вышеприведенных непримитивных отдельных фраз: {R (Г), Pa (7\ Mz)} и {Pa (T,Mz), Mh (Mz}). Анализ значения рассматриваемой фразы позволяет увидеть еще одно существенное явление, т. е. важные взаимоотношения примитивных значений. Допустим, что в каждом примитивном значении Р (., ., X, .,.) элементарные значения Р и X зависят друг от друга, т. е. что каждый предикат и имя, содержащее его место, зависят друг от друга. В отношении данного значения предположим, что оба элементарных значения А и В взаимосвязаны, если можно найти такие элементарные значения Си С2, . . ., Ck, что при С0 = А и C& + i ~ В имеем, что С\ и Ci+1 зависят друг от друга при каждом i = О, 1, 2, . . ., к. Этим и определен неориентированный граф на множестве элементарных значений, который в случае рассматриваемой фразы изображен на рис. 3, и, как видно, он связный. Поэтому назовем связным текстом такую последовательность фраз, значения которых определяют указанным способом связный граф или каждые два элементарных значения которых взаимосвязаны. Взаимосвязь элементарных значений, очевидно, можно перенести на взаимосвязь примитивных значений. Из примитивных фраз можно создать сложные фразы применением логических связок и кванторов, как это делается в математической логике. Кроме этих довольно известных логических предикатов, в естественных языках можно найти ряд других. Те, которые касаются перехода на метаязык, являются особенно важными и малоисследованными. Сюда 15*
232 К. ЧУЛИК принадлежат не только фразы, встречающиеся в грамматике рассматриваемого языка, но и фразы типа «утверждаю, что...» или «предположим, что...» и т. п. Так как метаязык в естественных языках обычно не отличается от самого языка, за значения метафраз надо принимать сами фразы, а если мы говорим о значениях фраз подлинного языка, то — подлинные значения, что и является нашей точкой зрения в данном вопросе; итак, метазначения являются, с одной стороны, подлинными значениями, с другой стороны — фразами языка. Это положение до настоящего времени не совсем ясно, можно, однако, ожидать, что и здесь окажется достаточным главный вид зависимостей, данный предикатами, как было указано вначале. Предположим для простоты, что и в дальнейшем недопустим переход к метаязыку. Указанным примером мы объяснили, что семантика фраз данного языка использует три основных типа значений: 1) элементарные значения для лексических единиц, под которыми подразумеваются символы предикатов (т. е. подлинная семантика лексических единиц); 2) примитивные значения для примитивных фраз; 3) множества примитивных значений для остальных фраз. Аналогично предшествующим разделам рассмотрим множество лексических единиц Lt i-vo языка и, кроме того, текст Т( этого языка, 1 < i < п. Предположим при этом, что нам известна семантика ф фразы всех возможных текстов на всех рассматриваемых языках. Если 7^ — = FiF2 • • . Fk, где Fj являются фразами, то текст Tj = G\G2 . • • Gk будет переводом текста Ttl если ф (F^) = ф (G^) при 1 < \i ^C к. Однако каждую фразу F^ можно разбить на примитивные фразы. Этот процесс выделения примитивных фраз данной фразы необходимо описать. Это не что иное, как определенный тип анализа фразы. С другой стороны, необходимо подробно описать, как из примитивной фразы составить фразу сложную, что и есть определенный тип синтеза фраз. Если At— процесс анализа, a St— процесс синтеза в i-м языке, то процесс перевода текста Tt на /-й язык следующий: для каждого F^ построим A^F^) = {F^, }, затем для каждого F^ имеем такие G^v чтобы ф (F^) = = Ф (^щЬ и> наконец, построим 6^ = Sj (G^, G^, . . ., G^). Описание процессов анализа At и синтеза St во всех языках требует подробного изучения этих языков с указанной точки зрения. ЛИТЕРАТУРА [1] Тезисы совещания по математической лингвистике, Л., 1959. [2] Андреев Н. Д., Ф и т и а л о в С. Я., Язык-посредник машинного перевода и принципы его построения, Тезисы совещания по математической лингвистике, Л., 1959. [3] С и 1 i k К., On chromatic decompositions and chromatic numbers of graphs, Publ. Fac. Sci. Univ. Brno, Tchecoslovaquie, No. 403, 1959, 177—185. Поступило в редакцию 30 VIII 1963.
ОБ ОДНОЙ МОДЕЛИ СЕМАНТИЧЕСКОЙ ТЕОРИИ ИНФОРМАЦИИ Ю. Л. ШРЕЙДЕР (МОСКВА) 1. Термин «информация» не вызывает сомнений и не нуждается в пояснениях в той мере, в какой он применяется в чисто интуитивном смысле. В широком смысле термин «информация» понимается как свойство процесса, противопоставляемое его энергетическим и массовым характеристикам. Однако существует много ситуаций, когда слово «информация» употребляется для обозначения точного математического понятия. Например, информация, перерабатываемая нормальным алгорифмом Маркова,— это слова в некотором алфавите (см. [1]). Вторым примером может служить выражение «информация, содержащаяся в одной случайной величине относительно другой», которому соответствует точное математическое определение (см. [2]). На этом определении, в сущности, построена вся «теория информации», возникшая из потребностей статистической теории связи. В статье [3] уже отмечалось, что в задачах, связанных с обработкой текстов (машинный перевод, автоматическое реферирование и т. п.), возникает потребность в создании точных понятий, позволяющих характеризовать свойства и количество смысловой информации, содержащейся в текстах. По существу, нам необходимо иметь формальную модель, позволяющую описывать процесс семантического анализа текста. Установим сначала, какими свойствами должна обладать такая модель. Ясно, что смысловой анализ текста можно описывать с точки зрения различных наблюдателей, обладающих различным «представлением о мире». Так, текст очень содержательной математической статьи не содержит, по существу, никакой информации для человека, который не является специалистом в данной области математики. Поэтому формальная модель должна содержать описание «представления о внешнем мире» некоторого наблюдателя. Это «описание» мы, следуя [3], будем называть тезаурусом. Сам процесс смыслового анализа текста мы будем интерпретировать как изменение тезауруса («представления о внешнем мире») под влиянием данного текста. Поэтому нам придется ввести систему допустимых операторов над тезаурусом. Вид этих операторов существенно связан с принятой ниже моделью тезауруса. Фактически будет введено несколько типов элементарных операторов таких, что любой допустимый оператор над тезаурусом будет представлен в виде произведения элементарных. Совокупность произведений элементарных операторов, удовлетворяющих некоторым формулируемым ниже ограничениям на состав и порядок сомножителей, будет образовывать множество всех допустимых операторов.
234 Ю. А. ШРЕЙДЕР Наконец, в описываемой модели должен фигурировать алгоритм, который каждому допустимому входному тексту сопоставляет допустимый оператор над тезаурусом. Более того, этот алгоритм должен по тексту строить допустимый оператор в виде произведения элементарных операторов. Таким образом, в излагаемой модели тексту Т соответствует оператор Аг над тезаурусом G. Можно рассматривать различные величины, характеризующие степень изменения тезауруса под действием данного оператора. Мы будем называть количеством семантической информации, содержащейся в тексте Т, относительно тезауруса 6,7 (Г, G) степень изменения тезауруса G под воздействием оператора, соответствующего тексту Т. В действительности оператор Аг может образовываться по различным правилам. Мы будем считать, что эти правила являются составной частью тезауруса G. Это предположение довольно естественно, так как при изменении тезауруса может расширяться состав входящих в него сведений и соответственно меняться правила преобразования Ат. При таком определении величина I (Г, G) зависит только от текста Т и тезауруса G. Если бы мы рассматривали правила построения оператора Ат как нечто стоящее вне тезауруса G, то величина 7 (Г, 6) зависела бы от этих правил. Иначе можно сказать, что I (Г, 6) определяется текстом Т и тезаурусом в широком смысле этого слова. Мы будем отдельно рассматривать тезаурус в узком смысле, не включая в него правила построения оператора Ат. Важное свойство этого понятия состоит в том, что предварительное увеличение запаса сведений в тезаурусе G (расширение тезауруса) может не только уменьшать, но и увеличивать величину I(T, G). Содержательно это означает, что человек, выучивший некоторую отрасль науки, извлечет из специального текста по этой отрасли, вообще говоря, больше, чем до обучения. Заметим, что эта особенность модели семантической информации существенно отличает ее от классической теории информации. В последней увеличение априорной информации всегда уменьшает количество информации, извлекаемой из данного сообщения. Дело в том, что в теории связи не ставится вопрос о степени «понимания» приемником сообщения. Считается, что приемник заранее правильно «настроен». В семантической теории информации существенную роль играет сама возможность правильной «настройки» приемника. Два текста Т\ и Т2 могут содержать одно и то же количество информации I(T\, G) = I (7*2, G), но эта информация будет разной. Целесообразно поэтому ввести следующее определение. Два текста Т\ и Т2 содержат одну и ту же семантическую информацию (синонимичны) относительно данного тезауруса G, если соответствующие им операторы ATl и АГ2 равны*). Иначе говоря, тексты Ti и Т2 синонимичны относительно тезауруса G, если они одинаковым образом воздействуют на этот тезаурус. Здесь существенна относительность понятия синонимичности. Так, текст стихотворения и текст прозаического пересказа того же стихотворения будут синонимичны относительно многих тезаурусов. Более того, очень трудно построить формальную модель тезауруса, различающую эти два текста. Данное выше определение количества информации, содержащейся в тексте Г, относительно тезауруса G по существу, отражает не столько *) Это понятие является естественным развитием экстенсиональной и интенсиональной эквивалентностей (см. [5]). Заметим также, что «непонятный» текст синонимичен пустому.
ОБ ОДНОЙ МОДЕЛИ СЕМАНТИЧЕСКОЙ ТЕОРИИ ИНФОРМАЦИИ 235 семантику текста, сколько его прагматику (воздействие на тезаурус). Однако отделять прагматические характеристики информации от семантических вряд ли целесообразно. В более общей модели, по-видимому, возникает необходимость рассматривать механизм порождения текста, «описывающего» некоторый тезаурус 6'. Семантика этого текста будет характеризоваться его соответствием с тезаурусом, на основе которого этот текст порожден. Этот текст Т, воздействуя на тезаурус G (обладающий в некотором смысле нулевой информацией, но достаточно развитый для понимания текста Г), превращает его опять в исходный тезаурус 6'. Это, собственно говоря, и означает, что семантическая информация текста Т относительно порождающего тезауруса 6' равна «прагматической» информации текста Т относительно тезауруса G. Поэтому мы и не будем различать далее семантический и прагматический аспекты информации. Мы принимаем здесь название модель «семантики», хотя в действительности речь идет о моделировании достаточно общей знаковой системы со всеми тремя ее уровнями: семантикой (порождение текстов), синтак- тикой (правила соответствия между текстами и операторами и, на этой основе, правила, выделяющие класс допустимых текстов) и прагматикой (преобразования тезауруса под воздействием текстов). 2. Будем строить теперь формальное описание модели. Начнем с построения тезауруса. Введем в рассмотрение три множества: Л {а, Ь, . . .}, М {х, г/, . . .} и С {а, |3, . . .}. Элементы множества П будем называть предикатами, элементы множества М — объектами, а элементы множества С — событиями. На множестве П заданы два отношения: следования (обозначается ZD) и применимости (обозначается 1>). Эти отношения обладают следующими свойствами: 1) а 3 а. 2) Если a ZD b и b ZD с, то a ZD с. 3) Если a ZD Ь, то b [> а. 4) Если а О b и b [> с, то а [> с. Из свойств 3) и 4) вытекает свойство: 5) Если a ZJ b и с \> Ь, то с [> а. Содержательно отношение применимости понимается так: а [> b обозначает, что предикат а применим ко всем объектам или событиям, к которым применим предикат Ь. Замечание. В дальнейшем будут использоваться многоместные предикаты. Для них отношение применимости следует писать в виде at[> bj. Эта запись означает, что предикат а применим по г-му месту ко всем объектам (событиям), к которым применим по /-му месту предикат Ь. Мы будем рассматривать также более общее отношение вида а\ ii l> (b)i, • • ., bjL). Читается: предикат а применим по местам И, . . ., ii к группам из / объектов (событий), к которым применимы по соответствующим местам предикаты, стоящие в правой части отношения. Для этого отношения нужно потребовать выполнения свойств, аналогичных 3), 4) и 5)*). Отношение применимости используется в алгоритме анализа текста для образования оператора Ат, а для тезауруса в узком смысле оно несущественно. *) При этом отношение включения придется рассматривать также в виде
236 Ю. А. ШРЕЙДЕР Мы будем считать заданным, что из некоторых пар элементов множеств П и М допустимо образовывать пары типа ах (читается: «объект х обладает свойством'а») и 1 ах (читается: «объект х не обладает свойством а»). Такие пары называются атомарными высказываниями. При этом, если первое высказывание истинно, то второе ложно, и наоборот. Если ах допустимо и Ь > а, то Ъх допустимо. Аналогично для /-местных предикатов а 6 П разрешается образовывать атомарные высказывания вида axi . . . хг и 1 ах± ... хг. Мы будем требовать, чтобы правила, разрешающие применять /-местный предикат а к кортежу объектов (xi, x2, ... хг), можно было представить в следующем виде. Введем тернарное отношение R(a, x, к) (где а £ П, х £ М, к — целое число). Атомарное высказывание ах\хг . . . хг должно быть допустимо, если и только если (V^)i?(a, xk, к) истинно*). Если А и В — высказывания, то А V В, А /\ В и 1 А по определению являются высказываниями. Введем теперь следующие условия: 1) Если допустимо автомарное высказывание ах^ . . . хг и bt[> ak для /с;£ Е <! [1, /], a i пробегает все места предиката Ь, то допустимо атомарное высказывание bxh xk ... xkv 2) Атомарные высказывания ах^ . . . хг и 1 ах\ . . . xi допустимы или недопустимы одновременно. 3) Если а > Ъ и ах\ . . . xt истинно, то Ъх\ . . . хг истинно, а если bxi . . . Xi ложно, то ах\ . . . х\ ложно. Прежде чем определить множество событий С, введем перечень кванторов, с помощью которых эти события будут определяться. Квантор рождения (возникновения, введения в рассмотрение) обозначается d. Выражение (dx)(ax) читается так: «возник х, обладающий свойством а». Квантор дескрипции i в выражении a(ix)bx читается так: «тот х, который обладет свойством Ь, обладает свойством а». Квантор множественной дескрипции е позволяет ввести выражения а(ех)Ьх, читаемые так: «те х, которые обладают свойством 6, обладают свойством а». Квантор общей дескрипции а употребляется в выражениях вида а(вх)Ьх, которые читаются так: «все те х, которые обладают свойством Ь, обладают свойством а». Разница между двумя последними кванторами состоит в том, что квантор е действует только на объекты, входящие во множество Л/, а квантор а — на все объекты, которые в дальнейшем могут входить в М. Иными словами, высказывание а(ях)Ьх равносильно отношению b ZD а. Можно сказать, что квантор е является экстенсиональным, т. е. относится к объектам из М, а квантор а является интенсиональным, т. е. относится ко всем «мыслимым» объектам. Далее мы будем обозначать символом типа А (х\, хг, . . ., х{) высказывание, образованное из атомарных высказываний, содержащих объекты Хи • • -, %1- С помощью введенных выше кванторов можно образовывать различные кванторные выражения с /-местными предикатами. Эти выражения для случая / = 2 приведены в таблице. Для / >> 2 такие выражения легко строятся по аналогии. Теперь можно определить, что такое событие. Определение события является рекурсивным. *) Аналогичный вопрос возникает о правилах определения допустимости выражений да, где а—событие.
ОБ ОДНОЙ МОДЕЛИ СЕМАНТИЧЕСКОЙ ТЕОРИИ ИНФОРМАЦИИ 237 1) Любое выражение в таблице, в котором участвуют кванторы d, i и е, является событием; 2) логическая связка событий, образованная с помощью символов Л> V и "1 , является событием; 3) любое выражение типа приведенных в таблице с кванторами d, i и е, где некоторые (или все) объекты заменены событиями, является событием. Таким образом, определено множество событий С. Таблица Кпаптор Типы высказываний (d*l) (d*2M 0*1» *2) В((\,х{)А{(хх), (^2)А2(х2)) В ((ix{) (ix2) A (xu х2)) В ((еа:,) Ai fa), (ех2) А2 (я2)) В ((гх{) (ех2) А (х'1, х2)) В{(ВхйАх{х{),{Ъх2)А2(х2)) /*((a*l)(a*2M(*l *2» /?((i.x'i) Ах (х{), (ех2) А2 (х2)) В((ух\){гх2)А(хь х2)) Наложим теперь на множества Л/, П и С дополнительное условие. Именно будем требовать, чтобы с каждым объектом х £ М был связан предикат х*6 П вида «совпадает с объектом х». Ясно, что я*у истинно, когда у = х, и ложно, когда у ф х. Множество таких одноместных предикатов будем обозначать Пм. Таким образом, множество П изменяется при изменении множества объектов. Аналогично мы будем требовать, чтобы каждому событию а соответствовал предикат а*(= Пс С П, читающийся: «участвует в событии а». Вообще говоря, определение этого предиката нуждается в уточнении, поскольку одно и то же событие в силу рекурсивности его определения может быть по-разному составлено из более простых событий и объектов. В частности, можно было бы отдельно рассматривать предикат а**: «совпадает с событием а». Теперь мы в состоянии дать определение тезауруса (в узком смысле). Тезаурусом G называется совокупность множеств П, М и С с заданными в П отношениями D и [> и с указанными допустимыми атомарными высказываниями. Рассмотрим теперь элементарные операторы над тезаурусом. Будем называть выражения, составленные по типу входящих в таблицу 1, каноническими. 1) Каноническому выражению а, содержащему кванторы i и е, соответствует элементрарный оператор над тезаурусом, преобразующий (Г следующим образом: во множество С добавляется событие а (если его там не было заранее), во множество П добавляется предикат а*, и устанавливается отношение применимости между внешним предикатом, участвующим в записи а, и внутренними предикатами (если это отношение не было установлено заранее). 2) Каноническому выражению а, содержащему квантор d, соответствует элементарный оператор над G следующего вида: во множество С добавляется событие а, во множество М добавляются объекты xtl входящие в область действия квантора d, во множество П добавляются предикаты #£. d i е а 16 Проблемы кибернетики, вып 13
238 Ю. А. ШРЕЙДЕР 3) Каноническому выражению а, содержащему квантор а, соответствует элементарный оператор, устанавливающий новые отношения Z3 во множестве П. (Выражение а(вх)Ьх требует установления отношения b ZD а, если оно не существовало ранее в П.) Тезаурус в широком смысле получается из тезауруса в узком смысле добавлением правил, позволяющих текстам Т, образующим некоторый класс Kq, сопоставить набор элементарных операторов и указать порядок их применения. Произведение этих операторов в нужном порядке определяет оператор Аг преобразования тезауруса G под влиянием текста Т. Из вышесказанного видно, что для построения оператора Аг достаточно научиться представлять текст Т в виде некоторой структуры канонических выражений*). Если в тексте Т не удается выделить канонические выражения, то он никак не преобразует тезаурус 0. В этом случае естественно говорить, что этот текст «непонятен» для тезауруса G. Если текст расчленяется на канонические выражения, но оператор Ат не меняет тезаурус 0, то естественно говорить, что текст Т не содержит новой информации относительно данного тезауруса. Алгоритм ЭД, который по тексту Т строит оператор Лт, мы будем называть алгоритмом анализа текста с помощью тезауруса. Таким образом, тезаурус в широком смысле есть совокупность некоторого тезауруса в узком смысле и некоторого алгоритма 21 анализа текста. Приведем примеры членения русских текстов на канонические выражения. Пример 1. Пусть задан текст: «Сегодня построен новый дом». Предположим, что заранее заданы предикаты: а^— дом (быть домом)у а2— новый, а3— быть построенным, а4— сегодня. Запись текста в канонических выражениях: 1) (da;) (aix), 2) a2(ix)a1x1 3) a3(ix)a2x = oti, 4) a4ai. Заметим, что для получения такой записи нам нужны были заранее только предикаты. Множества М и С могли быть априори пустыми. Но в результате анализа текста в них появились элементы. То обстоятельство, что множества М и С пополняются в процессе анализа текста, является весьма существенным. Пример 2. Рассмотрим текст вида: «Числовая последовательность называется регулярной, если она монотонна и ограничена». Используются предикаты: а±— быть последовательностью, а2 — числовая (состоять из чисел), а3 — называться (двуместный предикат), а4— монотонный, аь— ограниченный, я6— регулярный. Смысловая запись: 1) (dx)aix, 2) a2(ix)aix, 3) ak(\x)a\x = oti, 4) a5(ix)aix ~ a2, 5) otiA a>2= а>ь, 6) a3{{Bx)afx, (яу)а6у). *) Таким образом, алгебраически задача описания семантики класса текстов состоит в изучении отображения текстов в кольцо операторов над тезаурусом Э. При этом синоиимипые тексты склеиваются, а бессмысленные не имеют образа.
ОБ ОДНОЙ МОДЕЛИ СЕМАНТИЧЕСКОЙ ТЕОРИИ ИНФОРМАЦИИ 239 Здесь существенно, что предикат а6 мог заранее не входить во множество П. Приведенная выше запись текста говорит о том, что мы должны такой элемент ввести в П. Но даже если бы он и был там, то новыми являются вводимые в П отношения a6ZD ak, a6ZD а5, а6[> (аи а2). (Слову «регулярный», применяемому не к числовым последовательностям, тогда соответствует другой предикат в П, отличный от а6.) Отметим еще, что объект х в этом случае можно «после употребления» вывести из рассмотрения (исключить из М). Вообще говоря, вопрос о кванторе, «обратном» к dr не простой. Так, физическое уничтожение объекта х не означает его уничтожения в М постольку, поскольку о нем может еще идти речь в дальнейшем. В каких случаях нужно «забывать» про объект (выводить из рассмотрения), мы здесь обсуждать не будем. Сделаем еще следующее замечание. Текст Т может быть расчлени- мым на канонические выражения, но алгоритм анализа может установить такой порядок этих выражений, при котором не будет определено произведение соответствующих элементарных операторов. Для того чтобы такое произведение было определено, необходимо выполнение ряда условий. Эти условия сводятся, по существу, к следующим. Если применяется оператор a(ix)bx или а(гх)Ьх, то до него обязательно должен быть применен оператор вида (dx)bx. Исключением является только тот случай, когда b £ Пм. Если в область действия некоторого квантора, участвующего в каноническом выражении, вычлененном из текста Г, входит некоторое событие а, то это событие либо должно быть определено одним из предыдущих операторов, либо до начала анализа текста содержаться во множестве С. Поскольку алгоритм анализа 21 выдает упорядоченную последовательность элементарных операторов, вычленяемых из текста, можно ввести модификацию квантора дескрипции i*, определяемую следующим образом. Выражение a(i*x)bx означает, что тот х, который был последним из обладавших свойством 6, обладает свойством а. На самом деле при понимании текста мы именно так и употребляем оператор дескрипции. Именно, пусть где-то в тексте употреблено слово «дом», а затем сказано: «Некто остановился перед девятиэтажным домом». Тогда эта фраза будет, если не отмечено специально противоположное* относиться к новому объекту, являющемуся «домом»*). Операторы преобразования тезауруса могут еще интерпретироваться следующим образом. Далее будем считать, что в М всегда есть «пустой объект», обозначаемый 4t- Рассмотрим мыогознач ые функции /, заданные на П и принимающие значения на множестве Е — прямом произведении М{]С X К. Здесь К — множество из двух элементов: К = {*,! }. Равенство / (а) = (х, *) означает, что выполнено ах; равенство f(a) = (x, ~~\) означает, что имеет место отрицание ~[ ах. Равенство f(a) = (ф, *) означает, что нет объекта или события, для которого истинно или ложно высказывание ах (высказывание ах выполнено лишь для пустого объекта х = ф). Чтобы включить сюда еще случай многоместных предикатов, нужно; множество Е определить так: е=(м и О U W и cr U • • • U W U С)п ■ ■ • *к, где (М[_}С)П есть множество гс-местных кортежей из объектов и событий. *) Вообще следовало бы специально изучить операторы ссылки на текст, возникающие при описании смысла выражений вроде «вышеуказанное доказывает утверждение данной теоремы». 16*
240 Ю. А. ШРЕЙДЕР Нетрудно убедиться, что задание функции / вместе с ее областью определения позволяет определить тезаурус в узком смысле с точностью до отношений ZJ и [>. Оператор Ат можно рассматривать как оператор, преобразующий функцию / в функцию /'. Правда, этот оператор одновременно меняет множество значений и область определения функции. Такого рода интерпретация тезауруса рассмотрена в [3]. В настоящей работе не рассматривается вопрос о фактической структуре алгоритма ЭД анализа текста. Можно бы указать ряд приемов построения этого алгоритма для текстов с теми или иными ограничениями. Задача построения алгоритма 21 тесно связана с задачей анализа при машинном переводе. Построение алгоритма с достаточно широкими возможностями требует большой экспериментальной работы по машинной обработке текстов. В заключение автор считает своим долгом выразить благодарность своим товарищам по работе и в первую очередь М. В. Арапову, А. С. Есе- нину-Вольпину, Н. С. Горкиной, И. И. Ратцевой, Э. Д. Стоцкому за внимательное обсуждение содержания этой работы и О. С. Кулагиной за большую помощь при окончательной подготовке статьи. ЛИТЕРАТУРА [1] Марков А. А., Теория алгоритмов, Труды математического института им. Стек- лова, т. 42, 1954. [2] Г о л д м а я, Теория информации, М., ИЛ, 1957. 13] Ш р е й д е р Ю. А., К определению семантической информации, сб. НТИ, № 10, М., изд. ВИНИТИ, 1963. [4] А р а п о в М. В. и Ш р е й д е р Ю. А., Семантика и машинный перевод, сб. НТИ, № 1, М., изд. ВИНИТИ, 1965. [5] Карнап Р., Значение и необходимость, М., ИЛ, 1959. Поступило в редакцию 25 XII 1963.
VII. КРАТКИЕ СООБЩЕНИЯ АЛГОРИТМЫ, ОСУЩЕСТВЛЯЕМЫЕ ПОВТОРЯЮЩИМИСЯ ПРИМЕНЕНИЯМИ КОНЕЧНЫХ АВТОМАТОВ Ю. В. ГЛЕБСКИЙ, А. М. ДУДИЧ, Д. И. КОГАН, М. И. ЛИОГОНЬКИЙ, Ал. А. МАРКОВ (ГОРЬКИЙ) Основная цель этой работы — исследование алгоритмов, определяемых следующим образом. Имеется конечный автомат. Пропускаем через него ленту (с записанным на ней словом), полученную в результате ленту снова пропускаем через автомат и т. д. до тех пор, пока не будет получен сигнал об остановке (если только процесс вообще заканчивается). Если при этом брать только синхронные конечные автоматы (не изменяющие длины ленты, см., например, [1, 2]) и считать, что данный автомат представляет множество тех слов, для которых автомат останавливается, то класс всех множеств, представимых автоматами таким способом (С-множества см. ниже), шире класса множеств, представимых автоматами в обычном смысле [1, 2], но уже класса всех множеств, отвечающих алгоритмически разрешимым предикатам (при соответствующей геде- лизации — уже класса примитивно-рекурсивных множеств). Если же брать обобщенные конечные автоматы (изменяющие длину ленты, см. [3]), то повторяющееся использование таких автоматов позволяет получить любой алгоритм. В работе рассматриваются также другие вопросы, связанные с повторяющимся использованием конечных автоматов. 1. Если А — алфавит, то через А будем обозначать множество всех слов в алфавите А. Пустое слово в любом алфавите будем обозначать через Л. Если а £ Л, то через ап, п = О, 1, 2, . . ., будем обозначать слово аа ... а длины /г. Будем говорить, что задан R-автомат Х в алфавите Л, если задана совокупность объектов X = {A, Q, qQ, /, g, S}, где Q — конечное непустое множество (состояний автомата), q0£ Q (начальное состояние), / — функция, отображающая Qx А в Q; g — функция, отображающая Qx А в А, S CZQ (множество остановочных состояний). Функции fug, заданные на конечном множестве Q X А, распространяем на бесконечное множество Q X А следующим образом: / (q, Л) = q, g (q, Л) = Л; если а £ А, и а 6 А, то полагаем / (д, аа) = / (f(q, a),a), g (q, аа) = g (q, a)g(f(q, а), а).(Правую часть последнего соотношения следует понимать как соединение слов g (q, а) и g (f(q, а), а).) Пусть а £ A. Рассмотрим следующую последовательность слов at и состояний qt, t = О, 1, 2, ... : а0= a, q0— начальное состояние;
242 Ю. В. ГЛЕБСКИЙ, А. М. ДУДИЧ, Д. И. КОГАН, М. И. ЛИОГОНЬКИЙ, Ал. А. МАРКОВ «*+i= g (qt, a*)» qt+i= t (qt, a,t). Если существует такое t0, что ^0 6 S ж qt $ S для всех t <C £0, то будем говорить, что R-автомат X применим к слову а = а0, и слово а<0 будем называть результатом применения X к а и обозначать через X (а). В противном случае будем говорить, что X не применим к а (или что Х(а) не существует). Будем говорить, что задан R-автомат Х над. алфавитом А, если X есть Л-автомат в алфавите В, включающем А как часть. Следующая теорема устанавливает, что (в соответствии с тезисом о нормализуемости [4]) в .^-автоматах может быть осуществлен любой алгоритм. Теорема 1. Для любого нормального алгоритма N в алфавите А [4] можно построить такой R-автомат Х над A (J {Ь}, где буква Ъ (J A, что для всех а £ А результат N(a) существует тогда, когда существует X (Ьа) (и в этом случае выполняется равенство N(a) = X(ba)), и только тогда. 2. iJ-автомат X = {A, Q, q0, /, g, S} будем называть С-автоматом, если все значения функции g являются однобуквенными словами (т. е. автомат не меняет длины ленты). Если А — алфавит и С/сЛ,то{/ будем называть С-множеством, если существует С-автомат X над алфавитом А такой, что для любого а £ А автомат X применим к а тогда и только тогда, когда а £ U. Пусть дан алфавит В = {1}. Если натуральное число п представлять словом длины п в алфавите В, то следующие множества натуральных чисел будут С-множествами: множество всех простых чисел, множество всех степеней двойки, множество всех чисел вида хх и т. п. Теорема 2. Совокупность всех С-множеств слов в фиксированном алфавите замкнуто относительно операций дополнения, объединения и пересечения. 3. Для заданного С-автомата X = {A, Q, q0, /, g, S} рассмотрим совокупность четверок (q, a, q , а), где q (zQ, a £ A, q = f(q, a) £Q, a' = = g (#> а) 6 А. Такую четверку будем называть отмеченной, если q £ S, и неотмеченной в противном случае. Будем говорить, что задан С-автомат X с нумерацией, если для С-автомата X в алфавите А каким-либо способом занумерованы буквы алфавита А, занумерованы состояния (так что начальное состояние будет первым) и все четверки вышеописанного вида. Рассмотрим алфавит С = {с, d, 1, s}. Для данного С-автомата X = = {A, Q, q0, /, g, S} с нумерацией кодом четверки (q, a, q', а) будем называть слово IV 13'V £ С, если четверка не отмечена, и слово 1 ]cllJ'cl's £ С, если четверка отмечена (здесь /', i, /', i — номера q, a, q , а' соответственно). Кодом С-автомата X будем называть слово X*— d^d^ • • • ci^d, где £j, i = 1, 2, . . ., N,— коды всех четверок, выписанные в порядке, соответствующем выбранной нумерации четверок. Обозначим через Q совокупность всех С-автоматов с нумерацией над алфавитом С и через Q*— совокупность кодов этих автоматов, й*с: С. Будем говорить, что С-автомат X, принадлежащий £2, самоприменим, если X применим к собственному коду X*. Обозначим через V множество всех кодов несамоприменимых С-автоматов из Q, 7сй*. Теорема 3. Множество V не является С-множеством. Теорема 4. Можно построить R-автомат Y над алфавитом С, применимый к любому слову а £ С, причем Y (а) = А тогда и только тогда, когда а £ V. Таким образом, V есть пример алгоритмически разрешимого множества, не являющегося С-множеством. Заметим также, что при соответствую-
ПОВТОРЯЮЩИЕСЯ ПРИМЕНЕНИЯ КОНЕЧНЫХ АВТОМАТОВ 243 щей геделизации iJ-автомата Y множество геделевских номеров элементов из V является примитивно-рекурсивным. Это вытекает из того факта, что при построении предиката, который при геделевскои нумерации отвечает предикату «Y(oc) = Л», можно использовать только ограниченный |а-оператор [5]. Однако вопрос о вычислении арифметических функций и предикатов с помощью С-автоматов и вопрос о том, какое место занимает класс С-мно- жеств в иерархии, приведенной в [6], остались неисследованными. 4. Пусть даны два алфавита А, В, причем ic5. Проблемой пустоты для C-авгпоматов в В относительно А будем называть массовую проблему, заключающуюся в том, чтобы для каждого С-автомата X в алфавите В ответить на вопрос: существует ли хотя бы одно слово а £ А, к которому применим X, или нет? Если А = В, то указанная проблема сводится к проблеме пустоты для конечных автоматов [2], являющейся алгоритмически разрешимой. Отсюда следует Теорема 5. Для любого алфавита А проблема пустоты для С-автоматов в А относительно А алгоритмически разрешима, С другой стороны, имеет место следующая Теорема 6. Для любого алфавита А, состоящего из т букв, т >• >- 2, можно построить алфавит В (добавлением к А новых т + 4 букв) так, что проблема пустоты для С-автоматов в В относительно А является алгоритмически неразрешимой. Доказательство последней теоремы заключается в сведении комбинаторной проблемы Поста для алфавита А (неразрешимой алгоритмически [4, 7]) к проблеме, сформулированной в теореме. ЛИТЕРАТУРА [1] Автоматы, сб. под ред. Шеннона, ИЛ, 1956. ;[2] Rabin М. О., Scott D., IBM J. Res. Dev. 3, 2, 1959, 114—125 (русский перевод: Кибернетич. сб., вып. 4, ИЛ, 1962, 58—91). 13] Г л е б с к ц и 10. В., сб. «Проблемы кибернетики», вып 7, М., Физматгиз, 1962, 127-149. [4] М а р к о в А. А., Теория алгорифмов, Труды МИАН 42, 1954. [5] У с и с н с к и н В. А., Лекции о вычислимых функциях, М., Физматгиз, 1960. [6] Ritchie R. W., Classes of predictably computable functions, Trans. Amer. Math. Soc. 106, 1, 1963, 137—173. J7] Post E. L., A variant of a recursively unsolvable problem, Bull. Amer. Math. Soc. 52, 4 1946, 264—268. Поступило в редакцию 12 IV 1964.
ОБ АДДИТИВНЫХ ЦЕПОЧКАХ ЧИСЕЛ А. М. ИЛЬИН (СВЕРДЛОВСК) Рассмотрим последовательность целых чисел 1 = а0, аи . . ., ат = п (1) такую, что ah = ai + aj, 0<г, /</с, /с = 1, 2, ..., г. (2> Пусть 1{п)—наименьшее г (длина цепочки), при котором последний член цепочки ат = п, где п — положительное целое число. Задача отыскания величины I (п) возникает при стремлении найти наименьшее количество умножений, необходимое для возведения некоторого числа в степень п. А. Шольц [1] впервые поставил вопрос о некоторых свойствах последовательностей вида (1), которые он назвал аддитивными цепочками. А. Брауэр в работе [2] доказал оценки log2/г<Z (/г), (3) 1(п)<Юё2п + С^^ (4) для п > 2 и тем самым I (n) — log2/z. (5) (Посредством Ct (i=l, 2, ...) мы будем всюду обозначать положительные абсолютные постоянные.) Ряд свойств функции I (п) рассматривался в работах [3] — [5]. В неравенстве (4) второй член Ci-,—^у—— отличается от главного члена лишь очень медленно убывающим множителем , * п , и есте^ ственно возникает вопрос, нельзя ли улучшить эту оценку. Для некоторых чисел п она действительно завышена. Если, например, п = 2т, где т — положительное целое число, то I (п) =■ \og2n; если п = 2т—1, то, как следует из [2], I (п) < log2 п + С2 log2 log2 /г. В настоящей заметке будет, однако, показано, что оценку (4) нельзя улучшить для всех п одновременно. Точнее, справедлива Теорема. Для некоторой бесконечной последовательности положительных целых чисел п выполняется неравенство I (n) > log2 n + C3 -J^Jl— . (6> v ) 62 -г з log2 ]og2 п \ /
246 A. M. ИЛЬИН Доказательство. Рассмотрим положительные целые числа тг, удовлетворяющие неравенствам 2т</г<2т+\ (7) где т>2— положительное целое число. Пусть рт =max l (/г), где максимум берется по всем целым /г, удовлетворяющим условию (7). Из оценок (3) и (4) следует, что m<pm<(m+l)(l + i^-)<m + !|^-- (8) Обозначим через Аг(т) класс цепочек вида (1) длины г<,Рт и таких, что аг>2т. Из оценки (3) следует, что г>#г. Покажем, что большинство членов аддитивной цепочки из класса Аг(т) (при большом т) получается удвоением предыдущего члена. Точнее, будем называть номер к сильным, если а^ = 2а^-\, и слабым в противном случае. Введем обозначение Sr=r — т. Тогда справедлива Лемма*). Число слабых номеров в цепочке из класса АТ(т) не превосходит величины CbSr. Доказательство. Пусть у— это цепочка а0, аи .. ., аг из класса Аг(т). Построим другую цепочку у = {а0, аи . . ., аг) по следующему правилу: a0=l, ak--=2ah-i, если к — сильный номер цепочки у, и аи = = att-i-\-ak-2, если к — слабый номер цепочки у. Легко доказать по индукции, что ak^>au для всех к^,г. В частности, ar>ar>2m. (9) Пусть а, а+1, ..., а+ 0 — 1 — группа слабых номеров цепочки у такая, что а—1 — сильный номер. Тогда - _- , - 3 - аа — aa-i -f" aa-2 = "g" aa-U - _ 5 — - _ Т(з+з - aa+i — о aai - • • » #a+p-l — — <2а+р_2, 0 т(3+2 где Тр —член ряда Фибоначчи 1, 1, 2, 3, 5, 8, 13, ... (10) с номером р. Известно, что члены ряда (10) растут не быстрее геометрической прогрессии с основанием меньшим, чем 2. При этом < С6 < 2 для |3>1. Таким образом, ak = 2ak-1, если /с —сильный номер, и ak < <Сфк-и если й^-слабый номер. Пусть t—число слабых номеров в цепочке у. Тогда аг<2г~'(С6)'. Отсюда и из (9) следует, что 2r~l (C6y > 2»\ r-t + t log2 C6 > m, *(1 —log2Ce)<r —m = Sr. Лемма доказана. Продолжим доказательство теоремы. Цепочки вида (1) будем называть различными, если для какого-нибудь номера к числа ak в этих цепочках различны. Пусть Nr (m) — число различных цепочек класса Ar (т), a dr = C5Sr. Оценим величину Nr(?n) следующим образом. Рассмотрим совокупность Ar(m) цепочек длины г, у которых r — dr номеров сильные, а остальные dr номеров могут быть как сильными, так и слабыми и аг>2т. Число различных цепочек из класса А'г (т) обозначим N'r(m). Из леммы вытекает, что Nr(m)^.N'r{m). *) Аналогичный результат получен в работе [4].
ОБ АДДИТИВНЫХ ЦЕПОЧКАХ ЧИСЕЛ 247 Ясно, что цепочка из класса А'г(т) будет однозначно определена, если будут указаны dr номеров, которые могут быть как сильными, так и слабыми, и для каждого из этих номеров к указаны два предыдущих номера i и/так, что выполнено (2). Таким образом, N'r (m) < Cdr (r2)dr < r3dr. Согласно определению числа рт, цепочкой длины не больше, чем /?т, можно получить любое из чисел /г, удовлетворяющих неравенству (7). Всего таких чисел 2т. Следовательно, 2т< 2 Nr(m)< 2 rSdr- (H) Обозначим: hm = pm — m. Тогда dr=^C5Sr = C5(r — m) < Съ (pm — m) = = ' У7т- Из неравенства (11) вытекает соотношение 2т < 2 r3C*hm < (hm 4- 1) pl^m = (hm + 1) Р£Ч откуда получаем, что т < С7/гт log2 pm + log2 (hm +1) = С7Лт log2 (w f Am) + + log2 (hm + 1) = C7Am log2 m + С7/гт log2 (1 + -^) + log2 (hm + 1). Значит, hm—>oo при т—>со. С другой стороны, из оценки (8) видно, что fem<y—-— = о(т). Следовательно, Jra<C8ftmlog2/rc, а ^ = т + /г™>т + сЛ^- Следовательно, для всех т>2 найдется по крайней мере одно целое число между 2т и 2m+1 —1, для которого справедливо неравенство Цп)>га+Г™» >log2"-l +7^^r^:>log2ii + C,3 log2rc С8 l0g2 m ^ ё2 "*" C8 l0g2 l0g2 71 ^ ё2 ^ 3 l0g2 10g2 71 Теорема доказана. Замечание. Множество чисел п, для которых выполнено неравенство (6), не является исключительным. Грубо говоря, оно выполняется для «большинства» чисел. Точнее, пусть среди 2т чисел, для которых справедливы неравенства (7), L (т) чисел не удовлетворяют оценке (6), тогда Ш-+0 (т-+а>). (12) Действительно, для этих чисел I (п) < log2n + C3T^^— < (т+1) (1+1-^— v у ^ 62 ' 3log2log2" ^v ' 'V log2m При доказательстве теоремы установлено, что число различных цепочек длины /*, для которых аТ > 2"\ не превосходит величины /-зс5(г-т) Таким образом, L(m)<(Cm+l)^(<3m—>. Из этой оценки следует (12), если взять С3 < ^г . Из неравенств (4) и (6) вытекает, что величина С9 = Tim —|~2^g2yZ bg2 log2 n
248 A. M. ИЛЬИН 1 конечна и положительна. В работе [2] показано, что C9<i-~9. Как указал автору С. Б. Стечкин, можно установить, что С9<1. Для этого достаточно в неравенстве 4")<(l + y)log2" + 2r-2 для 0<r<[log2H], полученном в работе [2], положить г— log2 ( т-\— i~—\2) • Тогда полу- чим: Z(Az)<log2/z+1 log*n +C10 log2" .. , где а > 0. v '^ B2 log2\og2n (\og2\og2n){+a По-видимому, С9=1, однако это не удается доказать. Из доказательства неравенства (6) следует довольно грубая оценка снизу для величины С9. Несколько более тонкими рассуждениями, чем те, которые приведены выше, можно показать, что 69>у . ЛИТЕРАТУРА [1] Scholz A., Jahresbericht der deutschen Mathematiker Vereinigung 47, Abt. \l.r S'. 41, Aufgabe 253, 1937. [2] В г a u e г A., On addition chains, Bulletin of the American Mathematical Society 45, 7, 1939, 736—739. [3] U tz W. R., A note on the Scholz-Brauer problem in addition chains, Proceedings of the American Mathematical Society 4, 1953, 462 — 463. [4] Hanzen W., Zum Scholz-Brauerschen Problem, Journal fur die reine und ange- wandte Mathematik 202, 1959, 129—136. [5] Gioia A. A., Subbarao M. V., Sugunamma M., The Scholz-Brauer problem in addition chains, Duke Mathematical Journal 29, 3, 1962, 481 — 488. Поступило в редакцию 13 HI 1964^
НАСЛЕДСТВЕННАЯ ИНФОРМАЦИЯ И ЕЕ ПРЕОБРАЗОВАНИЯ (Тезисы доклада на X генетическом конгрессе, февраль 1958 года) На русском языке публикуются впервые. И. Я. ШМАЛЬГАУЗЕН (МОСКВА) Механизм эволюции рассматривается с точки зрения кибернетики. Регулируемым объектом является популяция как наименьшая эволюи- рующая единица. В роли регулятора.выступает биогеоценоз. Популяция связана с биогеоценозом посредством двух каналов связи. Первый канал связи лежит на молекулярном уровне организации и служит для передачи наследственной информации от зиготы к первичным половым клеткам зрелой особи. Второй канал связи лежит на уровне организации особи и служит для передачи обратной информации от фенотипов к биогеоценозу. Между этими двумя каналами вставлены механизмы преобразования, обеспечивающие связь между ними и замыкающие элементарный цикл эволюционных изменений. Чередование двух пар оснований в молекуле ДНК дает при большом числе звеньев в цепной молекуле огромное число комбинаций, обеспечивающих глубокую индивидуальность каждой молекулы. Наследственная информация передается через механизм клеточного деления. Хромосомы являются носителями информации, регуляторами внутриклеточного обмена веществ и контролируют процессы индивидуального развития. Последнее реализуется в формообразовательных механизмах с использованием усилителей. Вся суть индивидуального развития состоит в преобразовании наследственной информации в систему жизненных связей фенотипа с внешней средой. Естественный отбор осуществляется на основе оценки фенотипов и является механизмом преобразования обратной информации в биогеоценозе. Преобразование завершается перестройкой наследственной информациии в зиготах. Случайные внешние воздействия являются «помехами», искажающими информацию. Элиминация уклонений, т. е. стабилизирующий отбор, приводит к увеличению помехоустойчивости. Это достигается теми же средствами, как и в технике •связи. Повторность информации осуществляется повторением одинаковых генов и повторением целых хромосом в диплоидном организме. Система внутренних связей использована в строении генов и хромосом и в объединении набора хромосом. Изоляция наследственного кода достигается его положением под защитой регуляторных механизмов клетки. Помехоустойчивость механизма преобразования информации в онтогенезе поддерживается системой внутренних связей и регуляторным их характером. Надежность обратной информации обеспечивается организацией фенотипа, тювторностью всего существенного в каждой особи, развитием средств -защиты и изоляции от помех. Поступило в редакцию 31 I 1964.
VIII. ХРОНИКА СЕМИНАРЫ ПО КИБЕРНЕТИКЕ В МГУ В 1963/64 учебном году в МГУ продолжал работать семинар по кибернетике под руководством А. А. Ляпунова и С. В. Яблонского. Было проведено три заседания, на которых были заслушаны следующие доклады: В. В. Налимов, Планирование экстремальных экспериментов (21 II 1964). Н. П. Наумов, Структура и динамика популяций животных (24 IV 1964). Н. П. Рашевский (США), Реляционная биология (И V 1964). В том же году на семинаре но математическим вопросам кибернетики под руководством С. В. Яблонского были заслушаны следующие доклады: Г. П. Г а в р и л о в, О квазипеановости функций (4, И X 1963). См. ДАН 156, № 5, 1964, 1011-1013. Ф. Я. В е т у х н о в с к и й, О покрытиях графа системами окрестностей его вершин (18, 25 X 1963). См. ДАН 158, № 1, 1964, 21—24. В. А. Кузьмин, О нормальных алгоритмах и реализации ими функций алгебры логики (1, 22 XI 1963). См. наст, сборник. О. Б. Л у п а н о в, Реферат работы В. К. Коробкова «О синтезе схем для монотонных функций» (15 XI 1963). См. наст, сборник. В. М. X р а п ч е н к о, Реферат работы Э. И. Нечипорука «О синтезе схем из пороговых элементов» (29 XI, 6, 13 XII 1963). См. сб. «Проблемы кибернетики», вып. И, 1964, 49—62. В. Л. М у р с к и й, О преобразованиях некоторых типов схем, связанных с конечными автоматами (14, 21, 28 II 1964). См. ДАН 156, № 3 1964, 510-512. Ю. И. Я н о в, Об инвариантных операциях над событиями (6 III 64). См. сб. «Проблемы кибернетики», вып. 12, 1964, 253—258. Г. П. Г а в р и л о в, В. Б. К у д р я в ц е в, С. В. Я б л о н с к и й, Теорема Поста (13, 27 III 1964). Г. П. Г а в р и л о в, О числе предполных классов в счетнозначной логике (29 III 64). См. ДАН 158, № 3, 1964, 503—506. X. А. М а д а т я н, О самокорректирующихся контактных схемах (13 IV 64). См. ДАН 159, № 2, 1964, 290—293. Г. И. К и р и е н к о, О самокорректирующихся схемах из функциональных элементов (10 IV 64). См. сб. «Проблемы кибернетики», вып. 12. В. Я. Пан, Вычисление многочленов по схемам с предварительной обработкой коэффициентов и программа автоматического нахождения параметров (17, 24 IV 64). См. Ж. выч. матем. и матем. физ. (1962, № 1). В. И. Л е в е н ш т е й н, Асимптотика мощности максимального кода, корректирующего вставку или выпадение одного разряда (8 V 64) М. И. К р а т к о, Алгоритмическая неразрешимость проблемы распознавания полноты для конечных автоматов (15V64). См. ДАН 155 № 1, 1964, 35--37. Ю. В.Голунков,Об итерациях функций алгебры логики (22 V 64) Уч. зап. Каз. ун-та 123, № 6, 1963, 129-147.
ИСПРАВЛЕНИЯ К ВЫПУСКУ 12 Стр. 58 71 71 73 J 81 I 84 87 93 103 103 105 105 106 155 159 190 191 192 192 196 204 251 254 Строка 23 св. 8 св. 5 сн. в формуле 3 св. 18 св. И сн. 20 св. рис. 2 И св. 12 св. 25 св. 4 сн. 10 сн. 2 сн. 8 сн. 6 сн. рис. 1 6 октет 14 сн. 13 сн. 20— 21 св. 9 сн. 13 сн. 10 св. Напечатано = Г6'(/(*1. ..., s/_i, *г71' to), xJ+l> • ••' xn))'i ц>{а) = 0 UiCX ... X An) AtXAj = e c $Ax ° e о е о е о §Ах о е *A импульсам "oTT Л — Е Л~Е Е'г 2s-x 2k т ^ т [1 + М1)] Vp-з) Vi а обоз ачает содержимое ячейки а; Лей Сер ЦУ Лей ЦУЦ УЦЦ УЦЦ ЦУЦ Лей УЦЦ 1 ЦУЦ ЦУЦ|УЦЦ точное значение р* {at : i £ I & у * (| ai | определено)} Следуете читать = ®(/to,..., ^'-1. ^to), */+i,.... *п)); ф(а> =£ jZf Uix...x^) ^i = ^i J z.1 _ -i ^ z.i | = е о § ^х с е о е о 5д * с е 5А импульсом ол Л" — #2 ^-^2 #2 2s-t 2& т ^ m [1 — 0(1)] Vp-3 • • • Vj а обозначает содержимое ячейки а; Лей и Сер. ЦГУ ЦУЦ УЦЦ Лей УЦЦ ЦУЦ УЦЦ1ЦУЦ Лей ЦУЦ | УЦЦ | точное знание h | {at : i £1} и у i(\o.t\ определено) i